导航| 欢迎访问商讯网
综合商讯
当前位置: 商讯网 > 综合商讯 >

魔吒AI数字人2.0:率先在数字人拟真度和算力成本取得重大突破


投稿: oy  2023-06-14 14:14:52  来源:  我要评论(0 ) 访问次数 
日前,魔吒AI发布了AI直播数字人系统的2.0版本,采取了新的架构,极大的降低了AI数字人直播间消耗的算力成本,使大部分企业能用得起数字人直播。数字人是今年爆火的一个赛道,尤其是数字人用于直播,广受各类企业追捧。

虽然AGI时代是否来临还存在争议,但大家在文案撰写、代码编写、设计制图等各领域已开始大面积使用AI工具以提升效率。数字人就是当下十分受人关注的AI应用领域,企业将数字人用做数字员工能显著的降低成本提升效率。

AI驱动的数字人通过AI能力建立人与大数据的连接,提高效率并满足人情感交流需求,提升用户体验,将成为人机交互新入口。应用广度上,目前使用文字或语音交互的场景都可用AI数字人软着陆的方式替代,不需要改变原有的业务逻辑和商业模式,大众接受成本较低,并提供更好的用户体验,未来应用场景非常广泛,可以与各种领域相结合,服务规模化和标准化。应用深度上,数字人作为企业的数字资产,是对员工工作的增强,具有生产力的属性,可以进一步释放生产力,同时降本增效。未来数字人将根据不同行业的业务特点和应用场景进行更深度结合,孵化千行千面的数字员工,提供差异化服务。

在金融、通信、传媒、公共服务、生活服务等多个领域,在客服、大堂接待、展厅解说等多个岗位上,AI数字人都能发挥作用。AI数字员工可以7*24小时随时接受咨询,跟消费者互动,不会有情绪波动,无需培训即可上岗,能节省企业大量的人力成本。

数字人要在表现形式上接近真人,需要在语义、语音、视觉、底层算法等领域都有足够的技术积累。数字人的语音表达、面部表情和动作形态等需要通过深度学习模型进行运算,并将其结果实时或者离线驱动,并进行渲染。在语言处理方面,需要NLP能力通过文本驱动,通过ASR、NLP、TTS等AI技术进行感知、决策、表达的闭环来驱动数字人交互。需要预先设置相关的知识图谱和问答库等,与数字人的对话系统衔接。在动作合成方面,需要采用AI驱动嘴形动作、AI驱动表情和AI驱动其他动作等AI技术。

魔吒AI一直专注在AI数字人这个领域,在自然语言处理、AI驱动表情、声唇同步等AI技术领域有深厚积累。从虚拟人的建模,到动作捕捉和面部表情驱动技术,魔吒AI都有原创性的技术突破,并拥有数十项知识产权。魔吒AI数字人系统通过1比1复刻真人形象,让用户看到一个逼真的数字人。通过深度学习和语音合成算法,数字人能够模拟和还原真实人物的声音特征,从语调到音质,完美还原真实的声音。再加上大语言模型的接入,使数字人的对话更加自然流畅,用户可以享受到与真实人物交流的感觉。无论是在教育培训、客户服务还是娱乐互动领域,魔吒AI数字人都能够提供出色的体验。

直播成为许多企业的标配,魔吒AI在直播领域推出专业的直播数字人系统。该系统强大便捷的后台编辑功能,可以使用户轻松的设置直播间的背景、道具等内容,可以适应各种直播场景,支持目前市面上主流的直播平台,包括部分海外的平台。需要指出,魔吒AI提供的是24小时稳定的、不间断的直播服务,能够满足用户不同时段的直播需求。以chatGPT为代表的AI领域自然语言处理技术近期有了重大突破,伴随着计算机视觉领域里各项技术的日益走向完善。这些都使得AI数字人在降低成本的情况下,完全能够在企业直播领域进行大规模商用。

魔吒AI直播数字人系统聚焦于直播这个单一场景。在表情、动作和互动用语上,该系统的AI数字人在训练后更加接近电商主播的特点,这使得魔吒能够在此单一场景下脱颖而出。同时,魔吒AI在建模和渲染环节,也摒弃了大量在直播场景下用不到的模块,大幅度降低了成本,使之能被大量企业接受。

魔吒AI一直有一个观点,新技术的应用一定要带来10倍以上的成本降低,这样才能带来新技术的快速普及。魔吒AI直播数字人系统的2.0版本的发布,标志着魔吒AI率先在数字人直播拟真度和算力成本两方面取得突破,将推动AI直播的快速普及。

分类: 综合商讯   关键词
分享到:  
20.9K
相关文章
栏目导航
热门标签
图片推荐