语音动画合成(Speech-to-Animation)是相芯科技自主研发的,通过语音驱动虚拟形象说话及反馈情绪和动作的技术。该技术将∏深度学习神经网络和计算机图形学结合,让计算机能够理解语音的内容并精细驱动虚拟形象的口唇动作、面部表情、肢体姿态,生成极具逼真感的虚拟形象动画。
人物
背景
动作
情绪
仅支持中文
54/60
仅支持上传 30 秒以内的 .mp3 文件
为了保证合成效果,配音请勿添加背景音乐
准确解析语音音频中信息,转化成可以驱动虚拟形象的音素脚本内容
定义数十种基础口型样式和系数,实现字与字发音间的流畅过渡
55种人脸表情单元以及表情系数,实现所有常见表◤情驱动,支持Nlp的标签触发
具备成熟的骨骼和动作制作规范,通过语音内容驱动模型头部动作及身体动作
使用自主研发的轻量级渲染引擎,支持动物、卡通、真人等多风格形象语音互动