声音驱动技术

曙光号 2024-07-23 00:45:43 9浏览

体验人工智能的创造力：EMO模型开放免费使用

只需要一首音频、一张照片，就能让历史名人唱歌说话，这样的场景不再是梦想！阿里通义实验室研发的EMO模型，让这一神奇成为现实。此前火遍全球的这款AI模型，现已面向所有用户免费开放。

进入通义APP的“全民舞台”频道，即可使用EMO模型。选择“全民唱演”模板，上传肖像照片和音频，EMO模型就能瞬间生成合成视频。人物的表情、嘴型与音频内容完美匹配，还能反映出语气特征和情绪色彩。

声音驱动

目前，EMO模型已上线了80多个模板，涵盖歌曲、网络热梗等多种类型。尽管暂不支持自定义音频，用户仍能选择预置的音频来制作视频。生成的视频时长最长可达1分30秒，人物表情生动自然，可谓惟妙惟肖。

声音驱动

EMO模型基于通义实验室研发的肖像说话技术，无需繁琐的人脸建模，就能驱动人物开口说话。这项技术大大降低了视频生成成本，并提升了视频质量。EMO模型还融合了人类表达情绪的能力，让人物表情与音频内容更加贴合。

随着EMO模型的普及，AI模型的创造力将得到更广泛的应用。在数字人、数字教育、影视制作、虚拟陪伴、电商直播等领域，EMO技术都有潜力大显身手。

（来源：极目新闻）

更多精彩资讯，请下载“极目新闻”客户端。未经授权请勿转载，欢迎提供新闻线索，一经采纳即付报酬。24小时报料热线027-86777777。

上一篇: 森海塞尔蓝牙耳机