声音驱动技术


体验人工智能的创造力:EMO模型开放免费使用

只需要一首音频、一张照片,就能让历史名人唱歌说话,这样的场景不再是梦想!阿里通义实验室研发的EMO模型,让这一神奇成为现实。此前火遍全球的这款AI模型,现已面向所有用户免费开放。

进入通义APP的“全民舞台”频道,即可使用EMO模型。选择“全民唱演”模板,上传肖像照片和音频,EMO模型就能瞬间生成合成视频。人物的表情、嘴型与音频内容完美匹配,还能反映出语气特征和情绪色彩。

声音驱动

目前,EMO模型已上线了80多个模板,涵盖歌曲、网络热梗等多种类型。尽管暂不支持自定义音频,用户仍能选择预置的音频来制作视频。生成的视频时长最长可达1分30秒,人物表情生动自然,可谓惟妙惟肖。

声音驱动

EMO模型基于通义实验室研发的肖像说话技术,无需繁琐的人脸建模,就能驱动人物开口说话。这项技术大大降低了视频生成成本,并提升了视频质量。EMO模型还融合了人类表达情绪的能力,让人物表情与音频内容更加贴合。

随着EMO模型的普及,AI模型的创造力将得到更广泛的应用。在数字人、数字教育、影视制作、虚拟陪伴、电商直播等领域,EMO技术都有潜力大显身手。

(来源:极目新闻)

更多精彩资讯,请下载“极目新闻”客户端。未经授权请勿转载,欢迎提供新闻线索,一经采纳即付报酬。24小时报料热线027-86777777。