咨询热线:
熟睡2000多年的兵马俑与歌手董宝石“跨时空同台”,用华阴老腔展现“大秦雄风”;从北宋“穿越”而来的苏轼,与歌手李玉刚一起演绎《水调歌头》……在阿里通义EMO技能的支持下,这些画面变为或许。6月28日,央视《2024我国·AI盛典》将为观众们展现一场交融中华文化与数字科技的视听盛宴。
依托阿里通义EMO技能,熟睡2000多年的AI兵马俑用华阴老腔展现“大秦雄风”
只是一张相片、一个音频就能够让停止的形象,伴跟着音频的跌宕起伏、波澜起伏,演绎得活灵活现。秦始皇帝陵博物院院长李岗表明,“咱们咱们都期望跟着AI技能的渐渐的提高,未来的文化遗产维护和传达会愈加多元化、智能化,更好地宏扬中华文化,叙述我国故事。”
翻开通义APP,在主对话框查找“EMO”,或找到“全民舞台”频道点击产品页面“全民唱演”,即可体会同款“兵马俑”同唱《从军行》。此外,用户还能够自定义唱演,挑选喜爱的歌曲、热梗、表情包,上传肖像相片,EMO随即就能合成视频。
翻开通义APP,即可体会央视《2024我国·AI盛典》同款“兵马俑”,同唱《从军行》
据了解,EMO是通义实验室研制的AI模型,其背面的肖像说话(Talking Head)技能是当时大热的AIGC范畴。EMO之前的Talking Head技能都需针对人脸、人头或许身体部分做3D建模,通义实验室在业界首先提出了弱操控规划,无需建模就可驱动肖像开口说话,不只下降视频生成本钱,还大起伏的提高了视频生成质量。
EMO模型在海量的人物说话视频进步行了练习,不只是能够找到音频中详细发音与人像口型的匹配联系,更重要的是能发现音频中的口气特征与人物表情的关联性,将音频暗含的心情颜色反映到了人物微表情上。能够说,EMO在练习中渐渐学习并编码了人类表达心情的才能。
通义实验室运用视觉团队负责人薄列峰表明,“未来咱们咱们都期望用AI的力气将我国民间传统文化展现得更丰厚,愈加‘通情,达意’,让收藏在博物馆里的文物、陈设在宽广大地上的遗产、书写在古籍里的文字都‘活’起来。”
2月底,通义实验室发布相关论文,EMO随之成为继SORA之后最受重视的AI模型之一。EMO项目页此前已在Github展现,收成Stars数敏捷超6600。只是两个月后,通义实验室就将EMO产品化,正式在通义APP推出,所有人都可免费运用,让相片开口歌唱、说段子。未来,EMO技能有望运用于数字人、数字教育、影视制作、虚拟陪同、电商直播等场景。