阿里发布肖像视频生成框架 EMO

[db:摘要]

阿里巴巴团队发布了肖像视频生成框架 EMO,能够生成具有丰富面部表情和头部姿势的声音肖像视频。EMO利用参考网络从参考图像和动作帧中提取特征,通过预训练的音频编码器处理声音并嵌入,结合多帧噪声和面部区域掩码生成视频。实验结果表明,EMO在表现力和真实感方面优于现有方法。该模型潜在应用方向将提高数字媒体和虚拟内容生成技术水平,但也可能被用作犯罪工具。

本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/21169

该文观点仅代表作者本人,平台仅提供信息存储空间服务。

(0)
aiucaiuc
上一篇 2024年2月29日
下一篇 2024年2月29日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注