HunyuanVideo-Avatar

由音频驱动的动态多角色AI动画

2025-05-28

腾讯的HunyuanVideo-Avatar能够从音频生成动态、情感可控、多角色的说话头像视频。开源项目，确保角色一致性。代码和模型已发布。

HunyuanVideo-Avatar是由腾讯开发的一款先进的AI驱动动画工具，旨在从音频输入创建动态、情感可控的说话头像视频。它支持多角色场景，同时保持强大的角色一致性，非常适合沉浸式和互动式内容。该工具引入了三项关键创新：一个用于稳定运动和一致性的角色图像注入模块，一个用于精确情感对齐的音频情感模块，以及一个面部感知音频适配器，以实现多个角色的独立音频控制。这些功能使其超越现有方法，在各种场景中生成高度逼真的头像。作为一个开源解决方案，HunyuanVideo-Avatar提供了易于访问的代码和模型，使开发者能够将高保真音频驱动动画集成到他们的项目中。其能力使其适用于娱乐、教育和虚拟通信领域的应用。

产品网站

Product Hunt

Open Source Artificial Intelligence GitHub Photo & Video

HunyuanVideo-Avatar

由音频驱动的动态多角色AI动画

Flapico

WinifyAI