HunyuanVideo-Avatar

由音频驱动的动态多角色AI动画

2025-05-28

HunyuanVideo-Avatar
腾讯的HunyuanVideo-Avatar能够从音频生成动态、情感可控、多角色的说话头像视频。开源项目,确保角色一致性。代码和模型已发布。
HunyuanVideo-Avatar是由腾讯开发的一款先进的AI驱动动画工具,旨在从音频输入创建动态、情感可控的说话头像视频。它支持多角色场景,同时保持强大的角色一致性,非常适合沉浸式和互动式内容。该工具引入了三项关键创新:一个用于稳定运动和一致性的角色图像注入模块,一个用于精确情感对齐的音频情感模块,以及一个面部感知音频适配器,以实现多个角色的独立音频控制。这些功能使其超越现有方法,在各种场景中生成高度逼真的头像。作为一个开源解决方案,HunyuanVideo-Avatar提供了易于访问的代码和模型,使开发者能够将高保真音频驱动动画集成到他们的项目中。其能力使其适用于娱乐、教育和虚拟通信领域的应用。
Open Source Artificial Intelligence GitHub Photo & Video