OmniHuman by ByteDance
一款先进的AI驱动的人类视频生成模型
2025-04-13

OmniHuman-1 是字节跳动开发的一款尖端人工智能框架,它能够从单张图像和动作信号中生成逼真的人类视频。
OmniHuman-1由字节跳动开发,是一种先进的AI框架,仅需一张图片和音频或视频等动作信号,就能生成超逼真的人类视频。这种多模态模型在生成逼真的动作、手势和表情方面表现出色,非常适合娱乐、虚拟现实和媒体制作等应用。该框架支持多样化的输入,包括肖像、半身和全身图像,确保了一致的真实感。它能够从弱信号(如仅音频)合成自然动作,通过其混合条件训练策略超越了传统方法。尽管计算需求高,OmniHuman-1为创建唱歌的虚拟形象、说话的影响者和动画角色提供了可扩展的解决方案。伦理考虑仍然重要,但OmniHuman-1为AI生成的人类视频设定了新的基准,将创新与实际多功能性融合在一起。
Artificial Intelligence
Audio
Video