Wan2.1

开放与先进的规模化视频生成模型

2025-03-01

Wan2.1是一套革命性的视频基础模型套件,旨在彻底改变视频生成方式。它在多项基准测试中展现出顶尖性能,超越了开源和商业解决方案。该系列模型针对消费级GPU进行优化,其中T2V-1.3B模型仅需8.19GB显存,大幅降低了使用门槛。Wan2.1支持文本生成视频、图像生成视频、视频编辑、文本生成图像及视频转音频等多种任务,是内容创作者的万能工具箱。

Wan2.1的核心优势包括:

  • 顶尖性能:在各项基准测试中持续领先现有模型
  • 消费级GPU支持:高效显存占用可部署于普通硬件设备
  • 多任务处理:支持多样化的视频生成需求
  • 视觉文字生成:可在视频中同时生成中英文字幕
  • 强大视频VAE:Wan-VAE技术可高效处理任意长度的1080P视频

该模型基于扩散变换器架构,融合了创新时空VAE、可扩展训练策略及大规模数据构建等技术。采用Apache 2.0开源协议,在符合伦理准则的前提下支持灵活使用。欢迎通过Discord或微信加入社区,与研发团队直接交流。

Video Generation Artificial Intelligence Text-to-Video Image-to-Video Video Editing