Wan2.1

Wan2.1是一套革命性的视频基础模型套件，旨在彻底改变视频生成方式。它在多项基准测试中展现出顶尖性能，超越了开源和商业解决方案。该系列模型针对消费级GPU进行优化，其中T2V-1.3B模型仅需8.19GB显存，大幅降低了使用门槛。Wan2.1支持文本生成视频、图像生成视频、视频编辑、文本生成图像及视频转音频等多种任务，是内容创作者的万能工具箱。

Wan2.1的核心优势包括：

顶尖性能：在各项基准测试中持续领先现有模型
消费级GPU支持：高效显存占用可部署于普通硬件设备
多任务处理：支持多样化的视频生成需求
视觉文字生成：可在视频中同时生成中英文字幕
强大视频VAE：Wan-VAE技术可高效处理任意长度的1080P视频

该模型基于扩散变换器架构，融合了创新时空VAE、可扩展训练策略及大规模数据构建等技术。采用Apache 2.0开源协议，在符合伦理准则的前提下支持灵活使用。欢迎通过Discord或微信加入社区，与研发团队直接交流。

Wan2.1

开放与先进的规模化视频生成模型

OmniParser

MarkItDown