SkyReels-V2

具备顶尖性能的无限长度影片生成模型

2025-04-20

SkyReels-V2 是一款突破性的开源视频生成模型,采用自回归扩散强制架构(AutoRegressive Diffusion-Forcing),在视频生成领域实现了顶尖性能。作为首个公开可用的无限时长视频生成模型,它能持续输出高视觉质量、强动态表现且精准符合文本描述的视频内容。该项目包含模型权重、推理代码,以及用于精细化标注的视频描述模型(SkyCaptioner-V1)。

核心特性包括:

  • 无限时长视频生成:通过扩散强制框架实现流畅的长视频合成
  • 高清画质输出:支持540P与720P分辨率
  • 多场景应用:涵盖文生视频(T2V)、图生视频(I2V)及镜头导演功能
  • 高效推理优化:提供同步/异步模式选择、多GPU加速与显存优化方案

经严格测试,SkyReels-V2 在指令遵循度、画面连贯性和视觉质量上均优于主流模型。项目提供完整技术文档,含技术报告、推理脚本,并支持Hugging Face与ModelScope平台集成。

Artificial Intelligence Video Generation Diffusion Models Autoregressive Models Computer Vision