EX-4D

将任何视频转化为可控的4D体验

2025-07-04

EX-4D
EX-4D是Pico/Bytedance推出的一个开源框架,它能将单一视频转化为可通过相机控制的4D体验。其新颖的深度水密网格技术确保了即使在极端视角下也能保持一致性。
EX-4D是Pico/字节跳动推出的一个开源框架,它能将普通视频转变为具有全方位相机控制的动态4D体验。其突出特点是深度水密网格(Depth Watertight Mesh),这是一种新颖的几何表示方法,能够同时建模可见和被遮挡的区域,确保即使从极端视角观看也能保持视觉一致性。

该框架通过采用模拟掩蔽策略,克服了几何不一致性和遮挡伪影等常见挑战,无需多视图数据集即可工作。基于LoRA的轻量级视频扩散适配器进一步提高了效率,仅需1%的可训练参数即可生成高质量、时间上连贯的输出。

EX-4D的三步流程——构建网格、生成训练掩模和合成视频——提供了平滑的过渡和逼真的动态效果,使其成为沉浸式内容创作的理想选择。
Open Source Artificial Intelligence Video