中山大学梁小丹团队论文:让视频生成从「看起来真实」到「物理上正确」丨CVPR 2026
想象这样一些常见却又微妙的场景:一勺蜂蜜缓慢倒入热茶,本应拉出细长连续的丝状流动,但很多生成视频却会突然断裂甚至凭空消失;一块冰在室温下逐渐融化,真实过程应该是边缘先软化、体积变化、最终消散,而生成结果却常常直接从完整变成消失;一个玻璃球落入水中,本应经历接触水面、减速下沉、逐渐稳定的过程,但模型却可能只给出一个结果画面。这些现象并不罕见,也正是当前视频生成技术最容易让人出戏的地方。画面看起来像,但过程不对,缺乏因果关系,也缺乏真实世界中那种连续演化的逻辑。随着视频生成模型的发展,从 OpenAI Sora 到 Kling 等系统不断刷新视觉质量的上限,行业已经基本解决了清晰度和风格的问题,却逐渐暴露出更深层的瓶颈,即模型缺乏对物理规律的理解能力。现有方法更多依赖数据驱动的模式匹配,本质上是在生成看起来合理的结果,而不是在模拟真实发生的过程,这也导致在流体、热变化以及多物体交互等场景中表现明显不足。在这样的背景下,来自四川大学的雷印杰团队提出了一项新的研究工作《Chain of Event-Centric Causal Th
来源: 雷锋网