斯坦福团队创新结合SSM与扩散模型,打造高效长时记忆视频世界模型

[复制链接]
周大 发表于 2025-5-31 14:26:44 | 显示全部楼层 |阅读模式
斯坦福大学等机构提出一种融合状态空间模型与扩散模型的新型“视频世界模型”,通过逐块扫描及帧局部注意力机制,解决了长期记忆受限问题,提升了时间记忆与空间一致性。实验显示,该方法在长期记忆任务中表现最优,且具备线性扩展的训练时间和恒定的推理成本,为交互式视频生成提供了新思路。
来源:https://mp.weixin.qq.com/s/TMv5qsPaP3IMGunMWGi32w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 19:28 , Processed in 0.280044 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表