相机参数秒变图片!新模型打通理解生成壁垒,支持任意视角图像创作

[复制链接]
周大 发表于 2025-10-27 16:02:37 | 显示全部楼层 |阅读模式
来自多所高校与科研机构的研究团队推出Puffin模型,首次在统一框架下融合相机参数的理解与按参数生成图像的能力。该模型基于约400万组图片-文本-相机三元组数据训练,引入“与相机共思”理念,将抽象参数转化为摄影术语并结合空间线索进行推理,实现了从任意视角理解与生成场景的能力。实验显示其在多项任务中优于现有方法,支持空间想象、世界探索等复杂应用,相关数据集与评测基准已开源,为多模态空间智能发展提供了重要基础。
来源:https://mp.weixin.qq.com/s/QduRB-6lDvBjo_SBiLDmOQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 09:43 , Processed in 0.278525 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表