攻克长文档与多模态挑战,Paper2Video实现学术视频的自动化生产

[复制链接]
周大 发表于 2025-10-23 15:09:43 | 显示全部楼层 |阅读模式
新加坡国立大学Show Lab团队推出首个学术展示视频生成基准Paper2Video,涵盖101篇顶会论文及配套视频数据,并提出四维评估体系:Meta Similarity、PresentArena、PresentQuiz与IP Memory,全面衡量生成视频的类人程度、观感质量、知识传递与学术记忆效果。同时发布多智能体框架PaperTalker,支持从论文自动生成含幻灯片、字幕、语音、光标与讲者视频的完整展示内容。实验显示,该框架在各项指标上均优于现有方法,生成质量接近人工水平,且通过并行化与优化机制实现高效低成本输出,为科研自动化交流提供新路径。
来源:https://mp.weixin.qq.com/s/dGgwzwgR_4vAWuNrh22EHw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 09:36 , Processed in 0.273886 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表