攻克长文档与多模态挑战，Paper2Video实现学术视频的自动化生产

周大发表于 2025-10-23 15:09:43

新加坡国立大学Show Lab团队推出首个学术展示视频生成基准Paper2Video，涵盖101篇顶会论文及配套视频数据，并提出四维评估体系：Meta Similarity、PresentArena、PresentQuiz与IP Memory，全面衡量生成视频的类人程度、观感质量、知识传递与学术记忆效果。同时发布多智能体框架PaperTalker，支持从论文自动生成含幻灯片、字幕、语音、光标与讲者视频的完整展示内容。实验显示，该框架在各项指标上均优于现有方法，生成质量接近人工水平，且通过并行化与优化机制实现高效低成本输出，为科研自动化交流提供新路径。
来源：https://mp.weixin.qq.com/s/dGgwzwgR_4vAWuNrh22EHw

		自动登录	找回密码
密码			立即注册

课程导航

攻克长文档与多模态挑战，Paper2Video实现学术视频的自动化生产