北大团队综述:以心理测量学革新大语言模型评估与增强

[复制链接]
周大 发表于 2025-5-27 15:41:25 | 显示全部楼层 |阅读模式
北京大学宋国杰教授团队发表63页综述论文,探讨如何科学评估大语言模型(LLM)的心智特征。论文指出传统方法已无法满足需求,提出将心理测量学引入AI评估,从构念导向、严谨方法到项目反应理论实现革新。研究涵盖人格、能力等多维度测量,并在特质调控、安全对齐等方面助力LLM提升。未来需发展新理论与工具,推动AI向更安全可靠方向发展。
来源:https://mp.weixin.qq.com/s/w0Sgy74UMWsUd_zfVnXiKg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 06:31 , Processed in 0.289179 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表