港中大等提出TON框架:AI可自主判断是否思考,推理长度减少90%准确率反升17%

[复制链接]
周大 发表于 2025-5-30 14:45:35 | 显示全部楼层 |阅读模式
香港中文大学与新加坡国立大学的研究团队提出了一种名为TON(Think Or Not)的选择性推理框架,使AI模型能够根据问题难易程度决定是否进行显式推理。相比现有方法(如GRPO),TON通过两阶段训练机制实现了更高效的推理策略。实验结果表明,在CLEVR、GeoQA等任务中,TON将推理输出长度减少了最多90%,同时保持或提高了准确率(如GeoQA任务中准确率提升了17个百分点)。这种“按需思考”的模式不仅节省了计算资源,还让AI更接近人类思维习惯,为大模型的实际部署提供了新思路。
来源:https://mp.weixin.qq.com/s/U1fLDXgg9GlqG_sV5mo89Q

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 18:42 , Processed in 0.271666 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表