AI领域聚焦推理优化与后训练策略

[复制链接]
周大 发表于 2025-5-25 15:13:55 | 显示全部楼层 |阅读模式
随着预训练阶段的边际效益递减,AI领域自2024年起聚焦于“Scaling What”新范式的探索。研究者提出了TTS(Test-Time Scaling)方法,通过在推理阶段增加计算资源提升模型性能,并将其应用范围从特定领域扩展至通用任务。香港城市大学等高校进一步提出“四轴分类框架”,将推理优化技术系统化,揭示了研究重点从预训练转向推理优化的趋势。同时,四种主要的Scaling策略——Parallel、Sequential、Hybrid和Internal,分别通过不同的方式优化模型性能。此外,微调与推理在后训练阶段被赋予同等重要性,凸显了高质量数据对模型行为的关键作用。
来源:https://mp.weixin.qq.com/s/eY7fAaqcs6NJX4eXqm4oMg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 10:55 , Processed in 0.303405 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表