GPT-5.2已上线24小时:差评如潮!

[复制链接]
周大 发表于 3 小时前 | 显示全部楼层 |阅读模式
OpenAI 发布 GPT-5.2,宣称其在专业任务中达到新高度,并在多项基准测试中领先。然而,该模型迅速遭遇广泛批评,用户反映其过度安全审查、缺乏共情、回应机械,甚至在“garlic 有几个 r”等基础问题上出错。SimpleBench 和 LiveBench 测试显示其常识推理不及竞品,编程与艺术生成能力也逊于 Claude Opus 4.5。尽管官方强调智能提升,但实际体验中 GPT-5.2 在情感支持、语境理解方面表现倒退,引发对当前 AI 评估体系局限性的反思。
来源:https://mp.weixin.qq.com/s/xiOX9i6V-yfnn0pyC6ZlTA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-12-13 18:00 , Processed in 0.252373 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表