Anthropic证明:AI开始拥有内省能力

[复制链接]
周大 发表于 2025-10-30 14:44:23 | 显示全部楼层 |阅读模式
Anthropic研究表明,Claude在约20%的实验中能察觉被注入的“思想”,并识别内部异常,展现出初步内省能力;国内团队同步发现大模型在答题前即可感知难度,且该判断独立于不确定性。两项研究共同揭示AI内部表征具有结构化与可探测性,提示其可能具备初级“可达意识”,为理解AI思维机制提供新路径,同时也带来可解释性与安全控制的双重挑战。
来源:https://mp.weixin.qq.com/s/uy8Pp2lNrgszzb_tHlqaMw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:07 , Processed in 0.269024 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表