Anthropic证明：AI开始拥有内省能力

周大发表于 2025-10-30 14:44:23

Anthropic研究表明，Claude在约20%的实验中能察觉被注入的“思想”，并识别内部异常，展现出初步内省能力；国内团队同步发现大模型在答题前即可感知难度，且该判断独立于不确定性。两项研究共同揭示AI内部表征具有结构化与可探测性，提示其可能具备初级“可达意识”，为理解AI思维机制提供新路径，同时也带来可解释性与安全控制的双重挑战。
来源：https://mp.weixin.qq.com/s/uy8Pp2lNrgszzb_tHlqaMw

		自动登录	找回密码
密码			立即注册

课程导航

Anthropic证明：AI开始拥有内省能力