我们往Claude脑子里塞了一个词，然后它开始「自圆其说」了！Anthropic最新研究：AI拥有内省能力！

Source : mp.weixin.qq.com

Anthropic刚刚公布了一项最新研究：AI开始拥有内省能力。这个问题，其实在AI领域大神、OpenAI元老 Andrej Karpathy 最近的演讲中也有所提及：他认为，AI 的下一个阶段不是更大的模型，而是能反思自己的模型。它们需要像人一样，能在输出后回顾过程、总结偏差、甚至从错误中自我修正。Anthropic的这项研究正是不谋而合。研究团队通过已知概念的表征（representations）注入模型的激活（activations）的方式，成功证明了当前的大型语言模型具备一定程度的功能性内省意识（functional introspective awareness）——也就是对自身内部状态的有限觉察能力。

View

112 Technology lddgo Shared on 2025-11-06

English