我们往Claude脑子里塞了一个词,然后它开始「自圆其说」了!Anthropic最新研究:AI拥有内省能力!
Source :
mp.weixin.qq.com
Anthropic刚刚公布了一项最新研究:AI开始拥有内省能力。这个问题,其实在AI领域大神、OpenAI元老 Andrej Karpathy 最近的演讲中也有所提及:他认为,AI 的下一个阶段不是更大的模型,而是能反思自己的模型。它们需要像人一样,能在输出后回顾过程、总结偏差、甚至从错误中自我修正。Anthropic的这项研究正是不谋而合。研究团队通过已知概念的表征(representations)注入模型的激活(activations)的方式,成功证明了当前的大型语言模型具备一定程度的功能性内省意识(functional introspective awareness)——也就是对自身内部状态的有限觉察能力。