万字长文：大语言模型复杂推理的自我进化机制

出处： mp.weixin.qq.com

OpenAI的O1及其后续竞争者（如DeepSeek R1）的发布显著推动了大语言模型（Large Language Models，LLMs）在复杂推理方面的研究，引发学术界与工业界的双重关注。此项进展激发了相关技术成果的复现和在此基础上的创新。为系统构建该领域的研究框架，本文从自我进化（self-evolution）的角度系统地分类了现有技术。我们的调查发现分为三个相互关联的部分：数据进化（data evolution）、模型进化（model evolution）和自我进化（self-evolution）。