OpenAI的O1及其后续竞争者(如DeepSeek R1)的发布显著推动了大语言模型(Large Language Models,LLMs)在复杂推理方面的研究,引发学术界与工业界的双重关注。此项进展激发了相关技术成果的复现和在此基础上的创新。为系统构建该领域的研究框架,本文从自我进化(self-evolution)的角度系统地分类了现有技术。我们的调查发现分为三个相互关联的部分:数据进化(data evolution)、模型进化(model evolution)和自我进化(self-evolution)。
                        
                        
                                
                                    查看原文
                                
                            
                                         53
                                    
                            
                            技术
                            lddgo
                            分享于 
                            2025-04-22
                                        53
                                    
                            
                            技术
                            lddgo
                            分享于 
                            2025-04-22