• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools

数据合成篇|多轮ToolUse数据合成打造更可靠的AI导购助手

Source : mp.weixin.qq.com

近年来,大语言模型(LLM)的能力边界不断拓展:从检索增强生成(RAG),为大模型接上了外部知识库,让它能给出更可靠的答案;到引入思维链(COT)机制,通过显式地生成思考过程,增强了模型的逻辑分析与复杂问题拆解能力;再到如今的工具调用(Tool Use),模型真正被赋予了像人类专家一样的能力,主动思考、规划、并利用工具去解决未知复杂问题。这标志着模型正从“被动响应者”向“主动智能体”演进,让模型在复杂问题解决、响应鲁棒性和生成的透明度上发生质的飞跃。然而,“巧妇难为无米之炊”,要训练出这样的智能体,光有算法远远不够,数据才是真正的燃料。DeepSeek的研究工作确立了当前大模型训练的主流范式,即先是高质量数据驱动的冷启动阶段,再是基于强化学习的优化阶段。但Tool Use的冷启数据难以获取,通用模型通常在海量纯文本上预训练,再通过人工标注的指令数据微调,但这些数据几乎不包含“如何分步调用工具,分析工具返回结果,做出决策”的完整轨迹。人工标注不仅成本高昂、效率低下,还难以覆盖复杂场景的多样性。而特有业务场景的Tool Use数据更加稀缺。因此,合成数据成为破局关键。

View 29 Technology lddgo Shared on 2026-01-06