重磅发布|Scale‑SWE 构造 10 万级真实 SWE 数据集,火山引擎沙箱底座重塑代码智能体训练
Source :
mp.weixin.qq.com
近日,中国人民大学高瓴人工智能学院与字节跳动技术团队合作完成相关研究,重磅发布 Scale-SWE 数据集。研究团队依托火山引擎强大的 Sandbox 基建,通过 Sandboxed multi-agent 系统,成功实现 SWE 任务的规模化拓展,构建起包含 100k 真实数据、目前规模最大的开源高质量 SWE 数据集——这一成果为 Code Agent 训练数据的规模扩展提供了可行路径,让模型在 GitHub 量级的真实场景数据上进行充分训练成为现实。
View
4
Technology
lddgo
Shared on
2026-04-07