用一个强 Agent 构建评测 Harness,系统性评测一群业务 Agent(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
2026年5月29日至31日,中国图像图形大会(CCIG 2026)在广州召开,论坛内容涵盖大模型、三维建模生成与具身智能、空间智能、脑机接口、机器视觉等热点方向,覆盖学术前沿、产业应用和技术创新,与会学术界和产业界同仁近4200余人。作为中国图像图形学学会的常任理事单位,淘天业务技术Meta技术团队连续第四年受邀出席大会,在专属展位区展示了Meta技术团队介绍与核心技术成果。此外,Meta技术团队受邀在“三维建模生成与具身智能”学术论坛上发表演讲,分享3D真人数字人在淘宝Vision领域的应用,报告现场有诸多相关方向高校老师和学生主动联系,表达未来加强交流合作,深化产学研协同创新,共同攻克关键核心技术难题的愿景。
这篇文章把我们写 Skill 踩过的坑、总结出的经验,再加上 Anthropic 官方的一些好做法,整理到了一起。希望能帮你少走弯路,把团队积累的知识真正"喂"给 AI,让它干活更靠谱。 本文示例以 Go 语言为主,兼顾 Python、Java 等语言,所有原则和技巧适用于任何编程语言。
互联网信息呈指数级增长的当下,每天都有海量的文本数据产生,这些信息不仅污染网络环境,危害用户的身心健康,还可能对社会秩序和安全造成严重威胁。因此,构建高效可靠的文本内容审核系统迫在眉睫,它对于维护网络空间的健康、安全和有序发展具有至关重要的意义。本文将从新闻客户端文本审核流程、系统实现效果、核心技术具体实现流程以及系统应用拓展四个维度,详细阐述高效文本内容审核系统的设计与实现思路,为相关领域的技术研发和平台应用提供参考。
"Agent 进入生产环境的下半场,比拼的不再只是模型,更是 Agent 与上下文之间的关系是否被系统性组织起来。ContextBucket 的使命,是让 Agent 的记忆与工作区长在同一个底座上——记得住、找得到、带得走。"