• Open API
  • 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • Open API
    文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
1860 条查询结果

用一个强 Agent 构建评测 Harness,系统性评测一群业务 Agent(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)

14 技术 lddgo 分享于 2026-06-05

2026年5月29日至31日,中国图像图形大会(CCIG 2026)在广州召开,论坛内容涵盖大模型、三维建模生成与具身智能、空间智能、脑机接口、机器视觉等热点方向,覆盖学术前沿、产业应用和技术创新,与会学术界和产业界同仁近4200余人。作为中国图像图形学学会的常任理事单位,淘天业务技术Meta技术团队连续第四年受邀出席大会,在专属展位区展示了Meta技术团队介绍与核心技术成果。此外,Meta技术团队受邀在“三维建模生成与具身智能”学术论坛上发表演讲,分享3D真人数字人在淘宝Vision领域的应用,报告现场有诸多相关方向高校老师和学生主动联系,表达未来加强交流合作,深化产学研协同创新,共同攻克关键核心技术难题的愿景。

6 技术 lddgo 分享于 2026-06-05

今天,我们正式发布 Qwen3.7-Plus——将视觉与语言统一为一体化智能体基座的多模态模型。在 Qwen3.7 强大文本能力的基础上,Qwen3.7-Plus 全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。Qwen3.7-Plus 的核心特色在于其作为多模态交互混合智能体的能力。它能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用,以及基于网络知识回答视觉问题——在单一智能体循环中无缝融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的全方位任务。它具备跨框架泛化能力,无论通过 Claude Code、OpenClaw、Qwen Code 还是其他框架部署,均能保持稳定表现。

13 技术 lddgo 分享于 2026-06-03

重新思考研发基础设施:当 Agent 成为第一公民

8 技术 lddgo 分享于 2026-06-03

本文系统梳理了Agent长期记忆能力的评测全景,涵盖基准数据集、评估框架与记忆系统三大核心维度。在基准方面,介绍了MUSE、LOCOMO等贴近真实交互的数据集;在评估方面,分析了MemoryAgentBench、LONGMEMEVAL及MemBench等框架,重点考察准确检索、长程理解、冲突解决及反思记忆等关键能力;在系统实现上对比了THEANINE、RMM、M3-Agent及Mem0等代表性方案的技术机制与性能表现。文章指出当前技术虽在检索准确性上有所进展,但在跨会话推理、动态更新及效率平衡上仍存瓶颈,并强调未来评测需统一口径,综合考量检索正确性、使用有效性、时间维度及成本约束,以真正指导工程落地。

5 技术 lddgo 分享于 2026-06-03

在闪购搜索团队的日常工作中,我们需要频繁地进行搜索问题排查、性能分析、实验管理等操作。这些操作分散在多个平台(SLS日志、TPP实验平台、代码仓库等),效率低下。我们的目标是:在钉钉群里直接对话一个AI助手,它能代替人去查日志、看实验、分析性能、甚至部署代码。

25 技术 lddgo 分享于 2026-06-02

Utoo 是一套基于 Rust 开发的前端通用工具链,目前提供了包管理器以及构建工具的功能。utoopack 是 Utoo 工具链中负责前端构建的工具,作为蚂蚁上一代前端 Rust 构建工具 Mako 的 Next 版本。utoopack 基于 Next.js 背后的 Rust bundler Turbopack,在 Turbopack 优秀的增量引擎架构之上,utoopack 面向更通用的前端项目提供独立的构建 CLI、Node API、通用 bundler 的配置体系以及对 webpack 的兼容层。

24 技术 lddgo 分享于 2026-06-01

全是 Web,没有 CLI,怎么行?Agent 都会写代码了,远程排障还要人肉点网页、复制命令、盯滚动条,这画面多少有点“地铁老人看手机.jpg”。本文记录一次围绕 StarAgent/Drogo WebTerminal 的工具化实践:我们没有把 GPU hang、core dump 调试等场景固化成一个个“祖传脚本套件”,而是把 WebTerminal 抽象成稳定的 CLI 执行面,再用 Skill 描述操作方法。Agent 在任务中动态生成命令、读取结果、继续决策,最终完成远程 GPU hang 分析、文件上传下载、以及 Emacs + eshell + gdb 的交互式 coredump 调试验收。插播:我对 Skill 的态度很朴素:Skill 不是法器,不是咒语,也不是“复制进去 Agent 就突然开悟”的玄学符纸。Skill 本质上就是说明书,是贴在工具箱盖子上的那张“先拧这个、再接那个、别把手伸进风扇里”的操作指南。真正能把活干成的,必须是 CLI:参数清楚、行为稳定、输出可解析、错误可复现、证据能落盘。

24 技术 lddgo 分享于 2026-06-01

2025年成为AI智能体(Agentic AI)元年,传统工程架构面临与AI"不确定性"的冲突。AI Friendly架构通过三范式实现演进:1)确定性→概率性,将输出收敛至安全区间;2)结构化→语义化,基于意图而非格式响应;3)静态→动态,从规则转向规划。核心能力包括Multi-Agent系统、Context Engineering(上下文工程)、AI Friendly API及AI可观测体系。实际应用中,AI审核准确率达95.7%,AI答疑系统CogentAI问题解决准确率超98%,为业务带来80%以上效率提升。架构升级需根据业务深度需求,避免"为用AI而用AI"。

34 技术 lddgo 分享于 2026-06-01

Agent核心技术概念与范式发生了哪些演变以及背后的思考

38 技术 lddgo 分享于 2026-06-01