• Open API
  • 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • Open API
    文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
1860 条查询结果

用一个强 Agent 构建评测 Harness,系统性评测一群业务 Agent(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)

2 技术 lddgo 分享于 2026-06-05

2026年5月29日至31日,中国图像图形大会(CCIG 2026)在广州召开,论坛内容涵盖大模型、三维建模生成与具身智能、空间智能、脑机接口、机器视觉等热点方向,覆盖学术前沿、产业应用和技术创新,与会学术界和产业界同仁近4200余人。作为中国图像图形学学会的常任理事单位,淘天业务技术Meta技术团队连续第四年受邀出席大会,在专属展位区展示了Meta技术团队介绍与核心技术成果。此外,Meta技术团队受邀在“三维建模生成与具身智能”学术论坛上发表演讲,分享3D真人数字人在淘宝Vision领域的应用,报告现场有诸多相关方向高校老师和学生主动联系,表达未来加强交流合作,深化产学研协同创新,共同攻克关键核心技术难题的愿景。

2 技术 lddgo 分享于 2026-06-05

今天,我们正式发布 Qwen3.7-Plus——将视觉与语言统一为一体化智能体基座的多模态模型。在 Qwen3.7 强大文本能力的基础上,Qwen3.7-Plus 全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。Qwen3.7-Plus 的核心特色在于其作为多模态交互混合智能体的能力。它能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用,以及基于网络知识回答视觉问题——在单一智能体循环中无缝融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的全方位任务。它具备跨框架泛化能力,无论通过 Claude Code、OpenClaw、Qwen Code 还是其他框架部署,均能保持稳定表现。

13 技术 lddgo 分享于 2026-06-03

重新思考研发基础设施:当 Agent 成为第一公民

6 技术 lddgo 分享于 2026-06-03

本文系统梳理了Agent长期记忆能力的评测全景,涵盖基准数据集、评估框架与记忆系统三大核心维度。在基准方面,介绍了MUSE、LOCOMO等贴近真实交互的数据集;在评估方面,分析了MemoryAgentBench、LONGMEMEVAL及MemBench等框架,重点考察准确检索、长程理解、冲突解决及反思记忆等关键能力;在系统实现上对比了THEANINE、RMM、M3-Agent及Mem0等代表性方案的技术机制与性能表现。文章指出当前技术虽在检索准确性上有所进展,但在跨会话推理、动态更新及效率平衡上仍存瓶颈,并强调未来评测需统一口径,综合考量检索正确性、使用有效性、时间维度及成本约束,以真正指导工程落地。

5 技术 lddgo 分享于 2026-06-03

在闪购搜索团队的日常工作中,我们需要频繁地进行搜索问题排查、性能分析、实验管理等操作。这些操作分散在多个平台(SLS日志、TPP实验平台、代码仓库等),效率低下。我们的目标是:在钉钉群里直接对话一个AI助手,它能代替人去查日志、看实验、分析性能、甚至部署代码。

17 技术 lddgo 分享于 2026-06-02

Utoo 是一套基于 Rust 开发的前端通用工具链,目前提供了包管理器以及构建工具的功能。utoopack 是 Utoo 工具链中负责前端构建的工具,作为蚂蚁上一代前端 Rust 构建工具 Mako 的 Next 版本。utoopack 基于 Next.js 背后的 Rust bundler Turbopack,在 Turbopack 优秀的增量引擎架构之上,utoopack 面向更通用的前端项目提供独立的构建 CLI、Node API、通用 bundler 的配置体系以及对 webpack 的兼容层。

18 技术 lddgo 分享于 2026-06-01

全是 Web,没有 CLI,怎么行?Agent 都会写代码了,远程排障还要人肉点网页、复制命令、盯滚动条,这画面多少有点“地铁老人看手机.jpg”。本文记录一次围绕 StarAgent/Drogo WebTerminal 的工具化实践:我们没有把 GPU hang、core dump 调试等场景固化成一个个“祖传脚本套件”,而是把 WebTerminal 抽象成稳定的 CLI 执行面,再用 Skill 描述操作方法。Agent 在任务中动态生成命令、读取结果、继续决策,最终完成远程 GPU hang 分析、文件上传下载、以及 Emacs + eshell + gdb 的交互式 coredump 调试验收。插播:我对 Skill 的态度很朴素:Skill 不是法器,不是咒语,也不是“复制进去 Agent 就突然开悟”的玄学符纸。Skill 本质上就是说明书,是贴在工具箱盖子上的那张“先拧这个、再接那个、别把手伸进风扇里”的操作指南。真正能把活干成的,必须是 CLI:参数清楚、行为稳定、输出可解析、错误可复现、证据能落盘。

20 技术 lddgo 分享于 2026-06-01

2025年成为AI智能体(Agentic AI)元年,传统工程架构面临与AI"不确定性"的冲突。AI Friendly架构通过三范式实现演进:1)确定性→概率性,将输出收敛至安全区间;2)结构化→语义化,基于意图而非格式响应;3)静态→动态,从规则转向规划。核心能力包括Multi-Agent系统、Context Engineering(上下文工程)、AI Friendly API及AI可观测体系。实际应用中,AI审核准确率达95.7%,AI答疑系统CogentAI问题解决准确率超98%,为业务带来80%以上效率提升。架构升级需根据业务深度需求,避免"为用AI而用AI"。

21 技术 lddgo 分享于 2026-06-01

Agent核心技术概念与范式发生了哪些演变以及背后的思考

26 技术 lddgo 分享于 2026-06-01