• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
    OPEN API
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
    OPEN API
logo Online Tools
All Chinese English Newest Hottest
1883 search results

如何更科学、方向可控的实现 Skill 的“自进化”?

72 Technology lddgo Shared on 2026-06-09

让 Agent 改一个按钮、修一个 Bug,今天已不算新闻。但只给它一份调研文档,让它从 0 写出高度还原的完整应用呢?这是一条横跨规划、架构、十几个模块编码、验证、修复的超长程任务:几个小时、成百上千个决策、前后强依赖,错一步就会沿着后面几十步一路放大。这正是今天大多数 Agent 最容易翻车的地方。最近,我们和 Efflora 团队基于 Qwen3.7-Max 模型,做了一场实验:仅凭一份产品调研文档,在隔离环境中从 0 交付了移动端和 Web 端两套可运行应用。这场实验也揭示了一个被忽视的工程真相:质量不是模型一次「生成」出来的,是被闭环「收敛」出来的。

63 Technology lddgo Shared on 2026-06-09

Harness Engineering,本质上是在为 Agent 构建一个能够持续感知、持续反馈、持续优化的自主演进环境。它是通过约束机制、反馈闭环、工作流编排、效果评估以及持续优化循环等能力,将 Agent 的运行过程纳入一个可观测、可控制、可迭代的系统工程框架之中。目标是在长程和复杂场景下,让 Agent 不仅能够执行任务,更能够感知执行状态、评估执行效果、捕捉优化方向,并据此不断调整策略,从而实现自我迭代并交付高质量结果。Harness Engineering 和 Prompt Engineering、Context Engneering 并不是互斥的概念,而是发展阶段和嵌套关系,更像是随着 AI 能力的提升、基础设施的完善,一种重要性和关注点自然而然地升维。

75 Technology lddgo Shared on 2026-06-09

用一个强 Agent 构建评测 Harness,系统性评测一群业务 Agent(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)

131 Technology lddgo Shared on 2026-06-05

2026年5月29日至31日,中国图像图形大会(CCIG 2026)在广州召开,论坛内容涵盖大模型、三维建模生成与具身智能、空间智能、脑机接口、机器视觉等热点方向,覆盖学术前沿、产业应用和技术创新,与会学术界和产业界同仁近4200余人。作为中国图像图形学学会的常任理事单位,淘天业务技术Meta技术团队连续第四年受邀出席大会,在专属展位区展示了Meta技术团队介绍与核心技术成果。此外,Meta技术团队受邀在“三维建模生成与具身智能”学术论坛上发表演讲,分享3D真人数字人在淘宝Vision领域的应用,报告现场有诸多相关方向高校老师和学生主动联系,表达未来加强交流合作,深化产学研协同创新,共同攻克关键核心技术难题的愿景。

74 Technology lddgo Shared on 2026-06-05

今天,我们正式发布 Qwen3.7-Plus——将视觉与语言统一为一体化智能体基座的多模态模型。在 Qwen3.7 强大文本能力的基础上,Qwen3.7-Plus 全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。Qwen3.7-Plus 的核心特色在于其作为多模态交互混合智能体的能力。它能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用,以及基于网络知识回答视觉问题——在单一智能体循环中无缝融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的全方位任务。它具备跨框架泛化能力,无论通过 Claude Code、OpenClaw、Qwen Code 还是其他框架部署,均能保持稳定表现。

162 Technology lddgo Shared on 2026-06-03

重新思考研发基础设施:当 Agent 成为第一公民

63 Technology lddgo Shared on 2026-06-03

本文系统梳理了Agent长期记忆能力的评测全景,涵盖基准数据集、评估框架与记忆系统三大核心维度。在基准方面,介绍了MUSE、LOCOMO等贴近真实交互的数据集;在评估方面,分析了MemoryAgentBench、LONGMEMEVAL及MemBench等框架,重点考察准确检索、长程理解、冲突解决及反思记忆等关键能力;在系统实现上对比了THEANINE、RMM、M3-Agent及Mem0等代表性方案的技术机制与性能表现。文章指出当前技术虽在检索准确性上有所进展,但在跨会话推理、动态更新及效率平衡上仍存瓶颈,并强调未来评测需统一口径,综合考量检索正确性、使用有效性、时间维度及成本约束,以真正指导工程落地。

110 Technology lddgo Shared on 2026-06-03

在闪购搜索团队的日常工作中,我们需要频繁地进行搜索问题排查、性能分析、实验管理等操作。这些操作分散在多个平台(SLS日志、TPP实验平台、代码仓库等),效率低下。我们的目标是:在钉钉群里直接对话一个AI助手,它能代替人去查日志、看实验、分析性能、甚至部署代码。

127 Technology lddgo Shared on 2026-06-02

Utoo 是一套基于 Rust 开发的前端通用工具链,目前提供了包管理器以及构建工具的功能。utoopack 是 Utoo 工具链中负责前端构建的工具,作为蚂蚁上一代前端 Rust 构建工具 Mako 的 Next 版本。utoopack 基于 Next.js 背后的 Rust bundler Turbopack,在 Turbopack 优秀的增量引擎架构之上,utoopack 面向更通用的前端项目提供独立的构建 CLI、Node API、通用 bundler 的配置体系以及对 webpack 的兼容层。

49 Technology lddgo Shared on 2026-06-01