• Open API
  • 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • Open API
    文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
1864 条查询结果

《AI重塑经营:2026中国电商AI应用白皮书》正式发布!

5 技术 lddgo 分享于 2026-06-09

如何更科学、方向可控的实现 Skill 的“自进化”?

5 技术 lddgo 分享于 2026-06-09

让 Agent 改一个按钮、修一个 Bug,今天已不算新闻。但只给它一份调研文档,让它从 0 写出高度还原的完整应用呢?这是一条横跨规划、架构、十几个模块编码、验证、修复的超长程任务:几个小时、成百上千个决策、前后强依赖,错一步就会沿着后面几十步一路放大。这正是今天大多数 Agent 最容易翻车的地方。最近,我们和 Efflora 团队基于 Qwen3.7-Max 模型,做了一场实验:仅凭一份产品调研文档,在隔离环境中从 0 交付了移动端和 Web 端两套可运行应用。这场实验也揭示了一个被忽视的工程真相:质量不是模型一次「生成」出来的,是被闭环「收敛」出来的。

3 技术 lddgo 分享于 2026-06-09

Harness Engineering,本质上是在为 Agent 构建一个能够持续感知、持续反馈、持续优化的自主演进环境。它是通过约束机制、反馈闭环、工作流编排、效果评估以及持续优化循环等能力,将 Agent 的运行过程纳入一个可观测、可控制、可迭代的系统工程框架之中。目标是在长程和复杂场景下,让 Agent 不仅能够执行任务,更能够感知执行状态、评估执行效果、捕捉优化方向,并据此不断调整策略,从而实现自我迭代并交付高质量结果。Harness Engineering 和 Prompt Engineering、Context Engneering 并不是互斥的概念,而是发展阶段和嵌套关系,更像是随着 AI 能力的提升、基础设施的完善,一种重要性和关注点自然而然地升维。

2 技术 lddgo 分享于 2026-06-09

用一个强 Agent 构建评测 Harness,系统性评测一群业务 Agent(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)

32 技术 lddgo 分享于 2026-06-05

2026年5月29日至31日,中国图像图形大会(CCIG 2026)在广州召开,论坛内容涵盖大模型、三维建模生成与具身智能、空间智能、脑机接口、机器视觉等热点方向,覆盖学术前沿、产业应用和技术创新,与会学术界和产业界同仁近4200余人。作为中国图像图形学学会的常任理事单位,淘天业务技术Meta技术团队连续第四年受邀出席大会,在专属展位区展示了Meta技术团队介绍与核心技术成果。此外,Meta技术团队受邀在“三维建模生成与具身智能”学术论坛上发表演讲,分享3D真人数字人在淘宝Vision领域的应用,报告现场有诸多相关方向高校老师和学生主动联系,表达未来加强交流合作,深化产学研协同创新,共同攻克关键核心技术难题的愿景。

22 技术 lddgo 分享于 2026-06-05

今天,我们正式发布 Qwen3.7-Plus——将视觉与语言统一为一体化智能体基座的多模态模型。在 Qwen3.7 强大文本能力的基础上,Qwen3.7-Plus 全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。Qwen3.7-Plus 的核心特色在于其作为多模态交互混合智能体的能力。它能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用,以及基于网络知识回答视觉问题——在单一智能体循环中无缝融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的全方位任务。它具备跨框架泛化能力,无论通过 Claude Code、OpenClaw、Qwen Code 还是其他框架部署,均能保持稳定表现。

48 技术 lddgo 分享于 2026-06-03

重新思考研发基础设施:当 Agent 成为第一公民

23 技术 lddgo 分享于 2026-06-03

本文系统梳理了Agent长期记忆能力的评测全景,涵盖基准数据集、评估框架与记忆系统三大核心维度。在基准方面,介绍了MUSE、LOCOMO等贴近真实交互的数据集;在评估方面,分析了MemoryAgentBench、LONGMEMEVAL及MemBench等框架,重点考察准确检索、长程理解、冲突解决及反思记忆等关键能力;在系统实现上对比了THEANINE、RMM、M3-Agent及Mem0等代表性方案的技术机制与性能表现。文章指出当前技术虽在检索准确性上有所进展,但在跨会话推理、动态更新及效率平衡上仍存瓶颈,并强调未来评测需统一口径,综合考量检索正确性、使用有效性、时间维度及成本约束,以真正指导工程落地。

32 技术 lddgo 分享于 2026-06-03

在闪购搜索团队的日常工作中,我们需要频繁地进行搜索问题排查、性能分析、实验管理等操作。这些操作分散在多个平台(SLS日志、TPP实验平台、代码仓库等),效率低下。我们的目标是:在钉钉群里直接对话一个AI助手,它能代替人去查日志、看实验、分析性能、甚至部署代码。

44 技术 lddgo 分享于 2026-06-02