今天,我们正式发布 Qwen3.7-Plus——将视觉与语言统一为一体化智能体基座的多模态模型。在 Qwen3.7 强大文本能力的基础上,Qwen3.7-Plus 全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。Qwen3.7-Plus 的核心特色在于其作为多模态交互混合智能体的能力。它能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用,以及基于网络知识回答视觉问题——在单一智能体循环中无缝融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的全方位任务。它具备跨框架泛化能力,无论通过 Claude Code、OpenClaw、Qwen Code 还是其他框架部署,均能保持稳定表现。
本文系统梳理了Agent长期记忆能力的评测全景,涵盖基准数据集、评估框架与记忆系统三大核心维度。在基准方面,介绍了MUSE、LOCOMO等贴近真实交互的数据集;在评估方面,分析了MemoryAgentBench、LONGMEMEVAL及MemBench等框架,重点考察准确检索、长程理解、冲突解决及反思记忆等关键能力;在系统实现上对比了THEANINE、RMM、M3-Agent及Mem0等代表性方案的技术机制与性能表现。文章指出当前技术虽在检索准确性上有所进展,但在跨会话推理、动态更新及效率平衡上仍存瓶颈,并强调未来评测需统一口径,综合考量检索正确性、使用有效性、时间维度及成本约束,以真正指导工程落地。
在闪购搜索团队的日常工作中,我们需要频繁地进行搜索问题排查、性能分析、实验管理等操作。这些操作分散在多个平台(SLS日志、TPP实验平台、代码仓库等),效率低下。我们的目标是:在钉钉群里直接对话一个AI助手,它能代替人去查日志、看实验、分析性能、甚至部署代码。
Utoo 是一套基于 Rust 开发的前端通用工具链,目前提供了包管理器以及构建工具的功能。utoopack 是 Utoo 工具链中负责前端构建的工具,作为蚂蚁上一代前端 Rust 构建工具 Mako 的 Next 版本。utoopack 基于 Next.js 背后的 Rust bundler Turbopack,在 Turbopack 优秀的增量引擎架构之上,utoopack 面向更通用的前端项目提供独立的构建 CLI、Node API、通用 bundler 的配置体系以及对 webpack 的兼容层。
全是 Web,没有 CLI,怎么行?Agent 都会写代码了,远程排障还要人肉点网页、复制命令、盯滚动条,这画面多少有点“地铁老人看手机.jpg”。本文记录一次围绕 StarAgent/Drogo WebTerminal 的工具化实践:我们没有把 GPU hang、core dump 调试等场景固化成一个个“祖传脚本套件”,而是把 WebTerminal 抽象成稳定的 CLI 执行面,再用 Skill 描述操作方法。Agent 在任务中动态生成命令、读取结果、继续决策,最终完成远程 GPU hang 分析、文件上传下载、以及 Emacs + eshell + gdb 的交互式 coredump 调试验收。插播:我对 Skill 的态度很朴素:Skill 不是法器,不是咒语,也不是“复制进去 Agent 就突然开悟”的玄学符纸。Skill 本质上就是说明书,是贴在工具箱盖子上的那张“先拧这个、再接那个、别把手伸进风扇里”的操作指南。真正能把活干成的,必须是 CLI:参数清楚、行为稳定、输出可解析、错误可复现、证据能落盘。
2025年成为AI智能体(Agentic AI)元年,传统工程架构面临与AI"不确定性"的冲突。AI Friendly架构通过三范式实现演进:1)确定性→概率性,将输出收敛至安全区间;2)结构化→语义化,基于意图而非格式响应;3)静态→动态,从规则转向规划。核心能力包括Multi-Agent系统、Context Engineering(上下文工程)、AI Friendly API及AI可观测体系。实际应用中,AI审核准确率达95.7%,AI答疑系统CogentAI问题解决准确率超98%,为业务带来80%以上效率提升。架构升级需根据业务深度需求,避免"为用AI而用AI"。
DeepSeek V4 采用 CSA + HCA 的混合注意力结构:CSA 通过低倍率压缩与 sparse top-k 检索保留长程历史,HCA 通过高倍率压缩提供全局上下文补充,再由 SWA 负责最近窗口内的精细建模。这种设计降低了长上下文推理的计算和显存压力,但也对推理系统提出了一个根本性的挑战:同一个 token 在不同 attention 路径里会对应完全不同的物理形态——最近窗口需要 raw KV,长历史被压缩成 C4 或 C128,C4 还要配合 indexer 做稀疏检索。如果继续把 KV Cache 当作一块连续 buffer 来管理,系统根本接不住这样的复杂度。阿里云 Tair KVCache 团队联合SGLang 社区,为 DeepSeek V4 构建了一套面向 Prefill 和 Decode 的分层缓存架构。实测在多轮对话场景下,Prefill 结合 HiCache 吞吐提升接近 3 倍;Decode 侧通过 HiSparse 分层 SparseAttention 机制,成功释放显存提升 5~10 倍 BatchSize。
本文分享了TMIC AI小新技术架构从定制化workflow到DeepAgent模式的架构改版实践。面对复杂问题需要跨模块协作、多步骤推理和动态参数识别的挑战,我们借鉴DeepAgent的核心设计思路(TodoList、SubAgent、Summary、FileSystem),实现了从"预设流程"到"AI自主决策"的转变。与此同时,我们还在DeepAgent的基础上针对业务场景做了创新性优化(Tree Action模式、SubAgent提速、异步Summary),显著提升了系统性能和效率。