• Open API
  • 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • Open API
    文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
1858 条查询结果

今天,我们正式发布 Qwen3.7-Plus——将视觉与语言统一为一体化智能体基座的多模态模型。在 Qwen3.7 强大文本能力的基础上,Qwen3.7-Plus 全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。Qwen3.7-Plus 的核心特色在于其作为多模态交互混合智能体的能力。它能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用,以及基于网络知识回答视觉问题——在单一智能体循环中无缝融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的全方位任务。它具备跨框架泛化能力,无论通过 Claude Code、OpenClaw、Qwen Code 还是其他框架部署,均能保持稳定表现。

3 技术 lddgo 分享于 2026-06-03

重新思考研发基础设施:当 Agent 成为第一公民

3 技术 lddgo 分享于 2026-06-03

本文系统梳理了Agent长期记忆能力的评测全景,涵盖基准数据集、评估框架与记忆系统三大核心维度。在基准方面,介绍了MUSE、LOCOMO等贴近真实交互的数据集;在评估方面,分析了MemoryAgentBench、LONGMEMEVAL及MemBench等框架,重点考察准确检索、长程理解、冲突解决及反思记忆等关键能力;在系统实现上对比了THEANINE、RMM、M3-Agent及Mem0等代表性方案的技术机制与性能表现。文章指出当前技术虽在检索准确性上有所进展,但在跨会话推理、动态更新及效率平衡上仍存瓶颈,并强调未来评测需统一口径,综合考量检索正确性、使用有效性、时间维度及成本约束,以真正指导工程落地。

3 技术 lddgo 分享于 2026-06-03

在闪购搜索团队的日常工作中,我们需要频繁地进行搜索问题排查、性能分析、实验管理等操作。这些操作分散在多个平台(SLS日志、TPP实验平台、代码仓库等),效率低下。我们的目标是:在钉钉群里直接对话一个AI助手,它能代替人去查日志、看实验、分析性能、甚至部署代码。

13 技术 lddgo 分享于 2026-06-02

Utoo 是一套基于 Rust 开发的前端通用工具链,目前提供了包管理器以及构建工具的功能。utoopack 是 Utoo 工具链中负责前端构建的工具,作为蚂蚁上一代前端 Rust 构建工具 Mako 的 Next 版本。utoopack 基于 Next.js 背后的 Rust bundler Turbopack,在 Turbopack 优秀的增量引擎架构之上,utoopack 面向更通用的前端项目提供独立的构建 CLI、Node API、通用 bundler 的配置体系以及对 webpack 的兼容层。

14 技术 lddgo 分享于 2026-06-01

全是 Web,没有 CLI,怎么行?Agent 都会写代码了,远程排障还要人肉点网页、复制命令、盯滚动条,这画面多少有点“地铁老人看手机.jpg”。本文记录一次围绕 StarAgent/Drogo WebTerminal 的工具化实践:我们没有把 GPU hang、core dump 调试等场景固化成一个个“祖传脚本套件”,而是把 WebTerminal 抽象成稳定的 CLI 执行面,再用 Skill 描述操作方法。Agent 在任务中动态生成命令、读取结果、继续决策,最终完成远程 GPU hang 分析、文件上传下载、以及 Emacs + eshell + gdb 的交互式 coredump 调试验收。插播:我对 Skill 的态度很朴素:Skill 不是法器,不是咒语,也不是“复制进去 Agent 就突然开悟”的玄学符纸。Skill 本质上就是说明书,是贴在工具箱盖子上的那张“先拧这个、再接那个、别把手伸进风扇里”的操作指南。真正能把活干成的,必须是 CLI:参数清楚、行为稳定、输出可解析、错误可复现、证据能落盘。

12 技术 lddgo 分享于 2026-06-01

2025年成为AI智能体(Agentic AI)元年,传统工程架构面临与AI"不确定性"的冲突。AI Friendly架构通过三范式实现演进:1)确定性→概率性,将输出收敛至安全区间;2)结构化→语义化,基于意图而非格式响应;3)静态→动态,从规则转向规划。核心能力包括Multi-Agent系统、Context Engineering(上下文工程)、AI Friendly API及AI可观测体系。实际应用中,AI审核准确率达95.7%,AI答疑系统CogentAI问题解决准确率超98%,为业务带来80%以上效率提升。架构升级需根据业务深度需求,避免"为用AI而用AI"。

12 技术 lddgo 分享于 2026-06-01

Agent核心技术概念与范式发生了哪些演变以及背后的思考

14 技术 lddgo 分享于 2026-06-01

DeepSeek V4 采用 CSA + HCA 的混合注意力结构:CSA 通过低倍率压缩与 sparse top-k 检索保留长程历史,HCA 通过高倍率压缩提供全局上下文补充,再由 SWA 负责最近窗口内的精细建模。这种设计降低了长上下文推理的计算和显存压力,但也对推理系统提出了一个根本性的挑战:同一个 token 在不同 attention 路径里会对应完全不同的物理形态——最近窗口需要 raw KV,长历史被压缩成 C4 或 C128,C4 还要配合 indexer 做稀疏检索。如果继续把 KV Cache 当作一块连续 buffer 来管理,系统根本接不住这样的复杂度。阿里云 Tair KVCache 团队联合SGLang 社区,为 DeepSeek V4 构建了一套面向 Prefill 和 Decode 的分层缓存架构。实测在多轮对话场景下,Prefill 结合 HiCache 吞吐提升接近 3 倍;Decode 侧通过 HiSparse 分层 SparseAttention 机制,成功释放显存提升 5~10 倍 BatchSize。

28 技术 lddgo 分享于 2026-05-29

本文分享了TMIC AI小新技术架构从定制化workflow到DeepAgent模式的架构改版实践。面对复杂问题需要跨模块协作、多步骤推理和动态参数识别的挑战,我们借鉴DeepAgent的核心设计思路(TodoList、SubAgent、Summary、FileSystem),实现了从"预设流程"到"AI自主决策"的转变。与此同时,我们还在DeepAgent的基础上针对业务场景做了创新性优化(Tree Action模式、SubAgent提速、异步Summary),显著提升了系统性能和效率。

26 技术 lddgo 分享于 2026-05-29