我们以云原生应用部门为试验田,用商业化产品 AgentTeams 落地一支"数字员工小分队",让它们承接日常研发、工单答疑、开源维护与运营等业务,把原本人肉串联的协作流程,做成 AI Native 的工作方式。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
HPC-Ops 是腾讯混元 AI Infra 团队开源并长期维护的一套工业级、高性能的大模型推理底层算子库。在首轮开源中,HPC-Ops 提供了 Attention、GroupGEMM 等在内多个高性能算子,原生支持 BF16 与多种 FP8 量化方案,针对常见的主流推理硬件进行了深度优化。近日,为了进一步满足推理系统对动态业务负载的适应性、核心模块对复杂精度和高性能融合算子的需求,HPC-Ops 推出全新更新升级,包含五大关键算子。本次升级在主流推理平台上,有效缓解了Attention长尾延迟、显存搬运开销、跨卡通信等实际工程瓶颈,多项性能指标显著优于现有的开源基线。
软件开发进入 AI 时代以后,自动生成、自动补全、自动重构成了一种新潮。年轻程序员们开始学习如何拆分任务,审查 AI 输出,管理上下文,多 Agent 并行;面试也从古法编程的刷题,变成了“如何让 AI 稳定生成可维护代码?” 于是有老师傅哀叹,设计模式已死。可新人们却无动于衷,因为他们现在关心的是 Harness。可真当你去深入研究多 Agent 系统时,你会发现,AI 自发地演化出了一套类似设计模式的结构,就连 Harness 本身也跟设计模式有莫大的关联性。 当AI系统拥有足够复杂的任务和自治能力时,它最终会收敛到与人类工程设计相同的底层抽象,某些组织方式,会不可避免地再次出现。这或许对当下的 AI FOMO 焦虑有一种神奇的治愈作用,不管编程范式如何变化,经典始终是经典。 所以,咱们今天试着沉下心来,抛开 AI 的浮躁,重新去回顾一下,设计模式的经典吧!
本文深入探讨构建高质量 RAG 知识库的垂直技术原理与工程实践。文章首先界定知识库作为外部记忆系统的角色,并引入 RAGAS 框架从检索相关性、生成忠实度及答案相关性维度建立评估标准。随后详细拆解离线索引与在线查询流程,重点分析文档切分策略如 Late Chunking 和意图驱动切分,对比稀疏、稠密及混合检索范式,并阐述HyDE等查询增强技术。此外,文章探讨 Cross-Encoder 重排序机制以优化精度,介绍 AutoRAG 自动化优化、 QuIM-RAG 问题倒排索引及 OpenViking 文件系统范式等前沿架构,旨在通过系统性技术选型解决幻觉、召回不准等问题,实现知识库性能的端到端优化。
Kuikly 是腾讯基于 Kotlin Multiplatform (KMP) 技术构建的全平台高性能开发框架,具有一码多端、极致易用、动态灵活特点,覆盖 Android、iOS、HarmonyOS、H5、微信小程序、Mac 六大平台。得益于 Kotlin/Native 编译产物与原生渲染管线,Kuikly 已具备原生级性能表现;为进一步压榨首屏体验,我们推出了加速方案 TurboDisplay,通过节点缓存、主线程端侧直出与双线程并行渲染,在二次打开场景下实现"秒开",并在 QQ 游戏、输入法、腾讯地图等线上业务中取得 60%~80% 以上的耗时优化。本文将深入解析其设计思路与核心机制。
本文分享了团队将AI驱动的开发模式从“Vibe Coding”(AI写代码,人统筹)升级为“Harness模式”(代码库为唯一事实源,Agent自治流转)的实践。核心是通过重构代码仓库为单仓(使用Git Submodule整合前后端),并设计了一个由6个专业Sub-Agent组成的自动化协作流水线,覆盖从需求分析、前后端开发到集成测试与E2E测试的全流程。通过定义清晰的Agent Handoff协议,实现了任务状态在不同Agent间的安全、自动化流转。实践表明,该模式成功将原本需要1天完成的功能开发缩短至约2小时,效率提升约4倍,显著降低了前后端联调的沟通成本。
每次打开 Claude Code 开始新对话,它都是一张白纸。昨天你花了 10 分钟解释的项目架构、你反复纠正的代码风格偏好、你建立的特殊开发规范——全部归零。但是使用过 OpenClaw 和 Hermes 的同学都知道,这 2 个 agent 具备持久化记忆系统,这让我开始思考:能不能给 Claude Code 装上一套"长期记忆"系统?更进一步,不只是被动记忆,而是主动学习:观察我的行为模式、项目架构,提炼行为规律、项目知识,下次自动应用。这就是本文要介绍的系统。