随着 AI,尤其是 Generative AI(后文简称 GenAI)的快速发展,AI Agent 系统中涌现出大量新的核心概念,例如 Model、Prompt、Token、Tool Calling、Agent、Memory、Session 等。这些概念已成为算法工程师、运维人员和可观测平台用户最关心的观测对象。它们需要像传统系统中的 HTTP 请求、数据库调用一样,被标准化地采集、展示和消费,以便系统维护者清晰了解调用过程、高效排查问题。基于此,OpenTelemetry(后文简称 OTel)早在 2024 年初就开始推动 Gen AI 语义规范建设,希望为这些新对象建立统一的数据采集规范——Semantic Conventions(后文简称 SemConv),以解决相关领域可观测数据采集标准缺失、口径不统一等问题。
文章从 Skill 的规范格式、三层渐进式加载机制、模型驱动触发逻辑出发,深入解析 Skill-Creator 的工程化开发范式。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
本文系统阐述了构建App稳定性分析Agent的必要性、核心设计与实现路径。传统的手动排查流程效率低下、严重依赖专家,而本方案通过将工具链自动化与AI智能分析相结合,构建了一个统一的Agent框架。该框架以可扩展的Tool(原子能力)和Workflow(场景策略)为核心,当前已成功落地闪退(Crash)自动分析场景,能够实现从崩溃日志解析、地址符号化、代码上下文提取到AI推理和修复建议的一站式处理。更重要的是,通过引入向量数据库驱动的RAG知识库,系统能将处理经验沉淀下来,实现越用越智能的“数据飞轮”效应。
本文系统总结了汇金平台在缓存使用中的技术实践,涵盖缓存理论(适用条件、分类维度与选型方法)、落地实践(五类典型场景——配置/实体数据缓存、分布式锁、汇总计数等的选型依据与实现细节)以及缓存安全(穿透、击穿、雪崩、一致性、序列化、本地缓存并发等风险的成因与治理方案)。
从 Prompt Engineering 到 Context Engineering 再到 Harness Engineering,AI Coding 正在经历第三次范式跃迁。本文结合 Anthropic、OpenAI 的最新方法论与真实项目实践,系统分享如何为存量 Java 应用构建完整的 Harness 体系,将 AI 代码率从不到 25% 提升至 90%。
我们最近做了一份内部访谈,问几位深度使用 AI 的工程师"你日常时间分配的变化"。结果有点出乎意料——写代码的占比,从过去的 30% 降到 5%;和 Agent 对话的占比,从 5% 升到 60%;查问题的时间下降一半以上;纯编码效率提升 10 倍,但端到端需求交付效率只提升 2 到 3 倍。更值得停下的不是数字,是节奏:一个工程师上午 10 点上线一个新功能、中午做 A/B 测试、下午 3 点根据数据下线、5 点上线更好的版本。同一天。这是过去 6 周才能完成的迭代。为了理解这件事到底意味着什么,我想先回到一个更基本的问题:组织到底是为什么存在的?
本⽂是关于 AI 辅助编码的全⾯实战指南,基于天猫新品团队的实践经验,从问题本质到解决⽅案,从理论框架到实战案例,系统性地介绍如何让 AI 更好地完成⼤部分需求。