本文系统梳理了检索增强生成(RAG)架构的演进历程,从基础架构到智能化解决方案的迭代路径。文章通过对比Naive RAG、Advanced RAG、Modular RAG和Agentic RAG四代架构的核心特点与技术突破,揭示了RAG技术如何通过模块化设计、智能体协同等创新解决知识更新、语义对齐和复杂任务处理等关键问题,为LLM应用落地提供重要参考。由于作者水平有限,若相关理解有误请以实际为准。
近两年 AI 技术发展迅猛,日新月异。大语言模型 (LLM)、AIGC、多模态、RAG、Agent、MCP 等各种相关概念层出不穷,若不深入了解,极易混淆。本文旨在简要介绍这些 AI 技术的核心概念、基本原理及其相互关系,主要帮助非 AI 行业的开发者建立基础认知。文中涉及的每项技术在其垂直领域都值得深入探索,本文仅作概念性和原理性的概述。如有疏漏或错误,欢迎指正。
腾讯工程师程誉朝基于自己的编程助手使用经验,总结了这一套借助AI编程助手,从事软件开发的提示词工程,基本覆盖了项目开发的各个阶段:需求澄清、UI设计、可行性研究、技术选型、项目排期,任务拆分、进度跟进、测试、迭代、发布等等。
RabbitMQ 作为开源消息队列的标杆产品,凭借灵活的路由机制与高可用设计,支撑着海量业务场景的消息流转。而经典队列(Classic Queue) 作为 RabbitMQ 最基础、应用最广泛的队列类型,其底层存储机制直接决定了消息处理的性能边界与可用性上限。 理解经典队列的存储架构,不仅是掌握 RabbitMQ 核心原理的关键,更为生产环境的运维优化提供了理论支撑。本文将从文件目录结构、存储格式定义、读写流程到运维实践策略,全面解析经典队列的底层存储实现逻辑,帮助读者深入理解其在消息生命周期管理中的核心作用。
“太极AngelHCF推理极致优化”系列文章由太极Angel-HCF推理团队撰写,全面揭秘如何实现DeepSeek模型15800+ tokens/s的业内H20最高性能,本文将拆解DeepSeek全栈优化方法论:通过PD分离,Prefill和Decode使用不同的并行策略,多层MTP优化,并结合模型特点和Hopper架构特性,将多机推理性能推向极限。
近两年 AI 技术发展迅猛,日新月异。大语言模型 (LLM)、AIGC、多模态、RAG、Agent、MCP 等各种相关概念层出不穷,若不深入了解,极易混淆。本文旨在简要介绍这些 AI 技术的核心概念、基本原理及其相互关系,主要帮助非 AI 行业的开发者建立基础认知。文中涉及的每项技术在其垂直领域都值得深入探索,本文仅作概念性和原理性的概述。如有疏漏或错误,欢迎指正。
系统性地“啃书”学习,在AI时代还有必要吗? 有鹅厂同事认为:“AI时代下,程序员无需死磕过时的工具书,但放弃系统性学习等同于放弃技术纵深。这种学习不再是盲目的“啃”,而是有策略的“用”——用书籍搭建知识骨架,用AI填充细节,用项目实践注入灵魂。” 结合AI时代对程序员能力的新要求,我们为你精选了2025上半年值得深入阅读的大牛书单。这份书单不仅涵盖了AI与大模型的前沿知识,也兼顾了计算机科学的经典基石,一定要看到最后一本。