• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
1118 search results

近年来,大模型正从能力竞赛走向工程落地,推理阶段的成本、时延与稳定性逐渐成为制约规模化应用的核心因素。在长上下文、高并发与多模态场景下,解码过程受限于算力与显存带宽,单纯依赖模型压缩或硬件堆叠的优化路径正逼近边际收益,促使业界重新审视推理机制本身的优化空间。在这一背景下,投机采样(Speculative Decoding)通过“小模型多步生成 + 大模型并行验证”,在保证生成质量的前提下减少大模型的有效前向计算。腾讯混元近期升级的 AngelSlim 围绕 Eagle3 投机采样训练范式 构建系统化实现,将投机采样提升为可训练、可迁移的加速能力,并扩展至 LLM、视觉语言与语音等多模态场景,在实际部署中最高可实现 1.9× 的推理加速,为多模态 AI 的实时化与规模化应用奠定基础。

23 Technology lddgo Shared on 2026-01-13

大模型狂飙2025:一篇文理清从模型到智能体的架构演进

28 Technology lddgo Shared on 2026-01-13

Promt设计常见错误与解决方案

31 Technology lddgo Shared on 2026-01-09

2025 年 AI 编程工具遍地开花,但一个尴尬的现实是:工具越来越强,预期越来越高,落地却越来越难——speckit 的规范流程在企业需求的"千层套路"、海量代码面前显得理想化,上下文窗口频繁爆满让复杂任务半途而废,每次做类似需求还是要花同样的时间因为知识全在人脑里。本文记录了我从踩坑规范驱动工具,到借鉴 Anthropic 多 Agent 协作架构、融合上下文工程与复合工程理念,最终实现边际成本递减、知识持续复利的完整历程。如果你也在"AI 工具明明很强但就是用不好"的困境中挣扎,或许能找到一些共鸣。附带还有新的工作流下人的工作模式转变思考~

75 Technology lddgo Shared on 2026-01-09

架构图是架构师、产品经理、开发工程师、测试工程师等各种角色之间进行沟通的语言和桥梁,让整个团队更能有效地协调工作。设计图不单单是架构师要掌握的,在一个产品的开发过程中,任何一个环节和角色都可以通过掌握不同的设计图来完成沟通。

78 Technology lddgo Shared on 2026-01-08

随着大语言模型和多模态技术的蓬勃发展,非结构化多模态数据处理已经成为数据处理的重要组成部分。面对海量数据与复杂模型带来的挑战,传统大数据引擎在异构资源调度、Python生态兼容性等方面的局限性日益凸显。本文将详述基于异构融合底座Ray重构混元数据管道的相关工作,通过云原生调度融合、计算范式统一及平台化建设,构建高效灵活的新一代AI数据底座,并深入解析我们在容错、资源利用率、规模化、可观测性等方面的优化实践。

73 Technology lddgo Shared on 2026-01-07

Agent全面爆发!万字长文详解上下文工程

47 Technology lddgo Shared on 2026-01-07

某次Code Review时发现一段逻辑明显写错了位置,询问作者为何如此实现,得到的回答让人无奈:"我知道应该加在哪里,但那个文件已经几千行,几十个if-else嵌套在一起,需求排期很紧,评估了一下,要看懂那部分代码至少需要大半天,还不确定改完会不会影响其他逻辑,所以就先这样了。而且还有几个需求因为代码过于复杂,一直没能上线。" 回顾最近代码提交记录,类似的"绕道实现"出现了十余次。这种妥协正在形成恶性循环:每一次绕道都让原本该修改的模块更加复杂,下一个开发者面对同样需求时会发现理解成本更高,于是选择继续绕道。到了不得不改变的时候了,几个月前,我开始重构推荐系统粗排服务。

94 Technology lddgo Shared on 2026-01-06

大模型的成功并非偶然——从早期符号主义AI的失败,到深度学习的崛起,再到Transformer的成功,每一次进化都是从无数被淘汰的算法、模型中艰难诞生。在这艰难曲折的探索中,人类智慧的金块无疑是AI头上的一盏明灯。反过来,大模型的进化经验,能否成为我们人类认知进化的营养?由此,我们破茧成蝶,与AI时代同频共振,开启认知与智慧的跃迁。

63 Technology lddgo Shared on 2026-01-05

在人工智能的演进历程中,大语言模型展现出了令人惊叹的文本生成能力,但其“黑箱”特性也带来了显著挑战——模型经常产生看似合理但实际错误的“幻觉”回答,缺乏透明推理过程,且无法与外部世界交互获取实时信息。ReAct(Reasoning+Acting)通过将思考过程外显化和工具使用标准化,构建了一个可解释、可验证、可扩展的智能体架构。本文将深入剖析ReAct的核心原理、技术架构及其对整个AI领域的深远影响。

112 Technology lddgo Shared on 2026-01-05