• 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • 文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
5882 条查询结果

近年来,大模型正从能力竞赛走向工程落地,推理阶段的成本、时延与稳定性逐渐成为制约规模化应用的核心因素。在长上下文、高并发与多模态场景下,解码过程受限于算力与显存带宽,单纯依赖模型压缩或硬件堆叠的优化路径正逼近边际收益,促使业界重新审视推理机制本身的优化空间。在这一背景下,投机采样(Speculative Decoding)通过“小模型多步生成 + 大模型并行验证”,在保证生成质量的前提下减少大模型的有效前向计算。腾讯混元近期升级的 AngelSlim 围绕 Eagle3 投机采样训练范式 构建系统化实现,将投机采样提升为可训练、可迁移的加速能力,并扩展至 LLM、视觉语言与语音等多模态场景,在实际部署中最高可实现 1.9× 的推理加速,为多模态 AI 的实时化与规模化应用奠定基础。

3 技术 lddgo 分享于 2026-01-13

大模型狂飙2025:一篇文理清从模型到智能体的架构演进

3 技术 lddgo 分享于 2026-01-13

本文从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在“法”上,延续分层解耦、高可用等原则,但建模重心转向上下文工程与不确定性边界控制;在“术”上,融合传统工程基本功与AI新工具(如Context Engineering、轨迹可视化、多维评估体系),最终以确定性架构驾驭不确定性智能,实现可靠价值交付。

2 技术 lddgo 分享于 2026-01-13

Apache Dubbo Admin 是一个用于更好地可视化、监控、治理 Dubbo 微服务应用程序的管控台。0.7.0 版本是一个以 Kubernetes 原生为核心设计目标的里程碑版本,标志着 Apache Dubbo Admin 从“注册中心管理控制台”,演进为云原生环境中的服务治理控制面(Control Plane)。

5 技术 lddgo 分享于 2026-01-13

本次 Memory 系统重构是一次面向 AI Agent 未来演进的上下文工程升级——通过结构化、压缩与抽象机制,让模型在有限上下文预算下更高效地维持任务理解、目标对齐与推理连贯性。

16 技术 lddgo 分享于 2026-01-12

在 Agentic Coding 实践中,提升效率的关键在于优化与 AI 的协作方式,而非寄望于无限的上下文窗口。核心策略是采用“短对话、精简上下文”的模式,将复杂任务拆解为专注的子对话,并借助“复利工程”将 bug 修复、代码审查等日常经验沉淀为可复用的项目知识库,使系统获得记忆并实现效率的持续增长。此外,改善开发者体验(如清晰文档、快速测试)具有双重价值,既能帮助人类开发者,也能显著提升 AI 的表现。最终,与 AI 的协作应被视为一门需要刻意练习的技能,通过不断实践,开发者可以成为驾驭 AI 的“专家型通才”,在更广阔的领域创造价值。

26 技术 lddgo 分享于 2026-01-12

淘天业务技术2025年度热门文章盘点

9 技术 lddgo 分享于 2026-01-12

时光荏苒,Qunar技术沙龙陪伴大家又走过一年技术探索的征程。这一年,我们向大家分享了近二十篇高质量的技术文章,覆盖AI应用实践、数据库、中间件、系统/架构优化和运维方面等领域。在这一年的旅程中,感谢每一位读者的真诚相伴,你们每一次的阅读与反馈都让我们备受鼓舞。在此辞旧迎新之际,小编特地为大家汇总了2025年的技术文章,向大家呈现这一年来所探索的“技术地图”。(点击文章标题即可阅读哦)

13 技术 lddgo 分享于 2026-01-12

随着得物App各业务功能的丰富和升级,得物App内可供用户体验的内容和活动逐步增多,在用户App内体验时长不断增长的大背景下,App使用过程中的体验问题变得愈发重要。同时,在整个功能研发流程中,App端的测试时间相对有限,对于App上的各种场景的体验问题无法实现完全的覆盖,传统的UI自动化回归无法全面满足应用质量保障的需求。特别是在涉及页面交互和用户体验等较为主观的问题时,往往只能依赖于测试人员手动体验相关场景来进行质量保障,整体测试效率较低。 前段时间,我们结合内部的前端页面巡检平台,实现了对App上核心场景和玩法的日常巡检执行能力,对于基础的页面展示问题检查、交互事件检测和图片相似检测等问题已经初步具备有效的检测能力。针对应用体验类问题在传统自动化方式下的检测难题,我们结合AI模型在内部场景应用的经验,开始尝试在App上利用大型模型的分析能力进行巡检,并最终实现得物App智能巡检的应用落地。相较于传统的App质量保障方式,App智能巡检在帮助业务排查应用体验类问题有着极大的优势。

10 技术 lddgo 分享于 2026-01-12

1端开发6端复用:去哪儿RN转QTaro实战经验分享

97 技术 lddgo 分享于 2026-01-09