• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
1129 search results

在过去的一年里,我们已经习惯了与 ChatGPT 或 Claude 进行对话。但现在的 AI 正在从“对话框里的聊天伴侣”进化为“操作系统里的执行者”。今天向大家介绍一个近期在 GitHub 上爆火的开源项目:Clawdbot。它不是一个简单的聊天机器人,而是一个运行在你本地设备、拥有“手脚”和“记忆”的 AI 智能体。

3 Technology lddgo Shared on 2026-01-28

大模型推理性能优化比较复杂,千头万绪,涉及推理框架、模型特性、GPU硬件特性、算子优化、网络基础设施、通信协议、SLO等很多方面因素,优化的时候主要用工具分析Timeline,借力开源成果进展以及参考业界的各种论文和做法展开,总有一些东一榔头西一棒子的感觉。当涉及到灵魂拷问的时候,其实挺难回答,比如问:在某某芯片上的推理成本,还能降低到多少? 但大模型推理加速也有一些内在规律:大模型推理性能的核心挑战源于算力、显存、显存带宽、通信带宽等资源不匹配或短缺。该挑战在宏观分布式架构、中观框架设计、微观算子实现、更细粒度的计算优化等不同层级上均存在。 本文提出分形思考框架,借鉴分形几何的自相似性原理,在全层级遵循 “看清楚 - 避免浪费 - 提升利用率 - 节约资源” 的统一优化逻辑,尝试系统性地应对各种大模型在不同硬件上的推理优化的复杂局面,当普遍认为优化空间不大的时候, 实践看还是能分析和找到优化方向和机会点,不容易遗漏和丢失重点。

5 Technology lddgo Shared on 2026-01-27

腾讯混元AI Infra团队开源生产级高性能LLM推理核心算子库 HPC-Ops,该算子库基于生产环境痛点,采用 CUDA 和 CuTe 从零构建,通过抽象化工程架构、微架构深度适配及指令级极致优化等,降低底层算子开发门槛,将核心算子性能逼近硬件峰值,实现了显著性能突破。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。

3 Technology lddgo Shared on 2026-01-27

2025年初,DeepSeek的走红让更多人明白,不仅仅是模型本身,训练和推理过程中工程上的优化同样重要。元旦假期看了朱亦博老师的一篇帖子,很受启发,2025年过去了,我想应该尝试来把亦博老师总结的25年AI Infra六个重点方向尽可能以一些简单易懂的方式向大家介绍一下,也希望让更多的同学可以对这一年里AI Infra的发展有一些简要的了解。

40 Technology lddgo Shared on 2026-01-23

国内云厂商从2010年左右正式推出云服务开始,关系数据库作为核心产品,18年以前聚焦于传统关系型数据库如何更好的上云托管,提供开箱即用,以及企业级的高性能、高可靠、高稳定的能力。随着泛互联网的持续发展,云计算提供开箱即用的基础设施,帮助企业快速搭建业务无需考虑基建,加速迁移上云,完成云数据库规模极大增长,特别是大众创业,万众创新后,中小用户规模急剧增加。此时,基于各项 PaaS 设施的成熟,进一步推动数据库在成本、弹性、服务质量上的突破,云原生数据库 TDSQL-C 应运而生,应云而生。以上是数据库的简要发展历程,下面以多年业务后台开发的角色,分享自己对如何用好数据库的理解,如有不足欢迎大家指正。

35 Technology lddgo Shared on 2026-01-22

站在“上帝视角”审视软件开发的历史演变,我们实际上是在见证 “人类意图”与“机器实现”之间鸿沟的不断缩减。 从问题空间到解决方案空间,前人尝试过声明式DSL、RAD工具,尝试过模型驱动工具。但仍局限于定制或细分于领域。 现在,结合全知全能的大模型像打开了盒子,AI 的介入让软件工程快速进入了“意图驱动”的时代。 我们正处在软件工程史上最剧烈的变革期——从“人写代码给机器看” 转向“人表达意图给AI听,AI实现给机器看”。 如果传统编程像是拿着精密蓝图、亲手切割并组装每一块木板来建造房子;那么Vibe Coding更像是对着一个神奇的建筑机器人描述你想要的“氛围”(比如“我想要一个通透、有现代感的起居室”),机器人会立刻堆砌出房屋。你不需要知道梁柱是如何受力的,只需不断告诉机器人“窗户再大一点”或“颜色再暖一点”,直到你满意为止。但一旦墙内电线走火,你可能根本不知道从哪里拆起。

49 Technology lddgo Shared on 2026-01-21

鹅厂员工都玩过哪些技术恶作剧?

32 Technology lddgo Shared on 2026-01-21

万字详解大模型应用发展:RAG、MCP、Agent的爆发之旅

74 Technology lddgo Shared on 2026-01-20

随着通用大模型向着agentic以及GUI理解增强的方向发展,现在Gemini 3 Flash等通用大模型已经可以直接用来搭建一个效果还不错的GUI Agent,并且实践难度大幅降低,半小时左右就可以从0到1手搓出来。本文详细介绍如何逐步搭建一个GUI Agent,从实践中也可快速了解GUI Agent的原理。

77 Technology lddgo Shared on 2026-01-19

架构,是对系统的描述。 维基百科的定义是:软件架构是有关软件整体结构与组件的抽象描述,用于指导大型软件系统各个方面的设计。 系统的三大特征表现在架构上就是:横向可并列,纵向可推导,整体可演进。 物理学的熵增定律表明孤立系统总是趋向于熵增的方向发展。在软件系统里同样适用,只不过是以复杂度的增加表现的。 互联网软件系统总是朝着复杂度增加的方向发展。所以架构的第一目的是控制复杂,使系统朝着可控的方向发展。

96 Technology lddgo Shared on 2026-01-15