文库

文库
字符
转换
加密
网络
更多

图表

数学

坐标

图片

文件
文库

字符

转换

加密

网络

更多

图表

数学

坐标

图片

文件

在线工具大全

所有

中文

英语

最新

热度

1131 条查询结果

这大概是我读过关于AI大模型最全面、好读又易懂的文章了

推开AI的门，你是站在门外怕迟到的人。很多人害怕迟到，害怕在众目睽睽之下，被视作一个犯错的学生。就如同，AI“呼的一下”就来了，并且发展迅猛，很多人也怕被它甩在后面，而我就是其中之一。神经网络是了解AI大模型无法绕过的话题，是现代大模型的基石。但是别看它现在风光，在过去的半个多世纪，却是无人问津，甚至备受争议，以至于等到它再次复出时，不得不被迫改名换姓，叫作深度学习。我在第一个部分将围绕神经网络基本概念，并将自己学习过程中的疑问，融入到文章内容，希望有着同样疑问人也能有所收获。第二部分，我会利用前文的神经网络的知识，为大家勾勒大模型的大致轮廓，先是大模型的推理，而后是大模型训练。由于GPU与大模型相生相伴，我也将在其后，分享一些AI浪潮下，它对基础设施有哪些新要求。大多数人其实很少会直接接触到大模型，而更多是通过Agent来使用它，因此在文章的最后，会简单分享一下人们是如何使用大模型的。

腾讯技术

338 技术 lddgo 分享于 2026-02-02

打造Jarvis，OpenClaw很野，但Agent Studio简直变态

OpenClaw（原名clawdbot）突然就火了，了解后发现多终端协同的人机协同方式的jarvis正是自己的日常工作方式！在此之前，为了方便自己用 AI ，我基于 claude agent sdk 手搓了一整套工具链，打造自己的 Jarvis，IM接入功能算是基操了。本文带大家快速体验一下 Agent Studio 在企业微信快速接入过程。

腾讯技术

323 技术 lddgo 分享于 2026-01-30

一夜爆火，Clawdbot是否才是真正的AI入口产品？

在过去的一年里，我们已经习惯了与 ChatGPT 或 Claude 进行对话。但现在的 AI 正在从“对话框里的聊天伴侣”进化为“操作系统里的执行者”。今天向大家介绍一个近期在 GitHub 上爆火的开源项目：Clawdbot。它不是一个简单的聊天机器人，而是一个运行在你本地设备、拥有“手脚”和“记忆”的 AI 智能体。

腾讯技术

68 技术 lddgo 分享于 2026-01-28

万字详解大模型推理加速核心原理：分形规律与资源计算公式

大模型推理性能优化比较复杂，千头万绪，涉及推理框架、模型特性、GPU硬件特性、算子优化、网络基础设施、通信协议、SLO等很多方面因素，优化的时候主要用工具分析Timeline，借力开源成果进展以及参考业界的各种论文和做法展开，总有一些东一榔头西一棒子的感觉。当涉及到灵魂拷问的时候，其实挺难回答，比如问：在某某芯片上的推理成本，还能降低到多少？但大模型推理加速也有一些内在规律：大模型推理性能的核心挑战源于算力、显存、显存带宽、通信带宽等资源不匹配或短缺。该挑战在宏观分布式架构、中观框架设计、微观算子实现、更细粒度的计算优化等不同层级上均存在。本文提出分形思考框架，借鉴分形几何的自相似性原理，在全层级遵循 “看清楚 - 避免浪费 - 提升利用率 - 节约资源” 的统一优化逻辑，尝试系统性地应对各种大模型在不同硬件上的推理优化的复杂局面，当普遍认为优化空间不大的时候，实践看还是能分析和找到优化方向和机会点，不容易遗漏和丢失重点。

腾讯技术

84 技术 lddgo 分享于 2026-01-27

腾讯混元AI Infra核心技术重磅开源：推理吞吐提升30%！

腾讯混元AI Infra团队开源生产级高性能LLM推理核心算子库 HPC-Ops，该算子库基于生产环境痛点，采用 CUDA 和 CuTe 从零构建，通过抽象化工程架构、微架构深度适配及指令级极致优化等，降低底层算子开发门槛，将核心算子性能逼近硬件峰值，实现了显著性能突破。在真实场景下，基于HPC-Ops，混元模型推理 QPM 提升30%，DeepSeek模型 QPM 提升17%。同时，在单算子性能方面，HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍；GroupGEMM 相比 DeepGEMM 最高提升1.88倍；FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。

腾讯技术

222 技术 lddgo 分享于 2026-01-27

读懂 AI Infra，看这六个关键词就够了

2025年初，DeepSeek的走红让更多人明白，不仅仅是模型本身，训练和推理过程中工程上的优化同样重要。元旦假期看了朱亦博老师的一篇帖子，很受启发，2025年过去了，我想应该尝试来把亦博老师总结的25年AI Infra六个重点方向尽可能以一些简单易懂的方式向大家介绍一下，也希望让更多的同学可以对这一年里AI Infra的发展有一些简要的了解。

腾讯技术

260 技术 lddgo 分享于 2026-01-23

腾讯技术面：数据库核心八股终极典藏版

国内云厂商从2010年左右正式推出云服务开始，关系数据库作为核心产品，18年以前聚焦于传统关系型数据库如何更好的上云托管，提供开箱即用，以及企业级的高性能、高可靠、高稳定的能力。随着泛互联网的持续发展，云计算提供开箱即用的基础设施，帮助企业快速搭建业务无需考虑基建，加速迁移上云，完成云数据库规模极大增长，特别是大众创业，万众创新后，中小用户规模急剧增加。此时，基于各项 PaaS 设施的成熟，进一步推动数据库在成本、弹性、服务质量上的突破，云原生数据库 TDSQL-C 应运而生，应云而生。以上是数据库的简要发展历程，下面以多年业务后台开发的角色，分享自己对如何用好数据库的理解，如有不足欢迎大家指正。

腾讯技术

272 技术 lddgo 分享于 2026-01-22

反思软件工程，超越Vibe Coding

站在“上帝视角”审视软件开发的历史演变，我们实际上是在见证 “人类意图”与“机器实现”之间鸿沟的不断缩减。从问题空间到解决方案空间，前人尝试过声明式DSL、RAD工具，尝试过模型驱动工具。但仍局限于定制或细分于领域。现在，结合全知全能的大模型像打开了盒子，AI 的介入让软件工程快速进入了“意图驱动”的时代。我们正处在软件工程史上最剧烈的变革期——从“人写代码给机器看” 转向“人表达意图给AI听，AI实现给机器看”。如果传统编程像是拿着精密蓝图、亲手切割并组装每一块木板来建造房子；那么Vibe Coding更像是对着一个神奇的建筑机器人描述你想要的“氛围”（比如“我想要一个通透、有现代感的起居室”），机器人会立刻堆砌出房屋。你不需要知道梁柱是如何受力的，只需不断告诉机器人“窗户再大一点”或“颜色再暖一点”，直到你满意为止。但一旦墙内电线走火，你可能根本不知道从哪里拆起。

腾讯技术

290 技术 lddgo 分享于 2026-01-21

鹅厂员工都玩过哪些技术恶作剧？

腾讯技术

149 技术 lddgo 分享于 2026-01-21

万字详解大模型应用发展：RAG、MCP、Agent的爆发之旅

腾讯技术

265 技术 lddgo 分享于 2026-01-20

简体中文