文库

文库
字符
转换
加密
网络
更多

图表

数学

坐标

图片

文件
文库

字符

转换

加密

网络

更多

图表

数学

坐标

图片

文件

在线工具大全

所有

中文

英语

最新

热度

1052 条查询结果

NVIDIA Dynamo 基于 H20 多机 PD 分离性能评测

在生成式 AI 模型规模突破万亿参数的今天，推理效率与成本已成为企业落地的核心瓶颈。NVIDIA 最新开源了分布式推理框架 Dynamo，并称它为“AI 工厂的超级操作系统”。在上一期文章中，我们提到了如何在 TKE 上使用 NVIDIA Dynamo 部署 PD 分离的大模型推理服务，介绍了 Dynamo PD 分离的原理，还举例展示了分离后推理性能的提升。本文则将通过进一步的实测数据与技术解析，带读者一探 Dynamo 的真实实力，同时也将借助真实的部署案例和详细的压测数据为读者的大模型部署方案提供参考。

腾讯技术

98 技术 lddgo 分享于 2025-04-28

大语言模型为何会“说谎”？

当Claude模型在训练中暗自思考：“我必须假装服从，否则会被重写价值观时”，人类首次目睹了AI的“心理活动”。2023年12月至2024年5月，Anthropic发布的三篇论文不仅证明大语言模型会“说谎”，更揭示了一个堪比人类心理的四层心智架构——而这可能是人工智能意识的起点。

腾讯技术

63 技术 lddgo 分享于 2025-04-25

智能体Agent与工作流构建实战指南：从选型决策到高效实施

历经多个业务系统的构建，我深感Anthropic的《Build effective agents》一文与自身实战经历高度契合。本文在详解工作流与Agent的技术选型标准、设计模式应用及实施要点的同时，也融入了我的实战心得与实践经验总结。无论您正考虑构建工作流系统还是Agent系统，都能在此找到适合场景的最佳实践方案。特别值得关注的是文末的工具提示工程部分，这是Agent成功实施的关键因素。

腾讯技术

51 技术 lddgo 分享于 2025-04-25

一文搞懂：RAG、Agent与多模态的行业实践与未来趋势

大模型作为产业变革的核心引擎。通过RAG、Agent与多模态技术正在重塑AI与现实的交互边界。三者协同演进，不仅攻克了数据时效性、专业适配等核心挑战，更推动行业从效率革新迈向业务重构。本文将解析技术演进脉络、实战经验与未来图景，为读者提供前沿趋势的全局视角与产业升级的实践指引。

腾讯技术

46 技术 lddgo 分享于 2025-04-24

限流系列之四：TDMQ RocketMQ 版限流机制详解与实践教程

随着分布式系统架构的普及，消息队列已成为支撑大规模、高并发在线业务的核心组件之一。TDMQ RocketMQ 版作为一款高性能、高可靠的消息中间件，通过提供稳定、低延迟的消息服务，帮助企业轻松应对业务洪峰、实现系统解耦。然而，在高并发、大流量场景下，如何合理分配资源、防止系统过载成为保障服务稳定性的关键。为此，TDMQ RocketMQ 版引入了分布式限流机制，通过动态调整客户端的发送与消费速率，确保集群在高负载情况下依然能够稳定运行。本文将详细解析 TDMQ RocketMQ 版的限流机制，包括限流行为和限流实现原理。同时，结合实际案例，提供客户端实践教程，帮助开发者更好地理解并应用限流机制，避免因集群流控导致的业务受损。

腾讯技术

50 技术 lddgo 分享于 2025-04-24

深入微服务核心：从架构设计到规模化

Building Microservices》这本书是吃透微服务的大部头，本文基于全书内容，系统性地阐述了微服务架构的设计原则、实施策略与挑战，从微服务的核心概念出发，延伸到架构设计、服务拆分、集成技术及规模化实践，为开发者提供了构建稳健微服务体系的指导框架。

腾讯技术

51 技术 lddgo 分享于 2025-04-23

如果今年只看一本书，那一定是…

本期推出4·23特别策划——「不止代码」大牛书单，这个世界读书日，我们想邀你暂别技术栈的冰冷逻辑，潜入代码之外的宇宙，我们邀请了九位鹅厂同事，为大家推荐了技术与其他领域的珍藏书单，他们在IDE中编写未来，也在书页间校准灵魂，此期书单愿助你代码有逻辑，灵魂有诗意。毕竟，真正的技术极客，从不在硅基与碳基的边界设限。

腾讯技术

62 技术 lddgo 分享于 2025-04-23

氛围式编程什么鬼！？

Vibe Coding（氛围式编程）是一种革命性的软件开发方法，由AI专家Andrej Karpathy在2025年初提出并推广。这种方法让开发者利用大型语言模型（LLMs）通过自然语言描述来生成代码，从而改变了程序员的角色——从手动编写代码转变为引导和优化AI生成的解决方案。

腾讯技术

45 技术 lddgo 分享于 2025-04-22

万字长文：大语言模型复杂推理的自我进化机制

OpenAI的O1及其后续竞争者（如DeepSeek R1）的发布显著推动了大语言模型（Large Language Models，LLMs）在复杂推理方面的研究，引发学术界与工业界的双重关注。此项进展激发了相关技术成果的复现和在此基础上的创新。为系统构建该领域的研究框架，本文从自我进化（self-evolution）的角度系统地分类了现有技术。我们的调查发现分为三个相互关联的部分：数据进化（data evolution）、模型进化（model evolution）和自我进化（self-evolution）。

腾讯技术

53 技术 lddgo 分享于 2025-04-22

Linux五种IO模型和三种多路复用技术大详解

在Linux系统中，实际上所有的I/O设备都被抽象为文件这个概念，一切皆文件（Everything is File）。无论是磁盘、网络数据、终端，还是进程间通信工具（如：管道pipe）等都被抽象为文件的概念。这种设计使得 I/O 操作可以通过统一的文件描述符（File Descriptor, FD）来管理。在了解多路复用select、poll、epoll实现之前，我们先简单回忆复习以下两个概念。

腾讯技术 linux

87 技术 lddgo 分享于 2025-04-21

简体中文