• 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • 文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
5301 条查询结果

本专题是我们打造智能数字人的部分实践总结。我们将探讨六大核心环节:LLM文案生产赋予数字人思考和内容生成能力,如同其“大脑”;LLM互动能力则聚焦对话逻辑与拟人化交流,是实现自然交互的关键;TTS(语音合成)技术负责将文字转化为富含情感、个性化的“声音”;形象驱动技术让语音与表情、口型、肢体动作精准同步,塑造逼真视觉形象;音视频工程解决实时渲染、低延迟传输与高质量画面输出的技术挑战;最后,服务端工程构建稳定、弹性、高并发的后端支撑平台,确保数字人服务高效稳定运行。欢迎大家一起交流进步。

16 技术 lddgo 分享于 2025-06-25

“未来”,总是能让人类展开无限的想象。《连线》杂志创始主编、“硅谷精神之父”、《失控》《必然》作者凯文・凯利确信:在不远的将来,人工智能(AI)及其相关技术会成为塑造全球社会的核心力量。他认为,对未来持有乐观的愿景,对于构建一个更加美好的世界起着至关重要的作用。一个理想中的美好未来绝不可能偶然呈现,而是需要我们基于对未来走向的准确把握去积极塑造。

23 技术 lddgo 分享于 2025-06-25

伴随着大模型的性能提升、成本下降,在Web在线对话场景以外,大模型也越来越多的被集成到传统业务场景。在大模型API交互模式、业务集成模式经百家争鸣现已趋于稳定的背景下,Spring作为Java生态里的OSS巨头也下场为LLM提供生态支持,于近期释出 spring-ai 正式版。需要说明的是,Spring-AI 所提供的能力并不神秘,业务上也并非必须用Spring-AI不可。但是,就像过去Spring对新的数据库、新的中间件提供生态支持一样,Spring-AI提供了一套和Spring全家桶兼容并且语义一致、良好设计、易拓展的大模型交互的Java API,可以极大的降低LLM集成和开发的成本。从大模型的工程化、实用化角度来说,当你厘清Spring-AI这一套API设施的逻辑后,事情最后还是会回归到业务开发人最熟悉的CRUD领域。就像使用Mybatis操作MySQL一样,我们会用 spring-ai 来操作大模型。

14 技术 lddgo 分享于 2025-06-25

本文从作者实际痛点出发,到产生愿景,最后再到落地的全过程,并结合实例案例,介绍了一些核心设计思路,希望读者阅读后对vivo分销业务,能有一些了解,也希望能对读者在应用的认证鉴权、流程编排、低代码等方面有所启发。

24 技术 lddgo 分享于 2025-06-25

本文是近两个月的实践总结,结合在实际工作中的实践聊一聊Cursor的表现。记录在该过程中遇到的问题以及一些解法。问题概览(for 服务端):

25 技术 lddgo 分享于 2025-06-24

社区里缺的不是架构图,而是可供参考的架构实践。程序员缺的不是技术原理知识,而是抽象来的可供复用的方案思路。为了切实帮助技术人成长,在信息爆炸时代获取最精华的架构知识,腾讯云开发者携手腾讯云架构师技术同盟推出架构师系列文集,每期会以《如何设计一个 XX 系统》为主题,分享同盟架构师们多年经验抽象来的经典方案设计思想。 本文是系列第一篇,我们聊聊支付系统的经典设计。除了作为普适方案的本文,作者还准备了上中下三篇信息密度更丰富、细节更详实的雄文,各位读者朋友一定持续关注腾讯云开发者公众号,不错过后续更新。

24 技术 lddgo 分享于 2025-06-24

最近在哔哩哔哩,我们开发了一种改进的 BBR 拥塞控制算法,需要在真实环境中进行测试。该算法本身以内核模块的形式存在,因此将其安装到服务器上不是问题。然而,在快节奏的迭代过程中,我们遇到了一系列问题,最终发现了一个内核错误。本文将带您了解我们解决问题的整个过程,从拥塞控制算法热交换到内核错误修复。下方列出了本文所处的实验环境,可以帮助您复现实验。

18 技术 lddgo 分享于 2025-06-24

大模型浪潮席卷全球,我们正站在技术范式颠覆的临界点。智能不再仅仅是工具,更是驱动产业进化的新基因。“智能+”除了技术嫁接,还是认知革命和生态重构,其本质是给千行百业植入新时代的基因。中国智能经济正处于爆发前夜。我们不仅要厘清加什么(新认知、新数据、新技术),还要解决怎么加(云上智能、数字信任、π型人才、全员参与、机制重构)的问题,方能迎来产业升级的奇点。

19 技术 lddgo 分享于 2025-06-24

本专题是我们打造智能数字人的部分实践总结。我们将探讨六大核心环节:LLM文案生产赋予数字人思考和内容生成能力,如同其“大脑”;LLM互动能力则聚焦对话逻辑与拟人化交流,是实现自然交互的关键;TTS(语音合成)技术负责将文字转化为富含情感、个性化的“声音”;形象驱动技术让语音与表情、口型、肢体动作精准同步,塑造逼真视觉形象;音视频工程解决实时渲染、低延迟传输与高质量画面输出的技术挑战;最后,服务端工程构建稳定、弹性、高并发的后端支撑平台,确保数字人服务高效稳定运行。欢迎大家一起交流进步。

411 技术 lddgo 分享于 2025-06-23

DeepSeek-R1发布后,推理框架加速需求暴涨。在最近四个月中,各个开源框架(vLLM,SGLang,FlashInfer等)针对DeepSeek进行专项优化,性能提升了2-3倍。经过四个月的开发,一念发布了0.6.0,支持了DeepSeek模型和分布式推理。针对PCG业务的特殊需求,GPU资源供应灵活性要求高的特点,一念实现了流水线并行(PP)的multi-batch分布式推理方式。相对业界常见的多机DP+EP方案,跨机通讯量降低98.3%,机器之间通讯可以使用TCP,大大降低运营难度。然而即便使用TCP进行机器间通讯,一念的吞吐达到9084 tokens/s,比业界开源框架高48%。

22 技术 lddgo 分享于 2025-06-23