• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
5811 search results

通过链式思考增强的大语言模型在复杂任务上已取得显著的性能提升,但在将这种推理方式无差别地应用于所有问题时,常常面临推理开销过大、响应延迟偏高等现实瓶颈。为解决这一矛盾,bilibili Index-llm Team提出 SABER(Switchable and Balanced Training for Efficient LLM Reasoning),一种让大模型具备可切换、可控、并受 token 预算约束的推理能力的强化学习框架。SABER 首先对基座模型在每个训练样本中的推理长度进行统计,将样本划分到不同的预算层级。在随后的微调过程中,模型在系统提示词和混合奖励的引导下,学习如何在给定预算内完成推理。同时,我们额外加入一部分无思考训练数据,确保模型在关闭显式推理时依然能够稳定作答。SABER 支持四种离散推理模式:NoThink、FastThink、CoreThink、DeepThink,能够在推理深度与推理延迟之间灵活调节。我们在数学推理、代码生成和逻辑推理等复杂任务上进行了系统实验。

3 Technology lddgo Shared on 2025-12-19

本文以淘宝闪购服务包系统为案例,探索如何借助 AI 技术辅助领域驱动设计(DDD)落地。

2 Technology lddgo Shared on 2025-12-19

很多人默认:给LLM足够多工具、环境感知能力,再写清Prompt,就能搞定复杂任务。这个假设站不住脚,因为复杂任务会掉进 p^n 困境:每多一步,整体成功率就下降,链路足够长,成功率趋近于零。给Agent堆上百个MCP,只会塞进更多无用信息,加速context衰退。

3 Technology lddgo Shared on 2025-12-19

随着 AI 技术加速融入软件研发流程,AI 已经成为新时代的“代码贡献者”。在显著提升研发效率的同时,AI 生成代码也对软件安全、漏洞治理和工程责任边界提出了新的挑战。 围绕“AI 生成代码在真实世界中的表现与安全性”这一问题,腾讯安全平台部悟空代码安全团队联合北京大学 Narwhal-Lab 与复旦大学系统软件与安全实验室,基于开源项目与真实漏洞(CVE)数据,开展了系统性的实证研究,分析 AI 生成代码的使用趋势、安全风险及其在漏洞生命周期中的角色演变,并提出面向工程实践的治理思路。

2 Technology lddgo Shared on 2025-12-19

从静态页面到模块化开发,前端工程化经历了怎样的演进?Webpack、Vite、Rspack 这些打包工具各自解决了什么问题,在实际项目中又该如何选择?

12 Technology lddgo Shared on 2025-12-18

从 2010 年至今,Android 架构的迭代始终围绕“解耦、可维护、可测试”的核心目标,一步步从“代码堆砌”走向“规范化设计”。本文将通过 7 个阶段梳理这段进化史。

8 Technology lddgo Shared on 2025-12-18

豆包手机为什么会被其他厂商抵制?它的工作原理是什么?

7 Technology lddgo Shared on 2025-12-18

在人工智能领域,"One Model"(单一模型)范式正在成为一种新的技术信仰。从GPT系列统一自然语言处理任务,到DALL·E统一图像生成;从国内快手 OneRec 再到如今腾讯广告提出的GPR(Generative Pre-trained Recommender)——这种范式转变背后的核心理念是:用一个端到端的生成式模型替代传统的多阶段级联系统,实现目标一致、流程简化和全局最优。 本文将深度解读腾讯广告与清华大学联合发表的这篇突破性论文,重点关注GPR如何首次在工业级大规模广告推荐业务中落地了端到端生成式框架,以及这一范式为何能在微信视频号广告系统中取得显著的商业成功。

4 Technology lddgo Shared on 2025-12-18

在我们的业务中,一个基于Vision Transformer (ViT)微调的色情图片分类模型扮演着关键角色。它在线下评估中表现出色,然而,当我们将它部署到生产环境提供在线推理服务时,真正的挑战才刚刚开始。 我们最初采用训练时的PyTorch框架 + Flask提供WEB服务的方案,但性能测试结果给我们敲响了警钟:单张图片的端到端平均延迟 53.64ms。令人困惑的是,GPU核心、显存等关键资源的利用率始终不高。在业务压力下,我们首先依靠增加服务副本、利用多进程并发的方法来支撑,这显然不是一个可扩展、高效率的长期解决方案。 那么,如何榨干GPU的每一分性能?本文将完整复盘我们的优化之旅,记录我们如何通过七个阶段的迭代,跟随性能瓶颈的不断转移,将单张图片的平均处理时间从 53.64ms 极致压缩到 8.34ms,最终实现了超过 6.4倍 的性能提升。

8 Technology lddgo Shared on 2025-12-18

本文来自携程刚刚上市的《全球化技术架构与实战》一书。携程集团自2016年起启动全球化战略,在全球化进程中,技术团队在挑战中学习,在磨砺中成长,积累了许多值得借鉴的经验。全书以“全球化业务落地”为主线,深入剖析了从架构设计、流量调度、数据合规、基础设施,到体验优化、支付建设、客服系统及IT运维的完整技术实践,希望帮助出海企业规避技术陷阱,助力业务在海外平稳落地。 本月起,我们将推出4篇出海主题系列文章,带大家一起抢先看看新书中的部分精华内容。

4 Technology lddgo Shared on 2025-12-18