• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
527 search results

强化学习(RL)对大模型复杂推理能力提升有关键作用,然而,RL 复杂的计算流程以及现有系统局限性,也给训练和部署带来了挑战。传统的 RL/RLHF 系统在灵活性和效率方面存在不足,难以适应不断涌现的新算法需求,无法充分发挥大模型潜力。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow(开源项目名:veRL),一个灵活且高效的 RL/RLHF 框架。该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种RL算法,显著提升训练吞吐量,降低开发和维护复杂度。实验结果表明,HybridFlow 在运行各种 RL(HF) 算法时,吞吐量相较 SOTA 基线提升了 1.5-20 倍。

334 Technology lddgo Shared on 2024-11-01

在《字节跳动容灾实践:同城容灾+异地多活是最好的模式吗?》一文中,我们介绍了字节跳动从单机房到同城多机房再到异地多活的演进过程。本文将围绕字节跳动当前的模式——同城容灾+异地多活,介绍团队在异地单元化架构落地上的一些思考和实践。

205 Technology lddgo Shared on 2024-10-30

【万字干货】保姆级AI编程基础入门,看这篇就够了!

211 Technology lddgo Shared on 2024-10-29

在《字节跳动容灾实践:同城容灾+异地多活是最好的模式吗?》一文中,我们介绍了字节跳动从单机房到同城多机房再到异地多活的演进过程。本文将围绕字节跳动当前的模式——同城容灾+异地多活,介绍团队在异地单元化架构落地上的一些思考和实践。

200 Technology lddgo Shared on 2024-10-24

随着抖音集团公司业务的持续拓展,渐趋复杂化、多元化的场景为抖音集团实验平台提出了新的挑战。在此背景下,沿用传统的假设检验框架,则已无法解决难题。 本篇聚焦实验平台主要面临的边际收益、干涉效应、自动实验配置与随机实验盲区四项挑战,详解实验平台应对挑战、拓展边界的研究进展与现阶段实践。

179 Technology lddgo Shared on 2024-10-23

音视频技术原理及应用

255 Technology lddgo Shared on 2024-10-14

本文将聚焦电商场景,介绍抖音集团埋点历程、电商场景解决方案、归因实践及其收益等模块,旨在为数据技术人员在埋点后数据加工过程中所遇到的问题提供有益思路。

184 Technology lddgo Shared on 2024-10-09

飞行中换引擎:长城汽车 toC 业务中台同城双活架构升级

263 Technology lddgo Shared on 2024-10-09

截至 2023 年底,字节跳动内部微服务的数量超过了 30 万,而且这个数字还在快速的增长当中,每个季度仍然会新增上万个微服务。伴随着海量的微服务,微服务过微带来的编解码、序列化、网络和服务治理开销过大问题也愈加凸显,在一些性能敏感、QPS 大的的服务上急需优化,于是极致的微服务合并方案合并编译应运而生。 目前公司内采用合并编译方式合并的服务超过 300 万 core,取得的 CPU Quota 收益超过 40 万 core,接口时延根据包大小有 2-15 ms 不等的优化。

285 Technology lddgo Shared on 2024-10-08

本文系火山引擎多云多活技术拆解系列文章的第三篇,将基于火山引擎的技术实践和客户服务经验,介绍如何在多云环境中实现高效、精准的流量调度,保障业务持续稳定。

180 Technology lddgo Shared on 2024-09-26