Library

ARTICLE
STRING
CONVERTER
ENCRYPT
NETWORK
MORE

CHART

MATH

COORDINATE

IMAGE

FILE

OPEN API
ARTICLE

STRING

CONVERTER

ENCRYPT

NETWORK

MORE

CHART

MATH

COORDINATE

IMAGE

FILE

OPEN API

Online Tools

All

Chinese

English

Newest

Hottest

275 search results

TextFlux重磅发布：告别复杂控制信号！多语种高保真场景文本编辑新时代

在文本编辑领域，设想一种技术：无需复杂控制信号，只靠字形图像和少量训练数据，就能把文字“无缝”嵌入真实场景——中文招牌、日文海报、韩文标语，多语言统统适用。这就是 TextFlux 带来的全新体验，由bilibili人工智能平台部，联合北京大学王选所提出。TextFlux 不再依赖 OCR 编码器和繁复的监督信号，而是把渲染好的字形直接贴进场景，让模型型专注学习“如何与周围环境自然融合”。思路直观，架构简洁，却能生成更真实、更快捷、更通用的多语言场景文本编辑效果。相关代码、权重和数据集均已开源。截至目前，该项目已支持ComfyUI，能够在消费级显卡上部署和运行。

哔哩哔哩技术

204 Technology lddgo Shared on 2025-09-19

KMP on iOS 深度工程化：模块化、并发编译与 98% 增量构建加速

哔哩哔哩技术

510 Technology lddgo Shared on 2025-09-12

AniSoraV3 正式开源，长视频创作智能体框架AniME技术揭秘

在动画制作领域，传统流程复杂且劳动强度大，涵盖剧本创作、分镜设计、角色与场景设计、动画制作、配音以及最终剪辑等多个创作阶段。这一过程不仅需要大量专业人员参与，还要求不同团队间紧密协作，导致成本高昂、制作周期漫长。近年来，生成式人工智能取得了显著进展，例如用于动画生成的 AniSora 等基础模型，在特定任务中展现出了令人印象深刻的能力。然而，这些方法在特定领域各有优劣，在智能体驱动的视频生成中，难以维持一致性且精细可控性欠佳。因此，开发一个全自动的长篇动画生成系统仍是一项亟待解决的挑战，尤其是在选择合适的控制条件以及确保跨阶段内容一致性方面。为此，我们提出 AniME，一种导演驱动的多智能体框架。该框架通过引入定制化模型选择MCP机制，为不同环节的专用智能体配置定制化工具箱，实现了任务分解、跨阶段一致性控制以及迭代式反馈优化。AniME 借鉴真实动画工作室的生产流程，强调全局调度与质量控制，使长篇动画的自动化生成成为可能。

哔哩哔哩技术

409 Technology lddgo Shared on 2025-09-04

为什么我的 TLS 1.3 多了一个 RTT

哔哩哔哩技术

342 Technology lddgo Shared on 2025-08-26

B站第三代转码体系下流式转码测试实践

哔哩哔哩技术

240 Technology lddgo Shared on 2025-08-19

B站模型训练存储加速实践

随着模型训练技术进入规模化应用阶段，提升训练效率与降低算力成本已成为全球AI竞赛的关键突破口。在以集群为单位的常态化运行的模型训练场景中，底层存储系统面临三重核心挑战：需同时实现亿级文件的高吞吐低延迟访问、PB级数据的高可靠存储，以及全系统级的高可用容错能力。本文将系统性解析B站在大规模模型训练场景中构建的存储体系升级方案与工程实践经验。

哔哩哔哩技术

263 Technology lddgo Shared on 2025-08-12

B站是如何实现原声视频翻译的

最近，我们上线了一个新能力：支持将部分中文视频翻译为外语的原声风格配音。也就是说，观众现在可以听到“这个人用另一种语言在说话”，但他的声音、语气、节奏，甚至个性表达都和原片几乎一致，不再是那种传统配音里千篇一律的“代言人声线”，而是像本人亲自讲外语一样自然。这背后，其实是一整套跨模态、多语言协同生成系统的能力升级。这一系列技术探索的出发点，源于一个日益迫切的需求：随着视频内容全球化的深入，多语言传播已成为连接文化与社群的关键载体。观众不再满足于“听懂”，而是追求“真实感”与“在场感”——希望听到原声的情绪起伏、看到口型与语音的自然匹配；创作者也愈发意识到，声音不仅是信息的载体，更是人格表达与情感共鸣的核心媒介。

哔哩哔哩技术

416 Technology lddgo Shared on 2025-08-05

哔哩哔哩Android视频编辑页的架构升级

在数字内容井喷的时代，移动端已成为视频创作的重要阵地，而视频编辑页作为创作工具的核心场景，不仅为创作者提供了丰富的表达手段和创意平台，更是提升视频制作的效率。通过直观的操作界面和丰富的功能集成，用户可以轻松地将素材、音频、特效及文字等进行融合，创造出独具风格、彰显个性的作品。然而，视频编辑页的页面设计和代码实现也充满了复杂性和挑战。在单一页面中集成了视频、音频、文字、贴纸、特效等多种功能。横向上，数十个模块互相交织与影响；纵向上，每个模块又提供了丰富的功能和精细化的操作。如此的业务复杂度，对页面架构以及功能代码的设计提出了更高的要求。

哔哩哔哩技术

312 Technology lddgo Shared on 2025-08-01

B站大数据平台元数据血缘建设与应用

哔哩哔哩技术

495 Technology lddgo Shared on 2025-07-25

前端物料库的设计

在开发新项目或需求的过程中，前端开发通常需要经历一个物料收集阶段。这一阶段的核心目标是寻找是否已存在可复用的组件，这些组件可能以 npm 包、UMD 组件或 SVG 图标的形式存在。然而，在收集这些物料时，我们常面临以下挑战：如何判断公司内部是否有推荐的公共基础库来实现特定功能（例如唤端）？当了解到某个组件可能满足当前需求时，如何快速找到该组件的使用文档？此前，前端开发人员多通过咨询同事或查阅过往相似功能代码来确定所需组件，这种方式效率较低。对于组件相关文档，若为 npm 包，虽可通过公司内部搭建的 cnpm 系统搜索查阅 readme 文档，但 UMD 组件的文档却分散于各个 info 文档中，检索极为不便。

哔哩哔哩技术

413 Technology lddgo Shared on 2025-07-18

English