本文围绕一个核心问题展开:如何让AI助手从“输出文字”进化到“生成界面”?我们基于Google A2UI协议,自研了Vue渲染器和 Agent 完整工具链,形成了一套完整的生成式UI体系。文章将详细阐述Runtime Schema装配、双重校验机制、SSE双通道输出、Wrapper组件扩展等关键设计,为构建标准化、可复用的AI交互界面提供参考。
AI发展迅速,曾经 AI 只能帮我们补全下一行代码,到现在 AI 几乎已经可以在我们工作的各个阶段都提供帮助。创建需求、分析需求、分析技术方案、编写代码、调试bug、测试、性能优化 等等,几乎都有了AI的介入。但这些零散的节点,都需要开发者去自行选择使用,有的开发者可能还停留在传统编码,不同开发者用的不同 AI 方案。没有一个统一的工具将从TAPD到提测整个链路串起来,没有标准化的流程能够推动所有人都高效的利用 AI。
随着AI技术的快速发展,对GPU的需求也日益增加;但是,在实际生产环境中,受限于业务的模型特点及SLA等,GPU利用率普遍比较低,硬件算力被严重浪费。在这种情况下,GPU隔离能力对于最大化利用硬件资源就至关重要,本文基于NVIDIA场景,通过分析阐述业内隔离技术方案,引出他们的优势与缺陷,进而提出B站在隔离技术上的改进思路。
这篇文章将介绍B站是怎么使用 Compose Navigation3 进行页面的宽屏适配,并解决其中遇到的问题的。本文所涉及到的 Compose 页面均已完成了 CMP 跨平台化适配,内容中基于安卓习惯所提的 “Activity” 如无额外说明均代表各平台的页面容器,即可以直接替换为iOS的UIViewController理解。
多媒体中台在 B 站主要负责剪辑、拍摄、直播等业务场景的动效渲染,开发维护的 SDK 在后文统一称为特效 SDK。
回望 B 站富文本编辑器的演进史,我们经历了一个从“无”到“有”,再从“有”到“优”的过程。在 UEditor 时代,我们解决了基本的文本编辑需求;在 Quill 时代,我们引入了 Delta 数据模型。然而,在 Quill 时期,面对视频卡等复杂卡片,受限于 Quill 对 BlockNode 缺乏完善的支持,被迫采用“ Canvas 绘图伪造卡片” 的障眼法。今天,拥抱 ProseMirror 生态,这套“ 截图大法” 终于画上句号,取而代之的是支持真实交互的卡片渲染系统。这场从“伪造”到“真实”的革命,不仅是一次技术栈的迁移,更是一次对技术债的降维打击。今天就带大家深入代码底层,看看我们是如何填平这个深坑的。
写在前面,由于现在LLM生成内容千篇一律,作者尽量自行撰写核心内容,LLM仅限于润色优化,争取把整个开发迭代历程完整呈现出来供学习交流。
视频生成模型的推理优化是一个多层次、系统性的工程挑战。在模型推理的早期阶段,优化重点通常集中在算子层面,例如通过优化卷积、注意力等核心算子的计算效率来直接提升浮点运算性能。然而,随着单算子性能逐渐逼近硬件极限,计算图层面的优化便成为释放更大潜力的关键。计算图优化关注的是算子之间的调度、内存复用以及控制流开销,其核心在于提升整体执行图效率。一个高效的执行图能够最大限度地减少框架与硬件的交互开销,避免不必要的内存搬运,并使得更激进的算子融合与内存规划成为可能。本文将聚焦于推理执行流程本身,探讨如何借助 torch.compile 对 Self-Forcing 的推理流程进行整图编译(full graph compilation),以系统性地降低 Python 解释与调度开销,并为后续更深层次的图级优化奠定基础。