在经典的CAP理论中一致性是指分布式或多副本系统中数据在任一时刻均保持逻辑与物理状态的统一,这是确保业务逻辑正确性和系统可靠性的核心要素。在单体应用单一数据库中可以直接通过本地事务(ACID)保证数据的强一致性。 然而随着微服务架构的普及和业务场景的复杂化,原来的原子性操作会随着系统拆分而无法保障原子性从而产生一致性问题,但业务实际又需要保障一致性,为此BASE理论提出了最终一致性来解决这类问题。那么如何在跨服务、跨数据库的事务中保证数据最终一致性。
本文介绍了StarRocks数据库如何读取ORC加密文件,包括基础概念以及具体实现方案。深入探讨了利用ORC文件的四层结构和三层索引机制,实现高效查询加密数据。希望通过本文对ORC加密文件读取功能的实现细节的剖析,让读者更加深刻理解ORC文件,同时了解StarRocks支持加解密数据分析的方案。
知识蒸馏是什么?扩散模型的蒸馏和一般的蒸馏方法有什么不同?本篇文章简单介绍了一下知识蒸馏的相关概念和在扩散模型中的应用场景,希望可以给相关领域的朋友们提供一些参考。
2025年春晚是公司的年度大型直播活动,在常规的直播之外,直播结束之后转出点播稿件的耗时,也是一项重要的竞争指标。根据运营团队同步的信息,一些竞品可以在10分钟之内,将超过4小时的直播内容转成点播稿件。 视频云当时已经存在一套快速直转点系统,用于赛事大型活动的快速转点播,但是在生成超过4小时内容,需要至少40分钟,与业务需求的10分钟内差距较大。所以,技术团队以此为目标,对直播转点播的链路进行了整体的升级,同时,这也是新一代流媒体基建系统在线上大型活动下的首战。在春晚当天,4小时40分钟的晚会内容,在约8分钟完成了点播稿件的生产,相比优化前实现了约5倍的加速,达成业务目标。
近日,中国企业发布了全球首款通用型AI Agent——Manus AI,在科技界引发了广泛关注。与传统的AI助手不同,类似Manus这样的应用,不仅仅停留在生成文本或提供建议的层面,而是能够独立思考、规划并执行复杂的任务,实现“从指令到结果”的一站式服务。在最近的英伟达年度技术大会(GTC)上,黄仁勋将Agentic AI(代理式人工智能) 定义为人工智能技术演进的关键阶段,其核心在于从“生成式AI的单次响应”升级为具备自主推理能力的智能体。由腾讯研究院和腾讯学堂主办的圆桌围绕以Manus、Deep Research为代表的的下一代Agent在产品创新、技术架构做了深度的解读,探索下一代Agent新范式。
随着 LLaMA、DeepSeek、Qwen 等开源大模型的快速崛起,企业在模型部署的灵活性、成本与自主可控性方面迎来了新的机遇。然而,仅靠对模型本身的优化尚不足以将这些模型部署成高效且可扩展的生产级 API。大模型推理往往引入诸多独特的系统挑战,如GPU 弹性伸缩指标的非线性问题,长尾模型和精调模型流量过低的问题,多机推理时的角色编排以及 GPU 卡型的异构管理等,都对易用性和成本控制提出了更高要求。因此,我们需要从推理引擎到底层基础设施进行全栈系统设计,才能真正让大模型在生产环境中长期稳定且高效地运行。 AIBrix 作为首个基于 Kubernetes 的企业级推理系统项目,正好填补了业界在“系统层”上的空白。它通过优化资源调度、自适应扩缩容、缓存感知路由以及异构计算管理等多项能力,为企业级大模型的大规模部署提供高效、低成本、可扩展的解决方案。AIBrix 与 vLLM 等推理引擎深度协同,持续优化推理效率,并融合多项前沿研究成果,推动大模型推理走向更加高效、可落地的生产化阶段。
2025年3月18日,英伟达年度技术大会(GTC)在美国圣何塞开幕,CEO黄仁勋以"AI推理时代"为核心,发布了重磅技术与合作计划,涵盖硬件架构、软件生态、量子计算、机器人技术及行业应用。与往年不同,2025 GTC英伟达转变重心,从去年的"AI训练"转向"推理与部署"的行业转型。其中特别值得关注的是主会议外的1200多场行业应用"AI小会"。研究团队尝试梳理这千场会议内容,以揭示AI行业应用发展趋势,把握推理时代下的AI+行业应用的核心技术与实践重点。内容分为上下两篇:工程技术方向与行业应用实践,本文为上篇,关于AI+行业的若干技术方向。
本文详细介绍了 JavaScript 中次要垃圾回收的 Scavenger 算法和主要垃圾回收的标记-清除算法的实现细节,以及各种算法在并行、并发、增量上的优化方案,最后介绍了 JS 中垃圾回收的触发时机。