DeepSeek-V3 在多个评测中展现出强大性能,成为当前最受关注的开源大模型之一。由于采用了大规模 MoE 架构,如何优化推理性能,是工程落地上的关键难点。DeepSeek 团队于 2 月相继开源了 DeepEP、DeepGEMM、FlashMLA、EPLB 等关键组件。在开源社区工作的基础上,我们在RTP-LLM上完成了优化工作,对齐了 DeepSeek 推理系统的性能。 RTP-LLM 是阿里巴巴爱橙科技研发的 LLM 推理加速引擎,主要服务阿里集团内部业务。本文将分享实现过程中的一些关键技术点、不足和思考,以此感谢开源社区对我们的帮助。相关代码正在整理和重构中,不久之后会更新完整的代码和复现方法。
本文探讨了团队在代码风格与结构一致性上的长期实践与思考,分享了如何通过统一的代码规范和框架设计,提升代码可读性、可维护性,并降低团队协作与新人上手的成本。文章从问题起源、解决方案、实际收益到具体落地工具进行了全面阐述。
随着企业全球化业务的扩展,如何高效、经济且可靠地将分布在海外各地的应用与基础设施日志统一采集至阿里云日志服务 (SLS) 进行分析与监控,已成为关键挑战。本文聚焦于阿里云高性能日志采集 Agent(iLogtail/LoongCollector)在海外场景下的应用,深入探讨了如何为不同部署环境(包括本地机房、跨云平台及阿里云环境)设计最佳的网络接入链路。我们优先推荐 LoongCollector,因为它能提供更优的可靠性,尤其是在多目标发送场景下。文中详细分析了多种网络方案,涵盖公网直连、全球加速 (GA) 优化、阿里云内网以及专线/CEN/VPN 接入等方式。此外,本文还重点介绍了成本优化策略,包括利用 CloudLens for SLS 进行用量诊断,以及将公网链路迁移至私网以降低成本。同时,详细拆解了两种核心的多目标发送配置:一是通过 Agent 双写实现跨地域容灾(数据冗余),二是实现多地域/多目标日志分发(按需路由)。本文旨在为企业构建稳定、低成本、高可用的全球日志系统提供全面的实践指导和配置参考。
在人工智能技术飞速发展的今天,编程工具也迎来了变革。Cursor作为一款基于VS Code重新设计的AI驱动代码编辑器,正在重塑开发者的编程方式。它不仅提供智能代码补全、自然语言编程、多文件编辑等强大功能,还通过YOLO模式等创新特性实现任务自动化,让开发者能够更高效地编写代码、减少重复劳动。本文将深入解析Cursor的核心功能、与传统IDE的区别、真实用户反馈以及它对软件开发未来的影响。
随着 Manus 的火热,开源社区迅速响应,涌现出如 OpenManus 这样无需等待、人人可部署的优秀替代方案,它们通过多智能体协作和工具调用能力,实现了令人瞩目的效果。 正是在这样的大背景下,Spring AI Alibaba JManus 应运而生。它是一个完全以 Java 语言为核心、彻底开源的 OpenManus 实现。 JManus 产生的初心就是 “让Java程序员距离AI更近一点”。希望能够构建一个以 Java 语言为根基,基于 Spring AI Alibaba 的通用 AI Agent 框架/平台,让 Java 程序员朋友们能够更简单容易地使用 Agent 满足自己的工作、日常生活需求。 作为一个 Spring AI Alibaba 项目的子项目,整个项目在 GitHub 上获得接近 3k star,并且在快速增加中。在大语言模型构成方面,JManus 可以无缝集成包括 Claude 3.5、Qwen3 等在内的多个顶级大模型,使得开发者能充分利用各个模型的优势。
LangChain[1]是开源领域最流行的大模型编程开发框架,支持通过python/js语言快速构建AI应用。Dify[2]是开源的图形化大模型应用开发平台,可以通过可视化的画布拖拖拽拽快速构建AI agent/工作流。通过任务调度系统托管AI任务,可以进行脚本版本管理、定时调度、提升资源利用率、限流控制、可运维、可观测。
本文作者为支付宝技术部的李皓骅(亿晨),他将在本文中讨论 Kotlin/Native 的包体积的优化方法,主要包括包括:编译参数优化、精细管理导出符号 + DCE 的优化方法(暂时未讨论 Kotlin/JVM 等情况)。文中提到的优化策略部分来源于社区的公开讨论,部分则是在阅读 Kotlin 源码基础上做出的扩展与定制,已取得一定初步成效。需要强调的是,优化始终是一个持续迭代的过程,未来仍有更多手段值得进一步探索,欢迎同行共同交流与探讨。
本文是一篇关于前端AI实践的技术总结文章。文章提出了“AI四象限”决策模型,并介绍了鸿雁AI Coder和Nextdy Aone Copilot两款工具链的应用与成效。通过十余个最佳实践案例,展示了AI在前端领域的落地场景及未来发展方向。
人工智能技术的飞速进步,正在重塑全球商业格局,其影响辐射到各个行业领域。鉴于此,阿里云云栖号特别推出《一周AI大事件》,汇聚全球人工智能的最新动态。