Ray Data是构建于Ray之上的分布式数据处理库,提供了高性能且可扩展的API,可被有效结合到AI相关场景,例如批量推理、数据预处理等。Ray Data内部通过流式执行机制来有效处理大规模数据集,并可有效的利用异构架构,不让CPU或GPU成为数据处理的瓶颈。虽然Ray Data提供了简单易用的API,但其内部实现与执行原理较难理解,二次开发与问题排查有一定的难度,因此本文从Ray Data源码入手,重点分析了Ray Data流式执行的实现原理。
本文探讨了在大模型(LLM)时代下,如何重新定义业务核心资产以及Agent的演进与协作机制。文章从技术分层、Agent定义、协作模式、任务分配、冲突解决到工具调用标准(如MCP协议)等多个维度展开分析,并结合工程实践视角,提出了对Agent平台能力建设的思考,旨在为构建高效、灵活、可扩展的Agent系统提供参考。
最近刷了几篇cursor的文章,看到其中一篇文章介绍了几个cursor项目开发案例,突然有种睁眼看世界的感觉。之前对AI Coding的认知还停留在tab补全、自动生成单元测试上,没想到现在已经发展到直接能开发项目了,某种意义上做到了“有嘴就行”。于是试玩了下cursor,并结合了MCP、Rules、Docs等新功能,帮助对cursor不熟的同学快速入门。 Model Context Protocol,模型上下文协议。 官网:https://modelcontextprotocol.io/introduction功能:MCP provides a standardized way to connect AI models to different data sources and tools.(类比电子设备现在通用的USB-C口,MCP提供了一种开放标准,能让AI应用安全地访问和操作本地及远程数据,为AI应用提供了连接万物的接口)
本文详细介绍了大型语言模型(LLM)的结构、参数量、显存占用、存储需求以及微调过程中的关键技术点,包括Prompt工程、数据构造、LoRA微调方法等。
在AI大模型应用爆发的今天,Model Context Protocol (MCP) 作为连接AI大模型与应用的关键协议,正在快速普及。然而,如何在企业级环境中高效部署和管理MCP服务,成为技术团队面临的重要挑战。本文将深入剖析MCP Server的五种主流架构模式,并结合Nacos服务治理框架,为企业级MCP部署提供实用指南。
本文探讨了在直播业务中实现“多端一码”的技术方案,重点介绍了使用 Kotlin Multiplatform(KMP)来解决多端代码逻辑差异、提升开发效率和维护性的实践过程。文章从背景问题出发,详细阐述了 KMP 的核心技术特性,并结合直播业务的实际场景,分享了从技术预研到复杂业务落地、再到架构迁移的完整经验。通过这一系列探索与实践,团队验证了 KMP 在直播核心业务中的可行性与优势,并为未来实现 UI 与逻辑的全面统一奠定了基础。
"API 管理" 和 "API 网关" 这两个术语经常会被交替使用,在大模型应用上更甚(大模型被认为是 API 经济/货币化的催化剂)。但实际上,它们代表着不同的概念,服务于 API 生命周期的不同阶段。本文将探讨两者的起源和发展、关键差异对比、如何协同工作以及未来发展趋势。希望本文对技术团队做出更明智的架构决策上,能起到一些助益。
高德的poi数据来源多种多样,处理流程也多种多样,但因流程相对固定,因此使用了流程化配置简化开发,使用表达式语言保证灵活性。为了加深对平台的理解,并帮助大家对编排有一定的了解,本文会以影响范围的视角去总结当前编排的方案。