推开AI的门,你是站在门外怕迟到的人。很多人害怕迟到,害怕在众目睽睽之下,被视作一个犯错的学生。就如同,AI“呼的一下”就来了,并且发展迅猛,很多人也怕被它甩在后面,而我就是其中之一。 神经网络是了解AI大模型无法绕过的话题,是现代大模型的基石。但是别看它现在风光,在过去的半个多世纪,却是无人问津,甚至备受争议,以至于等到它再次复出时,不得不被迫改名换姓,叫作深度学习。我在第一个部分将围绕神经网络基本概念,并将自己学习过程中的疑问,融入到文章内容,希望有着同样疑问人也能有所收获。 第二部分,我会利用前文的神经网络的知识,为大家勾勒大模型的大致轮廓,先是大模型的推理,而后是大模型训练。由于GPU与大模型相生相伴,我也将在其后,分享一些AI浪潮下,它对基础设施有哪些新要求。大多数人其实很少会直接接触到大模型,而更多是通过Agent来使用它,因此在文章的最后,会简单分享一下人们是如何使用大模型的。
在人工智能技术快速演进的时代,大型语言模型和AI智能体已成为各类应用的核心组件,引发AI相关API流量的指数级增长。而大模型网关,正是这场变革中应运而生的智能交通枢纽。 随着DeepSeek、Qwen等开源模型及各类商用大模型的普及,企业AI应用场景日益丰富,从智能客服自动化到代码生成与软件开发,从金融法律分析到内容生成引擎,AI正深度融入企业核心业务流程。 这种深度融合使得企业不仅使用SaaS化的LLM服务,更在私有化环境中微调、部署LLM模型,形成混合云架构,随之带来了多LLM适配管理、成本失控、数据安全和可靠性保障等系列挑战。
在互联网流量竞争白热化的时代,A/B实验已成为产品迭代的标准决策工具。当实验数量从数十增长到数百甚至数千数万时,传统的人工巡检模式遭遇瓶颈:需要专业的同学每日投入4-6小时逐个检视实验数据,判断其上线或下线;即使如此,由于时间压力和注意力限制,误判率依然居高不下。
2025年10月,淘天集团自营技术运营算法团队的研究成果《DeepStock: Reinforcement Learning with Policy Regularizations for Inventory Management》荣获运筹学与管理科学领域极具声望的 “Daniel H. Wagner 杰出实践奖”(Daniel H. Wagner Prize for Excellence in the Practice of Advanced Analytics and Operations Research)决选荣誉。值得一提的是,这是该团队继 2022 年首次入选该奖项决选名单后,第二次获此殊荣,彰显其在工业级智能决策系统领域的持续领先能力。
OpenClaw(原名clawdbot)突然就火了,了解后发现多终端协同的人机协同方式的jarvis正是自己的日常工作方式!在此之前,为了方便自己用 AI ,我基于 claude agent sdk 手搓了一整套工具链,打造自己的 Jarvis,IM接入功能算是基操了。 本文带大家快速体验一下 Agent Studio 在企业微信快速接入过程。
随着 AI Agent 应用的快速发展,智能体需要处理越来越复杂的任务和更长的对话历史。然而,LLM 的上下文窗口限制、不断增长的 token 成本,以及如何让 AI“记住”用户偏好和历史交互,都成为了构建实用 AI Agent 系统面临的核心挑战。记忆系统(Memory System)正是为了解决这些问题而诞生的关键技术。记忆系统使 AI Agent 能够像人类一样,在单次对话中保持上下文连贯性(短期记忆),同时能够跨会话记住用户偏好、历史交互和领域知识(长期记忆)。这不仅提升了用户体验的连续性和个性化程度,也为构建更智能、更实用的 AI 应用奠定了基础。
本文针对数字人直播中LLM回复“AI感强、书面化”的问题,提出一种 基于真人直播ASR数据的拟人化训练方法:先构建高质量〈AI回复, 拟人化回复〉数据对,训练拟人化改写模型;再进一步训练拟人化奖励模型,通过GRPO强化学习使生成模型直接输出自然、口语化、有帮助的回复。实验证明该方法在保持准确性和帮助性的同时,显著提升语音交互的真实感与用户体验。
想象这样一个日常开发场景: 你正在使用 Claude Code 帮你重构一段清理逻辑,或者让 Gemini 写个自动化脚本处理数据,甚至是一个 LangGraph 驱动的 Agent 正在你的指令下调用系统 API。 你满怀期待地按下运行键,但危险往往就在这一刻: 如果 AI 在处理路径时产生了一个逻辑偏移,将清理范围锁定在了根目录;或者它引入的一个第三方库,在安装瞬间静默扫描了你的 .ssh 目录。 AI 生成的代码是一把双刃剑。 直接在宿主机“裸奔”,无异于将系统权限交给一个可能随时“幻觉”的黑盒。资源隔离、环境依赖、权限越权 —— 这些都是 AI 能力落地到真实环境时绕不开的挑战。 今天,我们正式开源 OpenSandbox —— 一个面向 AI 应用场景设计的「通用沙箱平台」,为大模型相关的能力提供安全、可靠的执行环境。