• 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • 文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
5935 条查询结果

推开AI的门,你是站在门外怕迟到的人。很多人害怕迟到,害怕在众目睽睽之下,被视作一个犯错的学生。就如同,AI“呼的一下”就来了,并且发展迅猛,很多人也怕被它甩在后面,而我就是其中之一。 神经网络是了解AI大模型无法绕过的话题,是现代大模型的基石。但是别看它现在风光,在过去的半个多世纪,却是无人问津,甚至备受争议,以至于等到它再次复出时,不得不被迫改名换姓,叫作深度学习。我在第一个部分将围绕神经网络基本概念,并将自己学习过程中的疑问,融入到文章内容,希望有着同样疑问人也能有所收获。 第二部分,我会利用前文的神经网络的知识,为大家勾勒大模型的大致轮廓,先是大模型的推理,而后是大模型训练。由于GPU与大模型相生相伴,我也将在其后,分享一些AI浪潮下,它对基础设施有哪些新要求。大多数人其实很少会直接接触到大模型,而更多是通过Agent来使用它,因此在文章的最后,会简单分享一下人们是如何使用大模型的。 

31 技术 lddgo 分享于 2026-02-02

OpenViking:面向 Agent 的上下文数据库

15 技术 lddgo 分享于 2026-02-02

在人工智能技术快速演进的时代,大型语言模型和AI智能体已成为各类应用的核心组件,引发AI相关API流量的指数级增长。而大模型网关,正是这场变革中应运而生的智能交通枢纽。 随着DeepSeek、Qwen等开源模型及各类商用大模型的普及,企业AI应用场景日益丰富,从智能客服自动化到代码生成与软件开发,从金融法律分析到内容生成引擎,AI正深度融入企业核心业务流程。 这种深度融合使得企业不仅使用SaaS化的LLM服务,更在私有化环境中微调、部署LLM模型,形成混合云架构,随之带来了多LLM适配管理、成本失控、数据安全和可靠性保障等系列挑战。

13 技术 lddgo 分享于 2026-02-02

在互联网流量竞争白热化的时代,A/B实验已成为产品迭代的标准决策工具。当实验数量从数十增长到数百甚至数千数万时,传统的人工巡检模式遭遇瓶颈:需要专业的同学每日投入4-6小时逐个检视实验数据,判断其上线或下线;即使如此,由于时间压力和注意力限制,误判率依然居高不下。

6 技术 lddgo 分享于 2026-02-02

2025年10月,淘天集团自营技术运营算法团队的研究成果《DeepStock: Reinforcement Learning with Policy Regularizations for Inventory Management》荣获运筹学与管理科学领域极具声望的 “Daniel H. Wagner 杰出实践奖”(Daniel H. Wagner Prize for Excellence in the Practice of Advanced Analytics and Operations Research)决选荣誉。值得一提的是,这是该团队继 2022 年首次入选该奖项决选名单后,第二次获此殊荣,彰显其在工业级智能决策系统领域的持续领先能力。

10 技术 lddgo 分享于 2026-02-02

当你需要频繁在 Kilocode、OpenCode、Claude、Codex、GitHub Copilot 等多个 AI 编程助手之间切换时,Ruler[1] 是你的最佳选择

33 技术 lddgo 分享于 2026-01-30

OpenClaw(原名clawdbot)突然就火了,了解后发现多终端协同的人机协同方式的jarvis正是自己的日常工作方式!在此之前,为了方便自己用 AI ,我基于 claude agent sdk 手搓了一整套工具链,打造自己的 Jarvis,IM接入功能算是基操了。 本文带大家快速体验一下 Agent Studio 在企业微信快速接入过程。

56 技术 lddgo 分享于 2026-01-30

随着 AI Agent 应用的快速发展,智能体需要处理越来越复杂的任务和更长的对话历史。然而,LLM 的上下文窗口限制、不断增长的 token 成本,以及如何让 AI“记住”用户偏好和历史交互,都成为了构建实用 AI Agent 系统面临的核心挑战。记忆系统(Memory System)正是为了解决这些问题而诞生的关键技术。记忆系统使 AI Agent 能够像人类一样,在单次对话中保持上下文连贯性(短期记忆),同时能够跨会话记住用户偏好、历史交互和领域知识(长期记忆)。这不仅提升了用户体验的连续性和个性化程度,也为构建更智能、更实用的 AI 应用奠定了基础。

32 技术 lddgo 分享于 2026-01-30

本文针对数字人直播中LLM回复“AI感强、书面化”的问题,提出一种 基于真人直播ASR数据的拟人化训练方法:先构建高质量〈AI回复, 拟人化回复〉数据对,训练拟人化改写模型;再进一步训练拟人化奖励模型,通过GRPO强化学习使生成模型直接输出自然、口语化、有帮助的回复。实验证明该方法在保持准确性和帮助性的同时,显著提升语音交互的真实感与用户体验。

44 技术 lddgo 分享于 2026-01-30

想象这样一个日常开发场景: 你正在使用 Claude Code 帮你重构一段清理逻辑,或者让 Gemini 写个自动化脚本处理数据,甚至是一个 LangGraph 驱动的 Agent 正在你的指令下调用系统 API。 你满怀期待地按下运行键,但危险往往就在这一刻: 如果 AI 在处理路径时产生了一个逻辑偏移,将清理范围锁定在了根目录;或者它引入的一个第三方库,在安装瞬间静默扫描了你的 .ssh 目录。 AI 生成的代码是一把双刃剑。 直接在宿主机“裸奔”,无异于将系统权限交给一个可能随时“幻觉”的黑盒。资源隔离、环境依赖、权限越权 —— 这些都是 AI 能力落地到真实环境时绕不开的挑战。 今天,我们正式开源 OpenSandbox —— 一个面向 AI 应用场景设计的「通用沙箱平台」,为大模型相关的能力提供安全、可靠的执行环境。

48 技术 lddgo 分享于 2026-01-29