6月30日,美团正式发布新一代万亿参数大模型 LongCat-2.0,并将对外开源。 作为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型(总参数 1.6 T,平均激活约 48 B,动态范围 33B~56B),LongCat-2.0 从零开始预训练,原生支持 1M 超长上下文,其架构设计自始至终围绕一个核心目标:让模型在真实的 Agentic Coding 任务中,更高效、更稳定地完成代码理解、生成与执行。 正式版发布前, LongCat-2.0 预览版本已通过 OpenRouter 平台和 longcat.ai 面向全球开发者开放调用—— 截至目前该模型已跻身 OpenRouter 全球大模型调用量前三,月调用量在 Hermes、Claude Code 和 OpenClaw 分列全球第一、第二和第三位,成为最受全球 Agent 开发者欢迎的模型之一。
本文介绍了一种基于 search_after + Redis 多级锚点缓存的Elasticsearch深度分页跳页方案。针对Elasticsearch原生不支持随机跳页的限制,通过三轮优化——分段预热缓存、最近锚点定位 + Elasticsearch查询提速(禁用 _source/关闭 track_total_hits)、大区间预热 + 小分页精细锚点——将 50 万数据量下的任意跳页响应时间从 10 分钟级优化至 1 秒以内。
Agent Skills 是一种轻量、开放的能力扩展规范,用于为 AI Agent 扩展专业知识和工作流。本文从概念原理出发,结合真实的工程化项目 trade-ab-skill,系统性地讲解 Skill 的结构规范、触发机制、作用域优先级,以及最佳实践。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
本文系统阐述了 AI Agent Skill 系统的设计理念与工程实践,核心观点是将 Skill 视为“行为编程”而非文档,旨在通过结构化设计(YAML+Markdown、DOT 流程图、检查表)和严格的约束机制(门控、合理化防御、说服原则)来规范 AI 代理的行为。文章详细探讨了在有限上下文窗口下的 Token 经济策略,包括基于触发条件的发现机制、两阶段加载及声明式引用;提出了单向管道工作流编排、子代理上下文隔离及分级模型选择方案;强调了基于 TDD 理念的 Skill 测试方法,即通过压力场景观测并封堵代理的违规行为;最后总结了跨平台适配策略及从“建议”走向“强制”、从“手动”走向“自动”的演进教训,旨在构建高合规性、低成本且可维护的 AI 代理技能体系。
本篇文章想做一件事:把学习方向调转过来。不只是用管理学教 Agent 如何工作,而是站在管理者和团队协作的视角,用 Agent 的运行逻辑,反过来重新审视组织协作——那些藏在算法里的管理真理,也许正是团队长期忽视的地方。
随着 AI Agent 技能(Skills)生态的迅速发展,社区开发者贡献的技能数量与日俱增。然而,这些技能来源多样、质量参差不齐,其安全性缺乏有效保障。攻击者可能借机发布恶意技能,对用户设备进行攻击或窃取数据。SkillScan 作为面向智能体技能包的全链路安全检测方案,为技能生态提供全面的安全保障。 本文将从风险全景、检测能力、场景实践、接入方案、开发规范五个维度,全面梳理技能安全的核心挑战,详细阐述 SkillScan 的安全检测体系与保障方案,为业务接入与开发者提供完整的实践指南。
Claude 在代码能力上的领先不是偶然,而是一场精心设计的系统工程胜利。本文将 Anthropic 的公开论文与技术逻辑相结合,推理其背后的核心机制。全文约 12000 字,从可验证奖励的本质,到Constitutional AI 的安全护栏,再到产品飞轮的自激强化,逐层拆解这套自我加速的进化引擎。