本文讲述 Dify 平台在 Agentic 应用开发中面临的可观测性挑战,从开发者与运维方双重视角出发,系统分析了当前 Dify 可观测能力的现状、局限与改进方向。
随着微信业务的持续发展,后台模块的运营成本逐步上升,其中机器计算资源占据了重要部分。为有效控制成本,我们自去年起开始探索微信后台服务的性能优化路径,并在早期分享了初步的实验性成果。经过团队半年多的持续努力,如今优化接口已正式对外开放,我们决定借此机会,系统性地介绍我们在性能优化方面的具体实践。本文旨在回顾过去一年中我们在性能优化方面的探索历程,以及在面对多种技术路线时的思考与选择,帮助感兴趣的同学深入理解相关技术细节。文档的整理不仅是对工作的总结,更是思路的梳理。我们也期待通过这样的分享,能够激发更多优化灵感,共同推动后台服务的持续进化。
在这个 AI 技术蓬勃发展的时代,每天都有新东西。每次浏览社交媒体,总能看到自媒体和 KOL 们极力的鼓吹着新产品、新技术,满口「革命」和「未来」,起初真的给我整 FOMO 了,但后来越来越感觉到厌烦,「Function Calling」、「Tool Use」、「MCP」、「Agent」、「Agentic AI」 …… 还有一大堆别的 AI 术语,你很难分清这些概念到底代表了技术的实质突破,还是同一件事被营销话术反复包装,跟前端火的那些年如出一辙,不禁让人感叹 AI 领域的概念也是通货膨胀了。在 10 月中旬,Anthropic 悄然推出了 Agent Skills(后简称 Skills),不出意外,技术社区又炸锅了。有人发出质疑,认为又在炒概念,也有人认为 Skills 虽然简单,但却是比 MCP 还要强大的玩意。最近我花了些时间深入研究 Skills,查阅官方文档,看了些 Youtube 视频,动手写了几个示例。结论是它没有某些 KOL 吹得那么神,但确实有其独到之处。而这背后,潜藏着 Anthropic 试图在 MCP 后进一步标准化 LLM 应用的野心。
长久以来,我们只知道大型视觉语言模型(LVLM)会犯错,但始终缺乏一把“手术刀”,无法剖析其视觉感知的根源性缺陷。我们只知其然,不知其所以然。我们希望当 AI 模型观察图像时,不再凭空想象,不再“指鹿为马”。现在,这一瓶颈被打破了。bilibili 用户技术中心提出 VisionWeaver 及其核心诊断工具 VHBench-10,带来了创新性的视角。VisionWeaver 不再依赖单一编码器,而是开创性地提出“上下文感知路由网络”,动态协同多个“视觉专家” 。而这一切得以实现的基础,正是其专门打造的诊断基准 VHBench-10——它让幻觉研究从“识别现象”迈向了“诊断病因”的新阶段。此工作已被 EMNLP 2025 Findings 录用。
你是不是也有过刚刷完进站闸机,抬头十几条指示牌,一脸懵;换乘只隔一条站台 最后走到腿软还绕回原点;地铁口连商场没指路牌,硬生生逛成“买单人流”。面对日益多样化的用户场景和亟待提升的用户体验指标,现有的通用引导策略已显不足。而高德地图的公交接驳指引项目是从“以交通方式为中心”到“以用户完整行程为中心”的升级。通过激活数据关联价值,为用户提供无缝的端到端出行体验。
本文介绍了手淘穿搭星球业务在面对快速迭代和极致用户体验需求时,从初期Weex方案转向Native技术栈,并基于微服务架构设计了TurboUIBuilder这一可视化页面搭建平台。该方案通过Template-Container-Component三层结构实现页面布局的结构化与动态化,结合DX动态组件、keypath数据绑定协议和内置核心服务(如布局、数据、埋点等),提升了开发效率30%-50%,实现了双端一致性、体验优化开箱即用(如无极缩放转场、多媒体浏览)以及页面的远程动态更新。同时,依托Skyline模板发布平台,支持高效、安全的模板管理与AB测试,最终形成了一套可复用、易扩展、高稳定性的Native页面底层构建引擎,已在穿搭星球等多个场景落地并持续演进。