• Open API
  • 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • Open API
    文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全

用 LLM Agent 重构告警排查流程|得物技术

出处: mp.weixin.qq.com

告警来了,第一反应是打开日志平台搜关键词,切到 APM 看监控曲线,再去链路追踪系统找 trace 详情。三个平台来回切换,最后发现只是上游 GC 抖动导致的瞬间超时,一分钟后就自愈了。这类告警排查通常需要 10~30 分钟,主要耗时不在分析本身,而在于频繁登录不同平台、拼凑分散的数据。此外,排查效率高度依赖个人经验,新人面对告警往往不知道该先看什么。于是我们做了 Troubleshooter——用 LLM Agent 自动完成告警的数据采集、根因分析和处置建议生成。上线后,中位数排查耗时从 20 分钟左右降到 4.4 分钟,覆盖了 11 个服务和 10+ 种告警类型。这篇文章是对技术方案的详细介绍。

查看原文 3 技术 lddgo 分享于 2026-06-03