• 文库
  • 字符
  • 转换
  • 加密
  • 网络
  • 更多
    图表
    数学
    坐标
    图片
    文件
  • 文库
    字符
    转换
    加密
    网络
    更多
    图表
    数学
    坐标
    图片
    文件
logo 在线工具大全
所有 中文 英语 最新 热度
6048 条查询结果

告警治理永远是后台架构中绕不开的话题,几乎可以认为告警是否治理得好,决定能否做好后台的服务质量。现网运作过程中,时而都会面临现网质量的问题,可能是大范围的故障,也可能是一个发布有 Bug 导致某一小群用户某个功能功能不可用。让人尴尬的是,事后复盘之时,总会发现优化措施里总是有告警优化措施的身影。而告警措施无论怎么补全,似乎永远补不完。 本文将结合笔者最近一年团队的成功实战经验,从如何结合错误码设计开始,再到统一告警策略、工具建设乃至团队值班制度管理等,介绍腾讯会议部分模块告警治理经验。 本文全文1.4w字,阅读本文后,后台团队质量负责人将能回答出以下三个问题:怎么样让告警是覆盖有效的,且能真实告警是故障(这个通常不难,一旦有大范围问题,告警通常是泛滥的),还能包含一些功能性的质量/bug问题,在大面积用户反馈之前介入。在告警有效的前提下,如何做到后台服务的告警不会一直处于轰炸状态,导致团队麻木。如何推动团队真正长期有效地对告警所反映的问题做到闭环解决。

311 技术 lddgo 分享于 2025-05-28

在分布式消息队列 RocketMQ 中,ConsumeQueue(消费队列) 是消息消费的核心组件之一。它作为  CommitLog 的索引机制,帮助消费者快速定位并拉取消息。如果没有 ConsumeQueue,消费者将无法高效地从海量消息中筛选出自己订阅的数据。 本文将基于 RocketMQ 5.0 源码,深入探讨 ConsumeQueue 的设计原理与实现细节。

272 技术 lddgo 分享于 2025-05-28

本文尽量用最简单的方式, 帮读者理解 LLM, Transformer, Prompt, Function calling, MCP, Agent, A2A 等这些基本概念. 表述时不追求绝对准确, 尽量通俗易懂. 部分内容有个人理解的成份, 内容难免疏漏, 欢迎指正.

192 技术 lddgo 分享于 2025-05-28

从概念到落地:有赞 Agent 应用与探索

160 技术 lddgo 分享于 2025-05-28

高德的poi数据来源多种多样,处理流程也多种多样,但因流程相对固定,因此使用了流程化配置简化开发,使用表达式语言保证灵活性。为了加深对平台的理解,并帮助大家对编排有一定的了解,本文会以影响范围的视角去总结当前编排的方案。

204 技术 lddgo 分享于 2025-05-28

在高并发推荐引擎场景中,C++的极致性能往往以开发效率为妥协,尤其在业务频繁迭代时,C++的开发效率流程成为显著瓶颈。传统嵌入式脚本(如Lua)虽支持动态加载,但其与C++的交互成本(如虚拟栈数据中转、类型转换)仍会带来额外性能损耗。为此,我们探索设计DScript2.0——一种与C++内存布局及调用约定深度兼容的动态脚本语言,通过自研编译器实现即时编译与无缝嵌入,尝试在保留脚本灵活性的同时,尽可能贴近C++的原生性能,为性能与效率的平衡提供了轻量化解决方案。

162 技术 lddgo 分享于 2025-05-28

在你的研发团队中,什么才构成“安全威胁”?又该如何有效地识别、分类并应对这些威胁?每个人都希望保障团队、系统和服务的安全,然而由于这个话题过于庞大且令人望而生畏,同时过往的讨论和研究成果离工程团队的日常工作依然存在结合不足的情况。本文将帮助你把安全威胁拆解为一系列可管理的步骤,从理解威胁、分类威胁,到有效地应对它们。我们从一个问题开始吧。

133 技术 lddgo 分享于 2025-05-28

本文通过depth-anything获取图片的深度图,同时基于pixi.js,通过着色器编程,实现了通过深度图驱动的伪3D效果。该方案支持鼠标/手势与手机陀螺仪双模式交互,在保证性能的同时,为不同终端用户提供沉浸式的视觉体验。

176 技术 lddgo 分享于 2025-05-28

人人都在聊MCP,但人们口中的MCP往往只是一个拼凑而成的幻影。如今,各大厂商纷纷为它镀金包装,就像硅谷创投圈每隔几年就热炒一次的那个“改变世界”的万能工具。然而,当最初的狂热稍退,我们不得不面对更复杂的问题:MCP真的适用于所有场景吗?它是否被赋予了过高的期待?技术史上从不缺少“神话”,而真正的进步,往往始于祛魅之后的清醒认知。

281 技术 lddgo 分享于 2025-05-27

随着B站业务的快速发展,用户规模和内容生态不断扩展,平台的技术架构也在不断演进。伴随着这一增长,服务器数量呈现出爆发式增长,支撑起了海量用户请求和复杂的业务场景。然而,随着机器规模的持续扩大,服务器故障管理面临的挑战也愈发严峻。人工处理效率低:传统的人工故障排查和修复方式难以应对如此庞大的服务器规模。工具链分散:由于硬件故障的多样性,不同硬件需要不同的工具,导致运维团队需要频繁切换工具,增加了排查的复杂性和时间成本。在这样的背景下,如何高效地进行服务器故障管理,成为保障平台稳定性和提升用户体验的关键课题。本文将详细介绍我们在服务器故障管理中的实践与探索。

265 技术 lddgo 分享于 2025-05-27