• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
35 search results Contribute

到 2023 年春节期间,流量已经基本恢复到疫情前的水平。Redis 资源的使用率大幅增加,但服务器的扩充速度却远远跟不上业务增长的速度。尤其是在春节这样的高峰期,导致服务器剩余可用资源和负载频繁报警,给运维工作和服务稳定性带来了巨大的压力和挑战。 为了应对这一现状,自动化运维工具成为了缓解压力的必要手段。通过开发和升级自动化平台,DBA 可以更加高效地管理大量的数据库服务器,减少人工干预和错误率,从而更好地应对与日俱增的 Redis 需求和流量。

13 Technology lddgo Shared on 2024-02-20

告警系统在数据库管理中扮演着至关重要的角色。它通过实时监测系统状态,一旦发现异常或达到预设条件,便迅速生成警报,确保相关人员能够及时得到通知并采取相应措施。 在去哪儿网的运维保障工作中,告警系统发挥了巨大作用,显著提高了故障发现和处理的效率。然而,仅仅依赖告警系统是不够的。在日常的数据库管理中,潜在的风险和问题可能悄然滋生,难以仅通过告警来全面掌握。因此,巡检系统成为了不可或缺的补充。 巡检系统通过对应用程序的性能和运行状态进行全面评估,能够及时发现潜在风险并提前解决萌芽阶段的问题。这使得DBA能够更加从容地应对复杂的数据库环境,提高整体服务质量。 为了进一步提升运维保障工作的效率和品质,去哪儿网DBA团队在数据库巡检系统和告警系统中采取了一系列优化措施。这些措施包括改进监控机制、健全指标及其等级分类、增强自动化处理能力、完善巡检指标、自动生成报告等。通过这些优化手段,去哪儿网不仅提高了数据库的稳定性,还显著减少了故障发生的风险,为公司的业务发展提供了坚实的技术保障。

9 Technology lddgo Shared on 2024-01-18

2023年『技术原创文章』精华大汇总!

9 Technology lddgo Shared on 2024-01-04

本文介绍了一款面向全司研发人员的开发助手的设计与实现思路,普及了开发助手的功能和技巧,量化了落地后的效果数据。 首先,分析了市面上已有的AI产品Copilot和ChatGPT的局限性,然后提出了开发助手的设想,包括 集成在IDE、智能代码补全、问答能力、与代码的联动、公司内部知识等。 接着,详细介绍了开发助手解决的典型痛点和方案,包括自动/手动填充上下文、自定义Prompt模板、快速排查报错、对接公司内部系统和智能代码补全。 最后,分享了开发助手不同功能的效果测量思路及数据,并列出未来规划。

9 Technology lddgo Shared on 2023-12-29

如何全面把握系统现状,以便在关键时刻做出明智的决策?这是很多负责全局稳定性的管理者深感关切的问题。基于这一背景,同时也为了寻求提升研发工作效率提升,去哪儿网构建了一套数字化质量度量体系,以此来更精确地度量、管理并提升系统稳定性。 本文将详细解读这套质量度量体系,阐述如何在100多个指标中筛选出关键的度量标准,并进行有效的优化。同时,也将探讨如何借助这个指标模型理论,衡量系统复杂度并进行系统防腐化治理。这套数字化度量体系让去哪儿网的管理决策更有依据,改进方向更明确,结果也更可控,实现了系统运行状态的可视化。

11 Technology lddgo Shared on 2023-12-20

底层技术是系统稳定运行的基石,往往牵一发而动全身。通过底层技术的优化,有效地管理和减少代码量,能极大提升系统的运行效率。去哪儿网作为业内较早落地“代码瘦身”的企业,该项目让其系统成功地减少了50%的代码量,26%的服务数量,提高了9.5%的发布效率。 本文旨在分享其如何运用可观测性技术识别并清除无用代码,并尝试通过还原实施细节、总结方法论,并为读者在系统精简方面提供一种新的思考和实践方式。

11 Technology lddgo Shared on 2023-12-12

去哪儿网的原有监控系统在指标数量上展现出了强大实力——上亿指标量和百万级的告警量,但在故障数据方面却稍显不足——订单类故障平均发现时间长达4分钟,仅有20%的订单类故障能在1分钟内被发现,近半数的故障处理时长超过30分钟。为了解决这些问题,去哪儿网决定从优化故障指标出发,对故障发现、故障根因定位、故障修复等各个环节展开全面优化。 本文将深入探讨这一系列优化改革的详细过程,剖析各个阶段所采用的监控方法和工具,以及在实践过程中遇到的关键问题。

9 Technology lddgo Shared on 2023-11-22

备份对数据库系统非常重要。当数据由于人为或意外的原因导致被误修改、误删除时,可能会造成服务显示错误或无法访问,进而给业务造成很多损失。部分情况下我们可以通过服务器上的日志立即进行恢复,但是服务器上的日志不会永久保留。如果需要查看整个库中的数据时,日志恢复就不能满足我们的需求。这时如果有一份合适的全量备份将数据库中的数据恢复到指定的时刻,则业务可以立即恢复,挽回损失。所以备份对数据库系统而言是一项必不可少的功能。

13 Technology lddgo Shared on 2023-11-20

分布式链路追踪系统在企业的APM体系中扮演着重要的角色。本文分享了去哪儿旅行构建分布式链路追踪系统的实践经验。从APM整体架构设计入手,讲述了日志收集、Kafka传输和Flink任务处理等环节的性能优化实践和踩坑经验。 同时,作者结合丰富的分布式系统架构经验,探讨了APM系统和Trace数据的价值。通过阅读本文,你将了解到去哪儿旅行在构建APM体系中所面临的挑战,并学习如何应对这些挑战,实现更高效的性能监控和管理。

13 Technology lddgo Shared on 2023-11-07

一、架构设计理念与技术 二、业务系统重构背景 三、系统重构改造模式和架构选择 四、业务驱动的微服务架构演进实践 五、总结和思考 六、Q&A

25 Technology lddgo Shared on 2023-10-13