• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
    OPEN API
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
    OPEN API
logo Online Tools
All Chinese English Newest Hottest
6245 search results

CoreDNS 概述及运维实践

164 Technology lddgo Shared on 2024-04-30

前期我们详细介绍了B站在定制化数据中心(R2-AZ2)项目上的探索[1],主要集中在智慧节能数据中心的技术迭代和实施情况。数据中心的高效运作并非孤立存在,它依赖于复杂而精细的互联互通网络,确保数据中心内的服务器、存储和网络设备间的连接。 布线系统是实现数据中心互联互通的关键组成部分, 数据中心布线的管理不当问题会造成生产环境交付周期拉长、预留线缆过长、线缆布局混乱、设备安装困难、故障排除和维护时间增加,甚至会影响机柜的气流组织,导致局部过热从而影响电子信息设备的安全运行。 此外,随着AI技术及业务应用的快速发展,智算中心正在迅速崛起,网络正向大带宽、低延时、低功耗等方向发展,这也意味着对网络和布线系统的要求正在持续提高。 布线系统作为大型数据中心的关键基础设施之一,如何利用数字化管理工具提高其交付及运维管理效率,也是我们一直在思考的问题和探索实践的方向。

273 Technology lddgo Shared on 2024-04-30

作为一款优秀的开源分布式数据库软件,TiDB 得到越来越多的用户关注和应用,但在运维保障过程中同样面临着运维孤岛、定界定位难、获取可观测性数据开销大等挑战,本文总结了 TiDB 用户如何基于 DeepFlow 构建全栈可观测性的最佳实践,包括如何用 DeepFlow 高性能、零侵扰的可观测技术消除全链路追踪在 TiDB 侧的盲区,如何在 DeepFlow 中统一观测业务全景、SQL 事务全过程、网络性能、系统资源性能、文件读写性能、应用函数性能,从而为 TiDB 及其上应用构建出统一、立体、全方位的可观测性能力。

157 Technology lddgo Shared on 2024-04-29

在日常的编码实践中,经常会用到缓存来解决高并发问题,缓存可以说是解决流量洪峰的不二利器。虽然集团中间件团队已经构建了缓存的基础设施,已经帮助我们解决了绝大部分问题,但是在实际的编码使用过程中,应用端调用缓存API时还是存在下述几类问题: 使用缓存的逻辑非常通用,基本都是先查缓存,有直接返回,没有查DB,再放入缓存中。这段通用逻辑散落在系统的各个地方,违反了高内聚低耦合的原则。 缓存代码和业务逻辑代码深度耦合在一起,不仅降低了代码的可读性,还额外增加了系统复杂度。 如果要切换缓存(MDB->LDB)或者API升级时,所有涉及代码都需要改动。 如果要解决缓存击穿、缓存穿透、级联缓存等类似通用问题时,都需要通过框架去解决。 因此,缓存是什么,如何选择某一种缓存,都不是本文重点,今天就写写实际编码过程中,如何将缓存代码从业务代码中剥离出来,促使代码更简洁,更便于阅读。

417 Technology lddgo Shared on 2024-04-29

2024年4月12日,腾讯研究院联合前海国际事务研究院、青腾一同发起AI&Society人工智能+社会发展高端研讨会,第一期会议主题为“大模型时代的创业生态”,研讨会在深圳前海举办。 会议邀请国内外人工智能与社会治理方面的业界领袖和知名学者,重点围绕大模型创业生态构建的话题,通过专家主旨演讲和圆桌讨论的形式,分别对中美大模型生态及技术趋势、AI投资趋势及应用方向两个主题展开讨论。 以下是“AI投资趋势及应用方向”圆桌实录,内容由实习生李玉杰整理,AI工具辅助完成。内容经嘉宾确认。

469 Technology lddgo Shared on 2024-04-29

由于外部环境的变化,适用于大模型训练任务的 GPU 整体规模无法继续增长。这些存量 GPU 组成的集群,仍然是当前加速大模型训练的主要 AI 算力来源。同时,各类国产 AI 芯片开始大规模投入实际生产任务。在未来一段时间内,数据中心的 AI 算力将保持多种芯片并存的现象。 但是,当前基础大模型训练所需要的最大 AI 算力集群规模,已经从单一集群千卡逐步提升至万卡量级。同时,很多智算中心已经部署的 GPU 集群,通常是十几台至数百台服务器不等,难以满足未来行业大模型训练的需求。 所以,在已有 AI 算力集群的基础上,构建由 GPU、昆仑芯、昇腾等不同芯片混合组成的单一集群,为大模型训练提供更大 AI 算力,成为了一个自然的选择。

364 Technology lddgo Shared on 2024-04-29

笔者支持过程中多次发现诡异的Dubbo接口异常问题,抓耳挠腮最后定位到代码上和代码外的原因,事后只感觉脑瓜子嗡嗡的。考虑到这不是第一次,也绝不会是最后一次出现类似问题,下面笔者将尽可能详细的梳理、总结一下该问题的现象和本质。

1011 Technology lddgo Shared on 2024-04-29

一条SQL语句的执行究竟经历了哪些过程?作者作为一个刚入职的大数据研发新人对SQL任务执行整个流程进行了整理,本文就作者学习内容和体会供大家参考。

224 Technology lddgo Shared on 2024-04-29

当「软件研发」遇上 AI 大模型

393 Technology lddgo Shared on 2024-04-29

本文先通过重现在不同业务线反复出现的问题,详细描述了从业务、数据库、OS等不同的角度来分析如何解决它。

378 Technology lddgo Shared on 2024-04-26