• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
1105 search results Contribute

随着大语言模型(Large Language Models,LLMs)在各领域的广泛应用,如何以低成本构建高吞吐、低延迟的推理服务成为了一个紧迫的问题。考虑到LLM在GPU上推理时参数量和计算量较大以致于单流执行就可以充分利用GPU资源,我们可以把LLM的推理延时分解到kernel level,因此,进一步的,不考虑时间占比小的kernel计算后,LLM的延时优化也就相应的分解成GEMM和Attention的kernel优化。 RTP-LLM是阿里巴巴智能引擎团队开发的大模型推理加速引擎,作为一个高性能的大模型推理解决方案,它已被广泛应用于阿里内部。在这篇文章里,我们将基于RTP-LLM的实践,介绍decode阶段的Attention在GPU上是如何优化的。

12 Technology lddgo Shared on 2024-07-26

本文旨在深入探讨MySQL(8.0.26)数据库中索引的设计与优化方法。

11 Technology lddgo Shared on 2024-07-26

【AI问爱答】首期干货:大模型商业化,怎么落地才有用还好用?

1 Technology lddgo Shared on 2024-07-26

本文将会极致贯彻实用主义,介绍一些可以直接上手用的 TypeScript 技巧,新手友好,不需要了解背后的原理与规则(但也提供了简单介绍),只要对着特定场景套公式就好了,就让我们把事情变得再简单一些吧!

8 Technology lddgo Shared on 2024-07-26

最近在某个项目的开发过程中,遇到了一个bean注入不生效的问题,本文主要针对该问题进行展开,欢迎大家共同探讨。

5 Technology lddgo Shared on 2024-07-25

本文旨在探讨和总结《金字塔原理》一书中的核心概念与实践策略,通过实例解析,展示如何运用金字塔结构来增强表达的逻辑性和说服力,从而提高个人在工作和生活中的沟通效率。

19 Technology lddgo Shared on 2024-07-24

这篇文章的核心宗旨就是教你如何写出优秀的Prompt。我们将从Prompt的定义、运行过程,以及优秀Prompt应具备的各个要素入手,逐步展开详细的解析和实用示例,让你在短时间内掌握写作高效Prompt的技巧和策略。

20 Technology lddgo Shared on 2024-07-23

本文分享了物流技术团队在垂直领域大模型开发和部署过程中的技术细节、挑战解决策略以及实际应用案例。

17 Technology lddgo Shared on 2024-07-22

最近在某个项目的开发过程中,遇到了一个bean注入不生效的问题,本文主要针对该问题进行展开,欢迎大家共同探讨。

13 Technology lddgo Shared on 2024-07-22

文章讲述了在Java编程中遇到并解决ConcurrentModificationException异常的经历与教训。

28 Technology lddgo Shared on 2024-07-19