Library

ARTICLE
STRING
CONVERTER
ENCRYPT
NETWORK
MORE

CHART

MATH

COORDINATE

IMAGE

FILE
ARTICLE

STRING

CONVERTER

ENCRYPT

NETWORK

MORE

CHART

MATH

COORDINATE

IMAGE

FILE

Online Tools

All

Chinese

English

Newest

Hottest

5181 search results

从Language Model到Chat Application：对话接口的设计与实现

RTP-LLM 是阿里巴巴大模型预测团队开发的大模型推理加速引擎，作为一个高性能的大模型推理解决方案，它已被广泛应用于阿里内部。本文从对话接口的设计出发，介绍了业界常见方案，并分享了RTP-LLM团队在此场景下的思考与实践。

阿里巴巴技术

50 Technology lddgo Shared on 2024-03-06

单核QPS提升10倍，亿级日调用！QQ频道前端网关升级之路

在流量增长、功能扩展的背景下，叠加性能优化的内在要求，把一个协议转换发展为业务网关，过程有多曲折？选型又有哪些考虑？为什么放弃了 JSAPI （客户端方案）、HTTPSSO（后台方案），最后选择了 Node（前端）方案？

腾讯技术

79 Technology lddgo Shared on 2024-03-06

Kubernetes 真的能帮助你节省云成本吗？请看 CNCF 的调查

CNCF 去年底发布的微调查报告，内容涉及云原生 FinOps 和云财务管理（CFM）。据调查显示，Kubernetes 的使用导致了 49% 的受访者的云开销增加，28% 的受访者表示他们的成本保持不变，而 24% 的受访者在迁移到 Kubernetes 后节省了开支。受访者列出了过度配置、缺乏意识和责任感以及资源扩张等因素是超支的主要原因。

kubernetes

65 Technology lddgo Shared on 2024-03-06

干货｜从MySQL到ByteHouse，抖音精准推荐存储架构重构解读

抖音依靠自身推荐系统为用户推送可能感兴趣的视频内容，其中兴趣圈层是推荐的重要能力，通过理解核心用户的偏好特征，判断两者偏好的相似性，从而构建同类用户的兴趣圈层，实现精准推荐。以往的兴趣圈层往往依赖单一的维度或标签，比如内容类型、时长、地理特征等，难以揭示用户兴趣的底层逻辑。例如，重庆美女小姐姐吃播视频、二次元古风舞蹈视频，表面上标签类型可能完全不一样，但深度分析后发现喜欢两个视频的是同一个类型的人，并把他们划分在同一个兴趣圈层中。要搭建这样一套兴趣圈层平台，不仅需要算法策略，对底层数据存储架构也是一大挑战。抖音每日新增的数据量庞大、业务标签五花八门，更需要满足业务人员对复杂查询的实时性诉求。之前技术团队采用MySQL作为存储架构，作为一种行式存储的数据库，MySQL对于大量数据的处理效率较低。如果要在MySQL上查询上亿级别的数据，可能需要更高配置的硬件，甚至可能需要采用分片、读写分离等策略来提升性能，这将导致硬件成本显著提高。

字节跳动技术

223 Technology lddgo Shared on 2024-03-06

AIGC图像技术在淘宝人生2的探索和应用

淘宝人生2（又名：第二人生）是淘宝的一个虚拟人装扮类应用，承担了用户在淘宝的第二个人生的作用。我们旨在通过AI为淘宝人生2的用户提供丰富有趣的可玩性内容，随着最近火热的AIGC技术的发展，我们也进行了相关尝试和落地，目前已经上线了AI拍照风格化、AI写真馆、AI服饰涂鸦等项目。本文主要以AI服饰涂鸦为例介绍我们在AIGC图像领域的探索和应用，希望能够对大家有所启发和帮助，也欢迎大家建议和合作。

阿里巴巴技术 aigc

75 Technology lddgo Shared on 2024-03-06

AGI万字长文：2024，趋势与展望

紧接着对于2023年的回顾，我想斗胆做些2024-25年可能发生的事情的预测。写这篇文章的时候正赶上OpenAI Sora、Google Genie、Mistral Large的发布，不少内容也经历了些修改。真是还没等写就都做出来了…… 作为小作坊创业者，在大模型时代是没有办法拥有底层技术的，技术护城河也更加难；于是，稍微早一点点预判，找到一个没有大鱼的“小水洼”就尤其重要，所以我也愿意花些力气来做今天这番思考梳理。不过，既然是预测，其中不免有不精确、不准确、过于科幻的推演；我也希望可以给大家一些启发，但也可能把人带沟里……不过纠结一番，还是觉得要把这些对于2024的猜想先写下来，立个Flag，一年之后作为笑话来看看也不是坏事。以及，大家也完全可以把这篇文章当作科幻文学作品来看。

aigc

55 Technology lddgo Shared on 2024-03-06

百科AI对话式体验设计探索

近年来AI发展如火如荼，大模型诞生与技术的积累和不断创新，带来了人机交互方式的革新。各大厂也纷纷结合自身业务场景进行模型和应用的开发，AI正以惊人的速度改变着我们的生活和工作方式。面对生成式AI的行业浪潮，百度百科产研团队也在探索如何结合大模型能力，发挥百科在泛知识领域的优势，延展百科场景AI特色体验，强化内容浏览的体验感及效率性，契合用户对百科的期望，带给用户更极致的知识消费体验。

百度技术

70 Technology lddgo Shared on 2024-03-06

商家可视化埋点探索和实践｜得物技术

在数字产品的数据分析实践中，手动代码埋点方式因其精确性和定制化的优势长期被许多组织采用，但随着业务快速发展和迭代需求的增加，传统手动埋点方法的时间消耗、一定的技术门槛和较高的维护成本成为研发角色的负担。另外，全埋点的埋点方式提供了全面数据捕捉的解决方案，但其带来的海量数据处理难题和潜在的隐私风险也不容忽视。原有商家后台通过手动埋点方式实现业务埋点的收集。

得物技术

56 Technology lddgo Shared on 2024-03-06

自定义 OpenTelemetry Collector 容器镜像

OpenTelemetry Collector 有两个官方发行版：Core 和 Contrib。 Core 发行版是 Collector 的基础发行版，供 OTel 开发人员进行开发和测试。它包含一组基本的扩展、连接器、接收器、处理器和导出器。 Contrib 发行版供非 OTel 开发人员进行实验和学习。它还扩展了 Core 发行版，并包含由第三方（包括供应商和个人社区成员）创建的组件，这些组件对整个 OpenTelemetry 社区非常有用。在之前的文章《使用 OpenTelemetry 和 Loki 实现高效的应用日志采集和分析》我用的就是这个发行版。不管 Core 还是 Contrib 都不应该成为你生产工作负载的一部分。仅仅使用 Core 本身太过简单，无法满足组织的需求（尽管它提供的组件都是必须的）；虽然 Contrib 中提供的组件足够全面，然而并不是说每个组件都是你所需要的，太多冗余的组件显得过于臃肿，还增大的攻击面。那如何选择你所需的发行版呢？答案就是构建自己的发行版。

49 Technology lddgo Shared on 2024-03-05

入行 15 年，我还是觉得编程很难

腾讯技术

74 Technology lddgo Shared on 2024-03-05

English