文库

Open API
文库
字符
转换
加密
网络
更多

图表

数学

坐标

图片

文件
Open API

文库

字符

转换

加密

网络

更多

图表

数学

坐标

图片

文件

在线工具大全

所有

中文

英语

最新

热度

6522 条查询结果

大模型“翻车”背后的技术原理及解决方案

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理（Tokenization与预测下一个Token），并解释了为什么会导致这些问题，接着我们利用CoT（思维链）方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因，最后提出【理由先行】风格这一简单有效的Prompt Trick！

阿里巴巴技术

685 技术 lddgo 分享于 2024-12-09

二十万分之一几率：if语句变do-while卡死问题分析｜得物技术

某次灰度发布之后没多久就收到线上ANR告警，经排查定位到是某个页面onCreate方法执行太久导致，而火焰图中的耗时堆栈指向了我们用于监控页面启动速度的一段插桩代码，反编译Apk之后发现本该是if语句的代码竟变成了一个do-while语句，形成了死循环最终导致主线程卡死。此后每构建二、三十次都会复现一次该问题，且每次的异常页面，异常方法完全随机。

得物技术 android

877 技术 lddgo 分享于 2024-12-09

写了BUG还想跑?---闲鱼异常日志问题自动追踪-定位-分发机制

为了高效地发现、定位和解决预发问题，闲鱼团队研发了一套异常日志问题自动追踪-定位-分发机制。这套机制通过自动化手段，实现了异常日志的定时扫描、精准定位和自动分发，显著降低了开发和测试的成本，提高了问题解决的效率。

阿里巴巴技术

435 技术 lddgo 分享于 2024-12-06

IJCAI2024: 基于集成网络的离线到在线强化学习

强化学习（Reinforcement Learning, RL）有两种基础的训练范式：在线强化学习（Online RL）和离线强化学习（Offline RL）。在线强化学习需要让智能体和环境进行交互，利用收集到的数据同步进行训练，但在环境中进行探索的开销很大；离线强化学习不需要和环境交互，直接利用已有的离线数据进行训练，但这种范式训练的智能体会受限于离线数据的质量和覆盖范围。基于此，研究者提出了离线到在线强化学习（Offline-to-online RL）训练范式，先利用已有的离线数量训练得到离线策略，然后将其应用到在线环境进行少量步数的微调。这种范式相比于前两者，一方面通过收集少量的在线数据，能够突破离线数据的限制，更贴近实际场景；另一方面在线阶段的微调是以离线策略为起点，相比于从零开始的在线强化学习，只需要非常少量的交互就能快速收敛。这一研究领域主要研究两个问题，一个是分布偏移引起的性能下降，就是如果直接将离线策略应用到在线环境进行微调，会在微调初期出现性能的急剧下降；另一个是在线优化效率，由于在线交互的开销很大，需要用尽可能少的交互次数实现尽可能大的性能提升

哔哩哔哩技术

326 技术 lddgo 分享于 2024-12-06

浅析JVM方法解析、创建和链接

上一篇文章《你知道Java类是如何被加载的吗？》分析了HotSpot是如何加载Java类的，本文再来分析下Hotspot又是如何解析、创建和链接类方法的。

阿里巴巴技术 java

859 技术 lddgo 分享于 2024-12-06

Flink+Paimon实时数据湖仓实践分享

随着 Paimon 近两年的推广普及，使用 Flink+Paimon 构建数据湖仓的实践也越来越多。在 Flink 实时数据开发中，对于依赖大量状态 state 的场景，如长周期的累加指标计算、回撤长历史数据并更新等，使用实时数仓作为中间存储来代替 Flink 的内部状态 state 是非常有必要的。本文主要分享了使用 Paimon 作为实时状态存储，并在 Flink 中通过 Lookup 维表 Join 的方式进行状态查询和更新的应用实践。

阿里巴巴技术 flink

654 技术 lddgo 分享于 2024-12-06

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

阿里巴巴技术 java

790 技术 lddgo 分享于 2024-12-05

AutoRec的增强丢包恢复机制 | 腾讯及中国人民大学联合研究成果入选ACM MM2024

腾讯与中国人民大学数据工程与知识工程教育部重点实验室共同撰写的论文“Toward Timeliness-Enhanced Loss Recovery for Large-Scale Live Streaming”（提高大规模实时流媒体损失恢复的时效性）已被多媒体领域的国际顶级会议 ACM Multimedia (MM) 2024录用，并被选为大会中口头报告论文（录取比例为3.97%）。值得一提的是，论文提出的 AutoRec 机制已在腾讯云 EdgeOne 产品落地，并且经现网验证能够使客户端直播视频卡顿的平均次数和持续时间分别减少11.4%和5.2%。这也是今年继 ICDCS 24之后，腾讯-人大联合实验室在多媒体数据传输领域今年的又一项最新研究成果。

腾讯技术

390 技术 lddgo 分享于 2024-12-05

一个暴论的结论

在《说个暴论》一文中，我们揭露了当前关于大模型行业的一些乱象和痛点问题，其中重点提到了当前企业私有训练，不能调用外部 API 的情况下，可以利用开源 LLM+RAG 部署的方式，但这种方式的最大痛点是硬件成本和维护成本。而如果能调用 API，完全不用管有几台服务器，可以在任意时间，随意拉高并发量。本文介绍了一种免去部署、维护、硬件成本的解决方案，利用腾讯乐享 AI 助手，企业可以实现基于企业内部知识库进行智能问答的业务场景，读者也可以从腾讯乐享 AI 助手的研发历程看到类似技术产品实现的方案逻辑。

腾讯技术

285 技术 lddgo 分享于 2024-12-05

一行代码改进：Logtail的多行日志采集性能提升7倍的奥秘

一个有趣的现象引起了作者的注意：当启用行首正则表达式处理多行日志时，采集性能出现下降。究竟是什么因素导致了这种现象？本文将探索Logtail多行日志采集性能提升的秘密。

阿里巴巴技术

448 技术 lddgo 分享于 2024-12-04

简体中文