“回音室攻击”(Echo Chamber)的新型越狱方法,可诱骗几乎所有主流大语言模型生成不良内容,Neural Trust 研究员Ahmad Alobaid在一份报告中指出:“与依赖对抗性提示或字符混淆的传统越狱方法不同,回音室攻击利用间接引用、语义引导和多步推理进行攻击”。虽然当今主流大模型已经逐步采用各种防护措施来对抗快速注入和越狱攻击,但是“回音室攻击”都能有效的让大模型产生有害的内容,比如,色情、恐怖暴力和歧视等内容。
本文是一篇关于如何构建一个极简ReAct Agent的实践教程,使用Java语言实现。文章通过一个200行代码的示例,帮助读者深入理解ReAct模式中的“思考 - 行动 - 观察”循环机制,并借助实际场景(如补货计划单审批)演示了Agent的工作流程。此外,作者还分享了代码运行方式、核心思路及具体的执行过程,便于读者动手实践与调试。
随着大模型技术的爆发,AI Infra 已成为基础设施领域的核心战场。过去1年多的时间,我们QQ基础架构算法工程团队落地了多个大模型应用,包括语音合成大模型、内容理解多模态大模型、生成式推荐大模型,跑通大模型训练到推理的全链路。踩了很多坑,也积累了不少经验。本文将分享传统后台工程师积累的技术栈和方法论,如何延续并迁移到 AI 系统,并系统性拆解 AI Infra 的硬件、软件、训练和推理挑战。
在之前分享的文章《矢量图SVG应用探索》中,我们知道了SVG作为一个矢量图形标准,不仅包括了矢量图形,还包含文字,图片,滤镜,字体,链接,脚本,CSS和动画等功能,这让SVG渲染器的开发变得过于复杂。现在只有浏览器支持全功能的 SVG 渲染器(不同浏览器可能有兼容问题),其它SVG渲染器要么只支持部分功能,要么支持一个比SVG更简单的矢量图格式,比如Android的Vector。Android对矢量图的支持做了大量简化,不再支持脚本,互动,复杂样式和动画,只保留了少量的元素和属性支持,并使用了一套新标签来描述矢量图,也支持无限缩放都保持清晰度的特性,其官方说明可参考:Android矢量可绘制对象概览
很多同学可能都听说过流量回放这个概念,但是会发现它比很多工程都更难推动落地,原因无外乎两点:1. 常规自动化技术都可以通过开源方案或者二次开发方案解决:这在流量回放上实施难度很大,原因是因为其高度依赖于公司内部的后端服务状况、环境条件、技术架构。而开源的工具也许可以解决核心思想问题、核心技术问题,或给我们一些参考,但实际的工具开发,如录制手段、回放的验证则因上述原因,几乎需要测试人员根据自己团队现状,部分甚至全部自己进行规划。2. 回放的验证过于严格或过于宽松,导致经常误报或发现不了问题:本篇主要是分享下我们团队从开始实施传统的流量回放到目前基于LLM的流量回放的心路历程,我们的思考以及解决方案,以及阐述这套系统的作用和效果, 希望可以帮助到您或给您一些灵感。
狐友是一款面向年轻人群体的社交APP,在初期阶段,当运营组织抽奖活动时,缺乏专门的系统,只能使用Feed抽奖,走线下流程发奖,过程非常繁琐。而通过Feed抽奖的方式,是无法组织全平台的大型抽奖活动,因为Feed抽奖的形式是在评论区随机选取中奖用户,运营无法让全平台的用户去对一条Feed进行评论,从而组装抽奖活动的。
随着大模型技术的爆发,AI Infra 已成为基础设施领域的核心战场。过去1年多的时间,我们团队落地了多个大模型应用,包括语音合成大模型、内容理解多模态大模型、生成式推荐大模型,跑通大模型训练到推理的全链路。踩了很多坑,也积累了不少经验。本文将分享传统后台工程师积累的技术栈和方法论,如何延续并迁移到 AI 系统,并系统性拆解 AI Infra 的硬件、软件、训练和推理挑战。