在日常AI应用工作中,我们常常遇到提示词(Prompt)调整效果不及预期,甚至出现输出“失控”的情况。本文所分享的提示词优化经验,源于去哪儿机票售前客服项目的实际淬炼,具备较强的实践指导价值,旨在为编写和优化提示词提供参考。当你面临修改无效或逻辑混乱的困境时,不妨尝试文中提到的几种修订技巧,多次实践往往能带来意想不到的成效。机票售前客服主要负责解答用户在购票前提出的各种疑问,例如机票信息及相关服务。在去哪儿App内,进入机票搜索列表页后,点击右上角的客服按钮,即可弹出与机票售前客服的对话窗口。客服的回答方式与内容如下图所示。
针对大语言模型(LLM)的量化方法层出不穷,近期三值量化(1.58Bit)在LLM中使用的越来越广,比如BitNet等方法。腾讯近期发布了1.58Bit量化的新算法 Tequila,提出一种QAT阶段解决“死区陷阱”的新算法,性能效果达到新SOTA。模型使用 1.58Bit 的位宽达到的性能,能对标同参数量的全精度模型,潜力巨大。
阿里云在云栖大会重磅发布了《AI 原生应用架构白皮书》,该白皮书覆盖 AI 原生应用的 11 大关键要素,获得业界 15 位专家联名推荐,来自 40 多位一线工程师实践心得,全书合计超 20w 字,分为 11 章,全面、系统地解构 AI 原生应用架构,包含了 AI 原生应用的 11 大关键要素,模型、框架、提示词、RAG、记忆、工具、网关、运行时、可观测、评估和安全。本文整理自阿里云智能技术专家李艳林在云栖大会现场的解读。
本文以编译原理中的语言形式化理论(如乔姆斯基谱系)为基础,指出AI领域从Prompt Engineering(低形式化,依赖语言微调,脆弱且难扩展)向Context Engineering(中等形式化,借RAG、工具集成等结构化方式提升可靠性)的演进,本质是为获取系统可追踪性与可靠性而牺牲LLM部分无限制表达能力;同时分析Anthropic的Think Tool,其通过形式化工具定义将模型内部推理转化为显式可验证动作,超越非形式化的CoT,最后提出未来需为Agent System构建全面形式化理论,以实现AI智能体行为的精确规约与验证,满足高风险领域需求,体现了语言形式化在AI思想层面的新发展。
又是一个美好的周一上午,我们的校招新人小D同学来到了工位,刚打开电脑就收到了一条上周遗留的工单消息来催赶紧解决,原来是有业务方看不懂宽表上的字段逻辑,并且发现在不同地方出现数据不一致,想弄清楚下这个差异是怎么造成的。小D心想:应该是前人在哪个环节用了不同表,查下代码就知道了,so easy~ 于是乎他查到这两个不一样的地方分别用的是哪个数据表,然后逐一打开代码想细看下这两个字段的代码逻辑,结果....WTF...这代码怎么一个比一个复杂!!!
RecIS是一个专为超大规模稀疏-稠密计算设计的统一架构深度学习开源框架,由爱橙科技智能引擎团队与淘天集团算法技术、阿里妈妈技术团队联合推出。该框架基于 PyTorch 开源生态构建,为推荐模型训练,或推荐结合多模态/大模型训练提供了完整的解决方案,已在阿里巴巴广告、推荐、搜索等场景广泛应用。