Androidify 焕新登场!这款全新应用可让您使用自拍和 AI 构建自己的专属 Android 机器人。今年早些时候,我们向您介绍了其中的一些组件。从现在开始,您可以使用 Androidify 的网页端,也可以使用 Google Play 上的应用版本。在这款新的 Androidify 应用中,您可以上传自拍照或根据需要编写提示,添加一些配件,然后见证 AI 如何构建属于您独一无二的机器人。体验过后,欢迎回来继续阅读,详细了解我们用于创建此应用的 AI API 和 Android 工具。
随着多模态大模型技术的发展,我们能用 AI 做的事情越来越多,比如让模型理解图片、生成视频和克隆声音。但与此同时,一个现实的问题也摆在了我们面前,AI 生成的内容越来越逼真,虽然带来了一定的技术便利性,比如社交媒体上,大家可以很轻松地给视频添加特效,也可以很方便地使用类似即梦这样的软件生成图片或者视频,但是技术的进步同时也会带来一些恶意行为,技术本身是无罪的,但是有的人使用AI去生成逼真的图片,或者视频,如何分辨真假,保证信息安全,成了一个重要的挑战。为应对这一全球性挑战,由中国图象图形学学会、蚂蚁集团、云安全联盟CSA大中华区主办,广泛联合学界、机构共同组织发起2025全球AI攻防挑战赛。比赛结束后,蚂蚁安全与智能实验室发布了一个百万量级的名为 OpenMMSec 的开放式多模态AI安全基准数据集,近期全面开源了。
在软件测试领域,如何提升测试效率、降低研发成本并保障测试质量一直是亟待解决的问题。本文从人工测试向自动化测试转型的实践,详细阐述基于Jest的自动化测试在人工编写测试case到通过BDD(基于行为驱动开发)生成测试case的完整解决方案,以及在实施过程中遇到的挑战和取得的成果。
本文聚焦百度电商风控场景,针对传统机审多模态识别弱、语义模糊难区分、审核体验差等痛点,推进原有机审流程向AI化流程改造,基于业界MultiAgent范式在审核场景落地应用,提出 “多模态大模型 + 规则 + 知识库” 协同的机审 Agent 方案。通过:1. 审核标准体系化、大模型化;2. 多模态大模型在领域典型问题上的抽象技术方案;3. 针对场景化问题精准优化。产出标杆式业务落地效果,为电商风控大模型落地提供可迁移能力强的技术方案。
过去一年,一直在想一个问题,平时所做的那些性能优化是否真有必要?有没有可能是系统本身可观测性不够,这些只是优化了可观测部分指标,比如某一段的延迟或者吞吐,但并没有真正改善用户实际体验,甚至为此,还引入新的复杂度,使得系统不断熵增。Fred Brooks 在“没有银弹”文中指出,软件工程的本质是复杂性的管理。复杂性无法被消灭,只能转移或隐藏,而抽象是控制复杂性的主要手段之一。技术发展也是如此,框架和工具的抽象程度越来越高,出现大量成熟的开发框架,甚至业务框架,开发借助 Quick Start 工具可以快速搭建站点,甚至不熟悉 TCP/IP,也能借助 Netty 完成高并发服务上线,开发成本似乎在变得越来越简单,却往往把复杂性转移至系统运行期。若能够深入一线去排查问题,很多时候,你会发现排查问题的时间,以及最终问题的解决的成本都在变高。
在 RAG 系统中,即便采用性能卓越的 LLM 并反复打磨 Prompt,问答仍可能出现上下文缺失、事实性错误或拼接不连贯等问题。多数团队会频繁更换检索算法与 Embedding模型,但收益常常有限。真正的瓶颈,往往潜伏在数据入库之前的一个细节——文档分块(chunking)。不当的分块会破坏语义边界,拆散关键线索并与噪声纠缠,使被检索的片段呈现“顺序错乱、信息残缺”的面貌。在这样的输入下,再强大的模型也难以基于支离破碎的知识推理出完整、可靠的答案。某种意义上,分块质量几乎决定了RAG的性能上限——它决定知识是以连贯的上下文呈现,还是退化为无法拼合的碎片。 在实际场景中,最常见的错误是按固定长度生硬切割,忽略文档的结构与语义:定义与信息被切开、表头与数据分离、步骤说明被截断、代码与注释脱节,结果就是召回命中却无法支撑结论,甚至诱发幻觉与错误引用。相反,高质量的分块应尽量贴合自然边界(标题、段落、列表、表格、代码块等),以适度重叠保持上下文连续,并保留必要的来源与章节元数据,确保可追溯与重排可用。当分块尊重文档的叙事与结构时,检索的相关性与答案的事实一致性往往显著提升,远胜于一味更换向量