VisionWeaver:从“现象识别”到“病因诊断”,开启AI视觉幻觉研究新篇章
出处:
mp.weixin.qq.com
长久以来,我们只知道大型视觉语言模型(LVLM)会犯错,但始终缺乏一把“手术刀”,无法剖析其视觉感知的根源性缺陷。我们只知其然,不知其所以然。我们希望当 AI 模型观察图像时,不再凭空想象,不再“指鹿为马”。现在,这一瓶颈被打破了。bilibili 用户技术中心提出 VisionWeaver 及其核心诊断工具 VHBench-10,带来了创新性的视角。VisionWeaver 不再依赖单一编码器,而是开创性地提出“上下文感知路由网络”,动态协同多个“视觉专家” 。而这一切得以实现的基础,正是其专门打造的诊断基准 VHBench-10——它让幻觉研究从“识别现象”迈向了“诊断病因”的新阶段。此工作已被 EMNLP 2025 Findings 录用。