动画在影视工业中是相当重要的一个领域。尽管当前先进的视频生成模型比如Sora、可灵或智谱清影在生成三次元视频上取得了成功,他们在处理动画视频时却缺乏同样的效果。此外,由于独特的艺术风格、打破物理规则以及夸张的动作,评估动画视频生成结果也是一个巨大的挑战。 在我们的工作中,我们提出了一个专为动漫视频生成设计的综合系统AniSora,包括数据飞轮、可控的生成模型和一个评估基准。在数据飞轮提供了10M以上高质量数据的支持下,生成模型加入了一个时空掩码模块来实现关键的动画制作功能比如图生视频、视频插帧和局部图像引导动画。我们收集了一个包含了948个不同的动画视频的评估基准。基于VBench指标和人工双盲测试都证明了生成视频在人物和动作上的一致性,取得了在动画视频生成领域行业领先的结果。 业务上,我们的视频生成模型赋能了动态漫内容制作,已经有超过10部自有IP作品运用了AI动态漫能力。相比于人工制作需要专业人员和较长工期,AI动态漫实现了低成本、低门槛、高效率的剧集内容制作,并在多个平台突破千万播放。
本文详细阐述了prompt的设计要素,包括引导语、上下文信息等,还介绍了多种prompt编写策略,如复杂规则拆分、关键信息冗余、使用分隔符等,旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化,可逐步实现更优的prompt设计。
算力上的提前布局,让小鹏汽车在国内率先实现端到端智能驾驶大模型量产上车。小鹏汽车认为,端到端只是开始,不是终局,真正的竞赛正在云端展开,云端大模型才是制胜关键。拥有强大算力的阿里云,支撑小鹏汽车端到端大模型的快速迭代。
抖音集团安全研究团队和南方科技大学可信系统安全实验室合作的研究论文揭示了大语言模型安全领域服务框架的侧信道漏洞,利用多租户场景下的KV缓存共享机制精确恢复了用户提示词。本工作成果《I Know What You Asked: Prompt Leakage via KV-Cache Sharing in Multi-Tenant LLM Serving》已被安全领域顶级会议NDSS 2025接收。
Weex购物车诞生已经一年有余,在长列表的交互优化上花费了不少时间,本篇文章重点回顾一下长列表下横滑操作的优化历程。
我们是阿里巴巴智能引擎事业部。智能引擎源自阿里搜索、推荐、广告技术,是深耕多年的AI工程团队,在AIGC时代致力于为内部业务提供先进、完整的大模型工程体系,持续关注训推性能、成本、研发范式等关键问题。本文将基于我们的思考,探讨大模型提升思维能力的路径。