ICLR 2026 | 基于概念蒸馏的生成式视频复原算法Vivid-VR
出处:
mp.weixin.qq.com
本文介绍了由淘天音视频技术团队提出的一种名为Vivid-VR的生成式视频复原算法,该成果已被顶级会议ICLR 2026收录。针对现有基于扩散模型的视频复原方法在微调过程中容易出现的“分布漂移”问题(导致纹理失真和时序不一致),Vivid-VR创新性地提出了“概念蒸馏”训练策略,利用T2V基座模型自身合成与文本完美对齐的训练数据,将基座模型的概念理解能力迁移至复原任务中。此外,文章还设计了控制特征投影器以过滤输入视频的退化伪影,以及双分支连接器以动态融合控制特征。实验结果表明,Vivid-VR在真实拍摄视频和AIGC视频上,均在纹理真实感、视觉生动性和时序一致性方面显著优于现有的SOTA方法。