腾讯视频技术突破:生成速度提升11.8倍
腾讯视频生成技术飞跃:更快、更智能、开源

对于从事AI视频生成的人来说,漫长的等待时间和高昂的计算成本一直是令人头疼的问题。腾讯混元研究团队为业界带来了一剂强力解药——他们的DisCa新技术在保持输出质量的同时,将生成时间缩短了近12倍。
DisCa如何改变游戏规则
关键在于团队所称的"可学习特征缓存"技术。想象一下基于先前画面预测后续视频帧的过程——这正是他们轻量级神经网络的工作方式,但预测精度显著提升。传统缓存方法在精简AI模型上效果欠佳,而DisCa的智能预测器能确保一切顺利运行。
"我们通过对抗学习进行训练,"团队解释道,"因此它不只是猜测,而是真正学习视频特征的演变规律。"这一突破意味着创作者能以最高11.8倍的速度获取AI生成视频,且无需像往常那样牺牲画质。

对MIT技术的改进
团队并未止步于此。他们将MIT前景广阔的MeanFlow技术——在图像处理上表现出色但在视频领域存在问题——改良得更适合动态画面。解决方案出人意料地简单:降低预期目标。
"单步生成听起来很诱人,"研究论文指出,"但却导致了训练问题。"通过在训练中设置更合理的步长范围,他们开发出了R-MeanFlow——这种改良方法与MIT和谷歌团队的研究发现高度吻合。
现已向公众开放
秉承开放研究精神,腾讯已将代码和模型权重公开。这项技术已在HunyuanVideo-1.5中展现价值,该模型目前是最优秀的开源视频生成模型之一。
核心要点:
- DisCa技术使AI视频生成速度提升11.8倍
- 采用神经网络预测的可学习特征缓存
- 改良MIT的MeanFlow技术以优化视频效果
- 完整代码和模型已开源
- 已应用于HunyuanVideo-1.5模型
对于视频创作者和开发者而言,这不仅意味着速度提升,更代表着AI生成内容可能性的根本性突破。




