跳转到主要内容

腾讯视频技术突破:生成速度提升11.8倍

腾讯视频生成技术飞跃:更快、更智能、开源

Image

对于从事AI视频生成的人来说,漫长的等待时间和高昂的计算成本一直是令人头疼的问题。腾讯混元研究团队为业界带来了一剂强力解药——他们的DisCa新技术在保持输出质量的同时,将生成时间缩短了近12倍。

DisCa如何改变游戏规则

关键在于团队所称的"可学习特征缓存"技术。想象一下基于先前画面预测后续视频帧的过程——这正是他们轻量级神经网络的工作方式,但预测精度显著提升。传统缓存方法在精简AI模型上效果欠佳,而DisCa的智能预测器能确保一切顺利运行。

"我们通过对抗学习进行训练,"团队解释道,"因此它不只是猜测,而是真正学习视频特征的演变规律。"这一突破意味着创作者能以最高11.8倍的速度获取AI生成视频,且无需像往常那样牺牲画质。

Image

对MIT技术的改进

团队并未止步于此。他们将MIT前景广阔的MeanFlow技术——在图像处理上表现出色但在视频领域存在问题——改良得更适合动态画面。解决方案出人意料地简单:降低预期目标。

"单步生成听起来很诱人,"研究论文指出,"但却导致了训练问题。"通过在训练中设置更合理的步长范围,他们开发出了R-MeanFlow——这种改良方法与MIT和谷歌团队的研究发现高度吻合。

现已向公众开放

秉承开放研究精神,腾讯已将代码和模型权重公开。这项技术已在HunyuanVideo-1.5中展现价值,该模型目前是最优秀的开源视频生成模型之一。

核心要点:

  • DisCa技术使AI视频生成速度提升11.8倍
  • 采用神经网络预测的可学习特征缓存
  • 改良MIT的MeanFlow技术以优化视频效果
  • 完整代码和模型已开源
  • 已应用于HunyuanVideo-1.5模型

对于视频创作者和开发者而言,这不仅意味着速度提升,更代表着AI生成内容可能性的根本性突破。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

蚂蚁集团羚搏科技开源突破性3D建图工具
News

蚂蚁集团羚搏科技开源突破性3D建图工具

蚂蚁集团旗下羚搏科技宣布开源其革命性产品LingBot-Map,该系统仅需普通摄像头即可实现实时3D场景重建。与需要专业设备或后期处理的前沿技术不同,这项创新能在视频拍摄过程中即时运算,达到惊人的20帧/秒处理速度。该技术有望通过降低高质量空间建图门槛,彻底改变从机器人到增强现实等多个领域。

April 16, 2026
三维重建计算机视觉蚂蚁集团
京东发布用于下一代机器人技术的尖端AI训练摄像头
News

京东发布用于下一代机器人技术的尖端AI训练摄像头

京东推出了创新性数据采集设备JoyEgoCam,旨在通过真实世界观察来训练AI系统。这款工业级摄像头能以每秒60帧的速度拍摄超高清画面,使机器能够学习细微动作和环境变化。此次发布是京东雄心勃勃计划的一部分,目标是在两年内收集1000万小时的视频数据,有望彻底改变仓储自动化和物流机器人技术。

April 16, 2026
AI训练机器人技术计算机视觉
谷歌AI重大突破:让机器像人类一样观察世界
News

谷歌AI重大突破:让机器像人类一样观察世界

Google DeepMind通过其新推出的TIPSv2系统攻克了AI视觉领域的一大难题。当前模型虽能大致描述图像内容,但在精确定位细节(如熊猫左后腿位置)时仍显不足。这项突破源于一个意外发现:在分割任务中,小型模型有时反而胜过大型模型。通过优化训练方法并减少计算开销,TIPSv2在减少42%参数量的同时,分割准确率提升了14%。这一进展可能为从医学影像到自动驾驶等多个领域带来革命性变化。

April 16, 2026
计算机视觉机器学习AI研究
News

火山引擎发布强大的视频生成API,助力创作者与企业释放创意潜能

火山引擎正式推出Seedance 2.0 API,为企业和个人用户提供前沿的视频生成能力。升级后的模型能处理文本、图像、音频和视频输入,并提升了物理精度和视觉真实感。除技术增强外,公司还为AI生成内容实施了严格的合规措施。行业专家认为,该产品或将彻底改变营销、娱乐和企业视频制作的工作流程。

April 14, 2026
AI视频生成创意科技数字内容创作
Skywork AI的Matrix-Game 3.0通过实时高清视频让虚拟世界栩栩如生
News

Skywork AI的Matrix-Game 3.0通过实时高清视频让虚拟世界栩栩如生

Skywork AI破解了AI视频生成的最大挑战——长期记忆。其全新Matrix-Game 3.0系统能以40帧/秒生成无缝720p世界,像虚拟导游般记住每个细节。秘诀在于相机感知记忆系统及海量游戏数据,这些数据教会AI理解真实世界的运作规律。这项突破或将彻底改变从电子游戏到机器人训练的各个领域。

April 14, 2026
AI视频生成实时渲染游戏技术
火山引擎全面释放Seedance 2.0的API潜能
News

火山引擎全面释放Seedance 2.0的API潜能

火山引擎已全面开放其Seedance 2.0 API服务,为创作者和企业提供了强大的视频制作新工具。该平台的多模态能力现支持文本、图像、音频和视频输入,使复杂的视频创作变得异常简单。早期采用者如导演贾樟柯已展示其创意潜力,企业用户则报告视频工作流程效率提升高达90%。

April 14, 2026
AI视频生成创意科技数字化转型