腾讯视频技术突破：生成速度提升11.8倍欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

腾讯视频技术突破：生成速度提升11.8倍

腾讯视频生成技术飞跃：更快、更智能、开源

对于从事AI视频生成的人来说，漫长的等待时间和高昂的计算成本一直是令人头疼的问题。腾讯混元研究团队为业界带来了一剂强力解药——他们的DisCa新技术在保持输出质量的同时，将生成时间缩短了近12倍。

DisCa如何改变游戏规则

关键在于团队所称的"可学习特征缓存"技术。想象一下基于先前画面预测后续视频帧的过程——这正是他们轻量级神经网络的工作方式，但预测精度显著提升。传统缓存方法在精简AI模型上效果欠佳，而DisCa的智能预测器能确保一切顺利运行。

"我们通过对抗学习进行训练，"团队解释道，"因此它不只是猜测，而是真正学习视频特征的演变规律。"这一突破意味着创作者能以最高11.8倍的速度获取AI生成视频，且无需像往常那样牺牲画质。

对MIT技术的改进

团队并未止步于此。他们将MIT前景广阔的MeanFlow技术——在图像处理上表现出色但在视频领域存在问题——改良得更适合动态画面。解决方案出人意料地简单：降低预期目标。

"单步生成听起来很诱人，"研究论文指出，"但却导致了训练问题。"通过在训练中设置更合理的步长范围，他们开发出了R-MeanFlow——这种改良方法与MIT和谷歌团队的研究发现高度吻合。

现已向公众开放

秉承开放研究精神，腾讯已将代码和模型权重公开。这项技术已在HunyuanVideo-1.5中展现价值，该模型目前是最优秀的开源视频生成模型之一。

核心要点：

DisCa技术使AI视频生成速度提升11.8倍
采用神经网络预测的可学习特征缓存
改良MIT的MeanFlow技术以优化视频效果
完整代码和模型已开源
已应用于HunyuanVideo-1.5模型

对于视频创作者和开发者而言，这不仅意味着速度提升，更代表着AI生成内容可能性的根本性突破。

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

News

蚂蚁集团羚搏科技开源突破性3D建图工具

蚂蚁集团旗下羚搏科技宣布开源其革命性产品LingBot-Map，该系统仅需普通摄像头即可实现实时3D场景重建。与需要专业设备或后期处理的前沿技术不同，这项创新能在视频拍摄过程中即时运算，达到惊人的20帧/秒处理速度。该技术有望通过降低高质量空间建图门槛，彻底改变从机器人到增强现实等多个领域。

April 16, 2026

三维重建计算机视觉蚂蚁集团

News

京东发布用于下一代机器人技术的尖端AI训练摄像头

京东推出了创新性数据采集设备JoyEgoCam，旨在通过真实世界观察来训练AI系统。这款工业级摄像头能以每秒60帧的速度拍摄超高清画面，使机器能够学习细微动作和环境变化。此次发布是京东雄心勃勃计划的一部分，目标是在两年内收集1000万小时的视频数据，有望彻底改变仓储自动化和物流机器人技术。

April 16, 2026

AI训练机器人技术计算机视觉

News

谷歌AI重大突破：让机器像人类一样观察世界

Google DeepMind通过其新推出的TIPSv2系统攻克了AI视觉领域的一大难题。当前模型虽能大致描述图像内容，但在精确定位细节（如熊猫左后腿位置）时仍显不足。这项突破源于一个意外发现：在分割任务中，小型模型有时反而胜过大型模型。通过优化训练方法并减少计算开销，TIPSv2在减少42%参数量的同时，分割准确率提升了14%。这一进展可能为从医学影像到自动驾驶等多个领域带来革命性变化。

April 16, 2026

计算机视觉机器学习AI研究

News