跳转到主要内容

苹果STARFlow-V采用颠覆性方法实现稳定视频生成

苹果押注归一化流技术打造下一代视频AI

与行业趋势截然不同,苹果推出了完全绕过主流扩散技术的视频生成模型STARFlow-V。该模型采用归一化流——一种将随机噪声直接转化为连贯视频帧的数学方法。

Image

归一化流为何重要

当Sora或Runway等扩散模型通过多次噪声迭代逐步优化视频时,STARFlow-V选择了更直接的路径。想象通过展示完整杰作而非反复擦除重画来教人绘画——这就是该技术的本质区别。

其优势显而易见:

  • 训练一次完成,无需无数微调
  • 生成几乎瞬时完成
  • 减少迭代处理导致的错误累积

苹果宣称STARFlow-V在质量上媲美扩散模型,且生成5秒片段的速度比初期原型快约15倍。

破解长视频难题

真正的突破在于处理长序列。大多数AI视频工具在超过几秒后就会因逐帧错误累积而失效。STARFlow-V通过创新双架构解决这一问题:

  • 一个系统维持跨帧运动一致性
  • 另一个优化单帧细节表现

结果如何?稳定的30秒演示中,竞品模型几秒内就会出现模糊或失真。

Image

能力与局限

该模型开箱即支持多种任务:

  • 根据文本提示生成视频
  • 为静态图像添加动画效果
  • 通过添加或移除对象编辑现有素材

基准测试显示STARFlow-V在VBench获得79.7分——虽逊于Veo3(85.06)等领先者,但在空间关系和人体形象的真实渲染方面显著优于其他自回归模型。

当前版本仍有不足:

  • 最高分辨率仅640×480像素
  • 标准GPU尚无法实时处理
  • 物理模拟偶现异常(如章鱼穿透玻璃)

苹果承认这些局限,计划重点优化速度、压缩模型并引入更精确的物理训练数据。公司已在GitHub发布代码,模型权重即将登陆Hugging Face。

核心要点:

  • 苹果STARFlow-V采用归一化流而非扩散模型
  • 实现竞品难以企及的30秒稳定视频
  • 直接处理帧而非迭代优化
  • 目前基准分数略逊顶尖模型
  • GitHub已开源代码,Hugging Face即将发布权重

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

昆仑万维开源视频AI将创意推向新高度
News

昆仑万维开源视频AI将创意推向新高度

中国科技公司昆仑万维近日发布了开源视频生成模型SkyReels-V3,在AI界引起轰动。这款多功能工具集图像转视频、电影风格延伸和逼真虚拟形象于一体。早期测试显示其在视觉质量和一致性上优于商业竞品。最惊喜的是?目前完全免费使用。

January 29, 2026
AI视频生成开源AI多模态模型
Kling AI的视频革命:一项功能如何引发全球热潮
News

Kling AI的视频革命:一项功能如何引发全球热潮

快手的Kling AI在视频创作领域掀起风暴,其用户基数在2026年初飙升至每月1200万活跃用户。秘诀何在?一项巧妙的'动态控制'功能将宠物视频变成了全球现象。收入远超预期,2025年达到1.4亿美元——是初始预测的两倍多。如今在40个国家下载量名列前茅,这款工具证明AI生成内容已到达转折点。

January 21, 2026
AI视频生成Kling AI内容创作工具
News

AI赋能故事新生命:阅道与生数科技携手打造下一代影视技术

中国娱乐产业迎来技术升级,阅道集团与生数科技达成合作,彻底改变IP可视化方式。双方将生数的Vidu视频生成模型整合至阅道创作平台,实现文本到动态画面的革命性转换。除技术突破外,两家企业还通过专项教育计划解决行业人才缺口,构建从创作到生产的完整生态体系。

January 13, 2026
AIGC数字叙事AI视频生成
Lightricks推出开源AI,数秒内生成带声音的视频
News

Lightricks推出开源AI,数秒内生成带声音的视频

以色列科技公司Lightricks发布了LTX-2,这是一款创新的AI系统,能够根据文本提示生成20秒高清视频并完美同步音频。与传统方法不同,它采用独特的双流架构同时处理视觉和声音。这款开源模型以惊人的速度超越竞争对手——每步仅需一秒多即可生成720p内容。

January 12, 2026
AI视频生成开源AILightricks
字节跳动StoryMem为AI视频注入记忆增强能力
News

字节跳动StoryMem为AI视频注入记忆增强能力

字节跳动与南洋理工大学研究人员开发的StoryMem系统创新性地解决了AI视频生成的持续性难题。通过模拟人类记忆机制,该系统保持了跨场景的角色一致性——即便是Sora和Kling等模型也面临的挑战。该方案巧妙地将关键帧存储为参考,同时保持计算成本可控。早期测试显示在视觉连贯性和用户偏好评分方面均有显著提升。

January 4, 2026
AI视频生成字节跳动计算机视觉
字节跳动StoryMem为AI生成视频带来一致性
News

字节跳动StoryMem为AI生成视频带来一致性

字节跳动与南洋理工大学研究人员联合开发了StoryMem系统,这一突破性技术解决了AI视频生成中的角色一致性问题。通过智能存储和引用关键帧,该技术实现了跨场景的视觉连续性——比现有模型提升28.7%的一致性表现。尽管在叙事应用上前景广阔,该系统仍面临复杂多角色场景的处理挑战。

January 4, 2026
AI视频生成字节跳动计算机视觉