跳转到主要内容

字节跳动StoryMem为AI视频注入记忆增强能力

字节跳动突破AI视频连贯性技术

是否注意到AI生成视频在不同场景间常难以保持角色外观一致?字节跳动与南洋理工大学的新系统StoryMem可能已攻克了这一棘手难题。

StoryMem工作原理

秘诀在于研究者所称的"混合记忆库"——相当于赋予AI短期记忆能力。Image 不同于将所有内容塞入单一庞大模型(导致计算成本飙升)或独立生成场景(丢失上下文),StoryMem采取了更智能的方案。

其精妙之处在于:系统会识别并保存先前场景的关键帧,在创作新内容时将其作为参考点。这类似于人类讲故事时记住重要细节的方式。

幕后技术魔法

该流程包含两个过滤阶段:

  1. 语义分析筛选视觉重要性高的帧
  2. 质量检测剔除模糊或不清晰的图像

生成新场景时,这些精选帧会通过名为RoPE(旋转位置编码)的创新技术反馈给模型。通过为这些记忆分配"负时间索引",AI能理解它们是故事早期的参考而非当前指令。

Image

可实际应用的显著优势

StoryMem的精妙不仅在于技术成就——它还具有令人惊喜的实用性:

  • 可在阿里开源Wan2.2-I2V模型上高效运行
  • 仅增加极小开销(在1400亿参数基础上仅增70亿)
  • 支持将自定义照片作为连贯叙事的起点
  • 比现有方案提供更流畅的场景转换效果

在对300个场景描述的基准测试中,相较基础模型StoryMem将跨场景一致性提升近30%,并在用户偏好评分上超越HoloCine等竞争对手。

当前局限与未来潜力

该系统尚未臻于完美——同时处理多角色或大规模动作序列仍是挑战。但团队已在Hugging Face公开权重参数,邀请全球开发者共同实验改进。

其影响远超出技术领域:设想未来能够:

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

Anthropic通过收购Vercept为Claude赋予视觉能力

人工智能初创公司Anthropic收购了计算机视觉公司Vercept,为其Claude AI配备了先进的视觉理解能力。这笔交易带来了超越竞争对手的前沿UI识别技术,标志着在创造能够像人类一样真正驾驭数字环境的AI助手方面迈出了重要一步。通过此次收购,Anthropic巩固了其在开发实用AI代理竞赛中的领先地位。

February 27, 2026
人工智能计算机视觉科技并购
News

快手AI视频模型在中国科技浪潮中登顶全球榜首

快手的Kling 3.0Pro在视频生成技术上超越全球竞争对手,基准测试获得1240分的惊人成绩。目前全球前15名中有7个中国模型,标志着电影AI能力的重大转变,或将重塑电影制作成本与工作流程。

February 27, 2026
AI视频生成快手中国科技
字节跳动在与迪士尼版权纠纷后调整AI视频工具
News

字节跳动在与迪士尼版权纠纷后调整AI视频工具

字节跳动在迪士尼等公司提出版权投诉后,更新了其Seedance 2.0视频生成服务。该AI模型因生成包含奥特曼等流行角色的未授权内容而遭到抵制。日本AI大臣警告可能的法律后果,凸显了创意AI工具与知识产权之间日益紧张的矛盾。

February 26, 2026
AI版权字节跳动生成视频
Keling AI 以创纪录分数称霸视频生成排行榜
News

Keling AI 以创纪录分数称霸视频生成排行榜

Keling最新AI视频模型以史无前例的1240分登顶全球基准测试,震撼科技界。这家中国企业的七款模型跻身全球前15名,标志着其在逼真视频生成领域的统治地位。专家表示,这一突破意味着AI技术正从实验阶段迈向专业影视制作工具。

February 26, 2026
AI视频生成Keling3.0Pro生成式AI
News

李飞飞的AI初创公司获得高达10亿美元巨额投资

由著名AI先驱李飞飞联合创立的人工智能初创公司World Labs已完成一轮高达10亿美元的巨额融资。主要投资者包括Autodesk、Andreessen Horowitz、NVIDIA和AMD。该公司旨在推动AI发展的边界,延续李飞飞在ImageNet项目上的开创性工作——该项目彻底改变了计算机视觉领域。

February 19, 2026
人工智能科技初创企业计算机视觉
豆包借力春晚热潮登顶应用商店榜首
News

豆包借力春晚热潮登顶应用商店榜首

字节跳动旗下AI助手豆包在苹果App Store排行榜上跃居第一,超越了阿里巴巴和蚂蚁集团等竞争对手。该应用在与央视春晚合作后人气飙升,除夕当晚创下19亿次用户互动的惊人记录。

February 18, 2026
豆包AI助手字节跳动