跳转到主要内容

字节跳动StoryMem为AI生成视频带来一致性

字节跳动新方案让AI视频更流畅

是否注意到AI生成的视频中,角色在不同场景间经常出现外貌不一致的问题?得益于字节跳动与南洋理工大学研发的新系统StoryMem,这种令人沮丧的不连贯现象可能即将成为历史。

Image

一致性挑战

Sora、Kling和Veo等主流AI视频工具擅长创作短视频片段,但将这些片段拼接成连贯叙事时往往会产生突兀的视觉变化。角色可能在镜头切换间莫名改变服装或发型,背景也会出现不可预测的变动。

"现有解决方案要么需要过量计算资源,要么牺牲连续性",StoryMem研究团队解释道:"我们想创建更智能的系统来高效保存记忆"。

StoryMem的差异化工作原理

突破点在于其选择性记忆机制:

  • 智能存储生成过程中的视觉关键帧
  • 引用这些记忆创建新场景时
  • 通过反馈存储帧维持连续性至模型中

该方法确保生成的视频中(无论是五秒短片还是长篇内容),角色与环境始终保持可识别性。

背后的技术创新

团队使用以下要素训练StoryMem:

  • 40万条视频片段(每条5秒时长)
  • 基于阿里巴巴Wan2.2-I2V模型的低秩自适应(LoRA)技术
  • 视觉相似性分组保持续集风格一致性

测试结果极具说服力:

  • 比基础模型提升28.7%一致性
  • 用户审美质量偏好得分更高
  • 更强的故事连贯性表现

当前局限与未来方向

虽然取得显著进展,但StoryMem仍有不足:

  • 处理多角色的复杂场景时存在困难
  • 偶尔会在不同主体间错误应用视觉特征

研究人员建议在提示词中添加更清晰的角色描述可暂时缓解这些问题,同时他们正在开发更稳健的解决方案。

项目官网:https://kevin-thu.github.io/StoryMem/

核心要点:

✅ 保持AI生成视频中角色/环境跨场景一致性
📈 比现有模型提升28.7%连续性表现
🔄 采用智能帧存储与引用系统
🎬 基于40万视频片段使用LoRA技术训练
⚠️ 仍面临复杂多角色场景的处理挑战

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

字节跳动发布Seedance 2.0:AI视频创作的颠覆性突破
News

字节跳动发布Seedance 2.0:AI视频创作的颠覆性突破

字节跳动Seed团队推出的Seedance 2.0通过统一的多模态架构彻底革新了AI视频生成技术。本次升级能在短短五秒内实现音画无缝融合,为创作者提供前所未有的控制能力。从复杂运动场景到沉浸式音效设计,这项技术势将变革工业级视频制作。

February 12, 2026
AI视频生成字节跳动创意科技
科领AI视频模型以全球最高分打破纪录
News

科领AI视频模型以全球最高分打破纪录

科领最新AI视频生成模型在全球基准测试中拔得头筹,获得1240分的惊人成绩。七款科领模型跻身全球前15名,展现了中国在AI视频技术领域日益增强的统治力。专家表示这一突破标志着该技术从实验演示转向专业级影视制作工具。

February 26, 2026
AI视频生成科领科技文本生成视频
News

李飞飞的AI初创公司获得高达10亿美元巨额投资

由著名AI先驱李飞飞联合创立的人工智能初创公司World Labs已完成一轮高达10亿美元的巨额融资。主要投资者包括Autodesk、Andreessen Horowitz、NVIDIA和AMD。该公司旨在推动AI发展的边界,延续李飞飞在ImageNet项目上的开创性工作——该项目彻底改变了计算机视觉领域。

February 19, 2026
人工智能科技初创企业计算机视觉
豆包借力春晚热潮登顶应用商店榜首
News

豆包借力春晚热潮登顶应用商店榜首

字节跳动旗下AI助手豆包在苹果App Store排行榜上跃居第一,超越了阿里巴巴和蚂蚁集团等竞争对手。该应用在与央视春晚合作后人气飙升,除夕当晚创下19亿次用户互动的惊人记录。

February 18, 2026
豆包AI助手字节跳动
字节跳动Seedream 5.0 Lite:您的新型AI视觉思维伙伴
News

字节跳动Seedream 5.0 Lite:您的新型AI视觉思维伙伴

字节跳动推出Seedream 5.0 Lite图像生成模型,实现'先思考后绘图'。与以往单纯执行指令的版本不同,该AI现在能理解上下文、进行视觉推理并接入实时数据。想象一个不仅能创建图像,还能与您协作的助手——无论是设计信息图、编辑照片还是可视化复杂概念。该模型对物理法则和专业知识的理解能力,使其特别适合需要精确技术插图的专业人士。

February 13, 2026
AI图像生成视觉推理字节跳动
News

火山引擎在情人节前夕重磅推出豆包2.0

字节跳动旗下火山引擎在这个情人节为其创意工具带来重大升级。焦点落在具备专业级视频生成能力的豆包2.0上。随着Seedance 2.0的工业级视频交付能力与Seedream 5.0预览版带来的实时信息检索和更深层意图理解——这些革新势将彻底改变数字内容创作。

February 12, 2026
火山引擎AI视频生成数字内容创作