跳转到主要内容

美团发布LongCat-Video模型:开启AI生成内容新纪元

美团推出革命性长视频生成AI

美团研究院通过发布LongCat-Video这一尖端视频生成模型,在人工智能领域实现重大飞跃,有望彻底改变内容创作流程。这一进展标志着该公司在探索"世界模型"(旨在理解与模拟现实世界动态的AI系统)道路上迈出重要一步。

Image

技术架构与核心能力

该模型基于先进的Diffusion Transformer (DiT)框架构建,集成三大核心功能:

  • 支持720p分辨率、30fps的文生视频生成
  • 精准保留原图属性的图生视频转换
  • 实现连贯片段延展的视频延续功能

LongCat-Video的创新之处在于其"条件帧数"参数的运用,使系统能智能区分不同输入任务,同时保持稳定的输出质量。

长内容创作领域的突破

最显著的成就是模型可生成长达5分钟且稳定连贯的视频——相较于此前受限于短片的系统堪称重大进步。该能力解决了AI视频生成领域的长期挑战:

  • 消除帧间色彩漂移现象
  • 避免随时间推移的质量衰减
  • 保持角色动作与环境的一致性

这项技术突破对需要长时间模拟的应用场景尤为重要,例如自动驾驶系统具身AI平台。

性能优化方案

开发团队通过多项创新提升效率:

  1. 两阶段由粗到精的生成流程
  2. 块稀疏注意力(BSA)机制
  3. 高级模型蒸馏技术 这些优化实现了推理速度10.1倍的提升,且未牺牲输出质量。

基准测试结果与可用性

严格测试表明LongCat-Video在多项指标上达到业界最优(SOTA)表现:

  • 文生视频对齐精度
  • 视觉保真度评分
  • 运动自然度评估

该模型已通过GitHub和Hugging Face仓库开源发布,为个人创作者与企业用户降低了使用门槛。

核心亮点:

  • 首个能生成稳定5分钟视频的商业级AI
  • 统一架构整合三种生成模式
  • 为开源视频生成质量树立新标杆
  • 潜在应用覆盖娱乐、教育及工业仿真领域

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

美团发布LongCat-Video模型:可生成5分钟AI视频内容
News

美团发布LongCat-Video模型:可生成5分钟AI视频内容

美团推出突破性AI模型LongCat-Video,能够生成高质量、连续5分钟的视频内容。该模型基于Diffusion Transformer架构,无需额外适配即可支持文生视频、图生视频及视频延续任务,在长视频生成中保持时间连贯性且避免质量衰减。

October 27, 2025
AI-video-generationDiffusionTransformerMeituan-tech
Moonlight AI的Kiwi-do模型以视觉物理能力惊艳亮相
News

Moonlight AI的Kiwi-do模型以视觉物理能力惊艳亮相

Moonshot AI神秘的新模型'Kiwi-do'已成为多模态AI领域的潜在颠覆者。这款新发现的模型在视觉物理理解方面展现出非凡能力,似乎领先于Moonshot计划发布的K2系列。早期测试表明Kiwi-do可能彻底改变AI解读复杂视觉数据的方式。

January 5, 2026
multimodal-AIcomputer-visionMoonshot-AI
阿里巴巴Z-Image Turbo以惊人效率加速AI艺术创作
News

阿里巴巴Z-Image Turbo以惊人效率加速AI艺术创作

阿里巴巴通义实验室发布突破性AI图像生成器Z-Image-Turbo,仅用60亿参数(远少于竞争对手)就能在消费级GPU上秒速生成惊艳效果。该模型自然处理复杂中文提示词,并以最少处理步骤生成印刷品质图像。这款开源挑战者已在人类偏好排名中攀升,或将重塑AI艺术格局。

November 27, 2025
AI-artgenerative-modelscomputer-vision
News

LTX-2 AI模型以4K输出革新视频生成领域

Lightricks发布突破性AI视频生成模型LTX-2,能够制作20秒4K叙事视频并实现音画同步输出。这款开源解决方案可在消费级GPU上本地运行,提供前所未有的创作控制。

October 31, 2025
AI-video-generationLTX-24K-content
字节跳动与香港高校开源DreamOmni2 AI图像编辑器
News

字节跳动与香港高校开源DreamOmni2 AI图像编辑器

字节跳动与香港高校联合开源了突破性AI图像编辑系统DreamOmni2,该系统能通过多模态指令理解抽象概念。其技术表现超越现有开源模型,并接近商业解决方案水平。

October 27, 2025
AI-image-editingmultimodal-AIopen-source-AI
豆包视频模型Seedance 1.0 Pro新增关键帧控制功能
News

豆包视频模型Seedance 1.0 Pro新增关键帧控制功能

火山引擎Doubao-Seedance-1.0-pro引入先进关键帧能力,通过提升主体一致性、运动物理性和叙事控制力,为专业创作者和普通用户增强AI视频生成效果。

October 23, 2025
AI-video-generationVolcEngineSeedance-Pro