跳转到主要内容

美团发布LongCat-Video模型:可生成5分钟AI视频内容

美团推出新一代视频生成AI

中国科技巨头美团正式发布其最新人工智能模型LongCat-Video,专注于视频生成领域。这一进展标志着AI通过动态视觉媒体理解和重构现实世界的能力取得重大突破。

技术架构与能力

该模型基于Diffusion Transformer (DiT)架构构建,可无缝处理多种视频生成任务:

  • 文生视频:根据文本提示精准生成720p高清30fps视频
  • 图生视频:保留参考图像所有特征的同时创建物理合理的动画
  • 视频延续:在保持逻辑连贯性的基础上扩展现有素材

Image

长内容生成的突破

LongCat-Video最显著的成就是能够生成连续5分钟的视频且不会出现质量衰减。该模型采用了多项创新技术:

  1. 先进的时间一致性算法
  2. 物理运动合理性检查
  3. 块稀疏注意力机制
  4. 条件令牌缓存系统

这些特性共同解决了AI生成视频内容中时长与质量平衡的长期难题。

性能优化

该模型通过以下方面展现出卓越效率:

  • 多重推理速度优化策略
  • 在内外部基准测试中表现稳定
  • 在开源视频生成指标中领先业界 Image

此次发布为内容创作者开辟了新可能,既能简化长视频制作流程,又能保持专业品质标准。

获取方式

The model is accessible through:

核心亮点:

  1. 创新架构:基于Diffusion Transformer技术实现多功能视频生成
  2. 多任务支持:无需额外适配即可处理文生视频、图生视频及视频延续
  3. 超长时长:稳定输出连续5分钟视频树立行业新标杆
  4. 质量维持:先进技术防止色彩漂移与画质衰减

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

美团发布LongCat-Video模型:开启AI生成内容新纪元
News

美团发布LongCat-Video模型:开启AI生成内容新纪元

美团LongCat团队推出突破性AI模型LongCat-Video,可生成长达5分钟的高质量视频。该模型采用Diffusion Transformer架构,提供文生视频、图生视频及视频延续功能,在保持卓越连贯性与质量的同时,将推理速度提升10倍。

October 27, 2025
AI-video-generationDiffusionTransformercomputer-vision
News

LTX-2 AI模型以4K输出革新视频生成领域

Lightricks发布突破性AI视频生成模型LTX-2,能够制作20秒4K叙事视频并实现音画同步输出。这款开源解决方案可在消费级GPU上本地运行,提供前所未有的创作控制。

October 31, 2025
AI-video-generationLTX-24K-content
豆包视频模型Seedance 1.0 Pro新增关键帧控制功能
News

豆包视频模型Seedance 1.0 Pro新增关键帧控制功能

火山引擎Doubao-Seedance-1.0-pro引入先进关键帧能力,通过提升主体一致性、运动物理性和叙事控制力,为专业创作者和普通用户增强AI视频生成效果。

October 23, 2025
AI-video-generationVolcEngineSeedance-Pro
Vidu Q2 AI视频平台全球开放API访问
News

Vidu Q2 AI视频平台全球开放API访问

生数科技已全面开放其Vidu Q2 AI视频生成平台的API访问权限,标志着AI驱动视频制作的重大进展。该平台提供增强的真实感、数字角色的情感表达,以及针对广告、动画和电商行业的专用工具。

October 23, 2025
AI-video-generationShengshu-Technologycreative-AI
麓城科技Open-Sora 2.0入选全球AI报告
News

麓城科技Open-Sora 2.0入选全球AI报告

麓城科技的视频生成模型Open-Sora 2.0被纳入《2025年AI现状报告》,彰显其全球影响力。该开源模型拥有7万GitHub星标,并被500多篇论文引用,展现了其在AI研究和商业应用领域的重要地位。

October 14, 2025
Open-SoraAI-video-generationLucheng-Technology
Google NotebookLM新增六种风格的动漫视频功能
News

Google NotebookLM新增六种风格的动漫视频功能

Google的NotebookLM推出由Nano Banana AI驱动的动漫风格视频生成功能,提供六种艺术风格。虽然专业用户可优先体验,但中文支持仍有待改进。

October 14, 2025
NotebookLMAI-video-generationNano-Banana