美团发布LongCat-Video模型:可生成5分钟AI视频内容
美团推出新一代视频生成AI
中国科技巨头美团正式发布其最新人工智能模型LongCat-Video,专注于视频生成领域。这一进展标志着AI通过动态视觉媒体理解和重构现实世界的能力取得重大突破。
技术架构与能力
该模型基于Diffusion Transformer (DiT)架构构建,可无缝处理多种视频生成任务:
- 文生视频:根据文本提示精准生成720p高清30fps视频
- 图生视频:保留参考图像所有特征的同时创建物理合理的动画
- 视频延续:在保持逻辑连贯性的基础上扩展现有素材

长内容生成的突破
LongCat-Video最显著的成就是能够生成连续5分钟的视频且不会出现质量衰减。该模型采用了多项创新技术:
- 先进的时间一致性算法
- 物理运动合理性检查
- 块稀疏注意力机制
- 条件令牌缓存系统
这些特性共同解决了AI生成视频内容中时长与质量平衡的长期难题。
性能优化
该模型通过以下方面展现出卓越效率:
- 多重推理速度优化策略
- 在内外部基准测试中表现稳定
- 在开源视频生成指标中领先业界

此次发布为内容创作者开辟了新可能,既能简化长视频制作流程,又能保持专业品质标准。
获取方式
The model is accessible through:
核心亮点:
- 创新架构:基于Diffusion Transformer技术实现多功能视频生成
- 多任务支持:无需额外适配即可处理文生视频、图生视频及视频延续
- 超长时长:稳定输出连续5分钟视频树立行业新标杆
- 质量维持:先进技术防止色彩漂移与画质衰减




