跳转到主要内容

AI2的Molmo 2将开源视频智能技术带到您指尖

开源视频智能的新纪元

艾伦人工智能研究所(AI2)再次以其最新发布的Molmo 2震撼AI界。这不仅仅是一个普通的语言模型——它专为理解视频和图像而设计,最重要的是,它完全开源。

Image

技术细节

Molmo 2提供多个版本:

  • Molmo2-4B & Molmo2-8B:基于阿里巴巴的Qwen3架构构建
  • Molmo2-O-7B:使用AI2自主Olmo架构的完全透明版本

该套件包含九个新数据集,涵盖从多图像分析到视频追踪等各个方面——实质上是为开发者提供了创建定制化视频理解系统的构建模块。

对企业的意义

AI2感知研究负责人Ranjay Krishna解释了Molmo 2的独特之处:"这些模型不仅能回答问题——它们可以精确定位视频中事件发生的具体时间和位置。"想象一下询问"球员何时得分?"不仅能得到答案,还能获得精确的时间戳。

这些模型具备一些令人印象深刻的能力:

  • 生成详细的视频描述
  • 跨帧统计物体数量
  • 在长镜头中发现罕见事件

开源优势

在大多数强大模型都被企业锁闭的行业中,AI2对开放性的承诺显得尤为突出。正如分析师Bradley Shimmin指出:"对于担心数据主权或需要定制解决方案的公司来说,完全获取模型权重和训练数据是无价之宝。"

相对紧凑的规模(40亿-80亿参数)使Molmo 2在实际部署中更具实用性。Shimmin补充道:"企业正在意识到更大并不总是更好——重要的是对AI工具的控制和理解。"

亲自尝试

感兴趣的开发者可以在以下平台试用Molmo 2:

完整项目详情请访问allenai.org/blog/molmo2

关键点:

  • 开放获取:完整的模型权重和训练数据可用
  • 视频智能:理解时序事件和空间关系
  • 开发者友好:多种尺寸选项平衡能力与效率
  • 透明AI:完全可见模型的构建过程

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

智谱与华为联手推出基于国产芯片的开源图像模型

智谱AI与华为联合发布GLM-Image,这一突破性多模态模型完全运行在中国昇腾芯片上。这标志着国产AI发展的重大进展,将尖端图像生成技术与完全自主的硬件体系相结合。混合架构融合了语言建模与扩散技术,有望为中国开发者提供更智能的内容创作工具。

January 14, 2026
AI自主化中国科技多模态模型
智谱与华为联合发布完全基于国产技术的突破性AI图像模型
News

智谱与华为联合发布完全基于国产技术的突破性AI图像模型

中国AI企业智谱与华为合作推出GLM-Image,这是一款完全基于国产硬件训练的革命性多模态模型。这一创新系统结合了文本与图像生成能力,尤其在汉字渲染和复杂视觉任务方面表现优异。现已作为开源软件发布,有望使先进的AI图像创作更加普及。

January 14, 2026
AI创新国产技术计算机视觉
MIT自动化'运动工厂'赋予AI物理直觉
News

MIT自动化'运动工厂'赋予AI物理直觉

来自MIT、NVIDIA和加州大学伯克利分校的研究人员攻克了视频分析领域的一大难题——教会AI理解物理运动。他们的自动化'FoundationMotion'系统无需人工干预即可生成高质量训练数据,帮助AI系统以惊人准确度掌握轨迹与时机等概念。初期测试显示其性能超越更庞大模型,标志着机器真正理解物体运动规律的进展。

January 12, 2026
计算机视觉AI训练运动分析
News

斯坦福研究揭示:中国在开源AI发展中领先

斯坦福大学一项突破性分析显示,中国已在开源权重AI开发领域超越美国,其中阿里巴巴的通义千问模型系列领跑全球下载量。尽管中国科技巨头和初创企业推动创新,但随着这些模型获得国际采用,安全问题依然存在。

January 12, 2026
人工智能中国科技开源AI
Lightricks推出开源AI,数秒内生成带声音的视频
News

Lightricks推出开源AI,数秒内生成带声音的视频

以色列科技公司Lightricks发布了LTX-2,这是一款创新的AI系统,能够根据文本提示生成20秒高清视频并完美同步音频。与传统方法不同,它采用独特的双流架构同时处理视觉和声音。这款开源模型以惊人的速度超越竞争对手——每步仅需一秒多即可生成720p内容。

January 12, 2026
AI视频生成开源AILightricks
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习