跳转到主要内容

小米开源多模态AI模型MiMo-VL-7B-2508

小米开源先进多模态AI模型

小米AI研究团队公开发布了其MiMo-VL-7B-2508多模态大语言模型,标志着对开源AI社区的重大贡献。此次发布包括模型的强化学习(RL)监督微调(SFT)两个版本。

突破性性能指标

新模型在多个领域展现出卓越能力:

  • 主题推理:在MMMU基准测试中达到70+分
  • 文档理解:在ChartQA测试中获得94.4分
  • 图形界面定位:在ScreenSpot-v2测试中达到92.5分
  • 视频理解:在VideoMME测试中提升至70.8分

Image

技术增强

最新版本在以下方面有显著改进:

  1. 强化学习稳定性
  2. 监督微调流程
  3. 内部VLM Arena评分(从1093.9提升至1131.2)

以用户为中心的功能

模型引入了创新的交互模式:

  • 思考模式:显示完整推理链(100%控制成功率)
  • 非思考模式:直接生成答案(99.84%成功率且响应更快) 用户可通过/no_think指令切换模式。

可用模型版本

MiMo-VL-7B-RL-2508

MiMo-VL-7B-SFT-2508

  • 适合自定义微调
  • 相比之前版本改进了RL稳定性
  • 开源仓库

关键要点

✅ 四项核心AI能力达到新水平
✅ 双模式操作优化准确度或速度
✅ 完全开源且采用商业友好许可协议
✅ 增强强化学习应用的稳定性

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

小米豪赌AI:推出万亿参数模型并追加220亿美元投资

小米发布MiMo-V2系列三款强大AI模型,标志着其在人工智能领域的重大突破。创始人雷军宣布今年将追加220亿美元用于AI研发。旗舰机型MiMo-V2-Pro拥有超万亿参数,跻身全球顶级AI系统之列。小米将这些模型定位为'智能体时代'的基础技术——届时AI助手将比以往任何时候都更强大、更人性化。

March 19, 2026
XiaomiArtificial IntelligenceLarge Language Models
News

小米的AI雄心:悄然跻身全球大模型竞赛前五强

在保持低调的同时,小米在AI领域取得了重大进展。公司研发的万亿参数模型Mimo-V2-Pro现已位列全球第八,使小米作为品牌首次闯入前五名——甚至超越了埃隆·马斯克的xAI Grok。今年投入160亿元并开放新API服务后,小米正从智能手机制造商转型为AI领域的强劲竞争者。

March 19, 2026
XiaomiArtificial IntelligenceLarge Language Models
Manus AI以20分钟应用创建功能让'我的电脑'焕发生机
News

Manus AI以20分钟应用创建功能让'我的电脑'焕发生机

Meta旗下AI平台Manus实现了从云端到桌面的革命性跨越。其全新'我的电脑'功能允许AI代理直接管理文件、自动化任务,甚至能在几分钟内构建应用程序——所有这些操作都在严格的人工监督下确保数据安全。这或将彻底改变我们与设备的交互方式,使AI从助手转变为真正的数字同事。

March 18, 2026
AI生产力工具Meta
NVIDIA推出NemoClaw:为OpenClaw生态系统带来一键式AI体验
News

NVIDIA推出NemoClaw:为OpenClaw生态系统带来一键式AI体验

NVIDIA发布了革命性工具包NemoClaw,极大简化了OpenClaw平台上AI代理的部署流程。用户现在仅需一条命令即可安装Nemotron等强大AI模型和OpenShell运行时环境。该解决方案通过隔离沙箱和混合模型策略解决了关键隐私问题,同时支持从消费级设备到企业超级计算机的全场景应用。NVIDIA首席执行官黄仁勋称其为当代的'AI操作系统'。

March 17, 2026
AINVIDIAOpenClaw
智谱的GLM-5-Turbo:永不言弃的AI助手
News

智谱的GLM-5-Turbo:永不言弃的AI助手

智谱AI发布了GLM-5-Turbo,这是一款强大的新模型,旨在处理复杂任务而不中途停滞。与可能在长时间处理过程中出现问题的标准AI工具不同,此次升级专注于四个关键改进:可靠的工具使用、分解复杂请求、理解时间敏感任务以及高效处理繁重工作负载。早期测试显示,在实际商业场景中它的表现优于竞争对手,多家大型科技公司已对其准确性和可靠性表示赞赏。

March 17, 2026
AIZhipu生产力
ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘
News

ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘

OpenAI与Shazam合作,将音乐识别功能直接整合进ChatGPT。当听到动听旋律时,无需再切换应用——只需询问ChatGPT正在播放的歌曲,即可获得即时结果。该集成允许用户通过简单的语音或文本命令识别歌曲,并提供艺人信息和预览片段。就像聊天框里有个懂音乐的朋友。

March 10, 2026
OpenAIChatGPTShazam