跳转到主要内容

商汤科技发布革命性AI,实现类人视觉与推理能力

商汤科技推出多模态AI模型取得重大突破

在可能重塑机器理解世界方式的举措中,商汤科技于2026年1月29日发布了SenseNova-MARS模型。这不仅是一个AI工具——它代表了计算机处理视觉信息方式的量子飞跃。

超越像素的视觉

SenseNova-MARS的独特之处在于它不仅能够识别图像,还能像人类一样对其进行推理。想象一下给你的手机看一张损坏电器的照片,它能诊断问题并搜索维修指南——这就是我们所说的能力。

该技术结合了:

  • 超越简单物体识别的视觉理解
  • 类似人类问题解决的自主推理
  • 让系统在工作中学习的实时知识整合

两种版本满足不同需求

公司发布了两个版本:

  1. 8B轻量版 - 体积小巧适合智能手机和边缘设备,同时仍具备强大分析能力
  2. 32B重量级版 - 专为需要深度推理的复杂工业应用设计

通过将两个版本开源,商汤科技正邀请全球开发者基于此平台进行构建。“我们希望加速跨行业创新,”商汤科技首席技术官张立博士解释道。“从医疗诊断到自动驾驶汽车,潜在应用令人惊叹。”

时机再好不过了。随着企业越来越依赖视觉数据分析——无论是扫描医学影像还是监控制造质量——像SenseNova-MARS这样的工具可能成为不可或缺的助手。

关键要点:

  • 首个结合视觉理解与自主推理的商业AI
  • 开源发布鼓励全球开发者参与
  • 小版本针对移动/边缘计算优化
  • 大模型瞄准企业级应用
  • 可能影响医疗、制造、零售等多个领域

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

商汤科技新型AI侦探能像人类一样思考与行动

商汤科技发布了首个开源AI模型SenseNova-MARS,该模型结合了视觉推理与图文搜索能力。这项突破性技术在多项基准测试中超越GPT-5.2,展现出类人的问题解决能力——从分析微小图像细节到执行复杂调查。该公司已向全球开发者开放8B和32B两个版本。

January 30, 2026
人工智能计算机视觉机器学习
News

海康威视AI检测仪攻克工厂包装瑕疵难题

海康威视推出基于观澜AI模型的智能质检系统,可即时识别包装错误。与传统人工检测不同,该方案能精准扫描每件产品,适应复杂生产环境。已在汽车和电子工厂展现价值,标志着智能制造又迈进一步。

January 30, 2026
工业自动化质量控制计算机视觉
Ant Lingbo新AI模型为虚拟世界注入生命
News

Ant Lingbo新AI模型为虚拟世界注入生命

Ant Lingbo科技发布了开源AI模型LingBot-World,能创建令人惊叹的真实虚拟环境。该突破性技术与谷歌Genie3质量相当,可实现长达10分钟无失真的无缝交互。从游戏到自动驾驶训练,开发者现在拥有了构建动态数字世界的强大工具,这些世界能即时响应用户指令。

January 29, 2026
AI创新虚拟世界机器学习
蚂蚁集团机器人技术飞跃:开源AI模型提升机器人智能
News

蚂蚁集团机器人技术飞跃:开源AI模型提升机器人智能

蚂蚁集团旗下灵波科技将其具身智能模型LingBot-VLA完全开源,标志着机器人技术的重大进步。该模型展现出卓越的跨平台适应性和训练效率,超越了现有框架。同时发布的新LingBot-Depth空间感知模型增强了机器人和自动驾驶车辆对3D环境的理解能力。这些发展或将加速智能机器人在各行业的应用。

January 28, 2026
机器人技术AI创新蚂蚁集团
谷歌Gemini 3 Flash现可如人类侦探般观察图像
News

谷歌Gemini 3 Flash现可如人类侦探般观察图像

谷歌为其Gemini 3 Flash AI升级了突破性的'Agentic Vision'技术,彻底改变了机器分析图像的方式。该AI不再只是简单浏览图片,而是能像人类专家一样主动调查——放大细节、标注元素并进行推理。这一突破使复杂视觉任务的准确率提高了5-10%,并将很快通过移动助手向普通用户开放。

January 28, 2026
计算机视觉谷歌AI图像分析
Kimi K2.5悄然登场:视觉与工具功能全面升级
News

Kimi K2.5悄然登场:视觉与工具功能全面升级

Moonshot AI低调推出Kimi K2.5,在视觉分析和工具集成方面带来重大改进。用户反馈其在图像转3D模型和分步解决复杂问题等任务中表现惊艳。技术社区对其潜在开源可能性尤为兴奋。

January 27, 2026
AI动态计算机视觉MoonshotAI