跳转到主要内容

商汤科技新AI模型在空间智能领域超越GPT-5

商汤科技在空间智能AI领域取得突破性进展

中国科技巨头商汤科技推出的SenseNova-SI系列模型正引发行业震动,这一可能重塑人工智能与物理空间交互方式的开源模型不仅比肩全球领先产品,更创造了新的性能标杆。

Image

弥补空间认知短板

尽管当前AI模型擅长语言任务和逻辑推理,但在理解三维环境的空间认知能力上始终存在局限。"我们意识到这是根本性缺陷",项目首席研究员李伟博士表示,"真正的具身智能需要像人类一样理解空间"。

解决方案是采用系统性训练方法,通过专为增强空间认知设计的海量数据集进行训练。旗舰产品SenseNova-SI-8B在空间智能基准测试中获得60.99的平均分,表现超越Qwen3-VL-8B等开源模型及OpenAI的GPT-5等商业系统。

Image

超越数字的意义

此次突破的非凡之处不仅在于性能指标的优势,更在于其实现方式。该技术聚焦空间智能六大核心维度:

  • 测量:精确的距离与尺寸估算
  • 重建:构建环境心理模型
  • 关系:理解物体的空间交互方式
  • 视角:从不同角度解析场景
  • 形变:识别变化或扭曲的空间
  • 推理:对空间布局得出逻辑结论

其应用前景远超学术基准测试:自动驾驶车辆可更安全地穿行复杂城市环境;机器人系统能以类人精度操控物体;甚至增强现实应用也将获得显著提升。

建立新标准体系

同步推出的EASI(进化式空间智能评估)开放平台旨在建立统一的AI空间理解测评标准。

商汤通过GitHub(https://github.com/EvolvingLMMs-Lab/EASI)公开了模型及评估工具,展现出通过集体协作而非技术垄断推动领域发展的决心。

The rapid progress suggests we may be approaching a tipping point where AI systems can understand and interact with physical spaces nearly as well as they process language - potentially opening doors to applications we've only begun to imagine.

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

微软全新AI模型以智能轻巧设计展现强大实力
News

微软全新AI模型以智能轻巧设计展现强大实力

微软发布了Phi-4-reasoning-vision-15B,这款AI模型虽轻巧却拥有惊人性能,在视觉推理任务中表现卓越。其独特之处在于能以较低计算成本提供顶级性能,非常适合资源受限的环境。成功秘诀在于高质量训练数据和创新的混合推理方法,能自动适应简单或复杂任务。该模型现已开源,或将改变我们对高效AI的认知。

April 13, 2026
微软AI多模态推理高效AI
News

腾讯新型机器人脑在关键测试中超越竞争对手

腾讯公布了HY-Embodied-0.5,这是一款突破性AI模型,旨在赋予机器人类似人类的空间感知和物理交互能力。与难以应对现实世界任务的标准AI模型不同,该系统通过专业架构与海量训练相结合,在22项性能基准测试中均获得最高分。这项技术可能最终弥合虚拟智能与实际机器人应用之间的差距。

April 10, 2026
人工智能机器人技术腾讯
News

蚂蚁集团以突破性技术在全球AI检测挑战赛中占据主导地位

在 prestigious CVPR 2026 大会上,蚂蚁集团的安全团队在AI内容检测领域取得了惊人的双料胜利。他们创新的方法将复杂的视觉分析与真实场景测试相结合,为对抗深度伪造和AI生成欺诈提供了强大的新工具。这一胜利凸显了中国在实用AI安全解决方案领域日益增长的领导地位,这些方案保护从数字支付到身份验证的方方面面。

April 10, 2026
AI安全深度伪造检测蚂蚁集团
Claude 全新顾问工具:以智能AI助力,无需高昂成本
News

Claude 全新顾问工具:以智能AI助力,无需高昂成本

Anthropic为其Claude AI平台推出了一项巧妙的新功能,将高效与智能完美结合。这款顾问工具让更快速、更经济的模型处理日常任务,同时在遇到复杂决策时自动咨询更强大的Claude Opus。想象一下拥有一位敏捷的初级助手,能在需要时谨慎地寻求资深专家的帮助。早期测试显示,该工具在显著提升性能的同时意外节省了成本——某些情况下甚至以低廉的代价实现了双倍能力。

April 10, 2026
AI创新Claude AI成本优化
深度求索V4下月登场:万亿参数巨擘,为中国AI未来而生
News

深度求索V4下月登场:万亿参数巨擘,为中国AI未来而生

中国人工智能领域即将迎来重大升级。深度求索创始人梁文峰确认,其下一代V4模型将于2026年4月下旬发布,具备万亿级参数规模,并与华为昇腾等国产芯片实现突破性兼容。这不仅是一次模型迭代,更是撼动中国计算市场的战略行动——科技巨头已开始囤积AI芯片。目前测试中的'快速'与'专家'双模式,从即时搜索到复杂问题求解,展现了该模型的多维能力。

April 10, 2026
AI创新中国科技深度求索
字节跳动Seeduplex让AI实现人类般听说同步
News

字节跳动Seeduplex让AI实现人类般听说同步

字节跳动推出突破性语音AI系统Seeduplex,实现语音同步处理而非轮流应答。这项全双工技术现已登陆抖音,将打断率降低40%,即使在嘈杂环境中也能准确理解用户。就像与一个永远不会错过节奏的人交谈。

April 9, 2026
语音AI字节跳动AI创新