跳转到主要内容

商汤科技推出新型AI模型,思维模式堪比侦探

商汤科技推出侦探灵感AI取得突破

总部位于上海的AI巨头商汤科技本周开源其革命性SenseNova-MARS模型引发轰动——这个系统不仅能理解信息,更能像经验丰富的调查员一样主动解决问题。

基准测试表现卓越

数据说明一切。在直接对比中:

  • 搜索推理:在MMSearch测试中获得74.27分,优于GPT-5.2的66.08分
  • 细节检测:在HR-MMSearch(高清搜索)测试中达到54.43分
  • 视觉理解:在多个评估平台创下新标准

这些结果的非凡之处不仅在于性能差距——更在于系统实现的方式。

福尔摩斯式思维

真正的魔力在于MARS能够:

  1. 发现大海捞针般的细节(如图像中占比不足5%的标识)
  2. 即时与全球数据库交叉比对发现结果
  3. 自然串联多步骤推理过程

"这就像训练一个数字侦探,"商汤科技研究团队的张伟博士解释道,"我们不只是构建了另一个识别工具——而是创造了知道何时及如何调查的系统。"

幕后故事:训练明日AI侦探

开发过程采用创新的两阶段方法:

第一阶段专注于通过自动化数据合成创建具有挑战性的"案件档案"——确保AI从一开始就学习复杂的真实场景。

第二阶段引入通过BN-GSPO算法的强化学习,平滑学习曲线,就像引导新手调查员处理首批案件。

开源承诺

商汤科技受到全球开发者赞誉的举措包括发布: 完整MARS模型(8B和32B两个版本) 所有底层代码 完整训练数据集 这些资源现已在Hugging Face平台提供,有望加速具身智能应用领域的创新。

这意味着什么?从医疗诊断到法医分析,MARS代表着AI系统的重大飞跃——它们不再只是处理信息,而是主动破解谜题。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

新型AI模型为机器人注入常识

深度心智智能公司推出突破性AI模型PhysBrain 1.0,赋予机器人对人类物理定律的理解能力。与以往仅模仿动作的系统不同,这项新技术能真正理解物体行为背后的原理——使机器人能够预测结果并以最少的训练适应新环境。这项由北京研究人员开发的成果或将彻底改变机器与人类世界的交互方式。

March 27, 2026
AI创新机器人技术机器学习
News

Moonshot AI创始人于NVIDIA活动揭晓下一代模型战略

Moonshot AI创始人杨植麟在NVIDIA GTC2026大会上阐述了他对大语言模型未来的愿景,引发广泛关注。他提出了一种超越单纯算力扩展的三管齐下策略,聚焦于token效率、长上下文处理和智能体集群。其Kimi K2.5模型背后的战略表明,我们正进入一个智能密度比原始参数数量更重要的时代。

March 18, 2026
AI创新Moonshot AINVIDIA GTC
News

Anthropic新一代AI Claude Mythos据传在秘密测试中超越顶级模型

泄露文件显示Anthropic即将推出的Claude Mythos AI模型已进入测试阶段,其能力超越了旗舰产品Opus系统。这款内部代号为'Capybara'的次世代模型据称在推理和任务处理方面实现了质的飞跃。虽然细节尚不明确,但内部人士警告这一突破伴随着前所未有的网络安全风险,可能重塑AI安全格局。

March 27, 2026
AI发展Anthropic机器学习
News

Qwen架构师揭秘:AI模型正从思考者转向行动者

阿里巴巴通义千问模型前首席工程师林俊阳分享了关于AI下一阶段发展的突破性见解。他揭示了早期尝试融合推理与指令能力时遇到的意外挑战,迫使团队重新思考技术路线。行业正在超越单纯让模型'延长思考'的阶段——当AI能通过现实交互优化计划时,真正的突破才会到来。这一转变可能重新定义我们衡量人工智能的标准。

March 27, 2026
AI进化代理思维Qwen洞察
中国AI模型SkyReels V4在视频生成领域超越全球竞争对手
News

中国AI模型SkyReels V4在视频生成领域超越全球竞争对手

昆仑万维的SkyReels V4在全球文本到视频生成排行榜上夺得榜首,超越了OpenAI的Sora2和Google Veo3.1等竞争对手。这一突破源自创新的强化学习和逻辑推理能力,解决了长期存在的视频一致性问题。该技术现已通过API开放,凭借其先进的视听生成能力,有望彻底改变从电子商务到教育等多个行业。

March 19, 2026
AI视频生成中国技术机器学习
News

AI迈出重要一步:MiniMax新模型现可实现自我提升

MiniMax发布了突破性的AI模型M2.7,该模型能主动参与自身开发。与传统仅依赖人类程序员的模型不同,M2.7可自主构建测试框架、与其他AI智能体协作并优化性能。这种自我提升能力或将显著增强AI处理复杂任务的方式。与此同时,AI行业持续快速发展,主要厂商纷纷获得融资并根据需求增长调整价格。

March 18, 2026
AI创新自学习系统MiniMax