跳转到主要内容

商汤科技NEO以更精简、更快速的人工智能突破多模态壁垒

商汤科技重写多模态AI规则

这项可能重塑人工智能处理多数据类型方式的突破中,商汤科技联合南洋理工大学S-Lab推出了NEO——业界首个真正原生的多模态架构。这不仅是渐进式改进,更是对AI协同处理视觉与文本信息的彻底重构。

Image

摆脱拼凑式设计桎梏

传统多模态系统如同鲁布·戈德堡机械——将视觉处理、投影和语言理解等独立组件强行拼接。"我们意识到这种弗兰肯斯坦式方法正在制造不必要的瓶颈,"商汤科技技术总监解释道。NEO彻底抛弃了这种碎片化设计。

突破性进展源自三大革新:

  • 原生像素读取消除了独立图像分词器
  • 3D旋转位置编码在统一空间整合文本与视觉数据
  • 混合注意力计算将空间理解能力提升24%

"最令我们惊讶的是效率提升,"总监补充道,"仅需同类系统十分之一的训练数据就能实现顶尖效果。"

Image

性能说明一切

测试数据令人印象深刻:在0.6B-8B参数范围内(完美适配边缘设备),NEO横扫行业基准:

  • ImageNet:刷新准确率记录
  • COCO:增强物体识别能力
  • Kinetics-400:卓越视频理解表现

最惊人的是,这些成就均在移动硬件上以低于80毫秒延迟实现——实时应用绰绰有余且不损耗电量。

开源浪潮兴起

技术社区对商汤科技决定在GitHub公开模型权重(2B和9B版本)及训练脚本反响热烈。早期采用者称赞此举加速了紧凑型AI系统的创新进程。

发展路线图同样值得期待:

  • 2026年Q1:计划发布3D感知版本
  • 年中:视频理解升级版本

影响深远如行业分析师所言:"NEO不仅是更好的技术——它可能最终终结阻碍多模态AI发展多年的模块化方案。"

核心亮点:

  • 🚀 减少90%数据需求:以极低训练要求实现顶尖性能
  • 闪电速度:低于80毫秒延迟使边缘部署切实可行
  • 🔓 开放生态:完整权重与脚本已登陆GitHub
  • 🔮 面向未来:3D与视频版本即将推出

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

AI芯片新秀豪揽11亿美元挑战英伟达

尽管有人担忧AI泡沫,投资者仍重金押注挑战英伟达芯片霸主地位的新锐。本周三家初创公司——MatX、Axelera和SambaNova——合计融资11亿美元。它们各具特色:MatX推出兼顾训练与推理的多功能芯片,Axelera专注超高效边缘计算,而SambaNova则与英特尔达成合作。融资热潮表明投资者相信专用AI芯片仍有发展空间。

February 25, 2026
AI芯片半导体边缘计算
Inception Labs以Mercury2颠覆AI领域——一款像编辑一样思考的扩散模型
News

Inception Labs以Mercury2颠覆AI领域——一款像编辑一样思考的扩散模型

AI初创公司Inception Labs发布了突破性的语言模型Mercury2,该模型摒弃了标准的Transformer架构,转而采用扩散模型。与逐字生成的传统AI不同,Mercury2能同时编辑整段文字——想象一个能重写段落而非逐个字母输入的AI助手。早期测试显示其速度惊人,在保持质量的同时每秒生成超过1000个token。凭借具有竞争力的价格和针对速度敏感应用的专有功能,这可能是AI文本生成新方法的开端。

February 25, 2026
AI创新扩散模型自然语言处理
谷歌Gemini 3.1 Pro以突破性推理能力超越竞争对手
News

谷歌Gemini 3.1 Pro以突破性推理能力超越竞争对手

谷歌发布了迄今为止最先进的AI模型Gemini 3.1 Pro,在逻辑推理和问题解决能力方面展现出显著提升。新架构在关键测试中性能较前代提升逾一倍,甚至在某些基准测试中超越了GPT-5.2。除了原始算力,Gemini 3.1 Pro还引入了创新的多模态能力,可处理超长上下文并生成复杂概念的视觉化呈现。

February 24, 2026
AI创新谷歌科技机器学习
中国GLM-5 AI模型凭借国产芯片支持取得突破性进展
News

中国GLM-5 AI模型凭借国产芯片支持取得突破性进展

智谱科技的GLM-5 AI模型通过最新升级引发轰动,现已全面支持七大国产芯片平台。该模型拥有惊人的7440亿参数,其编程智能体能力位居全球首位。虽然用户需求曾一度导致服务器过载,但公司已推出补偿措施。关键创新包括动态注意力机制和新型强化学习算法,显著提升了性能表现。

February 23, 2026
AI创新中国科技机器学习
谷歌Gemini 3.1 Pro大幅强化AI推理能力
News

谷歌Gemini 3.1 Pro大幅强化AI推理能力

谷歌发布最新AI模型Gemini 3.1 Pro,其推理能力显著提升。基准测试显示,该模型在逻辑处理测试中的表现超越前代产品两倍以上。这家科技巨头正通过多平台广泛提供该模型,并为高级订阅用户提供增强功能。

February 20, 2026
AI创新谷歌科技机器学习
阿里Qwen3.5-Plus打破纪录成为开源AI新标杆
News

阿里Qwen3.5-Plus打破纪录成为开源AI新标杆

正值农历新年庆祝之际,阿里巴巴重磅推出Qwen3.5-Plus——这款开源AI巨头以更低成本超越行业标杆。这款革命性模型在其紧凑框架中注入了重大创新,提供多模态能力并全面刷新基准测试成绩。全球开发者现在可免费获取媲美谷歌和OpenAI高端产品的技术。

February 17, 2026
AI创新开源技术机器学习