跳转到主要内容

商汤科技NEO以更精简、更快速的人工智能突破多模态壁垒

商汤科技重写多模态AI规则

这项可能重塑人工智能处理多数据类型方式的突破中,商汤科技联合南洋理工大学S-Lab推出了NEO——业界首个真正原生的多模态架构。这不仅是渐进式改进,更是对AI协同处理视觉与文本信息的彻底重构。

Image

摆脱拼凑式设计桎梏

传统多模态系统如同鲁布·戈德堡机械——将视觉处理、投影和语言理解等独立组件强行拼接。"我们意识到这种弗兰肯斯坦式方法正在制造不必要的瓶颈,"商汤科技技术总监解释道。NEO彻底抛弃了这种碎片化设计。

突破性进展源自三大革新:

  • 原生像素读取消除了独立图像分词器
  • 3D旋转位置编码在统一空间整合文本与视觉数据
  • 混合注意力计算将空间理解能力提升24%

"最令我们惊讶的是效率提升,"总监补充道,"仅需同类系统十分之一的训练数据就能实现顶尖效果。"

Image

性能说明一切

测试数据令人印象深刻:在0.6B-8B参数范围内(完美适配边缘设备),NEO横扫行业基准:

  • ImageNet:刷新准确率记录
  • COCO:增强物体识别能力
  • Kinetics-400:卓越视频理解表现

最惊人的是,这些成就均在移动硬件上以低于80毫秒延迟实现——实时应用绰绰有余且不损耗电量。

开源浪潮兴起

技术社区对商汤科技决定在GitHub公开模型权重(2B和9B版本)及训练脚本反响热烈。早期采用者称赞此举加速了紧凑型AI系统的创新进程。

发展路线图同样值得期待:

  • 2026年Q1:计划发布3D感知版本
  • 年中:视频理解升级版本

影响深远如行业分析师所言:"NEO不仅是更好的技术——它可能最终终结阻碍多模态AI发展多年的模块化方案。"

核心亮点:

  • 🚀 减少90%数据需求:以极低训练要求实现顶尖性能
  • 闪电速度:低于80毫秒延迟使边缘部署切实可行
  • 🔓 开放生态:完整权重与脚本已登陆GitHub
  • 🔮 面向未来:3D与视频版本即将推出

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

PixVerse R1通过实时1080P视频技术让虚拟世界栩栩如生
News

PixVerse R1通过实时1080P视频技术让虚拟世界栩栩如生

爱世科技的突破性PixVerse R1模型正在通过使虚拟世界即时互动来改变数字创作。它结合三项创新技术,能够无缝实时生成高清环境,用户可以随时共同创作内容。从游戏到电影制作,这项技术有望彻底改变我们与数字空间的互动方式。

January 14, 2026
虚拟现实AI创新实时渲染
智谱与华为联合发布完全基于国产技术的突破性AI图像模型
News

智谱与华为联合发布完全基于国产技术的突破性AI图像模型

中国AI企业智谱与华为合作推出GLM-Image,这是一款完全基于国产硬件训练的革命性多模态模型。这一创新系统结合了文本与图像生成能力,尤其在汉字渲染和复杂视觉任务方面表现优异。现已作为开源软件发布,有望使先进的AI图像创作更加普及。

January 14, 2026
AI创新国产技术计算机视觉
腾讯WeDLM通过扩散模型突破性进展为AI推理加速
News

腾讯WeDLM通过扩散模型突破性进展为AI推理加速

腾讯微信AI团队发布了创新扩散语言模型WeDLM,该模型在保持文本生成质量的同时显著提升了速度。通过巧妙融合扩散模型与注意力机制,这项技术在特定任务中实现了比现有模型快10倍的处理速度。早期测试显示,该技术在需要快速响应的应用场景(如客服和实时问答)中表现尤为突出。

January 13, 2026
AI创新自然语言处理腾讯技术
News

华硕UGen300:为日常PC打造的USB供电AI大脑加速器

华硕凭借口袋大小的UGen300加速器颠覆AI硬件市场。这款USB供电的奇迹设备能为普通电脑提供服务器级的40 TOPS性能,且无需专业技术。搭载Hailo高效NPU和8GB内存,预装100多个AI模型,可立即应用于安全、医疗和工业领域。这会是主流AI应用缺失的一环吗?

January 13, 2026
AI硬件边缘计算USB加速器
琼彻的口袋革命:你的手机如何助力训练未来机器人
News

琼彻的口袋革命:你的手机如何助力训练未来机器人

科技创新企业琼彻智能发布了颠覆性设备'RoboPocket',将普通智能手机用户转变为AI训练的数据采集者。这款口袋大小的解决方案打破了传统实验室的壁垒,让高质量的真实世界数据可以随时随地收集。专家表示这标志着机器人开发向更实用、更易获取的方向迈出了重要一步。

January 12, 2026
AI创新众包数据机器人开发
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习