商汤科技NEO以更精简、更快速的人工智能突破多模态壁垒欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

商汤科技NEO以更精简、更快速的人工智能突破多模态壁垒

商汤科技重写多模态AI规则

这项可能重塑人工智能处理多数据类型方式的突破中，商汤科技联合南洋理工大学S-Lab推出了NEO——业界首个真正原生的多模态架构。这不仅是渐进式改进，更是对AI协同处理视觉与文本信息的彻底重构。

摆脱拼凑式设计桎梏

传统多模态系统如同鲁布·戈德堡机械——将视觉处理、投影和语言理解等独立组件强行拼接。"我们意识到这种弗兰肯斯坦式方法正在制造不必要的瓶颈，"商汤科技技术总监解释道。NEO彻底抛弃了这种碎片化设计。

突破性进展源自三大革新：

原生像素读取消除了独立图像分词器
3D旋转位置编码在统一空间整合文本与视觉数据
混合注意力计算将空间理解能力提升24%

"最令我们惊讶的是效率提升，"总监补充道，"仅需同类系统十分之一的训练数据就能实现顶尖效果。"

性能说明一切

测试数据令人印象深刻：在0.6B-8B参数范围内（完美适配边缘设备），NEO横扫行业基准：

ImageNet：刷新准确率记录
COCO：增强物体识别能力
Kinetics-400：卓越视频理解表现

最惊人的是，这些成就均在移动硬件上以低于80毫秒延迟实现——实时应用绰绰有余且不损耗电量。

开源浪潮兴起

技术社区对商汤科技决定在GitHub公开模型权重（2B和9B版本）及训练脚本反响热烈。早期采用者称赞此举加速了紧凑型AI系统的创新进程。

发展路线图同样值得期待：

2026年Q1：计划发布3D感知版本
年中：视频理解升级版本

影响深远如行业分析师所言："NEO不仅是更好的技术——它可能最终终结阻碍多模态AI发展多年的模块化方案。"

核心亮点：

🚀 减少90%数据需求：以极低训练要求实现顶尖性能
⚡ 闪电速度：低于80毫秒延迟使边缘部署切实可行
🔓 开放生态：完整权重与脚本已登陆GitHub
🔮 面向未来：3D与视频版本即将推出

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

News

AI芯片新秀豪揽11亿美元挑战英伟达

尽管有人担忧AI泡沫，投资者仍重金押注挑战英伟达芯片霸主地位的新锐。本周三家初创公司——MatX、Axelera和SambaNova——合计融资11亿美元。它们各具特色：MatX推出兼顾训练与推理的多功能芯片，Axelera专注超高效边缘计算，而SambaNova则与英特尔达成合作。融资热潮表明投资者相信专用AI芯片仍有发展空间。

February 25, 2026

AI芯片半导体边缘计算

News

Inception Labs以Mercury2颠覆AI领域——一款像编辑一样思考的扩散模型

AI初创公司Inception Labs发布了突破性的语言模型Mercury2，该模型摒弃了标准的Transformer架构，转而采用扩散模型。与逐字生成的传统AI不同，Mercury2能同时编辑整段文字——想象一个能重写段落而非逐个字母输入的AI助手。早期测试显示其速度惊人，在保持质量的同时每秒生成超过1000个token。凭借具有竞争力的价格和针对速度敏感应用的专有功能，这可能是AI文本生成新方法的开端。

February 25, 2026

AI创新扩散模型自然语言处理

News

谷歌Gemini 3.1 Pro以突破性推理能力超越竞争对手

谷歌发布了迄今为止最先进的AI模型Gemini 3.1 Pro，在逻辑推理和问题解决能力方面展现出显著提升。新架构在关键测试中性能较前代提升逾一倍，甚至在某些基准测试中超越了GPT-5.2。除了原始算力，Gemini 3.1 Pro还引入了创新的多模态能力，可处理超长上下文并生成复杂概念的视觉化呈现。

February 24, 2026

AI创新谷歌科技机器学习