跳转到主要内容

AI重大突破:智谱、达摩院与360发布前沿模型

重大AI进展重塑科技格局

智谱开源GLM-4.5V视觉模型

中国AI公司智谱通过开源其GLM-4.5V视觉推理模型引发轰动,该模型拥有1060亿参数,在41项多模态基准测试中达到顶尖水平。该模型在图像分析、视频理解和GUI任务等全场景应用中表现卓越。

Image

主要特点包括:

  • 新增"思维模式"切换以实现效率优化
  • 具有竞争力的定价(¥2/M输入token)
  • 在复杂视觉推理任务中的卓越表现

阿里巴巴达摩院推进具身智能技术

在世界机器人大会上,阿里研究机构发布了三项突破性技术:

  1. RynnVLA-001-7B:通过第一人称视频学习的视觉-语言-动作模型
  2. RynnEC:从11个维度分析场景的世界理解模型
  3. RynnRCP:实现完整传感器到动作工作流的机器人上下文协议

该开源项目(GitHub)旨在标准化具身智能开发。

苹果为Siri准备GPT-5集成方案

这家科技巨头宣布计划在即将推出的iOS/macOS更新中为其Apple Intelligence系统升级GPT-5功能。增强功能将包括:

  • 改进的多语言实时翻译
  • 高级屏幕内容分析能力
  • 首次向第三方开发者开放API访问权限 此举表明苹果致力于保持在AI助手领域的竞争力。

高德AI智能体让地图更智能

阿里旗下地图服务推出了全球首个AI原生地图智能体"小高老师",具有以下特点:

  • 支持打断的端到端语音交互
  • 带多重约束条件的复杂POI推理能力
  • 基于训练了36万亿token的Qwen模型构建 该系统代表了空间语义理解的重大飞跃。

字节跳动攻克字幕去除难题

TikTok母公司推出基于DiT技术的无缝视频字幕去除方案,具有:

  • 像素级完美修复技术
  • 包含少数民族语言的多语言支持功能
  • "去除-翻译–唇形同步"一键式工作流 这项创新(VolcEngine)有望简化内容本地化流程。 Image

昆仑万维通过开放模型突破边界

这家游戏公司做出了两项重要贡献:

  1. Matrix-Game2.0:无需语言提示即可实时生成长达1分钟的25fps视频
  2. Matrix-3D:单图转360°可导航视频转换技术(GitHub) Image Image 两个模型都展示了生成式AI应用的显著进步。

    关键要点:

  3. 视觉AI飞跃: 智谱GLM–4.5V为开源视觉模型树立新标杆(1060亿参数)
  4. 机器人框架: 阿里达摩院三项技术可能加速具身智能发展
  5. 消费级升级: 苹果GPT–5集成与高德地图智能体展示实用AI应用场景
  6. 内容工具: 字节跳动和昆仑万维方案解决媒体制作中的关键挑战
  7. 开源浪潮: 多家巨头发布权重/代码标志着行业协作趋势

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

机器人迎来大脑升级:ForceGPT发布改变游戏规则的人工智能模型

在机器人技术的重大飞跃中,ForceGPT推出了DM0——全球首个专为机器人设计的原生嵌入式人工智能模型。与以往对语言模型的改造不同,DM0从零开始构建,旨在赋予机器直觉和学习能力。这款拥有24亿参数的高效模型在全球性能排行榜上名列前茅,同时足够轻量级以运行在消费级硬件上。凭借完全开源的特性和配套开发工具,此次发布或将像Android对智能手机的影响一样,推动机器人开发的民主化进程。

February 11, 2026
roboticsartificial intelligencemachine learning
优必选Thinker模型:智能机器人的革命性突破
News

优必选Thinker模型:智能机器人的革命性突破

优必选开源了其Thinker模型,这是机器人AI领域的一项重大突破,解决了空间理解和视觉感知等关键挑战。通过将原始数据从200亿条精炼至仅1000万条,并将标注成本降低99%,Thinker有望彻底改变机器人的学习和操作方式。此举或将加速整个机器人行业的创新进程。

February 2, 2026
roboticsAImachine learning
机器人变得更聪明:Antlingbot的新AI让机器像人类一样思考
News

机器人变得更聪明:Antlingbot的新AI让机器像人类一样思考

Antlingbot科技公司发布了开源AI模型LingBot-VA,赋予机器人类似人类的决策能力。这一突破性技术将视频生成与机器人控制相结合,使机器能够在执行动作前进行模拟。测试中,使用LingBot-VA的机器人在复杂任务(如折叠衣物和精确物体操作)中表现出卓越的适应性,超越了现有系统。该技术有望加速更具能力的服务机器人开发。

January 30, 2026
roboticsartificial intelligencemachine learning
蚂蚁集团LingBot-VLA为机械臂赋予类人精准度
News

蚂蚁集团LingBot-VLA为机械臂赋予类人精准度

蚂蚁集团推出突破性AI模型LingBot-VLA,使机器人获得惊人的类人灵巧性。该系统基于2万小时真实世界数据训练,能以前所未有的协调性控制不同机械臂——无论是叠积木还是穿针引线。其独特之处在于结合了视觉理解与空间推理能力,在复杂任务中超越竞争对手。更令人瞩目的是,蚂蚁集团将开源完整工具包,此举有望加速机器人技术研究进程。

January 30, 2026
roboticsAIAntGroup
News

OpenMind机器人应用商店旨在提升机器人多功能性

OpenMind推出了专为机器人打造的应用商店,弥合了先进硬件与适应性软件之间的鸿沟。该平台允许操作者像更新智能手机应用一样升级机器人功能,初期重点领域包括移动能力、社交互动和隐私保护。目前已兼容10家制造商的机器人产品,并获得优必选、傅利叶等行业领导者的支持。

January 29, 2026
roboticsOpenMindAI applications
News

机器人通过突破性新数据集获得触觉感知

随着Baihu-VTouch的发布,机器人技术迎来重大飞跃——这是全球首个跨机型的视觉-触觉数据集。由中国国家地方共建人形机器人创新中心与多支研究团队联合开发,这个数据宝库包含超过60,000分钟的真实机器人交互数据。其独特之处在于不仅记录机器人所见,还捕捉物体触感——使机器能够在不同硬件平台上发展类人的触觉敏感性。

January 27, 2026
roboticsAI researchtactile sensing