跳转到主要内容

IBM发布Granite 4.0 Nano AI模型,专为边缘计算设计

IBM推出Granite 4.0 Nano AI模型

IBM通过发布四款全新Granite 4.0 Nano模型展示了人工智能领域的最新创新,标志着高效小规模AI部署的重大进步。这些模型的参数量范围从350万到15亿不等,体现了IBM致力于让AI技术更易获取且适用于多样化应用的决心。

摆脱云端依赖

与传统需要云计算基础设施的大语言模型不同,Granite 4.0 Nano系列专为在标准笔记本电脑甚至浏览器环境中运行而设计。这一突破使开发者能够为消费级硬件和边缘设备开发应用,而无需依赖云服务。

Image

开源可及性

所有Granite 4.0 Nano模型均基于Apache 2.0许可证发布,面向:

  • 学术研究人员
  • 企业开发者
  • 独立软件创作者 该许可证允许商业用途,并确保与以下流行工具的兼容性:
  • llama.cpp
  • vLLM
  • MLX

这些模型还获得了负责任AI开发实践的ISO42001认证

模型变体与架构

Granite 4.0 Nano系列包含四款不同型号:

  1. Granite-4.0-H-1B(约1.5亿参数)
  2. Granite-4.0-H-350M(约350万参数)
  3. Granite-4.0-1B(约2亿参数变体)
  4. Granite-4.0-350M(变体模型)

H系列采用混合状态空间架构,针对低延迟边缘环境优化;而标准Transformer模型则提供跨平台的更广泛兼容性。

Image

基准测试表现亮眼

最新测试显示IBM的Nano系列在多维度超越同类小型语言模型:

  • 更优的指令跟随能力
  • 增强的函数调用性能
  • 更低的内存需求
  • 更快的运行速度 这些优势使其能在移动设备和标准CPU上流畅运行。 IBM已通过Reddit等平台积极与开发者社区互动以收集反馈并讨论未来改进方向。 技术详情参阅:HuggingFace博客 #核心亮点: 🌟 本地处理能力: Granite4Nano实现消费级硬件上的AI应用而无需云端依赖。 🛠️ 开放许可: Apache2许可证支持研究与商业双重用途。 📈 基准领先: 在速度和效率上超越同类小型语言模型。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

IBM豪掷110亿美元收购Confluent,押注实时数据领域

IBM正以高达110亿美元的巨额交易收购实时数据流领域领导者Confluent。这笔战略性收购旨在通过强化数据基础设施来提升IBM的人工智能能力。基于Apache Kafka技术的Confluent解决方案将帮助企业更快部署AI,同时管理系统间的关键数据流。此次收购正值Confluent的市场潜力预计在2025年翻倍至1000亿美元之际。

December 9, 2025
IBMConfluentAI基础设施
亚马逊通过一键式智能体工具强力推进AI开发
News

亚马逊通过一键式智能体工具强力推进AI开发

在AWS re:Invent 2025大会上,亚马逊发布了九项简化AI智能体部署的强大新功能。开发者现在可以通过TypeScript支持、边缘设备兼容性和简化的安全工具,比以往更快地构建智能体。这些创新有望大幅缩短开发时间,同时让前端工程师和嵌入式系统专家也能参与AI创作。

December 4, 2025
AWSAIdevelopmentTypeScript
IBM裁员以优先发展AI和软件业务
News

IBM裁员以优先发展AI和软件业务

IBM宣布裁员数千人,作为向AI和软件服务战略转型的一部分。此举将影响2700至5000名员工,主要涉及基础设施部门,与CEO Arvind Krishna专注于高利润的云和AI解决方案(如watsonx)的战略一致。

November 6, 2025
IBM人工智能科技裁员
IBM与Groq合作将AI速度提升五倍
News

IBM与Groq合作将AI速度提升五倍

IBM已与芯片初创公司Groq达成合作,将其LPU技术集成至Watsonx平台,承诺为企业提供速度快五倍且更具成本效益的AI解决方案。该合作初期将重点布局医疗健康和零售领域。

October 21, 2025
IBMGroqAI加速
News

Anthropic与IBM达成合作,将Claude AI引入企业市场

Anthropic已与IBM达成战略合作,将其Claude大语言模型集成至IBM软件产品中,标志着其向企业市场的重大推进。此次合作紧随Anthropic近期与德勤达成的协议,显示出与OpenAI日益激烈的竞争态势。

October 9, 2025
人工智能企业技术大语言模型
阿里巴巴Qwen3-Omni模型即将发布并集成Hugging Face
News

阿里巴巴Qwen3-Omni模型即将发布并集成Hugging Face

阿里云Qwen团队正准备推出第三代跨模态AI模型Qwen3-Omni。该系统已向Hugging Face的Transformers库提交了PR,预示着即将开源。这一端到端多模态解决方案可处理文本、图像、音频和视频,并通过独特的Thinker-Talker架构优化边缘设备部署。

September 22, 2025
Qwen3-OmniMultimodalAIHuggingFace