跳转到主要内容

谷歌Gemma 4以Apache 2.0协议开源,媲美顶级AI模型

谷歌通过Gemma 4开源发布拉平AI竞争格局

4月3日凌晨,谷歌DeepMind发布了可能是迄今为止对开发者最友好的AI产品。Gemma 4不仅仅是一次常规更新——它代表了谷歌为赢回开源爱好者做出的最大胆举措。Image

四款模型满足各类需求

谷歌采取"随心选择"策略推出四款不同的Gemma 4变体:

31B Dense(性能怪兽): 启用全部310亿参数,这款旗舰模型能处理超长上下文(256K tokens),在开源模型中排名第三。令人惊讶的是其高效性——仅需单块H100 GPU即可运行。

26B A4B MoE(性价比之王): 采用混合专家架构,每次仅激活38亿参数却能提供越级性能。就像以踏板车的能耗获得跑车的表现。

E4B & E2B(移动端奇迹): 这些针对边缘设备优化的版本通过智能压缩技术缩小至手机适用尺寸——E2B版本运行时占用的内存比普通手机游戏还少。

Image

不仅是更大——更是更聪明

数据讲述着令人印象深刻的故事:

  • 数学能力 在AIME2026测试中提升近五倍(20.8% → 89.2%)
  • 编程水平 现在可与许多人类开发者匹敌(Codeforces ELO:110 → 2150)
  • 科学推理 对研究生级别问题的准确率翻倍(42.4% → 84.3%)
  • 多语言掌握 覆盖140+种语言且测试成绩优异

为现实世界思考而生

Gemma 4借鉴了谷歌高端Gemini模型的技巧:

  • "思考模式" 让模型在回答前内部处理问题——就像看人解数学题时展示演算过程
  • 开箱即用的自动化 内置函数调用和JSON输出功能
  • 天生的多模态能力 所有版本都能处理图像、视频甚至音频——这在开源模型中实属罕见

Image

为何此刻意义重大

随着DeepSeek、Qwen等中国模型的崛起,开源AI领域竞争日趋白热化。通过将实质性技术升级与真正开放的许可协议(告别限制性条款)相结合,谷歌正试图赢得开发者忠诚度,这可能会重塑整个生态系统。

关键要点:

  • 许可解放: Apache 2.0协议为开发者带来真正的商业自由
  • 性能飞跃: 在编程、数学等技术领域表现尤为突出
  • 尺寸包容性: 从智能手机到服务器机架,总有一款Gemma适合
  • 代理就绪: 内置功能大幅减少自动化项目的工作量

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

谷歌Gemma4实现真正开源:这对开发者意味着什么
News

谷歌Gemma4实现真正开源:这对开发者意味着什么

谷歌对其最新AI模型Gemma4采取了大胆举措,采用Apache 2.0许可证为开发者提供前所未有的自由。这标志着其从以往限制性政策的重大转变,允许商业使用和修改而无需担心法律障碍。新模型不仅性能提升,还能与现有开发者工具无缝集成,有望为小型公司在AI竞赛中创造公平竞争环境。

April 3, 2026
Gemma4开源AI谷歌
News

美团LongCat-Next模糊了视觉、听觉与理解的界限

美团研究团队发布突破性AI模型LongCat-Next,将视觉、语音和文本作为平等信息处理。与传统系统以语言为核心不同,该技术将所有感官输入转换为AI原生理解的通用'语言'。早期测试展现出惊人能力——从比专业工具更精准阅读复杂文档,到用类人推理解决视觉数学问题。开源发布或将加速开发能更自然与现实交互的AI。

April 3, 2026
AI创新多模态学习计算机视觉
谷歌Gemma4 AI模型开源,展现卓越能力
News

谷歌Gemma4 AI模型开源,展现卓越能力

谷歌发布了最新开源AI模型系列Gemma4,包含四个具有突破性能力的变体。该系列包括适用于边缘设备的高效E2B和E4B模型,以及跻身全球顶级开源模型之列的强大26B MoE和31B密集版本。Gemma4的特别之处在于支持图像、视频甚至实时语音处理,同时非常便于本地部署。

April 3, 2026
Gemma4OpenSourceAIGoogleAI
蚂蚁森林发布2.7TB超大深度数据集,助力AI视觉研究
News

蚂蚁森林发布2.7TB超大深度数据集,助力AI视觉研究

蚂蚁灵波科技发布了一项改变游戏规则的开源数据集,用于计算机视觉研究。LingBot-Depth-Dataset包含300万组样本对——其中200万来自真实世界拍摄——涵盖六款主流深度相机。这一空间感知数据的宝库或将彻底改变AI系统理解3D环境的方式,其应用范围从机器人技术到增强现实均具有潜力。

March 31, 2026
计算机视觉AI数据集深度传感
通义实验室新AI工具让好莱坞级配音触手可及
News

通义实验室新AI工具让好莱坞级配音触手可及

通义实验室发布了开创性的开源工具Fun-CineForge,解决了AI配音领域最棘手的难题——真实的多角色对话。与传统文本转语音模型不同,这套电影级系统能实现声画同步、保持角色音色一致并传递情感深度。其秘诀在于创新的四模态融合架构和高质量的CineDub数据集。早期测试表明该工具性能超越现有解决方案,标志着视频本地化和内容创作领域的重大突破。

March 16, 2026
AI配音语音技术开源AI
News

Hume AI的TADA为手机带来闪电般快速且无幻觉的语音技术

Hume AI发布了突破性的文本转语音系统TADA,该系统能在移动设备上高效运行。与传统模型不同,它在提供比传统快五倍的音频同时消除了内容幻觉现象。真正让它脱颖而出的是什么?它能生成长达700秒的音频片段并同步提供实时转录——无需额外处理。早期测试显示其在音质方面也优于更大的模型。

March 12, 2026
AI语音合成移动技术开源AI