谷歌推出灵活新方案,全面调整Gemini API定价策略
谷歌以用户友好型方案革新Gemini API定价
为了让开发者更好地掌控AI成本,谷歌彻底重新设计了Gemini API的定价结构。新模式推出了五个明确定义的服务层级,每个层级都针对特定的性能和预算需求。
为各类需求量身定制解决方案
标准层级仍是基础选项,适合常规推理任务。但真正改变游戏规则的是这些新的专业级服务:
- 灵活层级:非常适合非紧急任务,该选项通过利用谷歌在非高峰时段的闲置计算能力,将成本削减一半。代价是什么?响应时间可能延长至15分钟。
- 批量层级:同样提供50%的成本节省,该解决方案可处理大规模数据任务,最长周转时间达24小时——非常适合夜间处理或分析工作负载。
- 缓存层级:基于存储的token而非处理时间计费,对于像聊天机器人这样需要重复访问复杂指令的应用来说非常经济实惠。
当速度至关重要时
对于每毫秒都至关重要的关键任务应用,优先层级可提供极速响应时间。虽然价格比标准费率高出75-100%,但该选项能确保近乎即时的结果——这对实时客服机器人或欺诈检测系统至关重要。
"我们正在为开发者提供优化性能和预算的工具,"一位谷歌发言人解释道,"无论您是精打细算的初创公司还是需要实时响应的企业,现在都有适合的方案。"
关键要点:
- 节省成本的选项:灵活和批量层级为非时效性工作提供显著折扣(50%)
- 实时能力:优先层级在速度关键时保证毫秒级响应
- 存储解决方案:缓存层为重复查询和文档分析提供经济实惠的定价
