谷歌(GOOGL.US)更新Gemini API定价 按推理使用分档计费

据官网APP消息,谷歌S更谷歌(GOOGL.US)近期对Gemini API的定价档计计费架构进行了调整,优化方案与定价基于实际推理使用需求制定。按推

新增加的理使推理服务档位包括:标准(Standard)、弹性(Flex)、用分优先(Priority)、谷歌S更批量(Batch)和缓存(Caching)版。定价档计

谷歌表示:“Gemini API提供多种优化机制,按推可以根据业务负载需求,理使在运行速度、用分使用成本与服务稳定性之间找到平衡。谷歌S更无论是定价档计实时对话机器人还是大型离线数据处理,选择适合的按推运行模式能有效降低成本或提升效率。”

其中,理使弹性推理档位通过使用非高峰时段的用分闲置算力,提供标准价格五折优惠,目标延迟为1至15分钟,但不保证延迟。批量API档位同样提供五折优惠,最长期限延迟可达24小时。

缓存档位的计费依据是缓存词元(Token)数量与存储时长,适合用于复杂系统指令的对话机器人、长视频文件重复分析以及大规模文档集查询等应用场合。

优先档位的定价比标准价格高出75%至100%,延迟可以控制在毫秒至秒级。谷歌建议该档位适合用于实时客服聊天机器人、实时欺诈检测及关键业务智能助手等场景。

分享到:
收藏