谷歌更新Gemini API定价,推出五档推理服务

2026-04-03 15:58:00

2026年4月3日,谷歌宣布更新Gemini API计费模式,推出标准、弹性、优先、批量和缓存五档推理服务。新方案按实际推理使用分档计费:弹性与批量档享五折优惠,延迟分别为1–15分钟和最长24小时;缓存档按缓存Token数与时长计费;优先档溢价75%–100%,延迟控制在毫秒至秒级,适用于实时客服、欺诈检测等关键场景。调整旨在匹配差异化性能与成本需求。