跳转至

Token 缓存与成本优化

Gemini CLI 在使用 API 密钥认证(Gemini API key 或 Vertex AI)时,会自动通过 token 缓存来优化 API 成本。该功能会复用之前的系统指令和上下文,从而减少后续请求中需要处理的 token 数量。

支持 token 缓存的场景:

  • API 密钥用户(Gemini API key)
  • Vertex AI 用户(已设置项目与位置)

不支持 token 缓存的场景:

  • OAuth 用户(Google 个人/企业账户) - 当前 Code Assist API 暂不支持缓存内容创建

您可以使用 /stats 命令查看 token 使用情况和缓存的 token 节省量。当有可用的缓存 token 时,它们会显示在统计信息输出中。