Token 缓存与成本优化
Gemini CLI 在使用 API 密钥认证(Gemini API key 或 Vertex AI)时,会自动通过 token 缓存来优化 API 成本。该功能会复用之前的系统指令和上下文,从而减少后续请求中需要处理的 token 数量。
支持 token 缓存的场景:
- API 密钥用户(Gemini API key)
- Vertex AI 用户(已设置项目与位置)
不支持 token 缓存的场景:
- OAuth 用户(Google 个人/企业账户) - 当前 Code Assist API 暂不支持缓存内容创建
您可以使用 /stats
命令查看 token 使用情况和缓存的 token 节省量。当有可用的缓存 token 时,它们会显示在统计信息输出中。