Token 缓存与成本优化

Gemini CLI 在使用 API 密钥认证（Gemini API key 或 Vertex AI）时，会自动通过 token 缓存来优化 API 成本。该功能会复用之前的系统指令和上下文，从而减少后续请求中需要处理的 token 数量。

支持 token 缓存的场景：

不支持 token 缓存的场景：

您可以使用 /stats 命令查看 token 使用情况和缓存的 token 节省量。当有可用的缓存 token 时，它们会显示在统计信息输出中。