Claude Code 为什么越用越贵？这 12 个习惯能帮你少烧 Token

用过 Claude Code 的人都知道，Token 就是钱。每一次对话、每一次文件读取、每一次上下文传递，都在消耗你的额度。

很多人刚上手时觉得"怎么这么快就用完了"，其实不是工具贵，而是用法有问题。

今天分享 12 条经过实战验证的省 Token 技巧，按影响力从高到低排列，帮你用更少的消耗，完成更多的事。

第一梯队：上下文管理（影响最大）

1. 新任务开新 Session

这是最重要的一条。

当你完成一个任务，准备开始下一个完全不同的任务时，不要在同一个 Session 里继续。因为之前所有的对话历史都会作为上下文被带入，即使跟新任务毫无关系。

一个累积了几十轮对话的 Session，每次新请求都在为那些无关内容买单。

具体操作： 在 Claude Code 中输入 /clear 命令即可清除当前对话，开启全新 Session：

Plain

/clear

也可以直接在终端中退出后重新运行 claude 命令来启动新会话。

干净的上下文 = 更少的 Token 消耗 + 更精准的回答。

2. 主动压缩上下文

对话进行到一定程度后，上下文会变得越来越长。很多早期的对话内容已经没用了，但它们仍然占着 Token。

正确做法： 使用 /compact 命令主动压缩上下文。Claude 会总结之前的对话要点，丢弃冗余内容，大幅减少后续每次请求的 Token 消耗。

具体操作： 直接在输入框中输入：

Plain

/compact

你还可以在后面加上提示词，告诉 Claude 压缩时重点保留什么：

Plain

/compact 保留关于数据库迁移的所有讨论细节

此外，你也可以在 /config 中配置自动压缩，当上下文超过一定比例时让 Claude 自动执行。

两个关键时机一定要压缩：

对话变长时 —— 感觉聊了很多轮了，主动压缩一次
长时间离开前 —— 午饭、开会、下班前，先 /compact 一下。回来时起点就是精简过的上下文，而不是几个小时前的臃肿历史

3. 多个问题合并成一条消息

很多人习惯想到什么问什么，一条一条地发。但每条消息都会带上完整的上下文历史，意味着你发得越多，重复传递的内容就越多。

正确做法： 把相关的问题整理好，一次性发出去。在 Claude Code 输入框中按 Shift + Enter 可以换行，方便你组织多行内容。比如：

帮我做三件事：修复 login 页面的样式问题给 API 接口加上错误处理更新 README 中的部署说明

一条消息解决三个问题，比分三次问节省大量 Token。

第二梯队：工作方式（避免返工浪费）

4. 写清楚 Prompt，一次说明白

这是大多数人最大的 Token 浪费来源，却最容易被忽略。

模糊的指令会导致 Claude 猜你的意思——猜错了你纠正，纠正又带来新的上下文……几个来回下来，Token 消耗翻倍，事情还没做对。

反面教材：

帮我改一下那个页面

Claude 不知道哪个页面、改什么、改成什么样。它只能猜，猜错概率极大。

正确做法： 一次性说清楚背景、目标和约束：

帮我修改 @src/pages/UserProfile.tsx，把用户头像从方形改为圆形，使用 TailwindCSS 的 rounded-full 类，不要改动其他样式

指令越精准，Claude 一次做对的概率越高，后续纠正的 Token 消耗就越少。

5. 复杂任务先用 Plan

面对一个复杂需求，很多人上来就让 Claude 开干。结果方向不对，改来改去，Token 刷刷地烧。

正确做法： 先让 Claude 制定一个计划（Plan），确认方向和步骤没问题后再动手实现。

具体操作： 按 Shift + Tab 可以在输入框中切换到 Plan 模式（你会看到输入框提示变为 “Plan mode”）。在 Plan 模式下，Claude 只会思考和规划，不会直接修改代码。

你也可以直接用自然语言要求 Claude 先做计划：

先帮我规划一下这个功能的实现方案，列出步骤，不要写代码。

确认计划没问题后，再按 Shift + Tab 切回正常模式让 Claude 执行。

Plan 阶段消耗的 Token 很少，但能帮你避免后面大量的返工浪费。

想清楚再动手，永远比边做边改更省。

6. 出错不纠正，编辑原消息

Claude 回答不满意怎么办？很多人会接着发一条"不对，我的意思是……"。

这样做的问题是：之前那条错误的回复也会留在上下文里，白白浪费 Token。

正确做法： 直接编辑你原来的消息，重新表述清楚。这样 Claude 会基于修改后的消息重新生成，不会保留之前的错误回复。

具体操作： 在对话中，按 ↑ 方向键可以快速调出上一条消息进行编辑。修改后回车发送，Claude 会丢弃之前的错误回复，基于新消息重新生成。

第三梯队：操作技巧（积少成多）

7. 引用文件时 @文件名指定路径

不要跟 Claude 说"看一下那个组件文件"或者"我有个 utils 文件"。这种模糊描述会逼 Claude 去猜、去搜索，搜索本身就消耗大量 Token。

正确做法： 用 @ 直接指定文件路径。Claude 直接读取目标文件，省去搜索的开销。

具体操作： 在输入框中使用 @ 加文件路径即可引用：

Plain

帮我优化 @src/components/Header.tsx 中的渲染性能

你也可以输入 @ 后按 Tab 键触发文件路径自动补全，快速定位目标文件。

8. 临时提问用 /btw

写代码写到一半，突然有个不相关的小问题想问？

如果直接问，这个问题和回答都会进入上下文，污染后续的代码任务。

正确做法： 使用 /btw 命令。它会在不影响当前对话上下文的情况下处理你的临时提问，问完就丢，干干净净。

具体操作： 在输入框中直接输入：

Plain

/btw JavaScript 中 map 和 flatMap 有什么区别？

回答完毕后，这段问答不会被计入主对话的上下文。

9. 控制输出长度，别让 Claude 写废话

Claude 默认会给你详细的解释、注释、甚至使用示例。但输出 Token 也是要花钱的。

如果你只需要代码，那些解释就是在烧钱。

正确做法： 在 Prompt 中明确告诉 Claude 你要什么、不要什么：

Plain

只给代码，不要解释

Plain

用 diff 格式输出改动，不要输出完整文件

Plain

简要回答，不超过三句话

养成这个习惯后，每次对话都能省下不少输出 Token。

10. 用 --resume 恢复会话，别从头再来

中途关了终端，或者第二天想继续昨天的任务？很多人会开一个新 Session，然后把背景重新说一遍。

这等于从零开始重建上下文，极其浪费。

正确做法： 使用 --resume 参数恢复上一次会话：

Plain

claude --resume

如果你想恢复特定的历史会话，可以用：

Plain

claude --resume <session-id>

Claude 会加载之前的对话记录继续工作，不需要重新解释背景。

第四梯队：配置优化（一劳永逸）

11. 精简 CLAUDE.md 配置

CLAUDE.md 是 Claude Code 的系统提示文件，每次对话都会被加载到上下文中。

如果你往里面塞了大量的规则、偏好、示例代码，每一次对话都在为这些内容买单。

文件位置： CLAUDE.md 存在于两个层级：

全局配置： ~/.claude/CLAUDE.md —— 对所有项目生效
项目配置： 项目根目录下的 CLAUDE.md 或 .claude/CLAUDE.md —— 仅对当前项目生效

正确做法：

只保留真正必要的配置
删除冗余的示例和说明
定期审视和精简
项目专属的规则放项目级配置，不要全塞到全局配置里

你可以用以下命令快速查看当前生效的配置文件大小：

Plain

wc -c ~/.claude/CLAUDE.md
wc -c ./CLAUDE.md

你的 CLAUDE.md 每精简一行，就是每次对话都省一点。日积月累，差距巨大。

12. 配置状态栏，让上下文消耗可见

你不知道自己花了多少，就不可能真正省下来。

Claude Code 支持通过 /statusline 自定义状态栏。把上下文占用、Token 消耗或当前成本显示在状态栏里，你就能随时看到这次会话是不是已经变得太重。

具体操作： 在 Claude Code 中输入：

Plain

/statusline

然后按提示配置你想显示的信息，比如当前模型、上下文占用、Token 使用情况或成本信息。配置好之后，每次对话时状态栏都会持续显示这些信息，让你更容易判断什么时候该 /compact，什么时候该 /clear 开新会话。

看得见，才管得住。

写在最后

这 12 条技巧的核心思想其实就一句话：减少不必要的上下文传递。

Token 的消耗本质上就是信息的传递量。你传得越精准、越干净，消耗就越少，效果反而越好。

按影响力总结一下：

最重要： 新 Session、压缩上下文、合并消息——管住上下文大小
次重要： 写清楚 Prompt、先 Plan、编辑原消息——减少返工浪费
锦上添花： @文件、/btw、控制输出、–resume——细节处积少成多
一劳永逸： 精简配置、开启状态栏——设置一次，长期受益

省 Token 不是抠门，是高效。

把这些习惯养成，你会发现同样的额度能做多得多的事。

觉得有用？分享给你身边也在用 Claude Code 的朋友，帮他们也省一笔。

你有自己的省 Token 妙招？欢迎在评论区分享，一起把效率拉满。

文章同步公众号：雨哥聊AI

来源：飞书 · AI Spark 知识库｜原文（最新版）：https://lcnniolukk80.feishu.cn/wiki/LMnywcVMIikF6qkwFENccRRVnLI ｜归档：2026-06-04

普通人如何开始用 AI

新手避坑清单

新手学习路径

自媒体人 AI 入门路径：从选题到复盘的完整工作流

AI 基础概念

工具避坑与选型

工具测评

AI 工具教程

智能体入门

智能体应用案例

AI 编程案例

AI 编程工具

Claude Code 深度全解

底层原理精讲

可视化图解

零到精通：七步上手路径

企业级安全与治理

生态与工具链全景

实战工作流手册

自媒体教程专区

AI 图像与视觉创作

办公效率

个人工具箱与环境配置

知识管理

AI 编程趋势

Claude Code 为什么越用越贵？这 12 个习惯能帮你少烧 Token

第一梯队：上下文管理（影响最大）

第二梯队：工作方式（避免返工浪费）

第三梯队：操作技巧（积少成多）

第四梯队：配置优化（一劳永逸）

写在最后

自媒体人 AI 入门路径：从选题到复盘的完整工作流

Claude Code 深度全解

底层原理精讲

可视化图解

零到精通：七步上手路径

企业级安全与治理

生态与工具链全景

实战工作流手册

Claude Code 为什么越用越贵？这 12 个习惯能帮你少烧 Token ​

第一梯队：上下文管理（影响最大） ​

第二梯队：工作方式（避免返工浪费） ​

第三梯队：操作技巧（积少成多） ​

第四梯队：配置优化（一劳永逸） ​

写在最后 ​

Claude Code 为什么越用越贵？这 12 个习惯能帮你少烧 Token

第一梯队：上下文管理（影响最大）

第二梯队：工作方式（避免返工浪费）

第三梯队：操作技巧（积少成多）

第四梯队：配置优化（一劳永逸）

写在最后