成本与优化

如何在控制 Token 消耗和成本的同时，从 Claude Code 中获取最大价值。

模型选择决策流程

并非所有任务都需要最强大的模型。为正确的任务选择正确的模型，可以在不牺牲质量的前提下将成本降低 5-10 倍。

此图表假设预算不受限制（Max/API）。 对于预算较紧的套餐（Pro、Teams Standard），请应用下面的预算修正器。

定价：显示的是相对费用——请在 anthropic.com/pricing 查看当前价格。

预算修正器 — 对于预算受限的套餐，每个阶段降低一档：

套餐	规划阶段	实现阶段
Max / API 不受限（xhigh）	Opus 4.7	Sonnet
Max / API 不受限	Opus 4.6	Sonnet
Pro / Teams Standard	Sonnet	Haiku（机械性任务）
API 紧张预算	Sonnet	Haiku

社区模式（Teams Standard $25/月）：Sonnet 用于规划 → Haiku 用于实现。机械性任务以极低成本获得相同质量输出。

ASCII 版本

Plain

任务复杂度？
├─ 简单（拼写、格式、重命名） → Haiku 4.5       ($  — ~比 Sonnet 便宜 5 倍)
├─ 标准（功能、Bug）          → Sonnet 4.5/4.6  ($ — 最佳性价比)
└─ 复杂（架构、安全）
   ├─ 需要深度推理？           → Opus 4.7 (xhigh) / Opus 4.6  ($$ — ~比 Sonnet 贵 5 倍)
   └─ 只是量大/清晰？          → Sonnet 4.6                    ($$ — 胜任)

预算修正器（预算受限套餐降一档）：
  Max/API (xhigh)  → Opus 4.7 规划，Sonnet 实现
  Max/API          → Opus 4.6 规划，Sonnet 实现
  Pro/Teams        → Sonnet 规划，Haiku 实现（机械性任务）

来源：「模型选择」 — 第 ~2634 行

成本优化决策树

Token 成本高通常是可以修复的。这个系统化的决策树找出根本原因，并为每种浪费模式指出正确的解决方法。

ASCII 版本

Plain

成本过高？
├─ 上下文太大？      → /compact 或新会话          （节省 40-60%）
├─ 响应过于冗长？    → CLAUDE.md：简洁             （节省 20-30%）
├─ 反复解释上下文？  → 移入 CLAUDE.md              （节省 15-25%）
├─ 使用了错误模型？  → 简单任务使用 Haiku          （节省 50-90%）
├─ MCP 输出噪音大？  → 过滤工具输出               （节省 10-20%）
└─ 以上都不是？      → 基础成本，在可接受范围

思考力度调节器 — /effort xlow/low/default/high/xhigh（v2.1.111）让你可以按任务调节思考深度。思考力度越低 = 消耗的 Token 越少。与模型选择结合使用，可进行精细的成本控制。

来源：「成本优化」 — 第 ~8878 行

订阅套餐 — 各套餐解锁内容

不同套餐解锁不同的 Claude Code 能力。了解限制有助于你规划使用并为升级提供依据。

ASCII 版本

Plain

免费         Pro ($20)          Max ($100-200)     团队/企业
────         ─────────          ──────────────     ───────────────
仅网页端     CLI ✓              CLI ✓              按席位定价
消息数有限   有限用量           5-20 倍用量        管理员控制
无 CLI       个人使用           并行 ✓             用量分析
             无并行             优先 ✓             SSO + 合规

来源：「订阅套餐」 — 第 ~1933 行

Token 减少策略流水线

多种策略叠加可累计节省 Token。按从高影响到低成本的顺序依次应用。

ASCII 版本

Plain

100% 基准
    │
RTK 代理（CLI 输出压缩）         → CLI 操作节省 60-90%
    │
/compact（对话摘要）              → 检查点节省 40-60%
    │
CLAUDE.md（避免重复上下文）       → 每次会话节省 15-25%
    │
模型选择（简单任务用 Haiku）      → 简单任务节省 50-90%
    │
典型用法约 10-20% 基准用量

跟踪用量 — 使用 /usage 监控 Token 消耗和成本（自 v2.1.118 起替代 /cost；/cost 仍作为别名有效）。

来源：「Token 优化」 — 第 ~13355 行

来源：飞书 · AI Spark 知识库｜原文（最新版）：https://lcnniolukk80.feishu.cn/wiki/IR8QwvDfUiJMjhktqiTcttr3nzf ｜归档：2026-06-04

普通人如何开始用 AI

新手避坑清单

新手学习路径

自媒体人 AI 入门路径：从选题到复盘的完整工作流

AI 基础概念

工具避坑与选型

工具测评

AI 工具教程

智能体入门

智能体应用案例

AI 编程案例

AI 编程工具

Claude Code 深度全解

底层原理精讲

可视化图解

零到精通：七步上手路径

企业级安全与治理

生态与工具链全景

实战工作流手册

自媒体教程专区

AI 图像与视觉创作

办公效率

个人工具箱与环境配置

知识管理

AI 编程趋势

成本与优化

模型选择决策流程

成本优化决策树

订阅套餐 — 各套餐解锁内容

Token 减少策略流水线

相关文章

自媒体人 AI 入门路径：从选题到复盘的完整工作流

Claude Code 深度全解

底层原理精讲

可视化图解

零到精通：七步上手路径

企业级安全与治理

生态与工具链全景

实战工作流手册

成本与优化 ​

模型选择决策流程 ​

成本优化决策树 ​

订阅套餐 — 各套餐解锁内容 ​

Token 减少策略流水线 ​

相关文章 ​

成本与优化

模型选择决策流程

成本优化决策树

订阅套餐 — 各套餐解锁内容

Token 减少策略流水线

相关文章