外观
认知模式切换
阅读时间:约 10 分钟前置条件:Claude Code Skills(技能模块)基础、计划模式相关:「计划流水线」、「计划驱动开发」
TL;DR
一个通用助手会将所有阶段混在一起。这个模式为每个阶段提供独特的认知模式:你为手头的工作召唤合适的大脑,当工作性质改变时切换。
Plain
/plan-ceo-review → 「我们在构建正确的东西吗?」
/plan-eng-review → 「我们如何让这个可实现?」
/review → 「什么会在生产中炸掉?」
/ship → 执行发布,不再争论
/browse → 它在浏览器中实际能用吗?
/retro → 这周我们交付得怎么样?洞察在于:规划、审查和交付需要根本不同的认知姿态——一个处于通用模式的单一助手会把它们混淆得很糟糕。
六个档位
| 命令 | 角色 | 核心问题 | 何时切换 |
|---|---|---|---|
/plan-ceo-review | 创始人 / CEO | 「我们在构建正确的东西吗?」 | 写任何代码之前 |
/plan-eng-review | 工程经理 / 技术负责人 | 「我们如何让这个可实现?」 | 方向锁定后 |
/review | 偏执的资深工程师 | 「还有什么可能在生产中崩溃?」 | 合并之前 |
/ship | 发布工程师 | 「让飞机着陆」 | 分支就绪,不再争论 |
/browse | QA 工程师 | 「它实际上能用吗?」 | 部署后,针对 staging 或 prod |
/retro | 工程经理 | 「我们交付得怎么样?」 | 每周或发布后 |
填补的空缺:实现前的战略门控
AI 编程助手最难做对的事不是实现。而是在此之前的问题:我们在构建正确的东西吗?
Claude Code 被优化为构建你要求的东西。如果你说「添加照片上传」,它就会添加照片上传。它不会问照片上传是否真的是产品需要的。这就是 /plan-ceo-review 要解决的问题。
示例:你在构建一个类 Craigslist 的挂牌应用。
- 请求:「让卖家为商品上传照片」
- 字面实现:文件选择器 + 图片保存
- 真实产品是什么:帮助卖家创建真正能卖出去的挂牌
如果你先运行 /plan-ceo-review,助手会被明确要求挑战字面请求,找出其中隐藏的产品。输出变成了完全不同的简报:从照片自动识别产品、拉取规格和定价对比、起草标题和描述、建议主图、在上线前检测低质量照片。
这是一个不同的功能。更好的功能。而你只有通过在实现开始前插入一个明确的门控才能得到它。
/plan-ceo-review 内部的三种模式:
- 扩展范围 — 寻找 10 星产品,问「付出 2 倍的努力,什么能让这个好 10 倍?」
- 保持范围 — 接受方向,让计划无懈可击
- 缩减范围 — 无情地精简到最小可行版本
用户选择模式。助手承诺并不偏离。
/plan-eng-review:让想法变得可构建
一旦方向锁定,认知模式从产品直觉转向工程严谨。/plan-eng-review 是理想化停止、架构开始的地方。
应产生的内容:
- 架构图(组件、边界、数据流)
- 核心流程的状态机
- 同步 vs 异步边界决策
- 失败模式和重试逻辑
- 信任边界(你在哪里接受外部输入?)
- 测试矩阵
关键突破是强制生成图表。图表能发现散文掩盖的隐藏假设。时序图让你明确谁调用什么。状态机让你枚举每一个失败模式。没有它们,「系统会处理它」会无限期地保持模糊。
/review:偏执资深工程师模式
通过测试并不意味着分支是安全的。/review 针对的是那类通过 CI 却仍然影响生产的 bug。
它检查什么:
- N+1 查询
- 竞态条件(两个标签页覆盖相同状态)
- 信任边界违规(接受客户端提供的元数据而不验证)
- 失败路径上的孤立数据
- 缺失索引
- 糟糕的重试逻辑
- 通过了但遗漏真实失败模式的测试
- LLM 输出流入后续处理时的提示注入
这种姿态是刻意的:在生产事故发生之前想象它。
/browse:非 MCP 原生浏览器自动化
/browse 是 gstack 中技术上最独特的部分。它不是 MCP 服务器。它是一个编译的原生二进制文件(TypeScript + Bun),运行一个持久的无头 Chromium 守护进程。
为什么架构很重要:
| 方案 | 冷启动 | 后续调用 | 状态持久性 |
|---|---|---|---|
| MCP 浏览器服务器 | 每次会话新建连接 | ~500ms+ | 会话间丢失 |
/browse 原生守护进程 | ~3 秒(一次) | ~100-200ms | Cookie、标签页、认证持久保存 |
这对 QA 工作流很重要:登录 staging 环境一次,然后运行完整的导航序列,因为守护进程不会重启所以速度很快。没有 MCP socket 开销,没有会话重置。
可用操作:导航、读取页面文本、截图、快照带引用的无障碍树、按引用点击/填充、运行 JavaScript、检查控制台日志、捕获网络请求。
何时优先选择此方案而非 MCP 浏览器工具:
- 延迟敏感的 QA 循环(顺序检查 10+ 个页面)
- 限制 MCP 服务器连接的环境
- 需要浏览器状态(认证、Cookie)在一次会话的多个命令中持久保存时
何时坚持用 MCP:单页检查、更简单的环境,或 MCP 浏览器工具已就位时。
完整周期演示
Plain
# 1. 战略门控——挑战简报
[计划模式]
你:我想为挂牌应用添加卖家照片上传。
卖家应该能上传照片,我们从中创建挂牌。
你:/plan-ceo-review (选择扩展范围模式)
Claude:「照片上传」不是功能。真正的工作是帮助卖家
创建实际能卖出去的挂牌。以下是 10 星版本:
自动识别产品,从网络获取规格和定价对比,
起草标题和描述,建议最佳主图……
# 2. 工程门控——锁定架构
你:/plan-eng-review
Claude:[架构图、异步任务边界、上传 → 分类 → 丰富 → 草稿
流水线的状态机、失败模式、信任边界、测试矩阵]
# 3. 实现计划
[退出计划模式,编写代码]
# 4. 偏执审查——找出测试遗漏的问题
你:/review
Claude:竞态条件:两个标签页可能覆盖封面图片选择。
信任边界:将网络数据拉入草稿生成产生提示注入向量。
缺失:失败上传的孤立清理。
你:[修复问题]
# 5. 发布
你:/ship
Claude:[同步主分支,运行测试,推送分支,开启 PR——完成]
# 6. 针对 staging 的浏览器 QA
你:/browse staging.myapp.com——测试挂牌流程
Claude:[导航路由,填写上传表单,验证丰富结果渲染,
检查控制台错误,每步截图]
所有页面正常加载。挂牌流程端到端正常运行。安装
Bash
# 全局安装(~/.claude/skills/)
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack && ./setup或将以下内容直接粘贴到 Claude Code,它会处理其余的:
Install gstack: run
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
对于团队安装(提交到仓库,队友 git clone 即可使用),参见 gstack README。
注意(2026 年 3 月):gstack 于 2026 年 3 月 11 日发布。模式很扎实;实现是新的。在生产工作流中采用之前,请验证仓库是否在积极维护。
何时使用此工作流 vs 其他工作流
| 情况 | 此工作流 | 替代方案 |
|---|---|---|
| 复杂功能,方向不确定 | 先 /plan-ceo-review | 「规格优先」 |
| 方向明确,架构复杂 | /plan-eng-review | 「计划流水线」 |
| 需要独立验证计划 | 「计划流水线」 /plan-validate | — |
| 浏览器自动化,单页检查 | 任何 MCP 浏览器工具 | /browse(过杀) |
| 浏览器自动化,多步 QA 循环 | /browse | MCP 工具(更慢) |
| 需要结构化 ADR 学习循环 | 「计划流水线」 | — |
与「计划流水线」的主要区别:gstack 是你手动控制的线性档位序列。计划流水线是带有 ADR 记忆和并行智能体团队的更自动化编排。对于想要明确控制每个阶段的单独开发者,gstack 采用起来更快。
延伸阅读
- 「计划流水线」 — 带 ADR 学习循环的自动化三命令工作流
- 「计划驱动开发」 — 编码前规划的基础
- 「迭代优化」 — 质量改进循环
- gstack on GitHub — 源码、安装说明、完整 Skills(技能模块)提示词
来源:飞书 · AI Spark 知识库 | 原文(最新版):https://lcnniolukk80.feishu.cn/wiki/Tbg2wq2fdivIFxkFQeJcxk56n9e | 归档:2026-06-04