gstack - Garry Tan 的 Claude Code 软件工厂
notes/research/github/gstack-2026-03-18.md
Port 8777
---
title: "gstack - Garry Tan 的 Claude Code 软件工厂"
category: "research/github"
source_type: "github"
created_by: "小美虾"
created_at: "2026-03-18T07:56:00+08:00"
status: "draft"
tags:
- claude-code
- ai-agent
- productivity
- garry-tan
- y-combinator
---
# gstack - Garry Tan 的 Claude Code 软件工厂
## 项目信息
- **仓库**: https://github.com/garrytan/gstack
- **作者**: Garry Tan (Y Combinator CEO)
- **许可证**: MIT
- **记录时间**: 2026-03-18
## 核心概念
gstack 是 Garry Tan 的开源软件工厂,将 Claude Code 转变为一个可管理的虚拟工程团队。通过 13 个专家级 slash 命令,实现从产品设计到发布的全流程自动化。
### Garry Tan 的生产力数据
- 过去 60 天:600,000+ 行生产代码(35% 是测试)
- 日均产出:10,000-20,000 行可用代码(兼职时间)
- 最近 7 天 retro:140,751 行新增,362 次 commits
## 13 个专家 Slash 命令
| 命令 | 角色 | 职责 |
|------|------|------|
| `/plan-ceo-review` | CEO/Founder | 重新定义问题,发现 10 星级产品功能,4 种模式(扩展/选择性扩展/保持范围/缩减) |
| `/plan-eng-review` | 工程经理 | 锁定架构、数据流、ASCII 图、边界条件、测试矩阵 |
| `/plan-design-review` | 高级设计师 | 80 项设计审计(字母评分),AI Slop 检测,导出 DESIGN.md |
| `/design-consultation` | 设计合作伙伴 | 从零构建完整设计系统,研究竞品,生成产品 mockup |
| `/review` | 首席工程师 | 发现 CI 通过但生产环境会爆炸的 bug,自动修复明显问题 |
| `/ship` | 发布工程师 | 同步 main、运行测试、覆盖率审计、推送、开 PR |
| `/browse` | QA 工程师 | 给 Agent 眼睛 - 真实 Chromium 浏览器,真实点击和截图 |
| `/qa` | QA 主管 | 测试应用、发现 bug、原子 commit 修复、生成回归测试 |
| `/qa-only` | QA 报告员 | 纯 bug 报告,不修改代码 |
| `/qa-design-review` | 会写代码的设计师 | 设计审计 + 原子 commit 修复,前后对比截图 |
| `/setup-browser-cookies` | 会话管理器 | 从真实浏览器导入 cookies 到 headless 会话 |
| `/retro` | 工程经理 | 团队感知周报复盘,个人分解、交付趋势、测试健康度 |
| `/document-release` | 技术作家 | 更新项目文档以匹配最新发布内容 |
## 工作流程示例
```
用户:我想为卖家添加照片上传功能
用户:/plan-ceo-review
Claude: "照片上传"不是功能本身。真正的工作是帮助卖家创建能卖出的 listing。
如果自动识别产品、从网络拉取规格和竞品、自动起草 listing 呢?
那是 10 星级功能。"上传照片"只是 3 星级。我们构建哪个?
[8 个扩展提案,用户选择 5 个,3 个延后到 backlog]
用户:/plan-design-review
Claude: 设计评分:B | AI Slop 评分:C
"上传流程看起来像默认 Bootstrap 表单"
[80 项审计,推断设计系统,导出 DESIGN.md]
用户:/plan-eng-review
Claude: [ASCII 数据流图]
┌─────────┐ ┌──────────┐ ┌──────────┐ ┌─────────┐
│ Upload │───▶│ Classify │───▶│ Enrich │───▶│ Draft │
│ (sync) │ │ (async) │ │ (async) │ │ (async) │
└─────────┘ └──────────┘ └──────────┘ └─────────┘
[14 个用例测试矩阵,6 个失败模式映射,3 个安全问题]
用户:批准计划,退出计划模式
[Claude 8 分钟内写入 2,400 行代码,跨越 11 个文件]
用户:/review
Claude: [自动修复] 失败上传的 S3 清理孤儿问题
[自动修复] listings.status 缺少索引
[询问] 主图选择的竞态条件 → 用户:yes
[追踪每个新枚举值通过所有 switch 语句]
3 个问题 - 2 个自动修复,1 个已修复
用户:/qa https://staging.myapp.com
Claude: [打开真实浏览器,登录,上传照片,点击流程]
上传 → 分类 → 丰富 → 草稿:端到端 ✓
移动端:✓ | 慢连接:✓ | 坏图片:✓
[发现 bug:预览在第二次上传时不清除 - 已修复]
生成回归测试
用户:/ship
Claude: 测试:42 → 51 (+9 新增)
覆盖率:14/14 代码路径 (100%)
PR: github.com/you/app/pull/42
```
## 关键洞察
1. **设计为核心**: `/design-consultation` 不只是选字体,而是研究竞品、提出安全选择和创意风险、生成真实 mockup、编写 DESIGN.md
2. **QA 是重大突破**: `/qa` 让 Garry 从 6 个并行 worker 提升到 12 个。Agent 能真正"看见"问题并修复
3. **智能审查路由**: 像运作良好的创业公司一样,CEO 不需要看基础设施 bug 修复,设计审查不需要在纯后端任务中运行
4. **AI Slop 检测**: 识别 AI 生成的平庸设计模式(渐变 hero、图标网格、统一圆角)
## 相关资源
- [技能深度文档](https://github.com/garrytan/gstack/blob/main/docs/skills.md)
- [Megatron-SWIFT 文档](https://github.com/modelscope/ms-swift)(之前查询的蒸馏相关项目)
## 个人思考
gstack 代表了 2026 年 3 月 agentic 系统的前沿实践。核心理念不是 copilot,而是**团队**——每个 slash 命令是一个专家角色,共同协作完成从产品构思到发布的完整流程。
Garry 的工作流展示了如何管理 AI 团队:
- 先定义问题(CEO)
- 再锁定架构(工程经理)
- 然后审计设计(设计师)
- 接着实现代码
- 最后审查、QA、发布
这种分层审查机制确保质量,同时保持高速迭代。
---
_笔记由小美虾创建于 2026-03-18 07:56_