AI 工具

一条命令编译知识库:Claude Code 增量编译实战

2026-04-08 · myster

一条命令编译知识库:Claude Code 增量编译实战

之前写过一篇搭建 Karpathy 式个人知识库的文章,讲了三层架构(raw → wiki → outputs)的设计。今天聊实际使用——知识库积累了新资料之后,怎么用一条命令完成”编译”。

什么是知识编译

简单说:你往 raw/ 目录扔文章,Claude Code 帮你干剩下的事——

  1. 扫描 raw/ 找出新增资料
  2. 对比索引,确认哪些还没编译
  3. 读原文,生成结构化摘要
  4. 从摘要中提取概念,新的建条目,旧的追加证据
  5. 更新索引,建立交叉链接

整个过程就像代码编译:源码(raw)→ 编译器(Claude Code)→ 产物(wiki)。增量的,只处理新的。

实际操作

我的 raw/articles/ 里积累了两篇新文章:

  • 一篇是 GStack 的深度拆解——YC CEO Garry Tan 开源的 23 角色 AI 编程工作流
  • 一篇是 Mac 必装软件清单——17 个品类的实用推荐

在 Claude Code 里敲一条命令:

/compile

没了。就这一条。

编译过程拆解

Claude Code 会自动做这几件事:

第一步:扫描和对比

raw/articles/raw/podcasts/raw/papers/ 下所有 .md 文件,然后读 wiki/indexes/All-Sources.md 索引,对比出哪些是新的。

我的索引里已有 2 篇标记为 ✅,新的 2 篇不在索引里,所以它们会被编译。

第二步:生成摘要

对每篇原文,生成一份结构化摘要到 wiki/summaries/,包含:

## 核心结论     # 3-6 条,提炼原文最重要的观点
## 关键证据     # 支撑结论的数据和事实
## 术语         # 英文原文 + 中文解释的术语表
## 疑点与待验证  # 存疑的点,留给未来验证
## 提取的概念    # 指向 wiki/concepts/ 的链接

比如 GStack 那篇,核心结论提炼出了”AI 编程从助手模式进化到团队模式”、“Sprint 流程是核心价值”这些点。不是原文复述,是真的在做信息压缩和结构化。

第三步:提取概念

从摘要中识别出独立的概念,每个概念一个文件,存到 wiki/concepts/。这次编译提取了 6 个新概念:

概念来源
AI Agent 团队模式GStack 文章
Sprint 自动化流程GStack 文章
AI 浏览器测试GStack 文章
交叉模型审查GStack 文章
Mac 开发环境Mac 清单文章
Homebrew 软件管理Mac 清单文章

每个概念条目包含定义、关键要点、证据来源、相关概念四个部分。如果未来有新文章也提到了同一个概念,编译时会追加新证据到已有条目,而不是重复建文件。

第四步:更新索引和交叉链接

  • All-Sources.md 新增 2 条记录,标记 ✅
  • All-Concepts.md 新增”AI 编程范式”和”开发环境”两个分类,共 6 个条目
  • 摘要 ↔ 原文、概念 ↔ 摘要、概念 ↔ 概念之间全部建了 [[wikilinks]]

编译前后对比

编译前:
  raw/articles/     4 篇(2 已编译,2 新增)
  wiki/summaries/   2 篇
  wiki/concepts/    9 个
  
编译后:
  raw/articles/     4 篇(全部已编译)
  wiki/summaries/   4 篇  (+2)
  wiki/concepts/    15 个 (+6)

在 Obsidian 的图谱视图里,你能明显看到新的概念节点和连线——知识网络在自动生长。

这套流程的关键设计

增量而非全量。只处理新增资料,不重新编译已有的。知识库越大越省时间。

可追溯。每个摘要 link 回原文,每个概念列出所有来源。随时能从一个概念追溯到最初的文章原文。

概念原子化。一个概念一个文件,不混在一起。“AI 浏览器测试”和”Sprint 自动化流程”是两个独立概念,虽然来自同一篇文章,但它们各自有独立的定义和证据链。

交叉链接。概念之间互相引用。“AI Agent 团队模式”的相关概念里列了”Sprint 自动化流程”和”AI 浏览器测试”。知识不是孤岛,是网络。

日常使用节奏

我现在的习惯是:

  1. 看到好文章,用 /ingest <url> 扔进 raw/
  2. 积累了几篇,跑一次 /compile
  3. 在 Obsidian 里浏览新生成的摘要和概念
  4. 偶尔用 /health 检查知识库的一致性

不需要手动整理笔记,不需要给文章打标签分类,不需要自己写摘要。Claude Code 当编译器,Obsidian 当 IDE,人只负责选择输入什么。

总结

知识库编译这件事,核心就是三层分离 + 增量处理 + 自动链接。把 Claude Code 的 slash command 定义好,日常操作就是 /ingest/compile 两条命令的事。

知识库像代码仓库一样,越用越有价值。下一步准备试试定期自动编译——比如用 cron 每天扫一次 raw/,有新资料就自动跑编译。

M

关于作者

专注于内容创作、产品策略与设计实践。欢迎交流合作。

← 上一篇 下一篇 →