用Claude Code实现LLM Wiki

我用Claude Code实现了两个结构化的维基——一个用于在 Medium 上写作,另一个用于使用 SQL、Python 和 Power BI 进行 BI 报告。

用Claude Code实现LLM Wiki
微信 ezpoda免费咨询:AI编程 | AI模型微调| AI私有化部署
AI工具导航 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo

上周末,我偶然发现了 Andrej Karpathy 的一个 gist,描述了他称之为"大语言模型维基"的东西——一种语言模型不只是回答你的问题,而是代表你维护一个活的知识库的模式。我读了它,感到一种安静的认同,心想:我想要这个,用于我每周从事的两个领域。

一小时后,我有了它。两个结构化的维基——一个用于在 Medium 上写作,另一个用于使用 SQL、Python 和 Power BI 进行 BI 报告——完全通过与 Claude Code 的对话构建。

以下是这个模式是什么,为什么重要,以及如何自己构建一个。

1、Karpathy 提出了什么

大语言模型维基模式基于一个简单的架构洞见。我们大多数人使用 AI 的方式都是一样的:问问题,得到答案,关闭标签页。明天,我们问一个稍微不同版本的同样问题。知识从不复合。

Karpathy 的替代方案有三层:

  • 原始源文件 —— 你策划的不可变文档。你读过的文章、有效的代码片段、分析导出、会议笔记。这些进入后永不改变。
  • 维基 —— 大语言模型生成和维护的 Markdown 页面。摘要、模式、交叉引用、工作示例。这是增长的层。
  • 模式 —— 一个配置文档,告诉大语言模型如何行为:命名约定、页面结构、执行什么操作、谁负责什么。

两个支持文件将所有东西联系在一起:一个用于分类发现的 index.md 和一个按时间顺序跟踪每个更改的 log.md

关键的转变是哲学上的。不是每次都从原始文档检索——标准的 RAG 方法——而是大语言模型增量地构建结构化知识。每个新源被编织到现有页面中,交叉引用被更新,矛盾被标记。维基记住,所以你不必记住。

2、为什么这引起了我的共鸣

我写两件事:博客写作(特别是在 Medium 上)和构建 BI 报告。两个领域都有一个令人沮丧的模式——我不断重新发现我已经学到的东西。

Medium 的算法如何权衡阅读比例与点赞?我查过四次。同比最干净的 DAX 模式是什么?我写过它,忘记了 SAMEPERIODLASTYEAR 语法,然后重写了它,次数比我愿意承认的要多。

传统笔记无法解决这个问题。我的笔记变得冗长、混乱,最终被放弃。维护负担的增长速度超过价值——正是 Karpathy 指出的失败模式。

大语言模型维基翻转了维护等式。繁琐的总结、交叉引用和保持一致的工作正是语言模型擅长的。人类负责有趣的部分:选择学习什么、问正确的问题、做出创造性决策。

3、我在一次会话中构建了什么

我打开 Claude Code 并描述了我想要什么。在一次对话中,它为两个领域生成了完整的结构。

3.1 博客写作维基(6 页)

模式定义了维基的范围:内容策略、写作技巧、Medium 特定机制、编辑工作流和分析。每页遵循一致的格式,带有 YAML front-matter、维基风格的交叉链接和源引用。

初始页面涵盖:

  • Medium 平台指南 —— 分发、合作伙伴计划和排名信号实际如何工作
  • 写作结构和钩子 —— 开头模式、正文结构(列表、叙述、问题-解决)、节奏规则
  • Medium SEO 策略 —— 为什么 Medium 的域名权威很重要、页面优化、搜索内容策略
  • 内容构思 —— 创意从何而来、验证清单、支柱-卫星模型
  • 编辑工作流 —— 从构思到发布分析的五阶段管道
  • 声音和语调 —— 晚宴测试、声音属性、按内容类型调整语调

3.2 BI 报告维基(7 页)

这个维基涵盖我每天使用的完整技术栈:用于查询的 SQL、用于处理和自动化的 Python、用于可视化和交付的 Power BI。

初始页面包括:

  • SQL 查询模式 —— CTE、窗口函数、条件聚合、日期轴和要避免的反模式
  • SQL 性能优化 —— EXPLAIN 计划、索引策略、可搜索谓词、物化视图
  • 数据建模:星型模式 —— 事实、维度、日期维度设计、缓慢变化维度
  • 用于 BI 的 Python —— Python 与 SQL 和 Power BI 的配合、pandas 基础、自动化模式
  • Python-SQL 集成 —— SQLAlchemy 连接、参数化查询、Jinja 模板、数据质量测试
  • DAX 基础 —— 度量值与计算列、CALCULATE、时间智能、迭代器函数
  • Power BI 数据建模 —— Vertipaq 优化、Power Query 折叠、行级安全、部署管道

每页都包含工作代码示例。SQL 页面有真实查询。DAX 页面有真实度量值。Python 页面有真实 pandas 转换。这不是抽象文档——这是我可以从中复制的参考资料。

4、维基如何增长

真正的价值不在于初始页面。而在于接下来发生什么。

4.1 摄取

当我读到有用的东西时——关于新的 Medium 算法变化的文章、同事分享的巧妙 DAX 模式、会议演讲中的性能提示——我将其放入 raw/ 文件夹,并要求 Claude Code 摄取它。大语言模型阅读源文件,提取要点,并更新相关维基页面。新概念获得新页面。现有页面变得更丰富。

4.2 查询

当我需要记住某事时,我查询维基而不是搜索互联网。大语言模型从现有页面综合答案,并引用源文件。如果答案足够大可以重用,它会自动成为新的维基页面。

4.3 清理

定期地,我要求大语言模型对健康检查维基。它查找页面之间的矛盾、过时的建议(Medium 经常更改功能)、没有入站链接的孤立页面,以及引用某个主题但尚未存在页面的缺口。

4.4 分工

使其可持续的是明确的责任分工:

大语言模型
选择学习什么 总结和结构化
设定创意方向 交叉引用和链接
做出判断调用 维护一致性
决定发布什么 标记缺口和矛盾

你留在驾驶座上。大语言模型处理你自己永远不会做的记账。

5、入门

如果你想自己尝试,这里是最小可行结构:

my-wiki/
├── schema.md ← 规则和约定
├── index.md ← 页面目录
├── log.md ← 更改历史
├── raw/ ← 你的源材料
└── wiki/ ← 大语言模型维护的页面

编写一个定义你的领域范围、文件命名约定和三个操作(摄取、查询、清理)的模式。然后与你喜欢的编码助手对话,要求它根据你已经知道的内容创建初始维基页面。

第一次会话给你基础。第二次会话,当你摄取第一个外部源并观看维基自我更新时,模式才真正显现。

6、我学到的东西

在与这个共处几天后,三件事很突出。

首先,维基改变了我阅读的方式。当我知道有一个地方可以让新知识落地时,我会更专注地阅读。我已经在思考这会更新哪个页面,它与什么矛盾,它填补了什么缺口。

其次,模式是最重要的文件。不是维基页面——那些可以重新生成。是模式编码了你关于什么重要、事物应该如何组织、大语言模型应该关心什么的判断。

第三,这是个人基础设施。它不是产品或框架。它是一种安静的实践,一次一个源地积累复合的知识。

Karpathy 将大语言模型维基描述为 Vannevar Bush 的 Memex 的现代版本——1945 年想象的一种设备,用于存储和检索一个人曾经读过的所有内容。我们已经等了 80 年让技术赶上这个想法。

我认为它终于赶上了。


原文链接:I Used Claude Code to Build a Personal Knowledge Base — Inspired by Karpathy's LLM Wiki Pattern

汇智网翻译整理,转载请标明出处