Update avaliable. Click RELOAD to update.
📱 安装应用到主屏幕,获得更好体验
目录

用Karpathy的LLM Wiki模式,我搭了一个会自己生长的研究大脑

先说痛点—你可能也有的那个”research”文件夹

你有一个叫”research”或”阅读资料”或”ai-stuff”的文件夹。里面有四十七个Markdown文件、六篇早就想总结但一直没动的PDF、三个导出过一次就再也没打开的Notion页面,还有一个叫”重要”的浏览器书签文件夹——里面的链接来自2023年。

你知道里面有一篇关于注意力机制的文章,和一篇关于MCP服务器的东西。你几乎确定这两者之间有联系——但你不知道当时记在哪了,也不知道到底有没有记过。

你不是不整理。你是被信息淹没了。这两者有本质区别。

为什么RAG不够

大多数人跟LLM和文档的互动方式是RAG:你把一堆文件上传,LLM在查询时检索相关段落,生成答案。

这能工作,但每次查询LLM都是从零重新发现知识。没有积累。没有成长。问一个需要综合五篇文档的微妙问题,LLM每次都要重新找到相关内容、拼凑在一起。什么都没有被构建起来。

我用了这个模式好几个月。NotebookLM处理论文。ChatGPT文件上传处理会议笔记。一堆永远不会再看第二眼的Claude对话。每一次都是一次性交易——我问一个问题,得到一个答案,关掉标签页,两周后我把同一批论文重新上传,问几乎同样的问题,因为之前综合出的东西没有在任何地方持久保存。

Karpathy的洞见:让AI当图书管理员

2026年4月,Andrej Karpathy在GitHub上丢了一个Gist,就叫”LLM Wiki”。不是新产品、不是新框架、不是SaaS——就是一个”思路文件”,一种设计模式,贴进Claude Code或者Codex里就能用。

核心思路的转变:

过去:你维护知识库,偶尔问AI问题。 现在:AI构建和维护整个知识库,你只管丢原始资料。

Karpathy用的类比来自软件工程:编译。你写源代码,编译器把它变成优化过的二进制产物。你不会每次运行源代码——你编译一次,分发产物,在需要时高效执行。编译步骤很贵,但在后续每一次使用中都值回票价。

在这里,编译后的产物不是二进制。是Wiki——一个文件夹的可读Markdown文件,每个概念一个页面,相互交叉引用,由模型维护,在Obsidian中查看。

RAG检索然后遗忘。Wiki积累然后复利。

三层架构:什么放哪,为什么

my-wiki/
├── raw/              # 原始资料(你维护,不可变)
│   ├── papers/
│   ├── articles/
│   └── notes/
├── wiki/             # 知识层(AI写,你读)
│   ├── entities/
│   ├── concepts/
│   ├── sources/
│   ├── index.md
│   └── log.md
└── CLAUDE.md         # 规则层(操作手册)

第一层:raw/ — 原始资料

论文PDF、文章、笔记、播客文字稿全部放在这里。这层不可变——不编辑,不修改,只追加。

不可变不是审美选择,是设计决策。它意味着你随时可以从原始资料重新派生出整个Wiki。如果需要重建、发现AI出了错,你永远不会丢失原始内容。

第二层:wiki/ — 知识层

这是AI生成的Markdown文件,按类型分目录:

每个页面内部有[[wikilinks]]交叉引用。一页可能关联到10~15个其他页面。

第三层:CLAUDE.md — 规则层

这是整个系统的灵魂。它把通用的LLM变成一个有纪律的知识工作者

CLAUDE.md定义了:

第一版写得比较粗糙。但经过几十次导入和几次lint之后,它会变成反映你领域实际运作方式的schema。

三个核心操作

1. 导入(Ingest)— 一份资料触达10~15页

你丢一个新资料进raw/,告诉Claude处理它。然后Claude:

  1. 读完整篇资料
  2. 跟你讨论核心观点和重点
  3. 在wiki里写一个摘要页
  4. 更新index页面
  5. 更新所有相关的实体和概念页面
  6. 在log中追加一条记录

一份资料可能触达10~15个Wiki页面。

Karpathy偏好一份一份导入,并在过程中保持参与——读摘要,检查更新,指导AI哪些该强调。第一次导入是一场对话,不是一次批处理。Claude总结完论文后,会建议创建五个概念页,并询问是否需要为某个特定数据集单独建页。这是编辑决策。模型主动询问是对的。

2. 查询(Query)— 质量碾压RAG

LLM不是从某个PDF第14页随机切一段出来。它读的是已经综合好了、交叉引用的百科条目,这些条目已经整合了系统所有所学。

作者问了一个典型问题:“关于上下文窗口长度和AI Agent可靠性的关系,我读过的所有资料都说了什么?”

Claude做了三件事:

  1. 读了index,定位到6个相关Wiki页面
  2. 引用4篇不同论文,按名字引用
  3. 标出了一个矛盾——两篇论文在这个问题上立场相反

还有一个关键设计:--save标记。当开启时,一次有价值的综合查询结果会被自动归档为新的Wiki页面。未来会话立即受益。Karpathy把这称为”复利原则”——你问了一个问题,系统回答了,现在Wiki也知道答案了。

3. 健康检查(Lint)— 每周8分钟的保养

没人爱做维护,这就是为什么人在做的时候Wiki最终会腐烂。但LLM做这个只需8分钟。

定期让AI健康检查Wiki,它会找:

作者在12天后做了第一次lint。AI发现了:

全程约8分钟。

在lint中标记矛盾,LLM花3分钟。而那个导致每份人维护的Wiki最终腐烂的知识管理开销,彻底消失了。剩下的是真正属于人的部分:筛选资料、决定哪些重要、问正确的问题、思考这一切意味着什么。LLM处理其他一切。

Obsidian的角色:窗口,不是大脑

这里有一个关键区别:Claude Code是大脑,Obsidian是窗口。

Obsidian作为Wiki的IDE存在。它渲染带反向链接的Markdown,显示页面之间的图视图,支持全文搜索,文件变更时实时刷新。

你始终处于阅读模式,从不处于编辑模式。你浏览、跟链接、看图、阅读。你从不直接编辑Wiki文件。

图视图是那个能转变怀疑者的功能。两周后,87个页面——图视图显示出了自然的聚类:围绕Transformer架构的、围绕Agent记忆的、围绕评估文献的。特定页面作为聚类之间的桥梁。作者没有设计这些聚类——模型通过跟踪文献中实际一起讨论的内容,自主发现了这些结构。

实战:作者两周的真实经验

指标数值
时间投入首次搭建~2小时,后续每次导入15分钟
导入资料34份(论文、文章、YouTube字幕、播客笔记)
生成页面87个(作者一个都没自己写)
首次lint12天后,8分钟,发现3个矛盾+2个孤立页+4个缺失概念
token消耗导入阶段约5~8倍原始token量,查询阶段极低

会断的地方和怎么修

Schema在第三天跟你打架

第一个版本的CLAUDE.md太抽象了。几次导入后,模型创建页面的结构不一致——有些有”Key Claims”章节,有些有”Main Arguments”,意思一样但命名不同。修复方法:标准化章节名。模型会严格遵循schema说什么,所以schema必须说清楚。

认知漂移

如果AI在导入时误解了一份资料——误解、幻觉出的连接——这个错误会进入Wiki,影响后续导入。Lint操作能减轻但不能消除。通过git diff进行人工审核是真正的安全网。作者在每次导入后跑git diff,花90秒,两周内抓住了两次错误。

规模上限:约100~200份资料

Karpathy建议Wiki包含大约100篇文章以确保系统保持高效。超过这个规模,可能需要LLM Wiki v2的扩展(混合搜索、多Agent治理)或专门的RAG管线。

好消息是:200份精选资料,经过正确的编译和交叉引用,比2000份在RAG系统中每次都从零检索的原始文档有用得多。

导入成本前置

导入步骤是token消耗最集中的地方。一份10页的PDF可能触发12个Wiki文件的更新。预算大约是原始token量的5~8倍。但后续查询极为便宜——通常只需要index.md加2~3个概念页。

两周后的改变

我停止了丢失东西。

听起来很平凡?其实不然。在这个系统之前,每篇读过的有趣论文都处于逐渐衰减的状态——刚读那天最有用,此后每周都在退化。

两周后,相反的事正在发生。每份新资料都让现有资料更容易被发现,因为导入过程会明确更新所有相关页面。第一天读的论文现在在11个后来添加的Wiki页面上被交叉引用。它比刚读的时候更有连接了

Karpathy本人几乎从不直接编辑Wiki文件。他把Wiki视为”AI的领地”。AI写、更新、维护。Karpathy只读。

那个让系统有效的纪律:你一旦开始手动编辑Wiki页面,你就在AI自己的领土上和它竞争,并且失去了让整个系统可行的维护自动化。

更大的图景

Karpathy还提到了一个未来方向:用Wiki生成合成训练数据,微调一个LLM,让它”在权重中知道”这些数据,而不仅仅通过上下文窗口理解。这意味着把个人知识库变成个性化模型。

那个未来比Gist听起来要远一些。但当前的版本——一个自愈、交叉引用、AI维护的Wiki,跑在你本机的一个文件夹里——已经是作者用过的最好的知识管理系统。

Memex终于可以建造了。不是因为我们有了更好的文档或更好的搜索,而是因为我们有了真正干活的图书管理员。

Vannevar Bush在1945年描述了Memex。Karpathy在2026年4月发布了操作说明。

文件夹就在那里。Gist是公开的。Claude Code有免费层。剩下的只是第一次导入。


原文:I Used Karpathy’s LLM Wiki to Build a Research Brain That Updates Itself,作者 Adi Insights and Innovations。

版权所有,本作品采用知识共享署名-非商业性使用 3.0 未本地化版本许可协议进行许可。转载请注明出处:https://www.wangjun.dev//2026/06/karpathy-llm-wiki-self-updating-research-brain/
📝 此页面已自动翻译为英文 · 查看原文
EN | 中文