本页目录
相关工作
急加载式 skill(SKILL.md、Custom Instructions)
现在的主流:一份 markdown 文件,每轮整份注入 system prompt。写起来便宜,上手快,规模一上去就崩。详见 批量加载的问题。
RAG(检索增强生成)
RAG 解决"批量"的方式是每轮从向量库里取内容,代价是结构性的:向量检索按 embedding 相似度排序,对类型完全不感知。一句 query "how do I make a pan sauce" 检索回来的可能是一段讲 pan sauce 历史的 fact、一条无关的 deglaze 温度规则,也可能是一段营销文案——embedding 自己分不清哪一条才是 agent 真正要的method。
Skill Wiki 沿用 RAG 的拉式模型,再加一层带类型的检索:agent 按 kind 提问,检索器在 kind 内部排序,contract 来强制组合规则。
知识图谱(Neo4j、Wikidata)
经典的知识图谱本来就把索引和内容分开了,边也带类型。差的是给 LLM agent 用的工具链:KG 的 schema 是为 SPARQL 查询和人工编辑设计的,不是为"按需要拿一段 30 token 的摘要、或者 200 token 的 core"设计的。Skill Wiki 借走"边带类型"这一点,再加上一层 projection。
Voyager 风格的 skill 检索
Voyager(NeurIPS 2023)用一个 skill 库加检索,让 agent 能力增量增长。它的 skill 单元是代码片段,检索靠向量相似度。Skill Wiki 把这个原则推广到任何类型的知识——不只是可执行 skill——还加上了 LLM 可以靠住的静态类型检查。
对比表
| 方案 | Index 常驻上下文 | 正文按需加载 | 边带类型 | 编译期检查 |
|---|---|---|---|---|
| SKILL.md | — | 否(急加载) | — | — |
| RAG(向量) | — | 是 | — | — |
| 知识图谱 | 部分 | 走 SPARQL | 是 | 仅 schema 层 |
| Voyager skill | — | 向量检索 | — | 编译(代码层) |
| Skill Wiki | 是(约 3 KB) | 是,按 id | 是(14 个 verb) | L1 + L3,可选 L2 |
定量数据见 长文对比。