Skill Wiki v0.1.0

文档 / background / prior-art

本页目录

相关工作

急加载式 skill(SKILL.md、Custom Instructions)

现在的主流:一份 markdown 文件,每轮整份注入 system prompt。写起来便宜,上手快,规模一上去就崩。详见 批量加载的问题

RAG(检索增强生成)

RAG 解决"批量"的方式是每轮从向量库里取内容,代价是结构性的:向量检索按 embedding 相似度排序,对类型完全不感知。一句 query "how do I make a pan sauce" 检索回来的可能是一段讲 pan sauce 历史的 fact、一条无关的 deglaze 温度规则,也可能是一段营销文案——embedding 自己分不清哪一条才是 agent 真正要的method

Skill Wiki 沿用 RAG 的拉式模型,再加一层带类型的检索:agent 按 kind 提问,检索器在 kind 内部排序,contract 来强制组合规则。

知识图谱(Neo4j、Wikidata)

经典的知识图谱本来就把索引和内容分开了,边也带类型。差的是给 LLM agent 用的工具链:KG 的 schema 是为 SPARQL 查询和人工编辑设计的,不是为"按需要拿一段 30 token 的摘要、或者 200 token 的 core"设计的。Skill Wiki 借走"边带类型"这一点,再加上一层 projection。

Voyager 风格的 skill 检索

Voyager(NeurIPS 2023)用一个 skill 库加检索,让 agent 能力增量增长。它的 skill 单元是代码片段,检索靠向量相似度。Skill Wiki 把这个原则推广到任何类型的知识——不只是可执行 skill——还加上了 LLM 可以靠住的静态类型检查。

对比表

方案 Index 常驻上下文 正文按需加载 边带类型 编译期检查
SKILL.md否(急加载)
RAG(向量)
知识图谱部分走 SPARQL仅 schema 层
Voyager skill向量检索编译(代码层)
Skill Wiki是(约 3 KB)是,按 id是(14 个 verb)L1 + L3,可选 L2

定量数据见 长文对比