Agent Skills 规范全面解读：AI 开发者的新编程范式正在统一

2026-05-12

1. AI 正在从定制走向统一
2. 背景回顾：Agent 到底在做什么
- 2.1 LLM 就是文本函数
- 2.2 ReAct 模式
3. Skill 的解剖结构
4. 实战：构建一个 IAEE 参考技能
5. SKILL.md 编写最佳实践
6. 我的思考
总结

1. AI 正在从定制走向统一

过去两年，每个 AI 平台都有自己的 Prompt 管理方式——Claude 有 Project Knowledge，OpenAI 有 Custom Instructions，VS Code 有 Cline 规则，Cursor 有 .cursorrules。这种碎片化让开发者疲于在不同平台间重复定义同样的行为。

但一个趋势正在发生：AI 正在收敛到一套共享的范式。模型架构相似，工具调用标准趋同（MCP、A2A），而现在又出现了 Skills（技能）——一套轻量、跨平台的标准，让开发者用统一的目录结构和 Markdown 文件定义 Agent 的行为。

核心思想很简单：与其每次手动写 Prompt 教 Agent 该怎么做，不如把它打包成一个标准的”技能”，让任何支持该规范的 Agent 随时调用。

2. 背景回顾：Agent 到底在做什么

Skill 规范建立在几个核心概念之上，理解它们能帮你更好地理解为什么需要这个规范。

2.1 LLM 就是文本函数

在本文语境下，LLM 本质上只是一个函数：输入文本，输出文本。它本身不会”操作”任何东西，但它能推理——通过 Chain of Thought（思维链），在给出最终答案之前先”思考”过程。

2.2 ReAct 模式

ReAct 是当前 Agent 最主流的架构模式：模型 Reason（推理） → 选择 Act（行动） → 接收 Observe（观察结果） → 再次推理。这个循环让 LLM 能够与环境交互。

其中 Tool Use（工具调用） 是实现行动的关键——模型输出特定格式的文本，系统解析后执行对应的函数并返回结果。Skills 本质上就是这套机制的升级版：用结构化文件代替零散的 Prompt。

3. Skill 的解剖结构

一个 Skill 本质上是一个目录，里面放一些特定文件：

my-skill/
├── SKILL.md          # 必需：元数据 + 指令
├── scripts/          # 可选：可执行代码
├── references/       # 可选：文档参考
├── assets/           # 可选：模板、资源
└── ...               # 其他文件

核心文件是 SKILL.md，它包含两部分：

3.1 Frontmatter（元数据）

---
name: roll-dice
description: 用随机数生成器掷骰子。当被要求掷骰子（d6、d20等）时使用。
---

name 和 description 是必须的——Agent 通过它们快速筛选技能
还支持 license、compatibility、metadata、allowed-tools 等字段

3.2 Body（正文）

Agent Skills 规范最精妙的设计是 渐进式暴露（Progressive Exposure）：

层级	内容	何时加载
元数据	name + description（~100 tokens）	启动时加载所有技能
指令	完整 SKILL.md body（<5000 tokens）	技能被选中时加载
资源	references/、scripts/、assets/ 中的文件	按需加载

这意味着 Agent 可以拥有数百个技能，但每次只加载最相关的几个的完整内容，极大节省上下文窗口。

3.3 三个辅助目录

scripts/：可执行脚本（Python、Bash、JavaScript），需自包含或有清晰依赖说明。

references/：参考文档，用于存放 SKILL.md 正文中提到的详细资料。推荐扁平结构：

my-skill/
├── SKILL.md
└── references/
    ├── REFERENCE.md
    ├── FORMS.md
    └── api-docs.md

assets/：静态资源，如文档模板、配置文件模板、示例图片等。

4. 实战：构建一个 IAEE 参考技能

作者用 Claude Code 演示了如何构建一个能自动查阅其 Substack 文章的技能。

4.1 目录结构

SkillsTest/
└── .claude/
    └── skills/
        └── ai-researcher/
            └── SKILL.md

4.2 SKILL.md 内容

You are an AI research assistant. When given an AI-related question, you must:

1. Use the WebFetch tool to search for relevant content on iaee.substack.com.
2. Cite specific posts or passages in your answer when they apply.
3. Synthesize what you found with your own knowledge.

Always lead with what you found on iaee.substack.com before adding broader context.

4.3 效果

当作者询问”什么是 VAE”时，Claude 自动激活 ai-researcher 技能，先查看文章索引，再爬取文章内容，最后结合自身知识给出完整回答。

随后作者还给技能添加了硬编码的文章索引文件（articles.md），提高了知识检索效率。

5. SKILL.md 编写最佳实践

规范给出了实用的推荐：

聚焦任务 — 只告诉 Agent 它不知道的东西，不要写常识
步骤化 — 使用分步程序，而不是大段描述
保持简短 — 核心指令放进 SKILL.md，细节移入 references/
提供示例 — 输入输出模板、常见场景
标注陷阱 — 常见错误和注意事项
默认值优先 — 不要列出过多选项，给一个靠谱的默认值
匹配严格度 — 安全场景用精确指令，创意场景放宽约束
教 Agent 自我检查 — 告诉它如何验证结果

6. 我的思考

6.1 规范 VS 建议：界限在哪里

作者在文中提到了一个值得注意的问题：Skills 规范的很多”规范”更像是博客文章中的建议。比如 REFERENCE.md 到底应该放在 references/ 目录里还是外面？FORMS.md 和 assets 里的模板有什么区别？这些东西在不同的 Agent 实现中有不同的解释。

这种”模糊性”既是优点也是缺点——它降低了准入成本，任何人几秒钟就能创建自己的技能。但如果你需要一致性保证（比如企业级应用），这种模糊就让人不安。

6.2 Skills 不解决一致性问题

作者坦率地指出：Skills 让”不受约束”的 Agent（如 ReAct 风格的 Claude Code）出错少一点，但不会让它变得可靠。如果你想构建一个行为可预测、可维护的应用，Skills 不是 LangGraph 或严格有向图的替代品。

这意味着 Skills 的最佳使用场景是：

本地开发辅助 — 为项目定制的规则集，让 Claude Code 不犯同样的错误
知识检索 — 绑定外部知识源的文章索引
轻量自动化 — 不需要严格状态机的简单任务

6.3 为什么这很重要

尽管有这些不足，Skills 规范的统一化趋势是不可忽视的。当一个标准被 Claude Code、VS Code、Cursor 等主流平台采纳时，开发者生态就会被重新定义。就像 MCP 统一了工具调用接口一样，Skills 正在统一行为定义接口。

你可以把它想象成 AI 世界的 package.json ——不是最强壮的规范，但因为所有人都用它，它就成了事实标准。

总结

Agent Skills 规范通过一套简单的目录结构和 Markdown 文件，为 AI Agent 提供了统一的行为定义方式。它的核心价值在于渐进式暴露——让 Agent 在数百个技能中高效筛选并加载相关指令，而不是把所有内容塞进一个 Prompt。对于日常开发而言，它是减少重复劳动、保持 Agent 行为一致性的实用工具。但如果你需要确定性强的生产级应用，别忘了它只是一个”让 Agent 少犯错”的辅助手段，不是工程上的可靠性保证。

版权所有，本作品采用知识共享署名-非商业性使用 3.0 未本地化版本许可协议进行许可。转载请注明出处：https://www.wangjun.dev//2026/05/agent-skills-intuitively-and-exhaustively-explained/