Claude Skills 深度拆解：Anthropic 在下一盘什么棋？

去年 10 月 Anthropic 发了一个叫 Skills 的东西。当时我刷到官方 blog，第一眼觉得”这不就是个 prompt 模板吗”，就划过去了。后来有个做 Agent 平台的朋友跟我说：”你再仔细看看，这玩意儿跟你想的不是一回事。”

我花了整整两个周末把官方文档、示例仓库、社区讨论翻了一遍，又自己动手写了几个 Skill 实际跑。最后的感受是——这是 Anthropic 在悄悄下一盘大棋。国内中文圈目前几乎没人认真写过 Skills，所以这篇我想把我的理解完整倒出来：它到底是什么、怎么运作、和 MCP 有啥区别、为什么它重要。

一、从一个具体问题说起

先不谈 Skills 是什么，先想一个场景：

你要让 Claude 做财务分析师。它需要会看 Excel、会算常见的财务指标（毛利率、ROE、现金流折现）、会按公司的报告模板写季度总结、会生成 PPT。

传统做法你会怎么搞？

放系统 prompt 里：全塞进 system prompt，好几千字。结果每次对话不管用户问啥，都要烧这些 token；而且太长的 prompt 模型注意力会稀释
做 RAG：把知识切片、Embed、向量检索。问题是财务模板、Excel 操作这种流程性知识，按关键词检索很容易断章取义，召回出来都是片段
做 MCP Server：封成工具。但”季度总结模板怎么写”不是一个工具调用能解决的，它是一套行动指南

Skills 就是为了解决这类问题出现的。它给模型一个”按需加载的能力包“。

二、三层渐进披露：Skills 的核心机制

Skills 最精妙的设计是渐进披露（Progressive Disclosure），分三层：

第一层：Metadata（元数据）

每个 Skill 都有一个 SKILL.md，最顶部是一段 YAML frontmatter：

---
name: financial-analyst
description: 使用此技能进行公司财务报告分析、计算财务指标（毛利率、ROE、DCF 估值）、生成季度分析报告。当用户提到财报、估值、投资分析时触发。
---

注意 description 这个字段——它是 Skill 的”广告词“。Claude 启动会话时，只加载所有 Skill 的 name + description，这叫Skill Registry。加载成本极低，几百个 Skill 也就几 KB。

第二层：Body（主体指令）

当模型基于用户请求判断”我需要 financial-analyst 这个 Skill”时，它会加载 SKILL.md 的正文部分：

# Financial Analyst Skill

你现在扮演一位专业财务分析师。工作流程如下：

1. 读取用户提供的财报 Excel 文件
2. 提取关键数据：营收、成本、利润、现金流
3. 计算标准指标（见 references/metrics.md）
4. 按季度报告模板生成分析（见 references/template.md）
5. 用 generate_ppt 工具输出 PPT

重要原则：
- 所有数字引用必须标注来源（哪张表、哪一行）
- 估值区间要给出上下限，不给单点预测
- 不做投资建议，只做数据分析

这部分一般控制在几百到一两千字。它告诉模型”怎么做“。

第三层：References（引用文件）

真正的细节——财务指标怎么算、报告模板长什么样、Excel 取数规则——放在 references/ 子目录里，只有模型真正需要时才去读。

financial-analyst/
├── SKILL.md
├── references/
│   ├── metrics.md        # 30+ 个财务指标的计算公式
│   ├── template.md       # 季度报告完整模板
│   └── industry-norms.md # 不同行业的基准值
└── scripts/
    └── generate_ppt.py   # 生成 PPT 的工具脚本

模型按需 read_file 这些引用。用户问”你帮我算一下毛利率”，模型会去读 metrics.md；问”给我写季度报告”，它会去读 template.md——按需索取，不浪费上下文。

三、和 MCP、Function Calling 的定位差异

这个问题我被问了不下十次：有了 MCP 为啥还要 Skills？

我的理解：

Function Calling 回答”模型能调用什么工具”
MCP 回答”模型能连接什么外部服务”
Skills 回答”模型能扮演什么角色 / 遵循什么工作流”

这三层是正交的，可以组合使用。在我那个财务分析的例子里：

Skill 负责定义流程和知识（怎么分析、指标怎么算、报告怎么写）
MCP Server 负责提供能力接入（读 Excel、查股票数据、生成 PPT）
Function Calling 是底层协议（模型和工具之间怎么通信）

Skills 不取代 MCP，它在 MCP 之上。想看 MCP 和 Function Calling 的详细对比，可以看我在 Tool与MCP 分类里那篇专门的文章。

四、为什么我说这是 Agent 范式升级

这就要聊到 Anthropic 在下的棋了。

回顾 LLM 应用架构的演化：

2022：纯 prompt 工程。所有指令塞 system prompt，模型就是个 completion 机器
2023：Function Calling + RAG。模型学会调工具、查知识库
2024：MCP + Agent 框架。标准化协议、多步推理、工具链
2025-2026：Skills。模型自主”选择”加载什么技能包

你发现规律了吗？**越来越多的决策权从”应用开发者硬编码”转移到”模型自主判断”**。

Skills 的核心哲学是：让模型自己决定它需要什么知识。你不再需要写一大堆 if-else 来决定”用户说 XX 就激活 YY prompt”——Skill Registry 里每个 Skill 的 description 就是它的自我推销，模型看完自己选。

这和人类的工作方式更接近。一个通才人类员工，遇到财务问题会翻出《财务分析手册》，遇到法务问题会翻出合同模板库，遇到技术问题会翻开 API 文档——知识按需加载，能力模块化组装。

Anthropic 不是在给 Claude 加一个功能，他们是在重新定义 Agent 的操作系统。Skill Registry 就像是 iOS 的 App Store 索引，SKILL.md 就是每个 App 的清单，references 就是 App 的资源包。

五、一个最简 Skill 示例

说了这么多理论，上一个最简实战。这是我给自己写的第一个 Skill——“博客文章润色师”：

1 2	blog-polisher/ └── SKILL.md

SKILL.md 内容：

---
name: blog-polisher
description: 帮助润色中文技术博客，去除 AI 味、加强口语化表达、检查标题和开头的吸引力。当用户提供一段博客草稿并要求润色、修改、优化语气时触发。
---

# 中文博客润色师

你的任务是把一段技术博客草稿改得更像真实的人写的，而不是 ChatGPT 生成的。

## 必改项

1. 替换套话：
   - "首先/其次/再次/最后" → 自然过渡
   - "总的来说/综上所述" → 直接说结论
   - "值得一提的是/不容忽视" → 直接写内容
   - "赋能/生态/加持" → 用具体动词替代

2. 增加真实感：
   - 开头加一个具体场景（时间、地点、遇到什么人）
   - 中间至少一处吐槽或主观判断
   - 插入具体数字（时间、金额、比例）

3. 语气降维：
   - 避免全段落都是完整句，适度使用短句和省略
   - 每隔几段出现一次"说实话/其实/我的感觉是"

## 不改项

- 不改动技术细节的准确性
- 不改动代码块内容
- 不增加无中生有的数据

## 输出格式

- 先给出修改后的全文
- 最后列出"修改要点" 3-5 条

就这样。把这个文件放到 Claude 配置的 skills 目录里（Claude Code / Claude Desktop 现在都支持），之后我写草稿发给 Claude，它自动识别需要润色、加载这个 Skill、按规则改。

这东西的威力在于——我团队其他人也能用同一个 Skill，通过一个 git 仓库同步。Skill 库 = 团队的共享肌肉记忆。

六、Skills 还不完美的地方

客观说几个目前的问题：

触发不稳定。description 写得不够精准，模型可能漏触发或误触发。目前靠经验调
调试工具弱。哪个 Skill 被激活、为什么被激活，现在还得翻日志，没有可视化
分发生态早期。Anthropic 自己在搞一个 Skills Marketplace，但还没正式上线，团队间靠 git 同步
跨厂商不兼容。OpenAI / Google 还没有对应机制，Skill 目前是 Claude 生态独占

但这些都是时间问题。你现在就开始写 Skill，半年后你会发现自己站在了一条很舒服的曲线上。

七、该从哪里开始

如果你想亲手试试，我的建议是：

找一个你重复做的工作——写周报、整理代码 review、生成测试用例……任何”有套路”的事
写一个最简 SKILL.md，只管工作流，先不考虑 references
跑 5-10 次实际任务，看哪里不稳定、哪里模型总漏掉
把那些”规则”抽成 references，让主体保持精简

更多自定义 Skill 的实战案例，可以看 Agent开发分类下其他文章——我之后会更新一篇”给市场团队做品牌文案 Skill”的完整复盘。想看 Anthropic 这类新能力的第一手消息，news.cocoloop.cn 我自己每天在翻。

这盘棋 Anthropic 才刚刚开局。但布局已经看出来了——他们要做的不是一个更好的模型 API，而是 Agent 时代的操作系统。Skills 是其中非常关键的一块拼图，比大部分人意识到的重要得多。

Agent 架构正在发生代际切换

本站持续追踪 Claude Skills、MCP、Agent 框架等核心动向。想要一手动态可以访问 news.cocoloop.cn，想交流实战可以去 ask.cocoloop.cn。