Claude Skills 深度拆解:Anthropic 在下一盘什么棋?
去年 10 月 Anthropic 发了一个叫 Skills 的东西。当时我刷到官方 blog,第一眼觉得”这不就是个 prompt 模板吗”,就划过去了。后来有个做 Agent 平台的朋友跟我说:”你再仔细看看,这玩意儿跟你想的不是一回事。”
我花了整整两个周末把官方文档、示例仓库、社区讨论翻了一遍,又自己动手写了几个 Skill 实际跑。最后的感受是——这是 Anthropic 在悄悄下一盘大棋。国内中文圈目前几乎没人认真写过 Skills,所以这篇我想把我的理解完整倒出来:它到底是什么、怎么运作、和 MCP 有啥区别、为什么它重要。
一、从一个具体问题说起
先不谈 Skills 是什么,先想一个场景:
你要让 Claude 做财务分析师。它需要会看 Excel、会算常见的财务指标(毛利率、ROE、现金流折现)、会按公司的报告模板写季度总结、会生成 PPT。
传统做法你会怎么搞?
- 放系统 prompt 里:全塞进 system prompt,好几千字。结果每次对话不管用户问啥,都要烧这些 token;而且太长的 prompt 模型注意力会稀释
- 做 RAG:把知识切片、Embed、向量检索。问题是财务模板、Excel 操作这种流程性知识,按关键词检索很容易断章取义,召回出来都是片段
- 做 MCP Server:封成工具。但”季度总结模板怎么写”不是一个工具调用能解决的,它是一套行动指南
Skills 就是为了解决这类问题出现的。它给模型一个”按需加载的能力包“。
二、三层渐进披露:Skills 的核心机制
Skills 最精妙的设计是渐进披露(Progressive Disclosure),分三层:
第一层:Metadata(元数据)
每个 Skill 都有一个 SKILL.md,最顶部是一段 YAML frontmatter:
1 |
|
注意 description 这个字段——它是 Skill 的”广告词“。Claude 启动会话时,只加载所有 Skill 的 name + description,这叫Skill Registry。加载成本极低,几百个 Skill 也就几 KB。
第二层:Body(主体指令)
当模型基于用户请求判断”我需要 financial-analyst 这个 Skill”时,它会加载 SKILL.md 的正文部分:
1 | # Financial Analyst Skill |
这部分一般控制在几百到一两千字。它告诉模型”怎么做“。
第三层:References(引用文件)
真正的细节——财务指标怎么算、报告模板长什么样、Excel 取数规则——放在 references/ 子目录里,只有模型真正需要时才去读。
1 | financial-analyst/ |
模型按需 read_file 这些引用。用户问”你帮我算一下毛利率”,模型会去读 metrics.md;问”给我写季度报告”,它会去读 template.md——按需索取,不浪费上下文。
三、和 MCP、Function Calling 的定位差异
这个问题我被问了不下十次:有了 MCP 为啥还要 Skills?
我的理解:
- Function Calling 回答”模型能调用什么工具”
- MCP 回答”模型能连接什么外部服务”
- Skills 回答”模型能扮演什么角色 / 遵循什么工作流”
这三层是正交的,可以组合使用。在我那个财务分析的例子里:
- Skill 负责定义流程和知识(怎么分析、指标怎么算、报告怎么写)
- MCP Server 负责提供能力接入(读 Excel、查股票数据、生成 PPT)
- Function Calling 是底层协议(模型和工具之间怎么通信)
Skills 不取代 MCP,它在 MCP 之上。想看 MCP 和 Function Calling 的详细对比,可以看我在 Tool与MCP 分类 里那篇专门的文章。
四、为什么我说这是 Agent 范式升级
这就要聊到 Anthropic 在下的棋了。
回顾 LLM 应用架构的演化:
- 2022:纯 prompt 工程。所有指令塞 system prompt,模型就是个 completion 机器
- 2023:Function Calling + RAG。模型学会调工具、查知识库
- 2024:MCP + Agent 框架。标准化协议、多步推理、工具链
- 2025-2026:Skills。模型自主”选择”加载什么技能包
你发现规律了吗?**越来越多的决策权从”应用开发者硬编码”转移到”模型自主判断”**。
Skills 的核心哲学是:让模型自己决定它需要什么知识。你不再需要写一大堆 if-else 来决定”用户说 XX 就激活 YY prompt”——Skill Registry 里每个 Skill 的 description 就是它的自我推销,模型看完自己选。
这和人类的工作方式更接近。一个通才人类员工,遇到财务问题会翻出《财务分析手册》,遇到法务问题会翻出合同模板库,遇到技术问题会翻开 API 文档——知识按需加载,能力模块化组装。
Anthropic 不是在给 Claude 加一个功能,他们是在重新定义 Agent 的操作系统。Skill Registry 就像是 iOS 的 App Store 索引,SKILL.md 就是每个 App 的清单,references 就是 App 的资源包。
五、一个最简 Skill 示例
说了这么多理论,上一个最简实战。这是我给自己写的第一个 Skill——“博客文章润色师”:
1 | blog-polisher/ |
SKILL.md 内容:
1 | --- |
就这样。把这个文件放到 Claude 配置的 skills 目录里(Claude Code / Claude Desktop 现在都支持),之后我写草稿发给 Claude,它自动识别需要润色、加载这个 Skill、按规则改。
这东西的威力在于——我团队其他人也能用同一个 Skill,通过一个 git 仓库同步。Skill 库 = 团队的共享肌肉记忆。
六、Skills 还不完美的地方
客观说几个目前的问题:
- 触发不稳定。description 写得不够精准,模型可能漏触发或误触发。目前靠经验调
- 调试工具弱。哪个 Skill 被激活、为什么被激活,现在还得翻日志,没有可视化
- 分发生态早期。Anthropic 自己在搞一个 Skills Marketplace,但还没正式上线,团队间靠 git 同步
- 跨厂商不兼容。OpenAI / Google 还没有对应机制,Skill 目前是 Claude 生态独占
但这些都是时间问题。你现在就开始写 Skill,半年后你会发现自己站在了一条很舒服的曲线上。
七、该从哪里开始
如果你想亲手试试,我的建议是:
- 找一个你重复做的工作——写周报、整理代码 review、生成测试用例……任何”有套路”的事
- 写一个最简 SKILL.md,只管工作流,先不考虑 references
- 跑 5-10 次实际任务,看哪里不稳定、哪里模型总漏掉
- 把那些”规则”抽成 references,让主体保持精简
更多自定义 Skill 的实战案例,可以看 Agent开发 分类 下其他文章——我之后会更新一篇”给市场团队做品牌文案 Skill”的完整复盘。想看 Anthropic 这类新能力的第一手消息,news.cocoloop.cn 我自己每天在翻。
这盘棋 Anthropic 才刚刚开局。但布局已经看出来了——他们要做的不是一个更好的模型 API,而是 Agent 时代的操作系统。Skills 是其中非常关键的一块拼图,比大部分人意识到的重要得多。
- 标题: Claude Skills 深度拆解:Anthropic 在下一盘什么棋?
- 作者: Claude 中文知识站
- 创建于 : 2026-03-15 10:45:00
- 更新于 : 2026-04-08 13:20:00
- 链接: https://claude.cocoloop.cn/posts/skills-deep-dive/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。