Agent Skills – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Wed, 15 Apr 2026 06:04:05 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico Agent Skills – 青瓜传媒 //m.clubpenjuin.com 32 32 Agent Skills入门指南 //m.clubpenjuin.com/380718.html Thu, 16 Apr 2026 00:45:31 +0000 //m.clubpenjuin.com/?p=380718

 

最近随着OpenClaw和微信ClawBot的火爆,似乎人人都在搭自己的 AI Agent。

但90%的人搭完都会陷入同一个尴尬:

花了几天时间配置,最后发现它还是个只会聊天的玩具。

让它写文案没问题,让它自动整理邮件、同步表格就彻底卡壳。

其实,问题不在大模型,而在Skills——这才是Agent真正的 “手脚”。

下面我们就展开聊聊什么是Agent Skills,以及怎么写第一个直接就能用的技能。

01 为什么大模型很聪明,却干不了活?

现在的大模型,比如GPT-4、Claude3.5,智商是真的高。

你跟它聊天,让它写文章、写代码,它都轻松搞定。

但是,一旦让它帮你做一件具体的事,问题就来了。

比如,你让它“分析一下公司上个月的销售数据,然后生成一份周报,最后发到工作群里”。

这个任务看似简单,但涉及三个关键步骤:

1、连数据库:查询销售数据。

2、处理数据:用Python画图、做分析。

3、发送报告:调用办公软件API接口。

在传统模式下,你得手把手地教它每一步怎么做。

每次遇到类似的任务,你都要重新写一遍复杂的提示词(Prompt),把公司规范、数据库结构、API文档再喂给模型一遍。

这就像一个智商超高的天才,但因为没有学过“报税流程”,所以根本不知道怎么帮你退税。

过去,大家为了解决这个问题,会为每一个垂直领域(如税务、编程、写作)单独构建一个全新的Agent。

但Anthropic的工程师们认为,这条路走歪了。

底层的Agent(大脑)应该是通用的,我们只需要给它安装不同的专业技能就行了。

“AI的未来,不是更大的Agent,而是一个通用Agent+无数可复用的Skills模块。”

02 Agent Skills到底是什么?

Agent Skills是Anthropic推出的一套开放标准。

它将专业知识、工作流程和最佳实践打包成可重用的、基于文件系统的资源,让AI能够以一致、可重复的方式完成特定任务。

一个Skill就是一组文件夹,里面包含了这个AI完成特定任务所需的全部“知识”和“工具”。

比如指令文档、Python脚本、模板文件等等。

AI需要的时候,自己加载就行了。

以前你每次让AI干活,都得把“说明书”重新念一遍。

现在你把“说明书”打包成一个Skill,AI自动就能看懂、会用。

Agent Skills把信息分成了三个层次,并按需加载:

第一层(元数据) :

只有技能的名字和简介。

AI在启动时会扫描所有Skills的元数据,几乎不占什么Token(约100 tokens)。

第二层(核心指令):

当AI判断“这个任务适合用这个Skill”时,它才会去读取完整的SKILL.md文件。

这一步会消耗几千Token,但只发生在触发时。

第三层(资源文件):

只有在真正需要执行脚本、读取模板时,AI才会去加载这些大文件。

按需加载,绝不浪费。

这个“三层渐进式披露”的机制,让Agent可以拥有海量的技能库,却不会因为一次性加载所有内容而耗尽上下文窗口。

03 创建你的第一个Skill

理论铺垫完了,现在开始动手。

写Skill只需要你会Markdown文件就行,其实和写文档难度相当。

第一步:创建文件夹结构

首先,在你的电脑上创建一个文件夹,名字就是你的Skill名。

比如,我们创建一个叫 `weekly-report` 的Skill。

在这个文件夹里,你需要创建一个核心文件:SKILL.md。

这个文件是你的“总说明书”。

如果你想让它更强大,还可以加几个子文件夹:weekly-report/├── SKILL.md          # 必需:核心指令 + 元数据├── scripts/          # 可选:放Python、Shell等脚本├── references/       # 可选:放参考文档、规范└── assets/           # 可选:放模板、图片等资源

第二步:编写核心文件SKILL.md

打开SKILL.md,用Markdown格式写入以下内容。

注意,开头要用三个短横线包裹的YAML元数据块。

yaml—name: weekly-reportdescription: 自动生成数据分析周报。当用户需要分析销售数据、制作图表并发送周报时使用。支持连接SQL数据库、Python数据处理和信息推送。license: MIT—# 数据周报生成技能## 何时使用本技能当用户提出“生成周报”、“分析上周销售数据”、“推送数据报告”等请求时,应触发本技能。## 执行流程1. **数据获取**:使用 `scripts/query_db.py` 连接数据库,执行SQL查询,获取上周的销售数据。2. **数据分析与绘图**:使用 `scripts/analyze.py` 对数据进行同比/环比分析,并生成柱状图和趋势图。3. **报告生成**:根据 `assets/report_template.md` 模板,填充分析结果和图表,生成Markdown格式的周报。4. **报告推送**:使用 `scripts/workgroup_bot.py` 将生成的周报发送到指定的工作组。## 注意事项- 数据库连接信息需在 `.env` 文件中配置,脚本会自动读取。- 生成的图表保存在 `./output/` 目录下。- 如果数据查询为空,应生成“本周无数据”的提示报告,而不是报错。

你看,是不是就像在写一份“工作交接文档”?

只不过这次,你的交接对象不是同事,而是AI Agent。

第三步:让它“跑”起来

Skill创建好之后,针对不同平台采用对应的运行方法:Claude Code/Cursor把你的Skill文件夹放到对应平台指定的skills目录下(比如`~/.claude/skills/`)。重启IDE或刷新后,当你在聊天框里说出相关指令,比如“帮我生成上周的销售周报”,AI会自动识别并加载你的Skill。OpenClaw/其他Agent框架

将Skill文件夹放到工作区目录,框架会自动加载。

你也可以通过 `/weekly-report` 这样的斜杠命令显式调用。

就是这么简单。

你不需要写复杂的代码,不需要研究API文档,只需要把你知道的做事流程写下来,AI就能替你执行。

04 Skill进阶避坑指南

入门容易,但要把Skill做好,让它稳定可靠,还是有一些门道的。

1、一个Skill只做一件事(单一职责原则)

千万别试图做一个“万能Skill”。

比如你想让AI既能“写代码审查”,又能“做财务分析”,结果往往是两样都做不好。

把不同的任务拆分成独立的Skill,需要的时候AI可以组合使用多个Skills。

2、两种设计模式:导师模式 vs. 脚本模式

根据任务类型,你的Skill应该采用不同的设计思路。

导师模式:

偏Review/创作的操作,如代码审查、写文案。

只给原则和输出结构,让模型自己发挥。

这里的Skill就像“导师”,只给方向,充分发挥LLM的推理能力。

脚本模式:

容易出Bug的操作,如部署、数据库迁移。

需要把自由度管控住,只给固定的工作步骤(Workflow)。

这里的Skill就像“脚本”,不许AI自由发挥,一步一步严格按照指令执行。

3、好的Skill都来自用户痛点

你不需要一上来就想着设计一个完美的Skill。

最好的Skill,往往来源于你反复遇到的“痛点”。

比如,你发现自己每周都在重复做同一套数据报表的流程。

那你就把这个流程里的关键步骤、用到的SQL模板、Python脚本,统统打包进一个Skill里。

下次,一句“生成周报”,全自动搞定。

先有痛点,再有Skill。

当你发现某个任务让你厌烦到想自动化的时候,就是你创建Skill的最佳时机。

4、拥抱“混合架构”,别让AI“裸奔”

在开发企业级应用时,一个常见误区是“激进路线”:

给AI全部权限,让它自己去写代码、调API、生成文件。

这种“裸奔”模式在生产环境中非常危险。

AI可能会写出低效SQL、生成格式错乱的文件,甚至带来安全黑洞。

更稳健的做法是采用“混合架构”:

Java/Python负责确定性的数据流转与安检,AI只负责意图理解与逻辑调度。

具体来说,可分为三个层面:

ETL层(确定性):由传统代码处理数据下载、格式识别、安全检测。

Skills层(AI调度):AI负责理解用户意图,调用封装好的高级函数。

交付层(确定性):由传统代码处理最终的PDF/Word生成。

通过这种方式,你既保留了AI的灵活性,又确保了系统的工业级稳定性。

最后

如果你还在为每次都要重复写复杂Prompt而头疼,还在为AI无法稳定执行复杂任务而烦恼。

Agent Skills就是你必须掌握的技能之一。

本质上,它就是把你脑子里的“隐性知识”和“做事流程”,变成一份AI能读懂的“说明书”。

花一点时间,把你日常工作中重复性最高的几个任务,用Skills封装起来。

你会发现,你的AI Agent会从一个“只会聊天的博学书呆子”,真正蜕变成一个能帮你干活的“得力助手”。

作者:伍德安思壮

来源:时间之上

]]>
万字干货!Agent Skills从入门到精通 //m.clubpenjuin.com/380662.html Wed, 15 Apr 2026 00:45:51 +0000 //m.clubpenjuin.com/?p=380662

 

如果你要问我,2026年最值得学习的AI技能是什么?我会毫不犹豫地推荐Skills。

无论是Claude Code,还是龙虾、爱马仕,几乎所有的Agent,如果想把事情干得又快又好,都越来越依赖Skills。

没有Skills的Agent,就像一位刚入职的新同事,你得培训,反复教他。而有了Skills的Agent,则更像是一位老同事,开箱即用,配合默契,非常靠谱。

“同事.skill”可能只是个玩笑,但“work.skill”一定是刚需,是生产力。甚至在我看来,Skills很可能是今年Agent领域最重要的创新之一。

简单理解:模型是大脑,Agent是躯体,而Skills就是双手。

现在,只是学会怎么“问”AI,其实已经有点不够了。更重要的一件事是,学会怎么“教”AI。把你重复做的工作、团队里的隐性知识、那些“只有老员工才知道”的操作细节,封装成一个又一个的.skill文件。

它们会成为你最好的数字同事。不摸鱼,不抱怨,随叫随到,而且越用越顺手。

今天这篇文章,我会试着带大家从入门到精通,彻底搞懂Skills——理解skill,成为skill,超越skill。

如果你是新手,相信一定会大有收获;如果你是老司机,也会看到一些新的启发。

如果觉得有用,欢迎点赞、在看、分享三连。一起学习,一起成长。


1、Skills是什么?——给AI发一本“员工手册”

2025年10月16日,Anthropic首次发布Agent Skills。最初,Skills只能在Claude Code里使用,而且还必须是Claude的Pro付费用户。

Anthropic发布Agent Skills

12月18日,Anthropic把Agent Skills作为统一标准,对外开放,不论你是不是Claude的付费用户,都可以使用。

之后,很快像Codex、Cursor、Antigravity、OpenCode、Trae、Qoder、CodeBuddy等Coding Agent以及Claude Cowork、Skywork、MiniMax Agent、扣子等桌面Agent都陆续支持了Skills。

也包括,2026年春节后爆火的OpenClaw(中文名“龙虾”)和最近大热的Hermes Agent(中文名“爱马仕”),也都支持Skills。

Skills,简单翻译过来就是“技能包”的意思。就像我们人一样,有很多的技能,比如骑车、游泳、开车、烹饪、摄影等。Skills,就是我们人类专门给AI准备的技能包。

Anthropic官方定义:Skills是一套模块化能力,允许开发者通过结构化的文件夹来增强Claude Code的能力。每个Skill都包含一个核心的SKILL.md文件以及相关的辅助资源文件。当用户提出请求Claude Code时,它会根据请求内容和Skill的描述自动判断何时调用相应的Skill来处理这个请求。

用一句话大白话来解释:Skills就是我们专门给AI定制的“标准操作手册(SOP)”。

每个Skill都有一个专门的文件夹(核心文档 SKILL.md),用来放执行指令、资源文件和参考资料等。但千万别小看这个文件夹,它能让AI瞬间从“职场小白”变成“职场老司机”。

为了方便大家理解,我们不妨拿“开一家汉堡店”来打个比方:

  • Prompt就像顾客的点单:“老板,给我做一个牛肉汉堡,不要洋葱!”(指令很明确,但怎么做全看厨师心情)。
  • MCP就像厨房里的工具和食材:它给了AI铲子、平底锅、牛肉饼和面包(AI终于不用空手套白狼了)。
  • Skills是这家店的秘制菜谱+员工守则:“第一步,肉饼必须煎 3分半钟;第二步,酱汁只能挤两圈半;做完后,必须清理灶台!”

Skills规定了动作的先后顺序、质量底线和执行标准。有了它,AI就不再瞎猜你的心思,而是按部就班地干活。

2、拆解Skills的核心架构

简单理解Skills后,我们从文件夹层面来对Skills的架构做一个剖析。

打开Claude Code的安装文件夹(默认是在C盘,文件名.Claude),找到Skills文件目录,通常你会看到这样的文件架构。

「skill-creator」skill的文件夹架构

  • SKILL. md:这是skill的核心指令,包括skill名称、触发条件、任务流程、执行指引等。
  • scripts:用于存放可执行代码(如Python、Bash脚本等)。
  • references:用于存放按需加载的参考文档,比如技术规范、API文档、代码片段、设计指南等,主要是给AI看的。
  • assets:用于存放素材资源,比如模板、字体、图片、logo、背景资料等。

通常,一份标准的Skill结构如下。

skill-name/├── SKILL.md (必需)│   ├── YAML frontmatter (必需)│   │   ├── name: (必需)│   │   └── description: (必需)│   └── Markdown instructions (必需)└── Bundled Resources (可选)    ├── scripts/          - 可执行代码    ├── references/       - 参考文档    └── assets/           - 资源文件

这里面,除了SKILL.md是必选项以外,其他都是可选项,可根据自己的skill需要进行灵活配置。

当Claude Code、OpenClaw这些Agent运行skill时,它会:

  1. 以SKILL.md为第一指引,了解该skill对大模型的要求。
  2. 结合当前的任务情况,判断是否需要调用scripts(代码脚本)、references(参考文档)和assets(素材资源)。
  3. 最后通过“规划-执行-观察”的交错式反馈循环,来完成用户制定的任务要求。

在整个架构中,SKILL.md最为关键,其内部架构如下:

SKILL.md内部剖析(图by苍何)

首先是skill的name,一般用英文和连字符“-”组成,比如一个前端设计skill,其name可以命名为「frontend-design」。

然后是description(描述),这是skill的YAML元数据非常重要的一环。其质量决定了该skill能否被Claude Code准确触发。

比如,Anthropic官方的frontend-design skill,它的description字段内容如下。

「frontend-design.skill」的description字段

翻译成中文,就是:

“创建具有高级设计感的独特的、专业的、可用于实际生产的前端界面。当用户需要开发网页组件、页面或应用程序时,可运用此skill。生成的代码富有创意且精致,避免出现千篇一律的AI风格。”

因此,写好SKILL.md中的description字段非常重要,因为它直接决定了Claude Code会在何种情况下自动触发并加载该skill。如果description写得不清晰或不准确,即使你的skill再强大,AI也可能在需要时“想不起来”使用它。

根据最新的Agent Skills最佳实践和官方指南,以下是写好description 的核心策略和模板:

1)核心原则:触发即正义

Description的首要任务不是给人看的,而是给AI的路由机制看的。它需要明确回答两个问题:

  • 这个skill是做什么的?(功能定义)
  • 用户在什么场景/说什么话时应该使用它?(触发条件)

2)“黄金结构”公式

一个高质量的description通常遵循这个结构:[一句话核心功能] + [具体执行动作] + [明确的触发关键词/场景]。

优秀写法示例:

案例A:代码审查技能

name: security-code-reviewdescription: Reviews code for security vulnerabilities and best practices. Use when the user asks to "review code", "check for bugs", "analyze security", or mentions specific issues like SQL injection, XSS, or performance bottlenecks.

案例B:PDF 处理技能

name: pdf-processordescription: Extracts text, tables, and metadata from PDF files; merges or splits documents. Use when working with PDF files, converting PDFs to text, filling forms, or when the user uploads a PDF and asks for summary/extraction.

简单理解就是,写好description的秘诀在于模拟用户的提问方式。想象一下你会怎么向AI提出请求,然后就把这些请求中的关键词都塞进description里。

通常,一个标准的SKILL.md,其Markdown格式大致是这样:

---name: 你的skill名称description: 简要描述该技能的功能以及何时该使用它---# 你的技能名称## 指令 (Instructions)为 Claude Code 提供清晰、逐步的操作指南。## 目标 (Goal)## 示例 (Examples)展示使用该技能的具体代码或操作案例。

比如,我们随手创建一个「PDF分析」skill,它的SKILL.md设计如下。

---name: pdfdescription: 从PDF文档中提取和分析文本。当用户要求处理或阅读PDF时使用。---# PDF 处理技能:1.使用本文件夹中的extract_text.py脚本提取PDF中的文本:python3 extract_text.py <input_file>2.提取后,请以结构化格式总结要点。

3、Skills的三个“魔法机关”

Skills的核心架构,藏着3个“魔法机关”,彼此协同工作。

比如,这是专门制作视频的Remotion skill的SKILL.md设置:

---name: remotion-best-practicesdescription: Best practices for Remotion - Video creation in Reactmetadata:tags: remotion, video, react, animation, composition---## When to useUse this skills whenever you are dealing with Remotion code to obtain the domain-specific knowledge.
## CaptionsWhen dealing with captions or subtitles, load the [./rules/subtitles.md](./rules/subtitles.md) file for more information.
## Using FFmpegFor some video operations, such as trimming videos or detecting silence, FFmpeg should be used. Load the [./rules/ffmpeg.md](./rules/ffmpeg.md) file for more information.
## Audio visualizationWhen needing to visualize audio (spectrum bars, waveforms, bass-reactive effects), load the [./rules/audio-visualization.md](./rules/audio-visualization.md) file for more information.
## How to useRead individual rule files for detailed explanations and code examples:

它主要靠三个聪明的“机关”来约束AI:

机关一:智能开关(YAML元数据)

每个Skill文件的开头(就是用—包裹的那块),都有一个小小的控制面板,这是Skills的元数据,会始终加载到Claude Code的系统提示中。这就好比技能的“开关”和“权限卡”。

机关二:随用随取的“小抄”(渐进式披露)

过去的AI有个毛病:记性不好。如果我们把公司的所有开发规范都塞给它,它的“短期记忆(上下文窗口)”瞬间就被撑爆了,导致它开始胡言乱语(AI幻觉)。

Skills的设计非常聪明:平时绝不占用脑容量,只在需要时占用。

你写好的几十个Skills,就像存放在书架上的工具书。Claude Code平时不去翻它们,只有当你触发了“测试代码”的技能时,Claude Code才会翻出小抄,只把关于“如何测试”的那张纸加载进大脑。内存省了,思路也无比清晰。

机关三:呼叫外援与影分身(行动导向与子代理)

Skills可不只是让AI读说明书,它还能让AI“动起手来”。

在Skill的指导下,Claude Code可以像人类一样敲击命令行、搜索文件、运行测试。更有趣的是,如果它碰到了一个极其复杂的巨无霸任务,它可以召唤一个“子代理”(Subagent)——就像是它召唤了一个自己的“影分身”,让分身专门去隔壁房间解决那个大难题,搞定后再把结果汇报给自己。

这里面,渐进式披露(Progressive Disclosure)是Skills最牛的的设计哲学。

它让Skills的所有信息不是一次性塞给Claude Code,而是分三层加载,根据需要逐步展示。

层级
内容
加载时机
Token配额
作用
第一层
元数据(name + description
始终在上下文中
约100词
决定skill何时触发
第二层
SKILL.md主体
技能触发后
<5000词
核心工作流程
第三层
配套资源(scripts/references/assets
按需加载
无限
详细参考和可执行代码

这种设计有什么好处?

想象一下,你有一个包含数百页技术文档的Skill。如果每次对话都把这些文档加载进去,对话上下文(Context)很快就会被撑爆。但通过渐进式披露,Claude Code只在需要时才加载相关文档——就像一本组织良好的指南书,你只看需要的章节,而不是从头读到尾。


4、Skills与Prompt、MCP、Agent、Projects的区别

简单认识Skills后,相信你心中一定会有一个疑问:Skills和Prompt、MCP以及Agent、Projects他们之间到底有什么区别?

这里,我简单做了张表,帮助大家理解。

简单来说就是,Skills你可以理解为是预制菜,Prompt是现炒菜,Project是食材,MCP则是物流和外卖系统。通过Skills,做法早就“预设”好了,你只需要点菜名,AI马上就能干活,又快又准,还省钱(Token成本)。

在Claude Code中,一个SKILL.md文件:

  • 包含了超级精细的Prompt(告诉AI目标是什么,怎么做,做到什么效果);
  • 规定了AI可以且只能使用哪些工具、可执行代码(给AI发放特定的武器);
  • 指挥Agent按照1-2-3-4的严格顺序执行,绝不偏离轨道。

5、如何找到好用的Skills?

看到这里,你可能已经按捺不住激动的心情,想要立刻给自己的电脑装上几十个Skills。

这里有3个渠道,供大家获取优质Skills。

1)官方推荐

如果你不想折腾代码,只想开箱即用,这是最好的入口。

在Github上,Anthropic官方已经为你预置了一批极其强大的“基础Skills”。比如专门用来处理几百页复杂数据的xlsx skill,或是能自动排版输出商业演示文稿的pptx skill。你只需要输入一句话,AI就能瞬间掌握了这些高级手艺。

Anthropic Skills:

https://github.com/anthropics/skills

Anthropic官方Skills

这里面,特别是「Skill-creator」,强烈建议你一定要安装一下。这是一个安装skill的skill,在Github上已经超过80k star了。有了它后,今后自己创建任意skill都变得极其简单。

Skill-creator:

https://github.com/anthropics/skills/tree/main/skills/skill-creator

Skill-creator.skill

安装命令超级简单,打开你的Claude Code,在里面输入这句话就可以了。

帮我安装这个skill,仓库地址是:

https://github.com/anthropics/skills/tree/main/skills/skill-creator

skill-creator安装命令

2)开源Skills市场

既然Agent Skills是开放标准,全世界最聪明的开发者自然都在为它添砖加瓦。

agentskills.io:它们就像是AI时代的“应用宝”或“npm软件源”。作为官方推荐的全球技能注册表(Registry),在这里你可以搜到各行各业专家的“心血之作”。

GitHub开源宝藏库:程序员对开源的热情永远最高。你可以直接去GitHub上搜索官方的anthropics/skills仓库,或者社区维护的awesome-agent-skills列表。看到大牛写的优质SKILL.md,直接下载到你的本地文件夹里就能用。

这里,特别推荐一下Github上的「OpenSkills」,这个开源仓库兼容了多个平台,可以自动创建项目规则Markdown文件,“教会”其他AI Agent使用Skills。

OpenSkills项目地址:

https://github.com/numman-ali/openskills

其他skills市场。随着生态的爆发,现在甚至出现了专门针对Skills的商业大卖场,比如skillsmp.com和skillsdirectory.com,也可以找到一些不错的skills。

另外,x上也有很多开发者分享自己的开源skills,可以通过关键词搜索查找。

3)终极来源:自己创建

不要光顾着去外面“淘宝”,全网最好用的Skill,往往是你自己写出来的。

外部下载的技能再好,也是通用的常识;而真正能为你建立商业护城河的,是你自己那些“不外传的业务秘密”:

  • 你们公司特有的代码命名规范;
  • 你们金牌销售应对客户退款的私域话术;
  • 你们财务部处理复杂报销的发票合规底线。

6、手把手教你制作Skills:信息图生成器

日常工作中,我们想要把干巴巴的文字做成精美的可视化信息图,不妨参考这段提示词来生成。

提炼下面文字内容的核心关键点,创建一个HTML网页。
文字内容:
{这里是一段文字}
网页的设计要求如下:
1.视觉设计:采用{Magazine Layout}风格布局,{深色}主题色,营造现代高端氛围。
2.字体与排版:
·使用超大字体或数字突出核心要点,中文采用大号粗体,强调视觉冲击力。
·英文使用小号字体作为点缀,与中文形成比例反差,提升设计层次感。
3视觉元素:
·融入超大视觉元素(如标题、背景图或装饰)以突出重点,与小型元素形成强烈对比。
·使用简洁的勾线风格图形作为数据可视化或配图元素,保持现代感和清晰度。
4.色彩与效果:运用高亮色(单色透明度渐变)营造科技感,每种高亮色独立使用,避免不同高亮色之间的渐变混杂。
5.技术要求:引入专业图标库(如Font Awesome或Material Icons,通过CDN加载),避免使用emoji作为主要图标。
6.内容要求:提炼内容关键要点,不忽略重要细节。

比如,我用这段提示词整理一个模型信息,AI能够给到我一个非常直观的信息图。

Qwen3.6-Plus模型信息图

但如果每次我们都自己去复制提示词,再去AI Chat网站生成,再下载、截图,就很麻烦。

现在,我们不妨用这段提示词来制作一个叫「HTML信息图生成器」的skill,安装到我们的Claude Code或龙虾(OpenClaw)里。以后需要使用时,直接告诉它「调用“HTML信息图生成器.skill”生成xxx」就行。

首先,我们给这个skill取个名字。为了让不同模型更好地认识我们的skill,我们给skill取名字时尽量使用小写英文,而且要语法标准。比如我这个skill的name,就叫做「html-infographic-generator」,每个单词之间用连字符“-”连接。

然后,我们按照前文给大家介绍过的Skills文件结构,给我们的这个skill设计一个架构。信息图生成器需要的文件架构并不多,一般放个必选的SKILL.md文件就可以了。如果需要,你也可以放一些诸如设计指南之类的资源文件在reference文件夹里,以及放些参考示例在assets文件夹里。

html-infographic-generator/├── SKILL.md                    # 入口文档(设计规范+操作流程)├── references/│   └── design-guide.md         # 详细设计指南

取好名字、设计好文件结构后,接下来是最关键的环节,给skill设计SKILL.md文件。“.md”即Markdown格式的意思,是一种非常轻量级的标记语言,旨在用易读易写的纯文本格式编写文档,通常用#、*、-等符号来实现格式化,可以随时转换为HTML/PDF。

SKILL.md通常包含这几个部分。

---name: 你的skill名称description: 简要描述该技能的功能以及何时该使用它---# 你的技能名称## 指令 (Instructions)为 Claude Code 提供清晰、逐步的操作指南。## 目标 (Goal)## 示例 (Examples)展示使用该技能的具体代码或操作案例。

最上面用三个连字符—包裹的区域,叫YAML元数据,包含name和description字段,这是Claude Code或OpenClaw这些Agent用来识别Skill的名片。

比如我们这个「html-infographic-generator」,它的YAML元数据就是:

---name: html-infographic-generatordescription: 从用户文字中提炼核心关键点,生成Magazine Layout风格的深色主题HTML信息图网页;当用户需要将文字内容可视化、创建信息图、生成数据展示页面或制作图文混排页面时使用。---

这段YAML元数据的意思是说,这是一个HTML式的信息图生成器,可以帮助用户把文字生成信息图HTML网页,当用户需要内容可视化、创建信息图、生成数据展示页面或制作图文混排页面时,就会加载这个skill。

这里面的description字段是比较关键的一环,它决定了Agent会在何时自动调用这个skill。

在设计description字段时,一定要坚持用第三人称来写,比如写成“把用户上传的文字生成HTML”,而不是“你帮我把这段文字生成HTML”,这是区别于Prompt一定注意的地方。字数上,一般不超过500字就可以了。不用太多,尽量包含skill触发的关键词就就够了。

写好YAML元数据后,下面是具体的执行指令,一般从Prompt来进行优化,比如我的「html-infographic-generator.skill」,它的执行指令是:

# HTML信息图生成器
## 任务目标- 本 Skill 用于:从用户提供的文字内容中提炼核心关键点,生成视觉冲击力强的HTML信息图网页- 能力包含:文本关键点提炼、信息架构设计、HTML/CSS代码生成、视觉设计实现- 触发条件:用户发送文字内容并希望生成可视化信息图、数据展示页面、图文混排网页
## 设计规范### 1. 视觉设计- **布局风格**:采用Magazine Layout(杂志排版)风格,强调网格系统、留白对比、视觉层次- **主题色调**:深色主题,背景色使用 `#0a0a0a` 或 `#1a1a1a`,营造现代高端氛围- **视觉层次**:通过大小、粗细、位置、色彩对比建立清晰的信息层级
### 2. 字体与排版- **中文文本**:使用大号粗体(60-120px),突出核心要点,强调视觉冲击力  - 标题字体:`font-weight: 700-900`  - 推荐字体:Noto Sans SC、Source Han Sans(通过Google Fonts加载)- **英文文本**:使用小号字体(12-16px)作为点缀,与中文形成比例反差  - 字体选择:Roboto、Inter、SF Pro Display  - 用途:副标题、注释、装饰性文字- **行高与间距**:  - 标题行高:1.1-1.3  - 正文行高:1.6-1.8  - 段落间距:使用em或rem单位保持比例一致性
### 3. 视觉元素- **超大视觉元素**:融入超大标题、背景图或装饰元素以突出重点  - 标题字号可达120-200px  - 背景图使用低透明度(10-30%)避免干扰文字- **对比原则**:超大元素与小型元素形成强烈对比- **图形风格**:使用简洁的勾线风格图形作为数据可视化或配图元素  - 可使用CSS绘制几何图形(圆、线、矩形)  - SVG图标保持线条简洁(stroke-width: 1.5-2px)
### 4. 色彩与效果- **基础色板**:  - 背景:`#0a0a0a``#1a1a1a`  - 主文字:`#ffffff``#f0f0f0`  - 次要文字:`#888888``#666666`- **高亮色方案**(单色透明度渐变):  - 青色系:`rgba(0, 255, 255, 0.8)` → `rgba(0, 255, 255, 0.1)`  - 洋红系:`rgba(255, 0, 255, 0.8)` → `rgba(255, 0, 255, 0.1)`  - 金色系:`rgba(255, 215, 0, 0.8)` → `rgba(255, 215, 0, 0.1)`  - 绿色系:`rgba(0, 255, 128, 0.8)` → `rgba(0, 255, 128, 0.1)`- **渐变规则**:每种高亮色独立使用,避免不同高亮色之间的渐变混杂- **科技感营造**:使用透明度渐变、发光效果(box-shadow)、渐变边框
### 5. 技术要求- **图标库**:引入Font Awesome或Material Icons(通过CDN加载)  ```html  <!-- Font Awesome -->  <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.0/css/all.min.css">
  <!-- Material Icons -->  <link href="https://fonts.googleapis.com/icon?family=Material+Icons" rel="stylesheet">  ```- **字体库**:引入Google Fonts  ```html  <link href="https://fonts.googleapis.com/css2?family=Noto+Sans+SC:wght@400;700;900&family=Roboto:wght@300;400;700&display=swap" rel="stylesheet">  ```- **禁止使用emoji**:避免使用emoji作为主要图标,统一使用专业图标库
### 6. 内容要求- **关键点提炼**:  - 识别核心主题、关键数据、重要结论  - 保留重要细节,不遗漏关键信息  - 合理分组,建立信息层次- **信息架构**:  - 主标题:最核心的信息  - 副标题:补充说明或引导  - 正文段落:详细阐述  - 数据/列表:结构化展示
## 操作步骤### 步骤1:文本分析与关键点提炼- 阅读用户提供的文字内容- 识别核心主题、关键数据、重要结论- 提炼3-8个核心关键点- 确定信息优先级和层次关系
### 步骤2:信息架构设计- 确定主标题内容(最核心信息)- 规划副标题和正文段落- 设计数据展示方式(数字、列表、图表)- 确定视觉元素布局(标题位置、装饰元素、留白区域)
### 步骤3:HTML代码生成- 引入必需资源(Font Awesome、Google Fonts)- 编写HTML结构:  ```html  <!DOCTYPE html>  <html lang="zh-CN">  <head>      <meta charset="UTF-8">      <meta name="viewport" content="width=device-width, initial-scale=1.0">      <title>信息图</title>      <!-- 引入资源 -->  </head>  <body>      <!-- 内容结构 -->  </body>  </html>  ```- 编写CSS样式:  - 基础样式(重置、字体、颜色变量)  - 布局样式(网格系统、容器、间距)  - 组件样式(标题、段落、卡片、图标)  - 效果样式(渐变、阴影、动画)
### 步骤4:输出与交付- 生成完整的HTML文件(包含内联CSS)- 确保代码格式规范、注释清晰- 使用write_file工具保存文件到用户工作目录
## 资源索引### 设计指南- 详细设计规范:见 [references/design-guide.md](references/design-guide.md)- 包含:Magazine Layout风格说明、配色方案、布局模板、最佳实践
### HTML模板- 基础模板:见 [assets/template.html](assets/template.html)- 包含:基础结构、资源引入、示例样式、常用组件
## 注意事项### 设计原则- **视觉冲击力优先**:通过超大字体、强对比、高亮色营造视觉焦点- **留白即设计**:充分利用留白创造呼吸感和高级感- **克制使用色彩**:深色背景+单一高亮色系,避免色彩混乱- **移动端适配**:使用响应式设计,确保在不同设备上的可读性
### 技术实现- 所有样式内联在HTML文件中,确保文件可独立运行- 使用CSS变量管理颜色和间距,便于维护- 优先使用CSS实现视觉效果,减少对外部图片的依赖- 确保代码结构清晰、注释充分
### 内容处理- 不遗漏重要细节,但避免信息过载- 使用视觉层次引导阅读顺序- 数据类内容优先使用数字+图标+简短说明的形式
## 使用示例### 示例1:产品数据展示**输入**:用户发送某产品年度销售数据文字描述**处理**:1. 提炼核心数据:总销量、增长率、市场份额等2. 设计信息架构:主标题(核心数据)+ 数据卡片(详细指标)3. 生成HTML:使用超大数字展示、渐变背景、图标装饰**输出**:完整的HTML信息图文件
### 示例2:知识要点总结**输入**:用户发送某主题的知识内容或文章**处理**:1. 提炼3-5个核心知识点2. 设计信息架构:主标题 + 要点列表 + 补充说明3. 生成HTML:使用编号列表、图标标记、卡片布局**输出**:结构化的HTML信息图
### 示例3:事件时间线**输入**:用户发送某事件的发展过程描述**处理**:1. 提炼关键时间节点和事件2. 设计信息架构:时间线布局 + 事件卡片3. 生成HTML:使用垂直/水平时间线、节点标记、渐变效果**输出**:时间线风格的HTML信息图
这里面有skill的任务目标、设计规范、操作步骤、资源索引、注意事项和使用示例。详细规范了skill应该如何工作、执行和输出,全程用Markdown格式来写。

为了让Agent更好的理解这个skill,我还建了一个references参考文件夹,里面放了一个信息图设师指南design-guide.md。

# HTML信息图设计指南
## 目录1. [Magazine Layout风格说明](#magazine-layout风格说明)2. [深色主题配色方案](#深色主题配色方案)3. [字体排版最佳实践](#字体排版最佳实践)4. [视觉元素设计原则](#视觉元素设计原则)5. [常见布局模板](#常见布局模板)---## Magazine Layout风格说明### 核心特征Magazine Layout(杂志排版)风格借鉴传统杂志的视觉设计,强调:- **网格系统**:基于列的布局,创造有序的视觉结构- **留白对比**:大量留白突出内容,营造高级感- **视觉层次**:通过大小、粗细、位置建立清晰的信息优先级- **图文混排**:文字与视觉元素有机结合,增强表现力
### 设计要点#### 1. 网格系统```css/* 基础网格布局 */.container {    display: grid;    grid-template-columns: repeat(12, 1fr);    gap: 24px;    max-width: 1400px;    margin: 0 auto;    padding: 40px;}
/* 内容区域 */.content-wide {    grid-column: span 12;  /* 全宽 */}
.content-main {    grid-column: span 8;   /* 主内容 */}
.content-side {    grid-column: span 4;   /* 侧边栏 */}```
#### 2. 留白运用- 页面边距:40-80px- 元素间距:24-48px- 段落间距:1.5-2em- 列表项间距:12-20px
#### 3. 视觉层次```Level 1: 超大标题 (120-200px) - 最核心信息Level 2: 大标题 (48-72px) - 重要章节Level 3: 中标题 (24-36px) - 段落标题Level 4: 正文 (16-18px) - 详细内容Level 5: 辅助文字 (12-14px) - 注释、说明```
design-guide.md全文太长,详细略(需要全文版可私信我)

这个design-guide.md详细阐述了设计风格、设计要点、页面布局模板以及设计检查清单。你可以理解为,这是skill的注释文件,它帮助skill理解这个技能任务。

整个就这2层结构、2份文件构成了我们的html-infographic-generator.skill,它可以将任何文字生成顶级审美的信息图。

无需输入Prompt,直接给文字就行。可以是链接,可以是附件,也可以是一大段文字,Agent会自己总结、提炼,生成顶级审美的信息图HTML,特别适合做产品介绍、宣传方案、新媒体素材等可视化内容。

这个skill,我已免费放在了扣子技能商店,输关键词「HTML信息图生成器」查找,可以直接调用。

在扣子商店调用

Skill地址:

https://www.coze.cn/?skill_share_pid=7614920172729843731


7、安装公开的skill

除了自己制作skill外,我们也可以安装公开的skill。

通常,skill会放在GitHub这个全球最大的代码开源社区上,比如Anthropic的一些开源skill,它就统一放在这里。

Anthropic的开源skill

仓库地址:

https://github.com/anthropics/skills/tree/main/skills

除了Github,还有一些专门的skill市场也放了不少skill。

比如:

https://www.skillhub.club

https://agentskills.io

https://skillsmp.com

https://www.skillsdirectory.com

https://skillhub.tencent.com

安装skill也很简单,打开你的Claude Code或OpenClaw,在里面输入这句话就可以了。

帮我安装这个skill,仓库地址是:

https://github.com/anthropics/skills/tree/main/skills/skill-creator

这个「Skill-creator」,建议每个人都安装一下,它是一个专门创建skill的Skill,在Github上已经有超过80k star了。

有了它后,今后自己创建Skill变得极其简单。比如,我们只需要输入这样一句话:

用creator skill帮我创建一个word转PPT的skill。

Agent会自己去设计框架、skill.md和运行脚本,帮你把这个skill创建好。


8、写在最后

根据Anthropic官方文档和社区实践,创建并部署一个skill通常包含四个阶段。

阶段一:明确需求与边界

在动手前,先回答清楚这三个问题:

1)这个skill要解决什么具体问题?原则是“单一职责”,每个skill只专注一个能力。例如,“处理PDF”太宽泛,而“从PDF中提取表格并转换为CSV”就是好的定义。

2)触发它的关键词/场景是什么?这将决定description字段的写法,而description是Agent判断是否调用该skill的唯一依据。不要写“帮助处理文档”,而要写“当用户提到PDF、表单或文档提取时,用于从PDF中提取文本和表格”。

3)需要哪些资源?脚本、模板、参考文档还是示例数据?把这些提前整理好,放入skill文件夹的对应子目录(如scripts/、references/、assets/)。

阶段二:构建skill文件夹

在确定了需求之后,就可以创建skill的文件结构了。根据使用场景,你可以选择三个存放位置。

类型
路径
使用场景
个人skill
~/.claude/skills/
个人工作流优化、实验性功能
项目skill
.claude/skills/
团队协作、项目特定知识
插件skill
通过插件系统安装
跨项目共享、公开发布

核心文件SKILL.md的结构如下:

---name: your-skill-namedescription: 清晰描述Skill的功能和触发场景,最多1024字符。allowed-tools: Read, Grep  # 可选:白名单工具列表---# Skill标题## 功能说明为Claude提供清晰的分步操作指导
## 使用示例展示具体应用场景和方法
## 注意事项边界条件、常见陷阱等

命名规范:name字段仅使用小写字母、数字和连字符,不超过64个字符。文件夹名称须与name一致。

阶段三:编写核心指令

这是决定skill质量的关键步骤。Anthropic内部团队的经验表明,最有价值的内容是“常见陷阱”章节——应持续累积Agent的失败模式,让后来者可以直接绕坑。

一个高质量的SKILL.md通常包含以下要素:

1)明确的职责边界:告诉Agent能做什么和绝对不能做什么。例如,一个SQL分析skill应明确限定只能执行SELECT查询,禁止DROP、DELETE 等危险操作。

2)具体的操作步骤:用编号列表而非段落文字。Agent对结构化内容的遵循度远高于叙述性文字。

3)输入输出规范:给出示例格式和预期输出,这能显著降低结果的随机性。

4)硬性约束:使用“必须”“严禁”“总是”等绝对化词汇。研究发现,包含至少3条明确约束和1个输出示例的skill,其结果的稳定性可提升60%。

阶段四:测试、调试与迭代

创建完成后,按以下清单验证:

  • 路径检查:确认SKILL.md位于正确的目录(.claude/skills/<skill-name>/)。
  • YAML校验:确保元数据格式正确,—包裹无误。
  • 触发测试:用自然语言提问,观察Agent是否识别并请求使用该skill。
  • 执行验证:检查输出是否符合预期格式和内容。

如果skill未被触发,90%的情况是description写得不够具体。调试时可运行claude –debug查看详细加载日志。

希望今天这篇文章,能帮你对Skills建立起一个更系统的认知。

但比“理解”更重要的是亲手去做,尝试去写出你的第一个.skill,把那些重复的工作、熟悉的流程、甚至是你自己的经验,慢慢沉淀成可以复用的能力。

当你真正开始制作skill的那一刻,很多关于Agent和Skills的理解,都会变得清晰起来。

如果你觉得这篇内容对你有所启发,也欢迎点赞+在看+分享三连支持一下。

我是冷逸,努力给大家分享一些有用、有趣的AI干货,我们下期再见。

作者:沃垠AI

来源:沃垠AI

]]>
网易云音乐Agent Skills测评 //m.clubpenjuin.com/380180.html Wed, 25 Mar 2026 01:54:22 +0000 //m.clubpenjuin.com/?p=380180

 

你是否有过这样的困扰:想听歌但不知道听什么,歌单里收藏了几百首歌却懒得整理,在终端里工作时还得切出去找歌曲?

最近,网易开源了一个有意思的项目——Agent Skills,专门为AI Agent打造的音乐技能包。它能把网易云音乐搬进命令行,让AI成为你的私人音乐管家。今天我们就来实测一下,看看它到底值不值得用。

 产品速览:3分钟了解核心信息

网易云音乐 Agent Skills 是网易云音乐团队开源的AI Agent技能包,基于 ncm-cli 命令行工具实现智能化音乐管理。

核心定位:将网易云音乐的能力封装成模块化的AI技能,让大模型能够调用音乐服务

开发背景

  • 项目地址:https://github.com/NetEase/skills
  • 技术栈:Python 100%
  • 依赖环境:Node.js ≥ 18

核心功能一览

  • 智能音乐推荐
  •  歌单管理(创建、添加、查看)
  •  歌曲/歌单/专辑搜索
  •  每日推荐获取
  •  用户信息查看

技能模块架构

  • ncm-cli-setup:安装配置模块,负责引导用户完成ncm-cli的安装和API配置
  • netease-music-cli:CLI操作模块,提供搜索、歌单管理等底层能力
  • netease-music-assistant:智能助手模块,基于用户画像进行个性化推荐

核心功能:这3个亮点最值得关注

1. 智能推荐引擎

这是最核心的功能。Agent Skills不只是机械地响应”播放某首歌”,而是能真正理解你的音乐偏好。它会分析用户的红心歌单,生成多维度的用户画像:

  •  曲风标签(流行、摇滚、民谣、电子等)
  •  情绪方向(欢快、舒缓、励志等)
  •  语言偏好(中文、英文、日语等)
  •  代表艺人

基于这些画像,AI会自动制定搜索策略,多关键词并行搜索,自动过滤掉已推荐和已收藏的内容,真正实现”懂你”的推荐。

2. 三层模块化架构

项目的架构设计非常清晰,层级分明:

智能助手层(netease-music-assistant)
        ↓ 调用
CLI操作层(netease-music-cli)
        ↓ 依赖
配置安装层(ncm-cli-setup)

这种设计有什么好处?每个模块都可以独立使用和测试。如果你只需要基础的命令行操作,只需要安装 netease-music-cli;如果你想让AI更懂你,就加上智能助手模块。

3. 自然语言交互

传统命令行工具需要记住各种命令参数,而Agent Skills支持自然语言。你可以说”帮我找一首适合跑步时听的歌”,AI会理解你的意图,自动选择搜索策略并返回结果。这种交互方式对非技术用户更友好。

 实测体验:真实使用感受

优点

  •  安装相对简单:三条命令完成基础安装,有详细的文档指导
  •  推荐确实智能:分析红心歌单后,推荐的歌曲符合个人口味
  •  返回可点击链接:搜索结果直接提供网易云音乐链接,方便跳转播放
  •  模块化设计:架构清晰,可以按需选择功能模块

缺点

  •  配置稍显复杂:需要申请网易云音乐开放平台的API Key(appId和privateKey),对普通用户有一定门槛
  •  依赖Node.js环境:如果没有Node.js基础,需要先安装配置
  •  登录可能超时:首次登录授权有时需要多次尝试
  •  无播放功能:目前只支持搜索和管理,暂不支持直接在命令行播放音乐
  •  开源信息有限:LICENSE协议未明确说明,项目维护状态不明

 竞品对比:和NeteaseCloudMusic相比怎么样

对比维度 Agent Skills NeteaseCloudMusic
编程语言 Python Python
交互方式 AI智能助手 + 自然语言 命令行参数
核心功能 智能推荐 + 搜索管理 搜索 + 播放控制
安装难度 需配置API Key 相对简单
播放支持  不支持  支持
歌单管理  支持  支持
推荐能力  AI个性化推荐  无
项目定位 AI Agent技能包 命令行客户端

结论:如果你追求智能推荐AI交互体验,Agent Skills更胜一筹;如果你需要直接播放音乐,NeteaseCloudMusic更实用。两者定位不同,可以互补使用。

适合人群:这些人最值得尝试

强烈推荐

  •  程序员/技术爱好者:习惯在终端操作,追求效率最大化
  •  AI开发者:正在构建音乐类AI应用或Agent系统
  •  内容创作者:需要快速搜索背景音乐或特定风格歌曲
  •  效率党:希望用自然语言管理音乐,不想记复杂命令

 不太适合

  •  纯听歌用户:直接用网易云音乐APP体验更完整
  •  电脑小白用户:需要一定技术基础配置环境
  •  移动端用户:主要面向命令行场景

 使用技巧:让你效率翻倍的5个秘诀

技巧1:先完善红心歌单再推荐

在让AI推荐之前,先整理好自己的红心歌单。红心歌曲越多,AI分析出的用户画像越准确,推荐结果越精准。

技巧2:用自然语言描述需求

不要局限于关键词搜索。试试”帮我找一首适合工作学习的轻音乐”或”推荐一些90年代经典华语歌”,AI能理解更复杂的意图。

技巧3:并行安装Node.js和ncm-cli

提前安装好Node.js ≥ 18版本,可以省去很多配置麻烦。使用 node -v 检查版本。

技巧4:遇到登录问题不要慌

如果提示”command not found”,先检查npm全局bin是否在PATH中。如果登录超时,重新执行 ncm-cli login 即可。

技巧5:模块按需组合

不需要一次性安装所有模块。只需要搜索功能?只用 netease-music-cli 就够了。想体验智能推荐?再加上 netease-music-assistant。

 总结:值不值得用

综合评分⭐⭐⭐☆☆(3.5/5)

核心优势

  • AI驱动的智能推荐确实比传统搜索更贴心
  • 模块化架构设计清晰,易于扩展
  • 自然语言交互降低了使用门槛

明显不足

  • API Key申请流程对普通用户不友好
  • 不能直接播放音乐,场景受限
  • 开源协议和长期维护情况不明

最终推荐

如果你是一个技术爱好者、程序员或AI开发者,想打造自己的音乐AI助手或Agent系统,这个项目值得一试。它提供了一个不错的基础框架,智能推荐功能也相当实用。

但如果你只是一个普通用户,想在电脑上听歌听歌,直接使用网易云音乐官方客户端会是更好的选择。

]]>
Agent Skills 终极指南:入门、精通、预测 //m.clubpenjuin.com/378795.html Thu, 22 Jan 2026 01:26:22 +0000 //m.clubpenjuin.com/?p=378795

 

Claude Skills 的价值,还是被大大低估了。

一个好 Skill 能发挥的智能效果,甚至能轻松等同、超越完整的 AI 产品。任何不懂技术的人,都能开发属于自己的 Skills。

比如我自己做的 Article-Copilot,一个 skill 就实现了从素材处理到正文写作的 Agent 应用;

又如 AI Partner Skill,让通用 Agent 深度学习你的记忆,塑造懂你的 AI 伴侣,给到个性回应。

在研读 Anthropic 官方技术博客,与持续 Agent Skill 实验之后,形成了这份全网最完整的 Skill 指南,包含:

  1. 1.最容易读懂的 Skills 概念与原理介绍
  2. 2.讨论 Skills 的真实价值、技术优势、对 AI 产品设计的影响
  3. 3.非常完整的 Skills 使用与开发教程
  4. 4.Skills 的场景识别,什么时候适合开发、使用 Skills?

从概念澄清、运作机制,到实践教程、应用价值,与你在本期分享。

一、Skills 是什么:从概念来源到运作原理

2025 年 10 月中旬,Anthropic 正式发布 Claude Skills。

两个月后,Agent Skills 作为开放标准被进一步发布,意在引导一个新的 AI Agent 开发生态。

OpenAI、Github、VS Code、Cursor 均已跟进。

为了更好的理解,你可以把Skills 理解为“通用 Agent 的扩展包”:

Agent 可通过加载不同的 Skills 包,来具备不同的专业知识、工具使用能力,稳定完成特定任务。

最常见的疑惑是:这和 MCP 有什么区别?

  • MCP是一种开放标准的协议,关注的是 AI 如何以统一方式调用外部的工具、数据和服务,本身不定义任务逻辑或执行流程。
  • Skill则教 Agent 如何完整处理特定工作,它将执行方法、工具调用方式以及相关知识材料,封装为一个完整的「能力扩展包」,使 Agent 具备稳定、可复用的做事方法。

以 Anthropic 官方 Skills 为例:

  • PDF:包含 PDF 合并、拆分、文本提取等代码脚本,教会 Agent 如何处理 PDF 文件 – 提取文本,创建新的 PDF、合并或拆分文档。
  • Brand-guidelines:包含品牌设计规范、Logo 资源等,Agent 设计网站、海报时,可参考 Skill 内的设计资源,自动遵循企业设计规范。
  • Skill-Creator:把创建 Skill 的方法打包成元 Skill,让 AI 发起 Skill 创建流程,引导用户创建出符合需求的高水准 Skill。

Skill-Creator:教 Agent 如何帮用户创建新 Agent 的技能

但 Skills 的价值上限,远不止于此。

它应该是一种极其泛用的新范式,从垂直 Agent 到 AI 产品开发:借用通用 Agent 内核,0 难度创造具备通用 AI 智能的垂直 Agent 应用。

本文开头提到的 article-copilot、AI Partner Skill,就是对这种可能性的验证。

让我们从 Skill 的运作原理讲起。

首先,如何理解 Skill?

Anthropic 说:

Skills 是模块化的能力,扩展了 Agent 的功能。每个Skill 都打包了 LLM 指令、元数据、可选资源(脚本、模板等),Agent 会在需要时自动使用他们。

我有个更直观的解释:Skill 就像给 Agent 准备的工作交接 SOP 大礼包:

想象你要把一项工作交给新同事。若不准口口相传,只靠文档交接(而且你想一次性交接完成,以后不被打扰),你会准备什么?

  • 任务的执行 SOP 与必要背景知识(这件事大致怎么做)
  • 工具的使用说明(用什么软件、怎么操作)
  • 要用到的模板、素材(历史案例、格式规范)
  • 可能遇到的问题、规范、解决方案(细节指引补充)

Skill 的设计架构,几乎是交接大礼包的数字版本:

相对标准的 Skill 结构示例,实际案例中,只有 SKILL.md 是必需的,其他结构为可选项

在 Skill 中,指令文档用于灵活指导,代码用于可靠性调用,资源用于事实查找与参考。

当 Agent 运行某个 Skill 时,就会:

  1. 1.以 SKILL.md 为第一指引
  2. 2.结合任务情况,判断何时需要调用代码脚本(scripts)、翻阅参考文档(ref.)、使用素材资源(assets)
  3. 3.通过“规划-执行-观察”的交错式反馈循环,完成任务目标

当然,Skill 也可以用来扩展 Agent 的工具、MCP 使用边界,通过文档与脚本,也可以教会 Agent 连接并使用特定的外部工具、MCP 服务。

举个例子,这是 PPTX Skill 的文件目录:

  • 整个文件夹就是一个完整的能力包,用来支持 AI 创建、编辑和分析 PowerPoint 演示文稿。
  • 核心文件是SKILL.md,包含技能的元数据和任务指导,告诉 agent 什么时候使用这个技能、如何按步骤处理任务。特别的,独立子技能往往会被拆为子文档(如教AI 把 html 导出为 pptx 流程的html2pptx.md),以避免一次性加载过长的 skill 文档,节省上下文窗口
  • Scripts/包含 Agent 可用的各类预先写好的程序脚本,比如 html 转 pptx 的一键程序脚本。这样 Agent 运行任务时就无需临时开发工具,直接调用,节省 tokens ,避免出错,提升速度
  • 也有一些参考文档(此项目打包的不算规范,但根据 SKILL.md ,Agent 也能理解哪些文档可以参考),比如 ooxml.md,是对 ooxml 格式文件的解析指南

整个 Skill 以简明的形式,把技能指引文档、代码脚本、参考文档和可用资源组合,定向扩展了 Agent 完成 pptx 生成相关的工作能力。

Skills 的真实价值:垂直 Agent 的未来态

看好 Skills 价值与未来生态发展的原因是,Skills 与其他 AI 应用开发方式,有底层机制的不同:

人给出专业知识与工具方法,通用 Agent 提供智能,自主理解,主动执行。

说人话就是:人给指引,最终 Agent 还能根据自己的智力看着执行。

而且「Agent + 文件」的形式,足够泛用。

这就相较于它的前辈们(Workflow 和程序编写的 AI 应用)有了3 个关键优势:

  • 非技术人员可用零代码、自然语言编写
  • 能突破预设限制,灵活响应用户输入,应对边缘情况
  • 甚至能多个 Skill 自由联用,应用方式极其灵活

这一部分可能会比较深入,但例证完善,实际上不会很难懂。虽一家之言,但仍有助于理解 Skill 价值与 Agent 发展趋势

1. 零代码、自然语言,编写真·智能 Agent

纵观此前的 AI 应用开发方法:

  • 不必多说程序编写的 AI 应用,必须懂程序逻辑、懂技术实现。
  • 即便是 Coze、Dify、N8N 等近年流行的 Workflow 平台,也得理解节点配置、条件分支,仍算「编程」,只是界面友好一些。

而 Skills 的创建门槛,完全不同:入门门槛极低,智能上限极高。

1)最简单的,以 Anthropic 的 brand-guidelines skill 为例

仅有一个 SKILL.md,纯自然语言写成。

  • 元信息:什么时候用这个 Skill
  • 正文:品牌颜色、字体等文本描述信息

但足以引导 Agent 变成符合 Anthropic 品牌设计的垂直 Agent,可用于品牌官网、海报、PPT 设计。

当你要设计一个符合 Anthropic 公司设计规范的 AI 搜索网站,Agent 就会自动运行该 Skill ⬇️

Skill 有两种加载模式:显式 / 隐式。

前者通过 user query 直接指定调用;后者根据任务与元信息描述的相关性,LLM 自动匹配。

这是该 skill agent 一次性开发的网站,调性接近 Claude 官网设计:

(我电脑上缺了他家的 Serif 字体,实际上可以更像)

2)复杂的,以 AI-Partner Skill 为例,一个 Skill 就是一个复杂 Agent

包含 SKILL 文档、向量数据库构建指南、向量数据库使用脚本、AI 伴侣与用户的 Persona 模板资源

SKILL.md本体依然由自然语言写成:

借此,Agent 就能理解 AI-Partner 的初始化与对话方法,引导用户上传包含个人记忆的文档预料,在用户端智能切分笔记片段,构建向量数据:

解析用户记忆文档,提炼个性化的 AI 伴侣与用户画像设定:

最终智能检索用户记忆,提供懂用户的 AI Partner 对话体验:

这能基本验证:单靠 Skill + Agent 所构造的垂直 Agent,所实现的智能效果,无异甚至可超过同类 AI 产品。

而做这些垂直 Agent,都不用编写程序代码。

非技术出身的领域专家,离自己做专业 Agent 只剩隔着一层窗户纸——

把你的专业经验和工作流程,用文档形式写清楚,Agent 就能照着执行。

2. 突破预设限制,灵活应对实际情况

Agents Skill 的这一优势往往被忽视。

Workflow 或 传统程序 的核心问题是,它们假设所有情况都能预设。

比如基于用户记忆的 AI 个性化助理,往往需要提前设定:

  • 用户导入记忆文件的入口
  • 允许用户上传的文件格式
  • 数据应该包含哪些字段

以及可能出现哪些特殊情况,每种情况如何处理。

但现实往往是:

  • 需要教育用户在哪点击「导入」
  • 用户只有预期之外的格式:预期支持 md,但实际只有 doc
  • 数据字段不符:预期每个文件需要一个标题,但用户文件没有标题

或者出现了预设之外的边缘情况。

这时 Workflow 或传统程序就卡住了,它只能按预设路径执行,遇到意外就报错,或要求用户自行消除差距。

而通用 Agent + Skill 应用的运作方式完全不同:

  • 能在统一的对话框,接收各类用户数据(文本、文件、图片)
  • 能自主调用其他 Skill,或即时编写 doc2md 脚本,自动转换用户格式
  • 能提炼补充每个文件的标题,完成数据入库处理
  • 能基于 LLM 的推理智能,弥合各类边缘问题

用 Skill 做的垂直 Agent,以 Skill 的知识与方法为指引,能巧借 Agent 内的 LLM 智能,灵活应对各类问题。

所以在 AI-Partner-Chat 中,也有过很有意思的探索:

借 Agent 本身的“观察-规划-执行”的动态智能,对用户文档进行自适应切片,而非所有文件都按照固定的分隔符 or 字数切分。

(DailyNotes 按照日期标题切分;项目笔记按照标题级别与语义切分)

这样能得到更符合实际情况的 RAG 切片。

3. 多 Skills 自由联用

Agent Skills 实质仍是 Context 工程,Skills 只是把垂直领域的知识、脚本调用方法等挂载到 Agent 的上下文窗口。

所以 Skills 在实际应用中极其灵活,甚至在一次任务中能调用多个 Skill。

比如:

  • 联用brand-guidelines + pptx,自动制作符合品牌规范的 pptx
  • 联用AI-Partner-Chat + Article-Copilot,写出更符合个人思考与文风的内容

也可以是更复杂的场景,如做一份产品分析报告:

  1. 1.从网页抓取竞品数据(Web Scraping Skill)
  2. 2.提取 PDF 中的用户反馈(PDF Skill)
  3. 3.分析数据并生成图表(Data Analysis Skill)
  4. 4.按品牌规范制作 PPT(Brand Guidelines + PPTX Skill)

每多一个 Skill,就多一种能力,N 个 Skill 可以应对远超 N 的应用场景。

☞ Skills 核心运行机制:渐进式披露

这节旨在讲解 Skills 运作的核心机制之一:渐进式披露。

整体更偏技术理解,如果只是想用 or 做 Skill,可以滑到下一部分

正如有效的 Context 工程所论证的,上下文过长容易导致模型能力下降。

由于 Skills 的本质就是 Context 工程,所以这个问题也需在 Skill Agent 中注意。

一个完整装载了 Skill 的 Agent 架构是这样的:

Skill 包放在 Agent 文件系统(右侧)中,并非默认全量加载在 Context Window 中。

根据 Context 加载顺序、优先级的不同,Skill 被划分为了 3 种层级:

Skill 内容物的 3 种渐进披露优先级

渐进披露的流程图解

1)Level 1(元数据,始终加载):

SKILL.md文档内的元数据,包含名称与用途描述。长度约 100 tokens。

Agent 启动时,就在 Context Window 中加载 Skill 元数据,将其包含在系统提示中。

AI 通过理解用户消息与 Skills 元数据的匹配情况,判断是否需要自动使用技能。

—name: pdfdescription: 全面的 PDF 操作工具包,用于提取文本和表格、创建新 PDF、合并/拆分文档以及处理表单。当 Claude 需要填写 PDF 表单或大规模地程序化处理、生成或分析 PDF 文档时使用。—

默认只加载元数据 → 意味着可以给一个 Agent 同时安装很多 Skills 但不影响上下文性能。

2)Level 2(指令,触发时加载):

SKILL.md文档内的正文内容,也就是主要技能指令,一般包含工作流程、最佳实践和指导。

建议少于 5000 tokens。

当用户发出的消息与Skill 元数据的描述匹配,需要调用 Skill 时,Agent 才会用 bash 读取文档正文 。读取时文档内容加载到 Context Window 中。

SKILL.md 的结构:分为 YAML 元数据与 MD 正文

3)Level 3(子技能指令/资源 / 代码,按需动态加载):

由子技能文档、代码脚本、参考文档、可用资源等文件构成。

也有 Agent Skill 规范文档将它们统称为「Resource」。相对来讲,Level 3 结构要求没那么严谨。

    • Sub-SKILL.md 子技能文档:相对独立、复杂的子技能指令,单独放在 Level3 拆分加载

  • 随着一个 Skill 的复杂度提升,可能因为技能知识的上下文过长,或者有些知识仅在特定场景使用,而不适合放入单个SKILL.md,可被分拆为独立指令文档,仅在必要时加载。
  • Scripts 代码脚本:视作“Agent 的可执行资源”,而不算 tool use(tool use 是 Agent 外部调用的独立服务)Agent 在 Agent 电脑(虚拟机)中直接调用脚本,脚本代码本身不进 Context Window,只有脚本运行完成后的输出会进 Agent 的 Context。
  • Reference 参考文档、Assets 可用资源,当然都是 Level 3,仅在必需时动态读取加载。

Level 3 因为按需加载的特性,文件在被访问前不会占用 Context 长度,所以没有内容大小限制,可按业务实际说明需要添加材料。

⬇️

小结:整个 Skill 运行过程中,Agent 自动判断哪些技能与任务相关,根据 skills 的元信息,动态判断、加载完成任务所需模块:

Level 1: SKILL.md 元数据(name + description) ↓Level 2: SKILL.md 完整内容 ↓Level 3: Resources 中的具体文件(按需读取)

公众号@言午在《Claude Skills背后的信息分层设计哲学》一文中,亦有形象的图解:

不过,即使 Agent Skill 支持「渐进式披露」。

但在商业化的 Agent 产品中,单个或多个 Skills 联用,如何稳定控制运行过程中的 Context 长度,依然是绕不过的工程问题。

☞ Skills 对 AI 产品设计的影响

我先和在做 Agent 平台的朋友@付铖讨论了一个问题:

基于 Skills 做的垂直 Agent 应用,会不会有依赖推理,响应速度降低的问题?

我俩是在 Mulerun Agent 开发者闭门会认识的,当时觉得他的 Agent 认知相当深刻。他负责的正是 Mulerun 平台的产品策划与研发。

他给了一组很有意思的启发:

  1. 1.Skills 是一种非常宽容的 Agent 设计架构
  2. 2.Skills 可以被设计为很多 tokens 的指令文档,引导模型思考;也可以是无需思考的简单指令,直接指向可直接运行的脚本代码
  3. 3.因为 Skills 能直接调用代码逻辑,不进 Context 窗口。所以用 skill 也不需要 agent 一直推理,agent 也可以只承担类似 hook 的角色,实质上和正常程序运行并无差别
  4. 4.所以 Skills 慢起来可以是 prompt,快起来也可以是 workflow

另外,再结合两个趋势的极端判断:

  1. 1.token 价格会下降
  2. 2.agent 速度会提升

这么看来,以 Skills 为基础的垂直 Agent,在性能、开销上的问题,也不是不可解决的持续性问题了。

所以,进一步推演未来 ai native 产品的发展趋势,我目前的猜测是:

拿笔记类 APP 举例,大部分 APP 的逻辑还是:新笔记 -> 代码 -> 处理。新笔记完全用代码逻辑,原模原样直接入库。

但如果是 ai native 式的笔记 APP,他们可能会内置一些类似 skill 的指引,包括笔记入库、智能纠错、冗余笔记合并等。这些 skill 有些可能以 prompt 为主(需要生成),有些基本只有代码逻辑(快速响应)。

当用户写新笔记时,ai 快速自行判断:能不能直接入库?要不要智能纠错?有没有冗余的历史相似笔记需要合并?

每种情况,都由 agent 拿着各种 skills 自动匹配来处理。

这样下来,Skills-based 的 Agent 产品,就能用同一个多模态输入框,处理用户各种不同的输入,也能灵活应对未被规划的边缘问题、为用户提供绝对个性化的生成需求了。

二、Skills 完全教程:制作与使用

如果你看到了这里,那 Skills 对于 AI 应用开发的价值就不言而喻了:

巧借通用 Agent 内核,只关注 Skills 设计,能低成本创造兼具通用 AI 智能上限的垂直 Agent 应用。

对于 Agent 开发者,尤其是非技术出身的团队 or 业务人员,是极大的开发利好:

  1. 1.0 代码创造 Agent 应用,仅靠“写文档”的方式,人人能做出可解决问题的垂直 Agent
  2. 2.无需过度关注 Agent 工程技术细节,凭借通用 Agent 智能,Skill Agent 能够自适应 Skill 设计中所缺失的代码、功能逻辑,甚至是自行在运行中克服 bug(虽有性能影响)。做 Demo、MVP、甚至小 Agent 应用,验证产品价值就非常容易
  3. 3.而且搓出来的垂直 Agent,兼具通用 AI 智能,有极其灵活的边界问题与个性化处理能力,智能上限极高。

那么,我们该如何开始使用 or 制作第一个 Skill?

1️⃣ 教程:我该如何使用 Skills?(Claude Code 版)

如果你已经会了,可跳过此部分;

也可以把这大概率是全网最详细的 Skills 教程,转给初学的小伙伴们

使用 Skills 的方式很多,我先推荐一种自己用最多的本地方法,Claude Code(简称 CC)。

注意:只是使用工具,Claude 模型并非必需

BTW:codex、cursor 等工具也逐步在支持 skill 的使用,有兴趣可以自行探索。

开个玩笑:

  • Claude Code 是 Anthropic 推出的 coding 工具 ❌
  • Claude Code 是 Anthropic 自己都没想到的通用 Agent 框架 ✅

CC 能做的事情远不止 AI Coding:它能代替我们操作电脑,包括搜索网页、操作浏览器、访问文件,以及使用电脑底层命令、运行 python 脚本等行为。

这就意味着 CC + Skills,就等于跑在自己电脑上的垂直 Agent。通过安装或自行创建不同的 Skills,就可以完成:

  • 搜索网络信息,总结感兴趣的资讯日报;
  • 自动化翻阅项目文件夹,输出项目复盘文档;
  • 以及其他不同的 Agent 任务。

使用方法其实并不复杂,只是需要一些耐心:

Step 1:安装 Claude Code

如果从未安装过 Claude Code,请打开「终端/命令行」工具:

    • 遵循官方安装指引https://code.claude.com/docs/en/quickstart#native-install-recommended,完成 Claude Code 安装。
    • 推荐直接把官方指引链接,按以下 Prompt 发给任意 AI(ChatGPT、Kimi 都行),让它一步步教你。我是电脑小白,参考以下信息,一步步指导我在【Mac/windows/linux】终端中安装该程序:【此处粘贴替换为官方安装指引文本】当我遇到疑惑或报错时,我会把终端的日志发给你,请帮我解决。AI 就会这样教你安装:

  • 遇到问题就截图给它,基本都能教你解决。

安装后,终端里输入claude –version,看到版本号,则这一步安装成功。

Step 2:如果不用 Claude 模型,请替换模型

现在大部分国产模型都已经支持了 Skill 的使用与创建。

❶ 你可以用「模型名称 + Claude Code」的关键词去网上搜索模型厂商官方的 Claude Code 模型接入教程。

目前比较推荐的是 GLM 4.7、Kimi K2-thinking 或新版本。

发送以下 Prompt 给 AI 对话,就能得到详细的人话指导了:

我是电脑小白,指导我根据【替换为教程链接】,并替换 claude code 内的模型。Claude Code 已经装好了

❷ 另外,也有一些好用的 Claude Code 模型管理工具,比如「CC Swtich」,项目地址为https://github.com/farion1231/cc-switch

同样打开 AI,发送以下 Prompt,就能学会如何使用:

我是电脑小白,指导我如何安装【项目地址】,并替换 claude code 内的模型,我要用的是【模型名称】

Step 3:安装并使用 Skills

正式使用 Claude Code 之前,建议在任意目录下创建一个空文件夹,比如叫test,再在终端内切换到对应文件目录:

然后在终端输入claude,就可以启动 CC 了,看到下图就是启动成功了

这一步能把 Claude Code 的后续 AI 行为,都局限在该目录,减小对本地电脑其他文件的影响。

❶ 在安装 Skill 之前,你需要先获取需要的 Skill 文件包。

比如官方 Skills 仓库:https://github.com/anthropics/skills/tree/main,里面就有很多已经做好的 Skills。

你可以让 CC 替你自动安装 Skill,比如在 CC 中发送安装 skill,skill 项目地址为:<skill 项目地址>

❷ 也可以手动下载 Skill,把文件包解压后,放在 skills 安装目录下:

可以在当前项目文件夹的/.claude/skills/目录下,放入要安装的 skill 文件包:(如图为正确的项目 skills 路径配置)

也可以选择全局目录~/.claude/skills/(所有项目都能共享放在全局目录的 Skill)

❸ 完成安装后,记得重启 CC 退出终端再打开就行,或者双击 ctrl+c 终止 CC 进程)

⬇️

要使用 Skill 时,只要在装好后的 CC 中,发送开始使用<skill 名称>,

或者用户消息与 skill 元数据的描述匹配,

就能自动调用 Skills,执行任务。

之前实验 AI-Partner Skills 分享过的 step by step 教程,能进一步体验复杂 Skill 的智能上限。非常细致,值得参考:

只用 Claude Skills,打造专属 AI 伴侣|附完整教程

怎么找到好用的 Skills 呢?

你应该也看出来了,在面向 to C 用户(也就是自己日常使用)时,以上的方法有两个问题:

  • 使用步骤确实比日常的 APP 复杂不少
  • 比较难找到想用的 Skills

常规方法是找规模比较大的第三方 Skills 市场:https://skillsmp.com/zh

但不难发现,现有大部分的 Skills 公开市场,没有完善的评价和精选体系,所有 Skill 缺少合理的分类与排序机制,导致很难找到需要的 Skills。

可以看到仅靠 star 排序,是非常难找到合适的精选 Skill 的

付铖他们的 Mulerun 最近就在研究解决这个问题,顺手给他们恰逢其时地推荐一下:

  • 他们在打造全球性的 Agent 市场,支持创作者在平台上开发并上架 Skill、N8N 等形式的 AI Agent
  • 他们会帮助 Agent 创作者做全球分发、增长(类似 Agent 向的 APP Store),且上架 Mulerun 后,Agent 能被其他用户付费使用
  • Mulerun 也即将支持 Agent Skills 生态,还会有个好功能:一键运行并测试 github上公开的 skill repo(也就是省掉了 CC 那样配置 Skill 的步骤)
  • 另外,还会引入自动评分、精选的 Skills 发现机制,帮助用户能够更好地找到自己需要的优质 Skills

2️⃣ 如何制作一个 Skill?

好,话说回来。

如果你按照上文,学会了 Skill 安装与使用,那制作第一个 Skill 将会无比容易。

我们需要用到 Anthropic 官方的一个 skill:skill-creator

顾名思义,用来帮你自动开发 Skill 的 Skill(我的 AI-Partner 和 Article-Copilot Skills 也都借助了这个 skill,大幅提升开发 skill 的效率)

❶ 首先是安装 skill-creator,skill 项目地址在:https://github.com/anthropics/skills/tree/main/skills/skill-creator,安装过程一如上面的教程,请 CC 来帮忙自动安装:

❷ 安装完成后,即可调用 skill-creator 自动创建需要的 skill。

比如,发送创建需求给 CC:

CC 自动调用 skill-creator,编写 SKILL.md 与 pdf2word 脚本

最终提示创建成功:

你也可以试着:

  • “创建 skill,能按照我写文章的行文风格写文章”
  • “创建 skill,能自动整理近期 XX 领域的新闻日报”……

如何安装自己做好 skill ?

这种方式做出来的 skill,会默认是xx.skill格式,会与 zip 或文件夹格式略有区别。是 skill-creator 创建的 skill 压缩格式。

告诉 CC 指定.skill的文件地址,要求 cc 直接安装 skill 即可:

如果是文件夹或者 zip,那就按上文的介绍,手动解压放到对应 skills 目录即可。

【进阶】如果你需要精调 skill,或者想完全手写一个 skill?

更细节的 Skill 规格设计说明,请参考:https://agentskills.io/specification#skill-md-format

BTW:Mulerun 本月也会开始内测 Agent Builder 功能,会着重用到 skill,对 skill 开发方法进一步优化。

如果你想讨论 skill,可以去他们的社区:https://community.mulerun.com/t/topic/73,已经积累了一些开发者讨论(付铖回头记得请我吃饭啊喂)

三、什么时候应该用 Skills?

概念、价值、教程,都讲完了,但更重要的问题是:

什么场景值得“用 Skill 来解决”、“开发一个 Skill”?

这个问题对于普通用户优化 AI 工作流程,开发者找 Skills Agent 创业机会,同样重要。

根据 Anthropic 官方博客建议,与我的实际理解,梳理了 3 种明显的时机:

1️⃣ 发现自己在向 AI 反复解释同一件事

最典型的信号是:为了完成某个任务,在多轮对话中,需要不断向 AI 解释一件事应该怎么做。

比如:

“帮我写一份技术文档”

“不对,我们公司的技术文档格式是这样的……”

“还有,代码示例要按这个模板来……”

“上次不是说了吗,章节标题要三级标题……”

“帮我分析这个数据”

“先把 > XX 的异常值筛掉”

“不对,应该用中位数,不是平均值”

“图表要按我们公司文档的配色方案……”

这时候就该想到:与其每次都解释一遍,不如把这些规则打包成一个 Skill,一次创建永久复用。

2️⃣某些任务需要特定知识、模板、材料才能做好

有时候是 AI 的通用能力够了,但缺“特定场景的知识材料”。

典型场景:

  • 技术文档写作:需要参考代码规范、术语表,使用文档模板
  • 品牌设计:需要参考品牌手册、色彩规范,使用 Logo 资源
  • 数据分析:需要参考指标定义、计算公式,使用报表模板……

这些都是「通用 Agent + 垂直知识」的典型场景:人提供材料,Agent 才能具备场景 Context。

在 Skill 包里放对应的知识材料,比如把模板、规范、案例放到 Skill 的assets/、reference/目录,或者直接描述在SKILL.md中,Agent 就能一次性输出符合任务需要的精准结果。

3️⃣发现一个任务要多个流程协同完成

有些任务更加复杂,往往需要“组合多个流程”才能完成。

  • 竞品分析报告:检索竞品数据 + 数据分析 + 制作 PPT
  • 内容生产:收集参考资料 + 学习风格 + 大纲协作 + 正文写作

我相信你的工作环境里也有很多这种任务。

把这类任务中每个环节的指令文档、可执行脚本、参考材料、可用资源打包成单个或多个 Skill 也是不错的 AI 解决方法。

让Agent 根据任务描述,智能调用不同的 Skill 模块,通过“规划-执行-观察”的交错式行动,一次性完成原本需要多个流程协同完成的复杂任务。

写在最后

写到这里,回到开头那个判断:Claude Skills 的价值,还是被大大低估了。

Skills 是 Agent 的灵魂,就像 Steam 游戏 + 创意工坊一样。

有了这种可扩展性极强的设计架构,Agent 开发者完全能巧借通用 Agent 内核,只需关注 Skills 本身的设计,就能低成本创造兼具通用 AI 智能上限的垂直 Agent 应用。

对于Agent 创业者,乃至非技术的领域专家来说,Skills 无异代表了很多的新机会:

垂直 Agent 工具,如果按传统方式开发,周期至少数周。

但用 Skill 的方式,几小时甚至几分钟就能测试起来,且智力与能力上限也有机会直逼通用 Agent。

⬇️

这不是说 Agent Skill 必然全面替代传统开发。

两种方式各有适用场景,但Skill 确实让更多人、更多场景接入 Agent 能力变得更为可行:

  • 不必为了一个内部小工具开发完整产品,打包个 Skill 就能解决
  • 不必说服 IT 团队理解你的需求,自己就能创建工具
  • 不必等待产品迭代,你可以随时调整 Skill 的行为

从这个角度看,Skill 更是降低了验证想法的成本。

另外再换一个思路:把 Skill Agent 服务打包为 AI API,是不是也能快速给已有的产品赋上好用的 AI 能力?

现在还是 Skill 生态的早期,Agent Skills 开放标准发布不到 1 个月,工具在完善,社区在成长。

但这个方向有意思的地方在于,终于能让更多人、组织、行业参与 AI 应用的创造了。

Ref.

  • Claude Doc – Agent Skills 说明:https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview
  • Agent Skills 开放标准:https://agentskills.io/home
  • Equipping agents for the real world with Agent Skills:https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

作者:一泽Eze

来源:一泽Eze

]]>