Skills – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Tue, 21 Apr 2026 06:04:00 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico Skills – 青瓜传媒 //m.clubpenjuin.com 32 32 Github 爆火的AI 营销skills?GTM环节的效率神器! //m.clubpenjuin.com/380877.html Wed, 22 Apr 2026 00:45:57 +0000 //m.clubpenjuin.com/?p=380877

 

最近在GitHub上刷到一个项目:coreyhaines31发布的marketingskills。

这个项目上线不久就冲到了22k星。它不教你写文案,而是专门为AI Agent构建了一整套“营销大脑”。它把CRO、文案框架、SEO策略到增长工程,几乎所有高阶营销人的专业框架,全部封装成了AI可以直接调用的“技能包”。

看到它的第一反应是:Product marketing 员工也开始要被蒸馏了?

为了验证它是否真的能打,我拿手中一个“快消终端铺货指导”的B2B产品做了实战测试。结果还是不错的:原本需要团队耗时2周的GTM落地工作,我一个人调用技能库,半天就完成了高质量交付。当然也有不少要小休小改的地方。

一、 核心区别:为什么普通大模型做不好B2B营销?

在展示实战效果前,我们先聊聊痛点。很多营销人觉得AI不好用,是因为直接调用的 Claude 或 Gemini 虽然表现不错,但是和to B行业的knowledge及product markting /GTM体系化需求结合的不够。

1. 普通大模型的瓶颈:只会编文案,不懂营销框架

如果你对普通大模型说:“帮我写个销售话术和竞品分析”,它给你的通常是:

  • 满屏套话:全是“提高效率、降低成本、赋能增长”这种放之四海而皆准的废话。
  • 结构散乱:它不懂快消行业“终端执行→动销结果”的因果逻辑。
  • 二次加工成本极高:你拿到的只是一堆文字素材,还需要花3天按营销框架重新拆解。

2. marketingskills 的降维打击:它是框架的自动化

当你加载了这个技能库,AI就从“文字搬运工”变成了“高级营销顾问”。它输出的不再是孤立的文字,而是基于专业营销框架生成的交付物

它懂的就不再只是“怎么写”,而是“怎么赢”。

二、 底层逻辑:它到底在AI Agent里植入了什么?

很多人误以为这是一个新的AI模型,其实不然。它的本质是“给AI预装的35个专业工具箱”

它的底层逻辑非常清晰:把营销人沉淀多年的工作流程(Workflows),通过代码化的方式变成了AI的原生技能(Skills。每一个技能都对应一个真实的实战场景,比如:

  • sales-enablement:不再从零开始写PPT,而是按销售赋能框架一键输出物料大纲。
  • content-strategy:不再瞎猜选题,而是基于流量逻辑规划全年营销方向。
  • pricing-strategy:直接调用B2B SaaS分层定价模型,而非拍脑袋定价。
  • battlecard:精准拆解竞品短板,把攻防话术应对客户售前的挑战。

这就是核心区别:普通AI需要你一点点教它“什么是B2B逻辑”;而加载了该库的AI,默认就带着这些逻辑进场。

三、 实战复盘:To B新产品GTM计划

我以工作场景为例,对新产品Go-to-market 场景做了个测试:

1. 全年GTM计划:贴合B端业务场景理解

我通过调用 copywriting、pricing-strategy 和 analytics-tracking 等技能,生成了一份计划。

这里说明:智能体本身就有规划和自主调用不同需求对应skill的能力,所以侧重点也可以优先放在自身业务的描述,而非指导怎么调用。

可复制的提示词模板:

你现在是我的专属B2B营销顾问,并且你已经加载了本地安装的所有营销技能。

我正在推出一款面向快消零售客户的「终端铺货指导」产品,请你用这些技能,为我制定一份完整的全年GTM(Go-to-Market)计划,要求如下:

1)先调用 competitor-alternatives 和 content-strategy 技能:帮我分析市场竞品,提炼出这款产品的独特价值主张(USP),要明确它解决了快消客户的什么核心痛点,和市面上其他工具/服务的差异化在哪里。

2)调用 pricing-strategy 技能:基于B2B SaaS定价模型,为这款产品设计分层定价策略,包括入门版、标准版、企业版的定价、权益和适用客户。

3)调用 analytics-tracking 技能:把全年GTM拆分为「冷启动期、增长期、成熟期」三个阶段,每个阶段都要有:

-核心目标

-关键任务拆解

-可量化的KPI指标(线索量、转化率、付费率等)

4)调用 lead-magnets 和 email-sequence 技能:为每个阶段设计配套的营销内容和获客渠道,包括:

-冷启动期:行业报告、白皮书、案例模板等引流钩子

-增长期:短视频内容、行业直播、客户案例拆解

-成熟期:老客户转介绍、客户成功故事、行业沙龙

同时生成一套对应的邮件序列,用于线索培育和转化。

5)调用 page-cro 和 copywriting 技能:为产品的官网落地页、销售话术、产品介绍文案做优化,重点突出USP和客户价值,提升转化效率。

6)最后,调用 analytics-tracking 技能:给我设计一套完整的效果追踪方案,包括每个渠道的追踪指标、数据看板建议,以及不同阶段的优化调整机制。

整个计划要贴合快消零售行业的特性,可直接落地执行,不要给我通用模板,所有内容都要围绕「终端铺货指导」这个产品来展开。

实战反馈:

它没有给我SaaS通用的模板,而是精准抓住了快消客户“执行看得见,结果说不清”的痛点。竞品分析部分,它直接将传统巡店SFA(打卡逻辑)与我的产品(结果验证逻辑)进行了深度切割,并提炼出了行业客户的场景痛点等问题。此外,GTM的计划框架还是非常完整,且符合行业特性的。

2. 销售赋能工具包:直接可交付的“核武器”

有了框架,我让它调用 sales-enablement 技能,一键生成全套物料。

可复制的提示词模板:

我现在需要为【快消零售行业·终端铺货指导/终端稽查产品】制作一整套专业销售赋能工具包(Sales Enablement Kit)。

请你自动调用你已安装的相关技能:sales-deck、battlecard、elevator-pitch、case-study、sales-email、sales-enablement 等技能,按照专业B2B销售物料标准输出全套内容。

产品核心:

-面向快消品牌方/区域经理/销售总监

-解决终端铺货率低、陈列不标准、稽查成本高、数据滞后、执行Gap看不到的问题

-模式:众包终端稽查 + 铺货Gap洞察 + 季度化落地交付

请严格输出以下5类销售工具,结构清晰、语言专业、可直接对外使用:

1)Sales Deck 核心结构(可直接做PPT)

2)Battle Card(竞品对比、攻防话术)

3)Elevator Pitch(30秒客户开口话术)

4)High-Level Email Letter(给销售总监/老板的初次触达邮件)

5)Case Study 框架(客户成功案例模板,可直接填空)

要求:

1.全部围绕快消铺货/陈列/稽查场景

2.语言商务、专业、可直接发给客户

3.不要泛内容,全部贴合我的产品

4.结构清晰,可直接复制进PPT/Word

实战反馈:

  • 一套完全贴合快消场景的 12 页 Sales Deck 大纲,连每页的演讲要点都写好了,后面我要求给到md格式,放到NotebookLM生成的PPT还不错。
  • 精准拆解了传统 SFA / 纯调研 / 纯众包三类竞品的 Battle Card,攻防话术直接能用。
  • 从 30 秒高管话术、高层冷邮件,到客户案例模板,这里需要优化的空间还是挺大的。
  • 本质是「用营销人的专业框架跑流程」,直接输出你要的交付物,不用二次拆解。

四、 深度复盘:它不是银弹,但它是“放大器”

在享受这种极致提效的同时,我也发现了它的边界

  1. 它能放大你的专业,也能放大你的平庸:AI提供的只是专业框架,如果你对自己产品的核心价值思考不透,生成的框架再漂亮也打不动客户。
  2. 它是“效率工具”,而非“决策工具”:它负责提供大脑,搭骨架、写大纲、做模板,你负责填入真实的行业数据和最后的决策点。

写在最后,给B2B营销人的3个AI建议:

  1. 拥抱“框架式AI”:停止无意义的聊天,开始用这种把专业知识“代码化”的工具。
  2. 流程即资产:把你的GTM、销售赋能路径拆解成可复用的提示词,这才是你在AI时代的护城河。
  3. 专注“行业认知”的厚度:把80%的可被提炼方法论的工作交给AI技能库,把剩下的时间用在洞察客户和产品决策上。

作者:疏桐to b运营

]]>
如何从0到1创建一个画原型的Skills? //m.clubpenjuin.com/380875.html Tue, 21 Apr 2026 06:01:28 +0000 //m.clubpenjuin.com/?p=380875

 

如何用Skills高效完成产品工作?发布后,收到不少伙伴的关注,其中最关注的问题就是“能把对应Skills分享出来吗?

我理解大家的想法,只是恐怕要让这些伙伴失望了。

原因很简单:我所写的Skills都是专属定制,适用于我自己,却未必适合你。比如我的需求文档、上线公告的格式,是我自己的格式;我的产品方案设计、需求工作量评估是完针对HR SaaS产品所定制。

退一步讲,我更主张“授人以鱼不如授人以渔”,提供给你一个价值不大的Skills,不如教会你创建自己专属的Skills。

前面的文章可能更偏向“炫技”(重点放在效果呈现),而没有从0到1手把手教的感觉,可能会让你无从下手,今天我就聚焦一个Skills——画原型,期望帮你写出自己的第一个稳定、可用、专属的Skills。

首先,我还是带你看看效果,让你对这个产出结果有所感知。

下面左侧的原型,是我花了2个小时(包含思考时间)用Axure画的原型,而右图是我花2分钟写,20分钟左右调试后的Skills画的原型。

原型效果对比图1

原型效果对比图2

相信你可以看出来效果的差异(即优质),也能感受到效率的提升(即高效),不再赘述。

下面我就把这个过程完整给你“还原一下”——从写到调试,再到输出结果的过程。

以前一直懒得用AI绘制原型,一方面是因为感觉它不够聪明,觉得不了解我们系统的设计风格,很难输出符合预期的结果;另一方面是觉得在现有系统上迭代功能,绘制原型的工作量不大,自己画就画吧,觉得与其投时间“磨刀”,不如直接“砍柴”,本质还是是路径依赖,不愿变化。

昨晚下班时,忙完了一天的工作,又把工作量评估的Skills调整了下,突然就想试下“画原型”的Skills,看看是否如大佬们所说“Coding就是现阶段的通用人工智能”,用HTML轻松绘制出来一个网页。

如何从0到1创建一个画原型的Skills?

前提条件:

  • AI工具:Trae国际版(付费模式)。国内版的免费模式也可行,唯一区别是模型不同,效果可能会有差异,但不影响整体使用;
  • 背景:基于现有成熟HR SaaS系统,如何快速生成对应原型,而不是面对一个全新系统;

第一步:创建Skills。

我在Trae里输入了下面这句话:

帮我生成一个Skills,目标是绘制原型,要求是根据附件中所提供的系统截图设计规范、样式、主题颜色,100%还原设计的方式设计原型。”

小提示:原型不是高保真图,这里100%还原目的是给它一个参考,确保原型图跟系统设计规范基本一致,减少后续改动量,适用于已有成熟系统情况下的设计;如果是全新系统,也可以要求它遵循Ant Design风格输出,而不给它系统截图,效果应该也不会太差。

同时,跟提示词一起,附件里附上现有系统的4张截图(重点说三遍,重点说三遍,一定要有截图,它们分别代表:列表页面(如下图)、新增页面、报表页面、排班页面,它们比较典型、常用,目的是让Skills把现有系统的设计规范、样式等写到Skills里,相当于让它学习我们系统的设计规范。

小提示:原计划是把这个提示词截图也贴出来,结果发现昨天晚上的聊天记录,已超过长度被Trae压缩,无法有效找到了。

系统参考图-列表页面

大概1分钟左右,它生成后,你就可以进入调试阶段(是的,不要怀疑,前后不到2分钟就创建了一个画原型的Skills)。

第二步:调试Skills。

这是最关键的环节,创建后,需要你进行调试效果。

你可以注意看下Skills文件里(如下图),它实际把原系统的视觉规范、主题颜色、交互形式,都已写到技能里,相当于完成了“预训练”,确保后续输出原型时,基本符合你们系统规范。

Skills文件的核心示意图

下面让它开始真正干活,我给它输入的提示词是:

“在现有系统功能的基础上(即附件截图),输出两张原型图:图一是在“按周循环”的基础上,新增支持添加多周(最多4周),同时,支持开关控制“自动跳过法定公休日”;图二是新增一种新的循环模板(即按天循环),支持用户配置最多31天,最少1天的循环模板,每天都支持添加班次,并支持开关控制“覆盖已有排班”,支持“法定节假日排班规则”可选“排班”、“跳过”、“顺延”,且提示语图标;支持“法定公休日排班规则”可选“排班”、“跳过”、“顺延”,且提示语图标。”

画原型V1.0

附件里是现有系统的原图(如下图),属于我需要让它修改的原图,它的“按周循环”模式,是不支持多周循环(比如大小周);也不支持“按天循环”模式。

系统原图

结果,它给我输出了两个全是HTML的代码片段,而不是可预览的原型,这显然不符合预期。

我就跟又它说:

“更新下原型绘制技能,要求是直接输出可预览的html文件,而不是给我一段代码片段。”

完成后,它自动在输出要求里,明确约束了输出HTML的原型文件(如下图),确保输出结果可轻易被预览、使用。

第一次调试

然后把同样提示词再发一遍给它,让它重新执行,完成后,它给了下面两个HTML的原型文件。

第二次调试结果

预览时,发现结果还是不理想,我就又跟它说:

“按天循环的添加模式,建议跟现有系统保持一致(即底部增加添加按钮,超过31天后才隐藏)。同时,法定节假日排班规则跟公休日排班规则,不适合平铺的形式,而是采取下拉单选,让它们跟覆盖已有排班成一行,确保基本的美观度。”

经过这么两轮调试,最终它给我的结果,就已经符合我的预期。

原型1是在原有系统支持“按周循环”的基础上,新增支持“多周循环”模式,而不仅仅是单周循环(如下图)。

原型图2:按周循环支持多周设置

原型2是在原有系统基础上,新增支持“按天循环”模式的原型(如下图)。

原型图1:新增按天循环模式

这个技能从创建到调试完成,最终花了大概不到30分钟。

第三步:复用Skills。

紧接着,我又让它帮我画另一个原型设计图,提示词是:

“在现有“按班组排班”的页面右上角,新增一个“操作”下拉框,支持用户选择“循环排班”、“排班记录”,当点击“排班记录”后,进入一个二级列表页面,列表元素包含:班组名称、开始循环日期、截止循环日期(可不设置,不设置代表无限循环)、循环模板(即关联了哪个循环模板)、操作(编辑、删除);点击“循环排班”,则弹窗或右侧边抽屉的方式,让用户添加对应循环排班,最上面是一段提示语,下面的元素包含:班组名称(下拉单选,支持用户选择排班班组名称)、开始日期(日期控件,默认是今天,必填)、截止日期(可不填,不填默认就是无截止时间,需要提示语)、循环模板(下拉单选,必填),确定、取消

新需求绘制

我附件里的系统原图,它的排班页面是没有“操作”相关按钮的(如下图)。

系统原图

大概不到1分钟,它给我输出了两个HTML文件路径,显然跟我预期的三张图不符。

原型V1.0

我就跟它说:

“你好像少了一个页面,就是创建循环排班的页面。”

第一次调试

它并没有直接给我生成三个原型,而是在理解需求的情况下,给我把第三个抽屉弹窗直接内嵌到“创建循环排班HTML”文件里。换句话说,它创建的原型是具有交互能力的原型,而不仅仅是静态图

第二次调试

对应原型结果如下:

原型-按班组排班-新增操作按钮群

我点击“循环排班”,它自动弹出下面的抽屉页:

循环排班

我点击“排班记录”,它自动跳转至下面页面:

循环排班记录

点击“新建循环排班”,结果它又重复创建了一个对应详情页,跟“循环排班”属于同样功能,却采取不同交互,我就又调试了一下。

重复创建循环排班页面

我给它输入了以下提示词:

“1、“操作按钮”期望不跟“保存”、“班组管理”在一行,而是在它们上一行的右上角(即操作按钮不仅适用于“按组排班”页面);2、“排班记录”页面属于详情页面,你需要记住我们详情页面是没有左边菜单栏,而是全屏页面的设计规划,麻烦调整下。同时,“新建循环排班”跟“循环排班”是同一个功能,不要单独再创建一个详情页面,而是复用“循环排班”的左侧抽屉即可。”

第三次调试

完成后,已经符合预期,我就直接使用了。

原型-循环排班

原型-排班记录

在“排班记录”页面,点击“新建循环排班”效果如下:

新增循环排班

如何从0到1创建自己的第一个Skills?

第一,选择一款适合自己的入门工具。市面上优秀的AI产品,基本都已支持Skills模式,第一次尝试,推荐用扣子的“扣子编程”,或 Trae IDE 国内版。它们的产品上手容易,成本几乎为零,还有丰富的教程。

第二,梳理自己的工作流,选择一个环节开始

以产品经理为例,核心工作流可能包括:需求管理 → 需求优先级判断 → 产品规划 → 竞品调研 → 客户需求调研 → 设计产品方案 → 评估工作量 → 画原型 → 写需求文档 → 评审 → 项目进度管理 → 上线 → 上线培训 → 写上线公告 → 收集反馈等。

每个环节都可以设计1-2个SKills,用它来辅助你高效完成对应工作,“贪多嚼不烂”,最理性、最合理的方式,分阶段、分步骤进行改造,核心理念就是“先僵化,后固化,再优化”。

最开始可以选择一个环节,最好符合经常做、重复做、事务性的环节(俗称可标准作业流程(SOP))。比如写需求文档、写上线公告、评估工作量等,或制作50家客户案例等;

第三,必须具备明确的标准。把经验、方法论、流程等,固化为一个个的Skills。

你所选择的环节,需要把过往的经验、流程、方法论等,对应输出为一个Skills,需要你具备定义标准的能力(即判断它的输出是好,是坏,需要你自己有标准)。

  • 一份好的需求文档的标准
  • 一个好的解决方案的标准
  • 一个需求的优先级标准
  • 一份竞品调研报告的标准
  • 一个需求评估结果的标准

等等。

第四,合理利用参照物

比如客户案例PPT中,我会提供现有标准的PPT模版,让它100%进行还原;或画原型时,我会提供现有系统的关键页面的截图,让它进行1000%还原等。

当你给它提供一个明确的参照模板时,相当于给对它进行了一次“预训练“,提前学会了对应内容,确保输出结果更符合预期。

小作业

临渊羡鱼,不如退而结网。纸上得来终觉浅,绝知此事要躬行。

无论我如何苦口婆心地说,分享再详细的教程,不如你动手一次。

你准备好写自己的第一个Skills了吗?我很好奇你会选择哪个环节,也期待你分享使用后的感受。

作者:产品方法论集散地

两天:产品方法论集散地

]]>
Chrome推出Skills新功能,Agent重塑上网方式! //m.clubpenjuin.com/380772.html Sat, 18 Apr 2026 00:05:18 +0000 //m.clubpenjuin.com/?p=380772

 

2026 年 4 月 14 日,Google 给 Chrome 浏览器加了一个 Skills 的新功能——用户可以把常用的 AI 提示词存下来,下次在任何网页上一键复用。同一周,OpenAI 的 AI 原生浏览器 Atlas 在 macOS 上开放使用,微软也正在把 Edge 里的 Copilot,从能聊天的 AI继续往能代做网页任务的 AI推进,原来的 “Actions in Edge Preview” 被改成了 “Auto Browse”。

这一连串动作背后指向的是同一件事:浏览器正在经历一次范式转变。过去二十多年里,浏览器的基本工作模式基本没怎么变——用户输入网址或关键词,浏览器展示网页内容,剩下的靠用户自行阅读、点击、填写。

无论是从 Netscape 到 Chrome 的霸主更替,还是从桌面端到移动端的平台迁移,浏览器的角色始终是一个展示窗口。但现在,科技巨头和新兴公司正在竞相回答一个全新的问题:浏览器的下一步,是继续帮用户看网页,还是直接替用户操作网页?

Chrome Skills 背后的战略布局

乍一看,Chrome Skills 并不复杂。你在 Chrome 里跟 Gemini AI 聊天时,觉得某个提示词好用,就能直接从聊天记录里把它存成一个 “Skill”。之后只要输入 / 斜杠命令或者点 + 按钮就能调出来,它会在你当前看的网页上运行,也能同时跨多个标签页工作。

Google 还配套上线了一个 Skills 预设库,覆盖了生产力、购物、食谱、预算管理这些常见场景,你可以直接拿来用,也可以改提示词让它更贴合自己的需求。用户访问 chrome://skills/browse 就能浏览所有可用的 Skills。

但这个功能的战略意义,远不止表面看到的那么简单。

先看时机。Chrome 推 Skills 的背景,是一堆新对手正在涌入浏览器赛道。TechCrunch 指出,Gemini 在 Chrome 里的深度集成,就是在 OpenAI、Perplexity、The Browser Company 等公司扎堆推 AI 原生浏览器的压力下加速的。Chrome 的全球市占率虽然还是第一,但它的优势从来没像现在这样,被 AI 赛道的新物种从根基上动摇过。

再看路径选择。Google 没有另起炉灶搞一个全新的 AI 浏览器,相反,它在 Chrome 的庞大用户盘子上一层层叠 AI 能力。2025 年底嵌入 Gemini 侧边栏,2026 年初上线 Auto Browse ,4 月又推出 Skills——每一步都很克制,降低用户的学习成本的同时,一点点扩大 AI 在浏览过程中的参与度。

值得一提的是 Skills 在安全上的考量。跟其他 Gemini 功能一样,Skills 在执行敏感操作,比如发邮件、加日历之前,都会先弹窗找你确认。这个设计说明 Google 心里很清楚,Skills 不只是一个辅助工具,它其实在为更深层的 Agent 操作铺路——只不过眼下选了一条更稳、更可控的渐进路线。

Google 在早期测试中发现,用户最常创建的 Skills 集中在三个方向:健康营养(快速算食谱里的蛋白质含量)、购物比价(跨标签页生成规格对照表)、文档处理(扫描长文提取关键信息)。这三类场景正好对应了普通人上网最高频的需求,也间接验证了可复用 AI 工作流这件事确实有真实的用户需求在支撑。

三条路线的不同赌注

如果说Chrome Skills代表了”在老地基上盖新楼”的思路,OpenAI 和 Perplexity 则分别代表了另外两种截然不同的战略选择。

Atlas:另起炉灶,AI 就是浏览器本身

OpenAI 的 Atlas 已经在 macOS 上可以用了,它把 ChatGPT 直接做进了浏览器的底层。根据 CNET 的评测,Atlas 最大的差异化功能叫 “Browser Memories”——AI 能记住你在不同网页上的浏览上下文和任务进度,下次打开还能接着来。

更核心的是它的 “Agent Mode”。开启这个模式后,AI 可以在你的监控下自主完成一系列网页操作:扫内容找灵感、起草文案、把产出整理成文档、审计落地页、清理收件箱、采购前自动对比不同工具,甚至根据你的历史操作重建整套工作流。

此外,Atlas 瞄准的痛点很明确——上下文切换。传统方式下,用户得在搜索引擎、AI 对话窗口、文档编辑器、邮件客户端之间来回跳,每跳一次上下文就断一次,信息要手动搬来搬去。这个问题对独立创业者和小团队尤其致命:一个人同时要管策略、做内容、跑运营、回客户,任务之间频繁切换成为了巨大的效率黑洞。

Atlas 想做的事很简单——把研究、写作、编辑、任务管理全揉进一个连续的 AI 浏览环境里,从根上消灭上下文断裂。根据其早期用户反馈显示,Atlas 可以接管一个独立创业者大约 80% 的日常运营工作。

Comet:从”搜索”到”研究”的跃迁

Perplexity 的 Comet 走的是第三条路,专注于帮使用者理解互联网上的信息。如果说 Atlas 的核心价值是操作自动化,那么Comet 的就是知识提取。

Comet 的典型使用场景是替代那些需要打开二十个标签页、逐一阅读比对的研究工作。用户给出一个研究问题,Comet 自主打开多个页面、分析内容、综合结果,直接输出研究报告。

Perplexity 在前几个月还推出了名为 Computer 的多模型协调引擎。Computer 能把复杂任务拆成多个子任务,再分给最合适的 AI 模型去做——Anthropic 的 Claude 负责核心推理,Gemini 跑深度研究,Grok 接轻量快速任务,ChatGPT 处理长上下文记忆。

这套架构的底层逻辑和企业里的分工其实是一样的。让最擅长推理的做推理,最擅长视觉的做图像理解,最快的做轻量任务。没有一个通才模型能在所有维度上都做到最好,但一组专精模型协同起来,整体表现就能大幅提升。这意味着 AI 浏览器已经开始往 AI 任务操作系统的方向长了。

把三条路线放在一起看,可以发现,Google 赌的是惯性——你已经在用 Chrome 了,加点 AI 不用你换地方,Gmail、日历、地图全打通,走得稳但转身也慢。OpenAI 赌的是迁移意愿——如果 AI 体验足够好,用户愿意为此换一个全新浏览器,哪怕扩展、书签、密码管理都要重头来过。Perplexity 赌的是场景切入——不跟前两家争”通用浏览器”这口饭,先把研究场景吃透,用多模型协作和信息综合做出差异化,再看能长多大。

三种赌法各有各的风险。Chrome Skills 被自家产品框架卡住了天花板,Atlas 面临真金白银的迁移门槛,Comet 则要应对 Amazon 已经打上门来的版权诉讼。但有一点是共通的:它们都在试图把浏览器从一个被动的展示工具,变成一个主动替用户干活的系统。差别只在于这个”干活”到底由谁发起、走多深、边界画在哪。

浏览器正在发生的三重变化

将视野从个别产品拉远,可以看到整个浏览器行业正在经历三个层面的结构性变化。

1)从”找信息”到”办事”

2026 年之前,浏览器的核心角色是信息获取入口——你主动搜、主动看,所有动作都由人来驱动。AI 代理浏览器正在把这个关系翻过来:你只要说清楚想要什么结果,AI 自己规划路径、操作网页、完成任务。以前的说法是”帮我打开浏览器查一下”,现在变成了”告诉 AI 你要什么”。

这个演进可以被归纳成四个阶段:2000 年代手动浏览、2010 年代搜索加 App、2020 年代 AI 问答助手、2026 年开始 AI 自主执行。浏览器从”人操作的工具”变成了”为人干活的代理”。换句话说,浏览器的价值衡量标准已经从”能展示多少信息”变成了”能替你办多少事”。

2)从标准化工具到个性化系统

Chrome Skills 就是这一趋势的缩影。当你攒起了一套自己的 Skills 库,你的 Chrome 和别人的 Chrome 已经不是同一个东西了。你的可能擅长食谱转换和营养计算,我的可能专精技术文档摘要和竞品分析——同一个浏览器壳子,跑着完全不同的个性化工作流。

Microsoft Edge 也在走类似的路:Auto Browse 给了 Light、Balanced、Strict 三档安全级别,让用户自己决定 AI 能操作到什么程度。而 Edge 正在测试的浮动 Copilot 工具栏更进一步,把 AI 嵌进了右键菜单——选中文字或图片后右键一点,就能直接摘要、解释、改写。

3)浏览器成为AI分发的主战场

过去两年,AI 主要靠独立 App、API 接口和开发者工具来触达用户。但 2026 年的趋势很明显:浏览器正在成为 AI 能力到达终端用户的最短路径。原因不复杂——浏览器是几乎所有人每天都会打开的软件,把 AI 直接塞进去,比让用户下载一个新 App 或学一套 API 的触达效率高得多。

Google 靠 Chrome、Microsoft 靠 Edge、OpenAI 靠 Atlas,各自把自家 AI 模型的能力直接送到数十亿用户面前。一位 LinkedIn 上的行业观察者估算,2026 年全球 LLM 用户市场份额中,ChatGPT 占约 60%,Gemini 占约 15%,Copilot 占约 13%——而浏览器作为这些 AI 能力的直接载体,正变成决定谁拿到多少份额的关键战场。谁的浏览器装机量大、谁的 AI 嵌入得深,谁就能占住用户日常使用 AI 的第一入口。

AI 浏览器还远未成熟

愿景很理想,但 2026 年的 AI 浏览器赛道还有一堆硬骨头没啃下来。

可靠性还是最大的坎。 根据 Medium 上一篇综合评测的实测结论,即使是表现最好的 AI 浏览器,跑复杂多步骤任务时的失败率还在 10% 到 40% 之间。对于金融操作、医疗信息查询这类容不得出错的场景,这个可靠性离”能用”还差得远。

安全风险很现实。 代理型浏览器要读网页内容、还要替你操作,这天然带来了提示注入的攻击面——恶意网页可以在页面里埋特定文本来诱导 AI 做出错误操作。Edge 的 Auto Browse 为此设计了三级安全模式,不同级别下 AI 需要拿到不同程度的用户授权才能跟网站交互;Atlas 的 Agent Mode 也走的是”先请示、后动手”的路子。但安全研究圈对这些防护到底够不够硬,态度普遍还是保守的。

费用和信任是两道并行的门槛。 大多数高级 AI 浏览器功能都需要付费订阅,价格从每月 20 美元到 200 美元不等,底层 API 调用还要额外花钱。但比费用更难跨过的是信任——”你愿意让一个 AI 登录你的银行账户自己转账吗?”绝大多数人的回答还是不愿意。

覆盖面也是个问题。 Chrome Skills 初期只支持桌面端,而且浏览器语言得设成英语才能用。Atlas 目前也只有 macOS 版,Windows 和移动端的时间表还不确定。也就是说,在相当长一段时间内,这些最前沿的 AI 浏览器功能只能覆盖一小部分用户,大多数人还停在传统浏览体验里。技术前沿和用户现实之间的差距,可能比产品发布节奏还要更慢地弥合。

尽管问题不少,赛道的方向已经不可逆了。当 Google、OpenAI、Microsoft、Perplexity 在同一个季度密集发布 AI 浏览器功能时,真正被改写的是人和互联网之间维持了二十多年的交互契约。而这场改写,才刚刚开始。

作者:江天 Tim

作者:有新Newin

]]>
OpenClaw 3.24发布:彻底解决最重要的Skills安装障碍 //m.clubpenjuin.com/380290.html Fri, 27 Mar 2026 01:43:33 +0000 //m.clubpenjuin.com/?p=380290

 

OpenClaw 又回到了熟悉的日更节奏。

这次更新,跟之前那种「修了几个无关痛痒的小 Bug」完全不是一回事。

光是更新日志的长度,就能感受到这次变动的分量。

而且里面有几件事,值得单独拎出来说一说。

Skills 装起来更丝滑了

这块改动,对大部分普通用户来说可能是感受最直接的。

之前装 Skills,你可能碰到过这种情况:装完了,跑不起来,一堆红字报错,但是根本不知道缺什么。

这次做了两件事。

一件是加了一键安装配方(Install Recipes)。

OpenClaw 内置的几个常用 Skills(包括 coding-agent、gh-issues、openai-whisper-api、session-logs、tmux、trello、weather 等)现在装的时候,系统会自动检测你缺哪些依赖,缺了直接提示你装,不用自己去翻文档。

另一件是控制台的 Skills 页面整个重做了。

以前那个页面,就是一排卡片,密密麻麻堆在一起,你也不知道哪个能用、哪个缺配置。

现在改成了分标签:全部 / 已就绪 / 需配置 / 已禁用,旁边还带数量。

每个 Skill 点进去是一个详情弹窗,里面写清楚了它需要什么、怎么配、在哪儿找 API Key、甚至怎么安装。

还有一个小细节:以前 Skill 缺配置会标红,显示「missing(缺失)」。

现在改成了「needs setup(需配置)」。

就这一个词的改动,语气完全不一样了。

不是在责怪你配错了,是在告诉你下一步该干啥。

毕竟,龙虾最大的价值之一,是情绪价值。高情商说话很重要。

控制台的侧边栏,不再让你找不到东西了

macOS 版本这次把配置页的导航方式换了。

之前是横向的胶囊按钮,一排排平铺,点来点去,层级不清晰。

现在改成了可折叠的树形侧边栏,有展开箭头、有缩进层级,一眼就能看出大类和子类的关系。

就跟你用 VS Code 的文件树是一个感觉。

不是什么革命性的改变,但是用起来顺手很多。

安全方面,堵上了一个挺大的漏洞

这次修复了一个媒体文件访问绕过的安全漏洞——原本的文件访问路径有个别名(mediaUrl/fileUrl),攻击者可以通过这个别名跳出 OpenClaw 的媒体访问限制,拿到理论上不应该拿到的文件。

这次把这个别名绕过彻底关掉了,工具动作和消息动作都不能再通过这个路径突破媒体访问边界。

这种安全漏洞,通常不会有人来跟你主动汇报。

你就是莫名其妙地文件被读取了,都不一定知道从哪里出去的。

Microsoft Teams,终于补上了短板

一直以来,OpenClaw 对 Microsoft Teams 的支持,跟其他频道比起来,就像是后妈养的。

这次,OpenClaw 把 Teams 的底层彻底翻新了一遍——迁移到了 Teams 官方 SDK,不再用之前那套非官方路子。

但变化不止这些。

这次跟着一起上的,还有 AI 原生的交互体验:流式回复(就是你能看着回答一点一点打出来,像和 ChatGPT 聊天一样,而不是等半天突然蹦出一大段)、欢迎卡片加入了快捷提示词、输入中会显示「正在思考」的状态指示器、消息旁边还有原生的 AI 标签。

说得直白点,就是你在 Teams 里用 OpenClaw,终于开始有点像个真正的 AI 助手的感觉了,而不是硬塞进去的外来物。

另外,这次还加了消息编辑和删除。

以前 Agent 发出去的消息,发错了只能干瞪眼。现在可以改了。

这两件事加在一起,基本上是把 Teams 频道从「能用凑合用」提升到了「可以认真用」的档次。

顺手修了一堆群聊 Bug

除了上面这些,这次日志里还有一整排频道层面的修复,几乎把主要平台都覆盖了。

WhatsApp 群组里,OpenClaw 之前会把自己发出去的消息重复处理一遍,相当于自己回复自己,现在修复好了。

Telegram 论坛话题,遇到 #General 主题时路由会出错,消息发不到正确的话题下,现在能正确处理了。

Discord 的超时问题也修复了——之前如果 OpenClaw 在处理你的请求时超时,它会就这么悄无声息地不回应,现在会给你发一条超时提示,告诉你它没处理完。

这些 Bug 单独拿出来说,可能每个都不大。

但如果你每天都在用这些频道,积累下来的体验差距,是实实在在的。

值得 AI 开发者关注的更新

如果你在自己的项目里通过 OpenAI 兼容接口来调用 OpenClaw,这次加了 /v1/models 和 /v1/embeddings 两个端点,对 RAG(检索增强生成)的兼容性提升不少。

目前 OpenClaw 的最新版本支持 Node 22.14+ 运行,官方推荐 Node 24。

此前 Node 22.14 的用户在升级时会遇到版本不兼容导致安装失败的问题,这次也把版本检测提前了,跑 openclaw update 之前会先检查你的 Node 版本够不够,不够会直接告诉你需要升级,而不是安装到一半失败、留下一堆让人摸不着头脑的报错。

附录:完整更新日志

 重大变更

网关 / OpenAI 兼容性:新增 /v1/models 和 /v1/embeddings 端点,并支持通过 /v1/chat/completions 和 /v1/responses 透传显式模型覆盖参数,以兼容更多客户端和 RAG 应用场景。

Agent / 工具:/tools 接口现在只展示当前 Agent 实际可用的工具;新增默认紧凑视图(可切换至详细模式);控制台新增「当前可用」实时区块,让你在提问前就能确认哪些工具可以调用。

Microsoft Teams:迁移至官方 Teams SDK,并引入 AI Agent 交互最佳实践,包括单聊流式回复、带快捷提示词的欢迎卡片、反馈与反思机制、友好的状态提示、输入指示器,以及原生 AI 标签。

Microsoft Teams:支持编辑和删除已发送消息,未指定明确目标时自动回退至线程内操作。

Skills / 安装元数据:为内置 Skill(coding-agent、gh-issues、openai-whisper-api、session-logs、tmux、trello、weather)添加一键安装配方,CLI 和控制台在检测到依赖缺失时可直接提示安装。

控制台 / Skills:新增状态筛选标签页(全部 / 已就绪 / 需配置 / 已禁用,各附数量统计);原内联 Skill 卡片改为点击弹出详情对话框,包含依赖说明、启用开关、安装操作、API Key 输入、来源元信息及主页链接。

Slack / 交互式回复:恢复直接投递的富文本回复对等支持;自动将末尾简单的 Options: 列表渲染为按钮或下拉选择;优化 Slack 交互设置默认值;将回复控件与插件交互处理器隔离。

CLI / 容器:新增 –container 参数和 OPENCLAW_CONTAINER 环境变量,支持在已运行的 Docker 或 Podman OpenClaw 容器内执行 openclaw 命令。

Discord / 自动线程:新增可选的 autoThreadName: “generated” 命名模式,新建自动线程后可异步调用 LLM 生成简洁标题进行重命名;原有基于消息内容的命名方式保留为默认行为。

插件 / 钩子:新增 before_dispatch 钩子,携带规范化的入站元数据;已处理的回复现在经由标准末端投递路径转发,保留 TTS 和路由投递语义。

控制台 / Agent:Agent 工作区文件列表改为可展开的 <details> 折叠行,支持懒加载行内 Markdown 预览;新增完整的 .sidebar-markdown 样式,覆盖标题、列表、代码块、表格、引用块及 details/summary 元素。

控制台 / Markdown 预览:重新设计 Agent 工作区文件预览对话框,采用磨砂玻璃背景、固定尺寸面板和样式化标题栏;集成 @create-markdown/preview v2 系统主题,支持富文本 Markdown 渲染(标题、表格、代码块、标注块、引用块),并自动适配应用的亮色 / 暗色设计变量。

macOS 应用 / 配置:将横向胶囊式子导航替换为可折叠树形侧边栏,使用展开箭头和缩进子项行进行层级导航。

CLI / Skills:将依赖缺失的提示文案从「missing(缺失)」软化为「needs setup(需配置)」;在 openclaw skills info 输出中补充 API Key 配置引导(如何获取 Key、CLI 保存命令、存储路径)。

macOS 应用 / Skills:在 API Key 编辑对话框中新增「获取密钥」主页链接和存储路径提示;保存确认消息中显示配置文件路径。

控制台 / Agent:默认 Agent 模型选择下拉框新增「未设置」占位项。

运行时 / 安装:将 Node 22 的最低支持版本降至 22.14+(官方仍推荐 Node 24),避免 npm 安装和自更新时将 Node 22.14 用户锁定在旧版本上。

CLI / 更新:在执行 openclaw update 全局安装前,预先检查目标 npm 包的 engines.node 字段,Node 版本不满足时直接给出明确的升级提示,而非强行安装后失败。

问题修复

出站媒体 / 本地文件:将出站媒体访问权限与已配置的文件系统策略对齐——workspaceOnly 关闭时,宿主机本地文件和入站媒体路径可正常发送;严格工作区模式下的 Agent 仍保持沙箱隔离。

安全 / 沙箱媒体分发:关闭 mediaUrl/fileUrl 别名绕过漏洞,防止出站工具动作和消息动作突破媒体根目录限制。

网关 / 重启哨兵:重启后通过心跳唤醒被中断的 Agent 会话(不再仅发送尽力而为的重启通知);出站投递遇到瞬时失败时自动重试一次;唤醒路径保留显式线程 / 话题路由,确保回复落到正确的 Telegram 话题或 Slack 线程。

Docker / 初始化:通过将启动前的初始化配置写入操作路由至 openclaw-gateway,避免 openclaw-cli 共享网络命名空间的循环依赖,解决 Docker 全新安装时在网关启动前就失败的问题。

网关 / 频道:保持频道按顺序启动,同时隔离单个频道的启动失败,确保某个频道异常不再阻塞后续频道的启动。

嵌入式运行 / 密钥:未解析的 SecretRef 配置不再导致嵌入式 Agent 运行崩溃,改为回退至已解析的运行时快照。

WhatsApp / 群组:追踪网关近期发送的消息 ID,仅抑制匹配的群组消息回声,保留关联账号 fromMe 流量中的 /status、/new、/activation 等所有者指令。

WhatsApp / 回复机器人检测:恢复隐式群组回复检测——通过解包 botInvokeMessage 载荷并从 creds.json 读取 selfLid,确保关联账号群聊中基于回复的 @ 提及能再次触达机器人。

Telegram / 论坛话题:修复 Telegram 省略论坛元数据时 #General 话题(topic 1)的路由恢复问题,覆盖原生指令、交互回调、入站消息上下文及回退错误回复。

Discord / 网关监管:将网关错误处理集中到一个生命周期托管的监管器,使早期、运行中和销毁阶段的 Carbon 网关错误得到统一分类,不再作为进程级崩溃抛出。

Discord / 超时:入站 Discord Worker 在回复开始前超时时,发送可见的超时提示,涵盖已创建的自动线程目标和排队运行的顺序。

ACP / 直接对话:即使块文本已提前流式发送,最终 TTS 未产生音频时仍确保投递一条终态 ACP 结果;跳过多余的空文本终态合成请求。

Telegram / 出站错误:保留可操作的 403 错误详情(含成员关系 / 封禁 / 踢出信息);将「机器人不在群组内」归类为永久投递失败,避免 Telegram 持续重试无效对话。

Telegram / 图片:预检 Telegram 图片尺寸和宽高比规则,图片元数据无效或不可用时自动回退为文件发送,解决 PHOTO_INVALID_DIMENSIONS 报错导致图片上传失败的问题。

Slack / 运行时默认值:精简 Slack 私信回复开销;恢复 Codex 自动传输;收紧 Slack 和网络搜索的运行时默认配置,涉及私信预览线程、缓存作用域、警告去重及网络搜索显式开启逻辑。

作者:新智元

来源:新智元

]]>
OpenClaw养龙虾火了,但你真正该学的是Skills //m.clubpenjuin.com/379893.html Mon, 09 Mar 2026 06:22:34 +0000 //m.clubpenjuin.com/?p=379893

 

这两周,你的朋友圈是不是被”养龙虾”刷屏了?

傅盛骨折在家14天,靠一群AI Agent完成了原本需要团队协作的工作。

腾讯云在深圳搞免费安装活动,现场排队的人比苹果发布会还多。

阶跃星辰的Step 3.5 Flash连续三天登顶OpenClaw榜首,Token消耗暴涨,大模型厂商终于找到了变现路径。

一切都说明,这是一个巨大的风口,龙虾改变了太多。

但当你真正开始养龙虾,很快就会发现三个尴尬的事实:

第一,Token烧得太快。

一个月下来,光API费用就够雇个实习生了。

第二,效果不稳定。

同样的任务,有时候完成得很好,有时候完全跑偏。

第三,Claude Code也能干。

很多编程场景,Claude Code效率更高,成本更低。

你开始怀疑:OpenClaw到底值不值得用?

但如果我告诉你,这些问题的根源,都不在OpenClaw本身,而在于你没有好的Skills,你信吗?

一、OpenClaw的火,烧的是Skills的柴

很多人以为OpenClaw火,是因为它能”操作电脑”。

错了。

OpenClaw火的本质,是Skills生态成熟了。

什么是Skills?

简单说,就是”教会AI做某件具体事情的能力包”。

比如:

一个”抓取网页数据”的Skill

一个”分析Excel表格”的Skill

一个”生成测试用例”的Skill

OpenClaw只是个”执行器”,真正让它能干活的,是背后成千上万个Skills。

没有Skills,OpenClaw就是个空壳。

这就像:

你买了一台iPhone,但App Store里没有应用

你买了一辆特斯拉,但没有充电桩

你雇了一个助理,但他什么技能都不会

为什么傅盛14天能搞定那么多事?

不是因为他的OpenClaw配置有多牛,而是因为他有一个成熟的Skills库

他的Agent能调用的Skills,可能有几十上百个:

数据分析类Skills

内容生成类Skills

项目管理类Skills

市场调研类Skills

而你的Agent呢?

可能只有几个通用Skills:写文档、搜索信息、发邮件。

这就是差距。

二、没有Skills的OpenClaw,就是个昂贵的玩具

现在回过头看,你养龙虾遇到的那些问题,是不是都能解释了?

问题1:Token消耗太大

为什么烧Token?

因为你没有专门的Skills,只能让大模型”从头推理”。

举个例子:

没有Skills的做法

你:帮我分析这个Excel表格,找出销售额Top10的产品

OpenClaw:好的,我先读取文件,然后理解表格结构,再计算每个产品的销售额,最后排序…

结果:消耗了5000个Token,花了30秒

有Skills的做法

你:用”Excel分析”Skill,找出销售额Top10

OpenClaw:调用Skill,直接执行

结果:消耗了500个Token,花了3秒

看出区别了吗?

前者是”让AI重新发明轮子”,后者是”直接用现成工具”。

Skills就是你的工具箱,工具越多,效率越高,成本越低。

 

问题2:效果不稳定

为什么不稳定?

因为大模型每次推理的路径可能不一样。

今天它可能先分析A再分析B,明天可能先分析B再分析A。

结果就是:同样的任务,输出结果千差万别。

但如果你有一个”标准化的Skill”,每次执行的逻辑都是固定的,结果自然就稳定了。

Skills是可复用的,大模型推理是不可复用的。

问题3:Claude Code也能干

这个问题最有意思。

很多人发现,编程场景下,Claude Code比OpenClaw好用多了。

为什么?

因为Claude Code本质上就是”一个专门为编程场景优化的Skills集合”。

它内置了:

  • 代码补全Skill
  • 代码重构Skill
  • Bug修复Skill
  • 测试生成Skill

而OpenClaw呢?

它是个”通用执行器”,什么都能做,但什么都不精。

这就是为什么专用工具往往比通用工具好用。

但如果你给OpenClaw配上一套”编程专用Skills”,它也能达到Claude Code的效果。

关键在于:你有没有这套Skills。

三、真正的护城河:你的Skills库

现在你应该明白了:

OpenClaw只是工具,Skills才是资产。

为什么这么说?

因为Skills有三个特性:

1. Skills是可复用的

一个好的Skill,可以用在无数个场景里。

比如”网页数据抓取”Skill:

  • 可以用来抓竞品价格
  • 可以用来抓用户评论
  • 可以用来抓行业资讯

你写一次,用一辈子。

2. Skills是可积累的

今天你写了10个Skills,明天再写10个,一年后你就有了几百个。

这就是你的护城河。

别人要从零开始,你已经有了一个完整的工具库。

这就是为什么傅盛说”Agent的核心壁垒是Skill积累”。

不是谁的模型更强,而是谁的Skills更多。

3. Skills是可交易的

未来,Skills会成为一种”数字资产”。

就像现在的App Store,会有一个”Skills Store”。

你可以:

  • 买别人的Skills
  • 卖自己的Skills
  • 订阅Skills服务

谁掌握了Skills,谁就掌握了AI时代的生产资料。

正确的养龙虾路径

说了这么多,那到底应该怎么做?

三步走:

第一步:先学会用Skills

不要急着养龙虾,先去看看现在有哪些好用的Skills。

比如:

  • GitHub上的开源Skills
  • 各大AI平台的Skills市场
  • 技术社区分享的Skills

理解每个Skill能做什么,不能做什么。

这就像学编程,你得先知道有哪些库可以用,才能写出好代码。

第二步:再学会写Skills

当你用了一段时间,就会发现:

有些场景,现成的Skills不够用。

这时候,你就需要自己写。

写Skills不难,关键是要理解:

  • 这个Skill要解决什么问题?
  • 输入是什么?输出是什么?
  • 边界条件是什么?

一个好的Skill,应该是”小而美”的。

不要试图写一个”万能Skill”,而是写一堆”专用Skill”。

第三步:最后才是养龙虾

当你有了几十上百个Skills,再去用OpenClaw,你会发现:

完全是两个世界。

以前你让龙虾做事,它磨磨蹭蹭,效果还不好。

现在你让龙虾做事,它直接调用你的Skills,秒级完成,结果还稳定。

这才是OpenClaw的正确打开方式。

写在最后

OpenClaw的出现,让”人人都能养龙虾”成为现实。

但就像当年”人人都能做公众号”一样,工具的普及,不代表价值的普及。

真正能从OpenClaw中获益的,不是那些”直接上手养龙虾”的人,而是那些”先积累Skills”的人。

当别人还在抱怨Token太贵的时候,你已经用Skills把成本降到了十分之一。

当别人还在抱怨效果不稳定的时候,你已经用Skills实现了标准化输出。

当别人还在纠结OpenClaw和Claude Code哪个好的时候,你已经用Skills让两者都为你所用。

OpenClaw是工具,Skills是资产。

工具会过时,资产会增值。

别急着养龙虾,先把Skills练好。

当你有了100个好用的Skills,OpenClaw才能发挥真正的价值。

作者:AI漫步

]]>
最适合新手安装的10个小龙虾🦞 skills来了! //m.clubpenjuin.com/379680.html Fri, 27 Feb 2026 03:57:51 +0000 //m.clubpenjuin.com/?p=379680

 

最近科技圈的“小龙虾”特别火——也就是 OpenClaw。

OpenClaw 的核心优势是“技能包(Skills)”系统——它就像一个万能工具箱,AI 遇到什么任务就掏什么工具,专具专用,高效不卡顿。

目前社区里已经有几百个这样的“工具”了,直接挑花了眼。

因此,基于 2026 年 ClawHub 热门榜、社区精选以及 X/Reddit 的真实反馈,我们专门为新手筛选出了10 个最建议安装的 Skills

最建议新手使用的 10 个技能

这份名单主打低风险、高实用、立竿见影。技能基本都来自 @steipete 等靠谱作者的,安装量高、star多、恶意报告极少。

1.self-improving-agent自我迭代/主动代理。

让Agent记住错误、自我优化、越来越聪明。新手最容易感受到“哇,变聪明了”。 (ClawHub热门榜第一,46k+ installs)

2.tavily-search(或 tavily-web-search) 联网搜索(Tavily API优化版)。

没这个Agent就是“井底之蛙”,查不了实时信息。几乎所有新手必装第一梯队。 (37k+ installs,AI Agent标配)

3.gog(Google Workspace CLI) Gmail、日历、Drive、Docs全家桶。

日常办公/邮件/日程神器,新手最快看到实际自动化效果(读邮件、加日历、写文档)。 (46k+ installs,超级实用)

4.githubGitHub集成(用gh CLI)。能搜代码、管issue/PR、创建repo。

新手学代码/做项目超方便。 (35k+ installs,开发者入门必备)

5.summarize

总结URL、PDF、图片、YouTube、音频。快速消化信息,新手研究东西时超级省力。 (36k+ installs,高频使用)

6.find-skills

让Agent自己去ClawHub搜并推荐/安装技能。解决“不知道装什么”的最大痛点,新手最友好。 (社区反复推荐的“元技能”)

7.ontologyagent-memory/memory

结构化记忆/知识图谱。让Agent真正“记住你”、跨对话连贯,不再健忘。新手交互体验提升巨大。 (35k+ installs,长期用越用越香)

8.weather

查天气(无需API key)。超级简单、零配置,新手第一个测试技能,成功率100%,建立信心。 (29k+ installs,入门玩具但实用)

9.proactive-agent

(或 proactive-agent-1-2-4 等版本) 增加主动性,能自己规划、迭代任务。

让Agent从“被动回答”变成“主动帮忙”。 (X上中文社区特别推,新手用后反馈“活了”)

10.skill-vetter/security-audit

或类似安全扫描 安装前扫描技能代码、防恶意。

新手安全第一,装这个后再放心装别的。 (安全类必备,社区共识“后悔没先装”)

新手安装建议顺序(别一下全装)

顺序很重要:先安全+基础,再加生产力,最后加高级。

强烈建议先用 clawhub install skill-vetter 或类似安全扫描技能检查,再装别的。安装用 clawhub install <slug> 或 npx clawhub@latest install <slug>。

具体步骤:

  1. 先装 skill-vetter(安全)
  2. tavily-search(联网)
  3. self-improving-agent + proactive-agent(聪明起来)
  4. gog 或 github(看你日常用Google还是代码)
  5. summarize + find-skills(研究+扩展)
  6. ontology/memory(长期记忆)
  7. weather(测试玩玩)

Tips

  • 先去 https://www.clawhub.ai/ 浏览热门/ trending,看安装量和作者。
  • 用 clawhub search “beginner” OR “essential” 自己搜。
  • 装完后新开session(重启OpenClaw),技能才会生效。
  • 别一次性开太多,token和性能会爆炸。先3-5个玩熟了再加。
  • 安全永远第一:用隔离环境(Docker)、别给敏感权限、定期 clawhub update –all。

作者:王熠明、刘伟鸿

来源:Datawhale

]]>
一文详解Skills:AI Agent 的核心能力单元 //m.clubpenjuin.com/379616.html Tue, 24 Feb 2026 03:30:48 +0000 //m.clubpenjuin.com/?p=379616

 

AI Agent(智能体)向实用化迭代的过程中,“Skills”(智能体技能)是连接大模型推理能力与实际执行能力的关键核心。

不同于大模型本身的思考能力,也区别于外部工具的基础功能,Skills是一套标准化、可复用、可组合的能力单元,让AI Agent从“只会思考”升级为“能落地执行”。

一、核心定义:Skills 到底是什么?

从技术层面定义,AI Agent的Skills是挂载在智能体上,可被自主调用、自由组合、重复复用的标准化能力单元,本质是“场景最佳实践 + 所需工具”的封装,核心作用是将大模型的抽象推理规划,转化为可落地、可验证的具体操作,保障输出的稳定性与一致性。

需明确3个认知边界,避免混淆:

一是与Prompt不同,Skills可模块化管理、集成资源,支持AI自主触发,无需人工手动输入;

二是与大模型能力不同,大模型提供“思考力”,Skills提供“执行力”;

三是与外部工具不同,工具是执行载体,Skills是整合工具调用逻辑、实现多工具协同的“使用能力”。

二、核心结构:一个标准Skill 的组成的关键

为了实现“可调用、可组合、可复用”,Skills需遵循统一结构,本质是一个标准化文件夹,核心由1个必需文件和3个可选子文件夹构成,简洁且实用。

必需文件为SKILL.md,是AI识别和使用Skill的唯一入口,需包含两部分:

一是YAML前置元数据,明确技能名称(小写字母+数字+连字符,作为手动调用命令)和功能描述(明确用途与边界,避免误用);

二是Markdown正文指令,明确执行流程、输入输出要求、注意事项与示例,确保AI精准执行。

3个可选子文件夹按需搭配:

  1. references/存放参考文档,提升输出准确性;
  2. scripts/存放可执行脚本,实现复杂自动化;
  3. assets/存放静态资源,保障输出规范。

整体而言,Skill = 元数据 + 执行指令 + 辅助资源,如同“插件”可自由复用。

三、核心分类:3类Skills 覆盖全场景需求

根据能力层级与适用场景,Skills可分为三大类,层层递进、协同互补,覆盖从基础执行到复杂业务的全部需求。

3.1 基础通用技能

所有AI Agent的底层必备能力,无需复杂工具,聚焦基础逻辑处理,如任务规划拆解、上下文管理、反思纠错、格式转换,是复杂技能调用的基础,轻量化且可自主触发。

3.2 工具调用技能

连接AI Agent与外部工具的核心,也是目前应用最广泛的类型,集成工具调用逻辑与异常处理,可自主选择工具、传递参数,如文件处理、搜索检索、代码执行、API调用等,实现“动手做事”的核心需求。

3.3 业务垂直技能

面向特定行业的高阶复合技能,由基础技能、工具技能与行业知识封装而成,行业属性强,可沉淀专家经验,如法律类案检索、营销物料生成、预算审批校验等,助力新手快速复用专业能力。

四、实战价值:Skills 的核心作用

Skills的核心价值在于降低门槛、提升效率、沉淀经验,从个人、团队、企业三个维度实现价值落地:

  1. 对个人,一键调用技能即可完成专业任务,降低专业门槛;
  2. 对团队,沉淀最佳实践,实现标准化复用,提升协同效率;
  3. 对企业,复用现有技能、组合新技能,降低研发成本,推动AI规模化落地。

五、进阶要点与未来趋势

自定义开发Skills需遵循三大原则:

  1. 单一职责、描述精准、异常处理,确保可复用、高稳定。
  2. 调用方式分为自动调用(AI自主判断)与手动调用(用户强制触发),按需选择即可;
  3. 优化可从数据驱动(分析日志、修正异常)与场景适配(贴合行业需求)两个方向入手。

未来,Skills将朝着生态化、智能化、低代码化发展,技能商店将成为核心载体,技能可自主学习、智能组合,可视化开发工具将降低门槛,让更多人成为Skill开发者。

总结

Skills是AI Agent实现自主执行、标准化落地、规模化复用的核心支撑,本质是标准化的能力封装。

掌握其定义、结构、分类与进阶技巧,无论是普通用户、开发者还是企业,都能更好地借助AI能力提升效率、创造价值。

随着技能生态的完善,Skills将成为AI Agent时代的核心资产,推动AI真正融入各类工作场景。

作者:Tuer AI

]]>