OpenClaw 从能聊到能干差的是这 50 个 Skills 😍😍😍
我正在开发 DocFlow,它是一个完整的 AI 全栈协同文档平台。该项目融合了多个技术栈,包括基于
Tiptap的富文本编辑器、NestJs后端服务、AI集成功能和实时协作。在开发过程中,我积累了丰富的实战经验,涵盖了Tiptap的深度定制、性能优化和协作功能的实现等核心难点。
如果你对 AI 全栈开发、Tiptap 富文本编辑器定制或 DocFlow 项目的完整技术方案感兴趣,欢迎加我微信 yunmz777 进行私聊咨询,获取详细的技术分享和最佳实践。
很多人第一次打开 OpenClaw,会下意识把它当成"接在微信或 Slack 上的聊天机器人"。这种理解只对了一半。从架构上看,OpenClaw 更像一个网关:它站在你和一堆能力之间,负责路由、鉴权、记忆和工具调用。真正决定你能做多少事的,不是对话框有多好看,而是背后接了多少"身体"——也就是 Skills。
大语言模型很像一个装在罐子里的超级大脑,读得懂天下书,推得了复杂逻辑,但它没有手。它没法自己点按钮、没法直接读你电脑里的真实文件、也没法"学会"一套新工作流,除非你每次都把那套流程写成十几页的说明塞进提示词。Skills 就是给这个大脑配上的手脚和工具箱。你通过 OpenClaw 发一句指令,网关把请求转给模型,模型按当前加载的 Skill 决定调用哪类工具、走哪套流程,最后把结果经由同一网关回到你的聊天窗口。所以,与其说你在和 OpenClaw 聊天,不如说你在通过它调度一个"大脑 + 一堆可插拔能力"的联合体。
下面这张图概括了这条链路:从你的一句话,到网关、模型与 Skills 的协作,再到结果回到聊天窗口。
![]()
上图从左到右依次是你发指令、OpenClaw 网关做路由与鉴权、大模型负责推理、Skills 提供手脚与工具、执行后结果再经网关回到聊天窗口;整条链路就是"一句话调度大脑与能力"。
本文会先澄清"提示词膨胀"为什么会让很多人吃亏,再说明 Skill 是什么、为什么要用 SkillGuard 管好环境安全,最后按类别梳理一批值得优先安装的 Skills,并附上各类别的示意配图 prompt,方便你从"聊天思维"切换到"基础设施思维"。
提示词膨胀:为什么你还在吃亏
如果还没用上 Skill,大概率会落在两种处境之一。
第一种是提示词工程的无底洞。为了让人工智能好好干一次活,你得花十几二十分钟写"完美提示词",把背景、约束、输出格式、反例全塞进去。一次两次还行,任务一换又要重写,而且同一个任务下次还想复用时,又得翻聊天记录或文档把那一大段再贴一遍。成本高、难复用、还容易忘。
第二种是上下文超载。为了"让 AI 更懂我",很多人会在系统提示里塞进大量个性设定、操作指令和禁忌清单。结果模型还没开始干活,上下文窗口已经占掉一大截,轻则推理变慢、容易截断,重则直接爆掉,顺便把 API 额度烧光。更麻烦的是,这些设定和任务强绑定在一起,换一个任务又得改一版提示,维护成本越来越高。
Skill 要解决的就是这两类问题。它把"怎么用某类工具、走某套流程"打包成独立文件(或指令集),只在需要时加载。OpenClaw 和你用的 Agent 只加载当前任务需要的"战术手册",其余时间保持轻量。这样 Agent 能保持敏锐、成本可控、结果也更容易复现。你不是在跟一个越聊越臃肿的聊天窗口较劲,而是在维护一套可组合的能力层。
Skill 是什么,以及为什么要用 SkillGuard
从技术上说,一个 Skill 就是一个打包好的指令集,通常以文件形式存在,用来告诉 Agent 如何使用特定工具或执行某类复杂工作流。
区别在于指令的粒度。不写 Skill 时,你只能说"请帮我看看这段代码有没有错误",模型只能根据当次对话里的零散信息自由发挥。有了 Skill,你可以说"用 debug-pro 这个 Skill 对我的仓库做一次全面扫描,检查日志,然后在终端里按规范修复语法错误"。后者是"指名用哪套能力、按什么流程做",前者是"随便你怎么做"。前者依赖每次的提示词质量,后者依赖事先定义好的能力包,可复用、可审计、可迭代。
Skill 来源一多,风险就来了。ClawHub 等技能市场上有大量第三方 Skill,质量参差不齐,甚至混入恶意代码(窃取凭证、反向 shell、挖矿等),OpenClaw 的架构又给了 Agent 系统级权限和对外通信能力,一旦装上恶意 Skill,影响会很大。所以官方和社区都强调用 SkillGuard 一类机制做监控:在真正执行或下载 Skill 前,做来源校验、行为扫描或沙箱隔离,在"环境安全"和"持续扩展能力"之间取得平衡。如果你打算认真把 OpenClaw 当基础设施用,建议从第一天就打开 SkillGuard,养成"先验再装"的习惯。
从聊天思维到基础设施思维
大多数人会淹没在二十多万个可用 Skill 里,不知道从哪装起。真正能跑赢一票"只会聊天"用户的,往往是那些先把基础能力打牢的人。下面按类别整理一批值得优先考虑的 Skills,并说明它们各自解决什么问题、适合谁用;每一类下面都附了一张"这类在做什么"的示意配图 prompt,你可以丢进文生图模型生成插图,再替换文中的代码块。你可以按自己的角色(独立开发者、内容创作者、做增长的人等)勾选几条主线,再逐步扩展。
基础 Skills:给 AI 装上手脚
如果感觉 OpenClaw"也就那样",多半不是模型不够强,而是管道太薄。把这层当成"操作系统"来配,而不是聊天窗口,会顺很多。下面六个是很多人会优先装的基础能力。
-
find-skills:技能市场里 Skill 数量巨大,手动搜既慢又容易漏。这个 Skill 让 Agent 能按任务描述自动发现、筛选合适的 Skill,相当于导航员。 -
skill-creator:把你自己的工作流和"氛围编程"逻辑打包成可复用 Skill,相当于规模化复制你的习惯和判断,让 AI 反复按同一套标准执行。 -
mcp-builder:通过模型上下文协议(MCP)把 AI 接到私人数据和外部工具上,是 2026 年很多人会装的"桥梁"类 Skill,没有它,很多高级能力接不进来。 -
using-superpowers:强制 Agent 先搞清楚自己有哪些高级能力、在什么场景下用哪一项,而不是凭感觉瞎试,相当于优化器。 -
subagent-driven-development:把大任务拆成子任务,委派给子 Agent 执行并做结果审核,主 Agent 专注规划和验收,适合不想在一个提示词里搞定所有事的场景。 -
agent-tools:给 Agent 一整套常用小工具,处理那些模型默认不擅长、但又很常见的琐事,相当于数字瑞士军刀。
适合谁用:独立创始人、独立开发者,以及不想"手把手教 AI 走每一步"的人。
下面这张图代表"基础 Skills"在做什么:给 AI 装上导航、桥梁、优化器、委派与工具箱。
![]()
上图概括了基础类 Skills 的五个角色:找 Skill、接数据、优化能力认知、委派子任务、以及日常小工具,合起来就是让 AI 从"只会聊"变成"能动手"。
策略与创作 Skills:从打字员到战略伙伴
如果 Agent 的输出总像机器人在填废话,多半缺的是"先想清楚再写"的环节。下面这类 Skill 会引入反思、大纲和策略,把 OpenClaw 从快速打字员变成能提前验证逻辑的伙伴。
-
brainstorming:从一个关键词展开多种角度和"如果……会怎样"的场景,避免只停留在第一个听起来很"AI"的念头。 -
copywriting:不只生成文案,还管结构、节奏和语气,减少对老套模板的依赖。 -
systematic-debugging:一套可复用的排查框架,既能用来查代码,也能用来分析项目计划或异常情况。 -
writing-plans:动笔前先建大纲和内容策略,避免长文写飞。 -
content-strategy:选题和内容日历规划,让发布有节奏、有品牌感。 -
executing-plans:把高层计划拆成可执行的多步任务,由 Agent 按顺序完成。 -
marketing-ideas:给一个功能或时间节点,用成熟营销框架产出传播点和活动概念。 -
copy-editing:在纠错之外,顺带打磨语气和逻辑,尽量保留你个人的表达习惯。 -
social-content:把同一套核心信息改写成适合不同平台(如 X、TikTok、小红书)的版本,照顾各处的阅读习惯。 -
reflection:在流程里加入自检和纠错环节,让 Agent 能回顾自己的输出、总结经验、在过程中修正错误。
适合谁用:做内容、做个人品牌、或者想从"对着空白页发愁"变成"稳定产出但不丢灵魂"的人。
下面这张图代表"策略与创作 Skills"在做什么:从想法到大纲、文案、多平台分发与反思。
![]()
上图从左到右是创意展开、大纲与计划、文案打磨、多平台分发、按计划执行和反思自检,对应"先想清楚再写、写完后还能改"的一整条创作链。
工程 Skills:用氛围编程的速度,达到生产级质量
氛围编程已经是 2026 年的常态,但光靠对话很难保证生产级可维护性和测试覆盖。下面这些 Skill 把工程最佳实践编码进去,让 Agent 在写代码时更贴近真实团队的标准。
-
vercel-react-best-practices、vercel-composition-patterns:React 与 Vercel 生态下的前端规范和组件组合方式。 -
remotion-best-practices:用代码驱动视频与动画,适合程序化营销素材和产品演示。 -
agent-browser、browser-use:让 Agent 能浏览网页、填表、抓取数据或做自动化测试,相当于给 AI 装上"眼睛"和"手"。 -
vercel-react-native-skills:移动端跨平台开发时的 React Native 最佳实践。 -
supabase-postgres-best-practices:数据库设计与 PostgreSQL 使用上的建议。 -
next-best-practices:Next.js 的架构与路由等最新模式。 -
webapp-testing、test-driven-development:测试驱动与自动化测试,减少回归和边缘问题。 -
requesting-code-review:在发布前让 Agent 自审代码,查找潜在漏洞和坏味道。
适合谁用:自己做产品、用氛围编程但希望交付物更稳、更可维护的创始人或开发者。
下面这张图代表"工程 Skills"在做什么:从代码规范、测试、到浏览器自动化与发布前审查。
![]()
上图概括了工程类 Skills 覆盖的几块:前端与全栈规范、数据库、测试与 TDD、浏览器自动化、视频与移动端,以及发布前的代码自审,对应"用对话的速度写出可维护的代码"。
设计 Skills:不碰 Figma 也能要专业审美
不需要自己会画图,也能让 Agent 产出符合设计原则的界面和素材。
-
web-design-guidelines、frontend-design:按网格、色板等原则审视前端实现,避免"通用 AI 丑"。 -
ui-ux-pro-max:跨技术栈的设计与无障碍建议。 -
canvas-design:把想法转成 PNG、PDF 等视觉素材。 -
tailwind-design-system:用 Tailwind 令牌和无障碍模式搭可复用的 UI 库。 -
content-visualizer、infographic-pro:根据内容推荐版式、生成信息图或封面图。 -
ai-image-generation:统一调用多模型(如 DALL·E、Imagen、Gemini)做原型和创意图。
适合谁用:做落地页、做高保真内容、希望产品"长得像样"但暂时不打算雇设计团队的开发者或创始人。
下面这张图代表"设计 Skills"在做什么:从网格与色板、到信息图与多模型出图。
![]()
上图从左到右是设计原则与色板、前端与组件库、UX 与无障碍、插画与素材、信息图与封面推荐,以及多模型统一出图,对应"不自己画图也能要专业视觉"。
增长 Skills:把 OpenClaw 当增长引擎
产品做出来只是前半段,卖不出去等于没存在感。这类 Skill 覆盖从 SEO、转化到心理诱因的链条。
-
Larry:结合图像生成和病毒式钩子,自动化 TikTok 等平台的图文内容。 -
audit-website、seo-audit:网站健康与 SEO 缺口扫描,减少盲目猜测。 -
marketing-psychology:把社会认同、稀缺性等原理用到产品钩子和文案里。 -
programmatic-seo:规模化生成大量 SEO 友好页面的工作流。 -
product-marketing-context、pricing-strategy、page-cro:定位、定价和落地页转化优化。
适合谁用:独立黑客、独立创始人,以及在没有大预算的情况下也要拉新和变现的营销或产品人。
下面这张图代表"增长 Skills"在做什么:从 SEO、网站健康、到心理诱因与转化。
![]()
上图概括了增长类 Skills 的链条:网站与 SEO 诊断、病毒式内容、营销心理、规模化 SEO、产品定位与定价,以及落地页转化优化,对应"产品做出来之后怎么卖出去"。
文档 Skills:把 AI 当行政助理
合并拆分 PDF、做 PPT、出 Word/Excel、把网页转成 Markdown 或 HTML,这类"文书劳动"交给专门 Skill 处理,能省下大量时间。
-
pdf-pro、pptx、docx、xlsx:对应格式的生成与编辑能力。 -
url-to-markdown、markdown-to-html:为知识库或发布流程做格式转换。 -
format-pro:统一文档版式和样式,保持品牌一致。
适合谁用:经常要出报告、提案、知识库或对外材料的创始人、学生或专业人士。
下面这张图代表"文档 Skills"在做什么:从 PDF、PPT、Word、Excel 到格式转换与统一版式。
![]()
上图从左到右是 PDF 处理、PPT 与 Word/Excel 生成、网页转 Markdown、Markdown 转 HTML 发布,以及版式与品牌统一,对应"文书杂活交给 AI 省时间"。
小结
OpenClaw 的价值不在于多一个聊天入口,而在于它把"模型 + 记忆 + 工具 + 技能市场"串成了一条可扩展的管道。你发出去的那句话,会经过网关被转成对某几个 Skill 的调用,再驱动真正的读写、执行和对外请求。想把它用成 2026 年能持续跑下去的基础设施,就需要从"聊天"思维切到"网关 + 能力层"思维:先装好基础 Skills、打开 SkillGuard,再按自己的角色补上策略、工程、设计、增长或文档中的几条线,让 Agent 既有手脚,又处在可控、可审计的环境里。