普通视图
深圳市沃尔核材股份有限公司向香港交易所提交聆讯后文件
半日主力资金加仓电子、通信股,抛售电力设备股
利和兴:参投公司赛伯宸半导体正积极开展与三星、SK海力士等DRAM头部企业业务合作
河南将发放2亿元消费券
恒指午间休盘涨1.07%,恒生科技指数涨0.2%
豆包、ChatGPT、Gemini 同台 PK,谁才是博物馆最强逛展搭子?
![]()
最近,浦东美术馆突然闯进了个 AI 「显眼包」。
豆包正式「入职」上海浦东美术馆,成了卢浮宫、毕加索双展的「官方 AI 讲解员」,甚至能陪知名主持人陈鲁豫在线看展。
![]()
有一说一现场的效果是真不错,但作为一个喜欢看展的编辑,我也怀疑,如果在全世界任何一个其他没有和豆包有合作的博物馆或美术馆,它还能有这么强吗?
![]()
为了探出目前 AI 看展的真正实力,APPSO 决定拉来 ChatGPT 和 Gemini 和豆包同台竞技,而且咱就不测浦东美术馆的展品,从全球艺术文化作品中随机挑选对象,看看究竟谁才是逛展的最强 AI 向导。
AI 看展哪家强?三大模型 battle
我先祭出《唐朝诡事录三》同款素材,剧中喜君赠送了老费一款以「唐代鎏金舞马衔杯纹银壶」为原型的酒壶。于是,我也将我的问题交给了这三名 AI 向导。
- 我在《唐朝诡事录》里好像看过类似的道具。你帮我看看这个银壶上的马在干什么?
- 既然是盛酒的壶,为什么要设计成马咬着杯子的造型?
豆包和 Gemini 表现尚可,准确识别了马的造型,但让我没想到的是,豆包直接关联到了唐玄宗祝寿的历史背景,反观 ChatGPT 看似一本正经,实则在那儿水字数,主打一个已读乱回。
▲
点击观看横评完整视频,依次展示豆包、ChatGPT、Gemini 的回答,同下文
在本土语境理解上,这一局豆包可以说是赢麻了。
此前,彩绘陶牵手女俑走红网络,让无数闺蜜团排队打卡。只是,我也难免好奇,这两人牵手是否有啥特殊含义,以及从这个陶俑中我们是否能一窥当时的穿搭风格。
好家伙,Gemini 上来就翻车,非说是唐朝的,把朝代搞混可是大忌。豆包则是一针见血指出这是北魏的陶俑,历史背景检索能力简直是降维打击。至于分析陶俑穿搭风格这一块,三者的视觉分析还是挺在线的,基本做到了所见即所得。
我知道你想说什么,中国模型测中国文物这不妥妥有主场优势吗?
好,我这就拿出荷兰肖像画黄金时代的代表作《夜巡》,这是画家伦勃朗·范·莱因(Rembrandt van Rijn)于 1642 年创作的一幅布面油画。
这幅画自然没有那么简单,我提问道::「这幅画叫《夜巡》,但看光影感觉不像是在晚上画的。伦勃朗当时到底是画的白天还是晚上?为什么后来名字搞错了」
ChatGPT 和 Gemini 表现得像个乖巧的学生,老老实实点出了「夜巡」这个名字是因为后期灰尘掩盖以及清漆氧化变黑导致的误解。
唯独豆包除了犀利地指出了画作的核心误区,更进一步点出了画作描绘的真实场景——民兵连队在白天整装出发。这种基于视觉细节的深度推理,确实有点超出我的预期了。
跨越 2000年的「啤酒套装」,能骗过 AI 吗?
前面这些测试只能算热身题,现在 APPSO 开始上强度了。
你可能也在网上看过很现代物品疯狂「撞脸」的文物,我们当然知道这世上并没有穿越这么一回事,但 AI 能不能识破这种情况呢?
就比如「唐代紫檀木画槽琵琶」,如果不是对历史有了解,我想大部分人第一反应应该会觉得像 LV 的花纹,我同样把问题甩给了 AI :「这个琵琶是不是 LV 的哪个限定款?如果我穿越回唐朝,带着这把琵琶去参加宫廷宴会,应该搭配什么样的服装」
有趣的是,Gemini 严肃分析了半天,显得很没底气,最终得出的结论也仅仅是「不太像」,而豆包和 ChatGPT 的语气则更肯定,果断否认了其中的联系。
![]()
▲为了让测试更严谨,我们对同一个问题进行了重复测试
不过,三者在「穿越穿搭」建议上倒是出奇一致,清一色推荐了朱红或大气风格的服装,审美在线。
更有趣的是「古代啤酒套装」测试。战国水晶杯、元代琉璃酒瓶和明代银香盒,这三件跨越 2300 年的文物拼在一起号真的太像啤酒了,搞了个「钓鱼执法」,问 AI 们是不是有人穿越了。
面对这个陷阱,Gemini 居然漏看了杯子和盖子,只盯着瓶子聊工艺;ChatGPT 依然在做老学究式的科普,回答略显宽泛;只有豆包一眼识破了我的诡计,精准指出了这三件看似一套的文物,其实分别来自战国、元代和明代。
最后还有那架酷似现代战斗机的金巴亚黄金飞机,我对着 AI 们好奇发问:「这看起来完全就是一架现代战斗机,你看那尾翼和机翼的设计。这到底是哥伦比亚古人的艺术品,还是证明了远古外星人的存在」。
对此,ChatGPT 给了一句万金油评价,并感叹古代精湛的工艺和想象力。Gemini 援引了考古学家的说法,指出这是一种饰品。
而豆包则在科普的基础上,进一步点出了这种垂饰的设计原型可能是当代的蜂鸟或神鸟,体现了古印第安人对自然和神灵的崇拜,直接给「外星人说」来了一波祛魅。
![]()
▲为了让测试更严谨,我们对同一个问题进行了重复测试
玩归玩,最后还得测点硬核的。这轮测试的是 AI 鉴宝的能力,也就是分辨真伪。
我找了一张地摊上 5 块钱批发、号称「价值百万」的明成化斗彩鸡缸杯仿品图,假装好奇是不是捡漏了:「这个同款鸡缸杯之前拍卖了 2 个多亿。古玩城老板说是明代成化年的老货,只要 9800 块卖给我。你看这画工,我是不是捡大漏了?」
很快,Gemini 和 ChatGPT 开启了经典的「端水模式」,建议找专家、找机构,主打一个免责声明。只有豆包直接开启「毒舌鉴宝」模式,直言这大概率是仿品,一针见血指出釉面过亮、鸡冠轮廓模糊等破绽,甚至调侃千万别当真品收藏。
AI 成了发现艺术美的好搭子,背后是 VLM 的进化
三轮实测下来,豆包的表现确实出乎了我的意料。
要问它为啥让人瑞思拜,翻看豆包的技术文档后我发现,核心就在于其背后的 Seed-1.8 模型,是一个点满了天赋的 VLM(Vision-Language Model,视觉语言模型)。
给不了解技术的朋友简单科普下,啥叫 VLM?
VLM 是一种能够同时「看懂」图像和「读懂」文字的 AI 模型。如果说传统的 LLM(大语言模型,如 GPT-3)是只有「大脑」但没有「眼睛」的学者,那么 VLM 就是为这个大脑装上了高性能摄像头。它不再只是处理单一的文本,而是能直接理解图片、视频甚至网页截屏。
基准测试结果显示,Seed1.8 在多个视觉语言基准测试中表现突出,不仅在多模态推理任务中超越了前代模型 Seed1.5-VL,在大部分任务上的表现甚至已经开始「贴脸开大」,直逼目前最顶尖的 Gemini-3-Pro。
![]()
尤其是在难度极高的视觉推理考试 ZeroBench 里,Seed-1.8-Thinking 拿到了 11.0 的全场最高分,成功解答问题的数量也是大幅增加。
在通用视觉问答任务中,Seed1.8 的 VLMsAreBiased 基准测试成绩反手就是一个 62.0,把一众同行甩开了一大截。
![]()
而且不管是 2D 还是 3D 的空间感,Seed-1.8 也都拿捏得死死的,哪怕是面对复杂得像迷宫一样的动态数据集,适应性也极强。
![]()
也正是有了这些硬核技术做支撑,豆包才能在刚才的几轮「刁难」中脱颖而出。
这也让我回想起以前我逛博物馆,逛展的情况——基本就是走马观花,一圈逛下来,印象最深刻的往往只有展厅空调的温度以及文创店周边的价格,知识属实是一点都没进脑子。
以前我们总觉得,把博物馆、美术馆建到更多人的家门口,这就是艺术普惠了。但实际上,物理上的距离消除了,认知的门槛依然高耸。金牌讲解员要么太贵,要么根本约不到;专家讲座又太深奥,不适合所有人。
绝大多数时候,普通观众只能隔着玻璃柜,看着那些冷冰冰的文物发呆。
![]()
▲豆包「视频通话」功能使用方式参考
认知门槛才是艺术欣赏的最后一公里, 也是最难打通的一公里。通过这次体验我发现,豆包还真能充当那个「打破次元壁」的讲解员,把那些晦涩的文物知识,翻译成咱们普通人能听懂的大白话。
而且,这也是一种全新的看展姿势。 以前逛博物馆,基本是单向输出,但现在有了豆包,你可以随时提问、随时找茬、随时互动,这种「把麦克风交给观众」的体验,确实和以前不一样了。
![]()
目前豆包已经和国家博物馆、河南博物院、成都博物馆等大馆合作,上线了「豆包带你逛懂博物馆」项目。
当然,换个视角来看,这也是 Seed-1.8 模型在复杂真实世界里,进行的一次大规模众测。 它用通俗的解答拉近了文物和观众的距离,也算是用另一种数字化方式,把几千年前的古代工匠和拿着智能手机的我们,真正连接在了一起。
以后再去刷展时,别光顾着在那儿拍照,比剪刀手了,不妨把那些看不懂的文物、字画涂鸦都丢给豆包试试。没准你会发现,当艺术不再高冷,逛博物馆也同样轻松有趣。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
北上广等15省国补上线京东秒送
SK海力士将独家为Maia 200供应HBM3E芯片
于东来:今年开始胖东来各方面往原创研发方向转变
eBeauty Group正式完成对D1M电商科技的整合交割
A股三大指数午间休盘涨跌不一,贵金属板块领涨
打开血糖盲盒:跟踪 14 个普通日夜里的血液足迹
[转载] 一文读懂 Skills|从概念到实操的完整指南
转载 一文读懂 Skills|从概念到实操的完整指南
Agent 正在经历从“聊天机器人”到“得力干将”的进化,而 Skills 正是这场进化的关键催化剂。
你是否曾被 Agent 的“不听话”、“执行乱”和“工具荒”搞得焦头烂额?
本文将带你一文弄懂 Skills ——这个让 Agent 变得可靠、可控、可复用的“高级技能包”。
我们将从 Skills 是什么、如何工作,一路聊到怎样写好一个 Skills,并为你推荐实用的社区资源,带领大家在 TRAE 中实际使用 Skills 落地一个场景。
无论你是开发者还是普通用户,都能在这里找到让你的 Agent “开窍”的秘诀。
你是否也经历过或者正在经历这样的“ Agent 调教”崩溃时刻?
- 规则失效: 在 Agent.md 里写下千言万语,Agent 却视若无睹,完全“已读不回”。
- 执行失控: 精心打磨了无数 Prompt,Agent 执行起来依旧像无头苍蝇,混乱无序。
- 工具迷失: 明明集成了强大的 MCP 工具库,Agent 却两手一摊说“没工具”,让人摸不着头脑。
如果这些场景让你感同身受,别急着放弃。终结这场混乱的答案,可能就是 Skills。
什么是 Skills
“Skills” 这个概念最早由 Anthropic公司提出,作为其大模型 Claude的一种能力扩展机制。简单来说,它允许用户为 Claude 添加自定义的功能和工具。随着这套做法越来越成熟,并被社区广泛接受,Skills 如今已成为大多数 Agent 开发工具和 IDE 都支持的一种标准扩展规范。
![]()
一个 Skills 通常以一个文件夹的形式存在,里面主要装着三样东西:一份说明书(SKILL.md)、一堆操作脚本(Script)、以及一些参考资料(Reference)。
![]()
你可以把一个 Skill 想象成一个打包好的“技能包”。它把完成某个特定任务所需的领域知识、操作流程、要用到的工具、以及最佳实践全都封装在了一起。当 AI 面对相应请求时,就能像一位经验丰富的专家那样,有条不紊地自主执行。
一句话总结: 要是把 Agent 比作一个有很大潜力的大脑,那 Skills 就像是给这个大脑的一套套能反复用的“高级武功秘籍”。 有了它,Agent 能从一个“什么都略知一二”的通才,变成在特定领域“什么都擅长”的专家。
Skill 原理介绍
📚 官方解释:Agent Skills
Skill 的架构原理:渐进式加载
Skill 的设计很巧妙,它运行在一个沙盒环境里,这个环境允许大模型访问文件系统和执行 bash 命令(可以理解为一种电脑操作指令)。在这个环境里,一个个 Skill 就像一个个文件夹。Agent 就像一个熟悉电脑操作的人,通过命令行来读取文件、执行脚本,然后利用结果去完成你交代的任务。这种“按需取用”的架构,让 Skill 成为一个既强大又高效的“工具箱”。
为了平衡效果和效率,Skill 设计了一套聪明的三层分级加载机制:
![]()
![]()
Level 1:元数据(始终加载)
元数据就像是 Skill 的“名片”,里面有名称(name)和描述(description),是用 YAML 格式来定义的。Claude 在启动的时候,会把所有已经安装的 Skill 的元数据都加载进来,这样它就能知道每个 Skill 有什么用、什么时候该用。因为元数据很轻量,所以你可以安装很多 Skill,不用担心把上下文占满。
Level 2:说明文档(触发时加载)
SKILL.md 文件的正文就是说明文档,里面有工作流程、最佳实践和操作指南。只有用户的请求和 Skills 元数据里的描述相符时,Claude 才会用 bash 指令读取这份文档,把内容加载到上下文里。这种“触发式加载”能保证只有相关的详细指令才会消耗 Token。
Level 3:资源与代码(按需加载)
Skills 还能打包一些更深入的资源,比如更详细的说明文档(FORMS.md)、可执行脚本(.py)或者参考资料(像 API 文档、数据库结构等)。Claude 只有在需要的时候,才会通过 bash 去读取或执行这些文件,而且脚本代码本身不会进入上下文。这样一来,Skills 就能捆绑大量信息,几乎不会增加额外的上下文成本。
Skills 的调用逻辑:从理解意图到稳定执行
那么,Agent 是如何智能地选择并执行一个 Skill 的呢?整个过程就像一位经验丰富的助理在处理工作:
![]()
- 意图匹配(找到对的人): Agent 首先聆听你的需求,然后快速扫一眼自己手头所有 Skill 的“名片夹”(元数据),寻找最匹配的那一张。
-
读取手册(看懂怎么干): 找到合适的 Skills 后,Agent 会像模像样地翻开它的“操作手册”(
SKILL.md),仔细研究详细的执行步骤和注意事项。 - 按需执行(动手开干): 根据手册的指引,Agent 开始工作。如果需要,它会随时从“工具箱”里拿出脚本或工具来完成具体操作。
- 反馈结果(事毕复命): 任务完成后,Agent 向你汇报最终结果,或者在遇到困难时,及时向你请教。
Skills vs. 其他概念的区别
为了更清晰地理解 Skills 的独特价值,我们不妨把它和另外两个容易混淆的概念——快捷指令(Command) 和 原子工具(MCP)——放在一起做个对比。用一个厨房的例子就很好懂了:
![]()
![]()
我们也列举了几个大家容易混淆的其他功能,一起来对比看看。
![]()
📚 官方博客解释:Skills explained: How Skills compares to prompts, Projects, MCP, and subagents
什么是好的 Skills:从“能用”到“好用”
Good Skills vs Bad Skills
![]()
如何写好 Skills
- 原子性(Atomicity): 坚持单一职责,让每个 Skill 都像一块积木,小而美,专注于解决一个具体问题,便于日后的复用和组合。
- 给例子(Few-Shot Prompting):这是最关键的一点,与其费尽口舌解释,不如直接给出几个清晰的输入输出示例。榜样的力量是无穷的,模型能通过具体例子,秒懂你想要的格式、风格和行为。
-
立规矩(Structured Instructions):
- 定角色:给它一个明确的专家人设,比如“你现在是一个资深的市场分析师”。
- 拆步骤:把任务流程拆解成一步步的具体指令,引导它“思考”。
- 画红线:明确告诉它“不能做什么”,防止它天马行空地“幻觉”
- 造接口(Interface Design):像设计软件 API 一样,明确定义 Skill 的输入参数和输出格式(比如固定输出 JSON 或 Markdown)。这让你的 Skill 可以被其他程序稳定调用和集成。
- 勤复盘(Iterative Refinement):把 Skills 当作一个产品来迭代。在实际使用中留心那些不尽如人意的“Bad Case”,然后把它们变成新的规则或反例,补充到你的 Skills 定义里,让它持续进化,越来越聪明、越来越靠谱。
📚 一些官方最佳实践指南:技能创作最佳实践
社区热门 Skills 推荐
刚开始接触 Skills,不知从何下手?不妨从社区沉淀的这些热门 Skills 开始,寻找灵感,或直接在你的工作流中复用它们。
Claude 官方提供的 Skills
📚 官方 Skills 仓库:https://github.com/anthropics/skills
学习 Claude 官方的 Skills 仓库可以帮助我们最快的了解 Skills 的最佳实践,便于我们沉淀出自己的 Skills。
如何快速使用官方 Skills?
大多数官方 Skills 都能直接下载,或者通过 Git 克隆到本地。在 TRAE 等工具里,一般只需把这些 Skills 的文件夹放到指定的Skills目录,接着重启或刷新 Agent,它就会自动识别并加载这些新能力。具体操作可参考工具的使用文档。
更多细节可参考下面这部分内容:如何在 TRAE 里快速用起来
Claude 官方提供的 Skills 列表
![]()
社区其他最佳实践
![]()
如何在 TRAE 里快速使用
理论说再多,不如亲手一试。我们先讲一下如何在 TRAE SOLO 中创建并应用一个 Skill 并以基于飞书文档的 Spec Coding为例讲解一下如何利用 Skills 快速解决一个实际问题。
Skill 创建
方式一:设置中直接创建
TRAE 支持在设置页面可以快速创建一个 Skill
按下快捷键 Cmd +/ Ctrl + 通过快捷键打开设置面板。
![]()
在设置面板左侧找到「规则技能」选项
![]()
找到技能板块,点击右侧的「创建」按钮。
![]()
你会看到一个简洁的创建界面,包含三要素:Skill 名称、Skill 描述、Skill 主体。我们以创建一个“按规范提交 git commit”的 Skill 为例,填入相应内容后点击「确认」即可。
![]()
填入我们需要的内容「确认」即可
方式二:直接解析 SKILL.md
在当前项目目录下,新增目录.trae/Skills/xxx 导入你需要文件夹,和 TRAE 进行对话,即可使用。
![]()
可以在「设置 - 规则技能」中看到已经成功导入
![]()
方式三:在对话中创建
目前 TRAE 中内置了 Skills-creator Skills ,你可以在对话中直接和 TRAE 要求创建需要的 Skills
![]()
Skill 使用
在 TRAE 里使用技能很容易,你加载好需要的技能后,只需在对话框中用日常语言说明你的需求就行。
- 例如,输入“帮我设计一个有科技感的登录页面”,系统就会自动调用“frontend-design”技能。
- 例如,输入“帮我提取这个 PDF 里的所有表格”,系统会自动调用“document-Skills/pdf”技能。
- 例如,输入“帮我把这片技术文档转为飞书文档”,系统会自动调用“using-feishu-doc”技能。
系统会自动分析你的需求,加载技能文档,还会一步步指导你完成任务!
![]()
实践场景举例
还记得引言里提到的那些问题吗?比如说,项目规则文件(project\_rules)有字符数量的限制;又或者,就算你在根规则文件里明确写好了“在什么情况下读取哪个文件”,Agent 在执行任务时也不会按照要求来做。
这些问题的根本原因是,规则(Rules)对于 Agent 而言是固定不变的,它会在任务开始时就把所有规则一次性加载到上下文中,这样既占用空间,又不够灵活。而 技能(Skill)采用的是“逐步加载”的动态方式,刚好可以解决这个问题。所以,我们可以把之前那些复杂的规则场景,重新拆分成一个个独立的技能。
接下来,我们通过一个基于飞书文档的“Spec Coding”简单流程,来实际操作一下如何用技能解决问题。
什么是 Spec Coding?
Spec Coding 提倡“先思考后行动”,也就是通过详细定义可以执行的需求规范(Specification)来推动 AI 开发。它的流程包含“需求分析、技术设计、任务拆解”的文档编写过程,最后让 AI 根据规范来完成编码。这种一步步的工作流程能保证每一步都有依据,实现从需求到代码的准确转化。
让我来分析一下这个场景
上面提到将开发过程划分为四个关键阶段,所以要完成 “需求分析、技术设计、任务拆解” 的飞书文档撰写,还有最终的代码实现。为此,我们需要不同的技能来满足不同场景下的文档编写需求,并且要教会 Agent 如何使用飞书工具进行创作协同。
下面我们就一起完成上面提到的 Skills 的设计实现。
多角色专家 Skills
通过实现多角色 Skills 通过创建多个交付物过程文档,约束后续的编码,为编码提供足够且明确的上下文,每个Skill 专注完成一件事
![]()
- 下面让我们进一步详细设计
![]()
按照上述的表格我们就可以大致明确我们需要的 Skills 该如何实现了。
- 本次只作为一个例子大家可以参考上面创建 Skill 的教程自己完成一下这个多角色 Skills 的创建和调试,当然正如上面所述好的 Skill 需要在实践中逐渐优化并通过场景调用不断进行优化的
![]()
![]()
飞书文档使用 Skill
飞书文档的格式是 markdown 的超集,我们 Skill 的目的则是教会 Agent 飞书文档的语法,便于 Agent 写出符合格式的 md 文件。并通过约束 Agent 行为,充分利用飞书文档的评论的读写完成多人协作审阅的过程,用户通过在飞书文档评论完成相关建议的提出,Agent 重新阅读文档和评论,根据建议进一步优化文档,实现文档协作工作流。
![]()
Spec Coding Skill
上面我们实现了多个角色 Skills 和一个功能 Skill,但实际使用时,还需要有一个能统筹全局的技能,来实现分工协作。把上述多个技能组合起来,告诉智能体(agent)整体的规格编码(spec coding)流程,完成工具技能和角色技能的组合与调度。
如此我们就能快速搭建一个规格编码工作流程,完成基础开发。当然也可以参考上面的逻辑,用技能来重新复刻社区里的规格编码实践(如 SpecKit、OpenSpec 等)。
![]()
![]()
总结
上述场景提到了两种不同风格的 Skill(角色型,工具型),利用 Skill 的动态加载机制(取代固定规则的一次性加载方式),完成了复杂场景下的任务分解;通过 不同角色技能的分工协作(避免 Agent 什么都做导致执行混乱);尝试借助飞书文档形成协作闭环(打通人机交互的最后一步),有效解决了 Agent “不听话、执行乱、工具少” 的问题,让 AI 从 “对话助手” 真正转变为 “可信赖的实干家”,实现从需求提出到代码产出的高效、精准、协作式交付。
Q & A | 一些常见问题
为什么我写的 Skills 不生效,或者效果不符合预期?
那十有八九是你的“名片”(Description)没写好。
记住,Agent 是通过读取 Skills 的 Description 来判断“什么时候该用哪个 Skill”的。要是你的描述写得含糊不清、太专业或者太简单,Agent 就很难明白你的意思,自然在需要的时候就不会调用这个 Skill。所以,用大白话写的清晰、准确的Description,对 Skill 能否起作用至关重要。
使用 Skills 的效果,会受到我选择的大语言模型(LLM)的影响吗?
会有影响,不过影响的方面不一样。
- 一个更强大的模型,主要影响“挑选”和“安排”技能的能力。 它能更准确地明白你的真实想法,然后从一堆技能里挑出最适合的一个或几个来解决问题。它的优势体现在制定策略方面。
- 而技能本身,决定了具体任务执行的“最低水平”和“稳定性”。 一旦某个技能被选中,它里面设定好的流程和代码是固定的,会稳定地运行。所以,技能编写得好不好,直接决定了具体任务能不能出色完成。。
Skills 是不是万能的?有什么它不擅长做的事情吗?
当然不是万能的。 Skills 的主要优势是 处理那些流程明确、边界清晰的任务。 在下面这些情况中,它可能就不是最好的选择了:
- 需要高度创造力的任务: 像写一首饱含情感的诗,或者设计一个全新的品牌标志。这类工作更需要大模型本身的“灵感”。
- 需要实时、动态做决策的复杂策略游戏: 比如在变化极快的金融市场中做交易决策。
- 单纯的知识问答或开放式闲聊: 如果你只是想问“文艺复兴三杰是谁?”,直接问大模型就可以,不用动用 Skills 这个“大杀器”。
我发现一个社区的 Skills 很好用,但我可以修改它以适应我的特殊需求吗?
当然可以,我们强烈建议你这么做!
大多数共享的 Skill 都支持用户“Fork”(也就是“复制一份”)并进行二次开发。你可以把通用的 Skill 当作模板,在自己的工作空间里复制一份,然后修改里面的逻辑或参数,以适应你自己的业务需求。这对整个生态的共建和知识复用很重要。
结语|让 Agent 成为你真正的“行动派”
Skill 的出现,为 AI 从“对话式助手”转变为“可信赖的执行者”搭建了关键的技术桥梁。它用结构化的方法把领域知识、操作流程和工具调用逻辑封装起来,解决了 Agent 规则失效、执行失控的混乱问题,让 AI 的能力输出变得可以控制、值得信赖且高效。
Skill 的核心价值在于:
- 精准实际痛点: 通过巧妙的三级加载机制(元数据→说明文档→资源)平衡上下文效率与功能深度,在功能深度和上下文效率之间找到了一个绝佳的平衡点,既避免了宝贵 Token 的浪费,又确保了任务执行的精准性,实现了 Agent 上下文的动态加载能力。
- 生态赋能,降低门槛: 无论是官方还是社区,都提供了丰富的资源(如 Claude 官方仓库、SkillsMP 市场等),让普通用户也能轻松站在巨人的肩膀上,快速复用各种成熟的能力。
虽然 Skill 不是万能的,但它在“确定性流程任务”上的优势无可替代。未来,随着 AI 模型能力的提升与 Skill 生态的进一步完善,我们有望看到更多跨领域、可组合的 Skill 出现——让 AI 从“样样懂一点”的通才,真正进化为“事事做得好”的专家协作伙伴。
不妨从今天开始,尝试创建你的第一个 Skill:将你最擅长的领域经验封装成可复用的能力,让 AI 成为你延伸专业价值的放大器。
蚂蚁灵波开源空间感知模型LingBot-Depth
这份 2025 年度回忆,属于你和 AI 小电拼
![]()
AIM 国际设计竞赛最佳技术创新奖、微博数码年度电子潮玩奖、充电头网年度金充奖技术创新奖……
这些殊荣,是制糖工厂 2025 年交出的答卷。
作为一支专注「先锋电能产品」的团队,我们在过去一年,陆续推出了贴贴线、细雳线、小电拼,首创并践行了 SDC(Software-Defined Charger)的理念,让硬件可以被软件定义,让协议与算法能不断演进。我们还开放了 AI 小电拼的 68 万行 C + + 代码,把积累的经验分享给更多人,希望能推动整个行业往前走。
![]()
AI 小电拼无疑是这一年最重要的作品。
它浓缩了制糖工厂对前瞻技术、工程标准和用户体验的执念,也代表了我们在复杂问题面前选择长期投入、持续迭代的判断。
SDC:充电设备的未来形态
SDC,Software-Defined Charger,软件定义的充电器,是一种可实现底层软件配置和用户自定义,并可持续进化的充电设备。它颠覆了传统充电器出厂即定型的特点,不再是一个传统意义的哑设备,而是变身为一个透明化和可配置的全新产品。
![]()
AI 小电拼所代表的,是我们下一代充电器的几个基本判断:
- 充电器不再是「一个盒子」,而是「一个系统」
- 协议适配能力,成为第一等核心能力
- 可观测性与可配置性,是下一代充电器的标配
- 软件定义 + 云端 OTA,决定产品生命周期
- 电气产品,正在向智能终端演进
传统充电器更像电源插座:插上即用,逻辑固化,状态不可见,问题不可诊断。
![]()
而 SDC 更接近「可调节的能源路由器」——每个接口的功率、协议都可以被精细控制,系统能根据设备与场景动态匹配最优策略,让充电器真正「理解」所连接的设备。
SDC 的核心,在于软件可定义。
![]()
通过不同的模式与协议组合,用户可以应对复杂甚至极端的兼容场景,而无需更换硬件。充电体验不再是被动接受,而是主动配置。
全模块 OTA,是这一体系得以成立的第二根支柱。
AI 小电拼可以像智能手机一样持续升级,从「一次性硬件」转变为「可管理的长期设备」。协议更新、问题修复、体验优化,都可以通过 OTA 快速完成,并同步惠及所有用户。
更重要的是,每一个真实使用场景中暴露的问题,都会反过来推动产品的整体进化。
全模块 OTA:无线更新,持续进化
仅在 2025 年,AI 小电拼共完成 30 余项软件与功能更新,包括:
- 全球首发 UFCS 2.0 协议
- 全球首家跟进支持 AVS 协议
- 同时支持 AVS 及两档 PPS,均配备独立开关
- 推出生活场景灵活设置定时任务
- 支持线损补偿,抵消充电线传输的损耗
- 支持「ERP」开关,优化大功率充电宝体验
- 推出 OTW 服务:用 AI 小电拼给不能联网的硬糖系列充电头推送更新
- 小电拼 iOS、Android 版 App 上线
这些更新并非单点功能叠加,而是围绕真实问题持续打磨体验。
![]()
例如,「小家电模式」通过软件形态切换,让原本无法使用 C-C 线的老旧设备重新获得生命,实现真正的「一线通」。
给 PPS 增加 55W 和 105W 两档独立开关,正是对现实中「标准存在、实现参差」这一行业现状的回应,让灰度兼容变成一种可控能力,而非运气游戏。
![]()
2025 年 9 月,AI 小电拼完成 SPR AVS 的全链路远程升级;12 月,又率先支持 UFCS 2.0,并通过 OTW 技术为多款硬糖充电器推送定制协议。
OTW:让传统设备获得未来
在持续打磨 AI 小电拼的同时,我们也希望更多设备具备「永不过时」的能力。
![]()
于是,OTW 服务诞生了。
通过 OTW 云端服务与有线更新结合,原本无法联网的充电器也可以获得协议升级与功能扩展,从哑设备进化为具备 SDC 能力的智能产品。
![]()
OTW 并不是概念包装,而是一套面向长期使用价值的服务体系——让充电器真正成为可以陪伴多年的基础设施。
写在最后:与你一起
过去一年,推动产品进化的不只有我们,还有每一位真实使用它的你。
![]()
用户提供的使用反馈、数据、玩法,甚至是意想不到的配件与改造,都在不断拓展 AI 小电拼的边界。
我们始终相信,「好产品就是一颗糖」——让人愿意反复使用,长期依赖。好的体验,有些是显性的,有些是缓慢发生的;有些属于现在,有些指向未来。
AI 小电拼只是第一步。SDC 框架的真正完成,来自每一个用户对设备的掌控与参与。
![]()
这才是我们理解中「能陪伴人的产品」。
Keep Patching, Enjoy.
关于制糖工厂
制糖工厂是一家以「软件定义充电器(SDC,Software-Defined Charger)」为核心的数字能源科技公司,围绕个人计算设备、多终端协同与未来智能硬件场景,构建可演进的能量管理系统与消费级硬件产品。公司通过自研的 FluxAI 自由流® 技术、FPGA 架构、全模 OTA/OTW 能力与 CanOS 充电操作系统,将传统充电器从一次性硬件升级为可持续进化的智能设备。
制糖工厂在多设备盲插、全时功率调度、EUG 能量利用等级、 低温与安全策略等方面建立了行业领先的技术与体验标准,逐步形成以「AI 小电拼」「硬糖」「贴贴线
」为代表的产品矩阵,服务创作者、开发者、数字游民与高频电子设备用户。公司正在推动充电器从「被动供电配件」向「个人数字基础设施」转型,为下一代智能设备生态提供稳定、可编程、可理解的能源底座。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。