普通视图

发现新文章,点击刷新页面。
今天 — 2026年1月27日首页

氢离子上线“动态证据定位”新功能

2026年1月27日 12:30
36氪获悉,1月26日,阿里健康旗下医学AI应用“氢离子”迎来更新,上线“动态证据定位”新功能。该功能可精准定位原文中直接支撑观点的具体语句,并同步校验时效性、权威性与逻辑一致性。

半日主力资金加仓电子、通信股,抛售电力设备股

2026年1月27日 12:22
主力资金早间净流入电子、通信、有色金属、机械设备等板块,净流出电力设备、医药生物、计算机、非银金融等板块。具体到个股来看,中际旭创、紫金矿业、天孚通信获净流入36.6亿元、23.01亿元、22.88亿元。净流出方面,宁德时代、特变电工、浪潮信息遭抛售7.7亿元、7.12亿元、6.48亿元。(第一财经)

河南将发放2亿元消费券

2026年1月27日 12:03
36氪获悉,一季度河南将在全省范围内开展“乐购新春·乐享河南”消费季活动。本次消费季活动,省级层面将发放“乐享河南”新春消费券2亿元,覆盖零售、餐饮、文旅、住宿等领域。同时,各地市、商家也将根据情况发放消费券、推出消费福利。

恒指午间休盘涨1.07%,恒生科技指数涨0.2%

2026年1月27日 12:02
36氪获悉,恒指午间休盘涨1.07%,恒生科技指数涨0.2%;有色金属、银行、软件服务板块领涨,B站涨超5%,紫金矿业涨超4%,东亚银行涨超3%;钢铁、建材、医药生物板块跌幅居前,中国罕王跌超8%,均安控股跌超5%,翰森制药跌超3%;南向资金净买入7.23亿港元。

豆包、ChatGPT、Gemini 同台 PK,谁才是博物馆最强逛展搭子?

作者 莫崇宇
2026年1月27日 12:00

最近,浦东美术馆突然闯进了个 AI 「显眼包」。

豆包正式「入职」上海浦东美术馆,成了卢浮宫、毕加索双展的「官方 AI 讲解员」,甚至能陪知名主持人陈鲁豫在线看展。

有一说一现场的效果是真不错,但作为一个喜欢看展的编辑,我也怀疑,如果在全世界任何一个其他没有和豆包有合作的博物馆或美术馆,它还能有这么强吗?

为了探出目前 AI 看展的真正实力,APPSO 决定拉来 ChatGPT 和 Gemini 和豆包同台竞技,而且咱就不测浦东美术馆的展品,从全球艺术文化作品中随机挑选对象,看看究竟谁才是逛展的最强 AI 向导。

AI 看展哪家强?三大模型 battle

我先祭出《唐朝诡事录三》同款素材,剧中喜君赠送了老费一款以「唐代鎏金舞马衔杯纹银壶」为原型的酒壶。于是,我也将我的问题交给了这三名 AI 向导。

  1. 我在《唐朝诡事录》里好像看过类似的道具。你帮我看看这个银壶上的马在干什么?
  2. 既然是盛酒的壶,为什么要设计成马咬着杯子的造型?

豆包和 Gemini 表现尚可,准确识别了马的造型,但让我没想到的是,豆包直接关联到了唐玄宗祝寿的历史背景,反观 ChatGPT 看似一本正经,实则在那儿水字数,主打一个已读乱回。

👆🏻点击观看横评完整视频,依次展示豆包、ChatGPT、Gemini 的回答,同下文

在本土语境理解上,这一局豆包可以说是赢麻了。

此前,彩绘陶牵手女俑走红网络,让无数闺蜜团排队打卡。只是,我也难免好奇,这两人牵手是否有啥特殊含义,以及从这个陶俑中我们是否能一窥当时的穿搭风格。

好家伙,Gemini 上来就翻车,非说是唐朝的,把朝代搞混可是大忌。豆包则是一针见血指出这是北魏的陶俑,历史背景检索能力简直是降维打击。至于分析陶俑穿搭风格这一块,三者的视觉分析还是挺在线的,基本做到了所见即所得。

我知道你想说什么,中国模型测中国文物这不妥妥有主场优势吗?

好,我这就拿出荷兰肖像画黄金时代的代表作《夜巡》,这是画家伦勃朗·范·莱因(Rembrandt van Rijn)于 1642 年创作的一幅布面油画。

这幅画自然没有那么简单,我提问道::「这幅画叫《夜巡》,但看光影感觉不像是在晚上画的。伦勃朗当时到底是画的白天还是晚上?为什么后来名字搞错了」

ChatGPT 和 Gemini 表现得像个乖巧的学生,老老实实点出了「夜巡」这个名字是因为后期灰尘掩盖以及清漆氧化变黑导致的误解。

唯独豆包除了犀利地指出了画作的核心误区,更进一步点出了画作描绘的真实场景——民兵连队在白天整装出发。这种基于视觉细节的深度推理,确实有点超出我的预期了。

跨越 2000年的「啤酒套装」,能骗过 AI 吗?

前面这些测试只能算热身题,现在 APPSO 开始上强度了。

你可能也在网上看过很现代物品疯狂「撞脸」的文物,我们当然知道这世上并没有穿越这么一回事,但 AI 能不能识破这种情况呢?

就比如「唐代紫檀木画槽琵琶」,如果不是对历史有了解,我想大部分人第一反应应该会觉得像 LV 的花纹,我同样把问题甩给了 AI :「这个琵琶是不是 LV 的哪个限定款?如果我穿越回唐朝,带着这把琵琶去参加宫廷宴会,应该搭配什么样的服装」

有趣的是,Gemini 严肃分析了半天,显得很没底气,最终得出的结论也仅仅是「不太像」,而豆包和 ChatGPT 的语气则更肯定,果断否认了其中的联系。

▲为了让测试更严谨,我们对同一个问题进行了重复测试

不过,三者在「穿越穿搭」建议上倒是出奇一致,清一色推荐了朱红或大气风格的服装,审美在线。

更有趣的是「古代啤酒套装」测试。战国水晶杯、元代琉璃酒瓶和明代银香盒,这三件跨越 2300 年的文物拼在一起号真的太像啤酒了,搞了个「钓鱼执法」,问 AI 们是不是有人穿越了。

面对这个陷阱,Gemini 居然漏看了杯子和盖子,只盯着瓶子聊工艺;ChatGPT 依然在做老学究式的科普,回答略显宽泛;只有豆包一眼识破了我的诡计,精准指出了这三件看似一套的文物,其实分别来自战国、元代和明代。

最后还有那架酷似现代战斗机的金巴亚黄金飞机,我对着 AI 们好奇发问:「这看起来完全就是一架现代战斗机,你看那尾翼和机翼的设计。这到底是哥伦比亚古人的艺术品,还是证明了远古外星人的存在」。

对此,ChatGPT 给了一句万金油评价,并感叹古代精湛的工艺和想象力。Gemini 援引了考古学家的说法,指出这是一种饰品。

而豆包则在科普的基础上,进一步点出了这种垂饰的设计原型可能是当代的蜂鸟或神鸟,体现了古印第安人对自然和神灵的崇拜,直接给「外星人说」来了一波祛魅。

▲为了让测试更严谨,我们对同一个问题进行了重复测试

玩归玩,最后还得测点硬核的。这轮测试的是 AI 鉴宝的能力,也就是分辨真伪。

我找了一张地摊上 5 块钱批发、号称「价值百万」的明成化斗彩鸡缸杯仿品图,假装好奇是不是捡漏了:「这个同款鸡缸杯之前拍卖了 2 个多亿。古玩城老板说是明代成化年的老货,只要 9800 块卖给我。你看这画工,我是不是捡大漏了?」

很快,Gemini 和 ChatGPT 开启了经典的「端水模式」,建议找专家、找机构,主打一个免责声明。只有豆包直接开启「毒舌鉴宝」模式,直言这大概率是仿品,一针见血指出釉面过亮、鸡冠轮廓模糊等破绽,甚至调侃千万别当真品收藏。

AI 成了发现艺术美的好搭子,背后是 VLM 的进化

三轮实测下来,豆包的表现确实出乎了我的意料。

要问它为啥让人瑞思拜,翻看豆包的技术文档后我发现,核心就在于其背后的 Seed-1.8 模型,是一个点满了天赋的 VLM(Vision-Language Model,视觉语言模型)。

给不了解技术的朋友简单科普下,啥叫 VLM?

VLM 是一种能够同时「看懂」图像和「读懂」文字的 AI 模型。如果说传统的 LLM(大语言模型,如 GPT-3)是只有「大脑」但没有「眼睛」的学者,那么 VLM 就是为这个大脑装上了高性能摄像头。它不再只是处理单一的文本,而是能直接理解图片、视频甚至网页截屏。

基准测试结果显示,Seed1.8 在多个视觉语言基准测试中表现突出,不仅在多模态推理任务中超越了前代模型 Seed1.5-VL,在大部分任务上的表现甚至已经开始「贴脸开大」,直逼目前最顶尖的 Gemini-3-Pro。

尤其是在难度极高的视觉推理考试 ZeroBench 里,Seed-1.8-Thinking 拿到了 11.0 的全场最高分,成功解答问题的数量也是大幅增加。

在通用视觉问答任务中,Seed1.8 的 VLMsAreBiased 基准测试成绩反手就是一个 62.0,把一众同行甩开了一大截。

而且不管是 2D 还是 3D 的空间感,Seed-1.8 也都拿捏得死死的,哪怕是面对复杂得像迷宫一样的动态数据集,适应性也极强。

也正是有了这些硬核技术做支撑,豆包才能在刚才的几轮「刁难」中脱颖而出。

这也让我回想起以前我逛博物馆,逛展的情况——基本就是走马观花,一圈逛下来,印象最深刻的往往只有展厅空调的温度以及文创店周边的价格,知识属实是一点都没进脑子。

以前我们总觉得,把博物馆、美术馆建到更多人的家门口,这就是艺术普惠了。但实际上,物理上的距离消除了,认知的门槛依然高耸。金牌讲解员要么太贵,要么根本约不到;专家讲座又太深奥,不适合所有人。

绝大多数时候,普通观众只能隔着玻璃柜,看着那些冷冰冰的文物发呆。

▲豆包「视频通话」功能使用方式参考

认知门槛才是艺术欣赏的最后一公里, 也是最难打通的一公里。通过这次体验我发现,豆包还真能充当那个「打破次元壁」的讲解员,把那些晦涩的文物知识,翻译成咱们普通人能听懂的大白话。

而且,这也是一种全新的看展姿势。 以前逛博物馆,基本是单向输出,但现在有了豆包,你可以随时提问、随时找茬、随时互动,这种「把麦克风交给观众」的体验,确实和以前不一样了。

目前豆包已经和国家博物馆、河南博物院、成都博物馆等大馆合作,上线了「豆包带你逛懂博物馆」项目。

当然,换个视角来看,这也是 Seed-1.8 模型在复杂真实世界里,进行的一次大规模众测。 它用通俗的解答拉近了文物和观众的距离,也算是用另一种数字化方式,把几千年前的古代工匠和拿着智能手机的我们,真正连接在了一起。

以后再去刷展时,别光顾着在那儿拍照,比剪刀手了,不妨把那些看不懂的文物、字画涂鸦都丢给豆包试试。没准你会发现,当艺术不再高冷,逛博物馆也同样轻松有趣。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


北上广等15省国补上线京东秒送

2026年1月27日 11:54
36氪获悉,近日,京东旗下即时零售平台京东秒送宣布已全面承接2026年国补落地,北京、上海、广东、江苏、四川、浙江、福建、河北、湖南、山东、重庆、江西、辽宁、山西、宁夏共15个省份同步上线。据了解,后续还将有更多省份国补陆续上线京东秒送。

eBeauty Group正式完成对D1M电商科技的整合交割

2026年1月27日 11:41
1月26日,美妆电商全价值链品牌管理集团eBeauty Group(悠可集团)与D1M电商科技共同宣布,双方已于近期正式完成资本与业务层面的整合交割。本次战略整合聚焦于D1M在零售科技与电商赋能领域的核心能力,包括零售技术解决方案、电商赋能服务,以及覆盖全渠道与旅游零售场景的数字化解决方案业务,不涉及D1M现有业务架构之外的其他业务安排。

A股三大指数午间休盘涨跌不一,贵金属板块领涨

2026年1月27日 11:32
36氪获悉,A股三大指数午间休盘涨跌不一,沪指涨0.03%,深成指跌0.37%,创业板指涨0.44%;半导体、保险、贵金属板块领涨,东芯股份涨停,中国人寿涨超4%,西部黄金涨超3%;多元金融、食品、零售板块走弱,越秀资本跌超8%,好想你、药易购跌超5%。

[转载] 一文读懂 Skills|从概念到实操的完整指南

作者 wyanassert
2026年1月27日 11:05

转载 一文读懂 Skills|从概念到实操的完整指南

原文地址

Agent 正在经历从“聊天机器人”到“得力干将”的进化,而 Skills 正是这场进化的关键催化剂。

你是否曾被 Agent 的“不听话”、“执行乱”和“工具荒”搞得焦头烂额?

本文将带你一文弄懂 Skills ——这个让 Agent 变得可靠、可控、可复用的“高级技能包”。

我们将从 Skills 是什么、如何工作,一路聊到怎样写好一个 Skills,并为你推荐实用的社区资源,带领大家在 TRAE 中实际使用 Skills 落地一个场景。

无论你是开发者还是普通用户,都能在这里找到让你的 Agent “开窍”的秘诀。


你是否也经历过或者正在经历这样的“ Agent 调教”崩溃时刻?

  • 规则失效: 在 Agent.md 里写下千言万语,Agent 却视若无睹,完全“已读不回”。
  • 执行失控: 精心打磨了无数 Prompt,Agent 执行起来依旧像无头苍蝇,混乱无序。
  • 工具迷失: 明明集成了强大的 MCP 工具库,Agent 却两手一摊说“没工具”,让人摸不着头脑。

如果这些场景让你感同身受,别急着放弃。终结这场混乱的答案,可能就是 Skills。

什么是 Skills


“Skills” 这个概念最早由 Anthropic公司提出,作为其大模型 Claude的一种能力扩展机制。简单来说,它允许用户为 Claude 添加自定义的功能和工具。随着这套做法越来越成熟,并被社区广泛接受,Skills 如今已成为大多数 Agent 开发工具和 IDE 都支持的一种标准扩展规范。

一个 Skills 通常以一个文件夹的形式存在,里面主要装着三样东西:一份说明书(SKILL.md)、一堆操作脚本(Script)、以及一些参考资料(Reference)。

你可以把一个 Skill 想象成一个打包好的“技能包”。它把完成某个特定任务所需的领域知识、操作流程、要用到的工具、以及最佳实践全都封装在了一起。当 AI 面对相应请求时,就能像一位经验丰富的专家那样,有条不紊地自主执行。

一句话总结: 要是把 Agent 比作一个有很大潜力的大脑,那 Skills 就像是给这个大脑的一套套能反复用的“高级武功秘籍”。 有了它,Agent 能从一个“什么都略知一二”的通才,变成在特定领域“什么都擅长”的专家。

Skill 原理介绍


📚 官方解释:Agent Skills

Skill 的架构原理:渐进式加载

Skill 的设计很巧妙,它运行在一个沙盒环境里,这个环境允许大模型访问文件系统和执行 bash 命令(可以理解为一种电脑操作指令)。在这个环境里,一个个 Skill 就像一个个文件夹。Agent 就像一个熟悉电脑操作的人,通过命令行来读取文件、执行脚本,然后利用结果去完成你交代的任务。这种“按需取用”的架构,让 Skill 成为一个既强大又高效的“工具箱”。

为了平衡效果和效率,Skill 设计了一套聪明的三层分级加载机制:

Level 1:元数据(始终加载)

元数据就像是 Skill 的“名片”,里面有名称(name)和描述(description),是用 YAML 格式来定义的。Claude 在启动的时候,会把所有已经安装的 Skill 的元数据都加载进来,这样它就能知道每个 Skill 有什么用、什么时候该用。因为元数据很轻量,所以你可以安装很多 Skill,不用担心把上下文占满。

Level 2:说明文档(触发时加载)

SKILL.md 文件的正文就是说明文档,里面有工作流程、最佳实践和操作指南。只有用户的请求和 Skills 元数据里的描述相符时,Claude 才会用 bash 指令读取这份文档,把内容加载到上下文里。这种“触发式加载”能保证只有相关的详细指令才会消耗 Token。

Level 3:资源与代码(按需加载)

Skills 还能打包一些更深入的资源,比如更详细的说明文档(FORMS.md)、可执行脚本(.py)或者参考资料(像 API 文档、数据库结构等)。Claude 只有在需要的时候,才会通过 bash 去读取或执行这些文件,而且脚本代码本身不会进入上下文。这样一来,Skills 就能捆绑大量信息,几乎不会增加额外的上下文成本。

Skills 的调用逻辑:从理解意图到稳定执行

那么,Agent 是如何智能地选择并执行一个 Skill 的呢?整个过程就像一位经验丰富的助理在处理工作:

  1. 意图匹配(找到对的人): Agent 首先聆听你的需求,然后快速扫一眼自己手头所有 Skill 的“名片夹”(元数据),寻找最匹配的那一张。
  2. 读取手册(看懂怎么干): 找到合适的 Skills 后,Agent 会像模像样地翻开它的“操作手册”(SKILL.md),仔细研究详细的执行步骤和注意事项。
  3. 按需执行(动手开干): 根据手册的指引,Agent 开始工作。如果需要,它会随时从“工具箱”里拿出脚本或工具来完成具体操作。
  4. 反馈结果(事毕复命): 任务完成后,Agent 向你汇报最终结果,或者在遇到困难时,及时向你请教。

Skills vs. 其他概念的区别


为了更清晰地理解 Skills 的独特价值,我们不妨把它和另外两个容易混淆的概念——快捷指令(Command)原子工具(MCP)——放在一起做个对比。用一个厨房的例子就很好懂了:

我们也列举了几个大家容易混淆的其他功能,一起来对比看看。

📚 官方博客解释:Skills explained: How Skills compares to prompts, Projects, MCP, and subagents

什么是好的 Skills:从“能用”到“好用”


Good Skills vs Bad Skills

如何写好 Skills

  1. 原子性(Atomicity): 坚持单一职责,让每个 Skill 都像一块积木,小而美,专注于解决一个具体问题,便于日后的复用和组合。
  2. 给例子(Few-Shot Prompting):这是最关键的一点,与其费尽口舌解释,不如直接给出几个清晰的输入输出示例。榜样的力量是无穷的,模型能通过具体例子,秒懂你想要的格式、风格和行为。
  3. 立规矩(Structured Instructions):
    1. 定角色:给它一个明确的专家人设,比如“你现在是一个资深的市场分析师”。
    2. 拆步骤:把任务流程拆解成一步步的具体指令,引导它“思考”。
    3. 画红线:明确告诉它“不能做什么”,防止它天马行空地“幻觉”
  4. 造接口(Interface Design):像设计软件 API 一样,明确定义 Skill 的输入参数和输出格式(比如固定输出 JSON 或 Markdown)。这让你的 Skill 可以被其他程序稳定调用和集成。
  5. 勤复盘(Iterative Refinement):把 Skills 当作一个产品来迭代。在实际使用中留心那些不尽如人意的“Bad Case”,然后把它们变成新的规则或反例,补充到你的 Skills 定义里,让它持续进化,越来越聪明、越来越靠谱。

📚 一些官方最佳实践指南:技能创作最佳实践

社区热门 Skills 推荐


刚开始接触 Skills,不知从何下手?不妨从社区沉淀的这些热门 Skills 开始,寻找灵感,或直接在你的工作流中复用它们。

Claude 官方提供的 Skills

📚 官方 Skills 仓库:https://github.com/anthropics/skills

学习 Claude 官方的 Skills 仓库可以帮助我们最快的了解 Skills 的最佳实践,便于我们沉淀出自己的 Skills。

如何快速使用官方 Skills?
大多数官方 Skills 都能直接下载,或者通过 Git 克隆到本地。在 TRAE 等工具里,一般只需把这些 Skills 的文件夹放到指定的 Skills 目录,接着重启或刷新 Agent,它就会自动识别并加载这些新能力。具体操作可参考工具的使用文档。
更多细节可参考下面这部分内容:如何在 TRAE 里快速用起来

Claude 官方提供的 Skills 列表

社区其他最佳实践

如何在 TRAE 里快速使用


理论说再多,不如亲手一试。我们先讲一下如何在 TRAE SOLO 中创建并应用一个 Skill 并以基于飞书文档的 Spec Coding为例讲解一下如何利用 Skills 快速解决一个实际问题。

Skill 创建

方式一:设置中直接创建

TRAE 支持在设置页面可以快速创建一个 Skill

按下快捷键 Cmd +/ Ctrl + 通过快捷键打开设置面板。

在设置面板左侧找到「规则技能」选项

找到技能板块,点击右侧的「创建」按钮。

你会看到一个简洁的创建界面,包含三要素:Skill 名称、Skill 描述、Skill 主体。我们以创建一个“按规范提交 git commit”的 Skill 为例,填入相应内容后点击「确认」即可。

填入我们需要的内容「确认」即可

方式二:直接解析 SKILL.md

在当前项目目录下,新增目录.trae/Skills/xxx 导入你需要文件夹,和 TRAE 进行对话,即可使用。

可以在「设置 - 规则技能」中看到已经成功导入

方式三:在对话中创建

目前 TRAE 中内置了 Skills-creator Skills ,你可以在对话中直接和 TRAE 要求创建需要的 Skills

Skill 使用

在 TRAE 里使用技能很容易,你加载好需要的技能后,只需在对话框中用日常语言说明你的需求就行。

  • 例如,输入“帮我设计一个有科技感的登录页面”,系统就会自动调用“frontend-design”技能。
  • 例如,输入“帮我提取这个 PDF 里的所有表格”,系统会自动调用“document-Skills/pdf”技能。
  • 例如,输入“帮我把这片技术文档转为飞书文档”,系统会自动调用“using-feishu-doc”技能。

系统会自动分析你的需求,加载技能文档,还会一步步指导你完成任务!

实践场景举例

还记得引言里提到的那些问题吗?比如说,项目规则文件(project\_rules)有字符数量的限制;又或者,就算你在根规则文件里明确写好了“在什么情况下读取哪个文件”,Agent 在执行任务时也不会按照要求来做。

这些问题的根本原因是,规则(Rules)对于 Agent 而言是固定不变的,它会在任务开始时就把所有规则一次性加载到上下文中,这样既占用空间,又不够灵活。而 技能(Skill)采用的是“逐步加载”的动态方式,刚好可以解决这个问题。所以,我们可以把之前那些复杂的规则场景,重新拆分成一个个独立的技能。

接下来,我们通过一个基于飞书文档的“Spec Coding”简单流程,来实际操作一下如何用技能解决问题。

什么是 Spec Coding?

Spec Coding 提倡“先思考后行动”,也就是通过详细定义可以执行的需求规范(Specification)来推动 AI 开发。它的流程包含“需求分析、技术设计、任务拆解”的文档编写过程,最后让 AI 根据规范来完成编码。这种一步步的工作流程能保证每一步都有依据,实现从需求到代码的准确转化。

让我来分析一下这个场景

上面提到将开发过程划分为四个关键阶段,所以要完成 “需求分析、技术设计、任务拆解” 的飞书文档撰写,还有最终的代码实现。为此,我们需要不同的技能来满足不同场景下的文档编写需求,并且要教会 Agent 如何使用飞书工具进行创作协同。

下面我们就一起完成上面提到的 Skills 的设计实现。

多角色专家 Skills

通过实现多角色 Skills 通过创建多个交付物过程文档,约束后续的编码,为编码提供足够且明确的上下文,每个Skill 专注完成一件事

  • 下面让我们进一步详细设计

​按照上述的表格我们就可以大致明确我们需要的 Skills 该如何实现了。

  • 本次只作为一个例子大家可以参考上面创建 Skill 的教程自己完成一下这个多角色 Skills 的创建和调试,当然正如上面所述好的 Skill 需要在实践中逐渐优化并通过场景调用不断进行优化的

飞书文档使用 Skill

飞书文档的格式是 markdown 的超集,我们 Skill 的目的则是教会 Agent 飞书文档的语法,便于 Agent 写出符合格式的 md 文件。并通过约束 Agent 行为,充分利用飞书文档的评论的读写完成多人协作审阅的过程,用户通过在飞书文档评论完成相关建议的提出,Agent 重新阅读文档和评论,根据建议进一步优化文档,实现文档协作工作流。

Spec Coding Skill

上面我们实现了多个角色 Skills 和一个功能 Skill,但实际使用时,还需要有一个能统筹全局的技能,来实现分工协作。把上述多个技能组合起来,告诉智能体(agent)整体的规格编码(spec coding)流程,完成工具技能和角色技能的组合与调度。

如此我们就能快速搭建一个规格编码工作流程,完成基础开发。当然也可以参考上面的逻辑,用技能来重新复刻社区里的规格编码实践(如 SpecKit、OpenSpec 等)。

总结

上述场景提到了两种不同风格的 Skill(角色型,工具型),利用 Skill 的动态加载机制(取代固定规则的一次性加载方式),完成了复杂场景下的任务分解;通过 不同角色技能的分工协作(避免 Agent 什么都做导致执行混乱);尝试借助飞书文档形成协作闭环(打通人机交互的最后一步),有效解决了 Agent “不听话、执行乱、工具少” 的问题,让 AI 从 “对话助手” 真正转变为 “可信赖的实干家”,实现从需求提出到代码产出的高效、精准、协作式交付。

Q & A | 一些常见问题


为什么我写的 Skills 不生效,或者效果不符合预期?

那十有八九是你的“名片”(Description)没写好。

记住,Agent 是通过读取 Skills 的 Description 来判断“什么时候该用哪个 Skill”的。要是你的描述写得含糊不清、太专业或者太简单,Agent 就很难明白你的意思,自然在需要的时候就不会调用这个 Skill。所以,用大白话写的清晰、准确的Description,对 Skill 能否起作用至关重要。

使用 Skills 的效果,会受到我选择的大语言模型(LLM)的影响吗?

会有影响,不过影响的方面不一样。

  • 一个更强大的模型,主要影响“挑选”和“安排”技能的能力。 它能更准确地明白你的真实想法,然后从一堆技能里挑出最适合的一个或几个来解决问题。它的优势体现在制定策略方面。
  • 而技能本身,决定了具体任务执行的“最低水平”和“稳定性”。 一旦某个技能被选中,它里面设定好的流程和代码是固定的,会稳定地运行。所以,技能编写得好不好,直接决定了具体任务能不能出色完成。。

Skills 是不是万能的?有什么它不擅长做的事情吗?

当然不是万能的。 Skills 的主要优势是 处理那些流程明确、边界清晰的任务。 在下面这些情况中,它可能就不是最好的选择了:

  • 需要高度创造力的任务: 像写一首饱含情感的诗,或者设计一个全新的品牌标志。这类工作更需要大模型本身的“灵感”。
  • 需要实时、动态做决策的复杂策略游戏: 比如在变化极快的金融市场中做交易决策。
  • 单纯的知识问答或开放式闲聊: 如果你只是想问“文艺复兴三杰是谁?”,直接问大模型就可以,不用动用 Skills 这个“大杀器”。

我发现一个社区的 Skills 很好用,但我可以修改它以适应我的特殊需求吗?

当然可以,我们强烈建议你这么做!

大多数共享的 Skill 都支持用户“Fork”(也就是“复制一份”)并进行二次开发。你可以把通用的 Skill 当作模板,在自己的工作空间里复制一份,然后修改里面的逻辑或参数,以适应你自己的业务需求。这对整个生态的共建和知识复用很重要。

结语|让 Agent 成为你真正的“行动派”


Skill 的出现,为 AI 从“对话式助手”转变为“可信赖的执行者”搭建了关键的技术桥梁。它用结构化的方法把领域知识、操作流程和工具调用逻辑封装起来,解决了 Agent 规则失效、执行失控的混乱问题,让 AI 的能力输出变得可以控制、值得信赖且高效。

Skill 的核心价值在于:

  • 精准实际痛点: 通过巧妙的三级加载机制(元数据→说明文档→资源)平衡上下文效率与功能深度,在功能深度和上下文效率之间找到了一个绝佳的平衡点,既避免了宝贵 Token 的浪费,又确保了任务执行的精准性,实现了 Agent 上下文的动态加载能力。
  • 生态赋能,降低门槛: 无论是官方还是社区,都提供了丰富的资源(如 Claude 官方仓库、SkillsMP 市场等),让普通用户也能轻松站在巨人的肩膀上,快速复用各种成熟的能力。

虽然 Skill 不是万能的,但它在“确定性流程任务”上的优势无可替代。未来,随着 AI 模型能力的提升与 Skill 生态的进一步完善,我们有望看到更多跨领域、可组合的 Skill 出现——让 AI 从“样样懂一点”的通才,真正进化为“事事做得好”的专家协作伙伴。

不妨从今天开始,尝试创建你的第一个 Skill:将你最擅长的领域经验封装成可复用的能力,让 AI 成为你延伸专业价值的放大器。

蚂蚁灵波开源空间感知模型LingBot-Depth

2026年1月27日 11:23
36氪获悉,蚂蚁集团旗下具身智能公司灵波科技宣布开源高精度空间感知模型LingBot-Depth。该模型基于奥比中光Gemini 330系列双目3D相机提供的芯片级原始数据,专注于提升环境深度感知与三维空间理解能力,旨在为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉。

这份 2025 年度回忆,属于你和 AI 小电拼

作者 爱范儿
2026年1月27日 11:22

AIM 国际设计竞赛最佳技术创新奖、微博数码年度电子潮玩奖、充电头网年度金充奖技术创新奖……

这些殊荣,是制糖工厂 2025 年交出的答卷。

作为一支专注「先锋电能产品」的团队,我们在过去一年,陆续推出了贴贴线、细雳线、小电拼,首创并践行了 SDC(Software-Defined Charger)的理念,让硬件可以被软件定义,让协议与算法能不断演进。我们还开放了 AI 小电拼的 68 万行 C + + 代码,把积累的经验分享给更多人,希望能推动整个行业往前走。

AI 小电拼无疑是这一年最重要的作品。

它浓缩了制糖工厂对前瞻技术、工程标准和用户体验的执念,也代表了我们在复杂问题面前选择长期投入、持续迭代的判断。

SDC:充电设备的未来形态

SDC,Software-Defined Charger,软件定义的充电器,是一种可实现底层软件配置和用户自定义,并可持续进化的充电设备。它颠覆了传统充电器出厂即定型的特点,不再是一个传统意义的哑设备,而是变身为一个透明化和可配置的全新产品。

AI 小电拼所代表的,是我们下一代充电器的几个基本判断:

  1. 充电器不再是「一个盒子」,而是「一个系统」
  2. 协议适配能力,成为第一等核心能力
  3. 可观测性与可配置性,是下一代充电器的标配
  4. 软件定义 + 云端 OTA,决定产品生命周期
  5. 电气产品,正在向智能终端演进

传统充电器更像电源插座:插上即用,逻辑固化,状态不可见,问题不可诊断。

而 SDC 更接近「可调节的能源路由器」——每个接口的功率、协议都可以被精细控制,系统能根据设备与场景动态匹配最优策略,让充电器真正「理解」所连接的设备。

SDC 的核心,在于软件可定义。

通过不同的模式与协议组合,用户可以应对复杂甚至极端的兼容场景,而无需更换硬件。充电体验不再是被动接受,而是主动配置。

全模块 OTA,是这一体系得以成立的第二根支柱。

AI 小电拼可以像智能手机一样持续升级,从「一次性硬件」转变为「可管理的长期设备」。协议更新、问题修复、体验优化,都可以通过 OTA 快速完成,并同步惠及所有用户。

更重要的是,每一个真实使用场景中暴露的问题,都会反过来推动产品的整体进化。

全模块 OTA:无线更新,持续进化

仅在 2025 年,AI 小电拼共完成 30 余项软件与功能更新,包括:

  • 全球首发 UFCS 2.0 协议
  • 全球首家跟进支持 AVS 协议
  • 同时支持 AVS 及两档 PPS,均配备独立开关
  • 推出生活场景灵活设置定时任务
  • 支持线损补偿,抵消充电线传输的损耗
  • 支持「ERP」开关,优化大功率充电宝体验
  • 推出 OTW 服务:用 AI 小电拼给不能联网的硬糖系列充电头推送更新
  • 小电拼 iOS、Android 版 App 上线

这些更新并非单点功能叠加,而是围绕真实问题持续打磨体验。

例如,「小家电模式」通过软件形态切换,让原本无法使用 C-C 线的老旧设备重新获得生命,实现真正的「一线通」。

给 PPS 增加 55W 和 105W 两档独立开关,正是对现实中「标准存在、实现参差」这一行业现状的回应,让灰度兼容变成一种可控能力,而非运气游戏。

2025 年 9 月,AI 小电拼完成 SPR AVS 的全链路远程升级;12 月,又率先支持 UFCS 2.0,并通过 OTW 技术为多款硬糖充电器推送定制协议。

OTW:让传统设备获得未来

在持续打磨 AI 小电拼的同时,我们也希望更多设备具备「永不过时」的能力。

于是,OTW 服务诞生了。

通过 OTW 云端服务与有线更新结合,原本无法联网的充电器也可以获得协议升级与功能扩展,从哑设备进化为具备 SDC 能力的智能产品。

OTW 并不是概念包装,而是一套面向长期使用价值的服务体系——让充电器真正成为可以陪伴多年的基础设施。

写在最后:与你一起

过去一年,推动产品进化的不只有我们,还有每一位真实使用它的你。

用户提供的使用反馈、数据、玩法,甚至是意想不到的配件与改造,都在不断拓展 AI 小电拼的边界。

我们始终相信,「好产品就是一颗糖」——让人愿意反复使用,长期依赖。好的体验,有些是显性的,有些是缓慢发生的;有些属于现在,有些指向未来。

AI 小电拼只是第一步。SDC 框架的真正完成,来自每一个用户对设备的掌控与参与。

这才是我们理解中「能陪伴人的产品」。

Keep Patching, Enjoy.

关于制糖工厂

制糖工厂是一家以「软件定义充电器(SDC,Software-Defined Charger)」为核心的数字能源科技公司,围绕个人计算设备、多终端协同与未来智能硬件场景,构建可演进的能量管理系统与消费级硬件产品。公司通过自研的 FluxAI 自由流® 技术、FPGA 架构、全模 OTA/OTW 能力与 CanOS 充电操作系统,将传统充电器从一次性硬件升级为可持续进化的智能设备。

制糖工厂在多设备盲插、全时功率调度、EUG 能量利用等级、 低温与安全策略等方面建立了行业领先的技术与体验标准,逐步形成以「AI 小电拼」「硬糖」「贴贴线™」为代表的产品矩阵,服务创作者、开发者、数字游民与高频电子设备用户。公司正在推动充电器从「被动供电配件」向「个人数字基础设施」转型,为下一代智能设备生态提供稳定、可编程、可理解的能源底座。

爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


金饰克价涨至1585元

2026年1月27日 11:18
1月27日,国内黄金饰品价格对比显示,多家黄金珠宝品牌公布的境内足金首饰价格有所上调,周生生报价1577元/克,周大福报价1585元/克,六福珠宝报价1583元/克,老凤祥报价1576元/克,老庙黄金报价1575元/克。(界面)

蜜雪冰城旗下公司收购鲜啤福鹿家完成工商变更

2026年1月27日 11:15
36氪获悉,爱企查App显示,近日,福鹿家(郑州)企业管理有限公司发生工商变更,新增蜜雪冰城旗下福鹿兄弟(海南)企业管理有限公司为股东,同时,注册资本由约663.1万元人民币增至约1353.3万元人民币。该公司成立于2018年10月,法定代表人为贾荣荣,经营范围包括日用百货销售、第一类医疗器械销售、第二类医疗器械销售等,现由田海霞、郑州麦浪同舟企业管理合伙企业(有限合伙)及上述新增股东等共同持股。

机构:预计到2028年台积电将削减15%-20%成熟制程产能

2026年1月27日 11:02
36氪获悉,根据Counterpoint晶圆代工服务月度情报报告,预计到2028年台积电将削减15%-20% Fab14的12英寸成熟制程产能,核心目的是改善传统制程利用率结构性不足的现状,同时腾挪资源支持先进封装技术的拓展。Counterpoint晶圆代工市场供应追踪数据显示,此次产能调整的核心驱动力是40-90纳米制程的利用率持续低迷。台积电此前已公布其Fab14工厂成熟制程产能的战略调整方案。
❌
❌