普通视图

发现新文章,点击刷新页面。
昨天 — 2026年1月29日首页

AI 视频生成也有 Skills了,@ 一下就能调用整个好莱坞剧组

作者 张子豪
2026年1月29日 18:54

Claude Skills 最近在社交媒体上刷屏。它让 AI 从会聊天变成会干活。把专业能力打包成模块,用户只用斜杠 / 一下就能选择对应的 Skills。

想做数据分析?/DataAnalyst。想写代码?/Coding Expert。AI 不再是猜我们想要什么的黑盒,变成了一个按需加载的工具箱。这个模块化的思路,现在也来到了 AI 视频生成领域。

Vidu 新上线的主体社区,把运镜、特效、氛围、表演、构图、叙事、风格、场景、招式等等,这八大类型打包成「主体库」,我们只需要在输入框里 @ 一下,就能调用。

▲在参考生视频中,输入 @,会自动弹出选择框,我们可以直接找到需要的主体

想要推镜头?@镜头库。想要赛博朋克氛围?@氛围库。想要粒子特效?@特效库。

我们甚至可以像 Claude Skills 那样叠加使用:@镜头 + @氛围 + @特效 + 角色图,一次性搞定导演、摄影师、特效师、美术指导的活儿。

以前都说 AI 要抢走好莱坞演员的饭碗,现在 Vidu 直接给每个创作者配了一个 AI 好莱坞制片厂。演员、导演、摄像全部都是 AI,只要我们 @ 一下。

这也是全球第一个 AI 视频主体社区,一个可分享、可交易、可互动的主体社区。

🔗 体验地址:https://www.vidu.cn |Vidu API:http://platform.vidu.cn/

APPSO 第一时间拿到了 Vidu 主体社区的测试资格,把里面的 8 大主体类型都体验了一遍,我们一起来看看它的实际表现如何。

🎁 还有给大家也准备了福利,登录 vidu.cn输入邀请码:APPSON,注册即送 500 积分,快一起来体验吧

AI 终于学会了「演戏」

在传统 AI 视频中,最难描述的就是画面感。稍微多写几个形容词,AI 就容易产生幻觉。尤其是人物表情的僵硬,简直就是 AI 视频的硬伤。

Vidu 主体社区的表演和表情库,把这些复杂的情绪描述和动作设计,都做到了标准化。现在包括癫狂大笑、惊恐、悲伤、欢快等表演和表情主体,能够直接生成对应角色的表情和情绪状态;还有双人对打、群像对峙、浪漫依恋等招式主体,更是把角色的具体动作都安排好了。

一键@表情,我们甚至不需要用多余的提示词,就能完美复刻主体社区里面各种表情。同时,还能兼顾到视频的完整统一性。

我们输入一张小丑的图片,使用癫狂大笑这一主体,既让小丑有更丰富的表情和动作,同时小丑的模样也没有被改变,整体画面的气氛也保持在恐怖惊悚中。

▲组合公式:@雷暴不止的@城市废墟@图1站在街道上,正对着镜头作出@癫狂大笑,结合剧烈的@急摇镜头,营造出强烈的@恐怖惊悚氛围

能笑,当然也能哭,使用@夸张大眼哭哭这个主体,就可以直接让画面里的角色,哭得撕心裂肺。这些表情和表演主体,能真的让 AI 视频里的角色「活」过来。

▲ 组合公式:@图1站在镜子前,镜子里显示着她展现出@夸张大眼哭哭的表情,结合强烈的@悲伤氛围,她的哭泣越来越悲痛,同时使用@侧逆光,显示她的轮廓和镜子中清晰的哭泣表情。

不只表情控制准确,动作上,有了主体库的预设,我们可以轻轻松松地就让角色放大招。不只是角色的动作,就连视频特效,我们也是直接@主体社区 里面的对应主体,就自动添加上。

我们先在招式里面,选了一个@百花缭乱的分身。

▲组合公式:@角色3使用@百花缭乱分身

效果还是很不错的,即使是比较复杂的@冰雨术、锁链等招式,Vidu 也基本上都能驾驭得很好。

▲组合公式:@剑圣使用@冰雨术攻击@苍玄,冰雨快要掉到@苍玄身上时,@苍玄快速使用@金钟罩来抵抗攻击

这些招式和特效,对于短剧漫剧创作者来说,简直是最佳利器。

不同的主体也能多个叠加组合,Vidu 就能给我一个精彩的玄幻武打大片。

▲组合公式:@星野仙尊面向@鬼怪打出@降龙十八掌,场景是@战场@智能运镜

近距离的双人对打,行云流水的动作也能复刻黑客帝国了。

@ 几下就能出片,我也能做百万运镜了

解决了人物的表情和动作,接着就是画面的设计。

能控制视角,掌握观众的眼睛的镜头,是视频内容呈现当之无愧的重要部分。其中的运镜和构图运镜能决定摄影机的运动方式,向来就是电影镜头语言的基础;而构图更是决定了画面的景别和视角

在 Vidu 主体社区,景别包括特写、全景、鸟瞰、360 度展示等,构图也有群像对峙、三分构图、荷兰角构图等,镜头则更加丰富,包含推镜头、摇镜头、环绕镜头、探针镜头等多种运镜方式。

我们先是从主体库里,按照人物+风格+场景+氛围+运镜的方式,随机选择了一组提示词,中间甚至没有太多的连接词,用来把这些主体连起来。最后一次性呈现出来的效果,也很有好莱坞大片的风格。

▲组合公式:@紧张压抑氛围@小李子站在@停车场,镜头先@360度展示,再拉远到@全景展示空荡荡的停车场

其中小李子就是我们自己创建的主体,上传 1-3 张图片,选择对应的声音,然后确定风格和提示词,就能得到一个可以重复使用的人物主体。

配合 @360度展示的环绕,进一步凸显紧张压抑的氛围,到镜头拉远,使用@全景展示,把这种视觉冲击力做到更强;短短五秒,充满了戏剧张力。

除了在这种封闭空间的运镜,Vidu 主体社区的镜头配置方案,在露天的无限空间里,表现同样优秀。

▲组合公式:@背后视角@活力少女坐在摩天大楼边缘,@无人机拉远@全景展现@南京城市天际线@敬畏崇高氛围

此外,Vidu 主体社区还提供了像@探针镜头这样的特殊镜头轨迹,很难用自然语言描述清楚摄像机的运动路径,现在直接直接调用主体就能帮我们快速实现微距穿梭。

▲组合公式:@郑开开@科幻风格@太空舱场景@科技感氛围@探针镜头

很多 AI 视频往往画质很美,动起来很假。Vidu 主体社区新增的丰富运镜,确实比以往我们输入提示词,告诉 AI 摄像机如何运动,角色如何运动,要可控和容易得多。它对那些专业镜头语言的理解,还是比较准确。

继续测试它对运镜和景别的理解能力。推镜头是最基础的电影镜头之一,从远景缓慢推进到近景,制造情绪递进感。我们先用传统方式写提示词,「Elean 在医院对面,天在下雨,镜头推进到她的脸部,然后镜头拉远,从空中鸟瞰」。

先不说这个用提示词实现的运镜如何,没有参考主体的纯文生视频有诸多不可控,例如画面的风格是否过于超现实,主体的展示是否符合情境等,我们生成了好几次,单纯用提示词的效果,几乎都把握不好这个推进到鸟瞰的速度和效果。

▲提示词版本,鸟瞰运镜下,人物都消失了,不能保持在画面中心

使用 Vidu 主体库,我们还可以直接选择主体社区中,已经有的人物形象,来生成视频。同时@镜头库选择「镜头推进」,加上简单的场景描述。第一次生成就出片了,从推进到拉远,再到鸟瞰镜头,自然过渡。

▲组合公式:@Elean@医院对面,天在下雨,@镜头推进到她的脸部,然后再@镜头拉远@鸟瞰运镜

这个对比很能说明问题,传统 AI 视频生成的「理解力」是飘忽的,同一个提示词每次生成都像开盲盒。而主体库相当于把这些专业概念做了标准化封装,模型不用再去猜我们想要什么效果。

不只是好看,让故事更有「代入感」

除此之外,在主体库中里面的氛围、风格和场景,决定了整个视频的味道。

具体来说,场景能决定视频的空间环境,风格决定视频的整体美术风格,氛围则是给画面的情感色彩带来了新的故事。Vidu 主体社区也提供了包括太空舱、医院、森林、咖啡店、豪华宴会厅等场景,科幻、悬疑、赛博朋克、古风等风格,以及紧张压抑、欢快、悲伤、浪漫依恋、科技感等氛围。

我们直接把一个豪华的高级宴会厅,变成一出阴森恐怖的惊悚片,配合左右摇晃的运镜,营造出从人物视角观察环境的效果,增强身临其境感。

▲组合公式:@豪华宴会厅变成@恐怖惊悚的氛围,采用@左右摇晃的运镜,整体是@悬疑电影风格

能通过环境的灯光来展现氛围变化,Vidu 主体社区的其他氛围,还能结合人物表情来呈现。

还能让 @小李子@梦露,加一个@浪漫依恋氛围。Vidu 最后生成的视频光影效果很好,当全景的时候,是用比较暗的下雨天氛围,而自动推进到两个人脸部时,画面又自动提亮了。

▲测试公式:@群像对峙@小李子@梦露@浪漫依恋氛围,背景是@咖啡店

通过对这些不同分类的主体进行测试,让我确认了一件事,多主体组合不是简单的「功能堆叠」,Vidu 在底层做了某种协调机制,让不同主体之间能互相配合。

这种协同感,是传统 AI 视频生成最缺少的。我们在提示词里写再多细节,模型也很难同时从里面理解到,镜头、氛围、特效的平衡。

更惊喜的是,我们不仅能直接引用主体库,来生成视频;Vidu 这次还把这些主体,做成了一个可以分享、互动和交易的社区。

▲用户可以上传自己设计的主体

我们每个人都可以设计和上传自己的主体,同时使用其他的主体,在创作和使用的过程中,Vidu 设置了资产变现模式,每一个主体都是可交易的

配合前两天刚刚更新的 Vidu Agent 1.0 和 Vidu Q2 参考生 Pro 模型,一方面有更自动化的工作流,开箱即用,实现一键成片,灵活性与便捷性完美平衡的 Agent;全新升级后的功能,支持上传背景音乐、删减旁白、Storyboard 编辑,内置多语言,多音色,多模特,多场景的海量素材库等。

另一方面则是更强大的基座模型,能直接复刻不同视频效果的 Q2 参考生 Pro。

AI 视频生成这条路,Vidu 算是越走越明白了。

从「抽卡」到「搭乐高」

这一圈实测下来,我对 Vidu 主体社区也有了一个更清晰的判断,它除了是一个更好的工具,能帮助我们更好地生成 AI 视频,它更想要改变整个生成的工作模式。

传统 AI 视频生成是「抽卡模式」,我们写一堆提示词,祈祷模型能理解,然后赌概率。运气好抽到 SSR,运气不好全是垃圾。这种模式的问题是,创作过程不可控,专业门槛以另一种形式(说的就是提示词工程)依然存在。

而 Vidu 主体社区是「乐高模式」,把专业元素拆解成标准化的模块,我们只需要选择、组合,然后生成。这种模式的核心优势是可控性,在选择主体时,我们就大体上知道会有什么效果,而不是单纯碰运气。

这个转变对谁最有价值?自媒体、短剧漫剧创作者、电商营销团队、中小企业主,他们需要批量产出有质感的视频内容,但没有专业团队和高昂预算。主体库对他们来说,相当于花小钱雇了一个「虚拟剧组」。

▲复杂的视频制作流程

那些独立创作者、设计师、广告从业者也会受益。主体库可以补齐他们的短板,不用从零学 AE 就能搞定酷炫的镜头和特效。

放到更大的行业背景下看,Vidu 主体社区让 AI 视频生成进入了「工业化阶段」的一个标志。

过去一年,AI 视频生成的主战场是谁的模型更强——可灵、Runway、Sora、Veo 都在比拼画面质量、时长、一致性。但技术到了一定阶段,竞争维度会转向「怎么生成」,也就是工作流、可控性、复用性。

这种转变,其实和 Claude Skills 的逻辑是如出一辙的。Skills 的价值不在于让 Claude 变得更聪明,而在于让它的能力变得可预期、可调用、可组合。用户不再需要猜测「这次它会不会理解我的意思」,而是明确知道「我调用了这个 Skill,它就会按这个方式工作」。

▲Claude 提供的 Skills 选择,不同的 Skill 能直接解决对应的问题

Vidu 主体库做的也是同样的事情。它把视频生成从「抽卡游戏」变成了「精准指令」。这种确定性,才是真正降低门槛的关键。

对于真正有想法、有审美、有叙事能力的创作者来说,这其实是好事。他们终于不用被技术门槛卡住,可以把精力集中在真正重要的部分。

换句话说,Vidu 全新的主体社区,它能帮我们实现一个完美的推镜头,但不能帮我们决定这个推镜头,应该出现在故事的哪个节点、推进速度应该配合什么样的情绪节奏、这个镜头和前后镜头如何形成叙事张力。

▲主体社区包含的部分主体

这些决策,依然需要我们人类创作者的判断力和审美。

当然,它现在还有一些可以进步的空间,8 秒限制、主体库覆盖度,但这些都是可以迭代优化的。更重要的是,Vidu 主体社区开了一个头,证明了「标准化 + 可组合」这条路是走得通的。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


昨天以前首页

想用Clawdbot何必抢Mac mini,手把手教你打造最强本地Agent,立省200美元 | 附保姆级教程

作者 张子豪
2026年1月28日 17:53

今年,本地 Agent 产品真的火了,说是一周一爆款,一点都不为过。

前有 Claude Cowork 一发布就创下将近五千万次的浏览;后有 Clawdbot(现在已经改名叫 Moltbot),在 GitHub 上的 Star 数量,直线突破,从两千狂飙到 7 万。

▲ 本周你漏掉了什么

这么多工具,根本尝试不过来,况且像 Clawdbot 这种需要自己部署服务器的 AI,着实很劝退想要尝试的电脑小白用户。Cowork 就更过分了,目前只开放给 200 美元/月的 Max 订阅用户。

但无论是 Cowork 还是 Clawdbot,其实还有个更聪明的选择;它们俩能做的事,本质上都是从 Claude Code 进化来的。这个已经推出快一年的工具,在今年突然再次流行起来。

国内模型厂商,像是 MiniMax 和阶跃,也推出了 Agent 2.0 桌面版 App 和 AI 桌面伙伴,主打就是「中国版 Cowork」。这些应用无一例外地都是从 Claude Code 的概念进阶而来,打造一个本地版的 Agent。

▲最近更新的 MiniMax Agent 和 阶跃 AI 桌面助手,都开始支持直接处理电脑文件

不需要买服务器,也不用本地搭建,Claude Code 本质上就是官方提供的一个「轻量级 Cowork」,一条命令就能安装。Skills 系统由 Anthropic 官方维护,现成的技能库也更丰富。

这篇文章,APPSO 就手把手教你如何用 Claude Code + Skills + 国产模型,构建你自己的本地 Agent。

什么是 Skills

2026 年,要混在 AI 圈里装 X,不能谈论几句 Skills,还是停留在提示词,已经算是 OUT 了。这些工具能火起来,Skills 这个概念功不可没。

Anthropic 在去年十月就推出了这项功能,但是直到今年年初,Skills 的各类教程才真正像病毒一样传播开来。不得不说,Anthropic 是有点技术傍身的,不是那种纯靠营销的吹吹捧捧,之前被广泛采用的 MCP 协议,也是由 Anthropic 提出的。

▲ 部分 Skills 聚合网站,整理的 Skill 提交数量趋势,在今年猛增|来源:https://skillsmp.com/

和 MPC 作为一个 USB 协议,接入不同的数据来源不同;Skills 更多的是像一个应用市场,和中文翻译为「技能」一样,它能把不同需求的应用都整理为一个单独的技能。我们可以简单的把 Agent 理解成一个游戏角色,它有自己专门的游戏定位,同时他自身也会有很多技能点,这些就是 Skills。

以前我们没办法给这个角色总结出一套按 E 出战技,按 R 开大招,要做什么都得一遍遍和 Agent 沟通;现在这些技能都封装成了一个快捷键,下次再遇到一样的怪,Skills 会直接按照之前设计的流程来操作。

根据 Anthropic 官方的介绍,它们把 Skills 定义为,能够将通用 Agent 转成专用 Agent 的文件目录。

▲Skills 是一个目录,其中包含一个 SKILL.md 文件,该文件组织了指令、脚本和资源的文件夹,为 Agent 提供额外的功能。

由于只是一个文件目录,Skills 也有了可移植的特点,能在 Claude 网页和应用程序(仅限会员用户)、以及 Claude Code、Cowork、API、第三方平台等直接使用。

还是有点懵,看几个 Skills 的热门玩法,我们能更直观感受到它的能力。

这个官方的演示视频,介绍了在 Claude 中,如何将 PowerPoint 技能,与自定义品牌指南技能结合使用,即视频中拖拽压缩包到 Skills 界面,然后再运用海报设计技能来创作概念图。

Claude 会根据我们的需要,来自动加载这些包含指令、脚本和资源的文件夹(Skill);这些 Skills 会像一个定制化的入职培训材料,让 AI 一来就能上手,更高效的实现我们的需求。

还有一个是最近非常火的,让 Claude 生成视频,通过在 Claude Code 中使用 remotion-best-practices 这个技能,我们可以直接一句话让它生成一个视频。

此外,在这个 Anthropic 官方的 Skills 库里面,还有大量针对网页设计、前端设计、PDF 剪裁和分页等处理、文件压缩、图片格式转换、图片剪裁和拼接等处理,只要你想得到的,现在都可以透过 Skills 来直接完成。

▲官方 Skills 库 https://skills.sh/

甚至还有给编辑们用的去 AI 味的 Skill,在 GitHub 上收获了一千个赞。我们在 Claude Code 里面输入「/humanizer-zh」,直接运行该 Skill,然后输入需要修改的问题,这个 Skill 会直接生成改写的文本,和更改的细节。

问题来了,能直接给我们干活的 Skills,到底怎么用?

安装 Claude Code 到你的电脑

Claude 的订阅用户可以直接在 Claude 网页和 App 里面直接开启,免费用户的使用方式,目前最火的就是 Claude Code,这也是 Claude Cowork 的「脚手架」版本。有了 Claude Code,等于有了一个 200 美元订阅才能用的 Cowork,和 20 美元订阅才能用的 Skills。

▲ 在 Claude 设置界面,「Capability 能力」选项下,订阅用户能看到 Skills 功能|图片来源:https://departmentofproduct.substack.com/p/what-are-claude-skills-and-how-can

APPSO 这次手把手教大家怎么把 Claude Code 在自己的电脑上配置好,然后当成 Cowork 来使用,让 AI 操作自己的电脑本地文件,还有叠加使用不同的 Skills 来完成更专门的任务,甚至是创建自己的 Skills。

温馨提示:预计用时,视不同用户的网络环境,大约在一小时左右。60 分钟后,你就能拥有一个真的能解决 50% 人类工作的 AI。此外,不要害怕黑乎乎的终端。

总结一下大致的步骤是:

  1. 使用合适的网络,下载和安装 Node.js,Windows 用户需要额外安装 Git 应用。
  2. 在终端里输入 Claude Code 的安装命令,Windows 用户可能需要额外配置环境变量。
  3. 购买 API,智谱、Kimi、MiniMax、千问,等几大国产 AI 都支持连接到 Claude Code。
  4. 修改 Claude Code 的 settings.json 文件,根据不同模型 API 开放平台的教程,替换对应的 JSON 文件内容。
  5. 开始使用 Claude Code,一直按 Enter 等待它解决问题,同时直接复制命令安装对应的 Skills,让 Skills 来处理我们的请求。

第一步:检查网络环境,由于涉及到下载不同的软件安装包,最好是切换到使用 ChatGPT 的网络。

第二步:认识终端。

找到电脑上的终端(Terminal),打开之后不要被它黑乎乎的界面给吓到了,把它当成一个聊天简陋的对话窗口就可以,只不过在这个黑框里面,对话的语言都是各种晦涩难懂的命令。

▲macOS 和 Windows 上的终端应用截图

第三步:软件下载。

下载和安装 Node.js,下载地址:https://nodejs.org/en/download/。

打开网页之后,网站会自动识别到设备信息,我们直接往下滚动,macOS 下载 PKG 安装包,Windows 下载MSI 安装包即可。

▲ Nodejs 网页截图,使用默认下载即可,下载第一个(.pkg 文件/.msi 文件)

和正常的软件安装一样,我们全部使用默认的安装设置即可。当然,如果你的电脑上本来就有安装 Node.js,那可以直接跳过这一步,检查是否有安装 Node.js 的方法是在终端里面输入命令「node –version」,这也是检查是否安装成功的命令。

▲安装成功,终端应该会显示版本号「v24.13.0」,具体版本可能会有所不同。

接着是 Windows 用户的额外操作,除了安装 Node.js,Windows 用户还需要安装 Git,我们把它叫做版本控制工具。

和安装 Node.js 一样,首先复制该网址到浏览器打开,https://git-scm.com/install/windows,然后现在 ARM64 的 Windows 电脑应该比较少,我们一般下载第一个「Git for Windows/x64 Setup」就可以。

▲如果你想检查一下自己的 Windows 电脑是什么架构,也可以在设置-系统-系统信息-设备规格里面找到,一般会写「64 位操作系统,基于 x64 的处理器」。

安装 Git 的步骤,也是只需要按照默认的安装设置即可,如果不明白什么意思,每一步都点下一步(Next)也没问题。安装完成后,会提示我们「View Release Notes(查看发布日志)」,取消勾选,然后结束。忘记取消勾选,也只会打开一个网页,所以问题不大。

第四步:开始安装 Claude Code。

如果你的电脑操作系统是 macOS、Linux 可以直接复制下面这条命令到终端里,这里复制可以直接用快捷键 CTRL+V,然后 ENTER 运行(发送命令到终端)。

curl -fsSL https://claude.ai/install.sh | bash

没有遇到网络问题的话,我们就可以直接看到安装完成的提示信息。

▲macOS 安装完成截图

而对于 Windows 用户,则是复制下面这条命令到终端,即打开名为 Windows PowerShell 的窗口,然后复制运行。复制时,遇到 CTRL+V 失效,反而当作命令输入,可以使用鼠标右键,然后选择粘贴。

irm https://claude.ai/install.ps1 | iex

▲Claude code 安装完成页面,如果你也跟我一样,提示遇到环境变量的问题,按照终端里面的提示信息,添加对应环境变量即可。

Windows 用户的小插曲

首先在 Windows 搜索里面,输入环境变量,会匹配到编辑系统环境变量的结果。

点击下方环境变量

按照终端提示的信息,USER PATH,我们只需要修改上方的用户变量,先点选中变量中的 Path,然后点击编辑

点击新建,然后复制你的终端里面,提示的路径信息,我这里是 C:\Users\ifanr\.local\bin

编辑完成后,点击确定,再点确定,关闭环境变量的窗口即可。然后关掉之前的终端,重新打开一个新的,输入 claude –version,看到有版本号出现,一切就大功告成了。

第五步:开始使用 Claude Code。

在终端里输入 claude,就正式进入了 Claude Code 的大门。

第一次点开,你一定会有诸多不习惯,明明是有很多选项可以选择,但是我不能用鼠标点击,就像这里的主题选择,我们只能使用键盘,上下选择,然后 Enter 表示选中。一般来说,默认第一个 dark mode 暗黑模式即可。

第六步:设置 API。

选择完主题,就会进入 API 的设置,这里提供了 Claude 账户登录,以及 API 和第三方 API 的选项,但无论选择哪个,它都会要求我们登录,登录 Claude 账号,或者 Anthropic 的 API 账户。

所以这个时候,我们要先退出终端,把 API 先设置好。

国产大模型支持 Claude Code 的非常多,无论是像千问这样的大模型家族,还是 AI 六小虎,MiniMax、Kimi、智谱 GLM 这些,都有专门的接入 Claude Code 的文档,方法基本上都一样,就是对参数进行修改。

▲cc-switch 页面,图片来源:https://platform.minimaxi.com/docs/guides/text-ai-coding-tools

最近甚至还有专门的工具,叫做 cc-switch 来直接对 Claude Code 的 API 信息进行修改。这里我们还是演示一下如何对文件直接进行修改,cc-switch 工具的 GitHub 项目地址是 https://github.com/farion1231/cc-switch。

拿智谱来举个例子,我们首先要获取 API,不同模型厂商的 API 获取方式不同,基本上都在对应的开放平台能找到。一般来说,API 只会出现一次,所以创建后复制,最好先放到其他地方,不过也可以重新再创建。

Windows 用户:打开终端,输入命令 notepad $HOME\.claude\settings.json;然后就会弹出记事本,在记事本里面,添加或者替换对应的 “env” 信息即可,同时也需要把 TOKEN 替换为自己真实的 API-KEY。

{
“env”: {
“ANTHROPIC_AUTH_TOKEN”: “your_zhipu_api_key”,
“ANTHROPIC_BASE_URL”: “https://open.bigmodel.cn/api/anthropic”,
“API_TIMEOUT_MS”: “3000000”,
“CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC”: 1
}
}

在智谱官方获取 API 也很方便,前往他们官网 https://bigmodel.cn/usercenter/proj-mgmt/apikeys,创建一个新的 API KEY。现在智谱还有活动,能直接送 200 万 Token,推荐小白可以直接去智谱官网,免费就能体验。

macOS 用户,在终端里面输入 open -e ~/.claude/settings.json,就会用系统自带的文本编辑器,打开编辑窗口。

如果提示文件不存在,就输入这行命令,mkdir -p ~/.claude && echo “{}” > ~/.claude/settings.json && open -e ~/.claude/settings.json

然后同样的,直接替换 settings.json 里面的内容即可,CTRL+S 对文件进行保存。

关闭终端,然后在自己的工作文件夹里面,以终端打开,输入 claude,我们就能直接进去,来到对话的页面了。

Windows 用户这里可能还会遇到一个小问题,就是对明明已经对 settings.json 文件进行修改了,重新输入 claude,还是提示我要去登录 Claude 账户或者 Anthropic API 账户。

又一个小插曲,我们需要在终端输入 notepad $HOME\.claude.json,然后在打开的记事本文件里面,添加或修改下面这一行: “hasCompletedOnboarding”: “true”,

到这里,如果你的 API 是可以使用的,我们就能直接在 Claude Code 里面进行对话了。

一般来说,我们会在一个专门的工作文件夹里面,来启用 Claude Code。这一点在 macOS 上更加明显,我们必须不断赋予 Claude Code 访问文件夹的权限,如果是在默认的文件夹里,Claude Code 生成的和处理的内容,相对来说会杂乱一点。

macOS 同样可以右键在终端里面打开,或者直接把文件夹,拖拽到在 dock 栏的终端应用 Logo 上。

到这里,Claude Code 基本上就配置完成了,现在我们可以让它来真的做点其他 AI 做不到的工作。

如果你想使用其他的 API,例如 MiniMax 2.1,在他们的 https://platform.minimaxi.com/docs/guides/text-ai-coding-tools开放平台文档中心, 也有具体的指引,同样是获取 API 之后,修改 settings.json 文件即可。

{
“env”: {
“ANTHROPIC_BASE_URL”: “https://api.minimaxi.com/anthropic”,
“ANTHROPIC_AUTH_TOKEN”: “”,
“API_TIMEOUT_MS”: “3000000”,
“CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC”: 1,
“ANTHROPIC_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_SMALL_FAST_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_DEFAULT_SONNET_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_DEFAULT_OPUS_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_DEFAULT_HAIKU_MODEL”: “MiniMax-M2.1”
}
}

把这些文件,替换掉之前的 settings.json 文件,就可以切换到 MiniMax 的模型。

让 AI 真的干点活

首先是聊天,我们现在可以在 Claude Code 里面,要求它帮助我们对文件进行处理,或者下载等。

例如,我们从 YouTube 上随便找了一个视频,然后复制视频链接,直接丢给 Claude Code,要求他下载下来。

其实可以看到,一开始 Claude Code 会一直报错,「command not found」,一直在提示没有对应的命令,但是 Claude Code 会自动进行处理,帮助我们下载并且安装好这些对应的库。

其中视频下载 yt-dlp 这个库,以及多媒体处理的 ffmpeg 库,我们之前没有安装,Claude Code 都会安装好,然后来下载和处理视频文件。

但是这里 ffmpeg 使用的是 AV1 编码,有些设备可能会解码不了,这个时候,我们可以直接要求 Claude Code 重新对视频进行编码,以符合更多设备的播放适配。

对其他文件的处理也是这样,例如我这里有一个 PDF,我需要它帮我分页,每一页都保存为一个单独的 PDF 文件和一个 PNG 图片格式的文件,Claude Code 会自动调用对应的 PDF 库来帮我们处理。

除了这些在本地进行的操作,Claude Code 也可以通过编辑 CLAUDE.MD 来修改我们的记忆,这些功能和前几天推出的 Cowork 是一样,所以,你现在已经有了一个免费的 Cowork 了。

接下来是重头戏,Skills 来了。安装 SKill 特别容易,也是一句命令就能解决。就拿 Claude 官方的 Skills 库来进行说明,它对每个库的介绍,首先都是一句安装命令,我们复制这行命令到终端,

▲ npx skills add https://github.com/remotion-dev/skills –skill remotion-best-practices

Windows 可能会提示不允许运行任何脚本,我们可以使用管理员模式打开终端,输入命令 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser,表示允许运行自己编写的脚本,或者直接使用 CMD,而不是 PowerShell 来运行。

搜索 CMD,打开,输入 y 表示 yes 确定,然后可以选择要安装到哪些应用,选择是否全局安装或只是某个项目,一般我会选择全局安装,如果这个 Skills 不是针对某个特定项目,此外的设置,如安装位置等按照推荐来,直接 Enter,等待安装完成就行。

▲使用 CMD 和 PowerShell 终端来进行安装

安装完成后,输入 claude,进入 Claude Code,然后斜杠 /,我们就能看到已经安装的两个 Skills,一个是 remotion-best-practices,一个是 web-design-guidelines。

除了通过斜杠 / 来启用对应的 Skills,在 Claude Code 里,它也能自动调用对应的 Skills 来完成我们下达的任务。

和那些 Claude Code 自动安装的库不同,Skills 更像是一个工作流,例如 Claude 官方也给出了一些针对 PDF 文件处理的 Skill。在这个 Skill 里面,不仅仅包含此前提到的 PDF 处理工具,还有更具体的工作流,来应对各种关于 PDF 的任务。

那么,什么时候需要用到 Skills,还是直接通过提示词,让 Claude Code 自己去找对应的库就好;怎么用好 Skills 又是一门新的功课。

任何可以被总结出一套工作流的任务,我们都可以让 Skills 来处理。尤其是那些 AI 还没有办法,凭借自己的知识,自动总结出工作流的任务。

像那些句子翻译之类的工作,AI 早已掌握了不同语言翻译的流程,不需要我们再赋予它什么角色,只是用简单的一两句提示词,大部分的 AI 都能翻译得很好,这个时候再用一个 Skills 来做翻译,就有点画蛇添足。

但是翻译可以被包装到一个更大的 Skill 里面,例如需要翻译为特定的格式、排版、以及文风要求;还有对不能直接复制、包含各种图表论文的 PDF 做翻译……这些每一次都需要我们跟 AI 说好该如何处理的任务,现在就能用 Skills 来解决。

最近做视频的 Skill 非常火,我们也直接让它来做一个 Claude Code 安装教程视频。

这效果我觉得是有点吹捧 Remotion 的能力了,很明显就是先做了一个网页,然后再把这个网页渲染成视频。不过这个概念倒是挺新鲜的,如果能对提示词再调整一下,或许会有一些不一样的成品。

生视频没问题,生图就更不在话下。我们还可以让它生成一张 Canva 的设计图,不需要先输入斜杠 / 唤起 Skills,我们输入的提示词,就能自动触发到相关的 Skills 的使用,Claude Code 会询问我们是否要使用 canva-design 这个 skill。

在 skill.md 的文档里面,也会有描述,用来告诉 Agent 什么时候可以唤起该 Skill。

这个 2.35:1 的封面,设计感是在线的,就是有点太简洁风格了。

直接处理电脑文件,有优点,也有很明显的缺点,有时候无预警的删除那些本来就有用的文件,是社交媒体上,对 Claude Code 这类产品,最常见的控诉。

▲开启 Plan mode 后会有提示显示「plan mode on」

有一个小 Tips,就是我们在使用 Claude Code 时,可以按 shift+tab 切换到 Plan Mode,计划模式。在计划模式下,Claude Code 不仅会保持为「只读模式」,对电脑文件不做任何操作,只是先给出执行的计划;此外,它也会比普通模式有更多的思考。

虽然 Claude 官方是推荐我们在多步骤实现、代码探索和交互式开发等项目上使用 Plan Mode,但我们的使用体验是,一般任务开着,也不会有额外的影响。

和这个缺点一样,Claude Code 并不是面向一般用户的产品,就连 Skills 也是,我们在安装 Skills 时,可以看到它能选择不同的 Agents,有 OpenCode、Cursor、字节的 Trae、腾讯的 CodeBuddy、Gemini CLI 等等工具。

这些工具都是面向开发者设计的,现在能从代码圈里走出来,或许一方面也是证实了 AI 时代,这种工具带来的差异,会越来越小。

每个人都可以拿起一个称手的工具,造出轮子,组装成汽车,然后开着这辆车,带我们去一些未曾抵达的地方。

未来 APPSO 会带来更多的 AI 时代的工具指南,我们的线下活动 AIDONE 也在持续更新,和我们一起去发现和体验,更好用的明日产品。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


奥特曼亲口承认 GPT-5.2 搞砸了,这是 OpenAI CEO 最特别的一次直播

作者 张子豪
2026年1月28日 11:27

ChatGPT 最近明显又有点焦虑。

一个月前还在拉红色警报应对 Gemini,现在又看到 Claude Code 爆火,后脚奥特曼就发推说 Codex 要憋大招。在这个时间节点,奥特曼把大家聚在一起,没开发布会,而是开了场座谈会

可能是真的想听听大家的想法,也可能确实没有太清晰的方向,奥特曼刚刚和一群 AI 应用开发者开了场一个多小时的研讨会。我们把整场对话整理了一下,他们主要讨论了关于未来产品形态、模型能力边界、还有个人成长的内容。

听完这一个多小时,这次也感觉奥特曼没把自己当成那个高高在上的 CEO,更像是回到了一个同样在摸索新时代玩法的老程序员

未来的 App,是一人一个

每个人都有自己定制的版本

有人问了个很实在的问题,AI 让代码变便宜了,工程师是要失业还是需求更大?

奥特曼的回答挺有意思,他说工程师的定义会变,但需求不会少。他提到了「杰文斯悖论」:代码越便宜,需求反而越多 。只是「工程师」这个词的定义变了,以前是自己在键盘上敲代码,以后是指挥计算机去做你想做的事。

所以,他觉得未来会是这样,就像我们现在的网名会标注「考研版」、「工作版」,以后每个人手机上的 App 也都不一样。我从 AI 应用商店下载安装的微信是「微信 – APPSO 版」,你的是「微信 – XX 版」。世界会充满为个人定制的软件。

谁来做这个入口

有个独立开发者问得更直接,你们 OpenAI 会不会垄断所有 Agent 的界面?我还能不能在 Codex 上做自己的东西?

说实话,这个担心不是没道理。现在无论是 ChatGPT 还是 Claude,都在疯狂开发各种应用,想收割不同层面的用户。

▲ 因为 Claude Code,软件股经历了自 2022 年以来最糟糕的一周

不过奥特曼倒是给了个比较开放的回答:我们也不知道正确的界面长什么样。有人可能喜欢像电影里那样面对三十个屏幕,有人可能就想安静地每小时说一句话让 AI 去处理。这是个巨大的未解领域,需要大家一起去试。

想想也是,就像当初谁能想到 Manus 这种产品形态会火成那样?

好点子从哪来

这可能是整场最戳心的问题,既然生产力不是问题了,好点子才是稀缺资源。有没有工具能帮我想创意?

很遗憾,目前还没有。但奥特曼提了个很有意思的想法,如果能做一个像 Paul Graham(著名投资人)那样的 ChatBot,能和我们对话激发灵感,那价值就大了。他说他人生中遇到过三四个这样的人,每次和他们聊完都能冒出一堆想法。

说到这个,我想起最近 Dan Koe 那篇《How to fix your entire life in 1 day》在 X 上疯传,目前收获了快两亿浏览。那篇文章提供了一套完整的「心理挖掘」方法,通过一天时间的深度自我提问,帮我们找到真正想做的事。虽然不是 AI 工具,但确实是个激发创意的好框架。

▲文章链接:https://x.com/thedankoe/article/2010751592346030461

这篇文章为什么能这么火,我想也是这种创意在 AI 时代的放大。当意义本身变成了稀缺品,所有人都能用 AI 快速生产内容时,真正有价值的反而是那个「独特视角」——你为什么关心这个问题?你的人生经历如何塑造了这个想法?这些是 AI 复制不了的。

这其实也呼应了奥特曼在座谈会上说的:人类只在乎人类。他没有简单的把那些 AI 生成的内容叫做 AI Slop,而是把那些 AI 作品定义为「Clanker 废铁」,他说这种作品一旦被识破,人们就不喜欢了。

我们渴望的是创作者背后的故事、挣扎和成长轨迹。

做出来了,然后呢

有个开发者说出了很多人的心声,用 AI 做 App 容易,但没用户啊!怎么找到用户(GTM)才是真正的难题。

▲「既然我们现在可以自己开发软件,为什么还要继续支付昂贵的订阅费用?」,知名软件服务提供商 Salesforce 订单减少

奥特曼这次没给什么新答案,很直白地说:是的,人类的注意力是有限的。这是创业永恒的难题,AI 并不能改变这一点。AI 能帮我们更快地做销售自动化、营销自动化,但最终我们还是要和别人竞争这个稀缺资源。

这是物理定律,AI 也改变不了「注意力有限」这个事实。

为了编程,GPT-5.2 的写作确实被削弱

GPT-5.2 写作确实变弱了

Raindrop 的 CTO 提了个很多人都注意到的问题:GPT-5 编码很强,但写作好像不如 GPT-4.5 了?

奥特曼直接承认了:我们搞砸了。5.2 版本为了专注推理和编码,确实牺牲了写作能力。但他强调未来的模型会是通用的,我们想要一个编程助手的同时,也希望它能写出清晰的文档和交互。

▲除了写作能力的下降,多数网友对 ChatGPT 的声讨,还是集中在路由机制和 4o 的回归

好消息是,他们会在后续版本里补上这块。

会不会被旧技术锁死

有个 YouTuber 问了个技术向的问题,模型都是基于旧技术训练的,我们会不会被困在旧技术栈里?就像现在让 GPT 用两年前更新的框架都很费劲。

奥特曼倒是挺乐观:模型本质上是通用推理引擎。未来它们学习新工具的速度会超过人类,给它一个全新的环境,探索一次就能学会。

3D 推理什么时候有

做生物医药的开发者问:药物设计需要 3D 推理能力,这个什么时候能有?

奥特曼说他们知道怎么做,只是优先级的问题。OpenAI 内部项目排期估计都排到巴黎了,但这个需求确实在路线图上。

安全问题怎么办

一个斯坦福做生物安全创业的学生问得更深,生物安全在你们的路线图里排在什么位置?

奥特曼一直对安全问题很担忧。他说单纯封堵已经行不通了,社会需要建立韧性机制,就像我们应对火灾风险那样。不是禁止用火,而是建立防火规范、使用阻燃材料。他还坦承,如果今年 AI 真出什么大热门,生物安全领域是个「合理的赌注」。

我的记忆能不能分成工作记忆和私人记忆

除了模型和安全,个人隐私向来也是大家关注的重点。当被问到,ChatGPT 能否手动分组记忆(工作 vs 个人)?奥特曼直接说,我比较懒,我希望 AI 知道我的一切并自己判断。

他自称是个懒人(Lazy user),他已经准备好让 AI 读取他电脑和网络上的一切数据,只为了不手动输指令,也不想费劲去给记忆分类。

但是,当被问到,能不能开放「用 ChatGPT 登录」,让用户把 Token 预算和记忆带到第三方 App?奥特曼又说我们会做的。先做 Token 预算共享,记忆共享比较敏感但也是目标。

奥特曼的回答还是有些微妙,Token 共享好说,记忆共享就很敏感了。毕竟,记忆数据某种意义上是 ChatGPT 最大的护城河,怎么安全地把这些数据开放给第三方,他们也还在纠结。

成本和速度

有个做 GTM 自动化的 CTO 问:你们说「智能便宜到不用计量」,但我们跑百万级 Agent 还是被成本卡住了。未来成本能降多少?

奥特曼给了个挺激进的预测,到 2027 年底,GPT-5.2 级别的智能成本至少降低 100 倍。

但他也提到了另一个维度:现在越来越多人在意的是速度,而不只是成本。怎么把同样的输出时间缩短到百分之一,这是个和降成本完全不同的问题,他们还在权衡怎么平衡这两个方向。

学历无用论

学历还重要吗

有个从伦敦辍学、进了 YC W26 的创业者问:父母逼我回去上大学,我该怎么办?

奥特曼的回答挺直接:如果你是个有野心的 AI 建设者,现在待在大学可能不是时间的最佳利用方式。学校永远在那里,但技术窗口期不等人。

他自己当年辍学,父母花了十年才不再问他什么时候回去读书。他建议就告诉父母:不是说大学对所有人都不合适,但现在对我来说,我得做这件事。

▲AI 圈里,从名校辍学去创业还做得很好的人,其实很少

小孩子该怎么用 AI

一个伯克利学生问了个很实际的问题:现在高中生都在用 ChatGPT 写作业,幼儿园和小学教育该怎么适应 AI?

奥特曼的态度挺保守:幼儿园别用电脑,让孩子在现实世界玩耍。他提到社交媒体对青少年的负面影响,已经被讨论很多了,但技术对幼儿的影响可能更糟,却很少有人关注。在我们搞清楚这些影响之前,没必要让幼儿园小朋友用 AI。

面试会变成什么样

有人问,软件开发的面试形式是不是该变了?

奥特曼说他们正在讨论这个。理想的面试应该是,给你一个去年一个人两周都做不完的任务,看你能不能在 10-20 分钟内搞定。他觉得传统的软件工程面试本来就不太好,现在就更不相关了。关键是看你能不能在这个新时代有效地工作。

至于招聘,他说 OpenAI 会放缓招聘速度,毕竟现在的 AI 领袖,都在说少量人加 AI 能做更多事。他也希望避免那种「招太多人然后突然发现 AI 能做这些事不得不裁员」的尴尬局面。

AI 时代最重要的技能是什么

最后有个越南国际学生问了这个经典问题。奥特曼的答案都是软技能:高能动性(High Agency)、善于产生想法、有韧性、能适应快速变化的世界。

他说这些技能都是可以学的。当年做 YC 的时候,他最惊讶的发现就是:通过三个月的训练营,真的能让人在这些方面变得非常强。

最后座谈会结束时,奥特曼说了句挺「暖心」的话。

我非常希望了解,你们希望 OpenAI 开发什么样的产品,就像是说假设我们会有一个比现在强 100 倍的模型,上下文长度、速度、成本都是现在的 100 倍优化,工具调用完美,超长上下文的一致性极好……都请你们告诉我们。

你想要什么,我们就会给你建什么。不管是需要什么 API、什么样的原语、什么样的运行时,我们都愿意做。

听起来还是挺诚恳的,毕竟这场座谈会本身,可能就是因为 OpenAI 也不太确定下一步该往哪走了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


让 Mac mini 一夜爆单的 Clawdbot,就是苹果 AI Siri 眼中的自己

作者 张子豪
2026年1月26日 15:44

一夜之间,Mac mini 爆单了,连苹果的销售部门都有点懵。

既没有开发布会,春节降价好像也只看到 iPhone Air 大跳水,但 Mac mini 的讨论度却在各大社交平台上突然诡异地飙升。如果你打开 X 或者 Reddit,会发现到处都有 Mac mini 订单截图和各种梗图。

就连 Google AI Studio 的负责人,Logan Kilpatrick 都发 X 说,「我已经下单了 Mac mini」。

但是你能想到,让网友们疯狂掏腰包的,只是一个 GitHub 上突然爆火的开源项目 Clawdbot 吗?这是一个自部署的 AI 助手项目,只是因为网上的攻略都在说,用 Mac mini 来搭建是最好的选择,于是,Mac mini 就这样火了。

不得不说,今年一开始,各种 AI 产品的爆发前所未有,前有狂揽 4800 万浏览的 Claude Cowork,顺势还催生了 Skills、Claude Code 的爆火,X 上的信息流,都是它们的教程。

现在又来了个 Clawdbot,号称是一个真正的 AI 个人助手,可以运行在自己的设备上。然后 GitHub 的 Star 数量在这两天,突然就直线飙升,从五千到两万,这在开源项目里面应该算是比较少见的存在。

有网友发梗图说,自己的 2026 才刚刚开始,就已经被这些东西「夺舍」了,这样的日子什么时候才能结束。

▲刚学会了 Claude Code ,又说 OpenAI 的 Codex 更好,用了 Cowork,又还有 Skills,还有乱入的 Mac mini|图片来源:x@riomadeit

不过,倒没有必要对这些 AI 工具产生焦虑,APPSO 就来帮你扒扒这个 Clawdbot 到底是个什么东西,怎么就引起了大家的关注,还有 Mac mini 又是怎么回事。

▲希望这是读完之后的你|图片来源:x@OanaGoge

Clawdbot 是一个手机端的 Cowork

Siri 喊了这么多年智能助手,结果在大多数的用户手里,还是个定闹钟的;Clawdbot 要做的,就是实现「Siri 本该有的样子」。

▲Clawdbot 官网:https://clawd.bot/

而要做到一个理想的「Siri」,Clawdbot 在某种程度上,是复刻了 Cowork 那一套,并且联动了更多的手机本地内容。具体来说,Clawdbot 是一个自部署的 AI 助手,它的理念是消息优先。我们不需要下载新的客户端,Clawdbot 就是聊天列表里的一个头像,像给同事发微信一样给它发消息,它也在同一个对话框里回复。

这听起来很像早期的「聊天机器人」?在 Telegram 上部署一个这样的机器人早已不是什么新鲜事,甚至 ChatGPT 刚出来那会儿,还有人在微信部署过类似的 AI 助手。

但是,Clawdbot 的不同,在于「Gateway(网关)」这个概念。

普通的 Chatbot 只是模型的一个传声筒,而 Clawdbot 是一个中枢(Gateway)。它一边连接着常用的聊天软件(WhatsApp/Telegram/iMessage 等),另一边连接着最强的 AI 大脑(我们可以自由切换 Claude、ChatGPT、DeepSeek、MiniMax 或本地模型),中间还挂载了无数个包含不同 Skills 的智能体工具。

▲图片来源:https://youtu.be/SaWSPZoPX34

就像这个架构图所描述的,以前的 Chatbot,我们只是能和他说几句话,或者生成几张图片。但是 Clawdbot 的架构,是由 Gateway 网关、Agent 智能体、Memory 记忆,以及 Skills 技能共同组成。

我们可以在不同的聊天工具里面部署一个 Clawdbot,常见的配置是使用 Telegram。这也是上图 User 部分,我们与 Clawdbot 进行交互的界面。

接着,Clawdbot 会利用网关,连接不同的聊天软件和 AI 机器人。例如,项目提到能支持 iMessage 发送和接收消息,使用的是 GitHub 上一个开源项目,steipete/imsg,它可以在 macOS 上提供一个命令行(CLI),用来「列出/读取/监听/发送」Messages.app(iMessage/SMS)的消息。

▲图片来源:https://docs.clawd.bot/channels/whatsapp

针对其他的即时通讯工具,Clawdbot 也会采用官方 API、模拟网页端等标准接口的方式,来获取聊天软件接收的信息。在他们的官方文档中,给出了连接到不同聊天应用的详细设置。

这些信息会进一步交给 AI 大语言模型处理,即图中的 Agent 部分,这也是 Clawdbot 的大脑,我们可以设置不同大语言模型的 API,使用 Claude、ChatGPT 等不同的模型来处理。Agent 还连接了丰富的 Skills 来增强智能体的能力。

Skills 最近也是大热门,Clawdbot 提供了常见的网页浏览、连接日历和邮箱、搜索 X 帖子、连接 Excel、设置清单到手机备忘录等等多个技能。

▲Clawdbot 的官方 Skills 库:https://clawdhub.com/skills

值得一提的是,Clawdbot 的大脑,其中思考和记忆部分是分开的,思考是由第三方的 AI 模型支持,但是记忆不会随着大模型的更换而消失,记忆的存储完全在部署 Clawdbot 的平台,即本地或云服务提供商。因此,一般来说,Clawdbot 的记忆容量是无上限的。

这套架构,也给了 Clawdbot 一些其他 Agent 触及不到的能力。

1. 它有记性了,我们上周告诉它「我只喝燕麦奶拿铁」,下周让它帮忙点咖啡时,它不会再问我们要什么奶。因为它有持久化记忆。对话不再是「用完即走」的一次性抛弃品,而是像和朋友聊天一样,有着连续的上下文。而且,这份上下文,还不会因为我们跟另一个朋友聊天,就被忘记。

2. 主动性,这是最像真人的地方。目前的 AI 都是被动的,我们不问,它永远不说话。 Clawdbot 支持主动性。我们可以设定它每天早上 8 点,把未读邮件摘要发给我们;或者在监测到服务器宕机时,第一时间发弹窗。 从「人找 AI」变成了「AI 找人」,这是质变。

3. 它真的在干活。通过丰富的工具连接和 Skills 引入,它不再只是陪聊。连接 Notion,它可以帮我们整理笔记;连接日历,它可以安排会议;连接浏览器,它可以去网上搜集资料并总结成文档。

想象一下,周五下午 4:55,你的手机震动了一下。 不是老板催命,而是 Clawdbot 发来一条消息:「这是你本周完成的 5 项主要工作摘要,以及下周一上午 10 点的会议提醒,需要我把它们整理成周报发给团队吗?」

很明显,这才是我们想要的「助理」,而不是那个只会写诗作画的搜索框。X 上已经有网友拿 Clawdbot 来炒股、购物、做生意、还有 Vibe Coding 也是同样不在话下。

这位网友使用 Claude Opus 4.5 部署好 Clawdbot 之后,直接给了它 2000 美元的交易钱包,让它每隔 4 小时使用多种 API 进行市场研究,不断提出新的交易思路,然后重新评估未平仓位;虽然还不知道 Clawdbot 能不能帮它自己赚到买 RTX 4090 的钱,但这种跨平台、能真的放手让 AI 去做的场景,确实在变多。

还有网友用它来买车,帮他省了 4200 美元。具体是怎么做的呢,基本上是 Clawdbot 揽了全部的工作。它先通过 Browser Use 之类的工具,浏览网页上的优惠政策和贷款利率,帮助博主找到合适的汽车型号之后;继续通过 Clawdbot 来联系供应商,要它来跟经销商讲价;一来一回,Clawdbot 还真的帮他谈下来了。

不只是能在买东西的时候,帮我们讲价省钱,还有人直接部署它来运营一个茶叶公司。这回真的是一台 Mac mini 就是一家公司了。

还有 Vibe coding,直接做出一个游戏界面。

更多玩法,可以在官方案例展示查看,https://clawd.bot/showcase

不要被网上的 Mac mini 欺骗了

随着 Clawdbot 的走红,在 X 上到处都是这种照片,桌面上堆叠着好几台 Mac mini,配文是「打造我的私人 AI 算力中心」。

▲未来的 CEO 和他的员工|图片来源:X@birdabo

看起来很极客,很赛博朋克,但其实并没有说 Mac mini 是运行这个项目的标配。Clawdbot 官方直接发文说,「别再给苹果公司送钱了,能运行 Node.js 的设备,都可以拿来部署 Clawdbot。」

因为 Clawdbot 本质上是一个「路由」。繁重的推理计算依然是在云端(OpenAI 或 Anthropic 之类的大模型服务器)完成,或者由本地电脑偶尔承担。Clawdbot 运行的地方,只需要负责收发消息、调用 API 和运行一些简单的脚本。

对于 90% 的用户来说,一台每月 5 美元的廉价 VPS 云服务器,或者家里那台 24 小时开机的旧电脑,就足以让这个 AI 助手跑得飞起。

▲Clawdbot 配置流程|图片来源:X@minchoi

但无论是用 Mac mini 还是自己找一个云服务器,要搭建一个 Clawdbot 都不是一件容易的事情。Clawdbot 目前还是一个开源项目,安装它需要我们懂一点终端的知识,其实就是复制粘贴一行代码的事。此外,它也并不总是完美,偶尔会报错,配置起来也有门槛。

既然都能看到,用起来这么麻烦,为什么大家还如此痴迷?

因为它解决了一个巨大的痛点,割裂。现在的软件生态是割裂的,笔记在 Notion,沟通在微信之类的即时通讯软件,待办在 Things,AI 在浏览器网页里。我们每天就在这些 App 之间反复横跳,精疲力竭。

Clawdbot 提供的是一种「大一统」的解法,以「对话」为界面,整合所有服务。

根据官方的介绍,在选择 AI 聊天对象上,Clawdbot 就提供了 WhatsApp、Telegram、Discord、Slack、iMessage / Messages、Microsoft Teams 等数十种聊天工具服务。

AI 模型也支持 Anthropic (Claude)、OpenAI (ChatGPT models)、Google (Gemini)、xAI (Grok)、DeepSeek、MiniMax、智谱 GLM、Perplexity 以及 OpenRouter 和本地模型等。

在具体连接的服务上,它能连接到 Notion、Things 3、Obsidian 等多个生产力工具、Spotify、Shazam 等音乐流媒体、Home Assistant 智能家居控制、以及生图、网络浏览等各种各样的工具集成。

▲网友分享的 Clawdbot 玩法,几乎能在数字世界里面,帮助他完成全部的任务

说实话,最近接连看到 Cowork 、 Clawdbot 这种产品的爆发,我发现 AI 产品新的主线似乎开始显现。

自从 Agent(智能体)概念提出来,大家就在喊「App 已死」。但直到今天,Clawdbot 这种形态的出现,才让我们真正看到了一角未来。我们不再需要为了看天气打开天气 App,不再需要为了记账打开记账 App。

所有的交互,回归到了人类最原始、最自然的本能——对话。

虽然现在的 Clawdbot 还是个需要敲代码配置的「极客玩具」,偶尔还会报错发疯。但别忘了,两三年前的 GPT-3.5 和 AI 视频,看起来就像个简陋的玩具,充满各种槽点。

从 Cowork 接管电脑文件, 到 Clawdbot 接管生活琐事,这种能深度连接本地生活的 AI Agent,如果再联合更多的终端,或许能把 AI 应用落地从 ChatBot 突破到一个新的阶段。

说起来这也是苹果等硬件厂商在这上面也有着巨大的优势,只是留给苹果挤牙膏的时间,真的不多了。

相关参考信息:

What Is Clawdbot? And Why Everyone Is Suddenly Obsessed With It


Clawdbot GitHub 地址:https://github.com/clawdbot/clawdbot

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌