普通视图

发现新文章,点击刷新页面。
昨天 — 2026年1月28日首页

想用Clawdbot何必抢Mac mini,手把手教你打造最强本地Agent,立省200美元 | 附保姆级教程

作者 张子豪
2026年1月28日 17:53

今年,本地 Agent 产品真的火了,说是一周一爆款,一点都不为过。

前有 Claude Cowork 一发布就创下将近五千万次的浏览;后有 Clawdbot(现在已经改名叫 Moltbot),在 GitHub 上的 Star 数量,直线突破,从两千狂飙到 7 万。

▲ 本周你漏掉了什么

这么多工具,根本尝试不过来,况且像 Clawdbot 这种需要自己部署服务器的 AI,着实很劝退想要尝试的电脑小白用户。Cowork 就更过分了,目前只开放给 200 美元/月的 Max 订阅用户。

但无论是 Cowork 还是 Clawdbot,其实还有个更聪明的选择;它们俩能做的事,本质上都是从 Claude Code 进化来的。这个已经推出快一年的工具,在今年突然再次流行起来。

国内模型厂商,像是 MiniMax 和阶跃,也推出了 Agent 2.0 桌面版 App 和 AI 桌面伙伴,主打就是「中国版 Cowork」。这些应用无一例外地都是从 Claude Code 的概念进阶而来,打造一个本地版的 Agent。

▲最近更新的 MiniMax Agent 和 阶跃 AI 桌面助手,都开始支持直接处理电脑文件

不需要买服务器,也不用本地搭建,Claude Code 本质上就是官方提供的一个「轻量级 Cowork」,一条命令就能安装。Skills 系统由 Anthropic 官方维护,现成的技能库也更丰富。

这篇文章,APPSO 就手把手教你如何用 Claude Code + Skills + 国产模型,构建你自己的本地 Agent。

什么是 Skills

2026 年,要混在 AI 圈里装 X,不能谈论几句 Skills,还是停留在提示词,已经算是 OUT 了。这些工具能火起来,Skills 这个概念功不可没。

Anthropic 在去年十月就推出了这项功能,但是直到今年年初,Skills 的各类教程才真正像病毒一样传播开来。不得不说,Anthropic 是有点技术傍身的,不是那种纯靠营销的吹吹捧捧,之前被广泛采用的 MCP 协议,也是由 Anthropic 提出的。

▲ 部分 Skills 聚合网站,整理的 Skill 提交数量趋势,在今年猛增|来源:https://skillsmp.com/

和 MPC 作为一个 USB 协议,接入不同的数据来源不同;Skills 更多的是像一个应用市场,和中文翻译为「技能」一样,它能把不同需求的应用都整理为一个单独的技能。我们可以简单的把 Agent 理解成一个游戏角色,它有自己专门的游戏定位,同时他自身也会有很多技能点,这些就是 Skills。

以前我们没办法给这个角色总结出一套按 E 出战技,按 R 开大招,要做什么都得一遍遍和 Agent 沟通;现在这些技能都封装成了一个快捷键,下次再遇到一样的怪,Skills 会直接按照之前设计的流程来操作。

根据 Anthropic 官方的介绍,它们把 Skills 定义为,能够将通用 Agent 转成专用 Agent 的文件目录。

▲Skills 是一个目录,其中包含一个 SKILL.md 文件,该文件组织了指令、脚本和资源的文件夹,为 Agent 提供额外的功能。

由于只是一个文件目录,Skills 也有了可移植的特点,能在 Claude 网页和应用程序(仅限会员用户)、以及 Claude Code、Cowork、API、第三方平台等直接使用。

还是有点懵,看几个 Skills 的热门玩法,我们能更直观感受到它的能力。

这个官方的演示视频,介绍了在 Claude 中,如何将 PowerPoint 技能,与自定义品牌指南技能结合使用,即视频中拖拽压缩包到 Skills 界面,然后再运用海报设计技能来创作概念图。

Claude 会根据我们的需要,来自动加载这些包含指令、脚本和资源的文件夹(Skill);这些 Skills 会像一个定制化的入职培训材料,让 AI 一来就能上手,更高效的实现我们的需求。

还有一个是最近非常火的,让 Claude 生成视频,通过在 Claude Code 中使用 remotion-best-practices 这个技能,我们可以直接一句话让它生成一个视频。

此外,在这个 Anthropic 官方的 Skills 库里面,还有大量针对网页设计、前端设计、PDF 剪裁和分页等处理、文件压缩、图片格式转换、图片剪裁和拼接等处理,只要你想得到的,现在都可以透过 Skills 来直接完成。

▲官方 Skills 库 https://skills.sh/

甚至还有给编辑们用的去 AI 味的 Skill,在 GitHub 上收获了一千个赞。我们在 Claude Code 里面输入「/humanizer-zh」,直接运行该 Skill,然后输入需要修改的问题,这个 Skill 会直接生成改写的文本,和更改的细节。

问题来了,能直接给我们干活的 Skills,到底怎么用?

安装 Claude Code 到你的电脑

Claude 的订阅用户可以直接在 Claude 网页和 App 里面直接开启,免费用户的使用方式,目前最火的就是 Claude Code,这也是 Claude Cowork 的「脚手架」版本。有了 Claude Code,等于有了一个 200 美元订阅才能用的 Cowork,和 20 美元订阅才能用的 Skills。

▲ 在 Claude 设置界面,「Capability 能力」选项下,订阅用户能看到 Skills 功能|图片来源:https://departmentofproduct.substack.com/p/what-are-claude-skills-and-how-can

APPSO 这次手把手教大家怎么把 Claude Code 在自己的电脑上配置好,然后当成 Cowork 来使用,让 AI 操作自己的电脑本地文件,还有叠加使用不同的 Skills 来完成更专门的任务,甚至是创建自己的 Skills。

温馨提示:预计用时,视不同用户的网络环境,大约在一小时左右。60 分钟后,你就能拥有一个真的能解决 50% 人类工作的 AI。此外,不要害怕黑乎乎的终端。

总结一下大致的步骤是:

  1. 使用合适的网络,下载和安装 Node.js,Windows 用户需要额外安装 Git 应用。
  2. 在终端里输入 Claude Code 的安装命令,Windows 用户可能需要额外配置环境变量。
  3. 购买 API,智谱、Kimi、MiniMax、千问,等几大国产 AI 都支持连接到 Claude Code。
  4. 修改 Claude Code 的 settings.json 文件,根据不同模型 API 开放平台的教程,替换对应的 JSON 文件内容。
  5. 开始使用 Claude Code,一直按 Enter 等待它解决问题,同时直接复制命令安装对应的 Skills,让 Skills 来处理我们的请求。

第一步:检查网络环境,由于涉及到下载不同的软件安装包,最好是切换到使用 ChatGPT 的网络。

第二步:认识终端。

找到电脑上的终端(Terminal),打开之后不要被它黑乎乎的界面给吓到了,把它当成一个聊天简陋的对话窗口就可以,只不过在这个黑框里面,对话的语言都是各种晦涩难懂的命令。

▲macOS 和 Windows 上的终端应用截图

第三步:软件下载。

下载和安装 Node.js,下载地址:https://nodejs.org/en/download/。

打开网页之后,网站会自动识别到设备信息,我们直接往下滚动,macOS 下载 PKG 安装包,Windows 下载MSI 安装包即可。

▲ Nodejs 网页截图,使用默认下载即可,下载第一个(.pkg 文件/.msi 文件)

和正常的软件安装一样,我们全部使用默认的安装设置即可。当然,如果你的电脑上本来就有安装 Node.js,那可以直接跳过这一步,检查是否有安装 Node.js 的方法是在终端里面输入命令「node –version」,这也是检查是否安装成功的命令。

▲安装成功,终端应该会显示版本号「v24.13.0」,具体版本可能会有所不同。

接着是 Windows 用户的额外操作,除了安装 Node.js,Windows 用户还需要安装 Git,我们把它叫做版本控制工具。

和安装 Node.js 一样,首先复制该网址到浏览器打开,https://git-scm.com/install/windows,然后现在 ARM64 的 Windows 电脑应该比较少,我们一般下载第一个「Git for Windows/x64 Setup」就可以。

▲如果你想检查一下自己的 Windows 电脑是什么架构,也可以在设置-系统-系统信息-设备规格里面找到,一般会写「64 位操作系统,基于 x64 的处理器」。

安装 Git 的步骤,也是只需要按照默认的安装设置即可,如果不明白什么意思,每一步都点下一步(Next)也没问题。安装完成后,会提示我们「View Release Notes(查看发布日志)」,取消勾选,然后结束。忘记取消勾选,也只会打开一个网页,所以问题不大。

第四步:开始安装 Claude Code。

如果你的电脑操作系统是 macOS、Linux 可以直接复制下面这条命令到终端里,这里复制可以直接用快捷键 CTRL+V,然后 ENTER 运行(发送命令到终端)。

curl -fsSL https://claude.ai/install.sh | bash

没有遇到网络问题的话,我们就可以直接看到安装完成的提示信息。

▲macOS 安装完成截图

而对于 Windows 用户,则是复制下面这条命令到终端,即打开名为 Windows PowerShell 的窗口,然后复制运行。复制时,遇到 CTRL+V 失效,反而当作命令输入,可以使用鼠标右键,然后选择粘贴。

irm https://claude.ai/install.ps1 | iex

▲Claude code 安装完成页面,如果你也跟我一样,提示遇到环境变量的问题,按照终端里面的提示信息,添加对应环境变量即可。

Windows 用户的小插曲

首先在 Windows 搜索里面,输入环境变量,会匹配到编辑系统环境变量的结果。

点击下方环境变量

按照终端提示的信息,USER PATH,我们只需要修改上方的用户变量,先点选中变量中的 Path,然后点击编辑

点击新建,然后复制你的终端里面,提示的路径信息,我这里是 C:\Users\ifanr\.local\bin

编辑完成后,点击确定,再点确定,关闭环境变量的窗口即可。然后关掉之前的终端,重新打开一个新的,输入 claude –version,看到有版本号出现,一切就大功告成了。

第五步:开始使用 Claude Code。

在终端里输入 claude,就正式进入了 Claude Code 的大门。

第一次点开,你一定会有诸多不习惯,明明是有很多选项可以选择,但是我不能用鼠标点击,就像这里的主题选择,我们只能使用键盘,上下选择,然后 Enter 表示选中。一般来说,默认第一个 dark mode 暗黑模式即可。

第六步:设置 API。

选择完主题,就会进入 API 的设置,这里提供了 Claude 账户登录,以及 API 和第三方 API 的选项,但无论选择哪个,它都会要求我们登录,登录 Claude 账号,或者 Anthropic 的 API 账户。

所以这个时候,我们要先退出终端,把 API 先设置好。

国产大模型支持 Claude Code 的非常多,无论是像千问这样的大模型家族,还是 AI 六小虎,MiniMax、Kimi、智谱 GLM 这些,都有专门的接入 Claude Code 的文档,方法基本上都一样,就是对参数进行修改。

▲cc-switch 页面,图片来源:https://platform.minimaxi.com/docs/guides/text-ai-coding-tools

最近甚至还有专门的工具,叫做 cc-switch 来直接对 Claude Code 的 API 信息进行修改。这里我们还是演示一下如何对文件直接进行修改,cc-switch 工具的 GitHub 项目地址是 https://github.com/farion1231/cc-switch。

拿智谱来举个例子,我们首先要获取 API,不同模型厂商的 API 获取方式不同,基本上都在对应的开放平台能找到。一般来说,API 只会出现一次,所以创建后复制,最好先放到其他地方,不过也可以重新再创建。

Windows 用户:打开终端,输入命令 notepad $HOME\.claude\settings.json;然后就会弹出记事本,在记事本里面,添加或者替换对应的 “env” 信息即可,同时也需要把 TOKEN 替换为自己真实的 API-KEY。

{
“env”: {
“ANTHROPIC_AUTH_TOKEN”: “your_zhipu_api_key”,
“ANTHROPIC_BASE_URL”: “https://open.bigmodel.cn/api/anthropic”,
“API_TIMEOUT_MS”: “3000000”,
“CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC”: 1
}
}

在智谱官方获取 API 也很方便,前往他们官网 https://bigmodel.cn/usercenter/proj-mgmt/apikeys,创建一个新的 API KEY。现在智谱还有活动,能直接送 200 万 Token,推荐小白可以直接去智谱官网,免费就能体验。

macOS 用户,在终端里面输入 open -e ~/.claude/settings.json,就会用系统自带的文本编辑器,打开编辑窗口。

如果提示文件不存在,就输入这行命令,mkdir -p ~/.claude && echo “{}” > ~/.claude/settings.json && open -e ~/.claude/settings.json

然后同样的,直接替换 settings.json 里面的内容即可,CTRL+S 对文件进行保存。

关闭终端,然后在自己的工作文件夹里面,以终端打开,输入 claude,我们就能直接进去,来到对话的页面了。

Windows 用户这里可能还会遇到一个小问题,就是对明明已经对 settings.json 文件进行修改了,重新输入 claude,还是提示我要去登录 Claude 账户或者 Anthropic API 账户。

又一个小插曲,我们需要在终端输入 notepad $HOME\.claude.json,然后在打开的记事本文件里面,添加或修改下面这一行: “hasCompletedOnboarding”: “true”,

到这里,如果你的 API 是可以使用的,我们就能直接在 Claude Code 里面进行对话了。

一般来说,我们会在一个专门的工作文件夹里面,来启用 Claude Code。这一点在 macOS 上更加明显,我们必须不断赋予 Claude Code 访问文件夹的权限,如果是在默认的文件夹里,Claude Code 生成的和处理的内容,相对来说会杂乱一点。

macOS 同样可以右键在终端里面打开,或者直接把文件夹,拖拽到在 dock 栏的终端应用 Logo 上。

到这里,Claude Code 基本上就配置完成了,现在我们可以让它来真的做点其他 AI 做不到的工作。

如果你想使用其他的 API,例如 MiniMax 2.1,在他们的 https://platform.minimaxi.com/docs/guides/text-ai-coding-tools开放平台文档中心, 也有具体的指引,同样是获取 API 之后,修改 settings.json 文件即可。

{
“env”: {
“ANTHROPIC_BASE_URL”: “https://api.minimaxi.com/anthropic”,
“ANTHROPIC_AUTH_TOKEN”: “”,
“API_TIMEOUT_MS”: “3000000”,
“CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC”: 1,
“ANTHROPIC_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_SMALL_FAST_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_DEFAULT_SONNET_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_DEFAULT_OPUS_MODEL”: “MiniMax-M2.1”,
“ANTHROPIC_DEFAULT_HAIKU_MODEL”: “MiniMax-M2.1”
}
}

把这些文件,替换掉之前的 settings.json 文件,就可以切换到 MiniMax 的模型。

让 AI 真的干点活

首先是聊天,我们现在可以在 Claude Code 里面,要求它帮助我们对文件进行处理,或者下载等。

例如,我们从 YouTube 上随便找了一个视频,然后复制视频链接,直接丢给 Claude Code,要求他下载下来。

其实可以看到,一开始 Claude Code 会一直报错,「command not found」,一直在提示没有对应的命令,但是 Claude Code 会自动进行处理,帮助我们下载并且安装好这些对应的库。

其中视频下载 yt-dlp 这个库,以及多媒体处理的 ffmpeg 库,我们之前没有安装,Claude Code 都会安装好,然后来下载和处理视频文件。

但是这里 ffmpeg 使用的是 AV1 编码,有些设备可能会解码不了,这个时候,我们可以直接要求 Claude Code 重新对视频进行编码,以符合更多设备的播放适配。

对其他文件的处理也是这样,例如我这里有一个 PDF,我需要它帮我分页,每一页都保存为一个单独的 PDF 文件和一个 PNG 图片格式的文件,Claude Code 会自动调用对应的 PDF 库来帮我们处理。

除了这些在本地进行的操作,Claude Code 也可以通过编辑 CLAUDE.MD 来修改我们的记忆,这些功能和前几天推出的 Cowork 是一样,所以,你现在已经有了一个免费的 Cowork 了。

接下来是重头戏,Skills 来了。安装 SKill 特别容易,也是一句命令就能解决。就拿 Claude 官方的 Skills 库来进行说明,它对每个库的介绍,首先都是一句安装命令,我们复制这行命令到终端,

▲ npx skills add https://github.com/remotion-dev/skills –skill remotion-best-practices

Windows 可能会提示不允许运行任何脚本,我们可以使用管理员模式打开终端,输入命令 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser,表示允许运行自己编写的脚本,或者直接使用 CMD,而不是 PowerShell 来运行。

搜索 CMD,打开,输入 y 表示 yes 确定,然后可以选择要安装到哪些应用,选择是否全局安装或只是某个项目,一般我会选择全局安装,如果这个 Skills 不是针对某个特定项目,此外的设置,如安装位置等按照推荐来,直接 Enter,等待安装完成就行。

▲使用 CMD 和 PowerShell 终端来进行安装

安装完成后,输入 claude,进入 Claude Code,然后斜杠 /,我们就能看到已经安装的两个 Skills,一个是 remotion-best-practices,一个是 web-design-guidelines。

除了通过斜杠 / 来启用对应的 Skills,在 Claude Code 里,它也能自动调用对应的 Skills 来完成我们下达的任务。

和那些 Claude Code 自动安装的库不同,Skills 更像是一个工作流,例如 Claude 官方也给出了一些针对 PDF 文件处理的 Skill。在这个 Skill 里面,不仅仅包含此前提到的 PDF 处理工具,还有更具体的工作流,来应对各种关于 PDF 的任务。

那么,什么时候需要用到 Skills,还是直接通过提示词,让 Claude Code 自己去找对应的库就好;怎么用好 Skills 又是一门新的功课。

任何可以被总结出一套工作流的任务,我们都可以让 Skills 来处理。尤其是那些 AI 还没有办法,凭借自己的知识,自动总结出工作流的任务。

像那些句子翻译之类的工作,AI 早已掌握了不同语言翻译的流程,不需要我们再赋予它什么角色,只是用简单的一两句提示词,大部分的 AI 都能翻译得很好,这个时候再用一个 Skills 来做翻译,就有点画蛇添足。

但是翻译可以被包装到一个更大的 Skill 里面,例如需要翻译为特定的格式、排版、以及文风要求;还有对不能直接复制、包含各种图表论文的 PDF 做翻译……这些每一次都需要我们跟 AI 说好该如何处理的任务,现在就能用 Skills 来解决。

最近做视频的 Skill 非常火,我们也直接让它来做一个 Claude Code 安装教程视频。

这效果我觉得是有点吹捧 Remotion 的能力了,很明显就是先做了一个网页,然后再把这个网页渲染成视频。不过这个概念倒是挺新鲜的,如果能对提示词再调整一下,或许会有一些不一样的成品。

生视频没问题,生图就更不在话下。我们还可以让它生成一张 Canva 的设计图,不需要先输入斜杠 / 唤起 Skills,我们输入的提示词,就能自动触发到相关的 Skills 的使用,Claude Code 会询问我们是否要使用 canva-design 这个 skill。

在 skill.md 的文档里面,也会有描述,用来告诉 Agent 什么时候可以唤起该 Skill。

这个 2.35:1 的封面,设计感是在线的,就是有点太简洁风格了。

直接处理电脑文件,有优点,也有很明显的缺点,有时候无预警的删除那些本来就有用的文件,是社交媒体上,对 Claude Code 这类产品,最常见的控诉。

▲开启 Plan mode 后会有提示显示「plan mode on」

有一个小 Tips,就是我们在使用 Claude Code 时,可以按 shift+tab 切换到 Plan Mode,计划模式。在计划模式下,Claude Code 不仅会保持为「只读模式」,对电脑文件不做任何操作,只是先给出执行的计划;此外,它也会比普通模式有更多的思考。

虽然 Claude 官方是推荐我们在多步骤实现、代码探索和交互式开发等项目上使用 Plan Mode,但我们的使用体验是,一般任务开着,也不会有额外的影响。

和这个缺点一样,Claude Code 并不是面向一般用户的产品,就连 Skills 也是,我们在安装 Skills 时,可以看到它能选择不同的 Agents,有 OpenCode、Cursor、字节的 Trae、腾讯的 CodeBuddy、Gemini CLI 等等工具。

这些工具都是面向开发者设计的,现在能从代码圈里走出来,或许一方面也是证实了 AI 时代,这种工具带来的差异,会越来越小。

每个人都可以拿起一个称手的工具,造出轮子,组装成汽车,然后开着这辆车,带我们去一些未曾抵达的地方。

未来 APPSO 会带来更多的 AI 时代的工具指南,我们的线下活动 AIDONE 也在持续更新,和我们一起去发现和体验,更好用的明日产品。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


奥特曼亲口承认 GPT-5.2 搞砸了,这是 OpenAI CEO 最特别的一次直播

作者 张子豪
2026年1月28日 11:27

ChatGPT 最近明显又有点焦虑。

一个月前还在拉红色警报应对 Gemini,现在又看到 Claude Code 爆火,后脚奥特曼就发推说 Codex 要憋大招。在这个时间节点,奥特曼把大家聚在一起,没开发布会,而是开了场座谈会

可能是真的想听听大家的想法,也可能确实没有太清晰的方向,奥特曼刚刚和一群 AI 应用开发者开了场一个多小时的研讨会。我们把整场对话整理了一下,他们主要讨论了关于未来产品形态、模型能力边界、还有个人成长的内容。

听完这一个多小时,这次也感觉奥特曼没把自己当成那个高高在上的 CEO,更像是回到了一个同样在摸索新时代玩法的老程序员

未来的 App,是一人一个

每个人都有自己定制的版本

有人问了个很实在的问题,AI 让代码变便宜了,工程师是要失业还是需求更大?

奥特曼的回答挺有意思,他说工程师的定义会变,但需求不会少。他提到了「杰文斯悖论」:代码越便宜,需求反而越多 。只是「工程师」这个词的定义变了,以前是自己在键盘上敲代码,以后是指挥计算机去做你想做的事。

所以,他觉得未来会是这样,就像我们现在的网名会标注「考研版」、「工作版」,以后每个人手机上的 App 也都不一样。我从 AI 应用商店下载安装的微信是「微信 – APPSO 版」,你的是「微信 – XX 版」。世界会充满为个人定制的软件。

谁来做这个入口

有个独立开发者问得更直接,你们 OpenAI 会不会垄断所有 Agent 的界面?我还能不能在 Codex 上做自己的东西?

说实话,这个担心不是没道理。现在无论是 ChatGPT 还是 Claude,都在疯狂开发各种应用,想收割不同层面的用户。

▲ 因为 Claude Code,软件股经历了自 2022 年以来最糟糕的一周

不过奥特曼倒是给了个比较开放的回答:我们也不知道正确的界面长什么样。有人可能喜欢像电影里那样面对三十个屏幕,有人可能就想安静地每小时说一句话让 AI 去处理。这是个巨大的未解领域,需要大家一起去试。

想想也是,就像当初谁能想到 Manus 这种产品形态会火成那样?

好点子从哪来

这可能是整场最戳心的问题,既然生产力不是问题了,好点子才是稀缺资源。有没有工具能帮我想创意?

很遗憾,目前还没有。但奥特曼提了个很有意思的想法,如果能做一个像 Paul Graham(著名投资人)那样的 ChatBot,能和我们对话激发灵感,那价值就大了。他说他人生中遇到过三四个这样的人,每次和他们聊完都能冒出一堆想法。

说到这个,我想起最近 Dan Koe 那篇《How to fix your entire life in 1 day》在 X 上疯传,目前收获了快两亿浏览。那篇文章提供了一套完整的「心理挖掘」方法,通过一天时间的深度自我提问,帮我们找到真正想做的事。虽然不是 AI 工具,但确实是个激发创意的好框架。

▲文章链接:https://x.com/thedankoe/article/2010751592346030461

这篇文章为什么能这么火,我想也是这种创意在 AI 时代的放大。当意义本身变成了稀缺品,所有人都能用 AI 快速生产内容时,真正有价值的反而是那个「独特视角」——你为什么关心这个问题?你的人生经历如何塑造了这个想法?这些是 AI 复制不了的。

这其实也呼应了奥特曼在座谈会上说的:人类只在乎人类。他没有简单的把那些 AI 生成的内容叫做 AI Slop,而是把那些 AI 作品定义为「Clanker 废铁」,他说这种作品一旦被识破,人们就不喜欢了。

我们渴望的是创作者背后的故事、挣扎和成长轨迹。

做出来了,然后呢

有个开发者说出了很多人的心声,用 AI 做 App 容易,但没用户啊!怎么找到用户(GTM)才是真正的难题。

▲「既然我们现在可以自己开发软件,为什么还要继续支付昂贵的订阅费用?」,知名软件服务提供商 Salesforce 订单减少

奥特曼这次没给什么新答案,很直白地说:是的,人类的注意力是有限的。这是创业永恒的难题,AI 并不能改变这一点。AI 能帮我们更快地做销售自动化、营销自动化,但最终我们还是要和别人竞争这个稀缺资源。

这是物理定律,AI 也改变不了「注意力有限」这个事实。

为了编程,GPT-5.2 的写作确实被削弱

GPT-5.2 写作确实变弱了

Raindrop 的 CTO 提了个很多人都注意到的问题:GPT-5 编码很强,但写作好像不如 GPT-4.5 了?

奥特曼直接承认了:我们搞砸了。5.2 版本为了专注推理和编码,确实牺牲了写作能力。但他强调未来的模型会是通用的,我们想要一个编程助手的同时,也希望它能写出清晰的文档和交互。

▲除了写作能力的下降,多数网友对 ChatGPT 的声讨,还是集中在路由机制和 4o 的回归

好消息是,他们会在后续版本里补上这块。

会不会被旧技术锁死

有个 YouTuber 问了个技术向的问题,模型都是基于旧技术训练的,我们会不会被困在旧技术栈里?就像现在让 GPT 用两年前更新的框架都很费劲。

奥特曼倒是挺乐观:模型本质上是通用推理引擎。未来它们学习新工具的速度会超过人类,给它一个全新的环境,探索一次就能学会。

3D 推理什么时候有

做生物医药的开发者问:药物设计需要 3D 推理能力,这个什么时候能有?

奥特曼说他们知道怎么做,只是优先级的问题。OpenAI 内部项目排期估计都排到巴黎了,但这个需求确实在路线图上。

安全问题怎么办

一个斯坦福做生物安全创业的学生问得更深,生物安全在你们的路线图里排在什么位置?

奥特曼一直对安全问题很担忧。他说单纯封堵已经行不通了,社会需要建立韧性机制,就像我们应对火灾风险那样。不是禁止用火,而是建立防火规范、使用阻燃材料。他还坦承,如果今年 AI 真出什么大热门,生物安全领域是个「合理的赌注」。

我的记忆能不能分成工作记忆和私人记忆

除了模型和安全,个人隐私向来也是大家关注的重点。当被问到,ChatGPT 能否手动分组记忆(工作 vs 个人)?奥特曼直接说,我比较懒,我希望 AI 知道我的一切并自己判断。

他自称是个懒人(Lazy user),他已经准备好让 AI 读取他电脑和网络上的一切数据,只为了不手动输指令,也不想费劲去给记忆分类。

但是,当被问到,能不能开放「用 ChatGPT 登录」,让用户把 Token 预算和记忆带到第三方 App?奥特曼又说我们会做的。先做 Token 预算共享,记忆共享比较敏感但也是目标。

奥特曼的回答还是有些微妙,Token 共享好说,记忆共享就很敏感了。毕竟,记忆数据某种意义上是 ChatGPT 最大的护城河,怎么安全地把这些数据开放给第三方,他们也还在纠结。

成本和速度

有个做 GTM 自动化的 CTO 问:你们说「智能便宜到不用计量」,但我们跑百万级 Agent 还是被成本卡住了。未来成本能降多少?

奥特曼给了个挺激进的预测,到 2027 年底,GPT-5.2 级别的智能成本至少降低 100 倍。

但他也提到了另一个维度:现在越来越多人在意的是速度,而不只是成本。怎么把同样的输出时间缩短到百分之一,这是个和降成本完全不同的问题,他们还在权衡怎么平衡这两个方向。

学历无用论

学历还重要吗

有个从伦敦辍学、进了 YC W26 的创业者问:父母逼我回去上大学,我该怎么办?

奥特曼的回答挺直接:如果你是个有野心的 AI 建设者,现在待在大学可能不是时间的最佳利用方式。学校永远在那里,但技术窗口期不等人。

他自己当年辍学,父母花了十年才不再问他什么时候回去读书。他建议就告诉父母:不是说大学对所有人都不合适,但现在对我来说,我得做这件事。

▲AI 圈里,从名校辍学去创业还做得很好的人,其实很少

小孩子该怎么用 AI

一个伯克利学生问了个很实际的问题:现在高中生都在用 ChatGPT 写作业,幼儿园和小学教育该怎么适应 AI?

奥特曼的态度挺保守:幼儿园别用电脑,让孩子在现实世界玩耍。他提到社交媒体对青少年的负面影响,已经被讨论很多了,但技术对幼儿的影响可能更糟,却很少有人关注。在我们搞清楚这些影响之前,没必要让幼儿园小朋友用 AI。

面试会变成什么样

有人问,软件开发的面试形式是不是该变了?

奥特曼说他们正在讨论这个。理想的面试应该是,给你一个去年一个人两周都做不完的任务,看你能不能在 10-20 分钟内搞定。他觉得传统的软件工程面试本来就不太好,现在就更不相关了。关键是看你能不能在这个新时代有效地工作。

至于招聘,他说 OpenAI 会放缓招聘速度,毕竟现在的 AI 领袖,都在说少量人加 AI 能做更多事。他也希望避免那种「招太多人然后突然发现 AI 能做这些事不得不裁员」的尴尬局面。

AI 时代最重要的技能是什么

最后有个越南国际学生问了这个经典问题。奥特曼的答案都是软技能:高能动性(High Agency)、善于产生想法、有韧性、能适应快速变化的世界。

他说这些技能都是可以学的。当年做 YC 的时候,他最惊讶的发现就是:通过三个月的训练营,真的能让人在这些方面变得非常强。

最后座谈会结束时,奥特曼说了句挺「暖心」的话。

我非常希望了解,你们希望 OpenAI 开发什么样的产品,就像是说假设我们会有一个比现在强 100 倍的模型,上下文长度、速度、成本都是现在的 100 倍优化,工具调用完美,超长上下文的一致性极好……都请你们告诉我们。

你想要什么,我们就会给你建什么。不管是需要什么 API、什么样的原语、什么样的运行时,我们都愿意做。

听起来还是挺诚恳的,毕竟这场座谈会本身,可能就是因为 OpenAI 也不太确定下一步该往哪走了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


昨天以前首页

让 Mac mini 一夜爆单的 Clawdbot,就是苹果 AI Siri 眼中的自己

作者 张子豪
2026年1月26日 15:44

一夜之间,Mac mini 爆单了,连苹果的销售部门都有点懵。

既没有开发布会,春节降价好像也只看到 iPhone Air 大跳水,但 Mac mini 的讨论度却在各大社交平台上突然诡异地飙升。如果你打开 X 或者 Reddit,会发现到处都有 Mac mini 订单截图和各种梗图。

就连 Google AI Studio 的负责人,Logan Kilpatrick 都发 X 说,「我已经下单了 Mac mini」。

但是你能想到,让网友们疯狂掏腰包的,只是一个 GitHub 上突然爆火的开源项目 Clawdbot 吗?这是一个自部署的 AI 助手项目,只是因为网上的攻略都在说,用 Mac mini 来搭建是最好的选择,于是,Mac mini 就这样火了。

不得不说,今年一开始,各种 AI 产品的爆发前所未有,前有狂揽 4800 万浏览的 Claude Cowork,顺势还催生了 Skills、Claude Code 的爆火,X 上的信息流,都是它们的教程。

现在又来了个 Clawdbot,号称是一个真正的 AI 个人助手,可以运行在自己的设备上。然后 GitHub 的 Star 数量在这两天,突然就直线飙升,从五千到两万,这在开源项目里面应该算是比较少见的存在。

有网友发梗图说,自己的 2026 才刚刚开始,就已经被这些东西「夺舍」了,这样的日子什么时候才能结束。

▲刚学会了 Claude Code ,又说 OpenAI 的 Codex 更好,用了 Cowork,又还有 Skills,还有乱入的 Mac mini|图片来源:x@riomadeit

不过,倒没有必要对这些 AI 工具产生焦虑,APPSO 就来帮你扒扒这个 Clawdbot 到底是个什么东西,怎么就引起了大家的关注,还有 Mac mini 又是怎么回事。

▲希望这是读完之后的你|图片来源:x@OanaGoge

Clawdbot 是一个手机端的 Cowork

Siri 喊了这么多年智能助手,结果在大多数的用户手里,还是个定闹钟的;Clawdbot 要做的,就是实现「Siri 本该有的样子」。

▲Clawdbot 官网:https://clawd.bot/

而要做到一个理想的「Siri」,Clawdbot 在某种程度上,是复刻了 Cowork 那一套,并且联动了更多的手机本地内容。具体来说,Clawdbot 是一个自部署的 AI 助手,它的理念是消息优先。我们不需要下载新的客户端,Clawdbot 就是聊天列表里的一个头像,像给同事发微信一样给它发消息,它也在同一个对话框里回复。

这听起来很像早期的「聊天机器人」?在 Telegram 上部署一个这样的机器人早已不是什么新鲜事,甚至 ChatGPT 刚出来那会儿,还有人在微信部署过类似的 AI 助手。

但是,Clawdbot 的不同,在于「Gateway(网关)」这个概念。

普通的 Chatbot 只是模型的一个传声筒,而 Clawdbot 是一个中枢(Gateway)。它一边连接着常用的聊天软件(WhatsApp/Telegram/iMessage 等),另一边连接着最强的 AI 大脑(我们可以自由切换 Claude、ChatGPT、DeepSeek、MiniMax 或本地模型),中间还挂载了无数个包含不同 Skills 的智能体工具。

▲图片来源:https://youtu.be/SaWSPZoPX34

就像这个架构图所描述的,以前的 Chatbot,我们只是能和他说几句话,或者生成几张图片。但是 Clawdbot 的架构,是由 Gateway 网关、Agent 智能体、Memory 记忆,以及 Skills 技能共同组成。

我们可以在不同的聊天工具里面部署一个 Clawdbot,常见的配置是使用 Telegram。这也是上图 User 部分,我们与 Clawdbot 进行交互的界面。

接着,Clawdbot 会利用网关,连接不同的聊天软件和 AI 机器人。例如,项目提到能支持 iMessage 发送和接收消息,使用的是 GitHub 上一个开源项目,steipete/imsg,它可以在 macOS 上提供一个命令行(CLI),用来「列出/读取/监听/发送」Messages.app(iMessage/SMS)的消息。

▲图片来源:https://docs.clawd.bot/channels/whatsapp

针对其他的即时通讯工具,Clawdbot 也会采用官方 API、模拟网页端等标准接口的方式,来获取聊天软件接收的信息。在他们的官方文档中,给出了连接到不同聊天应用的详细设置。

这些信息会进一步交给 AI 大语言模型处理,即图中的 Agent 部分,这也是 Clawdbot 的大脑,我们可以设置不同大语言模型的 API,使用 Claude、ChatGPT 等不同的模型来处理。Agent 还连接了丰富的 Skills 来增强智能体的能力。

Skills 最近也是大热门,Clawdbot 提供了常见的网页浏览、连接日历和邮箱、搜索 X 帖子、连接 Excel、设置清单到手机备忘录等等多个技能。

▲Clawdbot 的官方 Skills 库:https://clawdhub.com/skills

值得一提的是,Clawdbot 的大脑,其中思考和记忆部分是分开的,思考是由第三方的 AI 模型支持,但是记忆不会随着大模型的更换而消失,记忆的存储完全在部署 Clawdbot 的平台,即本地或云服务提供商。因此,一般来说,Clawdbot 的记忆容量是无上限的。

这套架构,也给了 Clawdbot 一些其他 Agent 触及不到的能力。

1. 它有记性了,我们上周告诉它「我只喝燕麦奶拿铁」,下周让它帮忙点咖啡时,它不会再问我们要什么奶。因为它有持久化记忆。对话不再是「用完即走」的一次性抛弃品,而是像和朋友聊天一样,有着连续的上下文。而且,这份上下文,还不会因为我们跟另一个朋友聊天,就被忘记。

2. 主动性,这是最像真人的地方。目前的 AI 都是被动的,我们不问,它永远不说话。 Clawdbot 支持主动性。我们可以设定它每天早上 8 点,把未读邮件摘要发给我们;或者在监测到服务器宕机时,第一时间发弹窗。 从「人找 AI」变成了「AI 找人」,这是质变。

3. 它真的在干活。通过丰富的工具连接和 Skills 引入,它不再只是陪聊。连接 Notion,它可以帮我们整理笔记;连接日历,它可以安排会议;连接浏览器,它可以去网上搜集资料并总结成文档。

想象一下,周五下午 4:55,你的手机震动了一下。 不是老板催命,而是 Clawdbot 发来一条消息:「这是你本周完成的 5 项主要工作摘要,以及下周一上午 10 点的会议提醒,需要我把它们整理成周报发给团队吗?」

很明显,这才是我们想要的「助理」,而不是那个只会写诗作画的搜索框。X 上已经有网友拿 Clawdbot 来炒股、购物、做生意、还有 Vibe Coding 也是同样不在话下。

这位网友使用 Claude Opus 4.5 部署好 Clawdbot 之后,直接给了它 2000 美元的交易钱包,让它每隔 4 小时使用多种 API 进行市场研究,不断提出新的交易思路,然后重新评估未平仓位;虽然还不知道 Clawdbot 能不能帮它自己赚到买 RTX 4090 的钱,但这种跨平台、能真的放手让 AI 去做的场景,确实在变多。

还有网友用它来买车,帮他省了 4200 美元。具体是怎么做的呢,基本上是 Clawdbot 揽了全部的工作。它先通过 Browser Use 之类的工具,浏览网页上的优惠政策和贷款利率,帮助博主找到合适的汽车型号之后;继续通过 Clawdbot 来联系供应商,要它来跟经销商讲价;一来一回,Clawdbot 还真的帮他谈下来了。

不只是能在买东西的时候,帮我们讲价省钱,还有人直接部署它来运营一个茶叶公司。这回真的是一台 Mac mini 就是一家公司了。

还有 Vibe coding,直接做出一个游戏界面。

更多玩法,可以在官方案例展示查看,https://clawd.bot/showcase

不要被网上的 Mac mini 欺骗了

随着 Clawdbot 的走红,在 X 上到处都是这种照片,桌面上堆叠着好几台 Mac mini,配文是「打造我的私人 AI 算力中心」。

▲未来的 CEO 和他的员工|图片来源:X@birdabo

看起来很极客,很赛博朋克,但其实并没有说 Mac mini 是运行这个项目的标配。Clawdbot 官方直接发文说,「别再给苹果公司送钱了,能运行 Node.js 的设备,都可以拿来部署 Clawdbot。」

因为 Clawdbot 本质上是一个「路由」。繁重的推理计算依然是在云端(OpenAI 或 Anthropic 之类的大模型服务器)完成,或者由本地电脑偶尔承担。Clawdbot 运行的地方,只需要负责收发消息、调用 API 和运行一些简单的脚本。

对于 90% 的用户来说,一台每月 5 美元的廉价 VPS 云服务器,或者家里那台 24 小时开机的旧电脑,就足以让这个 AI 助手跑得飞起。

▲Clawdbot 配置流程|图片来源:X@minchoi

但无论是用 Mac mini 还是自己找一个云服务器,要搭建一个 Clawdbot 都不是一件容易的事情。Clawdbot 目前还是一个开源项目,安装它需要我们懂一点终端的知识,其实就是复制粘贴一行代码的事。此外,它也并不总是完美,偶尔会报错,配置起来也有门槛。

既然都能看到,用起来这么麻烦,为什么大家还如此痴迷?

因为它解决了一个巨大的痛点,割裂。现在的软件生态是割裂的,笔记在 Notion,沟通在微信之类的即时通讯软件,待办在 Things,AI 在浏览器网页里。我们每天就在这些 App 之间反复横跳,精疲力竭。

Clawdbot 提供的是一种「大一统」的解法,以「对话」为界面,整合所有服务。

根据官方的介绍,在选择 AI 聊天对象上,Clawdbot 就提供了 WhatsApp、Telegram、Discord、Slack、iMessage / Messages、Microsoft Teams 等数十种聊天工具服务。

AI 模型也支持 Anthropic (Claude)、OpenAI (ChatGPT models)、Google (Gemini)、xAI (Grok)、DeepSeek、MiniMax、智谱 GLM、Perplexity 以及 OpenRouter 和本地模型等。

在具体连接的服务上,它能连接到 Notion、Things 3、Obsidian 等多个生产力工具、Spotify、Shazam 等音乐流媒体、Home Assistant 智能家居控制、以及生图、网络浏览等各种各样的工具集成。

▲网友分享的 Clawdbot 玩法,几乎能在数字世界里面,帮助他完成全部的任务

说实话,最近接连看到 Cowork 、 Clawdbot 这种产品的爆发,我发现 AI 产品新的主线似乎开始显现。

自从 Agent(智能体)概念提出来,大家就在喊「App 已死」。但直到今天,Clawdbot 这种形态的出现,才让我们真正看到了一角未来。我们不再需要为了看天气打开天气 App,不再需要为了记账打开记账 App。

所有的交互,回归到了人类最原始、最自然的本能——对话。

虽然现在的 Clawdbot 还是个需要敲代码配置的「极客玩具」,偶尔还会报错发疯。但别忘了,两三年前的 GPT-3.5 和 AI 视频,看起来就像个简陋的玩具,充满各种槽点。

从 Cowork 接管电脑文件, 到 Clawdbot 接管生活琐事,这种能深度连接本地生活的 AI Agent,如果再联合更多的终端,或许能把 AI 应用落地从 ChatBot 突破到一个新的阶段。

说起来这也是苹果等硬件厂商在这上面也有着巨大的优势,只是留给苹果挤牙膏的时间,真的不多了。

相关参考信息:

What Is Clawdbot? And Why Everyone Is Suddenly Obsessed With It


Clawdbot GitHub 地址:https://github.com/clawdbot/clawdbot

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌