阅读视图

发现新文章,点击刷新页面。

奥特曼亲口承认 GPT-5.2 搞砸了,这是 OpenAI CEO 最特别的一次直播

ChatGPT 最近明显又有点焦虑。

一个月前还在拉红色警报应对 Gemini,现在又看到 Claude Code 爆火,后脚奥特曼就发推说 Codex 要憋大招。在这个时间节点,奥特曼把大家聚在一起,没开发布会,而是开了场座谈会

可能是真的想听听大家的想法,也可能确实没有太清晰的方向,奥特曼刚刚和一群 AI 应用开发者开了场一个多小时的研讨会。我们把整场对话整理了一下,他们主要讨论了关于未来产品形态、模型能力边界、还有个人成长的内容。

听完这一个多小时,这次也感觉奥特曼没把自己当成那个高高在上的 CEO,更像是回到了一个同样在摸索新时代玩法的老程序员

未来的 App,是一人一个

每个人都有自己定制的版本

有人问了个很实在的问题,AI 让代码变便宜了,工程师是要失业还是需求更大?

奥特曼的回答挺有意思,他说工程师的定义会变,但需求不会少。他提到了「杰文斯悖论」:代码越便宜,需求反而越多 。只是「工程师」这个词的定义变了,以前是自己在键盘上敲代码,以后是指挥计算机去做你想做的事。

所以,他觉得未来会是这样,就像我们现在的网名会标注「考研版」、「工作版」,以后每个人手机上的 App 也都不一样。我从 AI 应用商店下载安装的微信是「微信 – APPSO 版」,你的是「微信 – XX 版」。世界会充满为个人定制的软件。

谁来做这个入口

有个独立开发者问得更直接,你们 OpenAI 会不会垄断所有 Agent 的界面?我还能不能在 Codex 上做自己的东西?

说实话,这个担心不是没道理。现在无论是 ChatGPT 还是 Claude,都在疯狂开发各种应用,想收割不同层面的用户。

▲ 因为 Claude Code,软件股经历了自 2022 年以来最糟糕的一周

不过奥特曼倒是给了个比较开放的回答:我们也不知道正确的界面长什么样。有人可能喜欢像电影里那样面对三十个屏幕,有人可能就想安静地每小时说一句话让 AI 去处理。这是个巨大的未解领域,需要大家一起去试。

想想也是,就像当初谁能想到 Manus 这种产品形态会火成那样?

好点子从哪来

这可能是整场最戳心的问题,既然生产力不是问题了,好点子才是稀缺资源。有没有工具能帮我想创意?

很遗憾,目前还没有。但奥特曼提了个很有意思的想法,如果能做一个像 Paul Graham(著名投资人)那样的 ChatBot,能和我们对话激发灵感,那价值就大了。他说他人生中遇到过三四个这样的人,每次和他们聊完都能冒出一堆想法。

说到这个,我想起最近 Dan Koe 那篇《How to fix your entire life in 1 day》在 X 上疯传,目前收获了快两亿浏览。那篇文章提供了一套完整的「心理挖掘」方法,通过一天时间的深度自我提问,帮我们找到真正想做的事。虽然不是 AI 工具,但确实是个激发创意的好框架。

▲文章链接:https://x.com/thedankoe/article/2010751592346030461

这篇文章为什么能这么火,我想也是这种创意在 AI 时代的放大。当意义本身变成了稀缺品,所有人都能用 AI 快速生产内容时,真正有价值的反而是那个「独特视角」——你为什么关心这个问题?你的人生经历如何塑造了这个想法?这些是 AI 复制不了的。

这其实也呼应了奥特曼在座谈会上说的:人类只在乎人类。他没有简单的把那些 AI 生成的内容叫做 AI Slop,而是把那些 AI 作品定义为「Clanker 废铁」,他说这种作品一旦被识破,人们就不喜欢了。

我们渴望的是创作者背后的故事、挣扎和成长轨迹。

做出来了,然后呢

有个开发者说出了很多人的心声,用 AI 做 App 容易,但没用户啊!怎么找到用户(GTM)才是真正的难题。

▲「既然我们现在可以自己开发软件,为什么还要继续支付昂贵的订阅费用?」,知名软件服务提供商 Salesforce 订单减少

奥特曼这次没给什么新答案,很直白地说:是的,人类的注意力是有限的。这是创业永恒的难题,AI 并不能改变这一点。AI 能帮我们更快地做销售自动化、营销自动化,但最终我们还是要和别人竞争这个稀缺资源。

这是物理定律,AI 也改变不了「注意力有限」这个事实。

为了编程,GPT-5.2 的写作确实被削弱

GPT-5.2 写作确实变弱了

Raindrop 的 CTO 提了个很多人都注意到的问题:GPT-5 编码很强,但写作好像不如 GPT-4.5 了?

奥特曼直接承认了:我们搞砸了。5.2 版本为了专注推理和编码,确实牺牲了写作能力。但他强调未来的模型会是通用的,我们想要一个编程助手的同时,也希望它能写出清晰的文档和交互。

▲除了写作能力的下降,多数网友对 ChatGPT 的声讨,还是集中在路由机制和 4o 的回归

好消息是,他们会在后续版本里补上这块。

会不会被旧技术锁死

有个 YouTuber 问了个技术向的问题,模型都是基于旧技术训练的,我们会不会被困在旧技术栈里?就像现在让 GPT 用两年前更新的框架都很费劲。

奥特曼倒是挺乐观:模型本质上是通用推理引擎。未来它们学习新工具的速度会超过人类,给它一个全新的环境,探索一次就能学会。

3D 推理什么时候有

做生物医药的开发者问:药物设计需要 3D 推理能力,这个什么时候能有?

奥特曼说他们知道怎么做,只是优先级的问题。OpenAI 内部项目排期估计都排到巴黎了,但这个需求确实在路线图上。

安全问题怎么办

一个斯坦福做生物安全创业的学生问得更深,生物安全在你们的路线图里排在什么位置?

奥特曼一直对安全问题很担忧。他说单纯封堵已经行不通了,社会需要建立韧性机制,就像我们应对火灾风险那样。不是禁止用火,而是建立防火规范、使用阻燃材料。他还坦承,如果今年 AI 真出什么大热门,生物安全领域是个「合理的赌注」。

我的记忆能不能分成工作记忆和私人记忆

除了模型和安全,个人隐私向来也是大家关注的重点。当被问到,ChatGPT 能否手动分组记忆(工作 vs 个人)?奥特曼直接说,我比较懒,我希望 AI 知道我的一切并自己判断。

他自称是个懒人(Lazy user),他已经准备好让 AI 读取他电脑和网络上的一切数据,只为了不手动输指令,也不想费劲去给记忆分类。

但是,当被问到,能不能开放「用 ChatGPT 登录」,让用户把 Token 预算和记忆带到第三方 App?奥特曼又说我们会做的。先做 Token 预算共享,记忆共享比较敏感但也是目标。

奥特曼的回答还是有些微妙,Token 共享好说,记忆共享就很敏感了。毕竟,记忆数据某种意义上是 ChatGPT 最大的护城河,怎么安全地把这些数据开放给第三方,他们也还在纠结。

成本和速度

有个做 GTM 自动化的 CTO 问:你们说「智能便宜到不用计量」,但我们跑百万级 Agent 还是被成本卡住了。未来成本能降多少?

奥特曼给了个挺激进的预测,到 2027 年底,GPT-5.2 级别的智能成本至少降低 100 倍。

但他也提到了另一个维度:现在越来越多人在意的是速度,而不只是成本。怎么把同样的输出时间缩短到百分之一,这是个和降成本完全不同的问题,他们还在权衡怎么平衡这两个方向。

学历无用论

学历还重要吗

有个从伦敦辍学、进了 YC W26 的创业者问:父母逼我回去上大学,我该怎么办?

奥特曼的回答挺直接:如果你是个有野心的 AI 建设者,现在待在大学可能不是时间的最佳利用方式。学校永远在那里,但技术窗口期不等人。

他自己当年辍学,父母花了十年才不再问他什么时候回去读书。他建议就告诉父母:不是说大学对所有人都不合适,但现在对我来说,我得做这件事。

▲AI 圈里,从名校辍学去创业还做得很好的人,其实很少

小孩子该怎么用 AI

一个伯克利学生问了个很实际的问题:现在高中生都在用 ChatGPT 写作业,幼儿园和小学教育该怎么适应 AI?

奥特曼的态度挺保守:幼儿园别用电脑,让孩子在现实世界玩耍。他提到社交媒体对青少年的负面影响,已经被讨论很多了,但技术对幼儿的影响可能更糟,却很少有人关注。在我们搞清楚这些影响之前,没必要让幼儿园小朋友用 AI。

面试会变成什么样

有人问,软件开发的面试形式是不是该变了?

奥特曼说他们正在讨论这个。理想的面试应该是,给你一个去年一个人两周都做不完的任务,看你能不能在 10-20 分钟内搞定。他觉得传统的软件工程面试本来就不太好,现在就更不相关了。关键是看你能不能在这个新时代有效地工作。

至于招聘,他说 OpenAI 会放缓招聘速度,毕竟现在的 AI 领袖,都在说少量人加 AI 能做更多事。他也希望避免那种「招太多人然后突然发现 AI 能做这些事不得不裁员」的尴尬局面。

AI 时代最重要的技能是什么

最后有个越南国际学生问了这个经典问题。奥特曼的答案都是软技能:高能动性(High Agency)、善于产生想法、有韧性、能适应快速变化的世界。

他说这些技能都是可以学的。当年做 YC 的时候,他最惊讶的发现就是:通过三个月的训练营,真的能让人在这些方面变得非常强。

最后座谈会结束时,奥特曼说了句挺「暖心」的话。

我非常希望了解,你们希望 OpenAI 开发什么样的产品,就像是说假设我们会有一个比现在强 100 倍的模型,上下文长度、速度、成本都是现在的 100 倍优化,工具调用完美,超长上下文的一致性极好……都请你们告诉我们。

你想要什么,我们就会给你建什么。不管是需要什么 API、什么样的原语、什么样的运行时,我们都愿意做。

听起来还是挺诚恳的,毕竟这场座谈会本身,可能就是因为 OpenAI 也不太确定下一步该往哪走了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


让 Mac mini 一夜爆单的 Clawdbot,就是苹果 AI Siri 眼中的自己

一夜之间,Mac mini 爆单了,连苹果的销售部门都有点懵。

既没有开发布会,春节降价好像也只看到 iPhone Air 大跳水,但 Mac mini 的讨论度却在各大社交平台上突然诡异地飙升。如果你打开 X 或者 Reddit,会发现到处都有 Mac mini 订单截图和各种梗图。

就连 Google AI Studio 的负责人,Logan Kilpatrick 都发 X 说,「我已经下单了 Mac mini」。

但是你能想到,让网友们疯狂掏腰包的,只是一个 GitHub 上突然爆火的开源项目 Clawdbot 吗?这是一个自部署的 AI 助手项目,只是因为网上的攻略都在说,用 Mac mini 来搭建是最好的选择,于是,Mac mini 就这样火了。

不得不说,今年一开始,各种 AI 产品的爆发前所未有,前有狂揽 4800 万浏览的 Claude Cowork,顺势还催生了 Skills、Claude Code 的爆火,X 上的信息流,都是它们的教程。

现在又来了个 Clawdbot,号称是一个真正的 AI 个人助手,可以运行在自己的设备上。然后 GitHub 的 Star 数量在这两天,突然就直线飙升,从五千到两万,这在开源项目里面应该算是比较少见的存在。

有网友发梗图说,自己的 2026 才刚刚开始,就已经被这些东西「夺舍」了,这样的日子什么时候才能结束。

▲刚学会了 Claude Code ,又说 OpenAI 的 Codex 更好,用了 Cowork,又还有 Skills,还有乱入的 Mac mini|图片来源:x@riomadeit

不过,倒没有必要对这些 AI 工具产生焦虑,APPSO 就来帮你扒扒这个 Clawdbot 到底是个什么东西,怎么就引起了大家的关注,还有 Mac mini 又是怎么回事。

▲希望这是读完之后的你|图片来源:x@OanaGoge

Clawdbot 是一个手机端的 Cowork

Siri 喊了这么多年智能助手,结果在大多数的用户手里,还是个定闹钟的;Clawdbot 要做的,就是实现「Siri 本该有的样子」。

▲Clawdbot 官网:https://clawd.bot/

而要做到一个理想的「Siri」,Clawdbot 在某种程度上,是复刻了 Cowork 那一套,并且联动了更多的手机本地内容。具体来说,Clawdbot 是一个自部署的 AI 助手,它的理念是消息优先。我们不需要下载新的客户端,Clawdbot 就是聊天列表里的一个头像,像给同事发微信一样给它发消息,它也在同一个对话框里回复。

这听起来很像早期的「聊天机器人」?在 Telegram 上部署一个这样的机器人早已不是什么新鲜事,甚至 ChatGPT 刚出来那会儿,还有人在微信部署过类似的 AI 助手。

但是,Clawdbot 的不同,在于「Gateway(网关)」这个概念。

普通的 Chatbot 只是模型的一个传声筒,而 Clawdbot 是一个中枢(Gateway)。它一边连接着常用的聊天软件(WhatsApp/Telegram/iMessage 等),另一边连接着最强的 AI 大脑(我们可以自由切换 Claude、ChatGPT、DeepSeek、MiniMax 或本地模型),中间还挂载了无数个包含不同 Skills 的智能体工具。

▲图片来源:https://youtu.be/SaWSPZoPX34

就像这个架构图所描述的,以前的 Chatbot,我们只是能和他说几句话,或者生成几张图片。但是 Clawdbot 的架构,是由 Gateway 网关、Agent 智能体、Memory 记忆,以及 Skills 技能共同组成。

我们可以在不同的聊天工具里面部署一个 Clawdbot,常见的配置是使用 Telegram。这也是上图 User 部分,我们与 Clawdbot 进行交互的界面。

接着,Clawdbot 会利用网关,连接不同的聊天软件和 AI 机器人。例如,项目提到能支持 iMessage 发送和接收消息,使用的是 GitHub 上一个开源项目,steipete/imsg,它可以在 macOS 上提供一个命令行(CLI),用来「列出/读取/监听/发送」Messages.app(iMessage/SMS)的消息。

▲图片来源:https://docs.clawd.bot/channels/whatsapp

针对其他的即时通讯工具,Clawdbot 也会采用官方 API、模拟网页端等标准接口的方式,来获取聊天软件接收的信息。在他们的官方文档中,给出了连接到不同聊天应用的详细设置。

这些信息会进一步交给 AI 大语言模型处理,即图中的 Agent 部分,这也是 Clawdbot 的大脑,我们可以设置不同大语言模型的 API,使用 Claude、ChatGPT 等不同的模型来处理。Agent 还连接了丰富的 Skills 来增强智能体的能力。

Skills 最近也是大热门,Clawdbot 提供了常见的网页浏览、连接日历和邮箱、搜索 X 帖子、连接 Excel、设置清单到手机备忘录等等多个技能。

▲Clawdbot 的官方 Skills 库:https://clawdhub.com/skills

值得一提的是,Clawdbot 的大脑,其中思考和记忆部分是分开的,思考是由第三方的 AI 模型支持,但是记忆不会随着大模型的更换而消失,记忆的存储完全在部署 Clawdbot 的平台,即本地或云服务提供商。因此,一般来说,Clawdbot 的记忆容量是无上限的。

这套架构,也给了 Clawdbot 一些其他 Agent 触及不到的能力。

1. 它有记性了,我们上周告诉它「我只喝燕麦奶拿铁」,下周让它帮忙点咖啡时,它不会再问我们要什么奶。因为它有持久化记忆。对话不再是「用完即走」的一次性抛弃品,而是像和朋友聊天一样,有着连续的上下文。而且,这份上下文,还不会因为我们跟另一个朋友聊天,就被忘记。

2. 主动性,这是最像真人的地方。目前的 AI 都是被动的,我们不问,它永远不说话。 Clawdbot 支持主动性。我们可以设定它每天早上 8 点,把未读邮件摘要发给我们;或者在监测到服务器宕机时,第一时间发弹窗。 从「人找 AI」变成了「AI 找人」,这是质变。

3. 它真的在干活。通过丰富的工具连接和 Skills 引入,它不再只是陪聊。连接 Notion,它可以帮我们整理笔记;连接日历,它可以安排会议;连接浏览器,它可以去网上搜集资料并总结成文档。

想象一下,周五下午 4:55,你的手机震动了一下。 不是老板催命,而是 Clawdbot 发来一条消息:「这是你本周完成的 5 项主要工作摘要,以及下周一上午 10 点的会议提醒,需要我把它们整理成周报发给团队吗?」

很明显,这才是我们想要的「助理」,而不是那个只会写诗作画的搜索框。X 上已经有网友拿 Clawdbot 来炒股、购物、做生意、还有 Vibe Coding 也是同样不在话下。

这位网友使用 Claude Opus 4.5 部署好 Clawdbot 之后,直接给了它 2000 美元的交易钱包,让它每隔 4 小时使用多种 API 进行市场研究,不断提出新的交易思路,然后重新评估未平仓位;虽然还不知道 Clawdbot 能不能帮它自己赚到买 RTX 4090 的钱,但这种跨平台、能真的放手让 AI 去做的场景,确实在变多。

还有网友用它来买车,帮他省了 4200 美元。具体是怎么做的呢,基本上是 Clawdbot 揽了全部的工作。它先通过 Browser Use 之类的工具,浏览网页上的优惠政策和贷款利率,帮助博主找到合适的汽车型号之后;继续通过 Clawdbot 来联系供应商,要它来跟经销商讲价;一来一回,Clawdbot 还真的帮他谈下来了。

不只是能在买东西的时候,帮我们讲价省钱,还有人直接部署它来运营一个茶叶公司。这回真的是一台 Mac mini 就是一家公司了。

还有 Vibe coding,直接做出一个游戏界面。

更多玩法,可以在官方案例展示查看,https://clawd.bot/showcase

不要被网上的 Mac mini 欺骗了

随着 Clawdbot 的走红,在 X 上到处都是这种照片,桌面上堆叠着好几台 Mac mini,配文是「打造我的私人 AI 算力中心」。

▲未来的 CEO 和他的员工|图片来源:X@birdabo

看起来很极客,很赛博朋克,但其实并没有说 Mac mini 是运行这个项目的标配。Clawdbot 官方直接发文说,「别再给苹果公司送钱了,能运行 Node.js 的设备,都可以拿来部署 Clawdbot。」

因为 Clawdbot 本质上是一个「路由」。繁重的推理计算依然是在云端(OpenAI 或 Anthropic 之类的大模型服务器)完成,或者由本地电脑偶尔承担。Clawdbot 运行的地方,只需要负责收发消息、调用 API 和运行一些简单的脚本。

对于 90% 的用户来说,一台每月 5 美元的廉价 VPS 云服务器,或者家里那台 24 小时开机的旧电脑,就足以让这个 AI 助手跑得飞起。

▲Clawdbot 配置流程|图片来源:X@minchoi

但无论是用 Mac mini 还是自己找一个云服务器,要搭建一个 Clawdbot 都不是一件容易的事情。Clawdbot 目前还是一个开源项目,安装它需要我们懂一点终端的知识,其实就是复制粘贴一行代码的事。此外,它也并不总是完美,偶尔会报错,配置起来也有门槛。

既然都能看到,用起来这么麻烦,为什么大家还如此痴迷?

因为它解决了一个巨大的痛点,割裂。现在的软件生态是割裂的,笔记在 Notion,沟通在微信之类的即时通讯软件,待办在 Things,AI 在浏览器网页里。我们每天就在这些 App 之间反复横跳,精疲力竭。

Clawdbot 提供的是一种「大一统」的解法,以「对话」为界面,整合所有服务。

根据官方的介绍,在选择 AI 聊天对象上,Clawdbot 就提供了 WhatsApp、Telegram、Discord、Slack、iMessage / Messages、Microsoft Teams 等数十种聊天工具服务。

AI 模型也支持 Anthropic (Claude)、OpenAI (ChatGPT models)、Google (Gemini)、xAI (Grok)、DeepSeek、MiniMax、智谱 GLM、Perplexity 以及 OpenRouter 和本地模型等。

在具体连接的服务上,它能连接到 Notion、Things 3、Obsidian 等多个生产力工具、Spotify、Shazam 等音乐流媒体、Home Assistant 智能家居控制、以及生图、网络浏览等各种各样的工具集成。

▲网友分享的 Clawdbot 玩法,几乎能在数字世界里面,帮助他完成全部的任务

说实话,最近接连看到 Cowork 、 Clawdbot 这种产品的爆发,我发现 AI 产品新的主线似乎开始显现。

自从 Agent(智能体)概念提出来,大家就在喊「App 已死」。但直到今天,Clawdbot 这种形态的出现,才让我们真正看到了一角未来。我们不再需要为了看天气打开天气 App,不再需要为了记账打开记账 App。

所有的交互,回归到了人类最原始、最自然的本能——对话。

虽然现在的 Clawdbot 还是个需要敲代码配置的「极客玩具」,偶尔还会报错发疯。但别忘了,两三年前的 GPT-3.5 和 AI 视频,看起来就像个简陋的玩具,充满各种槽点。

从 Cowork 接管电脑文件, 到 Clawdbot 接管生活琐事,这种能深度连接本地生活的 AI Agent,如果再联合更多的终端,或许能把 AI 应用落地从 ChatBot 突破到一个新的阶段。

说起来这也是苹果等硬件厂商在这上面也有着巨大的优势,只是留给苹果挤牙膏的时间,真的不多了。

相关参考信息:

What Is Clawdbot? And Why Everyone Is Suddenly Obsessed With It


Clawdbot GitHub 地址:https://github.com/clawdbot/clawdbot

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌