普通视图

发现新文章,点击刷新页面。
昨天以前资讯

Codex 这波大更新后,Mac 的含金量再次提升

作者 张子豪
2026年5月22日 17:43

「如果这条推文获得了一个赞,Codex 重置额度限制。」

已经数不清这是今年以来,第几次的限额重置了。奥特曼前两天在 X 发文,让 Codex 负责人 Tibo 再一次重置了使用限额。

网友做了一张梗图,每当一个人想走向 Anthropic 或 Gemini 时,奥特曼站在后面默默按下 Codex 限额重置的按钮,这个人就会回头,然后被拉回到 OpenAI。

OpenAI 这半年也因为出圈的 Codex 收获了一大批的新用户。外媒报道 OpenAI 第一季度营收达到了 57 亿美元,比 Anthropic 高出 10 亿美元,Codex 是主要因素。

▲ OpenAI 营收相关数据,季度营收达到 57 亿美元,年化收入 250 亿,第一季度调整后的营业利润率为 -122%,本季度周活跃用户平均约为 9.05 亿,在 2 月份的周活跃用户数曾达到约 9.2 亿,第一季度的付费用户数量为 5500 万,高于去年年底的约 4700 万。

我们在之前介绍过 Codex 的入门指南,从 ChatGPT 官网下载安装到连接手机上的 ChatGPT App 实现远程控制,都有详细的步骤。

不少读者在评论区留言,Codex 确实好用;也反馈了不少问题,像是下载 Codex 后仍需绑定手机号才能使用。我们的测试也发现登出之后再登录,确实会被要求绑定手机号。

这个时候,建议先在浏览器中进行登录,即主动打开网址 https://auth.openai.com/log-in 提前登录好。再回到 Codex 中登录,弹出的登录链接,只会显示要求授权即可,不会再有绑定手机号的提示。

不同的账号可能会遇到不同情况,大概也是眼下 OpenAI 在 Codex 这边投放了太多的算力,不希望被用户太轻易地薅走羊毛。

今天凌晨,Codex 又上新了一大波的新功能,现在只要按下电脑上的 Command-Command 键,就可将应用程序窗口附加到 Codex 的对话线程里。Codex 会自动获取窗口的屏幕截图和文本,包括屏幕上不可见的内容,作为对话的上下文。

以前还要自己手动截图,现在 Codex 不仅能处理截图,还能直接读到一整个应用窗口的信息。

此外,上次更新的在 ChatGPT App 内操作电脑上的 Codex 这一次也升级了,之前的选项是保持 Codex 常开,现在是即便电脑锁屏了, ChatGPT 同样能远程操作 Codex。

/goal 命令这次也从实验室版本来到了正式推出。之前我们分享多 Agents 协作时,就有读者提到 /goal 功能和多 Agents 类似,它们都是把一个任务当做一个项目来进行管理,有完整的目标生命周期,通过不同的机制来完成迭代。

/goal 最早是 4 月底出现在 Codex CLI 中,有了它确实也能更好的处理越来越多的长任务。

不过遗憾的是,无论是按 command 还是锁屏后继续远程控制,这些都是 macOS 平台的更新,对于 Windows 用户,只能等 OpenAI 的推进。

有网友说,「Mac 用户总是能享受到好东西,而 Windows 用户只能眼巴巴地看着,哈哈。」不得不说,Mac mini 作为 AI PC 的含金量还在增加。

省去很多麻烦的应用快照

这项功能叫 Appshots,开启它的方式也很简单,更新 Codex,在应用设置下,找到「应用快照」,就有一段视频教程,并且可以自定义快捷键。

不过需要注意的是,按下 command 键是指按下键盘上,空格键左右两边的两个 command 键,而不是单击两次。

在任何界面同时按下两个 command 键之后,Codex 会自动捕获页面截图,并快速打开 Codex 将截图放在输入框。我们可以针对这个窗口快照提出问题。

但基于 Codex 的能力,这个窗口快照不单是一张图片的 OCR 文本提取。Codex 可以再这个窗口的基础上,进一步使用 Computer Use 和 Chrome 自动化等功能。

▲ 图中只是在 Codex 的文章开头按下了 command,但是 Codex 不单是处理这张截图,而是会根据 Chrome 的能力,读取整个窗口。

例如,我们在飞书文档的文章开头同时按下了 command 键,然后告诉 Codex 要求它看看这个窗口讲了什么。Codex 会使用 Google Chrome 的工具,自动对网页进行浏览以获取更多的上下文。

这是它和一般截图最大的差别,除了把截图内容放进了上下文,Codex 还会自动把窗口的信息,来自哪个应用等状态信息,同步发送给 Codex。

▲ Codex 识别到了开头之后的文章内容

例如我们在微信里阅读公众号时,也能按下两个 command 键,开启 Appshots。但这里有一个小 Bug,当 Codex 使用 Computer Use 来控制微信的窗口,上下滑动公众号,退出图片的预览时,直接把微信给登出了。

▲暂不知道是微信识别到机器人操作的原因,还是 Codex 误操作,在退出图片预览时,直接退出了微信。建议用小号尝试 Computer Use 在微信中的应用。

官方在宣传视频里介绍 Appshots 时,同样不是简单地将它作为一张截图来使用,而是结合了 Computer Use 和 Google Chrome 来使用。

像是直接要求它修改我们的备忘录内容。

▲花了两分钟,帮我把备忘录的内容修改成了中英双语显示,直接在原备忘录上进行修改

还有也不用再复制什么图片,直接 command+command 然后告诉他生图提示词,对图片进行编辑。

▲ 在浏览器中打开了一张图片,告诉他生成涂鸦版本

就是这种应用多做了一步的感觉,我们就减少了很多 AI 的使用负担,让 Codex 的体验也变得更加丝滑。

/goal 的保姆级使用指南

在对话框内输入斜线,我们就能看到有「目标」的快捷选项,「设置 Codex 将持续努力实现的目标。」

目标存在的价值是作为一个独立存在的任务定义,而不是普通的对话提示词。Codex 会反复根据目标来判断「还该做什么」和「是否已经完成」,自动一轮接一轮的推进,直到任务完成、暂停或者烧到 Token 上限。

这两个判断也是目标的核心机制,即「延续」和「完成审计」。「延续」是在每轮结束后,自动注入提示,让模型决定下一步。「完成审计」是要求模型对照目标逐条核对。

Goal 模型最容易踩坑的地方,就是随手写一句话放进去。要写好一个 Goal,关键原则是 Codex 要能判断是否完成了。

官方在帮助文档也提到,好的目标应包含具体的结果、可衡量的指标或测试标准。他们给了一些案例,像是将项目从一种编程语言迁移到另一种编程语言。

把这个项目从 JavaScript 迁移到 TypeScript。

 

要求:以 strict 模式编译通过,不允许出现显式的 any 类型。

还有更直接的要求,「把首页的可交互时间压到 1 秒以内。」

这些例子都是有着具体的可验证标准,并不是「优化一下」、「完善一下」这种虚词。

 

▲ 图片来源 Goal 官方使用教程:https://developers.openai.com/cookbook/examples/codex/using_goals_in_codex

如果没有想到具体标准,Codex 建议是先跑 /plan。让 Codex 和我们讨论一轮,把验收标准定清楚,再切回普通模式下 /goal。

还有一些实用小建议是,可以在 goal 文本末尾加一句 Use a token budget of 80000 tokens for this goal,用来设置 Token 预算。

以及不要在一个会话的开头就发送 /goal,而应该是先给这个项目其他的需求,有一定的雏形,再给它目标。

锁屏了,Codex 还能操作你的电脑

除了这些大的更新,Codex Thursday 还带来了很多体验升级的功能。

Locked Computer Use 是最值得一提的一项,简单来说它就是能让 Codex 在 Mac 锁屏之后,仍然能在后台操控桌面应用完成任务。

网友对这项功能的评价,都集中在这是突破性的,这很有未来感的同时又很吓人。

如果 Codex 能够在没有活跃用户会话的情况下运行 Mac 应用,这或许是迈向持久 Agent 基础架构的第一步。

若要使用锁屏后继续操作的功能,必须由我们手动开启,并且输入密码。打开的方式同样是在设置里,找到电脑操控,开启锁屏操作。

正常的 Computer Use 需要屏幕处于解锁状态,Codex 才能「看到」并操作界面。这个功能打破了该限制,我们可以把 Mac 合上或锁屏,然后从手机、iPad 或另一台设备远程发起 Codex 任务,它会自动临时解锁、完成操作、然后重新锁上。

Codex 为此安装了一个 Apple Authorization Plug-in(苹果官方授权的认证插件),接入 macOS 的解锁流程。当有活跃的 Computer Use 任务时,插件允许 Codex 临时解锁屏幕;任务窗口之外,解锁权限直接拒绝。

OpenAI 也对这个功能做了几层约束,防止它变成其他危险操作的后门:

  • 解锁窗口极短,仅限当前 Computer Use 操作期间有效
  • 覆盖所有显示器,临时解锁期间屏幕内容对物理旁观者不可见
  • 检测到本地输入立即重锁——有人碰了键盘或鼠标,自动暂停,要求手动解锁
  • 这个路径只对 Codex 开放,其他应用或本地进程无法借道

另一项高级标注的功能,则是我们在使用 Codex Vibe Coding 某个网页时,通过 Codex 内置的浏览器打开,同时还提供了直接在网页内容上进行修改的标注工具。

除了 Codex 这一系列的更新,今天 ChatGPT 也上新了一项新功能,ChatGPT 现在可以直接在 PowerPoint 中创建和编辑演示文稿,并且还能使用 GPT Image 2 生成用于 PPT 里面的图片。

Codex 越来越好用的同时,钱包燃烧的速度也在加快。

我们的 Pro 账号,每周使用限额要到 27 号重置,但是今天(22 号)就只剩下 10% 了。只能在心里默默「作法」,祈祷它再一次重置。

如果这篇文章获得了一个赞,你的 Codex 有可能重置额度限制🐶

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

连时间都没法看的手环,每年敢收 1000 块,居然比苹果还火?

作者 苏伟鸿
2026年5月14日 12:27

Google 可以说是 5 月最出尽风头的科技公司,趁着 Goog I/O 大会的节点,一口气发布了大量新产品——

有颠覆手机系统的智能系统和 Gemini Intelligence,有颠覆电脑使用范式的 Googlebook,还有这个要颠覆智能手表的无屏手环 Fitbit Air——内嵌 Gemini,主打 AI 健康功能。

为此,Google 不仅重新捡起了快被扫进垃圾堆的 Fitbit,还请来 NBA 当家球星库里做代言。野心很明显,就是要在智能穿戴拿下一块市场。

不过,Fitbit Air 瞄准的并不是苹果 Apple Watch,而是对标这两年大火的「WHOOP」——这是一家创立 12 年,却在近两年异军突起的科技新贵,无屏手环是他们最主要的产品。

WHOOP 从产品定义到营销策略,都相当特立独行。他们不卖手环,直接送!只是如果想正常使用,要收一笔不菲的订阅费,来开启 AI 健康功能。

今年 3 月,WHOOP 完成 6 亿美元融资,估值超过 100 亿美元。

在这个充电头都会加一块屏幕的时代,一个没有屏幕的智能手环却卖爆了,凭什么?

无感设计,极致简洁

WHOOP 并不是一家初创公司,实际上成立于 2012 年,早于初代 Apple Watch,和 FitBit、Pebble 等名字并列为智能手表的探索者。

在那个技术还没那么发达的年代,手腕上没法集成太多东西,所以像主打健身健康的 Fitbit 和 WHOOP,初代产品基本上都是一个没屏幕的手环,反馈和交互靠手机 App 完成,本质上和在手腕上绑了一堆传感器无异。

图源:Tom’s Guide

随着技术发展,以及 Apple Watch 对用户心智的教育,类似的智能手环产品很快也都配备了一个小屏幕——在当时,手腕上的触控屏是大势所趋,要不然为什么要无缘无故给身上带个不便宜的手环?

WHOOP 不这么认为,时至今日他们的手环产品依旧没有屏幕,仿佛这十几年的智能穿戴变革浪潮,将他们给遗忘了。

一开始做无屏是妥协,现在还在做无屏,那就是「坚持」了。

实际上,「无屏」这件事,让 WHOOP 变成了一个异常简单的产品,没有太多复杂性和限制,带来了使用上的自由。

创始人 Will Ahmed 认为,一旦为 WHOOP 配备屏幕,那么就会不断加入时间、健康提醒、消息提醒这些功能,成了一块智能手表。这个赛道,很难和苹果三星等品牌竞争。

Will Ahmed

Reddit 上不少用户也表示,选择 WHOOP 的原因,就是因为它没有一块让人分心的屏幕,够纯粹。

WHOOP 的本质就是一个健康传感器,你可以将它佩戴在在身上的不同地方,官方也推出了可以和 WHOOP 配套使用的贴身衣物配件,这种灵活性是智能手表和智能指环都难以媲美的。

Apple Watch 的逻辑,是把更多信息带到手腕上;WHOOP 的逻辑,则是设备彻底退居幕后。

追根溯源,最终让 Apple Watch 得以成立并走进千家万户的原因,也是因为苹果为其找到了「运动健康」这个主要定位。

图源:CNET

这就带来了一个很有意思的反转:Apple Watch 本来应该杀死智能手环的比赛,但随着智能手表越来越普及,也越来越多人能理解「在身上绑传感器」的价值,反而让 WHOOP 极致简洁的价值得以凸显。

时至今日,依然有不少人更偏爱具备美学价值的传统机械表,又向往 Apple Watch 的健康监测功能,只是手上同时戴两块表难免显得有些别扭。爱范儿也采访了身边的真实用户 @flypig,他告诉我们:

因为我有不少机械腕表,我认为是一些蛮好看的饰品,根据心情换着戴。但我又有记录身体状态的需求。我不希望左手一块机械腕表,右手一块 Apple Watch。我试过,感觉戴两块表看起来还是太怪了。

单论产品形态,WHOOP 比 Apple Watch 有不少优势:没了屏幕,换来了两三周的续航,还有极致的轻便,顶配版也不到 30 克,佩戴在身上几乎无感;硬件本身成本极低,会员提供终身保修,非常适合极限运动爱好者,丢了换新也只需要 50-80 美元不等的补办费。

由于 WHOOP 手环本身没有任何交互,只需要「佩戴」,这意味着对于儿童,特别是更需要健康监测的老人群体来说,没有任何使用的门槛。

让人愿意戴,并且愿意长时间戴,这就是智能穿戴产品最重要的优势,这样看来,极致简洁的 WHOOP 已经是一个相当有价值的产品。

普惠,从运动员到每个人

10 年的时间,智能穿戴领域瞬息万变,最早的行业竞争者 Fitbit 和 Pebble 在苹果等大厂入局后,都走向了沉寂。

WHOOP 不仅顽强存活了 12 年,还在这两年大火。这个看似「逆袭」的故事,或许从一开始,就已经埋下了伏笔。

在成军之初,WHOOP 就没有瞄准大众用户,功能不止于步数、心率这些常规体征数值,直接聚焦「睡眠」「恢复」和「负荷」三大指标,用量化的分数告诉用户每一天醒来恢复程度如何,今天是否适合训练。

这种功能源自于创始人 Will Ahmed 自己大学时期作为壁球队员的经历:他发现自己很难达到训练量和恢复之间的平衡,于是开发了专注于追踪恢复、运动负荷和睡眠指标的 WHOOP。

由运动员打造的产品,自然最懂运动员,因此 WHOOP 在最初就瞄准了运动员这个非常独特的用户群体。

虽然这让他们在大众消费者之间的知名度更低,却避开了和 Fitbit 和 Apple Watch 竞争,拿下了包括美国职业棒球联盟在内很多职业运动队的独家订单。

并且,WHOOP 的专业属性很快也获得了 NBA 明星勒布朗 · 詹姆斯,和「C 罗」克里斯蒂亚诺·罗纳尔多这样的重量级用户作为「自来水」,不愁曝光和知名度。

这也是 WHOOP 的聪明之处。 不管是什么消费品,由大众产品冲击高端很难,但反过来要轻松得多了。

对于中产阶层来说,WHOOP 自带了一个「精英运动员同款」的光环,建立起「专业」的品牌形象,只差购买的契机。

2018 年开始,WHOOP 将产品从原本的 500 美元售价,转变成 6 个月起订,每个月 30 美元的订阅方式,大幅降低了准入门槛,正式向大众消费市场进军。

这个转变也彻底改写了 WHOOP 的商业模式:从一家「硬件」品牌,转变为了售卖软件的服务商。

手环是 WHOOP 商业模式的起点,却并非核心。这个手环几乎是「白送」给用户,WHOOP 在官网售卖的直接就是「订阅」,买的是一年的会员,成本直接包含在订阅费之中,免费试用一个月甚至直接送你一个手环。

当然,WHOOP 不同档位的会员,能拿到的表带配置有所不同,只是 WHOOP 不需要你为硬件付费,套餐可以随时换。

购买 Apple Watch 之后,只要硬件本身没有故障,理论上你获得了这个产品的终身使用权;至于 WHOOP,只要停止续费,那么你手上的表带就没有任何价值。

硬件形态只能吸引体验,软件体验才能真正留住人心,对于 WHOOP 来说更是如此。

WHOOP 的手机应用,把身体数据做成了一种几乎不需要学习成本的「身体仪表盘」,各种可视化图表,自己今天睡得怎么样、锻炼强度如何,身体年龄多少,一目了然。

普通人或许很难理解自己的「恢复」分数究竟算高还是低,但通过颜色区分,身体状态会变得非常直观—— 绿色意味着恢复状态良好,今天可以正常训练;红色则像是一张警告牌,提醒你身体还没缓过来,最好暂停运动。

全球疫情之后,越来越多人开始关注自己的「身体状态」,而不只是单纯记录运动数据。这个趋势,恰好撞上了 WHOOP 从「运动装备」向「生活方式品牌」的转型期。

与此同时,随着房颤、血压趋势等健康监测功能不断加入,再加上 WHOOP 4.0 在续航、体积和佩戴体验上的全面升级,以及免费试用机制降低门槛,越来越多原本并不热衷运动的普通用户,也开始接触并接受这个品牌。

从运动员的明星光环带动,到低门槛高价值的使用方式,WHOOP 也从从一款运动员工具,变成了一种新的中产社交符号,就像 Lululemon、冷水浴、燕麦奶。

你未必真的运动,但只要把 WHOOP 戴在手上,就仿佛已经进入了那个高度自律、关注健康、持续优化自己的生活方式体系——至少外人看来如此。

买 AI 硬件,就是为 AI 付费

WHOOP 这种订阅制的商业模式,对于智能手表来说很超前,但和当下热门的「AI 硬件」,又惊人地相似。

用 Plaud 举例,只要你是真正的录音笔目标用户,基本绕不开会员订阅,才能获取足够的录音转写时长,而它体验的核心,就是那个负责整理、理解和调用录音内容的 App。

以前做产品和硬件,我们会推崇「All in One」,在有限的机身中尽可能配备更多的功能。

而现在,我们看到许多真正跑通的「AI 硬件」,反而都回到了更简单的形态:功能单一、交互克制,却能够深入某个具体场景,持续收集数据,再交由后端 AI 去整理、理解,并最终生成真正有价值的结果。

WHOOP 也是如此,它的形态,真的就是将传感器绑在身上,贴近身体的同时又保证尽可能无感。

智能穿戴近年的方向,也已经不止于单纯收集数据,还要呈现简单易懂的结果。Apple Watch 的「生命体征」功能,本质上就是把体温、血氧、心率、睡眠等趋势,浓缩成「身体是否异常」的直观指标。

2022 年底,ChatGPT 掀起了生成式 AI 的浪潮,每个行业都在借助 AI 改造自己的产品和商业模式。2023 年 9 月,WHOOP 接入了 GPT-4,推出「WHOOP 教练」功能,利用大模型对用户的数据进行解读,提供更个性化的建议,属于第一批尝试将 AI 和健康相结合的厂商。

由于布局时间早,WHOOP 算得上是当今智能穿戴产品中 AI 健康功能的第一梯队。CNET 的编辑尝试过很多类似的产品,唯独觉得 WHOOP 是「好用」的:

她忘记了自己即将要来月经,而 WHOOP 教练提前两天通知她激素发生变化,因此锻炼会更吃力,建议降低强度,并在月经期间根据她的恢复情况,智能轮换调整了她的训练计划,很好帮她纠正了「练得多=更好」的心态。

@flypig 则表示:

我认为它的 AI 能力——特别是那个 LLM 问答框的体验——实属一般般。但它 AI 之外的智能建议和规划能力,我认为,很不错,够用了。我愿意每年给他们交钱。

从 WHOOP 可以看出,健康监测和 AI 属于一种「双向奔赴」。

智能穿戴设备能持续对身体的指标进行长时间监控,但累积了海量数据之后,对用户的价值却没那么大。

而想要从 AI 那里获得很好的结果,就必须要提供充足且高质量的上下文,智能穿戴设备获得的数据,刚好可以让 AI 进行和解读。

智能穿戴接下来要实现的跃迁, 不仅要替你解读数据,还要根据数据直接给你实在的建议。

这也是为什么,沉寂了好几年的 Fitbit 忽然被复活。

本来 Google 已经有了 Pixel Watch 的可穿戴产品线,不带屏幕的 Fitbit 的重点放在了 AI 健康模式上,为自家的 Gemini 找到了另一个落地的场景,不只是 Google 生态,甚至在打苹果阵营的主意。

Google Healthm

我依旧不会将 WHOOP 或者 Fitbit 称作一个「AI 硬件」, 它们更像是借助 AI 完成了一次新的叙事包装,核心依旧是健康监测那套已经被验证了十多年的逻辑,这也是它们能重新进入大众视野的原因。

当传感器本身逐渐触及技术瓶颈,智能穿戴真正重要的问题,也从「还能测到什么」,逐渐过渡到「如何理解这些数据」,WHOOP 在讲的,就是这样一个故事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

下个月的苹果 WWDC,假如 iCloud 变成 iClaw……?

作者 苏伟鸿
2026年5月11日 18:14

距离苹果全球开发者大会 WWDC 还有一个月不到的时间,彭博社又送上关于苹果新系统的全新爆料:

苹果准备对 macOS 27 的界面进行一轮小幅调整,进一步完善「液态玻璃」设计语言的视觉表现。

但问题在于,对于如今的 Mac 来说,除了需要继续打磨的 UI,最迫切的更新显然远不止于此。

液态玻璃,缝缝补补又一年

对比 iPhone 以及 iPad,Mac 的性能和续航都更有盈余,实际上 macOS 26 的界面,视觉效果要更接近去年 WWDC 上面演示的「满血版」液态玻璃。

不过,液态玻璃立项之初,就是专门为 OLED 屏幕设计的,而目前所有 Mac 产品都在使用 LCD 屏幕,在呈现半透明、阴影和玻璃质感的方面,效果不如 OLED。

于是 macOS 26 的一些高透明效果和阴影,会导致列表和文字可读性下降——这也是「液态玻璃」被一直诟病的问题。

和 iOS 27 一样,macOS 27 也将仔细打磨液态玻璃,让它更接近苹果一开始设想的效果:兼顾透明度和可读性,同时进一步优化能耗表现。

不过,macOS 26 在 UI 上的问题根本不止于液态玻璃本身,不对齐的圆角、大量分散注意力的小图标,以及重新设计后辨识度大打折扣的应用图标,对可读性和美观层面都造成了一定的影响。

图源:Daring Fireball

苹果评论员 John Gruber 对于 macOS 液态玻璃的点评相当一针见血:作为一种「内容优先」的设计语言,液态玻璃让系统 UI 隐身于媒体之后,在 iPhone 上或许能行,但作为强调生产力而非内容消费的桌面平台,Mac 包含大量的窗口、组间,因此复杂性更高,仍然需要应用界面保证清晰的结构、分明的功能区域,和强辨识度的界面。

在 Stephen Lemay 接任设计总监一职后,这位在苹果服务近 30 年的老将表现让人期待——Lemay 以公司内部的高口碑和稳定发挥著称,或许也称得上是苹果内部目前最懂苹果系统界面的人。

在他的把控下,macOS 27,以及 iOS 27 如何扭转液态玻璃褒贬不一的口碑,回到实用性和美感并举的方向,确实值得期待。

但对于 macOS 来说,界面上的「拨乱反正」固然必要,却已经不是最重要的更新了。

对苹果而言,未来系统的更新有两条主线:一方面,优化系统稳定性,另一方面,则是为 Apple 智能预备好。

最好的 AI 载体,需要一个 AIOS

根据彭博社爆料,苹果打算为「Apple 智能」打造一个「Extensions」功能,允许用户更换第三方 AI 模型,例如 Google Gemini、Claude 等等。

Siri 除了会集成到邮件、短信、相册等应用,自己也会化身聊天机器人,成为一个单独的应用。更多 AI 功能还会覆盖文本、图像等生成与编辑任务。

但这些更新,说实话更多还是做 AI 的单点功能,并非系统级别的编排能力,并未能进一步发挥 Mac 硬件上的优势。

今年年初的龙虾热,让 Mac mini 这个前年才火过的产品,又再一次出圈,这次火到苹果自己也没库存了,「入门版」在官网彻底售罄。

Mac 和 Windows 在不少层面上互有胜负,但在 AI 的问题上,Mac 作为「最佳 AI 容器」的论断几乎毫无争议。

关于这个问题,爱范儿已经出过一篇文章详细讨论。简单来说,就是因为 Mac 不管是 UNIX 系统底层还是集成运存的硬件架构,都非常契合 AI Agent 和大模型的运行方式,并且由于 ARM 架构的特性,运行功耗低还静音,非常适合 AI 常驻。

这更像是「无心插柳柳成荫」,苹果其实一开始并没有围绕 AI 去打造自己的 Mac,却无意间完成了所有 AI 的技术储备,严格意义上说是一种「适配度优势」。

从这个角度看,macOS 即使什么都不做,本身 Mac 也已经是一个很好的 AI 平台。苹果完全可以走 App Store 的逻辑,让用户自己部署想要的第三方 AI 智能体,自己继续扮演「收过路费」的角色。

这确实也是苹果长期以来的做法:在移动互联网兴起之时,苹果没必要自己做搜索引擎和网购平台。而 AI 时代,大众的需求变化万千,有人需要一个能剪辑的 Agent,也有人需要一个搞科研的 AI,必须要靠第三方满足。

在今年 5 月的财报会议上,苹果特别提到了 AI 公司 Perplexity 的智能体产品 Personal Computer,认为这种产品很好利用了 Mac 平台的能力。

既然觉得人家做得不错,何不自己上手做一个「iClaw」?

第三方 AI 百花齐放固然很好,这和苹果自己做一个却并不冲突,并且很多事情,只有第一方能做得好,能做得让人放心。

第三方应用再强,也很难自然获得系统级的上下文,苹果不可能将最底层的权限开放,只有系统底层自己能对文件位置、窗口状态、本地个人数据知道一清二楚,而 AI 应用的体验,往往就卡在了这些权限边界之上。

其实苹果并不是没有这种想法,那个迟迟没能推出的 AI Siri,其实就有着类似的构想,可以读取用户的文本和应用窗口,可以跨应用进行检索和处理。

对比 iPhone 和智能手机,AI 应用的主流使用场景其实还是在于桌面端,这也是为什么 Mac 能成为今年最热门的 AI 硬件,但苹果却没有继续在 macOS 的系统层面,赋予 Mac 足够分量的原生 AI 能力。

隔壁的 Windows 阵营在这方面要激进不少,系统层面有「Recall」和 「Copilot」这样的 AI 功能入口,联想和荣耀这样的 OEM 厂商,甚至为产品准备了开箱即用的龙虾应用,砍掉了门槛,并因为和本地深度集成,能节省不少 Token。

微软自己也已经坐不住了,据悉正在将原本只能你问我答的 Copilot,改造成一个 24/7 在线的数字分身,实现类龙虾能力。

对比 OpenAI、Anthropic 或者 Google,说实话我更愿意将这些敏感的数据,交给在隐私保护方面更上心的苹果。

更深一步,macOS 最缺少的不是 AI 应用,而是 AI 时代的「基建」。Mac 已经准备好了 AI 大有可为的土壤,但 macOS 还没能成为一个真正意义上的「AI 系统」。

苹果不仅可以做自己的 AI 智能体能力,也需要把模型、权限、上下文、自动化和跨应用任务重新梳理,让系统成为 AI 工作流的原生中介,成为一个掌控所有 AI 的「任务集散中心」。

就像是智能体运行所需要的「个人知识库」,现在我们用文件夹也可以搭建,但它还不够好用。

苹果完全可以自己承接这个环节,用户靠 Mac 自带的工具搭建、生成一个「知识库」文件,它可以和 Apple ID 绑定,利用 iCloud 流转,这样不管用哪一家的智能体服务,都能快速调用自己的知识库,不用从头开始配置,同时还能保证自己的内容被苹果的隐私政策保护。

并且,这些配置的模块都能整合进入 Apple 的订阅系统之中,iClaw 和 Token 也能成为苹果在 AI 时代提供的增值服务。

iClaw 示意图,AI 生成

实际上,苹果已经开始了这样的进程。在 macOS 26.1 中,苹果集成了「模型上下文协议」,一个面向不同 AI 的通用开放标准,Agent 可以通过这个协议,访问用户的个人数据;苹果的基础模型框架,让 macOS 开发者可以调用系统内置的基础模型,零网络延迟,零 API 费用,数据不离开设备。

作为计算机图形系统的祖师爷,macOS 在过去的数十年间都是围绕「应用」构建的桌面系统。

在接下来十年,应用和图形界面还会是人机交互的主流,因此 macOS 27 要将界面风格修缮得更好,当然非常重要。

但未来五十年甚至更远,AI 都会成为无可避免的主旋律,macOS 不可避免会被进一步改造,成为一个围绕「任务」运转的 AIOS。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

iOS 27 发力 AI 修图,苹果也开始 AI 焦虑了

作者 苏伟鸿
2026年4月29日 18:30


今年的 iOS 27,将会 AI 味浓浓。

彭博社报道,苹果准备在今年的 WWDC 开发者大会上推出一套全新的 AI 修图工具,将会集成在 iPhone、iPad 和 Mac 的照片应用中。

沉寂了一年的 Apple 智能,将随着 iOS 27 的推出,再次回到聚光灯下。

两年前,苹果还公开表示不做 AI 修图功能,在竞争对手的步步紧逼之下,终于还是忍不住跟进了。

iOS 27:AI 无处不在

在 iOS 18 推出的 Apple Intelligence 工具集,苹果就已经允许用户利用 AI 简单消除照片中的物体,属于当下智能手机的标配功能。

苹果的对手已经走得更远。像是把「AI 修图」作为标志性功能的 Google,已经实现给人物更换完美表情、把人物加入合照,甚至重构整个画面背景的能力,整个 Android 阵营都在发力类似的功能。

图源:WIRED

在 iOS/iPadOS/macOS 27 中,苹果将在「照片」App 的编辑界面中,增加一个全新的「Apple Intelligence Tools」(Apple 智能工具集)模块,包含以下三个功能:

  • Extend(扩展),就是 AI 扩图的功能,允许用户在原始画面之外额外生成图像内容,比如拍摄一张旅游景点的地标图,然后用这个工具来填充周围的景色,用户可以自行控制扩图的范围和位置。
  • Enhance(增强),利用 AI 自动修图,有点像不能自定义的「豆包修图」。
  • Reframe(重构),主要运用于苹果的空间照片,允许用户在拍摄后改变视角,比如一张汽车照片可以从正面视角调整为侧面视角。这个功能将充分利用空间照片来自多个摄像头的结构数据。

不过,根据内部测试的员工透露,这些功能的开发并不算顺利,效果更复杂的「重构」和「扩展」不稳定,苹果很可能会推迟或砍掉这些功能的发布。

包括这个新的 AI 修图功能在内,iOS 27 系统的更新将会沿着「优化」和「AI」两个主旋律进行。

此前爱范儿已经多次报道,由于 iOS 26 引入了「液态玻璃」的全新设计语言,系统稳定性有明显下降,因此 iOS 27 将会聚焦在系统稳定性优化上,不仅要修复目前 iOS 26 的大量 Bug,还会提升设备的续航和性能表现,并持续修改液态玻璃的视觉效果。

其余的功能更新,则会集中在「AI」上。首先,苹果正在努力将 2 年前画饼的 AI Siri 正式实装 iOS 27,这也是 Apple 智能体验和未来苹果 AI 硬件战略的核心体验部分。

虽然已经「潜心打磨」两年,今年年初有内部人员向彭博社透露,AI Siri 的一些杀手级功能,例如语音控制 Siri 操作应用,测试结果并不理想。

这意味着,即使我们能在 iOS 27 见到 AI Siri 庐山真面目,它也大概率会是一个「技术预览版」,并且需要等待后续更新补充完整功能。

旧饼还没兑现,iOS 27 选择继续加码 AI 新功能。

苹果打算进一步将 Siri 改造为类似 ChatGPT 和 Google Gemini 那样的聊天机器人,届时 Siri 会有一个独立应用,用来对话和存储聊天记录。

苹果还计划在邮件、日历和 Safari 浏览器等第一方应用中,引入新的 Siri 引擎,实现更强的搜索和数据管理能力。

除此之外,苹果正在酝酿一个 AI 搜索引擎, 允许用户从网络搜索信息,生成综合的报告和信息列表,以及网页链接,作为 Safari 和 Spotlight 网络搜索。

在健康领域,苹果将结合 AI 推出「Health+」的订阅服务,利用 AI 智能体,对用户的身体数据进行个性化分析,并针对性推送真人医生录制的建议。

比起两年前那场 WWDC,iOS 27 这一大批 AI 功能,比目前的 Apple 智能还要更丰富不少。

FOBO 的风,还是吹到了库比提诺

2025 年 1 月, 苹果的软件主管 Craig Federighi 和营销高级副总裁 Greg Joswiak 接受了《华尔街日报》的专访,谈到了对 AI 的看法。

其中 Federighi 特别提到了「AI 修图」,解释为什么苹果只推出「消除」,而不是如同三星和 Google 一样做大量的功能:

对我们来说,重要的是帮助人们传播准确的信息,而不是虚构的「幻想」。

Google Pixel 的表情修正功能,图源:The Washington Post

苹果公司内部曾经针对「AI 修图」的尺度进行了长时间讨论,考虑到用户的高需求,苹果公司愿意迈出「小小的一步」,于是在 iOS 18 之中推出了「AI 消除」的功能。

而像是「图乐园」这种 AI 生图功能,苹果也做出了严格的限制,只能用于创作卡通图案,避免生成逼真的图像造成误导。

某种程度上,苹果的坚持已经开始松动,iOS 27 这个全新的「AI 扩图」功能,让 Apple 智能进一步介入照片的真实性。

回望两年前的那场 WWDC,Apple 智能以一个非常温和的形象问世,没有想象中的 Apple-GPT,苹果的很多尝试都显得谨小慎微,不具备改天换地的野心。

但 AI 产品的代际变化速度极快。别说两年前,两个月前都没人觉得 ChatGPT 是一个好用的文生图机器人,现在打开社交媒体 GPT Image 2 的作品已经铺天盖地。

两年没动弹过的 Apple 智能,自然「遥遥落后」。

作为终端厂商的苹果,原本拥有一个得天独厚的优势,能够一夜让自己的 AI 产品面向全球十亿用户推出。

只是,对于用户来说,Apple 智能不仅不算好用,更致命的是,它提供的价值,和用户的需求,有很大程度的错位,导致用户并不想用。

FOBO(Fear Of Becoming Obsolete,害怕被淘汰)的阴影,终究还是笼罩了苹果。

过去, 苹果可以决定什么功能值得出现;如今,它也必须回应用户已经习惯拥有什么,行业在发力什么。iOS 27 上这些曾被苹果否决的 AI 功能,本质上都是一次迟到的补课。

Siri 版 GPT 要做,AI 搜索引擎要做,系统应用也全部 AI 化,现在苹果也盯上了 AI 照片编辑,一个其他手机品牌很喜欢演示的功能。

苹果能不能把这些功能做好,又是另一个问题。

即使已经发布 2 年,Apple 智能的照片「消除」效果依旧不如人意,横向对比 Android 阵营显得更显落后,经常会出现消除不彻底、扭曲图像的问题。

全新「扩展」和「重构」功能则更复杂,内部已经反馈稳定性不佳——其实,我相信对于更多用户来说,会更希望苹果能把更实用的「消除」功能进一步完善好。

并且,AI 修图一直以来都争议缠身,特别是前两年的 Google Pixel,可以在一张真实照片上加入任何元素,实现以假乱真的效果,就引发了国外媒体对于「真实」和「伪造」的大讨论。

左图为实拍,右图经过 Pixel Magic Editor 编辑,图源:The Verge

苹果会尽量规避这种风险,目前看来,这些新功能的自由度相当有限,用户不能自定义修改的方向和指令。

面对行业趋势和用户需求,苹果也不得不松动和更改曾经的价值取向,现在的他们,其实还不知道自己要做什么样的 AI。

但这不仅是苹果的困惑,其实也是笼罩整个行业的迷思,最富含 AI 的 Google Pixel,也并非是我们期待的那台 AI 手机。

既然暂时难以重新扮演行业的引领者,那么在 AI 这场竞赛中持续调整步伐的苹果,至少还能先通过跟随,确保自己依然留在牌桌之上。

但我仍然期待,今年的六月,苹果能为我们带来惊喜。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

首发实测|期待已久的HappyHorse 1.0,在千问能免费体验了

作者 张子豪
2026年4月27日 19:23

那个一度在 Artifical Analysis 的 AI 视频竞技场排行榜中登顶第一的视频生成模型 HappyHorse 1.0,我们终于能用官方版了,现在打开千问 APP 和千问创作Web端( c.qianwen.com ),直接就能用,甚至还有免费体验额度。

前段时间,一款名为 HappyHorse 1.0 的视频生成模型,悄然登顶权威 AI 评测平台 Artifical Analysis 的 AI 视频竞技场排行榜,引发社交媒体的纷纷议论。直到阿里正式认领 HappyHorse,谜团揭开,这匹快乐小马出自自家新成立不到一个月的 ATH 事业群。

今天,阿里公布了 HappyHorse 1.0 的体验渠道,千问官方首发灰测,千问 APP 和千问创作Web端都能直接使用。

移动端(千问 APP),我们只需将千问更新到最新版本,通过点击首页的「HappyHorse」胶囊,即可直接进入 HappyHorse 1.0 的生视频创作面板,并且千问还赠送了免费体验额度。

PC 网页版(千问创作 Web 端),针对有更专业创作需求的用户,可以通过浏览器打开 c.qianwen.com 登录使用。网页端每次生成消耗积分,综合对比下来,还是比较具有性价比的。

无论是文生视频还是图生视频,均支持最高 1080p 的视频分辨率。我们可以自由选择 16:9、9:16 或是 1:1 的视频宽高比,生成时长可选 5 秒、10 秒或15 秒,并且支持原生生成音频。

APPSO 第一时间拿到了体验资格,评测榜单的排名能说明结果,但是 HappyHorse 1.0 生成的视频,到底有什么优点,一起来看看我们的实测。

通过实测,能看到其实 HappyHorse 1.0 并没有在复杂的全能参考选项上做文章,而是将核心发力点放在了动作、声音、空间的自然度上,加上合理的镜头语言,和风格的准确还原,整体表现确实惊艳。

用一句指令,直接搞定运镜和故事板

大部分的主流视频模型,都会把镜头运动当做一个库,给用户来调用。所谓的镜头运动,更像是从这些库里,推进、拉远、旋转,随机挑一个运镜方式,并没有配合画面里正在发生的事情。

而镜头感作为视频最重要的一部分,往往一眼就能感受到明显的差距,但它本身又很难用具体数值来量化。

HappyHorse 1.0 的处理方式也表现得可圈可点,切换镜头的时机必须是服务于作品。情绪需要收紧的地方,镜头近一点;需要交代环境的地方,给我们全景;背后是一套有叙事逻辑的调度。

同样一个提示词,丢给多个模型生成的视频画面,可能都会偏向「固定机位」,人物站在中间,缺乏镜头调度。因为这样最不容易出错,但是给视频的观感又大打折扣。

HappyHorse 1.0 在生成的视频里,则是像一个懂行的摄影指导,各种大师级运镜,从全景到近距离跟拍马蹄的扬尘,再流畅切换到低角度仰拍拔枪的瞬间。

它打破了传统的 AI 视频生成模型「为了稳妥而选择平庸」的安全构图,用大量扎实的镜头调度,把这段追逐戏的动态张力,原原本本地拍了出来。

情绪和动作都有了层次感,微表情也能演戏

对于很多视频模型,人物动作是最难解决的问题。即便使用详细的参考生成,到了后半段还是容易出现变形,比如手指多一根、脸部模糊或者动作节奏突变。

但 HappyHorse 1.0 在这个硬指标上表现非常稳定,一段 5 秒的视频,人物动作从头到尾基本保持连贯,穿帮的频率明显更低。

举个具体的例子,我们用的提示词是一个穿着白色裙子的女生走在花海里,从画面的左边走到右边,镜头跟随,女生转动裙子,捧起一朵花闻。

HappyHorse 1.0 给的动作过渡非常自然,女孩在花丛中走路完全没有那些「太空步」的滑移,从她转动裙摆,到捧起花朵凑近鼻子,整个动作流程行云流水。

动作有层次感,人物的表情同样真实。我们生成了一个小朋友咬下酸柠檬的视频,从咬下柠檬的瞬间,到强烈的酸味,开始带来面部肌肉紧绷、五官皱起、紧闭双眼,再到酸劲儿逐渐过去,面部肌肉慢慢放松,最后茫然地重新睁大眼睛。

通过动作和表情,让人物的情绪更有层次感,HappyHorse 1.0 生成视频也更不容易让人出戏。

官方数据显示,HappyHorse 1.0 的内部 GSB(Good-Significant-Bad 人类偏好评分)是 Wan2.7 的 3 倍,动作流畅性和清晰度都进步明显。

对话听起来更像真人,环境音也开始参与叙事

除了画面表现,HappyHorse 在 AI 视频配音上的表现也比其他模型更出色。

大部分的 AI 视频配音,都有一个很难绕开的问题:听上去像在「念」,不像在「说」。

语气是平的,语调不跟着情绪走,两个人对话的时候,一方说话,另一方就在那里等着,没有反应,没有表情变化,像两个人在分别完成自己的任务。

HappyHorse 1.0 在这里的处理,是对白真的有情境感。语气和语调贴着画面里的情绪,惊讶的时候语调是对的,轻松的时候节奏是松的。多人对话的场景里,听的那一方也是自然,会有表情,有细微的肌肉反应,不是在发呆等下一句。

环境音也是一样的逻辑。书写声、翻页声、远处的背景音,这些细节在大多数视频模型里是缺席的,或者听上去是从音效库里随机抓来的。

HappyHorse 1.0 里,这些声音跟画面里正在发生的事情是对得上的,而且能参与情绪。在安静的场景里,出现一点纸张摩擦声,或许比大多数配乐都更容易让人有沉浸感。

还有一个比较小众但实用的能力:多语言的唇形同步,覆盖了普通话、粤语、英语、日语、韩语、德语、法语等语言。

输入中文文本生成人物说话的视频,嘴型就能跟上语音。这个能力的想象空间相当大,从短视频配音到虚拟主播,未来都会用得上。

不需要复杂的风格提示词,轻松拿捏经典影视剧风格

如果说前面关于镜头、动作和声音几点解决的是 AI 视频的硬件问题,即 AI 视频不能让人出戏;风格的还原,则是让最后的画面更有戏。它会开始用色彩、光影和质感,去建立属于创作者的美学氛围。

风格的添加也很讲究,不是套一层滤镜,或者一个打包好的 LUT 包,它也需要视频模型对不同美学风格的了解,以应用合适的风格化。

HappyHorse 1.0 在特定风格的还原上,细节非常扎实。各类经典影视剧的风格、老港片里胶片的颗粒感和偏冷的高光,我们在实测的生成结果里面都能看到。

无论是老水浒/三国画风那种粗粝写实的历史厚重感、光影迷离的经典港风,还是强调高反差冷峻光影的美剧质感、主打细腻柔光的韩剧氛围,它都能精准拿捏。

如果你是个对画面质感有追求的创作者,非常推荐去千问里亲自感受一下这种「导演级」的美学控制力。

AI 视频赛道需要一匹黑马

告别了动辄半天的视频生成排队,一个 Video Arena 榜单第一的模型,现在不仅直接放到了手机 App 里随手可用,还给了免费体验额度,千问这波实在是给力。

回头看 HappyHorse 1.0的这几个特点,动作不穿帮、镜头有语言感,解决了 AI 内容质量的可预期性,让我们不用再抱着「抽卡」的心态,去体验 AI 视频生成。

对白自然、真实的环境音、还有精准的风格化还原,更是让我们和创作者少了大量的后期修补成本,不需要在多个工具之间来回倒腾。

如果把这种极低门槛、高容错率的生成能力放到具体的商业语境中,价值是显而易见的。

对于新媒体运营、短剧导演或是电商营销团队而言,过去需要庞大后期团队和高昂拍摄预算才能完成的分镜预演、概念设计或视觉短片,现在只需在手机或电脑上输入指令就能快速落地。在千问里,一个人就是一支高效的视听制作团队。

▲现在我们在千问里,就能得到一段真实的虚拟主播视频

过去一段时间,视频生成赛道的竞争逻辑是「谁的模型更强」——更高的分辨率、更长的时长、更复杂的物理模拟。

拼的是参数和算法的技术竞赛,但我们真正卡住的地方很少是因为「模型做不到」,大多数时候是「做到了但用不起或用不到」,等待时间太长、声画要分开处理、动作稳不稳全靠运气,每一个环节的摩擦都在把视频生成挡在专业用户和 AI 超级创作者之外。

而这一次,千问不仅省去了我们在不同工具之间切换的折腾,把最顶级的视频生成能力直接放到了最熟悉的对话框里,更借助底层模型的实力,把这些创作摩擦一个个彻底抹平了。

千问现在是工作、学习、生活和创作中全能 AI 助手

HappyHorse 无疑是一匹强劲的黑马,他是阿里新成立的 ATH 事业群,在模型能力、平台分发、具体应用这条完整链条上的一块关键拼图;在千问首发灰测后,链条开始跑起来了。

从帮助用户解决日常问题、提升工作学习效率的文本对话,到如今整合了极高水准的 AI 生图与视频能力,千问的进化路径已经非常清晰:它正在打破「生活提效」与「专业创作」的壁垒。

通过一次次的功能迭代,千问正将顶级的算力平民化,真正从一个简单的问答工具,蜕变为一个覆盖用户全场景的「全能型 AI 助手」。

作为普通人,我们或许不需要关心背后复杂的算法架构,因为最好的技术,已经通过千问以最顺滑的方式装进了你的手机里。

现在,轮到大家上场了。

如果你也想体验 HappyHorse 1.0 强大的视频生成能力,千问还同步开启了「天马行空」挑战赛。一共四大 AIGC 视频赛道,20 万现金奖池等大家来拿。

直接前往千问 App 或千问创作 Web 端,用灵感在这个没有门槛的新画布上,真正「天马行空」一次。

*文章内视频播放可点击该链接预览*

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌