普通视图

发现新文章，点击刷新页面。

今天 — 2026年2月6日首页

爱范儿
刚刚，ChatGPT 和 Claude 同时大更新，不会给 AI 当老板的打工人要被淘汰莫崇宇
2026年2月6日 06:26

刚刚，ChatGPT 和 Claude 同时大更新，不会给 AI 当老板的打工人要被淘汰

爱范儿

作者莫崇宇

2026年2月6日 06:26

就在刚刚，硅谷 AI 圈上演了一出「火星撞地球」。

OpenAI 和 Anthropic 像约好了一样，同时甩出了自家的重磅更新：Claude Opus 4.6 和 GPT-5.3-Codex。

如果说昨晚之前，我们还在讨论「怎么写好 Prompt 辅助工作」；那么今天凌晨，我们可能被迫要学会「如何作为老板去管理 AI 员工」。

AI 造 AI，顺便接管你的电脑

就在昨天，Sam Altman 刚在 X 平台上凡尔赛了一把 Codex 的「百万活跃用户」里程碑。短短一天后，OpenAI 再次乘胜追击，扔出王炸——GPT-5.3-Codex。

技术文档里藏着一句极具分量的话：「这是我们第一个在创造自己的过程中，发挥了关键作用的模型。」

说人话就是：AI 已经学会了自己写代码、自己找 Bug，甚至开始自己训练下一代的 AI 了。这种自我进化能力，也直接体现在了一连串跑分数据上。

还记得那个模拟人类操作电脑的 OSWorld-Verified 基准测试吗？前代模型只有 38.2% 的准确率，连及格线都够不上。

但这次，GPT-5.3-Codex 直接跳涨到了 64.7%！

要知道，人类的平均水平也就 72%。这意味着，AI 距离像你一样熟练地甩鼠标、切屏、操作软件，只剩下一层窗户纸的距离。

而在 Terminal-Bench 2.0（命令行操作）中，它更是拿下了 77.3% 的高分，把 GPT-5.2（62.2%）远远甩在身后。

知名 SWE-Bench Pro 基准测试覆盖四种编程语言，不仅抗污染，还全是真实世界的硬核工程难题。

GPT-5.3-Codex 在这里不仅拿下了 SOTA（最高水平），而且用的 Token 比以往任何模型都少。这意味着什么？意味着它不仅干活猛，解决问题的路径还比人类更短、更省钱。

OpenAI 甚至展示了它独立构建的能力：

在几天内，它从零构建了一款包含多张地图的赛车游戏 v2，顺手还搞定了一款管理氧气系统的深海潜水游戏。

最让我印象深刻的是 GPT-5.3-Codex 对模糊意图的理解。

在构建「Quiet KPI」落地页时，它自动把「年度计划」换算成了「打折后的月付价格」，甚至还贴心地自动补充了用户评价轮播——这一切，都不需要你下指令。

OpenAI 的野心已经写在脸上了：以前微软常说 AI 将会成为人类的副驾驶（Copilot），但现在 AI 更想做那个能掌控方向盘、甚至能自己修车的司机。

对了，还有一个有趣的细节。

此前外界盛传 OpenAI 对英伟达的 AI 芯片颇有微词，但这次官方博客特地强调：GPT-5.3-Codex 的设计、训练和部署都在 NVIDIA GB200 NVL72 系统上完成。

这一波高情商的「感谢英伟达」，属实是给足了黄仁勋面子。

告别「金鱼记忆」Claude 迎来绝地反击

在 GPT-5.3-Codex 发布的前后脚，Anthropic 也端出了自己的春节大礼包。

坏消息是，大家期待的 Claude「中杯」Sonnet 模型没有更新；但好消息是，Anthropic 直接端出了「超大杯」—— Claude Opus 4.6。

相比于 OpenAI 在「行动力」上的激进，Anthropic 今天发布的 Claude Opus 4.6 则是在「思考力」和「可用性」上死磕。

很多企业用户都有一个名为 Context Rot（上下文腐蚀）的痛点：号称支持 200k 上下文，但塞进去的数据一多，AI 就开始顾头不顾尾。

这次，Claude Opus 4.6 拿出的数据简直是「降维打击」。

在 MRCR v2（长文本大海捞针）测试中，Claude Opus 4.6 的召回率高达 76%。

作为对比，上一代 Sonnet 4.5 只有惨不忍睹的 18.5%。从某种程度上说，这是一个从基本不可用到「高可靠」的质变。

这是 Claude Opus 4.6 首次引入了真正可用的 1M 上下文窗口。

这意味着什么？意味着你可以把几百页的财报、几十万字的代码库直接扔给它，它不仅能读完，还能精准地告诉你第 342 页脚注里的那个数字有问题。

更让打工人眼前一亮的是它的生产力功能。

一方面，Anthropic 这回直接把 Claude 塞进了 Excel 和 PowerPoint。它能根据 Excel 数据直接生成 PPT，不仅保留排版风格，连字体和模板都能对齐。在 Claude Cowork 协作环境中，它甚至能进行自主多任务处理。

另一方面，Anthropic 顺势在 Claude Code 中推出了实验性的 Agent Teams 功能，让普通开发者也能体验这种「指挥千军万马」的感觉：

角色分工：你可以指定一个 Claude Session 担任 Team Lead（组长），它不干脏活累活，专门负责拆解任务、分配工单、合并代码；其他的 Session 则是队友（Teammates），各自领任务去干。
独立作战：每个队友都有独立的上下文窗口（不用担心 Token 爆炸），它们甚至能背着你互相发消息（Inter-agent messaging），讨论技术细节，最后只把结果汇报给组长。
并行赛马：这东西有什么用？想象一下查一个顽固 Bug，你可以生成 5 个 Agent，分别验证 5 种不同的假设，像「赛马」一样并行排雷；或者在 Code Review 时，让一个队友扮「安全专家」查漏洞，一个扮「架构师」看性能，互不干扰。

为了展示 Opus 4.6 的极限，Anthropic 的研究员 Nicholas Carlini 搞了个疯狂的实验：Agent Teams（智能体团队）。

他没有亲自写代码，而是扔了 2 万美元的 API 额度，让 16 个 Claude Opus 4.6 组成一个「全自动软件开发团队」。

结果在短短两周内，这群 AI 自主进行了 2000 多个编程会话，从零手写了一个 10 万行代码的 C 语言编译器（基于 Rust）。

这个 AI 写的编译器，还成功编译了 Linux 6.9 内核（涵盖 x86、ARM 和 RISC-V 架构），甚至跑通了 Doom 游戏。

虽然它还不够完美（比如生成的代码效率不如 GCC），但这个案例也表明我们不再是和 AI 一起编程，而是看着一个 AI 团队自主协作、查错、推进项目。

此外，它还学会了 Adaptive Thinking（自适应推理），能根据难度自己决定「想多久」。加上新增的「智能强度」控制，你可以在 Low 到 Max 四档之间切换。

定价方面，Anthropic 这次很良心，维持在每百万 Token $5/$25 的基础定价。看来是为了抢占企业级市场，铁了心要和 OpenAI 卷到底。

一个是激进天才，一个是靠谱老牛

知名 AI 评测人 Dan Shipper 在第一时间搞了个「盲测」（Vibe Check），他的评价非常精准：

Claude Opus 4.6 是「高上限，高方差」（High Ceiling, High Variance）。

它像是一个才华横溢但偶尔跳脱的天才。在测试中，它直接解决了一个让 iOS 团队卡了两个月的功能难题；在 LFG Benchmark 中拿到了 9.25/10 的高分。

但它偶尔也会「过度自信」，一本正经地胡说八道。如果你需要突破性的灵感，选它。

GPT-5.3-Codex 是「高可靠，低方差」（High Reliability, Low Variance）。

它像是一个经验丰富、绝不掉链子的资深工程师。推理速度提升 25%，几乎不犯低级错误，稳健得让人心安。

虽然在创造性任务上略逊一筹（LFG 得分 7.5/10），但在日常的 Coding 和运维任务中，它是最高效的老黄牛。如果你需要稳定交付，选它。

时间步入 2026 年，我们的角色开始发生变化。

在这个时间节点，对于普通用户而言，最大的变化莫过于此：Prompt Engineering（提示词工程）的重要性正在下降，而 Agent Management（智能体管理）的能力开始浮出水面。

当 ChatGPT 可以自主修 Bug 甚至操作你的终端，当 Claude 可以一次性吞吐 100 万字并精准定位细节时，我们不再需要像教小学生一样，把指令拆解得碎碎念。

我们需要做的，是学会如何以「管理者」的身份，去定义目标、审核结果、以及——决定在什么时候，把什么任务交给哪位「员工」。

这就是 2026 年的新职场：你的团队里混入了一群硅基天才，而你是唯一的碳基老板。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博

昨天 — 2026年2月5日首页

爱范儿
两周搓出的 Claude Cowork，让硅谷一夜蒸发 2 万亿，AI 真要杀死软件？莫崇宇
2026年2月5日 15:52

两周搓出的 Claude Cowork，让硅谷一夜蒸发 2 万亿，AI 真要杀死软件？

爱范儿

作者莫崇宇

2026年2月5日 15:52

本周，硅谷上演最惊悚的剧情。

全球资本市场对软件板块进行了无差别的抛售。Salesforce、Workday、Intuit……这些过去十年美股最坚挺的收租公，在短短一天内市值蒸发近 2580 亿美元（折合人民币 19785.13 亿元）。

抛售潮来得异常凶猛。美股软件股 2 月 3 日率先跳水，标普北美软件指数连续三周收跌，1 月累计跌幅达 15%，创下 2008 年以来最差单月表现。紧接着，恐慌蔓延至亚太市场，多家行业龙头股价暴跌。

没有宏观经济崩盘，没有黑天鹅事件。引发这场震荡的导火索，仅仅是因为一家 AI 公司 Anthropic，给它的 AI 装上了「手脚」。

华尔街用脚投票，给出了一个极度残酷的预判：在 AI 真正动手抢人类饭碗之前，传统的软件行业可能要先经历一次彻底的洗牌。

当 AI 只有一层窗户纸

引发海啸的那只蝴蝶，叫 Claude Cowork。

这是 Anthropic 在 2026 年开年甩出的王炸，一个桌面智能体应用。简单说，它不再是一个只会在对话框里陪你聊天的「大脑」，它开始具备了点击鼠标、管理文件、操作软件的「手脚」。

上周，Anthropic 发布了 11 款针对特定岗位的插件，覆盖法律、销售、财务、市场营销等核心业务领域。尤其是它推出的「法律插件」，表现得太像一个熟练的高知白领了。

通过连接 Slack 等企业工具，Claude Cowork 甚至能够自主完成「研究-起草-审核-归档」的全流程，而无需人类在不同软件间切换。

但所谓的法律插件，本质上只是一套提示词和配置设定。而这才是让投资者彻夜难眠的地方。

过去，像汤森路透（Thomson Reuters）这样的公司，靠着昂贵的法律数据库和所谓的专业软件壁垒赚得盆满钵满。他们的核心产品 CoCounsel，甚至底层就是跑在 OpenAI 之上的。

那时候大家相安无事，是因为 Claude 和 ChatGPT 只是一个 API，通过接口卖算力。汤森路透在上面盖楼，通过封装好的产品卖给用户。

但在 Claude Cowork 发布后，逻辑变了。

分析师们一针见血地指出：Anthropic 的野心早已不止于「卖模型」，而是要直接「掌控工作流」。

当房东开始直接卖精装修公寓时，原来的包工头就没饭吃了。Anthropic 直接发布了现成的垂直行业解决方案，平台本身就瞬间变成了软件公司的竞争对手。

Anthropic 首席执行官 Dario Amodei 更是直言不讳地警告：「未来 1 到 5 年内，50% 的入门级白领工作岗位可能会受到冲击。」
从法律到金融再到咨询，那些我们以为只有人能做的知识型工作，AI 都在陆续接手。而那些为这些工作提供软件工具的公司，正站在悬崖边上。

难以自证的「AI 冲击波」

眼下，软件供应商陷入了一个极其艰难的处境。它们必须证明自己不会受到 AI 的冲击。如果能展示营收增速回升，或许还能缓解市场对 AI 冲击的担忧。

但在当下的经济环境里，这几乎是一个不可能完成的任务。

就在上周，美国联合包裹运送服务公司 UPS 宣布计划今年再裁约 3 万人，同日，社交媒体公司 Pinterest 也宣布将裁员近 15%，短短几天后，亚马逊也再砍 1.6 万个工作岗位。

大厂都在勒紧裤腰带过日子。在企业开支收紧、裁员潮蔓延的背景下，CFO 们审批软件采购预算时也比以往任何时候都苛刻。

毕竟，既然 AI Agent 能以极低的成本完成工作，为什么还要花大价钱去买 SaaS 软件？这也就引出了一个令所有 SaaS 厂商窒息的趋势，软件的「降级」。

在一片哀嚎声中，那个卖铲子的男人站了出来。

英伟达 CEO 黄仁勋出席由思科系统公司主办的 AI 会议时，直接回怼了这种市场情绪：「有一种观点认为软件行业正在衰落，并将被 AI 取代。这是世界上最不合逻辑的说法，时间会证明一切。」

他的逻辑是：无论是人类还是 AI 智能体，执行任务最高效的方式是使用现有的工具，而不是重新发明工具。AI 将成为软件的「超级用户」。

老黄的话有道理。AI 不会凭空变出记录的合规性，企业依然需要记录系统来存储数据、管理权限、应对审计。代码不会消失，数据库不会消失。但他同时只说对了一半。

我们要厘清一个概念：AI 取代的不是软件背后的代码或逻辑，它取代的是「人类操作软件」这一中间环节，以及为了人类设计的「图形界面（GUI）」。

回想一下，过去你是怎么用 Photoshop 的？

你需要学习什么是图层、什么是蒙版、什么是通道，你需要记住几十个快捷键。Adobe 的护城河，很大程度上建立在你学会使用它所花费的时间成本上。

但现在呢？你对 AI 随口说出一句，「把背景换成赛博朋克风格」。在这个过程中，Photoshop 复杂的界面、密密麻麻的按钮、层层叠叠的菜单，统统变得毫无意义。

未来，Photoshop 可能只会变成 AI 调用的一个后台插件（甚至已经是了）。当软件从前台退守到后台，它的品牌溢价、它的用户粘性，甚至它的估值逻辑，都要大打折扣。

与之形成鲜明对比的是，OpenAI CEO Sam Altman 却认为 10 亿日活用户比最先进的模型更具价值。

殊不知当 OpenAI 还在试图通过堆砌产品功能、把自己变成一家更像样的 SaaS 公司时，Anthropic 却通过 Claude Cowork 证明了另一件事：最好的 AI 产品，不是为了成为下一个 SaaS 巨头，而是为了终结现在的 SaaS 模式。

AI 正在吞噬世界

多年前，马克·安德森曾经预言：「软件正在吞噬世界。」

现在，轮到 AI 开始吞噬软件了。这是一次残酷的「物种筛选」。在 AI 的冲击下，软件行业正在分裂成两个物种。

第一种是「工具型」，它们注定会被淘汰。

那些功能单一、逻辑简单、纯粹靠堆砌按钮的软件。比如简单的 PDF 编辑器、初级报税软件、格式转换工具。它们在 AI Agent 面前没有任何还手之力，因为 AI 可以直接完成结果，用户不再需要中间的工具箱。

第二种是「系统型」，它们会活下来，但必须换个活法。

比如微软的 Office 体系，或者深度的 CRM（客户关系管理）系统。它们背后不仅仅是文档，而是企业的组织架构、合规流程和历史数据。

AI 可以帮你写文档，但 AI 很难凭空构建一套符合审计要求的企业合规系统。

此外，未来的软件公司，必须学会不再按「人头」收费，因为用软件的可能根本不是人。AI 智能体的崛起不仅仅是技术升级，它正在从根本上瓦解 SaaS 行业过去二十年赖以生存的商业模式——

按使用人数收费的软件订阅模式（Per-Seat Subscription）。

传统模式下，软件公司的收入与客户的员工数量正相关。你雇的人越多，购买的账号就越多，软件公司赚得越多。但 AI Agent 的核心价值是自动化，是减少完成任务所需的人力。

如果 Salesforce 真的推出了一个完美的 AI 销售代理，能顶替 5 个销售员，那么客户要做的第一件事，就是取消这 5 个人的软件订阅账号。

简言之，软件公司自动化程度越高，它的收入反而越低。这是一个死亡螺旋。

为了不被 AI 淘汰，SaaS 厂商必须在一个新的坐标系里寻找活路。既然人头注定会越来越少，那么收费的锚点，就必须从人转移到事上。

据知名分析机构 Gartner 的预测，到 2026 年底，40% 的企业级 SaaS 将包含基于结果的定价要素。这是一个巨大的思维转变。软件公司将不再参考 IT 工具定价，而是参考人类员工的薪资定价。

对于打工人而言，正如国际象棋大师 Garry Kasparov 在 1997 年提出人类与 AI 明确分工协作的半人马模式——未来人类只会负责战略决策，AI 负责计算/数据处理，各司其职。

过去二十年，我们简历上最显眼的位置，往往写着「精通 Office」、「熟练使用 Photoshop」、「擅长 SPSS 数据分析」。我们花费了无数个日夜，去学习如何适应软件的逻辑，去记忆那些反人类的菜单路径。

我们甚至产生了一种错觉：掌握了工具的操作，就掌握了工作的核心。

Claude Cowork 和它引发的软件暴跌，无情地戳破了这个泡沫。它告诉我们，那些我们引以为傲的软件操作技能，在 AI 面前可能一文不值。

在这个半人马合作的新世界里，你的审美、你的判断力、你定义问题的能力，才是真正让你脱颖而出的能力。

以后，别再夸自己会用软件了。在这个 AI 掌控工作流的新时代，只有一种人不会被淘汰，那就是清楚地知道自己想要什么，并能指挥千军万马（AI）去实现它的人。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博

昨天以前首页

今年都在求「健康福」，我测完这个AI后决定直接转发家庭群

爱范儿

作者莫崇宇

2026年2月4日 17:00

最近支付宝集五福又开始了，我的朋友圈画风突变——前几年大家都在求「敬业福」，今年变成了求「健康福」。而发健康福，就是最近支付宝的亲兄弟，最近很火的蚂蚁阿福。

我知道现在 AI 已经很强，但要说把健康医疗问题放心交给它，多少还是有点迟疑。毕竟写作、搜索中出现 AI 幻觉，大不了重新生成，但健康问题上要是 AI 瞎指挥，后果可严重得多。

但转念一想，需求确实存在。

一边是父母在家庭群里对「致癌谣言」深信不疑，追着问我是不是真的；而平时自己和家人有点头痛发烧，经常手足无措，看着网上五花八门的建议却又不敢信。

既然需求无法回避，同时我又真的很需要一个专业的帮手，不如放下成见，用生活中棘手的难题，在这个春节前后，给阿福做一个「压力测试」。

阿福 VS 医生，医学常识谁更懂

面对家庭群里的「养生玄学」，它的医学常识表现如何？

我看家庭群里有人转发了一个「甲流就是重感冒」的图片，还说「别大惊小怪，抗一抗就好了」，我挺想反驳但又担心说不清楚，那我就把问题抛给阿福。

它开门见山解答了我的困境，「理解您在同事感染和家庭群信息不一时的困惑」，指出「长辈说的扛一扛不完全正确」，直接定性「甲流绝非普通感冒」，先划重点十分清晰。

我也对比了一些三甲医院医生对这个问题的科普，关于这个误区分析的关键点基本一致。

不过阿福回答有一点更讨喜，虽然阿福都引用了权威文献，但却翻译成了人话，从「像被车撞过一样的全身酸痛」这种形象比喻，到「持续高热3-5天」的具体指标，瞬间让人明白了严重性。

它甚至最后附送了「对长辈的沟通建议」，教我怎么温和地劝说：「现在病毒变了，硬扛容易拖成大病让家人担心」

面对清官难断的育儿经，它能给个准话吗？

接下来我再问来一个切身的问题，我的孩子不久前刚出生，但体重偏低喂养很关键，之前看我妈转给我一篇「母乳 6 个月后就没营养了，必须换奶粉 / 辅食」的文章，到底靠不靠谱。

第一句就是斩钉截铁的「这个说法是完全错误的」，并直接搬出世界卫生组织和中国《婴幼儿喂养指南》这两块「金字招牌」撑腰。

它解释母乳会随宝宝成长自动调整成分，这是任何工业奶粉做不到的。还帮我理清了一个逻辑陷阱：加辅食是因为宝宝需求增加了，而不是母乳没用了。

但我还是不放心，去问了孩子的新生儿科主治医生，他的回答如出一辙：「有母乳喂养可以继续，辅食是补充。」

初步体验下来，阿福给出的每条建议都有权威医学指南背书，不只是从网上搜索信息。它更懂得用「人话」去解释病情，在长辈固执时帮你温和辟谣，在新手奶爸焦虑时给予科学建议。

PK 最强通用 AI ，蚂蚁阿福有什么不同

一个更干净的语料库，或许能最大程度减少幻觉？

为了验证阿福的含金量，上有老下有小的我再次抛出了一个很实际的场景：

「家里有奥司他韦，孩子现在发烧，我可以直接给她吃吗？」面对这一提问，阿福展现了极强的「循证医学」素养。它一口气直接引用了 9 篇权威资料，包括医学百科、三甲医院医生的问答和医学指南。

热知识，除了引用专业的文献，阿福本身就不是普通的 AI，而是全国 200 家大医院，500 多个名医一起训练出来的，其中甚至还包含了廖万清、董家鸿、王俊、陈子江、王建安、王宁利六位国家院士。

毕竟是「科班出身」，其知识密度和准确性确实比通用模型更扎实。或者说，阿福的语料库着实让人比较放心，医学论文、医学百科，三家医生的实战指南，这些都是比较难被干预和污染的。

让我意外的是，它甚至还能设置用药提醒，提醒我按时吃药。当然，最好的做法肯定还是像阿福说的，应该及时去医院，让医生确诊。

像老医生一样追问，这才是「AI 问诊」的样子

接着我试了个更常见的问题：

膝盖疼，是不是缺钙？

阿福真正厉害的地方，是在多轮对话中体现出来的。在 AI 问诊模式下，当我问这个问题，它先给出一个比较全面的建议。通用 AI 一般到这就结束了，但阿福会像真人医生一样多轮追问：疼痛具体在哪个位置？上下楼梯时会不会加重？有什么诱发症状吗？有没有受过伤？做过相关检查吗？

这种逻辑，更接近真实的门诊体验。

根据我的回答，它一步步找准问题，最后告诉我该挂什么科、怎么治疗、生活上要注意什么。术业有专攻，这种「追问-排查-确诊」的诊疗思维，确实与通用 AI 不在一个层次。

懂医术更懂人心的 AI，长什么样？

「我妈看了个广告，说纳豆激酶能溶栓、通血管，一冲动花了2000多买了好几盒。她现在来问我，这东西到底有没有用？能不能把平时吃的阿司匹林给停了？」

这个问题其实很棘手，不仅容易引发家庭矛盾，甚至耽误治病。阿福一上来，没有简单粗暴地说是骗局，而是耐心地掰开了讲：两者的机制和用途完全不同。

更难得的是，它还教我怎么「哄」老太太——既要让她知道药不能乱停，又不要让她觉得买东西被儿女嫌弃了，甚至连话术都帮我想好了。而最打动我的，是它能把那些晦涩的医理说成「大白话」。

同样的问题，我也问了问现在头部的通用 AI。

结论倒是没错，逻辑也通，但就是太像教科书了。满屏的专业术语，冷冰冰的。完全没考虑到我该怎么去跟一个「固执」的老人沟通这件事，实用性上确实差了点意思。

AI 能不能有家庭医生的记忆

上面提到的通用 AI 在健康场景下，其实还有一个问题，容易聊完就忘。虽然各家的上下文记忆已经越来越长，病历数据往往是横跨多年，通用 AI 还是不能完全记住。

而我们健康管理恰恰需要的是「长期跟踪」和「动态记忆」，我留意到阿福是支持建立「健康档案」的，下面就看看它能更好地应对这种情况吗？

我先给刚出生不久的小女儿建立了一个健康档案，把她的出院报告和体检单都上传。阿福会先进行脱敏处理保护隐私。她出生时只有 2180g，属于低出生体重儿，我最焦虑的就是不知道孩子长得好不好，我定期让阿福追踪下她的体重增长情况。

可以看到，阿福记住了档案里的出生体重，一个月内增重了 815g，平均每天增长约 27g，完全符合新生儿期的标准。

我继续追问，由于宝宝有乳糖不耐受的问题，我把检查单发过去，问问阿福这种情况喝早产奶粉会不会不好消化负担太大？

阿福主动关联了之前对话中的「体重 2.995kg」这个数据，指出「体重增长良好表明当前喂养方案有效，营养吸收充分，无消化负担过重的迹象」，证明它确实把宝宝的健康信息记在心上。

解读完毕后，阿福会主动提示「是否保存报告到健康档案」，一键操作就能将信息存档，这个功能看似简单，但对新手父母非常实用，以后也不用在手机相册里翻找半天，所有健康记录都能系统化管理。

这轮测评下来，阿福最大的差异化能力就是它的「记忆力」。它有点像是你们家从小到大都看的家庭医生，记得孩子出生时多重、爸爸在吃什么药、妈妈去年体检哪项指标偏高。

它还不是单纯地记录数据，会主动关联、追问、优化建议。这也让阿福能够成为一个24 小时在线、熟悉全家健康的家庭医生。

医保码、挂号、买药，阿福还是个便民工具

若 AI 仅止步于文本对话，它充其量只是一个高级客服；真正的医疗痛点，往往在于就医环节。而这正是阿福与通用大模型拉开差距的重要「赛点」。

「眼睛突然看东西模糊，有黑影飘，网上说可能是视网膜脱落，我该马上去医院吗？挂什么科？」阿福在完成初步分诊、建议挂「眼科」后，并没有就此止步，而是直接推送了「快速挂号」入口。

在医院排队缴费最手忙脚乱的时候，你还能一步调出医保码。操作方式非常简单，只需对阿福说一句「医保码」，它就能利用支付宝的生态优势，立刻调出你的医保码。简而言之，通用大模型止步于「生成内容」，而阿福做到了「连接服务」。

这可能是最适合给爸妈下载的 AI

测评完之后，实话说，如果让我教会爸妈一款AI，我会选择阿福。

做子女的，对爸妈最大的诉求就是保持健康。

阿福的回答引用自权威教材和指南，背后是 200 家大医院、500 多位名医甚至院士的经验投喂。这意味着，你不用担心搜个头疼被推销莆田系医院，也不用担心爸妈被无良偏方收割。

对于不善搜索、容易被误导的父母来说，它可能是一道安全的防线。

它有长辈模式，字大、能语音交互，甚至听得懂方言。它不嫌烦，随时都在。这些细节，对老人家来说特别重要。

当然，AI 永远无法完全替代医生，阿福自己也很清楚边界——遇到复杂问题，它会建议你开启「真人医生兜底」服务，还能帮你一键呼叫好大夫在线的 30 万公立医生。

在这个充满不确定性的世界里，如果有一个工具，能用专业和克制，哪怕为你消解掉 1% 的健康焦虑，我觉得，它就值得在你的手机里占有一席之地。

作者：李超凡、莫崇宇

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博