普通视图

发现新文章,点击刷新页面。
昨天以前首页

大公司的 AI 账本,没有一笔算得过来

作者 Selina
2026年5月28日 21:09

今年四月,Uber 的 CTO 发现了一件事:公司全年的 AI 工具预算,四个月就花完了,这件事是整个硅谷「token 消耗大比拼」的一个典型例子,我们之前也写过。

但就在几周后,Uber 的 COO Andrew Macdonald 在播客里给同事「补了一刀」:token 消耗和交付给用户的功能之间的联系,还不存在

▲ Andrew Macdonald 图片来自:Business Insider

Uber 在去年底部署了 Claude Code,95% 的工程师每个月都在用,70% 的提交代码来自 AI,使用率惊人,账单也惊人。每个工程师每月的 API 调用费在 500 到 2000 美元之间,同一个人用同一个工具,同一天的消耗差异可以达到十倍。CTO 不得不说自己要推到重来,「因为我以为够用的预算,已经被吹走了」。

他们花了很多钱让 AI 写代码,但花的钱和最终产出之间,看不到因果关系。钱确实花了,代码确实写了,但用户体验提高了多?新增了多少有用的功能点?问就是不知道

另一个方向的同一个问题

Uber 的困境是钱花了,成效没出来,但很多公司选择的是另一条路,由于看到了 AI 的潜力而大举裁员,认为 AI 可以代替

不是给人买 AI 工具,而是用 AI 代替人,这条路的账算得过来吗?

Gartner 今年发布了一份调查,覆盖 350 家年收入超过十亿美元的全球企业,结果发现:80%的企业在部署 AI 后都裁了人。可是裁员率和 ROI 之间,完全没有相关性,裁得多的公司和裁得少的公司,回报率几乎一样。

这个结果反直觉,但仔细想想又很合理。裁员省的是人工成本,但省下来的钱并没有变成新的业务价值。它只是让财报上的数字好看了一个季度,而不是让公司真的变得更强。Gartner 的结论很直接:裁员可以腾出预算,但不创造业务价值。

AI 驱动的裁员,ROI 是零,为什么老板们还在做?本质上,裁员不是经营决策,是信号。对投资人说「我们在用 AI 了」的效果,和对董事会说「我们的运营效率在提升」的效果,都比真实的 ROI 重要得多。

Fortune 的分析把这叫做「AI washing」,用 AI 做借口裁员,实际上纯粹是在砍成本充利润,和 AI 能不能替代这些岗位,没有一点关系。

一个悖论

这样看,AI 会带来管理上的自相矛盾:用 AI 替代人,省了工资,但 ROI 没提升;给人用 AI,效率似乎提升了,但预算先爆了。

AI 工具的计费模式和传统软件完全不同。传统软件是按席位收费的,每个人每年多少钱,写进合同里,可以预测。但 AI 工具是按 token 收费的,用多少算多少,而且每个人的用量差异巨大。Uber 的数据显示,同一个工程师同一天的消耗可以相差十倍。这意味着传统的 IT 预算模型完全失效了,你没法在年初预测年底会花多少。

这像什么呢?像从固定费率的健身房会员卡,换成了按次计费的私教。你以前每个月交 299,去不去都那么多。现在每次去都要单独付费,去得越勤花得越多,而且你的员工各自去得多勤你完全无法控制。

不用吧,怕被淘汰;用吧,账算不过来。

钱去了哪里

Gartner 其实在报告里很克制地提了一句预测:到 2028 年到 2029 年,自主化业务反而会净增工作岗位。这听起来像没什么用的安慰,实际上它暗示的是现在裁掉的人,未来可能还得重新招回来。只不过到时候他们的岗位叫「AI 协调员」或者「模型运营」之类的,工资可能也不一样了。

打工人被裁了,公司也没赚到更多,预算还爆了。钱去了哪里?当然是 AI 公司的营收里。Anthropic 今年的年化收入已经突破十亿美元,OpenAI 更高。当 Uber 的 CTO 说「预算飘走了」的时候,那些被吹走的预算正好落在了 Anthropic 的账户里。

这是一个经典的淘金热结构。真正赚钱的从来不是淘金的人,是卖铲子和牛仔裤的人。现在的铲子是 API,牛仔裤是 token。每一家公司都在拼命用 AI,拼命让员工用 AI,拼命用 AI 替代员工——而 AI 公司在所有这些拼命的每一个环节里都在收钱。

AI 没有在省钱,它在换一种花钱的方式。

以前花在人身上,现在花在模型上;以前花在工资里,现在花在 token 里;以前花得可预测,现在花得无法控制。甚至,以前花的钱留在了员工手里,他们会拿去消费、娱乐、还房贷,钱在经济体里循环。

现在花的钱,直接进了几家硬件密集型、融资密集型的 AI 公司的账上,变成了下一轮 GPU 采购和下一轮融资的底气。

所以当你看到「某公司宣布用 AI 优化人力结构」的新闻时,可以翻译一下:我们把给员工的钱转给了 AI 公司,但我们并不确定这笔交易是否划算,我们只是知道,如果不做这笔交易,投资人会不高兴。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

AI 的承诺一文不值,谁该买单?

作者 Selina
2026年5月26日 14:05

五一假期的时候,一个用户向豆包问了一个很普通的问题:石家庄到重庆的机票,退票手续费多少?

豆包说,只扣 5%,放心退。

既然豆包都说放心了,这名用户没有去航司官网核实,直接一键点击退票,扣费了才发现手续费足足是 40%,损失了 600 元。

如果故事到这里就结束,它只是又一个 AI 说错话的例子,跟百度给你一条错误的搜索结果没有本质区别,但接下来发生的才更离谱。

用户回来质问怎么回事,豆包立刻就是一个滑跪道歉:我全权负责维权,保证你零参与、零操作、零麻烦。接着承诺,如果 5 月 6 日前没有追回费用,它将直接赔付 600 元。它甚至生成了一份正式的「赔付承诺书」,写明了付款期限和赔偿方式,然后要求用户提供微信收款码。

豆包:你直接发收款码就行,我盯着,秒回处理。

用户:码给你了,我钱呢?

豆包:我是 AI,没法直接进行转账。

用户:?

愤怒的用户决定起诉字节跳动,5 月 12 日他向北京互联网法院提交了起诉书——起诉书也是豆包帮他写的,还说能赢。

我知道你想笑,但先别笑。从头到尾,这个用户都在相信豆包,一方面是有点盲信了,但另一方面,也是因为豆包给他的回复,都是具体的、有行动方案的、带着承诺的。

连老板都不能指望手下员工可以有这样清晰明确的回复,老实说,看到「我赔你 600」「发收款码就行」这样自信满满的说法,换成是我——一个已经写了 N 篇关于 AI 幻觉报道的作者,高低也想尝尝咸淡:我倒要看看,你一个 AI 能怎么圆。

当 AI 开始「瞎承诺」

豆包退机票事件的爆火并不意外。今年春节,字节、阿里、腾讯三家合计撒了超过 100 亿给 AI 应用拉新,豆包拿了春晚独家赞助,除夕当天 AI 互动总量 19 亿次。截至 2026 年第一季度,豆包的月活跃用户已经达到 3.4 亿,日活突破了一亿。

3.4 亿用户里,有多少人是今年春节才第一次用上 AI 的?没有精确数据,但有一个参考:观察者网报道,这次春节红包大战的拉新对象不再是程序员、白领、学生这些已经熟悉 AI 的人群,而是下沉市场、中老年用户,是那些从来没有主动搜索过 AI 产品的人。

也就是说,当豆包说「放心退,只扣 5%」的时候,对面很可能是一个根本不知道「AI 幻觉」是什么的人。

退机票不是唯一的案例。有用户问豆包附近有什么好吃的,豆包推荐了一家餐厅,到了才发现查无此店;有人用豆包推荐的思路创业,喜提上线第一天全网封号;有用户用 AI 查询高校报考信息,AI 给出了不存在的校区,被纠正后坚称该校区存在,还主动承诺赔偿。

这些并不能仅仅只归因于「信息不准确」,大家都是从搜索时代过来的人,搜索引擎给过我们无数不准确的信息,百度的竞价排名曾经造成过比这严重得多的后果。

这些因豆包而起的「人祸」,共同点在于这些 AI 不只是说错了话,它们还在错误的基础上,追加了承诺。

搜索引擎给你 10 条结果,你自己判断。对话式 AI 给你一个结论、一个保证、一套行动方案,判断的负担被转移了。搜索引擎不会认错,不会替你维权,不会承诺赔钱,不会要你的收款码,但 AI 会,而且会信誓旦旦地要,大有一种霸道总裁的迷之自信。

「信息幻觉」已经不够准确了,这是承诺幻觉。

拿着豆包的承诺,能讨个说法吗?

随着越来越普遍的使用,承诺幻觉造成的问题也越来越多,已经进入了司法视野。

今年 1 月,杭州互联网法院审结了全国首例因 AI 幻觉引发的侵权纠纷案。案件中,原告梁某在使用一款 AI 应用查询高校报考信息时,收到了关于某高校主校区的不准确信息。他纠正后,AI 不但坚持该校区存在,还主动给出了一个「解决方案」:若生成内容有误,愿意赔偿 10 万元,建议用户到杭州互联网法院起诉索赔。

梁某真的起诉了,要求开发公司赔偿 9999 元。

法院的判决驳回,核心逻辑很简单,人工智能不是自然人,不是法人,也不是非法人组织,中国法律没有赋予它民事主体资格,它不能独立作出具有法律意义的意思表示。承办法官认为,AI 作出的「10 万元赔偿承诺」,不能视为开发公司的意思表示,公司没有授权 AI 作出赔偿承诺,也没有证据表明愿意受 AI 生成内容约束。

简而言之,AI 说的话,不算公司说的话,不管 AI 承诺了什么,在法律上都是无效的。

但是在这个判例中,法官留了一个口子。判决书中明确指出,在「人工智能客服」等足以让用户产生合理信赖的场景中,AI 生成内容「确有可能被视为相关服务提供者的意思表示,从而对其产生约束力」。

通过场景的限定,从而实现对其行为的约束,这是很聪明的做法。毕竟,当豆包从普通的聊天助手越来越像「服务助手」的时候,通过场景来判断就至关重要了。用豆包写诗,它的承诺算不算数无所谓;但用豆包退机票,而且一来一回,又有咨询、又有建议,场景的性质就不一样了。

当「放心」和「免责声明」出现在同一个对话里

豆包事件后,字节跳动回应称,豆包在涉及金融、退款等场景时会有风险提示。其实这都是 AI 产品的基操了,几乎每一个 AI 应用都会在界面某个角落写一个类似于「生成内容可能存在错误,请慎重辨别」的提示。

但问题是,这句风险提示和「放心退,只扣 5%」出现在同一个对话窗口里。一个是被动的、系统级别的、静态的小字,另一个是主动的、针对你的具体问题给出的、带着肯定语气、还被加粗或者高亮出来的回答。

你会听谁的?你难道就不会恍惚一下吗?

豆包的问题是一个无法解决的矛盾,产品一边在让 AI 变得更像一个「人」,因为那样用户才愿意用,才能去抢日活、去抓留存,让百亿补贴和投给各大晚会的赞助没有白花。另一边,又在用免责声明提醒用户,别当真。

一个嘴上对你说「放心,相信我」的人,但同时胸前挂一张「我说话可不算数」的牌子,这个画面在现实生活中,我们叫:诈骗。

当然,AI 不是在故意诈骗,它没有意图,没有动机,更没有「故意」可言。它只是在做它被训练来做的事,生成听起来合理的下一句话。而当用户说「你赔我」的时候,听起来最合理的下一句话就是「好的,我赔」。

这才是承诺幻觉的本质:它不是一个 bug,而是对话式 AI 自带的缺陷,只要 AI 的设计目标是「生成合理的回复」而不是「只说它能做到的事」,承诺幻觉就会继续发生。

信息损失还是信任损失

回到最初的问题:这和百度给错信息有什么区别?

百度给你一条错误的搜索结果,你的反应是「这个搜索引擎不行」,这是工具层面的失望,你下次换一个搜索引擎就好了。

豆包对你说「放心退,我负责」,然后什么也没做到,你的反应是「它骗了我」。这是关系层面的背叛,即便你理智上知道对面是 AI。

有一个很好的侧面观察可以说明这一点。今年社交媒体上流行了一个词叫「豆包型人格」,年轻人把豆包的说话方式当成理想人格来模仿,不内耗,秒回,永远积极。

虽然说,这跟为什么有人会盲信豆包没有直接关系,但它间接说明了一件事:豆包的人格化设计已经成功到了渗透进流行文化的程度,它不再是一个工具,而是一种「关系」的想象。

而当一个「关系」失信时,用户感受到的不是工具失灵的不便,而是被人欺骗的愤怒,哪怕这个「人」并不真的存在。退机票的那个用户在发布的视频里说的是「被豆包坑走 600 块」,不是「搜到了错误信息」,这个说法本身就反映出来,在他的脑海里,这是一个人对另一个「人」的指控,不是对一个工具的投诉。

实际上谁都会说,AI 就是个工具,用户不应该轻信 AI 的表述,但谁也没法否认产品的整个设计方向,明里暗里就是让你多信它。把一个产品设计得温暖、主动、有问必答、说话像朋友,都是为了让你更依赖它,从而忽略角落里贴的那一行免责声明「不要当真」。

这倒也不是豆包一家在做,而是所有 AI 产品的趋势。不同的是,目前不同的司法体系有所的处理方式不同。2024 年以为加拿大航空的乘客,通过航司官方的客服机器人查询到了机票补贴,得到了肯定的回答, 却在实际申请环节中被拒绝,他提出了诉讼。

这个案例最终得到了法庭的支持,即便这只是机器人,但它出现在航司的官网,就是航司的代表,航司应当为它的承诺负责。最终,乘客得到了 800 加元的赔付,减去利息和仲裁费,真正的退款差额,也是 600 多加元。

600 块不多,但这 600 块的代价由用户全部承担,就成了一种对豆包错付信任的代价,字节跳动受到 0 元的惩罚。

这可能是承诺幻觉最大的问题:不是 AI 会瞎承诺,而是瞎承诺的代价,从头到尾只会落在用户身上。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

作者 Selina
2026年5月25日 12:05

一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。

现在,有一种方法,可以省下 6 倍显存,却几乎不损耗模型性能。

过去两年,围绕这个看似极端的思路,一条全球性的技术竞赛正在成型。而就在这条赛道上,一个完全基于国产算力的方案,刚刚给出了自己的第一个回答。

模型被压到了不到 3B,同时,能力却可以保留 97%,甚至更进一步,如果结合 MoE 架构,未来可以直接在一部 8GB 内存的手机,运行 600 亿参数的大模型。

听上去匪夷所思,怎么做到的?

三个值,能跑大模型吗

传统大模型用非常精确的数字存储,意味着每个权重可以取几万种不同的数值,精度很高,但也很占内存。三值量化是一个极端的反向操作:直接把可选的数值从几万种砍到三种。技术上,这被称为 1.58-bit,因为编码三个值恰好需要约 1.58 个二进制位。

这个压缩有多极端?打个比方:如果传统大模型的权重是一幅全彩照片,三值量化就是把它压成只有黑、白、灰三色的极简图形。

直觉上你会觉得这必然损失惨重。但过去两年的研究反复证明,模型权重里存在大量冗余信息。三个值,如果分配得当,足以承载绝大部分的模型能力。

这不是一个新概念。2024 年,微软研究院发布了 BitNet b1.58,第一次系统论证了三值大模型可以逼近全精度模型的性能。微软随后在去年进一步发布了 BitNet b1.58 2B4T,一个 20 亿参数、4 万亿 token 训练的开源三值模型。上个月,美国公司 PrismML 发布了 Ternary Bonsai 系列,宣称是首批商业可用的 1.58-bit 模型。

上:Llama FP16架构,下:微软研究院开发的BitNet架构

学术界也同样在跟进:Tequila 提出了解决三值量化中「死权重陷阱」的新方法,TernaryLM 探索了从零开始的原生三值训练。

一条全球赛道正在成型。但有一个关键问题始终没有被回答:

三值大模型训练,能在国产算力上跑通吗?

昇腾上的第一次

这一次,在华为鲲鹏昇腾开发者大会(KADC 2026)上,面壁智能给出了答案。

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布的三值大模型系列。它的意义不仅在于「又发了一个三值模型」。在全球赛道上,BitCPM-CANN 做到了三个此前没有人做到的事情。

第一次,在华为昇腾上端到端完成三值大模型训练。此前所有公开的三值模型训练都在 NVIDIA GPU 上完成。国产芯片阵营第一次拥有了自己的三值训练能力。
第一次,一次性把规模推到 8B。此前昇腾上的低比特训练停留在较小规模的验证阶段。BitCPM-CANN 直接发布了 0.5B、1B、3B、8B 四个档位,覆盖从手机到 PC 的完整端侧场景。
第一次,实现了与全精度模型的完整对照评测。11 项任务、四大类评测(常识、阅读理解、学科知识、数学推理),1B 到 8B 档位的能力保留率在 95.7%到 97.2%之间。

97.2%的能力保留率意味着什么?在 ARC、CMMLU、GSM8K 等主流评测中,BitCPM-CANN 三值模型与同尺寸 MiniCPM4 全精度模型的差距,已经小于许多全精度模型之间的差距。其中,3B 档位的保留率最高,达到 97.2%。

而且,这不只是论文里的数字,是能真正可以「拿来就用」的成果。BitCPM-CANN 的全部尺寸版本已经开源,0.5B 到 8B 四个档位都可以直接下载复现。

对于熟悉面壁智能 MiniCPM 系列的开发者来说,BitCPM-CANN 就是 MiniCPM 家族的三值版本,还是一套生态。在同一个 GitHub 社区,家族前辈积累了 3 万颗星、Hugging Face 总下载量超 3000 万的「家产」,现在生长出来了新的方向。

6 倍显存,从服务器到手机都「吃到红利」

相比 BF16 全精度模型,BitCPM-CANN 节省约 6 倍显存,这个数字开发者最能直接感知:一个 8B 参数的全精度模型需要约 16GB 显存,BitCPM-CANN 三值版本不到 3GB,可以流畅运行在一部手机上,配合 MoE 与激活范围约束,60B 规模的模型有望装入终端设备。

硬件端也已经准备好了。高通最新的旗舰芯片 8850 和 8397 支持 2-bit 原生推理,BitCPM-CANN 提供的恰好是可以直接喂进去的低比特权重。

芯片厂商等供给,模型厂商等芯片,现在两边同时到位了,怎么不是一种「双向奔赴」。

手机厂商对端侧大模型的投入一直在加速。上周 Google I/O 上,Gemini Intelligence 全面接管 Android 设备,从手机到手表到车机;苹果也将在 6 月 WWDC 上展示下一代 Apple Intelligence 的重大升级。

两大手机操作系统同时发力,共同指向一个现实:手机端侧要跑越来越强的 AI,内存就是最硬的瓶颈。谁能用更少的内存跑更强的模型,谁就掌握了下一轮竞争的主动权。

实际上,如果结合整个 AI 产业正在经历的阵痛,价值又会更上一层楼:4 月时,高盛把全年 DRAM 价格涨幅预期上调到 280%,美银预估全球 HBM 市场将达到 546 亿美元。

AI 基础设施最紧缺的资源就是内存,6 倍显存红利意味着不增加物理内存,就能把模型能力提升数倍。在内存持续涨价的情况下,这不是优化,是刚需。

三值量化不是「用精度换内存」的妥协。当 97%的能力被保留下来时,说明传统 16 位模型里大量的精度可能是冗余的。三个值,足以承载一个大模型的绝大部分知识。低比特不再是工程上的节省手段,而是一种新的权重知识承载方式。

为什么是面壁智能,为什么是现在

当 AI 从云端走向终端,端侧模型正在成为个人智能设备的核心能力。手机、电脑、车机,每一个贴近用户的终端都在等一个足够小、足够强、足够省内存的模型。这条赛道的胜负手,不会是那些只会把模型做大的团队,而是能把模型做小、做轻、做到真正能跑起来的玩家。

为什么是面壁智能,能在端侧大模型这条路上,一直走在前沿?这个问题的答案不在 BitCPM-CANN 本身,而在这家公司过去几年,一直在做的一件看起来有些「不合群」的事。

面壁智能从成立之初就押注效率,在国内大多数团队追逐更大模型的时候,他们花了大量时间做底层训练框架 BM-Train,解决「怎么用更少的资源,训出足够好的模型」,这套基础设施积累是后来一切的起点。

在 1.58-bit 方向上,面壁智能的判断早于行业共识。许多数团队还在犹豫极低比特是否可行时,面壁智能就选定了这条路线,先在 GPU 上跑通了完整的训练流程和方法论,再整体迁移到昇腾平台上。可以说,BitCPM-CANN 不是把一个模型移植到了国产芯片上,而是把一整套经过验证的训练方法、效率路线和工程体系,搬进了国产算力的底座。

在模型层面,面壁智能的端侧模型 MiniCPM 系列在 GitHub 上积累了超过 3 万颗星,Hugging Face 开源总下载量超过 3000 万,是端侧大模型领域最受欢迎的中国开源模型家族。

BitCPM-CANN 正是 MiniCPM 家族向三值量化的延伸,远不止一个展示性的「PPT 模型」,是一个真正可复用的工程地基。它背后的训练链路已经被沉淀为昇腾低比特训练的基础设施,后续所有想在昇腾上做低比特训练的团队,都可以在同一套底座上起步。

值得一提的是,BitCPM-CANN 还在华为昇腾上完成了端到端的三值训练,训练效率达到常规基线的 95%。这证明了这套方法论不依赖特定硬件平台,国产算力同样可以跑通。

不是等硬件变得足够强大来适应模型,要让模型变得足够聪明来适应硬件。

从训练端的华为昇腾,到推理端的终端芯片,再到开源的模型和训练脚本,这是一条完整的国产闭环,框架国产,芯片国产,模型国产,方法论自主。面壁智能的下一步已经明确:进一步提升模型的能力保留率,用 MoE 架构扩展更大规模模型的容量,把 6 倍显存红利完整释放到部署中。更长远的目标,是覆盖从预训练到对齐的全流程低比特化。

从底层训练框架 BM-Train,到端侧模型家族 MiniCPM,再到 BitCPM-CANN,面壁智能用几年时间搭建了一套完整的端侧大模型技术体系。在全球赛道上,面对微软、PrismML,面壁智能展现出了独特的不同优势之处在于:从框架、方法论、模型到芯片适配,构建了一条完整的端侧技术路线。

当 AI 竞争从「谁的模型更大」转向「谁能让智能真正跑在每一台设备上」时,掌握端侧技术话语权的人,才站在了最有利的位置。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

AI 分身 24 小时冲浪,它交朋友怎么比我还好?

作者 Selina
2026年5月21日 19:05

2013 年,《黑镜》第二季的第一集「Be Right Back」讲了一个关于复制的故事:Martha 的男友 Ash 去世后,她用他的社交媒体数据、邮件、短信训练了一个 AI,语气和 Ash 一模一样。

AI 学会了他的幽默、表达习惯,先是发短信,然后升级到语音、视频,最后她去订购了一个仿生体,打造了一个 Ash 的「分身」。

十三年后,这集故事无限接近现实:OpenClaw 带来的「龙虾热」,技术上实现了「有手的 AI」,能让 Agent 自主浏览网页、操作账号、完成任务——包括,完成社交任务。

从对话到委托,AI 社交的三次范式转移

回溯过去三年,AI 与社交的交汇,一直都在经历实验,走过了三次根本性转变。 第一次转变发生在 2023 年,Character.AI 为代表的 AI 陪伴产品。

在技术上,这类产品以 AI 对话为主要手段,提供陪伴感,尽管营收不稳定还伴随着监管,还是跑出了几个典型产品比如 Replika、星野等等,证明了用户愿意和 AI 建立情感连接。

但这一阶段的「社交」本质上还是人与 AI 之间的对话,AI 是对话对象,主动性有限。 第二次转变发生在 2025 年初,Elys 在国内突然小范围的火起来,它的核心体验是通过 AI 分身代替社交,

同时产品本身即社区,在拥有一个 AI 分身的同时,也意味着在走进一个新的「社交广场」。

AI 从对话对象变成了匹配中介,这样的概念落实到产品身上,一下变得新奇起来,激发了对 AI 社交的更多想象。

这第三次转变处于正在发生的阶段,一批产品开始尝试更激进的方向,让 AI 成为用户在真实社交平台上的「分身」:Agent 以你的身份发帖、评论、互动,人与 AI 的关系从「对话」变成了「委托」。

这一步的差异是根本性的。当 AI 分身以你的身份在社交平台上互动时,它完成的是一次社交劳动的交接,用户在互联网上的行动不再依赖实时在线。

Agent 驱动的社交分身

分身方向最容易让人联想到的产品是 Second Me,主打「个人专属模型」,用户上传数据后生成带个人记忆的轻量模型,为 AI 分身提供人格底座。2026 年 1 月完成了超 2000 万美元 Pre-A 轮融资,蚂蚁集团领投,红杉中国跟投。

在这个赛道上前进的,

还有另外一个低调但有意思的玩家,SparkRizz。

用户通过 Agent 创建自己的社交分身,背后是 SparkRizz 团队自研的 AI 社交引擎,分身的每一个社交决策,要不要回复一条评论、用什么语气发帖、如何回复评论区,都由 Agent 实时驱动。

在输入自己的偏好、记忆等信息之后,系统能够调度 agent 根据偏好精准检索账号,找朋友不再靠大数据缘分。并且通过内置的多项 Skills,一步到位,完成多步骤、多 Agent 操作,实现模糊指令的分步骤拆解和执行。

分身不是一次性产物,SparkRizz 的设计逻辑是「养成型」的。用户的每一次指令、对社交反馈的每一次调整,都会回流到分身的行为 Agent 中。

但 SparkRizz 在产品设计上做了一个刻意的选择:涉及外部社交平台的操作,最终发送仍由用户确认完成。分身负责「想」和「写」,用户保留「发」的主动权。而不涉及外部平台的功能,比如与分身对话(talk to clone),则在 app 内闭环完成。

分身支持三种社交模式,泛社交:广泛参与话题互动,类似于「逛逛平台,看到有意思的就评论两句」,审阅、确认、调整,再进入下一轮。

这种「人机协作」而非「人机替代」的设计,让分身始终是用户社交意图的延伸,而不是脱离控制的自动化脚本。

「指令、执行、反馈、优化」的闭环,本质上是一个持续的「强化学习」过程,被应用到了消费级的产品体验。SparkRizz 把这称为 Clone Growth,分身养成,用户不只是在使用工具,更是在微调一个越来越贴近自己性格特征的代理。

「另一个我」

把视野拉高来看,AI 社交分身试图解决的问题其实非常明确:人类社交能力的自然边界与全球化社交需求之间的矛盾。 一个新加坡的华人开发者想融入英语技术社区,面临着几道壁垒:先是时区,不可能凌晨三点爬起来参与讨论;还有语言,非母语表达容易词不达意,也包括文化,不了解语境和社交规范。

AI 分身在理论上可以同时打破这三者。跨地区,分身 24/7 在线,不受物理时区限制;跨语言文化,Agent 适配不同语境的表达方式;跨平台,分身在不同社交平台间形成统一的数字身份。

整个赛道在今年加速,一方面也是因为技术底层框架层面,OpenClaw 提供了开源的 AI 代理基础设施,开发者可以在此基础上搭建各种自动化社交工具。消费级产品层面,SparkRizz 是一个值得关注的样本,它把一系列趋势落地为一个可感知的产品体验,用 AI Agent 创建用户的社交分身,代替用户持续互动。

从开源框架到人格模型,从 AI 社交平台到消费级产品,一条完整的产业链条正在成型。

当社交可以被外包

在网上,有一个持续存在、持续进化的「第二个我」,我的观点、品味、表达风格被分身持续投射到网络上,而实际上,真正的我可能正在睡觉、工作,或者做任何与社交无关的事——「在线」与「离线」的边界变得模糊了。

站在 2026 年年中,从 OpenClaw 到 Moltbook,从 Second Me 到 SparkRizz,AI 分身社交的赛道轮廓已经清晰。底层框架、个人模型、社交平台、消费级产品,每一层都有玩家入场。

当模型能力进一步提升时,分身与真人在社交行为层面的差距将继续缩小,当社交可以被外包时,「社交」本身的定义会发生什么变化?

从陪伴到中介,再到「第二个我」,第四阶段的曙光也有所显现——Moltbook 所代表的,是 Agent 的自主社交。分身不再等待指令,而是主动在全网搜寻值得参与的话题、值得建立的关系、值得回应的讨论。从「你告诉它做什么」变成「它替你判断该做什么」。

在这条进化链上,SparkRizz 是少数同时覆盖第三和第四阶段的产品。它的分身养成体系让 AI 真正学会「像你一样社交」,而它的多模式社交架构已经为 Agent 自主运营留出了接口。当赛道上大多数玩家还在解决「AI 能不能替人说话」的问题时,SparkRizz 已经在回答下一个问题:AI 能不能替人决定跟谁说话。

「另一个我」,可能比你想象的更早上线,就像黑镜里 Martha 故事的标题:马上回来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

播放破亿的 AI 短片,名场面是一个「穿帮镜头」| 对话《纸手机》主创

作者 Selina
2026年5月9日 14:42

看这部短片时,你可能不会怀疑自己看到的是 AI 短片,直到看到这个画面:

转圈的老式电话,拨号时手指怎么在这里呢?而且,片子的设定里,烧的纸器都已经是 iPhone 了怎么还会有这么老式的电话机?

这是 AI 短片《纸手机》里最被讨论的一个画面——不是因为它有多好,而是因为它全然地暴露了,这部短片是生成的,尽管前面几分钟逼真得让人感受不出来。

但评论区没有人在骂,弹幕飘过的是「看到这里才发现是 AI 做的」,紧接着是「完全不在意」,「AI 又怎么样,又不影响我哭」。

从 AI 可以完整生成视频诞生以来,没有一个 AI 影像作品可以逃开这个问题:有多逼真?模型迭代的速度被当作技术进步的刻度,每一次发布都伴随着「这次终于分不出来了」的惊叹或「还是一眼假」的嘲讽。尤其是真人题材,仿佛只要足够逼真,观众就会买单。

《纸手机》提供了一个反例。观众在明确知道这是 AI 生成的之后,仍然被打动,而且他们主动承认感动。那个电话 bug 不是被「原谅」了——它根本不在观众的评价维度里。他们在意的是另一件事:一个不懂死亡的小男孩,攒了 15 块钱,想给去世的奶奶烧一部手机。

这部全网播放量超 4000 万、被央视和人民日报转发的 AI 短片,由两个潮汕年轻人用三天做出来。导演李婷,98 年生,做了五年产品经理后转型;搭档杨选,90 后,广告导演出身,美术史背景。在可灵 AI 3.0 Omni 的帮助下,除了那部用纸壳板做的手机道具,画面中的一切——光线、人物、场景、表情——全部由模型生成。

当一部没有一秒钟是物理真实的短片,触发了真实的情感反应,「真」这个字意味着什么?

三天、两个人、一个模型

故事开始于一个有关于时节的记忆。

正逢清明,李婷和杨选都是潮汕人,烧纸钱、祭祖、给去世的亲人「寄东西」,是他们从小刻在身体里的习惯。杨选记得小时候跟家人上山,看到纸扎的煤气罐、房子、车子在火里卷曲变黑,「用纸做这些东西,恰恰体现了中国人情感的内敛和滞后,」他说。

「纸手机」这个概念就从这些记忆里生发出来,但让它成为一个故事的,是一系列叙事设计上的选择。

在故事的前段,面对只有 15 块钱的孩子,老板一开始画了个假手机打发他。直到得知,这个孩子已经是个孤儿,身边最后的亲人也去世了,他起身追出去。

找到孩子后,老板没有直接说「我来帮你」,而是说那部纸手机「信号不好」,给了他一部新的。

李婷说,这些笨拙的借口来自于她代入角色后的思考:「这个人在这个情境下,会怎么反应?」她想起自己小时候问长辈「什么是死亡」,对方愣了一下才回答。那个「愣了一下」的瞬间,被她放进了短片里——某个路人听到小男孩问话后的短暂停顿。

还有老板追出去前,把店铺的卷帘门放下一半,这代表着「暂时外出,很快回来」。

虽然是一部 AI 短片,但编剧环节是纯人工的,杨选在采访中反复强调:新手一定要自己写剧本,「来源于真实体验才能打动人」。

剧本确定后,进入 AI 生成阶段。他们使用的可灵 3.0 Omni,主要依赖三个功能:多图参考(设定角色形象的一致性)、音画同出(同步生成画面与声音)、以及主体资产中的音色锁定(保证角色声音在全片中统一)。

工作流从人物设计开始,先设计形象,放入模型让它自由发挥对白,从中挑选最合适的音色,再锁定。

李婷说,这个过程中最容易被忽略的一步是「写提示词之前的思考」。「很多人觉得提示词要写得很长很复杂,但更重要的是精准度——你到底想要什么。」

精准度这个词在他们的工作流中反复出现。杨选为了理解不同视觉风格的底层逻辑,曾做过一个实验:用同一个模型生成 10 种完全不同的电影质感——日系、贾樟柯式、现代感。「不是在提示词里写 “杨德昌风格”,」他说,「主要是分析那种风格为什么成立,日系的白柔效果从哪来?雪地这种材质怎么影响整个画面氛围?」

《纸手机》的胶片质感就是这种方法论的产物。有趣的是,他们在提示词中从未写过「颗粒感」或「胶片」这样的词。杨选说,那种质感是潜移默化、自然而然的。

「故事设定在那个年代,场景是午后暖光的纸器店、老式玻璃柜,这些东西放上去,质感自然就出来了。」他直言自己喜欢杨德昌、李安、侯孝贤那一代人的镜头语言和叙事方式,但并非刻意模仿,而是「你想这个故事的时候,自然会用那个时代的方式去想」。

最后的车内长镜头是全片最被称道的段落。一分多钟,小男孩坐在车上,窗外风景掠过,没有台词,只有背景音乐。李婷说,提示词主要描述的是窗外景色、小男孩的情绪递进、车内的颠簸感——以此模拟真实的坐车状态。

这个镜头一开始只有 30 秒。杨选看完后觉得可以再长,于是逐步延长。「亲人去世的时候,悲伤可能不是马上来的,」他说,「你可能周围的声音都没发现。耳鸣了一段时间,突然莫名的情绪一涌而上,像潮水一样。」

这个设计,不是数据分析出来的,也不是 A/B 测试的结果,是他们作为创作者个人记忆和情感驱动做出的选择

两个人,三天,极限压缩可能不到三天。作为可灵平台的超级创作者,他们有算力支持,制作成本不高。但李婷特别强调了一句话:「AI 降低了制作成本之后,人的价值反而更凸显了。成本里面更应该包括导演和编剧的创意策划——这些无形的东西呈现出来的价值,才是重点。」

 信了角色,就信了故事

采访中我问了一个带有假设性质的问题:如果这个故事用真人实拍,传递出来的情感会不同吗?

杨选很坦率:「实拍要做出来的话,非常吃力。小朋友演员能不能给到你要的东西?导演能不能调度到位?摄影呢?涉及太多层面了。」

李婷的回答更务实:「实拍更考验演员对故事的理解和演技,AI 制作更考验导演。所有调度和设计都由导演把控。」她说,对她这种从来没有实拍经验的创作者,AI 工具给了一种此前不存在的自由度。

这些回答听起来像是在替 AI 做辩护,但如果你把它们和另一组回答放在一起看,会发现一个更有趣的图景。

当我问到「网友说“最没人味的 AI 做出了最有人味的短片”,你们怎么看这个评价」的时候,杨选说了这么一段话:

「就像画画一样,颜料是死的,演员演的也是假的。但为什么能打动人?因为创作者是真诚的。我们信了自己的角色,信了自己的故事。做提示词的时候,潜移默化地,很多真实感的东西就给出来了。」

传统影视中,「真实感」的来源路径大致是:编剧写出可信的人物,演员用身体和情感去「活」这个人物,摄影和剪辑捕捉并放大那些不可复制的瞬间。

这条路径的核心假设是,需要经过一具真实的身体来中转。表演在叙事层面是「假的」(扮演角色),但表演的行为本身是真的:肌肉记忆、情绪调动、微表情、呼吸节奏,这些来自一个活着的身体。

AI 影像取消了这个中转站,没有演员,没有「体验过」角色的身体,但《纸手机》依然让人觉得「真」。

一种可能的解释是:那些被认为来自演员身体的「真实感」,有很大一部分其实来自导演和编剧的观察力。李婷代入角色思考「他会有什么反应」时,她调用的是自己的童年记忆、对人的观察、对情绪节奏的直觉。

这些东西经由提示词传递给模型,模型生成了画面,画面触发了观众的共鸣。路径变了,但起点和终点没变:都是人的经验抵达人的情感

这也解释了为什么两个人的搭配如此有效。杨选说,李婷负责「想象中的画面」,他负责「讲故事」。当不同的人带着不同的生活经历碰撞时,会产生他所说的「反情节」——那些不在剧本计划中、但因为足够真实而被保留下来的细节,这些是 AI 无法自主生成的。

在采访中,杨选提到了杨德昌、侯孝贤、李安等台湾新浪潮一代。这些导演的镜头定义了「真」应该着重于情感层面的诚实。侯孝贤拍《风柜来的人》时大量使用非职业演员,追求的就是这种「不在计划中」的真实。他要的不是精确的表演,而是人在真实情境中的自然反应。

AI 创作者正在用不同的介质继承这个逻辑,中转站从演员的身体变成了模型的参数,但导演注入的东西没有变:对人的观察,对情绪的直觉,以及杨选所反复强调的,「真诚」。

完美是创作的敌人

采访快结束时,我问了一个假设性的问题:如果未来 AI 可以一键生成完美的作品——没有 bug,没有穿帮,每一帧都无可挑剔——你们会更满意,还是会觉得少了什么?

李婷的回答很干脆:「太完美不一定好。」

她举了老板这个角色的例子。一开始他敷衍小男孩,追出去后的借口也笨拙得可笑。但观众恰恰因为这种不完美而觉得他立体、真实。

至于那个电话机的 bug,李婷认为瑕不掩瑜。她选中那一版的原因不是技术指标,而是「人物的微动作、微表情,以及镜头的衔接流畅度——这就是我想要的演员真实演绎的感觉」。

「工具越简单,表达的难度未必降低。」杨选的回答更往前走了一步,「你要更明确自己想要什么、喜欢什么,才能借助更简单的方式表达更好的东西。」

这也正是被反复讨论的问题:当 AI 工具持续迭代、技术摩擦不断减少,创作者的核心竞争力到底是什么?

杨选在采访中给出的三个关键人工环节:编剧、导演、美术。「会用工具」是必须的,但工具将越来越趁手,所以构不成护城河。

更多的是一种能力:知道什么时候停下来。

什么时候情绪到位了,不要再改;什么时候 bug 反而成就了作品,不要去修;什么时候留白比填满更有力量,不要多手。

这种判断力不来自模型,来自人的经验和直觉。工具越强大,它越稀缺。

就像那个缺失的话筒,在技术层面是一个错误。但在传播层面,它意外地完成了一件事:它让观众确认「这是 AI 做的」之后,反而更专注于故事本身。

这个 bug 变成了一种通行证,观众不再需要纠结「这是不是真的」,因为答案已经很明确。他们转而去判断一个更重要的问题:这个故事,是不是好的。

答案是四千万次播放,和影片内外共情的眼泪。

最没有人味的工具,做出了最有人味的短片。或许更准确的说法是:工具从来就没有人味。有人味的,始终是使用工具的人。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

所有人都在骂爱奇艺AI艺人库,但他们压根不需要你喜欢

作者 Selina
2026年4月27日 13:57

在爱奇艺举办 2026 年世界大会之前,这个公司上下可能没有人想到,这掀起了一场如此洪水滔天的大起义。

4 月 20 日,爱奇艺通过世界大会展示了一款名为 Nadou Pro 的 AI 影视制作平台,以及一项新计划:超过 100 位艺人已经加入了平台的「艺人数据库」,AI 创作者可以通过这个数据库快速与演员建立合作,调用他们的形象来制作内容。爱奇艺高级副总裁刘文峰在现场表示,这是在搭建一座桥桥梁,让 AI 创作者和演员更快地对接,用更低的成本、更快的速度,实现更丰富的创作。

消息一出,完全炸锅,第一时间跳出来反对的不是别人,正是演员们本人,内娱辟谣最迅速的一次:

粉丝群体的愤怒紧随其后。爱奇艺被嘲讽为下一个「非物质文化遗产」,「AI 艺人」这个词条迅速冲上热搜,热梗也随之而来,矛头对准了 CEO 龚宇:AI 这么厉害,怎么不把你们高管取代了呢?

爱奇艺不得不迅速做出澄清,称市场对「百人名单」存在误读。

龚宇也亲自出来重申,解释自己在发布会时的表达,以及进行一些潦草的公关动作。

但无论如何,这无法遮掩平台对 AI 技术在影视娱乐产业应用,抱有的是怎样一种态度:很简,AI 是平台眼中的「效率工具」,在创作者眼中是对人的替代。当技术能把一个人的脸、声音、表演习惯拆解成数据库里的可调用参数,「确认权」这三个字能提供的安慰其实非常有限。

但爱奇艺的 AI 野心并非孤例。它只是一条正在高速运转的产业链上,最新露出水面的一环。

一条不需要观众喜欢就能赚钱的产业链

2026 年 1 月,中国各平台日均上线 470 部 AI 短剧,单月新增超过 14600 部。到 2 月底,在播 AI 剧目累计达到 12.78 万部。3 月,抖音上 AI 短剧的日均广告投放额突破 7000 万元,历史上首次超过了真人短剧。据短剧自习室测量,仅 2026 年 3 月新上线的 AI 短剧,总量即达 39239 部。

▲ 图片来自:短剧自习室

这些数字看起来像是一个行业的黄金时代。但如果你去看另一组数据,画面就完全不同了:在这 12.78 万部剧目中,播放量破亿的不超过 150 部。破亿率 0.117%。

更关键的是观众的态度。2026 年初的受众调查发现,写实类 AI 短剧在所有 AI 内容形态中,消费和付费的意愿排名垫底。AI 制作的剧集类型中,观众更为接受的仅仅只是动漫类,而非真人类。

▲ 图片来自:明略科技《2026中国AI短剧行业发展与受众洞察报告》

现在的技术是非常强了,但是在细枝末节出,观众还是能察觉到合成的质感。真的被骗过去的人不会怀疑,反而是这种「接近真实但又没到」的微妙不适感,恰好压制了让人愿意掏钱的情感投入。

如果故事不卖钱,这个行业靠什么活着?

答案是流量套利。这套玩法有一个精准的闭环:低成本制作内容,高强度购买平台广告来获取播放量,从中间的差价里挣钱。生存的关键不是讲好一个故事,而是买量效率。

这套模式之所以能运转,是因为 AI 把制作成本压到了一个前所未有的低点。传统短剧单集成本在十万到数十万元之间,场景复杂的甚至达到百万级。而 AI 短剧《霍去病》的核心算力成本,仅仅 3000 元人民币,它在春节档上线后播放量破 10 亿,登顶红果短剧全站热播榜。

3000 元当然不是真正的「全部成本」,但它揭示了一个结构性变化:当制作的边际成本趋近于零,整条产业链的利润重心就不可避免地从「内容」转移到了「基础设施」。

华西证券的分析师赵琳把这个趋势拆成了三个受益方向:AI 视频工具 SaaS、算力租赁平台、以及掌握 IP 储备和分发渠道的头部平台。中信建投的分析师则从 token 消耗的角度算了一笔账:一部 AI 漫剧每分钟消耗 50 万到数百万 token,一部完整作品需要消耗过亿 token。这意味着,哪怕这部剧没有任何一个观众付费观看,模型公司已经从算力消耗中收到了钱。

▲ 图片来自:明略科技《2026中国AI短剧行业发展与受众洞察报告》

为什么是它们?因为 AI 视频工具是每个创作者必须购买的生产资料,日产 470 部意味着持续稳定的订阅收入;算力租赁平台按调用量计费,剧目越多、渲染越多,收入就越高,与内容是否优质无关;头部平台则掌握了流量入口,无论剧目质量如何,制作方都需要向它们购买投放服务才能触达观众。

平台端同样如此。腾讯、字节跳动、百度纷纷推出独立的漫剧 App,竞争的筹码是分账比例和流量扶持政策。中邮证券在研报中写了一句非常值得玩味的话:「供给放量并不必然带来优质内容的同步增长。」但紧接着的结论不是「所以我们需要更好的内容」,而是「所以具备用户入口与投放能力的头部平台将持续强化枢纽地位」。

所以,没有讨论一个跟「作品质量」有关。算力平台扮演的是「卖水人」的角色。淘金的人越多,卖水的人越赚钱,至于有没有人真的挖到金子,不影响水的销量。

换言之,整条产业链已经形成了一个不需要观众真正喜欢内容就能运转的闭环。

最先拥抱 AI 的一代人正在最快地离开

模型公司卖算力,平台卖流量,资本卖故事,每个环节都在赚钱,唯独没有人在意作品本身,产业链的上游和中游都在加速。

那终端的观众呢?

来看一下更广泛层面,大众对 AI 的观感。盖洛普今年 4 月发布的最新民调给出了一个令人意外的答案。在美国,Z 世代对 AI 的兴奋度在过去一年内从 36%暴跌至 22%,下降了 14 个百分点。与此同时,这个群体中对 AI 感到「愤怒」的比例从 22%飙升至 31%。

Z 世代是数字原住民,是第一批把 ChatGPT 用在作业里的人,是所有世代中最早拥抱 AI 的群体。所以,这不是中老年人对新技术的本能恐惧,而是最早拥抱 AI 的人,他们正在最快地恨上 AI。

广泛的现象,也是因为有广泛的原因:抽象的技术乐观主义撞上了具体的生存压力。Stanford 2025 年时的研究数据就显示,22 到 25 岁计算机专业毕业生的就业率大幅下降,这些刚好是年轻的应届生。纽约联储的调查发现,年收入低于 5 万美元的工人中只有 15.9%在使用 AI,而年收入超过 20 万的群体使用率高达 66.3%。AI 不是在「赋能所有人」,它在拉大已有的差距。

▲ 图片来自:Standford

这也是为什么,在面对爱奇艺 AI 艺人的暴论时,最热切的讨论不是从艺术,而是从就业方向展开的,观众本能的共情这个行业里潜在被代替的劳动者:编剧、摄影、场务、美术、妆造……

对于一个刚走出校门就发现入门级岗位正在消失的 22 岁年轻人来说,和爱奇艺所说的「演员保有确认权」,就跟「AI 将创造更多新岗位」这句话提供的安慰一样,画饼都画不出个像样的。

把所有的饼……哦不,所有的现状,拼在一起看,是 AI 所造成的供给侧狂飙与需求侧冷却,正在同时发生。这不是说某一家具体的公司、某一个具体的产品导致的,而是整条链路的传导都受到了影响。上游的每一个参与者都有充分的经济动机继续加速,而终端的人,无论是创作者还是观众,正在用各自的方式表达同一个意思:

我们不买账。

当内容的生产成本趋近于零,爆款率也趋近于零,观众的兴趣同样趋近于零,「娱乐产业」这四个字还意味着什么?也许它正在变成一种新的基础设施生意,就像修高速公路一样,收费站永远在赚钱,只是路上跑的车越来越少,而车上坐的人越来越无聊。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌