阅读视图
小米给全国汽车经销商发超一亿元“红包”
《疯狂动物城2》热度“带飞”线下,上海迪士尼主题园区年销售额实现10倍增长
元旦假期临近 海南机票预订量明显上涨
摩尔线程发布AI算力笔记本MTT AIBOOK,预售价9999元
摩尔线程发布“庐山”GPU芯片,AI性能提升64倍
AI 大神 Karpathy 2025 年度总结刷屏:AI 既是天才也是智障,这 6 个转折最关键

最近各种年度回顾陆续上线, OpenAI 的前联合创始人 Andrej Karpathy 也交出了自己对大模型的年度总结
就在今年早些时候,他在 YC 的一场演讲刷爆了全网,提出了不少新的观点:
- 软件 3.0 已来: 从最初的人写代码(1.0),到喂数据训练模型(2.0),现在我们进入了直接对模型「念咒语」(Prompt)的 3.0 时代。
- LLM 是新操作系统: 它不是像自来水一样的普通商品,而是一个负责调度内存(Context Window)和 CPU(推理算力)的复杂 OS。
- Agent 的十年: 别指望 AI Agent 一年就成熟,从 99% 到 99.999% 的可靠性,我们需要走上十年。
Karpathy 今天这篇《2025 年度总结》,他再次向我我们剖析了这一年 AI 究竟长出了什么样的「脑子」。
以下是对 Karpathy 年度总结的精译,APPSO 在不改变原意的基础上做了更多通俗解读。
如果想看原文可以点击
https://karpathy.bearblog.dev/year-in-review-2025/
2025 年是 LLM(大语言模型)发展强劲且充满变数的一年。以下是我列出的几点个人认为值得注意且稍感意外的「范式转变」——这些变化不仅重塑了行业版图,更在概念层面上狠狠地冲击了我的认知。
太长不看版:
2025 年既让人兴奋,又有点让人措手不及。
LLM 正在作为一种新型智能涌现,它同时比我预期的要聪明得多,也比我预期的要笨得多。
无论如何,它们极其有用。我认为即使以目前的能力,行业甚至还没挖掘出其潜力的 10%。同时,还有太多的想法可以尝试,从概念上讲,这个领域感觉依然广阔。正如我今年早些时候提到的,我同时(表面上矛盾地)相信:我们将看到持续快速的进步,但前方仍有大量艰苦的工作要做。
系好安全带,我们要发车了。
1. RLVR:教 AI 像做奥数题一样「思考」
在解释这个复杂的基础概念之前,先看看以前是大模型训练是怎么做的?
在 2025 年初,各大实验室训练 LLM 的「老三样」配方非常稳定:
1. 预训练(Pretraining):像 GPT-3 那样,让 AI 读遍全网文章,学会说话。
2. 监督微调(SFT):找人写好标准答案,教 AI 怎么回答问题。
3. 人类反馈强化学习(RLHF):让 AI 生成几个答案,人来打分,教它讨人喜欢。
现在发生了什么变化?
2025 年,我们在这个配方里加了一味猛药:RLVR(从可验证奖励中进行强化学习)。
这是什么意思?
简单来说,就是不再让人来打分(人太慢且主观),而是让 AI 去做那些「有标准答案」的任务,比如数学题或写代码。对就是对,错就是错,机器能自动验证。
在数百万次的自我博弈和试错中,模型自发地演化出了看似「推理」的策略。它们学会了先把大问题拆解成小步骤,甚至学会了「回过头来检查」这种高级技巧(参考 DeepSeek R1 论文)。
核心对比:
- 旧范式(RLHF): 像是教小孩写作文。因为没有标准答案,AI 很难知道自己哪一步想错了,只能模仿人类的语气。
- 新范式(RLVR): 像是把 AI 关进奥数训练营。不用教它具体怎么想,只要给它足够多的题和对错反馈,它自己就能摸索出解题套路。
这一招太好用了,以至于 2025 年大部分算力都被这只「吞金兽」吃掉了。结果就是:模型并没有变大,但训练时间变长了。 我们还获得了一个新旋钮:让 AI 思考得久一点。OpenAI 的 o1 是开端,而 o3 则是真正的拐点。
2. 幽灵 vs 动物:AI 不是「电子宠物」
2025 年,我和整个行业终于从直觉上理解了 LLM 智能的「形状」。
一个惊悚的比喻:我们不是在像养宠物一样「进化/养育动物」,我们是在「召唤幽灵」。
为什么这么说?
因为 AI 的一切都和生物不同。人类的大脑是为了在丛林里活下来、为了繁衍后代而优化的;而 LLM 的大脑是为了模仿人类文字、在数学题里拿分、在竞技场里骗赞而优化的。
参差不齐的智能(Jagged Intelligence):
正是因为 RLVR(可验证奖励)的存在,AI 的能力在某些领域(如数学、编程)会突然飙升成刺状。这就导致了一种极其滑稽的现象:
- 它同时是一个绝世天才(秒解高数题);
- 又是一个智障小学生(会被简单的逻辑陷阱骗得团团转)。

▲这里 Karpathy 引用了一张梗图:人类智能是圆润的蓝色圆圈,AI 智能是像海胆一样满是尖刺的红色图形。这很形象.
这也解释了为什么我对现在的「跑分榜单」(Benchmarks)失去了信任。
什么是「刷榜」的本质?
既然榜单是可验证的,那就可以用 RLVR 针对性训练。现在的实验室都在搞「应试教育」,把 AI 的能力尖刺专门往考题上长。「在测试集上训练」已经不仅仅是作弊,而成了一门新的艺术形式。
3. Cursor:不仅是编辑器,更是「包工头」

Cursor 今年的爆火,揭示了一个新真相:LLM 应用层比我们想象的要厚。
大家开始谈论「医疗界的 Cursor」、「法律界的 Cursor」。这些应用到底做了什么?
- 「上下文工程师」: 帮你整理好所有背景资料喂给 AI。
- 「工头」: 在后台偷偷指挥多个 LLM 干活,把复杂任务拆解,还要帮你省钱。
- 「遥控器」: 给你一个调节「自主性」的滑块,决定放手让 AI 干多少。
预测:大模型实验室(如 OpenAI)会负责培养「全科大学生」;而应用开发商(如 Cursor)则负责给这些学生提供私有数据和工具,把他们组建成「专业施工队」。
4. Claude Code:住在你电脑里的「赛博幽灵」

Claude Code (CC) 的出现让我眼前一亮。它不仅仅是一个能写代码的 Agent(智能体),更重要的是:它活在你的电脑里。
对比来看,我认为OpenAI 搞错了方向。
OpenAI 早期的 Agent 都在云端跑(ChatGPT),离你的真实环境太远。虽然云端智能体听起来像是 AGI 的终局,但在当前这个「参差不齐」的过渡阶段,本地才是王道。
为什么本地很重要?
因为你的代码、你的配置、你的密钥、你的混乱环境,都在本地。Anthropic(Claude 的母公司)搞对了优先级,他们把 AI 塞进了一个小小的命令行界面(CLI)里。
它不再是你浏览器里的一个网页(像 Google 那样),它变成了一个寄宿在你电脑里的「赛博幽灵」,随时准备帮你干活。这才是未来 AI 交互的样子。
5. Vibe Coding
什么是 Vibe Coding?
这是我在推特上随口造的一个词(居然火了):意思是写代码不再需要你真的懂语法,你只需要用英语描述你的「意图」和「感觉」,剩下的交给 AI。
这带来了什么改变?
- 对于普通人: 编程的门槛彻底消失了。
- 对于专家: 代码变得像纸巾一样「廉价、一次性、用完即弃」。
举个例子,我为了找一个 Bug,可能会让 AI 现场写一个专门的 App 来测试,测完就删。放在以前,为了找个 Bug 专门写个 App?疯了吧!但在 2025 年,代码是免费的。
Vibe Coding 将会彻底重塑软件行业,也会改写程序员的招聘 JD。
6. Nano Banana:AI 终于有了自己的「脸」

为什么现在的 AI 交互很反人类?
不管是 ChatGPT 还是 Claude,我们还在用「打字」跟它们聊天。这就像 80 年代还在用 DOS 命令行的黑底白字。
事实是: 计算机喜欢文本,但人类讨厌读文本。人类是视觉动物,我们喜欢看图、看表、看视频。
Google Gemini Nano banana(这是一个虚构的模型代号,指代某种多模态交互模型)是 2025 年的另一个范式转变。它暗示了未来的 LLM GUI(图形界面) 是什么样子的。
未来的 AI 不应该给你吐一堆字,它应该直接给你画一张图、生成一个网页、弹出一个交互面板。 这不仅仅是「画图」,而是将文本生成、逻辑推理和视觉表达纠缠在一起的混合能力。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
电影《阿凡达3》内地票房破2亿
蜜雪冰城美国首店正式开业
XREAL 1S 体验:巨幕随身带,不到三千块

这两天大家都在为《阿凡达 3》摩拳擦掌,而如何挑选影厅,到底该看 CINITY、IMAX 还是杜比,是个巨大的纠结——没关系,我们有一篇文章专门帮大家答疑解惑。
但如果你想要一块随身巨幕的话,我想在 2025 年底,没有比 XREAL 1S 更合适的(多么丝滑的转场!)

消费级增强现实 (AR) 眼镜的进步,基本上被 XREAL 这一家公司撑着。作为唯一同时具备自研空间计算芯片和自研光学系统能力的 AR 技术公司,XREAL 在「眼镜作为随身巨幕」的这个细分市场上,可以说让竞争对手望尘莫及。
这个优势,被 XREAL 最新发布的 1S 眼镜再次保持住了。
虽然实话来说,各方面和之前该公司发布的同为 One 系列的 AR 眼镜大差不差(都以随身巨幕为主要功能点),但这次 1S 的销售价格更加亲民,明摆着冲着年轻消费人群而来。
更重要的是,XREAL 独家自研的 X1 空间计算芯片,使得无设备歧视的纯原生云台增稳、极低 M2P 延迟的画面悬停等 3DoF 能力成为可能;以及 52° 的 FoV、自动电致变色——诸多过去只在旗舰机上才有的体验和功能,这台价格更亲民的 1S 更是一个没落下。
诚恳地讲,如果你只是需要一个随身巨幕,无论是飞机高铁看电影,还是日常当个隐私感更强的扩展屏,而且对体验颇为吹毛求疵的话,那么国补后价格打下来到了 2799 的新款 XREAL 1S,比价格更高的竞品,以及同品牌的前序产品,还要更物超所值。
爱范儿最近使用了 XREAL 1S 一个星期左右,主要场景是办公屏幕、看电影,以及外接手机在长途通勤时刷剧/打游戏,来说说这台随身巨幕眼镜的主要卖点和对应的体验。

很多 AR 眼镜都宣称自己有巨幕,但除了「巨」之外,一切其它的体验细节,诸如画面稳定性、动态延迟等等,都好像没有被顾及到。
XREAL 1S 则并非如此,它的屏幕不仅大,而且观感更「真实」:戴上眼镜,选定屏幕位置之后,屏幕能够一直稳定悬浮在选定的位置,无论怎样晃动、旋转头部,甚至摘下眼镜再戴上,那块屏幕都会一直在那里。
我觉得悬停效果的优劣,对于巨幕眼镜的体验好坏起到决定性作用。稳定的悬浮,让画面感到真实,能够显著改善 AR 眼镜的眩晕问题。AR 眼镜的可视角度逐渐增广,显示面积越来越大,但既然我们把它当做一块巨幕,那么画面的稳定性才更重要。
这就好比你沉浸在一部电影那引人入胜的剧情当中,旁边有人喊你,你转了个头,再转回来的时候,画面的位置突然变了,沉浸感没了,那不会是好的观影体验。悬停效果的好坏,其实和人类视觉的「直觉性」关系很大。而越符合直觉,体验就会越好。

现在我们建立了「画面空间悬浮固定」很重要这个前提。在此基础上,更进一步,我认为画面能够跟随用户的需要,及时移动位置,且过程中保持稳定和顺滑,同样很重要。
如果需要移动画面位置,XREAL 做了一个很简单的设计:长按镜腿下方的 X 按钮,也就是眼镜上唯一的红色按钮/主要的交互按钮,即可重新定位画面。你不需要进入多级菜单,绕来绕去,即可完成操作。

这个功能的背后有多重场景考虑:比方说你脖子酸了,后仰靠在椅背上,可以把画面重新定位到仰角更高的位置,来放松一下脖子;再比如,当你临时需要在多个屏幕上进行多任务操作,可以将眼镜当做副屏,把画面重新定位到桌面主显示屏的旁边(当你转头看回主屏幕的时候,镜片还会自动变色,让你能够清晰看到主屏幕上的内容)——无论场景是什么,这个功能都很方便。
而与悬停模式平行的,是另一个模式:云台跟随。同样无需任何外挂传感、适配器、第三方软件,在跟随模式下,1S 的画面能够实现类似「云台」一样的稳定效果,无论是下意识的头部/脖子轻微晃动,还是大幅度的活动,画面都会在一定范围内保持稳定,只在动作幅度足够大的时候,才会顺滑地跟随。

上述的画面悬浮锁定、云台防抖等功能的背后,是 XREAL 自研 X1 空间计算芯片的功劳。这颗芯片不仅能够实现优秀的原生 3DoF 能力,另一大作用是显著降低了 M2P(motion to photon)延迟,也即从「用户头部运动开始」到「渲染图像发生相应变化」中间的延迟。
XREAL 的官方数据显示,没有 X1 芯片时,数据处理的链路较长,甚至需要视频输入源设备(电脑、手机等)的 CPU 和 GPU 运算,M2P 延迟可能超过 20 毫秒,延迟是肉眼可察觉,是反直觉的,会加重眩晕效果。
而基于 X1 芯片的数据处理链路,眼镜本地获取运动数据,本地芯片完成计算并矫正视频图像,直接反应到屏幕上,M2P 延迟最低可以达到 2 毫秒,已经进入肉眼不可察觉的区间。

X1 芯片还有其他重要的作用,比如从过去的逐帧画面补偿,进化为逐行补偿。在画面悬停模式下,向左右方向大幅度歪头的时候,你就会发现逐行补偿的强大之处,即便大角度倾斜,画面本身的显示,和画面的位置,仍然稳如泰山(只有在角度超过了计算极限的时候才会熄屏)。
至于在内容消费体验上最有意思的,还得是 3D 模式——就像当年第一次用上任天堂 3DS 一样奇妙。纯靠 X1 芯片自身的算力,将任何传统 2D 内容转化为 3D 显示效果,哪怕只是追个剧,看个下饭视频,都能获得不一样的体验。
说到下饭,戴着 1S 吃饭这件事我还真试了一下……它有三档可调的电致变色,所以在任何环境下都可以调整成我需要的通透效果。以及在悬停模式下视线移动到屏幕以外的位置,1S 会自动切换到无色的通透模式。
这样就可以做到:低头扒口饭,抬头接着看……

52° 视场角或许还不够宽,但基本达到了「不转动眼球即可清晰感知」的视野上限

除此之外, XREAL One 系列标配的 Sound by Bose 定制音效,1S 也没有落下;700 尼特的入眼亮度,结合电致变色,在显示效果和护眼之间取得平衡。索尼 0.68 英寸 Micro-OLED 配合双眼 1200p 分辨率,并且支持常规屏幕、超宽屏模式,以及搭配电脑的多种分辨率/屏幕比例可调,让 1S 的使用方式更加多样。
比如工作时候就开 1.6:1 的全尺寸显示,画幅更高、显示内容更多。观看影视作品,换成超宽屏则沉浸感更强。

最重要的可能还是价格:1S 的官方定价 3299 元,国补/各类补贴后的参考价格在 2799 元浮动,成功打进 2500-3000 价位段。要知道这个区间里,在此之前是没有 1S 性能和体验水准的产品的。
这也是为什么我在标题里说:不到三千块,巨幕随身带。

在我看来,这句话就是 XREAL 1S 的精髓。1S 是一块各方面素质顶级,且产品定义设计充分考虑了 AR 眼镜关键痛点的「随身巨幕」。而如果你对这个细分市场有兴趣,经常长途通勤需要一块随身巨幕,那么在当前这个时间点上,似乎真的没有比 1S 更合适的替代品……
——直到 XREAL 这家进化速度极快的公司,再次用更强大的新产品「背刺」老用户之时。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
上海电气与中交集团升级全面战略合作
华为Pura X官宣降价
软银据悉正推动其支付应用运营商PayPay上市
摩尔线程发布新一代GPU架构花港 支持10万卡以上规模智算集群
中国长安新能源汽车年销量突破100万辆
摩根士丹利有望牵头SpaceX IPO
字节跳动全年利润500亿美元?知情人士回应
2025年上汽MG欧洲销量突破30万辆
相亲角的真相:不是男的没了,而是不玩了

我们都知道咱们国家是男多女少,但是现在的相亲会为什么会变为闺蜜局呢?男的都去哪了呢?这个看似悖论的问题,却能把当代我国婚恋、性别、经济和文化的若干基本矛盾直接拽到台面上。简单答案是:人口统计意义上的“男多”,并不等于婚恋市场上“可被选择的适婚男性多”;而更深的答案是,制度化的择偶门槛、地域与教育的错配,经济压力与性别期待的双重作用,正把大量男性“挤出”或“劝退”出传统相亲市场。换句话说,“男的不是没了,而是不玩了”......
下载虎嗅APP,第一时间获取深度独到的商业科技资讯,连接更多创新人群与线下活动