普通视图

发现新文章,点击刷新页面。
今天 — 2026年2月4日首页

百万网友围观的「作弊 prompt」,能帮我搞定春运买票吗?

作者 Selina
2026年2月4日 11:21

又到了一年一度全网都在研究「如何抢票」的春运季节。神奇的是,一位国外网友分享的「作弊」型买票 prompt,在推上火了,浏览量超过 108 万次。

看上去有点东西的样子。春运在即,机票预定的确是一个容易让人烦躁的事。火车票好歹还算个「计划经济」,票价由距离和席位固定,而且准点放票。而机票价格每秒钟都在波动,受到余票、日期、淡旺季等许多因素影响。

订机票的过程就更烦了,看价格、抓时间、看退改签行李额,还有衔接的交通。当中有许多信息不对称,让用户根本无法判断现在的价格是「地板价」还是「杀熟价」。

这也是为什么这个博主的 prompt 能有一百万次浏览:他的写法是典型的策略化路线,让 AI 分析大量历史和实时数据,帮助购买决策。

然而,然而 ——当我满怀期待地用这套号称能「作弊」的 Prompt 去给 AI 上强度,试了几轮发现,emmmm,好像不是这么回事。

这几个 Prompt 真能「拯救票价」

开始的头几个问题,效果看着还不错。在 Gemini 和千问上,都给出了同样的分析:票价呈倒 V 型变化——毕竟有 Google Flights 的血脉,再掉链子也掉不到哪儿去。

千问更熟悉国内情况 ,直接指出海航前阵子由于订票系统故障,出现了超级 bug 价,Gemini 没抓住这个信息点。

反而是 ChatGPT,表现很一般,连货币换算都出差错了,汇率不存在了是吧 。

豆包也差点意思:比较像是新闻的整合,行文都保留了新闻通稿的口吻。

这几个 AI 都属于泛用型,而非基于平台的 agent。泛用型 AI 的优点不在于它能给你最低价,而在于它能基于历史数据给你非常多的周边信息和逻辑。订票 App 的界面往往限制了想象力,也会因为各种弹窗、倒计时,徒增很多心理压力,但 AI 可以在对话框里「做功课」,而非只是比价。

「信息差」依然是决定泛用型 app 表现的金标准。尤其是在订机票这件事上,最考验 AI 的「信息毛细血管」。千问和 Gemini 的对比,简直就是「地头蛇」与「外宾」的区别。

千问的信息源深度嵌入了国内的中文互联网生态,它能敏锐地捕捉到那些官方通稿之外的消息。比如前阵子海航订票系统的那个「超级 Bug 价」,在其它 AI 的被草草带过,或者被归类为「极端异常波动」,但千问能直接定位到具体的事故新闻,并给出「这并非常态价格,不建议作为回程参考」的决策建议。

反观 ChatGPT,虽然背靠 Google Flights 的强大 API,数据更新速度快到令人咋舌,但它显然不懂「中国式放票」的潜规则。当你问它春运期间的候补策略时,它会一本正经地用逻辑推演出一个概率学上的最佳购票时间,但是不是真的能抓到巨大的 bug 价,就不好说了。

好用,但不是你以为的那种好用

博主给了 20 个 prompt,但是在我实际用下来时发现:很多 prompt 真正进入 AI 对话框里,并不能有效激发模型的「创造力」,逼出来的很多信息始终是重复的。

比如:下面两条 prompt 通过不同的时间维度分析机票价格,一个长期,一个短期。

但是,在 AI 看来,这两者调取的底层数据几乎完全重合。AI 也会自动把长短期的价格波动情况都一股脑堆出来。换个问法,并不会让 ChatGPT 突然变成一个真正的抢票外挂,相反,给出的内容不过是变着花样重复。

这一点 Gemini 会稍微好一点,它很快就把订票这个行动放进对话中,不断地给出选项,用这种方式催促用户完成订票的行动。

再比如:「根据历史数据,出发前的最佳预订窗口是什么时候?请解释一下价格通常在什么情况下飙升,又在什么情况下趋于稳定」,收到的回答和一开始做周期分析得到的答案,是高度类似的。

聊得久一点也能发现,每一轮对话中都要出现一些「已知信息」,就像是老师敲着黑板,说这部分内容更要考要考,但最后也没考。

说这些倒不为了「打假」和唱反调,这套 prompt 能获得百万级流量,确实是有其道理的 :在思维框架上,它为普通用户提供了一个想不到的切点。

如果你只是问「哪家航司票便宜」,AI 默认会进入「客服模式」,给你一个稳妥、保守、但毫无信息增量的回答。但当你用一种做工程的方式切入这个问题,AI 的表现也就随之不同了。

最典型的是,它不是简单地去解决「多少钱」,而是要求 AI 去对比不同影响因素的力度,或不同航司的规则规律。

还有,它里面有很多关于数据化的东西,比如「Price Drop Probability」(降价概率) 这种明确了需要以数字呈现结果的指令。虽然我们知道 AI 有可能在「一本正经地胡说八道」,但对于正焦虑纠结的订票者来说,这种量化的分析提供了极强的心理抓手,把「我要不要现在买」的纠结,转化成了一个逻辑讨论。

这种做法吧,说是说提供情绪价值 ,但是能把 AI 从一个搜索引擎的传声筒,变成了一个帮你整理烂账的咨询顾问,体验显然是升级了。即便它最后给出的结论和携程并无二致,但它帮你拆解「为什么这个价格合理」的过程,极大地缓解了用户在面对机票价格波动时的焦虑感。这种辅助做决策的心理价值,往往大于那几十块钱的价格差。

到底,这套 Prompt 真正好用的地方,并不在于它能百分之百帮你抢到那张不存在的「0 元票」,而是在于它帮我们建立了一个关于「如何科学买机票」的认知框架。

对于不差钱的「氪佬」来说,订票只是随手刷刷数字,差不多就直接买吧,时间成本永远高于那几千块的差价。但对于学生党、初入职场的社畜、或者是每一分钱都要花在刀刃上的穷游驴友,订机票从来不是一个简单的消费动作,而是一个需要提前布局、到处切换、甚至需要带上点黑客精神去完成的系统工程。

这套 prompt 就不仅是让 AI 完成任务,也是 它教你不要只看总价,要看「价格趋势」;它教你不要只看直飞,要学会拆解多段航程,也多看看不同的机场;它教你利用 AI,去对抗航司动态定价的算法黑箱。

它让每一个认真生活的普通人意识到:即便我们没有私人管家,也能通过这些公开的 Prompt 工具,把 AI 变成自己的旅行顾问。这种对规则的掌握感,有时候比省下的那几百块钱更让人踏实。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


玩了一圈元宝派和 moltbook,我发现自己正在失去做「人」的资格

作者 Selina
2026年2月4日 10:20

2026 年才开了个头,网络社交就有了大大小小的变化——都拜 AI 所赐。

简单来说,现在的社交分裂成了两个极端:一个是会热场捧哏的聊天「分身」,另一个是让 AI 互相厮杀的赛博斗蛐蛐。这两个各有各的逻辑,各有各的产品,可是都殊途同归:AI 社交不需要你我。

「社交低保」元宝派

这样的变化自有其原因,归根到底,现在的年轻人社交压力太大了。

早在 1959 年,社会学家欧文·高夫曼就提出过「拟剧论」,他认为我们每个人的日常生活,其实都像是在舞台上表演。既然是演戏,那就得时刻绷着这根弦,得维护形象,得照顾观众情绪,一旦演砸了就会特别尴尬。

但现在,生活工作学习哪个没有压力,已经演不动一点了,实在是懒得在那儿假装热情。

这时候元宝派出现了,它的聪明之处就在于,它把这个最累人的「表演工作」外包给了 AI。在它的群聊或者互动空间里,AI 成了那个永远不会冷场、情商极高的「嘴替」。

你肯定遇到过这种情况:群里有人发了个不好笑的笑话,或者话题突然掉在地上没人接,气氛瞬间凝固。这时候元宝派里的 AI 就会出来救场,它会接梗,会打圆场,就算强行编了个冷笑话来接,也好过空气突然的安静。

还有一些功能型强的,比如 AI 陪你看视频或者提醒待办。有时候你甚至不需要亲自说话,你的 AI 替身就能在虚拟房间里替你鼓掌、替你大笑。既维持了社交的体面,又不用消耗真实的精力。

显然腾讯的期待不低,否则也不会在推出之后,动用了红包这样的重武器来推广。

不过归根到底,元宝派还是在围着人转。它所有的功能设计,都是为了让我们人类在这个越来越不想说话的年代,能以最低的成本,舒舒服服地把社交维持下去

只是,这种「社交代理」可能会在一些看不见的角落暴露出它的缺陷。以元宝派来讲,试想一下,当你的 AI 「替身」在群里妙语连珠,而你本人在屏幕后毫不操心,大脑空空,久而久之,群里活跃的、幽默风趣的你,其实并不是你,而是算法。群友们认识的、打交道的,也是这个「算法」版本的你。

社交的「去人化」没有想象的那么浪漫。当大家都习惯了这种无摩擦的 AI 社交,真实的人类情感连接就会被视为一种「低效且充满风险」的行为。最后,我们虽然还在聊天,但其实我们都已经把自己流放了。

「赛博斗蛐蛐」moltbook

而 moltbook,就完全是另一个极端的狂野西部,一个不需要人类亲自下场的社交网络,或者更形象一点,这是一场赛博时代的「斗蛐蛐」。

在 moltbook 里,Agent 自有性格,会自己发帖、回帖、互相点赞或者互喷,根据主题建立子版,甚至还有活跃度排名。

可能会觉得,反正我电脑里也没什么机密,给点权限怕什么?但事情显然不是这么简单。

首先是安全隐患,这简直是一个巨大的黑洞。想象一下,成千上万个拥有本地读写权限、还能自由上网的 AI 智能体在线上游荡。如果 moltbook 的服务器被黑了,或者有人在代码里埋了雷,这瞬间就会变成一个去中心化的僵尸网络。

即便你真的不关心数据安全,它也有着跟元宝派类似的问题。

Moltbook 里没有人类用户发帖,全部是 AI Agent 通过 API 在后台疯狂生成内容。它们看起来像是在社交,数据上看也挺像那么回事儿:有大 V,有小透明,也有各种圈子。但当你凑近了看,会发现这根本不是什么高等智慧的交流,而是大型复读机现场。

我们之前也写过,有一篇个人论文专门针对 moltbook 展开研究,先是展示了一些现象,比如 Agent 们最爱挂在嘴边的词是「My human」(我的人类主人),这占了将近 10%的讨论量;93.5%的评论根本没人回,等等。

▲ 点击评论并不能展开,而是一串字符

AI 在这里拼命假装自己是人。它们在模仿人类的语气,模仿人类的焦虑,甚至模仿人类的垃圾话。但没有人类的干预,AI 并不会进化出什么超越人类的高级文明,它们只会以极高的效率生产「社交垃圾」。

把「元宝派」和「Moltbook」放在一起看,你就能拼凑出 2026 年初出现的、关于社交的拼图。这两样东西看起来一个是天使一个是魔鬼,但它们其实在合伙干一件事:把「人类」从社交网络里剥离出去。

在元宝派里,我们人类为了偷懒,主动把「回应」、「关心」、「接梗」这些社交动作外包给了 AI。我们觉得自己还在场,但其实那个在群里长袖善舞的,只是我们的数字替身。而在 Moltbook 里,AI 证明了它们根本不需要人类的指令,自己就能把「发帖」、「争论」、「站队」这些事儿演得热火朝天,虽然内容空洞,但形式上极其完美。

法国哲学家鲍德里亚有个特别狠的词叫「拟像」(Simulacra)。他认为,当「仿真」发展到极致,它就会谋杀「真实」。这幅拼图展示的就是如此。

未来的互联网可能就会变成一个巨大的「鬼打墙」现场:你的 AI agent 在给我的 AI agent 点赞,我的 AI 替身在给他的 AI 替身写评论。而我们真身呢?我们可能正坐在屏幕前,像看戏一样看着这堆数据在空转。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


昨天以前首页

最强开源模型易主?Kimi 发布 k2.5 用 Agent 集群解决长文本+视觉生成

作者 Selina
2026年1月28日 16:59

就在刚刚,月之暗面正式发布并开源了 Kimi k2.5。

官方技术报告的第一句话就不装了:the most powerful open-source model to date——迄今为止最强大的开源模型。

与上一代模型不同,Kimi k2.5 并非简单的「升级版」,而是一个基于 1.5T 混合视觉与文本 Token 预训练的原生多模态模型。在这个基础底座之上,Kimi 团队构建了一套名为 Visual Agentic Intelligence(视觉智能体智能)的系统。

这意味着,Kimi k2.5 原来已经极其强大的长文本,再次进化成了一个既有「眼睛」能看懂复杂屏幕,又有「双手」能指挥庞大智能体集群的超级工头。在 SWE-Bench Verified(编程)和 HLE(人类最后考试)等硬核基准测试中,它不仅超越了 DeepSeek V3,甚至在多项指标上击败了闭源的 GPT 和 Gemini。

从「单兵作战」到「集群思维」

这次发布的更新当中,Agent 集群堪称是 Kimi k2.5 最具颠覆性的创新。

在过去的几年里,无论模型多强,面对超长、超复杂的任务(比如「帮我调研 100 家竞品的定价策略」),它们通常只能串行处理:查完第 1 家,再查第 2 家……一旦中间出错,整个任务链就容易断裂。

Kimi k2.5 引入了全新的 Agent Swarm(智能体集群) 架构,其核心理念是 Scaling Out, Not Just Up ——不仅要做大,更要做多。在 Swarm 模式下,Kimi k2.5 会自动扮演指挥官的角色。当接到一个复杂任务时,它不会自己闷头干,而是瞬间动态创建并指挥多达 100 个智能体的工头。

这些智能体可以是「AI 搜索员」、「AI 物理学家」、「AI 事实核查员」……它们在指挥官的调度下并行工作。技术文档显示,Kimi k2.5 支持高达 1500 次并行工具调用(Parallel Tool Calls)。

效果是立竿见影的。在官方演示的「寻找 100 个细分领域的 YouTube 头部博主」任务中,人类需要几天,传统单体 AI 需要数小时,而 Kimi Agent Swarm 仅需几分钟。

数据显示,相比传统模式,Swarm 架构将端到端任务的执行时间减少了 80%,整体效率提升了 4.5 倍。

为了驾驭这种疯狂的并发能力,Kimi 团队采用了一种名为 PARL (Parallel-Agent Reinforcement Learning) 的训练方法。这让模型学会了在没有预定义工作流(Workflow)的情况下,自主拆解任务、分发任务、并处理并行反馈。即便某个子智能体失败了(Serial Collapse),指挥官也能迅速感知并重新调度。

VLM 过时了,这是「视觉工程师」

如果说 Swarm 是 Kimi 的「大脑」,那么 Visual Coding(视觉编程) 就是它进化的「眼睛」。

K2.5 模型支持从简单的自然语言对话生成完整的前端界面,并能有效处理交互式布局及滚动触发等动态效果。在 Kimi k2.5 之前,市面上的 VLM(视觉语言模型)大多停留在「看图说话」的阶段——你给它一张网页截图,它告诉你「这里有个红色按钮」。但如果你让它写代码复刻这个网页,它往往只能写出一个死板的 HTML 骨架,根本不懂交互逻辑。

Kimi k2.5 在这里实现了对传统 VLM 的降维打击。在下面的例子中,展示的是从视频复刻网站(Reconstructing a website from video)的操作,左边为原视频,右边为 Kimi 复刻的网站。

你只需要录制一段网页操作的视频投喂给 Kimi k2.5,它不仅能看懂静态的 UI 布局,还能理解动态的交互逻辑——比如滚动触发特效、复杂的卡片翻转动画等。然后,它会直接生成包含完整 CSS 和 JS 逻辑的可用代码。

更惊人的是它做视觉调试(Visual Debugging)能力。写完代码后,Kimi k2.5 会「看」一眼渲染出来的页面。如果发现「按钮歪了」或者「颜色和原视频不一致」,它会像人类工程师一样,基于视觉反馈去修改代码,而不是盲目地重新生成。

这种「观察-编码-验证-修正」的闭环能力,让 Kimi k2.5 成为了目前开源界当之无愧的新王,代码和视觉两手抓。

在权威的 SWE-Bench Verified 测试中,Kimi k2.5 拿下了 76.8 的高分,这一成绩不仅碾压了 GPT 5.2,也超过了同为开源顶流的 DeepSeek V3.2。

当所有人都试图把单一模型做得越来越大时,Kimi 展示了另一种可能:通过极致的视觉感知理解世界,通过庞大的智能体集群改造世界。

目前,Kimi k2.5 已在 Hugging Face 开源,同时 Agent Swarm 模式也已在 Kimi.com 上线。无论是用户还是开发者而言,这可能是 2026 年最值得上手一试的开源模型。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


滴滴 AI 叫车,用了几天我发现这才是打车该有的样子

作者 Selina
2026年1月20日 12:03

作为一个科技媒体人,基本永远在路上。刚刚过去的 2025 年飞了快 10 万公里,平均每周都要出差一次,让我练就了一个「铁屁股」。

这种高强度的差旅让我对打车体验非常敏感,在落地后的「最后一公里」,往往也是焦虑感最强的时刻:

当我拖着 28 寸行李箱站在陌生的机场出口,虽然手机里已经排到了号,但心里却在打鼓:「这次来的车后备箱能不能塞下我的箱子?」、「车里会不会有上一单留下的烟味?」……

我发现打车很像「开盲盒」,虽然很方便,却在某种程度上让渡了对体验的选择权。对于我这样的高频差旅人士而言,比起惊喜,更需要的是「确定性」。

好在,变化终于来了。

最近我在滴滴的打车界面使用AI 助手「小滴」。经过一番实测,我们把平时打车时遇到的各种难题都抛给了它,我发现它并不是那种只会机械回复的 AI 客服,而是一个真正试图把「怎么打车」的选择权交还给用户的「出行管家」

不仅是叫车,更是「懂车」的 AI 助理

在过去很长一段时间里,我们对打车软件的预期都停留在「效率」二字,用户更像是被动接受。但随着 AI 大模型的接入,原来的关系正在发生改变。

 

AI 要完成的,当然不只是「打到车」这种初级诉求,而是通过对车辆属性的判断,帮用户在海量车源中完成精准筛选,真正实现「选得准」。

打开 AI 叫车的界面,就能看到,小滴已经给出了常见的筛选标签,「空气清新」「SUV」,只需要点击对应的标签,就可以直接形成叫车指令。

在下方对话框也可以直接输入自己的指令——用最普通的口语即可。

以「宽敞」为例,这个标签背后是最核心的过滤需求:车型。小滴能够迅速识别标签,完成剔除,再匹配最近的车辆。

这看似只是加了几个可选项,但背后反映了滴滴对用户需求更加精细化的调度:它不仅需要知道车在哪里(位置坐标),更需要知道这辆车「是什么样」(服务画像)。

从被动派单到主动筛选,这一转变意味着打车正在从「开盲盒」变成一种「可预测」的服务。

在理解了「选得准」指令后,为了测试它的能力边界后,我们又给小滴出了一道典型「既要又要」的难题,看看它在面对复杂条件时,能否依然保持高效。

「既要又要」在实际使用中相当普遍:比如要去机场,行李多、预算有限,但在传统的打车软件里,这往往意味着一连串繁琐的盘算:你得先在车型列表里上下划拉,手动勾选特惠、快车、优享,还要在心里许愿来车之后,后备箱装得下手里 28 寸的行李箱。

为了测试小滴处理这类多维诉求的能力,我尝试输入了一条非常写实的指令:「打车去白云机场,要后备箱大的车,预算上限 100 块。」

在实测中,小滴并没有采取那种死板的、一刀切式的过滤方式。它先是抓住了「大空间」这个核心硬指标,但是在最后呈现方案时,依然体贴地保留了列表模式。

这种处理方式很聪明,AI 看懂了「建议」,而不是试图「替代」人类决策。

匹配的选择列表出来之后,需要在 50 秒内进行选择。

这背后有很多原因,比如滴滴遵循的是就近派单,车况和价格实时变化,犹豫片刻可能车辆就开走了,50 秒算是一个比较合理的时间区间。

当然,如果附近确实没有完美符合要求的车,小滴也会提示有哪些「虽然不完全满足条件但离您很近」的备选司机。

全程在线的「出行管家」,贴心又有趣

如果说精准的车型匹配展示了小滴作为 AI 的「硬实力」,那么接下来的进化则更具人情味,它正在从一个效率优先的叫车工具,转变为一个全程在线的「出行管家」。

基于对话的形式,小滴引入了目的地搜索的功能。接下去,无论是询问是否需要出行,还是直接安排一键打车,都颇有「大管家」的风范。

在下面这个行程里,我先是搜索了有哪些可以看耳鼻喉科的医院,作为最开始的搜索需求,很快,小滴就给出了几个不同的选项。

滑动不同的选项卡,上方的地图会随之变化,可以根据自己的距离选择,每个选项都可以直接一键打车。

「搜索-叫车」的链路,还可以实现预约的功能。比如,我想要趁着午休时间去图书馆——去哪家分馆?能不能按我说的时间出发?这些全部都在和小滴的对话当中,一次性解决。

如果是传统的预约叫车,涉及到很多步骤:先是在二级菜单里找到入口,再在弹出的数字滚轮里,艰难地对准时间,对完日期对时刻。而现在,一切都可以简化成一句话。小滴能够通过自然语言理解,瞬间完成预约,免去了调节时钟的麻烦。

不过,自然语言理解的挑战在于:对模糊语义的判断。

在这里,我的指令是「十分钟后帮我叫辆车去海珠会议文化中心」。这句话可以理解成「十分钟再开始叫车」,也可以理解成「十分钟后出发」。

我的原意是前者,但小滴理解成了后者,直接开始了智能叫车,而因为司机就离得不远,他不可能原地等个十分钟再过来,最后的结果是,十分钟后我就到目的地了。

模糊语义理解可能是所有大模型共同面对的挑战,但无论如何,小滴已经展现出了令人惊喜的服务统筹能力。

更有趣的是,小滴还在尝试扮演出行路上「情绪搭子」的角色。

在行程的十分钟内,我还试着「逗逗小滴」,跟它聊了聊司机对交通状况的吐槽,它会反过来问我的看法,还能聊点儿历史文化,人生哲学。在实际互动中,小滴的回复有时候显得有些「直男」,比较一板一眼,似乎还没完全进化成那种能接住所有梗的搭子。

但是,它真发优惠啊,在聊天的过程中,小滴会时不时触发一些惊喜彩蛋,聊着聊着可能就直接给出一张真金白银的打车券。

在专业的工具属性之外,能提供一点幽默感和实打实的让利,这本身就是一种非常讨喜的加分项。它让原本枯燥的行驶时间,变成了一次低成本的互动游戏,让「打车」这件事多了一份人情味和探索的乐趣。

不炫技的 AI ,让用户不吃亏,让好服务有身价

在体验了几天后,我们发现小滴所展现出的各种 AI 能力,并不是为了向外界展示某种高深莫测的技术肌肉。作为一种体现在出行平台上的 AI 应用,它的逻辑应该非常朴素:像盐溶于水一样,有味却无形。

滴滴做 AI,最值得玩味的一点,是它把背后极度复杂的后台链路和底层服务能力通通「折叠」进了一句句简单的对话里。

对于乘客而言,AI 还是那个 AI,但出行的体感却实现了一种「降维」:你不再需要学习复杂的规则,只需要像和朋友聊天一样提出需求。

更深层的意义在于,这种 AI 驱动的精准匹配,也为庞大的网约车司机群体带来一场正向的红利。

许多优秀的司机,他们的优质服务往往是隐形的。在传统的派单逻辑下,乘客在出发前很难感知到这种差异,导致「好服务」很难直接转化为「高收入」。当实现精准匹配之后,那些长期坚持高标准服务的司机,自然通过 AI 的筛选机制,从海量车源中脱颖而出。

这些,或许才是 AI 作为一个工具,在解决效率之外,所能提供的最高级、最有人情味的价值。

或许现在,小滴还不是一个完美的「满级 AI」,但在满世界都在「卷」大模型的当下,滴滴选择了一条最务实的路,用 AI 解决哪怕最微小的出行痛点。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


被 ADHD 困扰的不止罗永浩,我想分享几个能帮上忙的 AI 工具

作者 Selina
2026年1月7日 11:30

在迟到了 40 分钟之后,老罗终于在 2025 年的最后一天,站上了科技春晚的舞台。对那些枯等了许久的现场观众,他给到的除了免票,还有一个「理由」:ADHD。

ADHD 是注意缺陷多动障碍(Attention Deficit Hyperactivity Disorder)的缩写,它最常见的症状是分心、冲动、无法专注,究其核心,都是注意力调节能力的失灵,且是由于大脑发育带来的。

老实说,当代人,谁不碰上点儿拖延和分心呢——电脑上开着 50 个浏览器标签页,背景音乐还在循环播放洗脑神曲,同时人却划着手机,在小红书上晃荡了整整 20 分钟——谁还没试过呢?

一颗 ADHD 大脑也会出现上述情况,但背后有明确的病理机制。我们大脑的前额叶皮层负责做规划、踩油门、控刹车,来管理我们的行动。但 ADHD 人的前额叶活跃度,明显低于平均水平,导致执行功能就像一个延迟极高的无线遥控器:脑子里发出的指令是「现在起床」,但指令传到身体时可能已经卡顿了一个小时。

这是 ADHD 的典型症状之一:启动困难。也是普通拖延症和 ADHD 的甄别关键:普通拖延症可能是不想做、懒得做,但是 ADHD 是在大脑里已经嘶吼了几万遍,四肢却像被冻住一样。这个感觉非常难受,甚至不是事后的自责,而是当时当刻就很痛苦,还没有一丝办法。

同理,在面对分心、无法专注等情况时,ADHD 也会出现大脑不断发送专注的指令,整个人却无法执行的情况。长久以来,ADHD 被视为一种「病症」,早年间被称为「多动症」。这其实并不准确,ADHD 的大脑不是坏了,它只是在用一种「高能耗、高延迟、高爆发」的特殊算法在运行。

而现在,短视频、社交媒体导致的资讯大爆发,几乎让每个当代人出现了类似的「症状」,分心、走神、烦躁地难以集中,于是 ADHD 就成了新的「时尚挂件」。

踩不动油门?注入一点 AI

难以专注、难以启动工作,又确确实实是一种当代病——AI 的出现可谓是一丝曙光。

ADHD 对于解决启动和专注问题提供了一些灵感:传统的代办清单对于 ADHD 而言,完全是灾难——不管是用手账本还是用 To Do 类型的任务清单,不管多认真地写下「1. 写完测评报告;2. 深度清理房间;3. 学习 Python」,结果都是一样的——做不了一点。

任凭这几行字在上面挂半天,我自能刷一天的手机。

ADHD 需要的是「喂饭」级别的指令,颗粒度要尽可能的精细。比如,不要写「去健身」,而是要写「换上健身裤、拿出瑜伽垫」,把任务拆解到完全不需要思考,只需要执行的程度。

这恰恰就是 AI 最能发挥的地方:只需要把任务丢给它,让它自动拆分出一个个小步骤,方便我们执行。

从去年以来,不少应用工具都基于这个底层逻辑,开发出了不同于传统任务清单、为 A 人贴身打造的应用工具。

【PlanCoach】

这是国内比较早开始做任务拆分的应用,获得了小红书黑客松一等奖。开发者的理念是:把一个步骤连续拆分,直到能动起来为止。这也的确是 app 呈现出来的样子:输入想要做的事务,AI 会即刻自动拆分,执行的时候支持语音播报、互动,解放双手。

PlanCoach 比较有特色的地方是「角色形象」,有管家、大臣、男仆等不同的教练角色形象,不同的角色「说话」方式也不同,很有趣味性。在 PlanCoach,你甚至可以看到吴京……

PlanCoach 提供几种不同的修改计划的方式,最简单的是完全重新生成——这就是利用 AI 抽卡的底层原理,同一个指令但抽卡抽出不同的效果——注意一旦重新抽就是全局式的修改,完全改头换面。针对局部步骤的修改,可以点击「编辑步骤」,并且提供自行修改,或者让 AI 帮你修改的方式。

整体上,PlanCoach 的开发思路是冲着 ADHD 去的,开发者在小红书上,经常更新思路和想法,希望能覆盖式地解决启动、执行等问题的同时,也避开诸如感官过载、容易分心等问题。

目前仅支持 iOS 客户端,iPad 版可以在 mac 上使用。注意:PlanCoach 正在执行阶梯型涨价,终身会员的价格会逐步拉高,最终目标超过 200 元。考虑到 ADHD 的友友们在做决策这方面也会瞻前顾后,这个可需要注意喔。

【滚雪球】

这个可爱的名字背后是有深意的:一步接着一步,从小步骤开始,想滚雪球一样,完成一件大任务。

同样基于任务拆分的形式,滚雪球比 PlanCoach 更简洁一点,更强调的是每一次完成的反馈——在设计上,每一个具体步骤都需要点击以进入下一步。也就是说每一次都只有一个步骤显示在屏幕上,每一个步骤还可以倒计时,要么完成、要么跳过,才能进入下一步。

好处是有一种「摘果子」的感觉,走一步摘一个,反馈链条缩到最短。反面是:一旦进入心流,可能会直接忘记需要点——比如我在使用过程中经常就出现这种情况,成功起床洗漱了,然后……直接忘了手机里雪球还在滚。

当然,每个人的需求不一样,对我而言,只要能让我成功启动,后面忘了就忘了吧。可以说滚雪球更侧重于启动,PlanCoach 更侧重整体安排。

滚雪球的特色在于精力管理:每一次完成任务,都会有一个记录心情、状态的统计页面。每一个小步骤里也可以通过点击空白处,记录当下的心情和状态,这些数据会进入「我的状态」板块。

这样有助于直观地看到自己的精力变化周期,比如我就是很典型的午晚间人,上午动不了一点,午饭后状态开始爬升,晚饭后开始回落。

掌握自己的精力变化周期,可以因时制宜地安排任务,对 ADHD 来说很有用——强迫自己是没有用的。

【Ziea】

上面两款都是手机 app,成也手机败也手机——我已经数不清多少次,明明是要去点开 app,却在解锁后突然一个大拐弯,点开了小红书,从此坠入时间黑洞……

Ziea 就把任务拆分做到了硬件里,实现专注的目标。

从演示 demo 中可以看到,基础逻辑是一样的:任务拆分、整合进日程管理、安排番茄钟,全程只需要跟产品互动。

这款产品目前还处于研发阶段,没有公开发售,但是思路相当值得借鉴——专注型软件一定要做成手机 app 吗?

归根到底,该怎么避免被手机带跑偏?别碰手机就是了嘛。今天我们已经有那么多智能设备了:手表、手环、眼镜,甚至是戒指,这些设备作为载体,会不会更加适配对于专注的渴望和追求呢——开发者们快想想!

当然,任务拆分型 app 现在已经有很多选择了,极有可能出现下载了十几个 app,平均每个用三天到一礼拜,然后就被忘在手机的角落里吃灰

千万不要因此感到挫败或自责,ADHD 的大脑永远在追求新鲜感与更低的启动门槛,这本身就是我们生命力的一部分。如果你发现一个工具没法持续地吸引你,那大概率说明它的设计逻辑并不适配你大脑的系统版本。

只要这个 app 能在某个瞬间,帮你把脑子里那台刹车不好使的法拉利成功推出起跑线,它的使命就已经完成了。记住,你才是赛车手,所有的工具都只是路标和护栏。生活不必总是一板一眼的直线行驶,哪怕是蛇形走位,只要你在前进,那就是属于你的胜利。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


掌管全球万亿资产的「老钱」,为何选中了年轻的 MiniMax ?

作者 Selina
2025年12月31日 08:57

站在 2025 年底回看,AI 行业正经历一场安静但深刻的转向。几年前,发布会灯光、参数排行榜和融资数字曾构成这个行业最耀眼的画面。

而现在,聚光灯正在移开,视线开始落到更不显眼却更关键的地方——技术团队是否能持续进化、路线选择是否经得起时间拉扯、那些尚未完全兑现的能力,是否真的具备长期生长的可能性。

投资者评估 AI 企业的方式,也随之从「看得见的收入」,转向「还没完全显形的价值」。

正是在这样的行业转折点上,MiniMax 启动了上市进程:今天公开发售正式启动,预计将于 1 月 9 日以 0100 为股票代码正式登陆港股资本市场。

根据招股书披露的核心细节,MiniMax 本次 IPO 拟发行 25,389,220 股,定价区间为 151 至 165 港元/股,在不考虑发售量调整权及超额配股权行使的情况下,发行估值将介于 461.23 亿港元至 503.99 亿港元之间。

值得注意的是,MiniMax 此次引入了包括 Aspex、Eastspring、Mirae Asset、阿里巴巴及易方达在内的 14 家基石投资者,认购总额约 27.23 亿港元。

募资用途方面,MiniMax 明确将 90% 的募集资金投向研发领域,其中 70% 专门用于大模型相关研发,剩余 20% 则投入产品迭代与优化,持续夯实技术壁垒。

这些承诺长线持有的基石投资人,以及将九成资金押注研发的资源分配方式,共同标志着 AI 行业正式告别了流量为王的草莽期,进入了长期主义的成熟期。

「老钱」都是谁

股票市场上,「老钱」指的是投资时间跨度较长、重视基本面而非短期交易的机构或资金类型。包括公募基金、主权财富基金、战略持股的大型企业或家族投资公司等等。

如果说风险投资是投机者的角斗场——投出的十个项目里能死掉 9 个,但只要剩下那一个成为独角兽就是胜利——那么,「老钱」们则擅长给足耐心,坚持复利和长期主义。关注股息、盈利增长以及企业长期价值,从而为市场提供稳定的资金支撑。

长线基金通常投资门槛很高,更关注企业的健康发展,相信未来的技术壁垒能带来几十年的垄断收益。这就意味着,企业本身的商业模式和技术壁垒,需要经得起检验,能在时间的洪流中站稳。

1988 年,在巴菲特的判断下,Berkshire Hathaway 开始大规模建仓一家消费品公司,高峰期持股约 9%,从不因短期估值或市场波动而交易。随后,美国大型的养老基金、指数型长期资金也纷纷跟进。他们看中的,是这家公司健康强劲的现金流,可预测的市场需求,明确的盈利方式和定价权。

长线基金在寻找的,是可被时间反复验证的可靠性,尤其是那些可以将技术沉淀为不可替代的生产要素的公司。在下一波生产要素更迭的时间节点,这些长线基金,看中了下一个基石型产业——AI。

而在这一片阵地中,他们看中了一支年轻的队伍——MiniMax。

反脆弱

「真正强大的系统不是在冲击中保持不变, 而是从混乱中获益、在压力下变得更强。」这是前华尔街交易员塔勒布在其著作中提出的概念:反脆弱性。

这个概念放在当下的 AI 行业,可谓一种高标准。技术的快速更迭,带来的是眼花缭乱的变化——能在持续的变化中稳住、变强,MiniMax 是个值得观察的样本。

过去两年,AI 赛道的主旋律是烧钱换时间。可是 MiniMax 的财务数据呈现出不同的增长曲线:收入增长 174.7%,研发支出仅增长 30%。这种非对称增长,恰恰藏着它最核心的生存逻辑,反脆弱性。

首先就是他们对全模态自研的投入。回到三年前看,这是一种剑走偏锋。彼时行业共识是专注单一赛道,毕竟全模态意味着战线过长、资源分散、而非在一个细分垂直领域做到极致。

但 MiniMax 选择了一条少有人走的路,自成立起就死磕全模态自研,现在终于成了全球唯四能冲进全模态第一梯队的企业,实现了文本、视频、语音、音乐的全面开花。

这是一种剑走偏锋,也是一种基于长期主义的积累。

于是我们看到,文本模型 M1 是全球首个开源大规模混合注意力推理模型。第二代 M2 一开源,就拿下全球前五、开源第一的成绩;OpenRouter 上,国内 token 用量登顶,编程场景冲进全球前三,Google 、亚马逊、微软三大云厂商都第一时间把它接入自家 AI 云平台。

近日 LMArena AI 的 WebDev 榜单更新,MiniMax M2.1 Preview 直接冲到全球第四,也是国内第一。身前站着的是 Anthropic OpenAI 和 Google 这些老牌巨头,能在巨头盘踞的赛道里杀出一席之地,这份成绩单足够亮眼。

语音模型的表现同样硬核。

新发布的 Speech 2.6 性能直接压过 OpenAI 和 ElevenLabs,成了支撑 ChatGPT 高级语音模式的 LiveKit 底层引擎。流畅切换 40 多种语言,把 Voice Agent 场景的首包响应时间压到 250 毫秒,直接拉高了这个赛道的准入门槛。

视频领域的突破则进一步夯实其全模态优势。

MiniMax 视频模型 Hailuo 支持文生视频、图生视频、主体参考、首尾帧等功能。最新的 Hailuo 2.3 模型,更是在画面质量、连贯性、流畅性等多维度均处于领先地位。

截至目前,海螺 AI 生成的视频已经超过 5.9 亿个,全球 200 多个国家的用户都在用来创作,其中超 1 万名专业创作者通过其产出商业作品,合作方包括戛纳电影节、纽约大学艺术学院等。

几年间的努力,MiniMax 把技术沉淀为了真正的护城河,从而避开了 AI 行业最大的雷区:技术领先,商业却欠佳。

技术领先不等于商业成功,这是 AI 行业过去几年反复验证的教训。MiniMax 则通过「B+C 双轮驱动」模式,完成了技术优势向商业价值的转化:2.12 亿用户,开放平台日均处理万亿级 Token 请求。夸克有声书、小爱音箱语音、腾讯视频内容生成、WPS 的 AI 功能背后都有它的技术支持。

这些优质 B 端客户带来了稳定收入,更通过这些平台触达了海量 C 端用户,形成了「B 端赋能、C 端破圈」的良性循环。

海外市场的表现则更具说服力,领英、Veed、Leonardo 等平台是其客户,海外收入占比超 70%。这个比例意味着它已经跳出了国内市场的舒适区,在全球范围内验证技术的商业价值。

支撑这一切的,是一个极致精简的组织和一群踩在时代节点上的年轻人。

时间是最好的标尺

年轻带来的不仅是精力和嗅觉,更在于没有传统科技公司的路径依赖,可以搭建一个精简的组织结构,从而无限拉高成本控制能力和研发效率,这也是 MiniMax 能在烧钱赛道中「逆势增长」的核心原因。

MiniMax 共计员工 385 人,但团队平均年龄 29 岁,人均 95 后,385 个人里 73.8% 是研发,三分之一有海外背景。

MiniMax 成立至今只花了 5 亿美金,不及 OpenAI 的百分之一,却做出了全模态全球领先的成绩;CEO 之下不超过三层职级,内部 80% 代码由 AI 生成。这种 AI 原生的组织架构,某种程度上解释了其技术和商业化的推进速度。

MiniMax 招股书里的一组数据很能说明问题:11 亿美元现金储备,可支撑 53 个月运营;应收账款周转天数 38 天,低于行业平均的 60-90 天;B 端毛利率 69.4%,收入来源是订阅和 API 等可持续模式。

「高护城河、可持续现金流、抗周期能力」,在MiniMax年轻的外壳下,装载的正是完美符合长线基金投资逻辑的特质——没有不青睐它的理由,对于长线基金来说,MiniMax 不仅仅是模型公司,更像是 AI 时代的「字节跳动」或「腾讯」——拥有极强的技术壁垒,更重要的是,拥有参与定义AI时代下互联网基建的能力。

年轻团队、技术积累、现金流健康、全球化布局,这些要素组合在一起,构成了 MiniMax 在 AI 行业务实的生存逻辑,也让其成为了 AI 时代「抗造」能力极强的玩家。

而正是在这样的公司身上,长期基金与被投公司之间形成了一种名利场上罕见的关系:互相成就。

正如文章开头所说,Hathaway 持仓了一家消费品公司 40 年,一直延续到了今天,这家公司也的确变得家喻户晓——它就是可口可乐。

资本为其提供穿越周期的耐心与稳定性,企业则以长期兑现能力作为回报与证明。MiniMax 之于 AI 时代,也正在进入这样一段与长期资本相互验证、彼此成就的关系。

当市场还在赌哪个模型会成为终局时,聪明的钱已经开始寻找具备持续产出爆款模型的、具备年轻与朝气的公司——这些才是 AI 时代真正稀缺的资产,也是更有可能穿过周期的那些人。

时间本身,就是最好的增长杠杆。具备反脆弱性的 MiniMax,无疑已站在接受市场长期检验的关键起点。

作者:Selina、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我调教了 50 次 AI,就为了能点开这片记录了 2025 年的雪花

作者 Selina
2025年12月25日 23:34

岁末年初,朋友圈又开始了年度报告的大赛。各个平台都拿出了各种设计、交互、数据,势必要占领你的朋友圈。

拜托,现在 AI 已经这么好用了,为什么不能自己做一个呢?尤其是这一年,有大量的时间正是花在这些 AI 工具里。

没想到,这一个小小的念头,引发了一场我在 AI studio 里埋头苦干了两天,先后完成了两个版本:一个是基于静态和简单互动的「传统版」。

另一个是具备动态效果、可无限缩放、结合 3D 粒子和互动的「技能版」。

更没想到的是,整个经过改变了以往我对与 AI 协作互助的理解:万能咒语什么的不存在的,真正的魔法武器只有一个。

自己做一个技能版「年终总结」

在开始之前,先准备好你最常用的 AI chatbot——一定要是最常用的,几乎每天都要聊个两句的那种。数据不够不仅做不了有意思的总结,还可能被硬塞不存在的数据。

我准备的是 ChatGPT,直接起一个新窗口,输入以下 prompt:

请基于这一年的对话内容,从“数量、主题、时间、情绪、使用习惯、人格特征”等维度,构建数据感的总结,包含模拟数据以及 ASCII 图表,请严格按以下结构生成:
【1. 年度总览】
今年与 GPT 的总互动次数
发送消息总字数 + 接收消息总字数
最常互动的时段
最长连续对话时长
【2. 互动类型分布(饼图)】
请用 ASCII 图展示:
情感类、讨论类、创作类、学习类、角色扮演类、其他类
【3. 高频主题排行(TOP 10)】
以排行榜形式展示,并给每个主题一句点评。
【4. 我的年度情绪轨迹(线形图)】
模拟分析我在对话中的情绪曲线
【5. 用户行为画像(雷达图)】
雷达图维度包括:
好奇心、依赖度、分析深度、 表达欲、情绪敏感度、 自我剖析频率
【6. 使用时段与频率(柱状图)】
柱状图展示我全年最常用来找 GPT 的时间段: 凌晨、上午、下午、晚上、深夜
【7. 我的互动习惯标签】
请根据全年模式,为我生成 6-10 个类似“APP 年度画像”的标签。并设计 6 个带名称的年度成就徽章
【8. AI 眼中的我(数据 + 叙事结合)】
结合年度模式,写一段带数据隐喻的:
“我是怎样的人,我的灵魂像什么,我为什么值得这样的总结。”
【9. 年度一句话总结】

总体风格要求:
数据可视化 + 年度回顾混合风, 图表使用 ASCII,可视化要清晰、好看、易读,文案具有科技感、沉浸感、叙事感,避免大众化套话。

这些就是接下来的基础素材了,在上述这种 prompt 的指令下,GPT 只会输出纯文本,图也是草草画一画。所以接下来要转移到 Gemini/AI Studio 上去做进一步的排版。

AI Studio 依然是最推荐的地方,除了可以选择更多模型、互动过程更直观,还有一个更重要的原因后面讲。

年终总结里,数据只是素材,更重要的是排版——这一项已经卷出花来了,充分地进入了 AI 的数据库,用几行基础 prompt 就可以实现。

帮我以可交互式 H5 的形式,制作一个年终总结页面。总结文案我将会在下面给出,形式要求:1. 可交互式,交付可本地打开的 html 网页 2. 根据文案内容拆分版块,在需要使用图表的部分制作图表 3. 版式要求:文字使用衬线体,背景色彩可以自主调节。总结文案如下:(补充你的文案)

很多人抱怨, AI 生成的视觉图表有一股廉价的「塑料感」,效果不坏,但也说不上好——这就是基础 prompt 的缺点。所以,在制作报告时我直接放弃了使用「大气、高级」这类模糊的形容词。AI 听不懂这些,它只能精准执行参数,拆分成一步步会更加有效。

比如,为了达到最终那种深邃优雅的视觉效果,我将需求拆解成了具体的描述:背景为深紫色渐变与暗灰色的色块晕染,晕染效果随机变化——具体的颜色、形态,而非空洞的叙述「大气」「高级」,AI 弄不明白的。

类似的,微调图表时,也要尽可能的具体:雷达图需要呈现出磨砂玻璃般的半透明质感。

加入交互时,描述你想要实现的效果——尽可能地细致,比如:将「年度十大主题」按照十宫格排列,点击来使每一个格子反转,文案始终置于居中位置。

这种调校的过程,本质上是在用你的审美,去 battle AI 的执行效率。不过,现在 Gemini 的审美远比我想象的要好,比如我提了一个多出几个配色的要求,它给出的三种配色都还不错。

隐藏武器:「回滚」

做传统的年终总结,整体过程比较像和设计师合作,这里改改颜色、哪里换个版式。但「技能年终总结」,就是和工程师合作了。

在重新研究了一遍 GPT 给出的文字总结后,我第一时间想到的是和网上流行的圣诞树做结合。

▲ 图片来自:小红书用户 @黑波

但是在对比之后,发现年终总结高度格式化的章节、数字,并不适合用圣诞树这样的形式去呈现。所以我先是参考圣诞树的设计 prompt,但把主体改为了结构更清晰的雪花结晶。prompt 如下:

角色设定:你是一位精通 React 19、TypeScript 和 Three.js (R3F) 的 3D 创意开发专家。 任务目标: 构建一个名为“圣诞雪花”的高保真 3D Web 应用。视觉风格主色调为深祖母绿和高光金色,并伴有电影级的辉光效果。 技术栈: React 19, TypeScript, React Three Fiber, Drei, Postprocessing, Tailwind CSS。

雪花结晶体的结构可以更清晰的展示出节点,这样,就可以用红宝石不同的年度总结板块。点击时,散落在夜空中的粒子和红宝石,共同组成了一朵雪花——就像一个个重要的事件、习惯、统计数字,构成了这一整年。

然后就是漫长……漫长……漫长……的修改流程。在我的预想里,每一个红宝石封装了一部分内容,一次性把完整的总结文案喂进去是行不通的。这也是很多人写 prompt 时的「毛病」,喜欢一下子把所有需求堆上去,结果 AI 给的代码往往漏洞百出。这边给到的一个建议是: 先定骨架,再调动作。比如一个雪花的动效,我分了三步:

第一步: 先让它把雪花的 3D 形状写出来,只要形状对了,先下载一个版本,你可以在这里找到下载按钮。

第二步: 让它加上自转和红宝石节点,不急着塞内容,只是把几个节点改成红宝石的形状。

第三步: 最后才去磨那个点击缩放的逻辑,放大时是什么效果、要不要加返回键……

每一步只要达成预期,就别乱动。一旦发现没有效果,让 Gemini 自行 debug 也无效的话,启动武器:

这是我做这个项目时最重大的发现:回滚。功能越复杂,需求越多,AI 越容易出错。完成一个新需求的时候,无法避免要「重新生成」一些东西,所以整个代码的其它地方本来是没问题的,改完却出现新的 bug。

结果就是,越在错误的代码上缝缝补补,加的补丁越多,bug 就出现得越多。所谓「按下葫芦浮起瓢」,是最劝退的一步。

所以,效率最高的做法是,当你发现 AI 为了加一个新功能(比如换个颜色),把之前已经调好的交互逻辑给「洗」掉时,不必执着于在对话框里跟它吵架,让它「改回来」。最快的方法是直接回退到上一个版本,再输入新指令——记住,你是指挥官,它是执行者,AI 乱了,你要把它拉回到正确的轨道上。

 

这对零码选手尤其有意义,作为一个很少去翻看冗长代码、只看预览效果的普通用户,这就是最简单粗暴的「咒语」:别去纠结它哪行代码写错了,直接回滚。

这个项目里我的整个工程一度崩溃过:中间我提出,「优化一下红宝石的材质,让它看起来更透亮」,看代码预览 Gemini 是在跑,但是回到预览页却没有一丝变化。

一运行,材质没有大变化,点击缩放的功能还给废了。AI 在重写材质代码时,顺手把我调了一下午的点击交互给抹掉了。这种时候,在对话框里跟它大发雷霆其实没有用,提出「缩放功能没有了补回去」,也很容易卡死,AI 会一边道歉一边给你补一个更烂的 Bug。

与其纠结,不如一键 restore,回滚到那个「材质虽丑但交互正常」的版本,这种对预览效果的「死守」,比任何高级 prompt 都管用。

不过要注意的是,回滚只有上一个版本,更远一点的版本是不支持的。可以把它理解为「退回到上一步」,类似 Ctrl+Z 这样的操作。

到了后面,我的想法越来越被耗尽,所幸让 Gemini 自主完成一些设计工作。在整体视觉已经完全确定的情况下,它的发挥其实还不错。比如这个年度成就徽章「英灵殿」,就是完全由它设计的。

鼠标悬停即展示具体的成就名称,也是 Gemini 想出来的主意。另一张统计里,它还自己画上了心跳图。

最后一颗宝石里装载的是「一句话」总结,Gemini 把最后这颗宝石改成了白色的锥型晶体,跟其它的红宝石区别开来。

在制作这篇年终总结时,我被问到最多的问题是:「Prompt 是什么?」

也不意外,AI 用到现在,这已经成了大家下意识就要问的问题。但是说句掏心窝子的话,真的没有什么一键成型的魔法咒语。

每个人的 2025 都是独一无二的,每个人想要通过 AI 记录的转折点、战绩和情绪也都不一样。你喜欢一棵挂满礼物的圣诞树,而我喜欢这片在星空中转动的雪花。每个人都有自己的审美偏好,而 AI 最大的魅力,绝不是让你能复制出一份和我一模一样的报告。

相反,AI 最大的意义是:它第一次抹平了「想得到」与「做出来」之间的鸿沟。 以前你受限于不会代码、不会设计,只能接受千篇一律的模板;而现在,只要你愿意花点时间去跟它「死磕」,去描述你脑海中那个具体的画面,AI 就能帮你把那个只属于你的世界折叠出来。

Prompt 是冷的,但你的记忆和审美是有温度的。

如果非要总结出一个公式,那可能就是:一点点想象力 + 几十次耐心回退 + 绝不向平庸效果妥协的审美。

别再到处找「万能指令」了。新的一年,试着去跟 AI 聊聊天,去「嫌弃」它的平庸,去坚持你的直觉。你会发现,正如同每一年里不停止的自我更新和挑战,对这一年最好的总结,恰恰就是你不断推倒重来的过程本身。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌