普通视图

发现新文章,点击刷新页面。
昨天 — 2026年4月21日首页

等等,这些图是GPT-Image-2出的?!

作者 张子豪
2026年4月21日 19:31

在互联网上吃瓜、维权、实锤一件事,过去我们靠的是五个字:有图有真相。

哪怕 AI 生图已经铺天盖地,但只要图里出现复杂的中文排版,或者某款软件的真实界面,AI 就会立刻露馅,变成一个彻底的「文盲」。

▲ 图片来源:X@hx831126

但现在,这个时代到头了。

那个靠找错别字、找 UI 漏洞来鉴别 AI 图片的年代,随着 ChatGPT 旗下图像模型 GPT Image 2 的全量推送,已经轰然收场。

APPSO 第一时间用最刁钻的中文场景和商业需求对它展开了压力测试,不用抽卡,每张都出乎意料的好。

打开 ChatGPT,点击 + 号,选择「创建图片」,或在右侧边栏更多中找到「图片」,就可以使用 GPT Image 2。目前,任何订阅计划,包括免费用户,都可以直接使用。

数学试卷都能伪造,中文渲染新王

当初 Nano Banana 就是靠着文字渲染,一举成为 AI 生图界的「神」。但尽管 Nano Banana 在文字处理上比其他模型强上不少,面对一些超量文本时,Nano Banana 的表现,还是会出现个别文字的错位,以及对文字的排版布局比较生硬。

现在,GPT Image 2 的出现,把这个局面彻底翻过去了。它不仅懂中文字形,还懂极其复杂的中文排版。

使用 GPT Image 2 甚至不太需要过于复杂的提示词,我们的测试都是一两句简单的画面描述。

例如让它生成广州市小学数学试卷。

▲提示词:生成广州市小学数学试卷

结果相当震撼。卷头标题、填空题下划线、几何图形标注,以及试卷特有的宋体 / 楷体排版风格,全被精准还原。第一眼看,这完全就是一张拿手机对着真实考卷拍出来的照片。

如果这种统一字体的文字,算不上有难度的话,我们尝试继续用中国传统书法去难倒它。

▲提示词:生成《蜀道难》真迹图片

GPT Image 2 表示,这仍然难不倒我。生成的书法真迹图片,里面的文字不仅准确,还做到了书法作品应有的行云流水、笔锋苍劲。甚至连纸张的做旧纹理,一些印鉴都到位了。

对于一些图文并茂的排版测试, GPT Image 2 的表现同样严丝合缝,没有任何乱码或字体重叠。

▲提示词:一张泛黄的今日人工智能晚报,时间是 2049 年 4 月 21 日

当一个 AI 模型能以假乱真地生成带题目的试卷、完美渲染中文日历,这句过去的成语「眼见为实」,真的彻底被击破了。

相信把那张四年级的试卷给小学生看,真的会找不到破绽。

配合文字,可以 1:1 还原整个数字世界

中文渲染只是基本功的补全,GPT Image 2 更惊艳的,是它展现出的世界知识的厚度。

包括前段时间 GPT Image 2 爆料中疯传的那些图片,马斯克在抖音直播买老干妈、奥特曼同平台竞争,都是基于 GPT Image 2 强大的文本渲染能力和世界知识。

世界知识这个概念,在 Nano Banana 爆火的时候,就开始流行,意思是就是生图模型也会有通用模型的知识,可以联网搜索,会思考,它真的知道我们每天盯着的屏幕、玩的游戏、看的直播,到底长什么样。

我们随手输入了一个极具互联网特色的场景。

▲提示词:一个漂亮的美女主播在抖音直播

出来的图里不只有人物,更恐怖的是它完整复刻了抖音的 UI 界面。左下角的评论区、右侧的点赞和分享按钮、顶部的观众人数和跑马灯,所有交互元素的层级逻辑全部正确。

游戏玩家可能感受更深。当我们让它还原英雄联盟的团战画面,它不仅画出了峡谷地形,英雄头顶的血条、技能特效的光影、小地图的 UI 框,也一并安排到位了。

▲提示词:英雄联盟游戏画面,召唤师峡谷地图,经典的等距俯视视角,几个英雄正在进行激烈的团战。

甚至科技圈的名场面,它也了如指掌。一句话,就能精准还原 Sam Altman 的面部特征、OpenAI 极简的舞台打光,以及套着视频播放器外壳的直播界面。

▲提示词:GPT-Image-2 发布会直播画面,包含 Sam Altman

GPT Image 2 对这个数字世界视觉规律的掌握程度,比我们想象的都要更深。

XX is Dead,再一次颠覆设计、营销、广告……

技术的快速推进背面,是一批旧工作流的终结。

AI 跨过了文字和 UI 的门槛,生图这件事就彻底脱离了「艺术创作」的范畴,成了一种硬核的商业生产力工具。这次实测里,GPT Image 2 的商业落地能力,足以让许多设计师坐不住。

工业与产品设计领域,复杂的机械结构和建模往往耗费大量时间,而现在只需几秒。

▲提示词:给「张雪机车」的摩托车设计一张酷炫的产品分解图

悬浮的零件排布、极具科技感的光影,这种过去需要 3D 建模师肝上几天的图,它能瞬间给出高品质的原型参考。

图片来源:X@hx831126

电商和广告视觉方面,苹果那种冷峻高级的质感,或者电商平台要求的高饱和度、带中文促销文案的网感图,它都游刃有余。

▲提示词:iPhone 16 Pro Max 高端商业广告

▲提示词:产品广告照片,一个游泳圈,有吸引力,能获得大量点击率,16:9,使用中文

宣发和 IP 创作上,GPT Image 2 的排版逻辑和特征抓取同样表现出现。中文字体排版直接可用,分镜逻辑清晰,连各家大模型的 Logo 特征,都能被它做成颇具网感的 IP 延展。

▲提示词:给电影拯救计划设计一张横屏海报(虽然他不知道高司令的拯救计划,但是选的几个演员确实是大片演员)

▲提示词:经典漫画书内页,包含分镜格子、人物动态动作、对话气泡

▲提示词:生成一系列不同的 AI 大语言模型(Gemini、deepseek、ChatGPT、Claude、Grok 等)的表情包设计

过去设计师对齐需求时,找各种参考、搭复杂的设计框架、排版修字。现在,一段清晰简单的提示词进去,一张可以直接用于商业提案、电商投放甚至直接出街的成品就出来了。

在我们测试过程中,无论是 Plus 账号还是免费账号,都已经上线了 GPT Image 2,大家可以在自己的 ChatGPT 对话框里试试。

不过,目前仍然会有速率限制的提示,当我们频繁发送提示词,要求 ChatGPT 生成时,他会直接回复一段错误代码,显示「你的图片生成速度太快了,为了保证所有人最好的体验,我们有速率限制,请在 13 分钟后生成。」

不得不说,每当我们觉得 OpenAI 陷入停滞,它总能在你毫无防备的时候甩出一张新牌。

过去几个月,外界吐槽它发新模型是挤牙膏、Sora 关闭、ChatGPT Atlas 浏览器爆冷,仿佛那个曾经不可一世的 AI 霸主真的变菜了。

今天 GPT Image 2 的出现,也算是给了这些唱衰一次有力的回应。

当一个模型能以假乱真地生成数学试卷、完整复刻抖音直播界面,「这是 AI 做的」我想很难是一眼能看穿的事了。

那个「有图有真相」的时代,是真的回不去了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌