太牛逼了!刚刚,GPT-Image-2 正式全量上线。

虽然这个 Twitter 是假的,但模型上线是真的。就在现在,ChatGPT 网页端和 App 都能用。
作者跑了老一会儿,挑出来的五十张图,分十个方向,给大家展示一下这个东西的实力。
一、攻略长图
最能看出跨代感的就是这一类。几百个汉字压在一张竖版长图里,字号、间距、对齐、色彩层级,全都稳得住。



二、老片海报
这一类测的是年代氛围和风格迁移。油画质感、港味、苏联风、昭和特摄、民国月份牌,每种都能精准还原。



三、杂志封面
品牌识别和层级排版同时过关。《纽约客》《时代》《GQ》《Forbes》《滚石》的字体和版式都能认出来。



四、社交截图
小红书、朋友圈、抖音、推特、微博,五个平台的 UI 一张张过。按钮、标签、数据、头像位置,连深色模式都能一次到位。



五、发布海报
品牌海报和产品展示。苹果极简、特斯拉参数满、潮玩收藏盒、潮牌大 logo,调性差异很大。



六、萌系图鉴
测插画一致性。多格卡通每格里的角色造型不能崩,表情和动作又要每格不一样。



七、幻想地图
虚构地理场景,羊皮卷、RPG 世界地图、水彩梦境。图例、罗盘、小插画、音译地名全部拉满。



八、老印刷品
质感模拟这块儿是硬活。泛黄报纸、粉笔灰、印刷厂章、毛笔字、宣纸水墨,每种老物件的手感都得出来。



九、软件界面
UI 高保真还原,从 3A 游戏 HUD 到记账、任务、阅读、音乐 App,中文 UI 密度拉到顶一点不崩。



十、白日做梦
最后一类纯看一些瞎搞的东西。药方、奖状、登机牌、超市价签,换个载体继续整活。























总结
五十张跑完,最大感受是「中文这块儿终于能用了」。然后提示词不用写长,三五句话直接上,模型自己能琢磨排版和风格。
苏米注:GPT-Image-2 的中文能力确实令人印象深刻。从长图排版到老片海报,从杂志封面到软件界面,中文字符的渲染都非常准确。特别是复杂场景下的文字布局能力,相比之前的模型有显著提升。对于需要生成中文视觉内容的设计师、运营人员来说,这是一个值得尝试的工具。