
与此同时ChatGPT 新的 AI图像生成器上线仅一天,社交媒体上就已经充斥着各种由ChatGPT-4o生成的效果案例,甚至可以说是刷屏了,各种风格,各种效果,GPT-4o的更新,预示着AI对普通人又一次的降维打击。

GPT-4o亮点
这次升级的核心在于ChatGPT已经整合了全新的图像生成功能,而驱动这项强大能力的是最新的 GPT-4o 模型。与以往不同的是,GPT-4o 的技术原理与传统的扩散模型(Diffusion)不同,它采用了类似人类写作的 “自回归”(autoregressive)模式:从图片左上角开始逐步绘制到右下角,每一步都基于之前绘制的内容展开。这种模式 显著提升了细节的精准度和文字渲染的效果。

-
精准与复杂处理
支持10-20个物体及属性的准确组合,复杂场景还原度高
文字生成无乱码,菜单、海报等商用场景直接可用
-
知识驱动创作
整合大模型知识库,输入简单指令(如“吉卜力风格”)即可生成吉卜力工作室风格的梗图
-
交互革新
多轮对话原生生成,迭代调整时保持内容一致性(如游戏角色设计)
强指令遵循能力,细节还原精准
-
风格多样性
支持莫奈、幻想等艺术风格转换,生成逼真照片级效果
-
智能学习与融合
通过上传图像学习风格/细节,无缝融入新创作(如插画风格迁移)
GPT-4o如何使用
目前,只有两种方式可以使用 GPT-4o 的图像生成功能,都是OpenAI自家的产品 :
1、ChatGPT
GPT-4o是需要PLUS以上的用户才能解锁的,普通用户是不支持, GPT-4o 不是之前的 DALL-E 3,只需要直接在 GPT-4o 的对话界面,选择创建图片即可,同时支持上传参考图。

PLUS和PRO的收费,最低$20起,对于普通用户目前还只能看看网上的案例了,不过相信过一段时间第三方接入后,应该可以解锁免费使用额度。

体验地址:https://chatgpt.com/
2、Sora
GPT-4o 的全模态能力也融合进了 Sora 中,在 Sora 上使用的一个好处是 速度极快,并且可能没有 ChatGPT 上的流量限制。

GPT-4o生成案例
下面苏米整理了一下目前各平台上大家体验GPT-4o生成的各种场景的案例,真的大开眼界,如果你暂时还无法体验,那么不妨提前了解是否对于你的工作有帮助,再来决定开通PLUS,毕竟工具付费的前提是效率上真正提升的价值体现,咱也不需要盲目跟风!
全新的 GPT-4o 不仅仅局限于娱乐、科普,更是 企业商用的新利器,看看下面的案例:
-
快速生成IP形像

-
真机模型合成效果

-
卡通IP形像定制

-
不同画风照片合成效果

-
空间设计,室内装修快速出图

-
真机效果图,快速生成

-
字体设计,字体风格参考,原创字体

-
3D立体风格的LOGO、图片

-
老照片修复,老照片上色

-
真人P图,换背景、视觉风格

总结
GPT-4o以原生多模态交互重塑AI绘图生态,从“工具使用”转向“自然对话驱动创作”,技术成熟度逼近商用临界点,预示设计、营销、教育等领域效率革命,GPT-4o的生图能否彻底改变现有的 AI 绘图生态以及人们进行 AI 绘图的交互方式,这是需要我们思考的!