面对Google Nanobanana Pro的强势出击,OpenAI终于坐不住了。
就在刚刚,OpenAI推出了新一代图片生成模型——GPTImage 1.5。
此次OpenAI瞄准的核心是一个长期困扰用户的痛点:图片编辑的一致性问题。
此前的GPT-4o生图虽然在网上掀起过一场"吉卜力美学"的热潮,但其最大的软肋就是编辑时的一致性不行。
除了一致性的改进,新模型的生成速度也提升到了之前的四倍,同时新模型对指令的遵循也更加可靠。
还有大家关心的价格,GPT Image 1.5 的图像输入和输出成本比上一代降低了 20%。
此外,ChatGPT还给生图功能配套了一个全新的独立使用界面,内置了丰富的风格库和很多创意的玩法。
不过这里有一个坏消息,OpenAI明确指出,不支持中文。
在我们实测的过程中也发现了这个问题,中文生成的效果非常糟糕。
那它的其他的效果怎么样呢?老规矩,我们实际测试一番。
先来看GPT Image 1.5的一致性效果如何?
案例一:背景移除
提示词:移除背景中的任何人物,同时保持主要人物不变。自然地填补背景,使其看起来好像那些人从未存在过。
除了消除背景中的人物外,其他的物体都没有变化,而且它还补全了之前被人物遮挡的画面。
案例二:单属性编辑
提示词:把她的头发颜色换成金色/橘色/粉色/红色,保持发型和人物不变
这组会更加直观,除了发色变了之外,衣服上的花纹、纹理都没有任何变化。
案例三:三视技术图
提示词:请根据图片精细绘制cybertruck的标准三视技术图,并补充爆炸分解展示。所有主要部件用英文标注名称及功能说明,标明关键尺寸,布局清晰现代、具有科技感,整体规范符合工业工程制图标准。
效果依旧不错,整个画面是清晰、可读的。每部件都有英文标标签,分解部分也是专业。
案例4:黑白图上色
提示词:给图片进行上色
上色的效果很好,细节没有丧失。整个画面依旧充满故事性的,并不是看起来不自然。
案例5:YouTube封面
提示词:帮我生成youtube的封面图
整个图片构图非常好,无论是文字的主体突出、排版还是上色,都十分协调。
案例6:纸张修复
提示词:修复撕毁的纸张,还原完整清晰的文字和笔迹
这一组明显翻车了。根据第一张图看,"TH"和"DE"各自是一行的,但还原的图片同样把它们放到了同一行。
案例七:多人物一致性
提示词:制作一个好莱坞级别的真人英雄海报,这6个人都在海报封面上
其他人物还原的都很好。但山姆.奥特曼像是开了美颜似的,他的下颚线有这么锋利吗?
目前,GPT Image 1.5已经向全球所有 ChatGPT 用户和 API 用户推出,免费用户也可以使用,大概每天是生成8次,感兴趣的可以去试玩一下。
如果你还不会升级Plus,可以使用wildAI一键升级Plus。
相关阅读:wildAI一键升级GPT Plus
在看GPT Image 1.5的排名,已经在LMArena 的文本到图像中排名第一,而图片编辑是排名第四。