OpenAI新图像模型超越谷歌登顶!设计行业又要被颠覆了?
“GPT images 2终结了比赛”“强得有点离谱了”“设计行业要变天了”。北京时间4月22日,OpenAI发布了新的图像生成模型ChatGPT Images 2,生图能力被认为跨越了一个大的台阶。不少网友实测后感慨,现实与AI生图的界限更难分清了。
今天凌晨,OpenAI CEO 奥尔特曼(Sam Altman )带队开启了一场 20 多分钟的线上直播,直播中提到Images 2 是公司迄今为止功能最强大的图像生成模型。“Images 2是一个巨大的飞跃,就像从 GPT-3 一步跳到了 GPT-5。”奥尔特曼说。
从评测基准来看,Images 2确实表现出色。海外大模型评测机构Arena.ai发布帖子表示,OpenAI 的 GPT-Image-2 已登顶所有 Image Arena 排行榜第一,并在文生图领域以创纪录的 242 分优势领先第二名的谷歌Nano-banana-2。

“这是迄今为止见过的最大差距,此前没有任何模型能在 Image Arena 以如此大的优势主导。”Arena.ai表示。
从第一财经记者的实测以及各方反馈来看,这次的提升确实不小。
记者让Images 2生成一张《第一财经》杂志的封面,封面图片是20年后的上海城市面貌,需要包含东方明珠和黄浦江,等待了大概20秒生成了一张图。

此前记者曾用该封面的需求测试过多个图像模型,但所有模型都无法将中文字体输出正确,但Images 2一次生成就基本做到了,无论是大的文字还是更小的字体,一眼看过去没有明显的问题。这仅仅是免费版本的效果。
如果要挑细节,放大图像仍会有一些不真实的地方,例如图像底部小字体的“浪潮”“趋势”笔画会有一些不标准。此外,图像右边缘有半个人似乎站在水里。在日期上,图像给出的是2024年也就是两年前。但总体来看,这确实是一个表现出色的模型。
“这是我在过去4个月里一直在准备的东西。”OpenAI研究科学家陈博远今天也发帖表示,GPT Images 2有着巨大的飞跃。它在精准听懂长指令、准确摆放并理清物体间关系、渲染密集文本方面有了巨大突破。
官方博客还展示了一张陈博远亲自制作并出镜的案例图,他写了提示词一次性生成了一整页全中文彩色漫画,内容是他在OpenAI做Image 2中文文本渲染优化的故事,提到了家乡无锡的热门玩法,还加入了时下热门的“稳稳地接住你”的AI语言梗。

这张图同时展示了中文文本渲染能力的突破、极小字号的精度控制、以及复杂多面板漫画的一次性生成能力。
除了文字渲染,在真实图像生成中,Image 2也被认为拥有出色的构图能力和视觉美感,使得最终效果看起来不像AI生成,而更像是精心设计的作品。
Images 2也是OpenAI首个具备思考能力的图像模型。在 ChatGPT 中选择思考型或专业型模型后,Images 2 可以搜索网络获取实时信息,根据一个提示创建多个不同的图像,并对其输出结果进行双重检查。OpenAI称,凭借思考能力,该模型可以承担从构思到图像生成的更多繁重工作,尤其是在准确性、信息时效性、一致性和视觉连贯性至关重要的情况下。
Canva创意策略师表示,“最让我们感到惊喜的是 GPT Image 2 添加的细节。它引入了一些我们之前没有考虑到的元素,比如TikTok 爆款贴纸,这是一个巧妙的创意选择,旨在制造话题热度。这个模型不仅仅是渲染图像,它还能解读简报、了解受众,并在幕后做出创意决策。”

不少业内人士拿新模型与谷歌的Nano-banana-2做对比,大多数情况下Images 2在构图、人物背景的真实感会更佳,但是在光线渲染上谷歌仍然会更好。
在博客最后,OpenAI也承认Images 2并非完美无缺。例如它仍然难以处理需要完整且连贯的物理世界模型、折纸指南、魔方等谜题,以及需要在隐藏、倾斜或反转表面上正确显示的细节。此外,像细沙粒这样非常密集或重复的视觉细节也可能超出模型的处理能力。这些局限性是未来工作的重要方向。
不过,从当前的反馈来看,Images 2已经重新定义了AI图像生成的顶尖水平,人人都是设计师的时代或许更快到来了,“这件事对内容行业、设计协作、信息表达都会有影响。”
| 直通车game推荐阅读 | ||
| OKX下载 | 交易所排行 | 比特币平台下载 |
