昨夜,GPT-4o原生出图在全网掀起风暴。从一键风格迁移、秒出高保真线框,到精准呈现复杂信息图和完整漫画,GPT-4o将AI生图从「超现实」带回「现实主义」。这场视觉革命,或许正推动AI正式进入专业创作领域。
昨晚,AI圈乐疯了:先是DeepSeek高调官宣V3模型升级;紧接着谷歌深夜上线旗下最强模型Gemini 2.5 Pro。
双方夹击之下,OpenAI还能坐得住?这种时候,怎么能少得了OpenAI整活?
果不其然,奥特曼亲自出马,现场直播演示GPT-4o全新的原生图像生成功能。
更让人意外的是,OpenAI这次也终于Open了一把,连免费用户也可以使用。
200万粉丝的网红Allie K.Miller,提前尝试过GPT-4o新功能表示:「新模型确实值得一试,特别在文本生成上取得了巨大飞越。」
与DALL-E 3不同,此次OpenAI的全新图像生成器基于其原生多模态GPT-4o模型,能够同时理解图像和文本,可以非常好地遵循提示词指令,轻松创作出虚实结合的场景,就像在现实中一样。
从事创意的Lucas Crespo,已经研究了好几周OpenAI的新图像生成模型了。
简单总结,OpenAI的新模型几乎可以可视化全部东西,甚至包括待办事项列表(To-Do List),更不要提替换背景了。
Lucas Crespo认为新模型的确令人印象深刻,并分享了10个令人惊叹的用例。Bsport体育APP
1、给ChatGPT-4o输入情绪板或视觉指导,就可以创建遵循相同风格的图像。
在各种风格上,都令人印象深刻,而且可以简单地「与模型聊天」,就可以迭代编辑图像。
下面这张女人的脸,睫毛根根分明,脸上斑点也是清晰可见,关键非常符合女性外貌特征。
以OpenAI Sora的风格为例,Bsport体育APP对于提示词中天马行空的想象力,AI表现的总是游刃有余。
GPT 4o最新生图功能的目的不再专注于创造典型的「超现实主义」AI艺术。
提示词从神秘幻想的「黄昏时分,神秘森林,发光的生物优雅地漫步在高耸的苔藓覆盖的树木中」开始演进为「冰箱中上的磁贴和手里拿着单词卡的男人」。
模型能够在单个图像中生成12个离散图形——如猫的表情符号或闪电图标——并将它们按正确的顺序排列。
OpenAI正在将该工具定位于给专业人士使用:比如平面设计师、广告公司或插画师。
无论如何,OpenAI的新图像生成器不论是不是为了「狙击」谷歌和Grok等竞争对手。
从GPT-4o的生成结果来看,OpenAI的技术显然已经突破了某些技术障碍。