GPT-4o吉卜力风格只是开始 画笔编辑创作与推理模型合并成热议

撰文: 机器之心
出版:更新:

这几天,你要说 AI 圈最火的是哪个模型?OpenAI 的 GPT-4o 当仁不让。

吉卜力风格的图像和视频在社交圈疯传,被玩出了花。机器之心用 GPT-4o 和可灵做出了吉卜力版《甄嬛传》全网播放超 20w。

+13

除了一些口型和神情还有出入,人物形象可谓是超绝还原。

X 平台上的网友利用 GPT-4o 和 Luma Ray 2,把《疯狂的麦克斯(Mad Max)》动画版也做出来了。

+7

在网友探索 AI 动画生成的同时,还有一个功能被刨了个底朝天。在 OpenAI 的发布介绍中压根没提,但非常有用的功能 —— 画笔编辑。

+1

没错,就是这么一涂,你就能变身造物主,想怎么改图就怎么改图。

我们赶紧上手试了一下,发现效果真的很强!

把同事的照片转换成吉卜力风格后,点击生成的图片,右上方有一个画笔按钮,轻点之后就能进入到画板界面。

轻点之后就能进入到画板界面(机器之心提供)

涂抹需要修改的部分,然后输入相关的 prompt,例如这张图里,我们输入了“移除外套只保留里面那件短袖”。

涂抹需要修改的部分,然后输入相关的 prompt(机器之心提供)

于是,一张保留了大量原图细节的脱去外套版图片就生成了。

生成脱去外套版图片(机器之心提供)

不过,原图与新图之间还有一定差别。后面背景中石头和植被的布置以及人物的表情都发生了变化。不过整体细节相对保留完整,GPT-4o 也能够理解我们的指令。

还能换背景哦,下面这张图就把背景换成了小溪。

背景换成小溪(机器之心提供)

换个同事的童年照片,给她加顶海盗帽也是非常好用。

加顶海盗帽(机器之心提供)

不过,复杂一些的转换看起来效果还不算完美。例如这个弥补了《大话西游》中至尊宝和紫霞仙子遗憾结局的换位。猴子脑袋快被金箍勒爆了,身体也没有被云雾覆盖。但是人物的细节和风格都保持住了。

《大话西游》人物换位(机器之心提供)

延伸阅读:Google推出免费AI图像编辑器 文字指令即时修改照片:中英文都得(点击连结看全文)

+5

推理与非推理集于一身,GPT-5 要来了?

在刷爆图像生成的同时,GPT-4o 还有了另一个重大发现:现在可以显示推理时间与思维链过程了。

这不禁令人联想,难道 OpenAI 开始合并推理与非推理模型了?正如奥特曼上个月提到的那样,OpenAI 计划统一 o 系列与 GPT 系列模型,构建可以自主判断任务需求的智能系统,不用再每次选择模型。

(机器之心提供)

还有用户晒出了自己 2024 年底的截图,这可能意味着 OpenAI 并不是最近才开始测试,GPT-4o 的推理能力也持续很长时间了(6 个月以上)。

(机器之心提供)

截图如下:

(机器之心提供)
(机器之心提供)

对此,以上两位用户展开了讨论,前一位表示现在的推理看起来比去年更长更好了。后一位称,这只是反映了 OpenAI 如何输出“推理”过程,可以看到过去是两种方式,与 o1 相同。而最近 o1、o3 与 4o 的推理看起来不一样了,非推理模型中开始出现推理了。

(机器之心提供)

这并不是个例,越来越多人发现了 GPT-4o 的推理现象。

(机器之心提供)

不过有人怀疑是不是 bug。即使是 bug,也许是非常有趣的 bug。

(机器之心提供)

正如下面这位网友所说,看起来我们正在即时观察 GPT-5 的启动,模型版本之间的界限正在迅速模糊并合并。

(机器之心提供)

延伸阅读:Grok 3全面开放 免费体验与ChatGPT同级智能服务 更有图像功能(点击连结看全文)

+14

【本文转自“机器之心”,微信公众号:almosthuman2014】