GPT-4o吉卜力风格只是开始 画笔编辑创作与推理模型合并成热议
这几天,你要说 AI 圈最火的是哪个模型?OpenAI 的 GPT-4o 当仁不让。
吉卜力风格的图像和视频在社交圈疯传,被玩出了花。机器之心用 GPT-4o 和可灵做出了吉卜力版《甄嬛传》全网播放超 20w。
除了一些口型和神情还有出入,人物形象可谓是超绝还原。
X 平台上的网友利用 GPT-4o 和 Luma Ray 2,把《疯狂的麦克斯(Mad Max)》动画版也做出来了。
在网友探索 AI 动画生成的同时,还有一个功能被刨了个底朝天。在 OpenAI 的发布介绍中压根没提,但非常有用的功能 —— 画笔编辑。
没错,就是这么一涂,你就能变身造物主,想怎么改图就怎么改图。
我们赶紧上手试了一下,发现效果真的很强!
把同事的照片转换成吉卜力风格后,点击生成的图片,右上方有一个画笔按钮,轻点之后就能进入到画板界面。
涂抹需要修改的部分,然后输入相关的 prompt,例如这张图里,我们输入了“移除外套只保留里面那件短袖”。
于是,一张保留了大量原图细节的脱去外套版图片就生成了。
不过,原图与新图之间还有一定差别。后面背景中石头和植被的布置以及人物的表情都发生了变化。不过整体细节相对保留完整,GPT-4o 也能够理解我们的指令。
还能换背景哦,下面这张图就把背景换成了小溪。
换个同事的童年照片,给她加顶海盗帽也是非常好用。
不过,复杂一些的转换看起来效果还不算完美。例如这个弥补了《大话西游》中至尊宝和紫霞仙子遗憾结局的换位。猴子脑袋快被金箍勒爆了,身体也没有被云雾覆盖。但是人物的细节和风格都保持住了。
延伸阅读:Google推出免费AI图像编辑器 文字指令即时修改照片:中英文都得(点击连结看全文)
推理与非推理集于一身,GPT-5 要来了?
在刷爆图像生成的同时,GPT-4o 还有了另一个重大发现:现在可以显示推理时间与思维链过程了。
这不禁令人联想,难道 OpenAI 开始合并推理与非推理模型了?正如奥特曼上个月提到的那样,OpenAI 计划统一 o 系列与 GPT 系列模型,构建可以自主判断任务需求的智能系统,不用再每次选择模型。
还有用户晒出了自己 2024 年底的截图,这可能意味着 OpenAI 并不是最近才开始测试,GPT-4o 的推理能力也持续很长时间了(6 个月以上)。
截图如下:
对此,以上两位用户展开了讨论,前一位表示现在的推理看起来比去年更长更好了。后一位称,这只是反映了 OpenAI 如何输出“推理”过程,可以看到过去是两种方式,与 o1 相同。而最近 o1、o3 与 4o 的推理看起来不一样了,非推理模型中开始出现推理了。
这并不是个例,越来越多人发现了 GPT-4o 的推理现象。
不过有人怀疑是不是 bug。即使是 bug,也许是非常有趣的 bug。
正如下面这位网友所说,看起来我们正在即时观察 GPT-5 的启动,模型版本之间的界限正在迅速模糊并合并。
延伸阅读:Grok 3全面开放 免费体验与ChatGPT同级智能服务 更有图像功能(点击连结看全文)
【本文转自“机器之心”,微信公众号:almosthuman2014】