吉卜力风已过时?GPT-4o打造动画新境界 让动态关键帧成为艺术

撰文: 机器之心
出版:更新:

这届网友真是把 AI 玩出花!

继谷歌Gemini 2.0 Flash 去水印骚操作后,Reddit 社区的老哥们又用 GPT-4o 解锁动画制作新姿势——直接生成动画关键帧。

只需简单指令,模型直接吐出连贯动作序列帧,丝滑程度堪比动画师原画。

受此启发,另位网友献上进阶玩法:

对提示词稍加润色,再将 GPT-4o 生成的一系列关键帧直接整成了 GIF 动图。

推文一出,立刻狂揽 20 万+围观。

GPT-4o打造动画新境界(机器之心提供)

提示词模版:

创建一个详细的像素艺术帧动画,用于游戏,其中最终图像被分成多个子图像,每个子图像作为一个连续的动画关键帧。设计序列以描绘[一个巫师施法:从复杂的手势开始,然后展示巫师召唤一个鲜艳的火球,最后捕捉施放火球的瞬间。]确保关键帧之间平滑而连续地过渡,并尽可能包含多个帧,以实现高水平的流畅性和细节。

网友们也不闲着,陆续整活儿。

日出既视感。

+2

不断变身的小动物和武术。

+3

话说这些活儿算不上好玩,我们决定亲自整几出。

韩国大明星金秀贤深陷与未成年女星交往风波,近期记者招待会上精彩演出,被网友用 AI 整成了喜剧:

GPT-4o打造动画新境界(机器之心提供)

我们配了个动图,不忘 BGM: You are my destiny。

最惊讶的是做了个马蒂斯风格的艺术动图,这效果也太好了吧!

提示语:创建一个马蒂斯风格的艺术动画,最终图像被分成多个子图像,每个子图都是连续动画关键帧,请描绘一位贵妇被吓得大吃一惊的过程:一位贵妇面对着镜头,然后脸上露出不安的表情,接着眼睛瞪大,嘴巴张开,捕捉最后目瞪口呆瞬间。请确保关键帧过渡流畅且连续,并包含尽可能多的帧,以实现动画的高流畅度和细节。 人物应在每一帧中保持居中,所有帧大小相等,并完美排列在一个 nxn 的网格中,形成单张图像 。

宫崎骏风格的小女孩 wink,随手拈来!

+2

创建一个吉卜力风格艺术动画,最终图像被分成多个子图像,每个子图都是连续动画关的键帧,请描绘一个女孩儿转头对着镜头wink的过程:女孩儿背对镜头,披肩长发;然后转过头,对着镜头,微笑,最后捕捉对着镜头wink瞬间。请确保关键帧过渡流畅且连续,并包含尽可能多的帧,以实现动画的高流畅度和细节。 人物应在每一帧中保持居中,所有帧大小相等,并完美排列在一个nxn的网格中,形成单张图像 。

哪怕只有 4 张关键帧,效果也不错!

GPT-4o打造动画新境界(机器之心提供)

当然,帧图越多,效果越细腻。

GPT-4o打造动画新境界(机器之心提供)
+1

创建一个像素风格的艺术动画,最终图像被分成多个子图像,每个子图都是连续动画关的键帧,描绘一个女孩儿尬舞的过程:面对镜头,开始扭动臀部, 左右扭动,手舞足蹈。请确保关键帧过渡流畅且连续,并包含尽可能多的帧,以实现动画的高流畅度和细节。 人物应在每一帧中保持居中,所有帧大小相等,并完美排列在一个nxn的网格中,形成单张图像。

两只皮克斯风格的加菲猫,一开始还挺友好,后来怒到毛都竖起来,想要互殴。

即使画面出现两个主体,有一定动作交互,也没问题。

GPT-4o打造动画新境界(机器之心提供)
+3

创建一个皮克斯风格艺术动画,最终图像被分成多个子图像,每个子图都是连续动画关键帧,请描绘两只加菲猫敌视对方,要打架的过程:两只猫对视,接着露出凶狠表情,身上的毛竖起来、尾巴竖起来,最后捕捉要打架的瞬间。请确保关键帧过渡流畅且连续,并包含尽可能多的帧,以实现动画的高流畅度和细节。 动物应在每一帧中保持居中,所有帧大小相等,并完美排列在一个n

xn的网格中,形成单张图像。

话不多说,下面介绍整活方法。

最傻瓜的方式

最简单的办法就是全部在 GPT-4o 里完成。

你问平替?木有的。

豆包、谷歌 Imagen 都试过,不仅很难生成有逻辑顺序的系列帧,图像一致性也够呛,更别说直接在对话中生成动图。

以金秀贤的动图为例。

输入提示: 生成一张包含 9 个精灵帧的图像网格,描述一个男演员在记者会上,一边哭一边吃汉堡喝水的样子,吉卜力艺术风格 。

所谓精灵帧( Sprite Frame),是一个游戏和动画开发技术术语, 可以理解为一系列静态图像或帧,这些图像快速地连续播放,会产生动画效果。

不用抽卡,一次搞定:

GPT-4o打造动画新境界(机器之心提供)

继续输入: 先检测照片的大小,然后合理裁剪这张照片,最后完成初步对齐匹配之后,将这张照片生成一个 gif 动画 。

立刻就有了结果。

(机器之心提供)

就是这样:

+4

更精细的方法

如果你仔细观察上面的九宫格,会发现两个比较明显的问题。

首先,第三张图明显不合理——一只手捂着脸,还有两只手拿着汉堡。

其次,关键帧的逻辑顺序需要再调整,比如吃汉堡的过程;水杯里的水应该是从多变少。

所以,想要动图效果更好,我们需要一些可以编辑这些图片的工具。

介绍两个简单好用的:

一个是负责裁剪生图的 Image Splitter :

https://miniwebtool.com/image-splitter/

一个是负责将切片组成动图的 GIF Maker :

https://miniwebtool.com/gif-maker/

我们将 GPT-4o 生成的九宫图上传到 Image Splitter ,然后裁成九张图片。

GPT-4o打造动画新境界(机器之心提供)

导入  GIF Maker。

去掉有三只手的生图,并调整图片的顺序。

你还可以选择合适的帧率(我一般选 500 左右,或者更低延迟),延迟越高,动图越缓慢;反之,则越快。

还能调整画质和尺寸。

GPT-4o打造动画新境界(机器之心提供)

看看编辑后的动图效果,是不是明显更合理了?

再做个火柴人风格艺术动画。

提示语:创建一个火柴人风格艺术动画,最终图像被分成多个子图像,每个子图都是连续动画关键帧,请描绘一个人躺在地上默默流泪:一个男孩躺在地上,接着眼睛开始流出泪水;眼泪越来越多,逐渐在脸上流程两条小河;最后捕捉到泪水留到地面的瞬间。请确保关键帧过渡流畅且连续,并包含尽可能多的帧,以实现动画的高流畅度和细节。 人物应在每一帧中保持居中,所有帧大小相等,并完美排列在一个 nxn 的网格中,形成单张图像 。

稍微解释下,这个提示词意味着,我们将究竟生成多少张帧图才能实现画面流畅的问题直接扔给了大模型。你对帧图的逻辑内容描述越细致,生成结果的可控性就会更好。

另外,考虑到后面自动剪裁的便利性,需要在提示词中明确要求:

所有帧大小相等,并完美排列在一个 nxn 的网格中:

GPT-4o打造动画新境界(机器之心提供)

剪裁完了,删掉明显影响效果的帧图(但不要太多),再调整它们的位置,以求效果最好。

延伸阅读:AI回复竟有60%以上是错误?外媒实测8款搜寻工具 最常犯这三大错(点击连结看全文)

+6

我们想要一个描绘小船在梵高星月夜里游动的动画,系统自动生成了 16 宫格。

GPT-4o打造动画新境界(机器之心提供)

一个意外

在寻找平替的过程中,突然想到

谷歌 AI studio 里有 Storyboard

,它本身就有图文并茂的能力,能不能生成系列帧呢?

关键是免费,如果可以凑合用,也不错啊。

提示词:创建一个吉卜力风格的艺术动画,最终图像被分成多个子图像,每个子图像作连续的动画关键帧,设计一个序列描绘公主施法的过程,先从公主的手部动作开始,然后展示公主变出一个充满活力的火球,最后捕捉施放火球的瞬间。请确保关键帧过渡流畅且连续,并包含尽可能多的帧,以实现动画的高流畅度和细节。

很意外,一共生成了九张图,图与图之间逻辑还挺合理。

+2

将这些图片依次导入 GIF Maker。

GPT-4o打造动画新境界(机器之心提供)

看效果还不错呢!

一个吉卜力风格的小女孩 wink 动图,也还行,但明显不如 GPT-4o:

一个是对吉卜力风格的理解;另一个是指令遵循差一截,女孩 wink 其实并不明显。

GPT-4o打造动画新境界(机器之心提供)

不过,测试几次,谷歌 AI studio  Storyboard 就会失灵,出现严重不稳定状态,毕竟它也不是用来干这个的。

延伸阅读:OpenAI开放Deep Research功能 非Pro付费用户可使用但有这些限制(点击连结看全文)

+13

【本文转自“机器之心”,微信公众号:almosthuman2014】