AI 绘图热门 Q&A 一文看清 输入关键字突显风格 手机用唔用到?
在1996年2月10日,IBM深蓝电脑挑战西洋棋世界冠军卡斯帕罗夫,但输了。研究小组改良深蓝后,1997年5月再度挑战卡斯帕罗,这次深蓝赢了。本来以为最不可能被攻克的围棋,也在2017年AlphaGo大杀四方后,落下帷幕,人类在围棋从此无力与 AI 争霸。之后 AI 在即时战略游戏也击败人类冠军......基本上,AI 不断的在各领域击败人类的选手。
这时,我们还可以很自豪的说:“我们人类是有创造力的,AI 虽然可以下棋下赢我,但它无法独立思考、没有灵魂,是无法创作出令人动容的作品。”
但显然我们还是低估了 AI,AI 的潜力远远地超出了我们的想像。透过学习后的 AI,不仅能补完贝多芬的第十号交响曲,而且听起来还真像出自贝多芬的手笔,就连绘画,你只要给它几个关键字,它也能画出塞尚、梵高和毕加索。
▼▼AI绘图热门Q&A全在这!!!▼▼
Q1.甚么是AI绘画?
AI (Artificial Intelligence:人工智能)基本上只是指一台机器能够像人一样思考,执行相关任务。这个想法,几十年前由艾伦•图灵就问了“机器能思考吗?”这个问题,所以提出了“图灵测试”的概念。
但人工智能一般又分为“弱人工智能”和“强人工智能”,弱人工智能(或称狭义人工智能)是指这个 AI 经过训练之后,只能执行特定的任务;强人工智能或人工超级智能是指这些智能型机器能像人类一样的思考,具有同等的智能,能独立学习并有解决问题、归画未来的能力,具有自我的意识。
AI 绘画英文一般写作“AI Art”、“AI Art Generator”也有直接写作“AI Drawing”的。顾名思义,就是由 AI 演算法所创作出来的画作。
近年来拜人工神经网络为架构的深度学习所赐,让人工智能有了快速的发展,AI 在各领域都有杰出的表现,开发新药、分析各种商业数据帮助决策、运用在创作的领域就是我们现在要介绍的 AI 绘画。
2018年2月,一幅由 AI 所绘制,名为《Le Comte de Belamy》的女性肖像画卖出了1万欧元。2022年9月,一位名叫 Jason Allen 的艺术家,把人工智能 Midjourney 所绘制的作品送到科罗拉多州博览会参加比赛,并得到数位艺术类的第一名。再度炒热了 AI 绘画这个议题。
Q2.有哪些AI绘画的平台?
AI 绘画的平台的平台非常多,基本上只有要有相关程式技术能力,有大量的资料可以训练,都可以开设 AI 绘画的App或网站。目前人工智能发展最迅速的美国和中国,都有许多 AI 绘图的网站,这些 AI 绘画网站因为训练的资料不同,演算法不同,在结果的呈现上也各有不同。中国的 AI 绘画平台或App,有些基于微信的小程式,必须付费才能使用,但台湾的使用者很难在台湾透过网络完成实名认证及付费,因此我们这次以美国的目前较为主流的几个网站来作介绍。
“Disco Diffusion”是最早进入大众视线的 AI 绘画网站,它是在 Google 的云端电脑( Google Colab)上执行的一个开源软体,只要有浏览器就能执行。但必须使用 Google 帐号才能登入,Disco Diffusion开源免费,但操作介面并不友善,而且执行速度很慢。
“Midjourney”是目前相当多人使用的 AI 绘画网站,目前已经改版4次,每次的改版都会强化某些功能。 Midjourney 最大的优点除了速度快之外,每次出4张图,如果你对于其中某一张较为满意,可以指定使用该张图做为范本再绘制其他的4张图,或是指定某一张强化其细节,又会得到4张图,如此不断的画来得到你想要的图片。但 Midjourney 没有独立的网站,是架构在通讯软体 Discord 上的一个频道,而且必须下指令才能操作,使用上较“DALL•E 2”、“Stable Diffusion”或“Stableboost”这些网站来得复杂一点,是使用者一开始必须要先习惯的。
“DALL•E 2”的介面非常简洁,和 Google 搜寻的介面一样,只有一个输入文字的栏位;而栏位的下方则是各种不同风格的画作图片,只要点选该张图,就会出现该张作品当初输入的文字给使用者参考,每次出4张图。“Stable Diffusion”操作介面和 DALL•E 2一样,只需要在栏位中输入文字,就可以得到4张画作。
而后起之秀“Stableboost”的操作介面同样简洁清爽,在栏位中输入文字就可得到画作。和前辈不同的是,Stableboost 可以对图片数量、图片品质、图片尺吋大小…… 做各种更细部的设定,甚至只对局部做修改,同样是输入文字就可以。之前的 AI 绘画网站一次都只能得到4张图,Stableboost对于同一组文字,最多一次可以画200张图,只是出图的时间会稍久就是了。
“NightCafe”是一个澳大利亚的 AI 绘图网站,在这个网站上,你可以选择不同的演算法,它提供了 Stable Diffusion、DALL•E 2、Coherent、Artistic 以及 Style Transfer 等不同的选择,使用“NightCafe”时,你可以很直觉得看到下方各种不同的画风,直接点选你想要的风,再输入文字就可以了。Style Transfer(风格转移)的功能可以让你上传自己的照片,把它变成另外一种画风。
Q3.使用AI绘画的电脑硬件规格要很高吗?
基本上不用。因为这些电脑都是使用远端的伺服器来做运算,和使用者本地端的电脑效能没有甚么太大的关连,只要你有浏览器可以连到该网站,输入文字后,网站根据你的描述启动远端的电脑运算绘图,等到绘制完成,再把结果呈现在网页上,使用者再自行下载回电脑。
Q4.如何画出自己想要的绘画风格?
如果你没有指定相关的绘画风格,那么 AI 就会依照自己的“想像力”自由发挥,如果你给的关键字愈明确,关于场景描述的愈仔细,那就“愈有可能”得到你想像中的画作。如果你想要得到一张毕加索的画风,那么毕加索是立体主义的创始人,你在关键字上最好加上“Cubism(立体主义)”这个关键字;如果你喜欢达利的画风,那你加上“Surrealism (超现实主义)”会让 AI 有个更明确的方向。如果你是要日本卡通的风格,可以加上“Anime”、如果想要3D电玩大作那种画风,可以加上“unreal engine”这个关键字。基本上,你给的描述和关键字愈多,愈有机会得到你想要的结果。
AI 绘画常用关键字:
Abstract抽象派、Action painting 行动派绘画、Art gothique哥德式风格、Art Nouveau 新艺术
Constructivism 构成主义、Cubism立体主义
Dada达达主义、De Stiji风格派(新造型主义)
Expressionism 表现主义
Fauvism 野兽派、Futurism 未来派
Impressionism 印象派、ink painting 水墨画
landscape 风景画、lithograph 石版画
Magic Realism魔幻写实主义、Magical Realism魔幻写实主义、 meticulous painting 工笔画、minimalism极简主义、mural 壁画
Neo-impressionism 新印象派、Neo-romanticism新浪漫主义、nude 裸体画
oil painting 油画
Pixel art 像素风格、Pointillism 点画、Pop普普艺术、portrait人物画
realism写实主义
self-portrait 自画像、sketch 素描、still-life静物画、Surrealism 超现实主义
Ukiyo-e浮世绘
watercolour 水彩画
Q5.AI绘画的作品可以商用吗?
Midjourney 的政策是,如果你是免费试用的会员,那么产生的那些作品不可以拿来商业应用,如果你是付费的个人会员,那么 Midjourney 上绘制的图片可以使用在商业用途,但如果你的公司营业额超过每年100万美金,那么你需要订阅“企业方案”才可以使用。
DALL•E 2目前则没有对商用有特别的限制,甚至DALL•E 2还同意你在发表时可以把 AI 的签名档涂掉;但你不可以在涂掉之后,宣称这是你自己画的。
Stable Diffusion或是其他美国的 AI 绘图网站,基本上只要你有付费,作品都是可以商业使用的,你要拿去做成NFT都可以。但是使用 Stable Diffusion 产生的作品,版权都会自动转为 CC0 1.0 公众领域贡献宣告,意谓著你并不拥有这张图片的版权。
基本上目前得知的讯息,AI 画作可以做各种商业用途,没有问题,但虽然这些 AI 网站的政策同意你可以商用,但 AI 的作品在美国并不受到版权的保护,因此有些贩售图库的网站并不接受 AI 的作品上传到他们的网站上贩售。像 Getty Images 这间美国图片交易公司就不接受使用 AI 等工具产生的作品上传,而已经上传的 AI 作品也会被删除。在 Getty 发难后,许多图片网站也都纷纷跟进。因此,虽然 AI 绘画平台可以商用,但不同的行业领域得视情况,以及各国的法律而定。
Q6.这些AI绘图网站都是免费的吗?
AI 绘图需要消耗电脑运算能力,因此每个网站都有些免费使用的基本额度,当你的免费额度用完之后,就必须付费才能使用。以 Midjourney 来说,当你的免费额度使用完后,必须订阅才能继续使用,每个月10美金订阅费可以让你画200张图,每个月30元美金则是吃到饱。如果你是大型公司(营业额每年100万美金),订阅费则是600元美金。
DALL•E 2一开始注册时,你会有50点的信用额度,每1点可以出图1次(一次4张),等到50点额度用完之后,如果不想储值,你可以等一个月,时间一到,DALL•E 2会在你的帐户里放入15点。如果你等不及,或是用量比较大,可以付费购买额度,每15元美金可以增加115点的信用额度。
“Stableboost”注册时会有500点的信用额度,每画1张扣1点,如果你一次出图200张,就会扣掉200点。额度用完之后,每5美元,会再给你500点。
“NightCafe”免费额度用完后有各种月租方案、也有单买的方案,甚至可以透过分享、评论、按赞等各种方式赚取免费的额度。
Q7.想获得更漂亮作品有甚么诀窍吗?
在使用 AI 绘图网站时,会常看到“prompts”这个字,prompts是“提示”的意思,也就是我们叫 AI 作画时给它的关键字词、AI 是透过你给给的“prompts”来画画,你给的描述愈清楚,比较“有机会”接近你想像的作品。当你把提示字元输入栏位后,剩下只能“等等等等”。因为接下来你只能靠 AI 的“灵感”,因此,你仔细的描述你想要的那个画面,如果第一次画的不满意,那就再来一次,其他,你没甚么可以著力的部分。
另外,要善用各网站的“提示资料库”,每个 AI 绘画网站的图片,都会注明了这张图是由哪些关键字所组合绘成的,如果你在网站上有看到自己喜欢的作品,你可以多参考别人下的关键字,来提升自己的功力。
Q8.别人下同样的关键字也会得到一样的内容吗?
不会。根据我们实际操作的结果,你在不同的 AI 绘画平台输入同样的关键字,都会得到不一样作品。以戚建邦在 Midjourney 画的红衣侠女的关键字“a 20ish wuxia long h AI r beautiful woman in red standing on a cliff, moss-covered, wind swirling, dramatic light, 4k, watercolor splatte”输入到其他的平台,都不会得到同样的结果,甚至你在同一个平台,输入同样的提示字,每次也都不会得到同样的结果。
就结果来看,即使输入同样的关键字,每次都会是独立事件,所以不用担心每个人如果输入同样的关键字会得到一样的作品。就好比同一个画家给他同样的主题,也不会画出一样的东西了。
但就结果来看戚建邦在 Midjourney 画的那张图显然质感和构图都比较好,但要提醒读者的是,正如我们前面提到的,你可以从 Midjourney 在初始画4张图中,挑选其中一张再补强细节或是加以延伸,但“Stable Diffusion”、“Stableboost”或“DALL•E 2”目前并没有这种延伸的功能,因此单纯的拿第一次的作品还重刷无数次的成果比较并不太公平。
Q9.用手机也能使用AI绘画吗?
答案当然是可以的。我们之前谈到,AI 绘画用的是平台的电脑运算能力,和你自己的本地端的设备没甚么关系,只要透过浏览器就可以操作,因此,只要你的手机可以透过浏览器上网,那么你同样可以使用这些平台的服务。这些你透过手机所绘制的图片,当你在电脑上登入自己的帐号时,照片仍然会保留在你的帐号底下。
Q10.这些AI绘画的关键字可以使用中文吗?
很抱款,没办法。除了中国的 AI 绘画网站外(但也是只使简体中文),今天我们介绍的平台都只支援英文,因此你必须使用英文来输入这些提示字词。但英文不好的人也不用担心,现在有个很好用的工具叫“Google 翻译”,你只要在 Google 翻译里用中文输入你想要描述的句子,再把 Google 翻译翻出来的英文复制/贴上到 AI 绘画网站的提示字栏位中,效果也不错。
【本文获“T客邦”授权转载。】