陸宇婷
“做了幾幅之后我就傻了,沒想到機(jī)器真的能看懂我的指令,還能給出相應(yīng)的圖像。”
2022年8月31日,由AI生成的畫作《空間歌劇院》在美國(guó)科羅拉多州博覽會(huì)的數(shù)字藝術(shù)類美術(shù)比賽中獲得第一名。該獎(jiǎng)項(xiàng)的授予引起很大爭(zhēng)議,有人感嘆“藝術(shù)的死亡在我們眼前展開”,也有人表示“憑借AI作品獲獎(jiǎng)并不能證明你就是藝術(shù)家”。
2022年,AI繪畫工具迎來(lái)了飛躍性的發(fā)展,在生成結(jié)果的質(zhì)量和速度上都有了顯著提升,幾秒鐘內(nèi)便可以生成畫面優(yōu)美的高清圖片。8月22日,生成速度極快、且具有較高藝術(shù)觀賞性的AI繪畫算法Stable Diffusion宣布開源,再次讓AI繪畫成為熱點(diǎn)。
故事從裝飾房間開始
2019年,一個(gè)朋友到自由職業(yè)工程師Angus Russell(安格斯·拉塞爾)家里做客時(shí)說道:“你們家墻上有點(diǎn)光禿禿的?!闭f者無(wú)心,聽者有意,拉塞爾和女朋友決定找些藝術(shù)品來(lái)裝飾。
幾乎逛遍所有墻面藝術(shù)品店鋪后,拉塞爾發(fā)現(xiàn)市面上的作品都無(wú)法與自己的經(jīng)歷、情感產(chǎn)生關(guān)聯(lián)。他突發(fā)奇想:能否購(gòu)買一幅AI生成的畫作,或者自己用AI創(chuàng)作一幅完全個(gè)人化的作品?
經(jīng)過搜尋,拉塞爾發(fā)現(xiàn)了市場(chǎng)空白——沒有能夠購(gòu)買AI生成畫作的平臺(tái)。于是,他萌生了更大的計(jì)劃——開發(fā)平臺(tái),幫助更多人用AI畫作裝飾自家墻面。他首先開了一家網(wǎng)店來(lái)進(jìn)行“市場(chǎng)調(diào)查”,以30到50澳元標(biāo)價(jià)售賣自己生成的AI作品,看是否有人購(gòu)買。確定有市場(chǎng)后,拉塞爾花了一個(gè)月時(shí)間利用開源代碼搭建起了Nightcafe,一個(gè)讓使用者免費(fèi)生成畫作,并提供付費(fèi)購(gòu)買制作裝飾畫實(shí)物的平臺(tái)。
2021年,VQGAN+CLIP算法的結(jié)合使用讓AI繪畫踏入新階段,真正實(shí)現(xiàn)了較高質(zhì)量的“輸入文字生成圖像”。這兩種機(jī)器學(xué)習(xí)算法彼此獨(dú)立,前者擅長(zhǎng)根據(jù)原有圖像生成相似的圖像,而后者能夠給圖像與文字的匹配程度打分。兩個(gè)算法互相配合,多次迭代后,便能生成一張符合使用者輸入文字的最佳圖像。
算法開源后,拉塞爾將其引入了自己的網(wǎng)站。在拉塞爾看來(lái),當(dāng)時(shí)技術(shù)下的AI繪圖更適合用于創(chuàng)作一些抽象的內(nèi)容,例如夢(mèng)境和鬼屋,但對(duì)于具象化的作品則很難完美實(shí)現(xiàn),比如一個(gè)結(jié)構(gòu)科學(xué)的房子,或者身材面部比例合理的人像。
這一缺憾在一年后,也就是2022年得到了改善。這一年,擴(kuò)散模型(Diffusion Model)憑借更出色的生成結(jié)果取代了對(duì)抗生成網(wǎng)絡(luò)(GAN),成為圖像生成領(lǐng)域更偏愛的算法。
進(jìn)步神速的AI畫手
2022年3月6日,有著影視和游戲從業(yè)經(jīng)驗(yàn)的FeiArt第一次使用Disco Diffusion(以下簡(jiǎn)稱DD)。進(jìn)入網(wǎng)站后,指令框中已然存在一行文字,“一個(gè)很漂亮的、在海邊的燈塔”,并配上了某藝術(shù)家風(fēng)格。點(diǎn)擊生成后,F(xiàn)eiArt解鎖了第一次AI創(chuàng)作體驗(yàn),得到了一張燈塔的圖片。
得到燈塔圖片后,F(xiàn)eiArt又輸入了幾個(gè)指令,讓AI生成大樓、車輛:“做了幾幅之后我就傻了,沒想到機(jī)器真的能看懂我的指令,還能給出相應(yīng)的圖像?!?/p>
四個(gè)月后,效率更高的AI繪圖軟件Midjourney(以下簡(jiǎn)稱MJ)出現(xiàn)了。DD時(shí)代下,生成一張圖可能要半小時(shí),而MJ生成四張圖不到一分鐘。而且,使用者不再需要面對(duì)代碼,只需要在Discord社群中輸入指令便可得到結(jié)果。該變化不僅為使用者帶來(lái)了便利,而且營(yíng)造了一個(gè)開放性社區(qū)。在這個(gè)社區(qū),每個(gè)人都可以看到其他人所使用的指令關(guān)鍵詞,這意味著創(chuàng)作不再神秘,人們可以互相模仿。
此時(shí),“畫”出一幅好畫的關(guān)鍵不再是掌握訓(xùn)練AI的辦法,而是有效描述自己想要的畫面,比如在內(nèi)容描述完后加一個(gè)“Art Station”(一個(gè)綜合CG視覺藝術(shù)網(wǎng)站名字),AI生成的圖片質(zhì)量會(huì)比較高,再比如“高細(xì)節(jié)”“電影打光”等描述能賦予圖片不同質(zhì)感。有人更是整理出了“AI繪畫秘籍200關(guān)鍵詞”“畫派關(guān)鍵詞——XX類”等關(guān)鍵詞手冊(cè)。
AI理解這些關(guān)鍵詞似乎尚需時(shí)日,比如沒法很好地演繹“美麗的”這種寬泛的形容詞,需要使用者同時(shí)給出特定藝術(shù)家、設(shè)計(jì)師的名字,這無(wú)疑提升了專業(yè)門檻。
2022年8月,功能強(qiáng)大的AI繪畫平臺(tái)Stable Diffusion(以下簡(jiǎn)稱SD)開始內(nèi)測(cè)。SD模型能在消費(fèi)級(jí)顯卡上的10GB顯存下運(yùn)行,并在幾秒鐘內(nèi)生成512x512像素的圖像。據(jù)FeiArt介紹,SD在不到一個(gè)月的時(shí)間內(nèi),產(chǎn)出AI圖畫的數(shù)量已經(jīng)超過了人類畫家過去幾十年在Artstation網(wǎng)站上作品的總量。
“打不過就加入”
2022年6月11日,《經(jīng)濟(jì)學(xué)人》雜志選擇用MJ生成的AI繪圖作為當(dāng)期雜志的封面,報(bào)道主題“人工智能新前沿”同時(shí)也是給AI輸入的繪圖指令。編輯部表示,生成圖片本身較為輕松,但是找到能生成合適圖片的指令卻并不簡(jiǎn)單,他們嘗試了250次,生成1000張圖片后才最終確定了這個(gè)拼貼風(fēng)格的封面。
“我們想指出,目前AI繪畫的基礎(chǔ)模型與好萊塢電影所鐘愛的殺手機(jī)器人還相差甚遠(yuǎn)?!本庉嫴吭谏缯撝辛谐隽硕嘟M試驗(yàn)結(jié)果,其中不乏直接給出指令里沒有的棋盤、將長(zhǎng)篇指令詞直接堆積在畫面中間的無(wú)厘頭圖片,“它們(AI)確實(shí)很厲害。但是我們認(rèn)為,至少在接下來(lái)的幾期中,還是應(yīng)該堅(jiān)持與人類插畫師合作。”
畫師或許是受到AI繪畫最直接影響的群體,他們對(duì)于AI繪畫的態(tài)度已然兩極分化。不少畫師公然批評(píng)用AI生成作品的人,認(rèn)為“這樣不道德,應(yīng)該讓藝術(shù)家來(lái)做”,對(duì)于AI生成的作品本身,則表示“細(xì)看是一堆垃圾”。
2022年8月29日,AI繪畫網(wǎng)站mimic的測(cè)試版上線,該網(wǎng)站主攻日系二次元畫風(fēng)頭像,允許用戶上傳圖像讓AI學(xué)習(xí)并輸出相同畫風(fēng)的AI畫作。mimic剛發(fā)布便遭到了大量日本畫師的抵制,他們發(fā)表了“禁止將我的作品用于AI作畫”的聲明,有人甚至刪除了發(fā)在推特上的畫作,怕有心之人盜用上傳至平臺(tái)。一天后,平臺(tái)宣布整改。
然而,正如19世紀(jì)的“新技術(shù)”攝影既沒有被畫家的聯(lián)名反對(duì)淹沒,又沒有造成繪畫的“死亡”,如今的AI繪畫也在一片抗議聲中獲得了不少“打不過就加入”的擁護(hù)者。
游戲場(chǎng)景原畫師秦天對(duì)AI繪圖工具持完全肯定的態(tài)度。他在業(yè)余時(shí)間利用AI創(chuàng)作了多套作品,表示應(yīng)用AI后可以節(jié)省80%的繪畫時(shí)間。在社交平臺(tái)上得到較高關(guān)注的古風(fēng)武俠AI創(chuàng)作《趙客縵胡纓》便是秦天在AI的輔助下,用大約七個(gè)小時(shí)做出來(lái)的。
在秦天看來(lái),AI繪圖的出現(xiàn)和3D輔助非常相似,它們都受到了很多傳統(tǒng)繪畫、模型制作的質(zhì)疑,但是最終都會(huì)成為劃時(shí)代的工具。“就好比最早用筆畫畫,后來(lái)用數(shù)位板去創(chuàng)作,再后來(lái)用波普藝術(shù)去合成、復(fù)制、拼貼,到現(xiàn)在 AI用繪畫邏輯去組合元素來(lái)實(shí)現(xiàn)你的想法?!?/p>
摘編自微信公眾號(hào)“南方周末”