朱秋雨 黃澤敏
2022年,AI引發(fā)了一場席卷繪畫圈的革命。只要輸入幾句描述語言,幾分鐘內(nèi),一幅清晰的畫作就出現(xiàn)在人們眼前。
人人都能成為畫家。
“AI已經(jīng)不能叫作迷人,而是恐怖?!本W(wǎng)頁設計師逗砂對南風窗感嘆。
作為AI領域的前從業(yè)者,她說,2021年前,“從沒想過人工智能還能取代創(chuàng)意視覺產(chǎn)業(yè)”。
逐漸取代人類創(chuàng)意產(chǎn)業(yè)的是AI領域的一個分支,這被稱為AIGC(AI Generated Content)。今年2月,谷歌推出開源性AI畫作生成平臺Disco Diffusion,引發(fā)全球“用嘴畫畫”熱潮。隨后,Dall.E2、Stable Diffusion、Novel AI等AI繪畫工具相繼面世。百度也推出了AI中文繪畫平臺“文心一格”。
技術與資本的加持下,AI繪畫迅速走進了大眾的視野。
但它也引發(fā)了人們警覺:AI有了與人類相當?shù)乃?,那么,它會有取代人力的一天嗎?/p>
AI取代人力,已經(jīng)部分實現(xiàn)了。
8月,有十多年游戲研發(fā)經(jīng)驗的史官發(fā)了一條微博,“不管你是策劃、美術還是程序,建議盡早學習使用AI畫圖”。
她表示,所在公司已經(jīng)嘗試用AI提供素材,現(xiàn)決定“下個項目盡可能地用AI獲得美術資源,這樣開發(fā)成本至少下降一半”。
史官告訴南風窗,AI繪畫的一大優(yōu)勢是“大批量”。一個周末,她在AI畫圖軟件Stable Diffusion上設置關鍵詞,兩天后,AI生成了1萬張圖。這些都是游戲里的圖標,例如旗幟上的標志物,不是主角但耗費很多人力。
結(jié)果,在人類休息的時間,AI高效產(chǎn)出。
史官驚喜地發(fā)現(xiàn),AI畫的圖很多能用?!耙蝗f張我都沒看完,很多圖隨便調(diào)調(diào)就足夠用了?!?/p>
AI繪畫會成為如此實用的生產(chǎn)工具,放在2022年初,極少人能預料到。很多AI繪畫愛好者有個共同記憶,年初,谷歌推出Disco Diffusion時,出一幅圖耗時約1小時。
在網(wǎng)頁等待AI最終成畫的過程,心情是既期待又煎熬的。
漫長的等待時間讓AI繪畫一度在小眾領域狂歡。但半年后,一幅AI畫作的生成時長普遍在幾分鐘內(nèi)。
“沒想到時代變得那么快。這才半年,AI能做的已經(jīng)天翻地覆了?!蓖婢咴O計師烏鴉對南風窗感嘆。
他給記者展示了幾張自己用AI生成的畫作,都是色彩對比濃烈,主角鮮明,具有骷髏頭、怪獸、異形人等“克魯蘇”元素,乍看作品很吸睛,像好萊塢商業(yè)片中的場景。
烏鴉說,這些畫作只輸入了幾個描述主角的關鍵詞,再添加他想要的繪畫風格,例如,克魯蘇風。
最后一步,加上喜歡的藝術家的名字。
他仰慕波蘭藝術家貝克辛斯基。后者在畫里傳遞了超現(xiàn)實的末世感,那種與死亡、命運有關的猙獰與沖擊,總讓他著迷。有了AI,如今他也能畫出無數(shù)幅“貝克辛斯基”。
更關鍵的一點,烏鴉說,AI繪畫擁有了融合的能力?!艾F(xiàn)在AI不僅僅可以模仿,還能將各類藝術風格融合到一起。”
他曾嘗試將中國水墨風加進了“貝克辛斯基”里,AI為他生成了從未想過的畫面。
“如果認可融合便是創(chuàng)新的話,AI絕對有能力成為強大的武器,進行藝術風格上的拓展?!睘貘f如此認為。
與烏鴉相似,AI繪畫的愛好者都對南風窗提起,AI一大特點是隨機性。
即便在同一程序輸入同樣的關鍵詞,AI生成的畫作也極可能有很大區(qū)別。
史官認為,這一特點讓AI在策劃階段起重要作用。“AI在試圖創(chuàng)造現(xiàn)實不存在的東西時很有創(chuàng)造力,很多搭配人都未必想得出來。AI的混搭反而提供了靈感?!?/p>
據(jù)她透露,AI繪畫如今被其大量用于游戲概念設計階段。通過調(diào)整關鍵詞,游戲策劃會先讓AI出100張效果圖,尋找靈感。
“但如果我讓美術或者外包先出100張圖看看效果,他們應該會把我從窗戶扔出去?!?/p>
AI繪畫進軍人類世界,讓2022年下半年對AI的討論抵達高潮。
兩大觀點反復交鋒。一派認為AI的發(fā)展將取代藝術界,給行業(yè)帶來覆滅后果。另一派如史官和逗砂,認為AI目前僅是提高效率的工具。
而之所以AI繪畫引起了如此大“恐慌”,一個關鍵原因是,其所屬的 AIGC(AI自動化內(nèi)容生成),一直是不受資本追捧的冷門領域。
這是一個在AI工程師眼里難以攻克的高峰。
業(yè)內(nèi)普遍認為,當AI學會自動生成內(nèi)容時,意味其不局限于某一特定功能,例如語音識別、智能推薦等,而是邁入了通用人工智能階段。
逗砂稱這叫“強人工智能”。AI相當于擁有了人類完成復雜任務的智力水平。
只是,這一智力水平到底停留在哪里,一直是人工智能界的焦點。
百度文心一格負責人告訴南風窗,AI生圖的原理是,AI從海量圖文對應的數(shù)據(jù)中學習到了“語言描述”與“藝術畫面”的關聯(lián),便從隨機化的起點開始,不斷修正畫作,形成審美上與人類經(jīng)驗與知識高度一致的作品。
但難點一直橫亙在AI工程師面前。
一張繪畫擁有海量的信息,最基本的便是輸出“長×寬”個RGB像素點。但簡單組合RGB得不到有效畫作,還需考慮人類繪畫時每一筆的位置、形狀、顏色等多方面參數(shù)。
2022年以前,支撐AI繪畫領域的是2014年AI學術界提出的深度學習模型,即對抗生成網(wǎng)絡(GAN)。模型的核心理念是讓兩個內(nèi)部程序,生成器和判別器互相比拼,相互平衡。
這一過程就像生產(chǎn)贗品。
用戶首先提供草圖,生成器通過數(shù)據(jù)學習,生成作品,交由判別器判斷其與原圖的相似度。直到生成器產(chǎn)出了與原作同一類別的“贗品”,判別器予以通過。畫作產(chǎn)生。
顯然,GAN模型讓AI繪畫長期停留在“美圖秀秀”的功能上。給圖畫加濾鏡、轉(zhuǎn)換風格,AI繪畫長期囿于模仿人類。
2022年不同的是,AIGC實現(xiàn)了一次近年來最大的進化。
文心一格負責人對南風窗表示,AI繪畫最近的一次技術爆發(fā),是2022年對擴散生成模型(Diffusion Model)的引入。
模型的原理是為圖片去噪,讓AI查看全是噪點的畫面變清晰的過程,讓其有效理解圖像如何生成。
“擴散生成模型能夠在更短的時間內(nèi),像素級建模并生成分辨率顯著提升的繪畫,在美感、細節(jié)精細度上有非常顯著的提升?!鄙鲜鲐撠熑苏f。
于是,如今使用市面上諸如Disco Diffusion等程序,用戶們也驚訝地發(fā)現(xiàn),機器并非像人類一般一筆一畫地繪圖。它們繪畫是從一張高噪點的圖畫開始的,接著畫作一步步變得清晰,擁有細節(jié),最終成像。
技術的突破帶動了各平臺的“內(nèi)卷”。除了谷歌Disco Diffusion開源供用戶免費使用,英國AI創(chuàng)作公司Stable AI,在8月宣布開源,向公眾開放。
Stable AI開源后,眾多國內(nèi)外軟件基于此開發(fā)產(chǎn)品。逗砂告訴南風窗,最近兩個月,新的AI繪畫平臺不斷冒出,工具每天指數(shù)級地迭代,令她眼花繚亂。
“我都有點累了,每天都有新的東西出來,已經(jīng)學不過來了。現(xiàn)在仿佛iPhone剛面世時,每年發(fā)布會都有革新性功能公布,非常讓人激動?!?/p>
AI繪畫能在如此短的時間取得飛速進展,推動的不只是繪畫領域。
視頻、音樂再到大熱的元宇宙和虛擬現(xiàn)實,都在AIGC賽道上看到發(fā)展?jié)摿Α?/p>
“AI繪畫超越了區(qū)塊鏈,成為今年最受資本關注的領域?!倍荷罢f。
9月,臉書母公司Meta發(fā)布AI自動生成視頻系統(tǒng)“Make-A-Video”。原理與AI繪畫相似,根據(jù)輸入文字,生成短視頻。相似地,谷歌也于9月先后發(fā)布AI視頻程序Imagen Video和Phenaki。
Phenaki甚至能在200字左右提示語的基礎上,生成2分鐘以上的長視頻,實現(xiàn)“人人都當導演”的暢想。
一系列新品和操作讓普通人感到,發(fā)展AI仿佛打開潘多拉的寶盒。
人類對AI的生畏情緒一部分源于其強大的學習和數(shù)據(jù)處理能力。一個流行的網(wǎng)絡段子形容,AI能發(fā)展那么快,是因為給它學習資料和數(shù)據(jù),“AI是真在學”。
更重要的是,AI學習基于的數(shù)據(jù)往往來自人類的作品。
這在部分畫師眼中,AI是“縫合怪”“剽竊高手”般的存在。
8月底,大量日本畫師在社交媒體上齊力抵制AI作畫。他們聲明:“請不要在AI自動制作的服務中使用我的作品。”
事件緣起于一個日本二次元網(wǎng)站,在AI繪畫大火時,發(fā)布了一個測試版,允許用戶自己上傳15至100張圖像讓AI進行學習,并輸出相同畫風的AI畫作。這一相當于“克隆”的程序,直接侵害了畫師的權益,同時點燃了人類與AI創(chuàng)作之間的沖突。
逗砂理解這樣的抵制。版權問題始終是AI繪畫懸而未決的問題,但背后深藏的是來自行業(yè)內(nèi)部的焦慮。
“繪圈(指日系繪畫社交圈)近10年形成較為固定的畫風,人物有相似的眼睛和穿搭。只要將數(shù)據(jù)訓練出來, AI能形成非常穩(wěn)定的畫風?!?/p>
如此一來,許多中小畫手在繪圈將被AI取代。
但“AI為什么是一種威脅呢?”逗砂在社交媒體上發(fā)問,“我看到了兩種截然不同的態(tài)度。一種是興奮地嘗試學習如何利用AI為自己作品服務,另一種是覺得這些是無價值的電子垃圾,開始例舉傳統(tǒng)藝術多么高貴,或者自己之前學的都失去了意義”。
“《三體》里有一句特別適合用來回答,‘弱小和無知不是生存的障礙,傲慢才是’。”逗砂說。
文心一格負責人認為,AI繪畫的未來將帶來兩方面的變化。一是今后藝術創(chuàng)作過程將有AI協(xié)同,例如AI生成初稿后人工修改的新創(chuàng)作方式。
“二是AI繪畫本身,可能會形成一種新的藝術流派?!?/p>
逗砂也對人類未來感到樂觀。AI繪畫雖然降低了普通人繪畫的門檻,“但要想用AI做出比較好的圖,需要非常了解畫作背后的知識,比如風格、藝術家、藝術史”。她猜想,今后(繪畫)的關鍵可能在于人對藝術知識的理解。
“首先人得知道,才能將它描述出來?!?/p>
不過,內(nèi)心深處,她也深藏對技術帶給人類社會不確定性的恐懼。
在AI繪畫剛火時,她創(chuàng)作了一幅《數(shù)字上帝》的電子藏品。
圖畫里的上帝是深黑色背景,身上帶有電子、金屬等元素。
她說,通過人工智能和虛擬技術,人們正創(chuàng)建一個十分逼真、真假界限模糊的虛擬元宇宙。這樣一想,“我們生存的世界,是虛擬世界的可能性有多大?”