法國攝影師納達爾在《我的攝影師生涯》這本書里提到了作家巴爾扎克對攝影的理解,“所有的肉體都是由一層一層的幽靈般的圖像組成,由無數(shù)葉子般的皮膚層層疊加而成”,“重復曝光意味著不可避免地要失去這樣的一個幽靈層,也就是生命的本質(zhì)” [1]。在巴爾扎克看來,攝影這樣基于客觀對象進行拍攝的行為,是將由無數(shù)葉子構(gòu)成的肉體的靈光給去除掉了,身體在巴爾扎克的“幽靈說”里變成了一個圖像的疊加體。巴爾扎克的看法意外地呼應AI圖像的生成邏輯,即“一層一層的幽靈般的圖像”“無數(shù)葉子般的皮膚層層疊加”。AI這樣的數(shù)字幽靈,正是通過這樣的材料單元和工作方式,在大模型里接受文字指令,進行疊加、渲染,最后生成圖像。所有生成的啟動媒介,都是文字,這也反證出巴爾扎克作家身份之于AI生成邏輯的契合,他通過文字思維來理解圖像的生產(chǎn),AI也正是如此。關于“幽靈理論”,德里達也曾不斷闡述,但其幽靈理論更多是指向電影,他甚至認為電影就是一個“鬼魂歸來”的藝術。而本文提及巴爾扎克的“幽靈理論”,一方面是想說明這種基于新媒介的擔憂情緒,是與當下人們對AI的緊張情緒相對應的,另一方面是想回到文字的邏輯里理解圖像的生成。
在AI生成技術面向大眾的2023年里,它收獲了驚喜,也遭遇了詬病,驚喜的是AI意外的制圖能力,而其遭人詬病的原因,除了在于人們憂心其學習能力和主體意識的形成之外,還在于人們指認其缺乏情感。這種憂心和指認之間的悖謬,反映出人對媒介和其使用者的剝離和對AI的全能索求。事實上,所有的媒介都是中性且沒有情感的,它們不會說話,也不會主動表達。我們通常在媒介里看到的情感,是媒介的使用者通過媒介釋放出的某種情感。
一、圖像觀看經(jīng)驗
AI生成圖像所能夠利用的是記憶與經(jīng)驗,“/ imagine:”指令框調(diào)動的正是人們遺落和丟失的東西,所以“/imagine:”的動作,既是勾起,又是找回,以此讓記憶和經(jīng)驗在當下的數(shù)據(jù)語境里重生。
首先,我們得面對關于真實的經(jīng)驗以及真實的創(chuàng)傷經(jīng)驗,這是圖像觀看經(jīng)驗的前提。人們理所當然地認為攝影圖像是現(xiàn)實的等價物,但正是圖像的工具化,使得圖像在社會的運作中產(chǎn)生了分化,衍生出權力和意義。如約翰·塔格(John Tagg)所言,兩者“建立了互惠關系”,意義(知識)塑造權力,而權力制造新的意義。在塔格看來,“照片證據(jù)所屬的政體,是以管理和話語的復雜重構(gòu)過程為特征的,它取決于生產(chǎn)和占有的權力及優(yōu)勢與生成意義的負擔之間的社會分化?!盵2]經(jīng)由這樣的互惠過程,攝影所制造的圖像形成了新的話語和體制形式。所以,考察這樣的圖像,必須考察它的敘事主體(擁有者,或者闡釋者)。真實的容貌面具遭遇揭秘,人們長期以來達成的對真實的共識,卻帶給了自己如同情感背叛一樣的創(chuàng)傷經(jīng)驗。我們在理解“等價物”之初,就已經(jīng)做出了一個注定要受創(chuàng)傷的動作,也即是說在這個邏輯鏈里,我們把作者切割掉了,只保留了相機和現(xiàn)實世界的等價關系,而正是作者,使我們得以節(jié)制這種對于客觀真實的強烈熱忱。
當我們觀看那些由“無數(shù)葉子般的皮膚”組成的身體與圖像時,我們也應該如此觀看那些由“無數(shù)葉子般的圖像”組成的AI圖像,只有將其從“真實”中打撈出來,我們才可以卸掉重負,在較為輕松的觀看行動里識別和重構(gòu)新的圖像經(jīng)驗。藝術家方政在其作品《截斷》里有意混淆了現(xiàn)實圖像與AI圖像的邊界。他用手機拍攝了疫情期間及之后的很多日常圖像,以及其他現(xiàn)實景觀,然后將這些手機生產(chǎn)的圖像投喂給AI生成器,輔以文字指令,生成出新的AI圖像,最后打印在拍立得相紙上。在展覽現(xiàn)場,尺寸小巧的物質(zhì)化圖像被完全打亂后,觀眾已經(jīng)難以分辨出手機拍攝的圖像與AI圖像之間的區(qū)別。方政將一個常常被忽略的知識盲區(qū)通過AI生成與攝影并置的形式展示出來,從媒介發(fā)展的角度來講,方政展示的是兩種媒介巖層里的積液。
二、AI圖像生成與視覺養(yǎng)成
在AI圖像的生成過程中,除了底層大模型的數(shù)據(jù)儲備之外,AI指令需要調(diào)動的碎片要么來自記憶,要么來自圖像經(jīng)驗。腦神經(jīng)的機敏度、對于記憶的調(diào)取能力,以及圖像經(jīng)驗里的歸納和統(tǒng)籌能力,無時無刻影響著AI指令的文字結(jié)構(gòu),而圖像經(jīng)驗來自大眾文化、藝術史、自然現(xiàn)象及社會事件,在“無數(shù)葉子般的皮膚層層疊加而成”的生成場景里,這些經(jīng)驗被調(diào)動和組織。
筆者曾生成過許多個孤舟在游泳池中停泊的景象,其中一張(圖4),是一個穿著寬大西裝的中年男子和一個穿著露背裝的年輕女子背對鏡頭坐在泳池中的孤舟上的場景,靜默而曖昧。追溯起來,這幅作品大致可以找到如下圖像經(jīng)驗:藝術家楊福東的攝影作品《客再遇 》第3號,拍攝了兩個穿水兵服裝臉上有傷的男子坐在孤舟的兩端,而面容優(yōu)雅的女子坐在孤舟中間的場面;在翁奮的作品《看湖》中,幾個穿著學生裙的女中學生待在獨木舟上望著河對岸裸露出地面的山峰;馮立的作品《白夜》用強力閃光燈俯拍了一家三口在公園湖中劃孤舟的場景;在嚴明的新作《綠野仙蹤景區(qū)》中,一對情侶在漂滿綠藻、周圍有樹的網(wǎng)紅景區(qū)劃著孤舟;在荒木經(jīng)惟《感傷之旅》中,陽子蜷縮著身體趴在獨木舟上小憩;在日本導演小林正樹的電影《怪談》中,一名日本男子站在獨木舟頭劃船,而女子坐在船尾側(cè)頭望向湖水中,昏黃的電影光推進著詭異而不安的氣氛;加拿大藝術家彼得·多依格(Peter Doig)畫作中也頻繁出現(xiàn)紅色獨木舟……這些構(gòu)成了一個圖像經(jīng)驗的微型數(shù)據(jù)庫,主導了筆者的AI圖像生成的視覺養(yǎng)成,在眾多數(shù)據(jù)中,“孤舟”被提取為圖像劇場中的主導元素。
藝術家有自己的創(chuàng)作脈絡。武漢藝術家組合李郁&劉波的《2012新聞肖像》沿用他們以往的創(chuàng)作思路,在過去的創(chuàng)作中,他們以武漢當?shù)貓蠹埳系囊恍@悚而怪誕的新聞為依據(jù),找臨時演員,現(xiàn)場布景和布光,進行拍攝。在《2012新聞肖像》中,他們依然以舊報紙上的新聞為底本,將這些新聞編輯成指令,在AI生成器中生成新的圖像。AI生成器于他們而言,與他們之前的創(chuàng)作脈絡一致,只是它更加快捷且低廉。
此外,歷史圖像也成為藝術家使用的視覺資源和敘事線索。藝術家傅為新的作品《本杰明之后》使用AI來模擬考古,該系列作品分為三個板塊:“消亡史”“本杰明之后”“假設的藝術”。藝術家以一個已經(jīng)滅絕的物種—袋狼—為線索,結(jié)合部分真實史料,想象并生成了三個板塊的圖像故事:第一個板塊講述了袋狼本杰明消亡之前人類的所作所為,第二個板塊講述了消失后人類試圖利用基因?qū)λM行克隆的努力,這個故事最后以袋狼作為一個符號與藝術史和消費社會結(jié)合的場景作結(jié)。
三、AI底層架構(gòu)師的文化設定
從過往的AI生成經(jīng)驗來看,中國的數(shù)據(jù)在其中占比極少,無論是地理地貌、風土人情,還是人種的面孔結(jié)構(gòu)、服飾裝扮,甚至是工種、食品、建筑或者樂器等都會在生成的過程中令創(chuàng)作者大費腦筋。數(shù)據(jù)的占比也使得中國文化在AI的語境里遭遇邊緣化。在大部分情況下,即便我們在指令里加入“中國”或“中國人”等文化限定詞,也多半會滑入“泛東亞”的文化圈。這就使得我們在AI生成過程中,需要不斷地投喂圖像數(shù)據(jù),以達到適度的平衡,這也逼迫我們要在生成的過程中揣摩AI底層架構(gòu)師的文化設定。
就目前流行的AI生成器來說,ChatGPT這樣的文字性生成器還允許使用漢語,這至少保證了適度的語言環(huán)境,而AI繪圖Midjourney和Stable Diffusion則無一例外地使用英語,雖然后者的理想操作是下載模型,進行本地訓練,但指令還是會在轉(zhuǎn)譯的過程中損失其文化表達的準確性。以英語為母語編碼數(shù)據(jù)、編寫算法規(guī)則和語言程序的AI工程,在底層架構(gòu)師的文化設定和價值構(gòu)建里,依然秉持著既有的國際差異眼光和權重。
筆者曾經(jīng)生成了一張圖像《AI雙胞胎姐妹》,在這幅圖像中一對穿著紅色衣服的中國西北雙胞胎女孩,坐在停放在西北戈壁灘上的卡車上,女孩的表情、發(fā)型和穿著符合中國人的普遍性審美,不具有AI生成慣性中的時尚模特的商業(yè)化屬性。后來,筆者將這幅圖像在Midjourney里進行“/describe:”的指令操作,生成器根據(jù)上傳的這張圖像輸出4條不同的文字描述,再根據(jù)這4條文字分別生成4張圖像。這個過程中,筆者試圖通過反向操作來反推AI圖像生成中的邏輯習慣和文字描述的權重與規(guī)則,并且有意去測試AI圖像生成中的記憶與識別性,即由它生成的圖像是否還粘連著最初的文字信息,以及測試在反向“/describe:”生成文字的過程中,這些信息在多大程度上脫落。從中,我們可以間接地觀察到“圖生文”和“文生圖”的反復生成過程中的基因變異,并通過“反偵察”的方式試圖接近底層架構(gòu)師的設定邏輯。
從測試情況來看,由這張圖像生成的四條指令從一開始就將人物判定為亞洲女性,接著尋找風格與之相對應的藝術家的作品。在第四條指令里,AI生成器做出一個安全的指涉,指出這張圖像與韓流、日本古典風格以及中國當代藝術等有相關性。然而,當我將4條指令分別輸入,生成的四張圖像時,情況已然失控—原來樸素的雙胞胎變身為坐姿職業(yè)化、面容國際化且商業(yè)屬性濃烈的時裝模特,人物的膚色也變成了符合西方審美偏好的小麥色—即便這已經(jīng)是AI生成的系列圖像中較為接近初始圖像的一張(圖5)。
四、人機共創(chuàng)下的個性化與集體洪流
我們不妨簡單描述一下AI圖像生成的過程。首先它有一個大數(shù)據(jù)庫,這個數(shù)據(jù)庫抓取了大量圖像作為基礎數(shù)據(jù),比如油畫、插圖、動漫以及攝影,甚至是歷史圖像。在以大數(shù)據(jù)為基礎的大模型架構(gòu)完成之后,這些圖像全部會被程序打碎,然后被命名和編碼。當指令送達時,指令也會根據(jù)先后順序和權重被打碎,和這些底層被命名的碎片進行基因匹配,有限的算力開始工作,為了展示算力的神奇性(當然也可能是為了降低過久的算力壓力),架構(gòu)師們設定了算法耗費的時間區(qū)間,在固定的時間里,圖像碎片堆疊的工作就已經(jīng)開始了。當這個過程完成以后,我們就獲取了指令所換來的圖像。即便每個使用者都擁有一個個性化的頻道,但就云端數(shù)據(jù)庫而言,每個使用者生成的圖像最終會匯入大數(shù)據(jù)的集體洪流,再一次經(jīng)歷上述過程。我們不得不面對人機共創(chuàng)中的幾個重要問題:
(一)頻道特性與數(shù)據(jù)共用
一張圖像的生成,不單是一個人完成的,也不單是一個機器完成的,它涉及共同合作。長時間對個人所占有的頻道進行喂養(yǎng)或指令訓練,大數(shù)據(jù)就會形成自己的記憶,并不斷討好頻道所有者。在某種程度上,頻道所有者看上去似乎具備主體意識和相應的權力,但從大模型的角度來看,這些特性都會變成共用的數(shù)據(jù)。
(二)數(shù)據(jù)供養(yǎng)和圖像反饋
筆者在這里使用了“供養(yǎng)”一詞,是因為在AI里,如同在現(xiàn)實中,對于信仰人物的付出儀式一樣,需要時間、財力以及虔誠度,而在大多數(shù)情況下,我們的付出和收獲從來不成正比。在不可操控的界面和算法下,即便我們輸入了很多限定性指令,也未必能夠獲得較為令人滿意的圖像。
(三)審美偏差和在線逃逸
意外總是頻繁發(fā)生,并令人驚喜。生成的圖像的成熟度和美學樣式,也經(jīng)常使我們亢奮。例如,當我們看到生成出來的圖像跟我們最初想象的完全不一樣,但該畫面又特別驚艷的時候,到底是接受還是放棄這樣的結(jié)果?大部分人可能偏向于接受,而接受以后面臨的問題就在于人被數(shù)據(jù)訓練,被數(shù)據(jù)喂養(yǎng),而不是在塑造它,長此以往,就會形成舒適區(qū)。抵抗被馴養(yǎng)的辦法不是逃避,而是達成在線逃逸的目的。所謂“逃逸”就是通過不斷地修正指令,糾正審美偏差,使自身從AI設定的圖像邏輯和較流行的審美偏好中擺脫出來,建立符合自己意志的圖像生成取向。
(四)時間黑洞與數(shù)據(jù)“勞工”
AI表面上的低廉和快捷,造成了很多圖像剩余。生成這些被我們看作廢棄物的圖像,消耗了大量的時間成本。就筆者生成圖像的體驗來測算,最初訓練頻道小模型,大致需要花費一天的時間才有可能生成一張比較滿意的圖像,后期這種訓練的時間會逐漸遞減,但這個過程無異于時間黑洞,創(chuàng)作者被其卷入。對于不斷地在升級和更新的AI來說,大量的使用者并不是利益攫取者,而是數(shù)據(jù)和模型大公司的數(shù)據(jù)勞工,每一個模型的豐富與升級均有賴于大量使用者的喂養(yǎng)和勞作,而數(shù)據(jù)和模型的開發(fā)者由此獲得用于改進模型的參數(shù)。
五、攝影與AI圖像的關系思辨
攝影從業(yè)者需要將自己從媒介的焦慮里掙脫出來,以較為坦然的心態(tài)面對AI生成技術。如果要形象地描述AI生成,筆者認為它就是圖像的雜交,是圖像生物學意義上的混血樣本。讓攝影從業(yè)者焦慮的類攝影模型無非是對攝影的模擬—以攝影作為表象,并利用攝影的成像范式。
AI圖像與攝影的關系到底如何?我們不妨來對比一下。攝影調(diào)動的人體器官是眼睛、手和腳,人們拿著相機走出去,用眼睛通過取景框觀看世界,在情動之時用手按下快門。AI圖像不遵循這種工作邏輯,它動用人的大腦和語言構(gòu)建一個畫面,人們要用文字表述指令。在攝影中,相機是人和世界的中介,在AI中,算法是人和數(shù)據(jù)的中介。攝影的結(jié)果是產(chǎn)生關于世界的圖像,被拍下的圖像是現(xiàn)實世界的鏡像,而我們反過來通過鏡像理解世界;AI的圖像應該被看作是圖像的世界,因為它使用大量的圖像形成了一個圖像的海洋,它是關于圖像的圖像。如果我們把攝影看成現(xiàn)實主義的倒影,那么AI圖像就是神秘主義的禱告。
自AI誕生之日起,其生成的結(jié)果就面臨著追問,尤其是版權問題。攝影是把世界進行共享,攝影家通過操作相機,提供主觀意志形成的圖像,而AI則是共享圖像碎片?,F(xiàn)實并沒有版權,大家共享,圖像碎片也因為被打碎而失去了版權的屬性。但是,我們在AI圖像的生成過程中看到,使用者們都是通過主觀意志和勞動,使AI能夠按照自己的指令去創(chuàng)造圖像,如果攝影有版權,AI自然也應該有版權。事實上,對于版權的追問,反而有悖于攝影這一媒介本身的延展,更遑論AI圖像。在芝加哥大學圖像學學者W.J.T.米歇爾看來,“攝影既不是藝術、也不是非藝術(而是技術),它是一種新的生產(chǎn)形式,它改變了藝術的整個本質(zhì)”[3]。而美國“十月”學派的看法更具針對性,“攝影作為技術復制時代最具代表性的媒介之一,它的可復制性、非原創(chuàng)性已經(jīng)滲入藝術創(chuàng)作的底層邏輯?!盵4]這句話意味著,口口聲聲踐行攝影的人們,似乎執(zhí)意讓攝影這一去中心化的媒介回到少數(shù)人手中,而“原創(chuàng)”作為一種資本邏輯和術語,在創(chuàng)作實踐中被提高到一個異常的地位?;仡櫋皥D像的一代”里的辛迪-舍曼、芭芭拉-克魯格以及理查德-普林斯的實踐,我們就會明白《十月》雜志里的這句話似乎對大多數(shù)攝影從業(yè)者而言是一種嘲諷,而AI圖像似乎更應該如此。
(海杰,獨立策展人、影像批評家,青島電影學院攝影藝術與技術系學科帶頭人)
注釋:
[1] [3] [4] 羅莎琳-克勞斯:《追溯納達爾》,載于李鑫、徐曠之編,《重塑攝影:〈十月〉與當代攝影理論》,第42至43頁、第5頁、第5頁,該書為內(nèi)部學術交流資料,尚未正式出版。
[2] [美]約翰-塔格:《表征的重負:論攝影與歷史》,重慶大學出版社2018年版,第6頁。