陳奇佳 徐陽(yáng)
中國(guó)人民大學(xué)文學(xué)院
“我想全球市場(chǎng)也許只需要5臺(tái)計(jì)算機(jī)?!薄獓?guó)際商用機(jī)器公司董事長(zhǎng)托馬斯·沃森,1943年。
“未來的計(jì)算機(jī)也許不會(huì)超過1噸半?!薄锻ㄓ脵C(jī)械學(xué)》雜志,1949年。
“對(duì)任何人來說,640K的內(nèi)存都應(yīng)該夠用了?!薄葼枴どw茨,1981年。
不妨往后退一步,擱置AI寫作的藝術(shù)性、文學(xué)性、詩(shī)性,也暫且擱置AI寫作的潛能等話題,回到問題的起始之點(diǎn),叩問今天的AI何種層面、何種形式的活動(dòng)能夠與人類所謂的藝術(shù)活動(dòng)相接近、相配稱?其實(shí)也就是這樣一個(gè)問題:當(dāng)前的AI活動(dòng)是否已經(jīng)可以將某些人類公認(rèn)的藝術(shù)形式轉(zhuǎn)化為一種確定的算法?具體到寫作領(lǐng)域,我們顯然就有必要脫離一般文學(xué)研究的領(lǐng)域,撇開文學(xué)與其他藝術(shù)形式的共性與差異性討論等傳統(tǒng)模式,僅從文學(xué)表達(dá)的基本物質(zhì)基礎(chǔ)也就是文字表意的可算化這一前提出發(fā),討論當(dāng)前AI文字寫作算法的邏輯構(gòu)造樣態(tài)及其實(shí)踐成效,分析其邏輯樣態(tài)的必然結(jié)果,以此與人類文字寫作的結(jié)果比照;并根據(jù)當(dāng)代AI最新、最強(qiáng)大的深度學(xué)習(xí)模式,追問這種比照學(xué)習(xí)的發(fā)展?jié)摿σ嗉雌溥_(dá)成或超越人類同類型文字寫作的可能性。
就AI當(dāng)前的寫作學(xué)習(xí)來說,其參考人類文字寫作模式的邏輯構(gòu)造,大抵可分作兩種基本的類型,即抒情寫作與敘事寫作。抒情寫作的基本學(xué)習(xí)對(duì)象是抒情詩(shī),微軟小冰的現(xiàn)代詩(shī)創(chuàng)作能力是通過對(duì)1920年后519位現(xiàn)代詩(shī)人的上千首詩(shī)學(xué)習(xí)上萬次后而達(dá)成的;而敘事寫作的基本學(xué)習(xí)對(duì)象是故事與小說,2015年阿里巴巴推出了聲稱擁有龐大的故事資料庫(kù)的智能創(chuàng)作系統(tǒng)“阿里編編”,對(duì)外宣稱平均創(chuàng)作一集電視劇劇本只要10分鐘,而創(chuàng)作一個(gè)完整的電影劇本也只需30分鐘。2021年,阿里巴巴作為第二大股東的科技公司“海馬輕帆”又進(jìn)一步推出“小說轉(zhuǎn)劇本”智能寫作功能。AI的抒情寫作和敘事寫作涉及兩種迥然不同的算法構(gòu)造邏輯,本文主要討論AI在敘事寫作上,按照人類的寫作方式,需要建構(gòu)什么樣的底層的邏輯形態(tài)及其實(shí)踐的可能性。
從根本上講,人類的思維模式與計(jì)算機(jī)的處理模式所能直接相比較的地方是算法,這是我們討論一切問題的前提。
早在20世紀(jì)中葉,“計(jì)算機(jī)之父”約翰 · 馮 · 諾依曼(John von Neumann,1903—1957)曾創(chuàng)造性地從數(shù)學(xué)的角度對(duì)計(jì)算機(jī)的數(shù)學(xué)運(yùn)算和人腦思維的過程進(jìn)行過比較研究,這一創(chuàng)舉不僅為計(jì)算機(jī)的創(chuàng)新、人工智能的發(fā)展指明了方向,也為今天AI藝術(shù)與人類藝術(shù)提供了可比較的理論基礎(chǔ)。這便是馮 · 諾依曼死后所出版的《計(jì)算機(jī)與人腦》(,1958)一書的基本思想。
基于此,本文就人類自身出發(fā),將人類的藝術(shù)形式解析為一種算法。不過,當(dāng)以算法為基礎(chǔ)比較AI創(chuàng)作與人類創(chuàng)作時(shí),我們所必須面對(duì)的問題便是算法無法將諸如情感、信仰、宗教等雖對(duì)藝術(shù)創(chuàng)作至關(guān)重要但卻不可演算之物統(tǒng)籌在內(nèi)。事實(shí)上,像情感、信仰、宗教等要素對(duì)人文藝術(shù)的發(fā)展功不可沒,在中西文明的演進(jìn)過程中扮演了至關(guān)重要的角色。但我們從現(xiàn)實(shí)層面讓AI如科幻小說中的人物那樣擁有情感、保有信仰既無可能更無必要。換言之,在真正對(duì)AI作品和人類作品予以比較之時(shí),一是我們僅能討論二者在客觀上可被比較和可被計(jì)算的環(huán)節(jié),也就是以人類身體為經(jīng)驗(yàn)的建構(gòu)藝術(shù)作品時(shí)所涉及的環(huán)節(jié);二是在對(duì)比過程中我們的基本設(shè)想是將人類藝術(shù)創(chuàng)作算法化,而非漫無標(biāo)準(zhǔn)地設(shè)想AI依據(jù)何種高級(jí)程序能夠達(dá)到人類創(chuàng)作的標(biāo)準(zhǔn)等。在這兩大前提下,相較具體AI程序的運(yùn)作而言,我們的討論將不可避免地顯得粗泛和宏觀,但這確是目前研究首先需要澄清的問題。
在對(duì)比AI創(chuàng)作和人類創(chuàng)作的過程中,我們所采取的基本思路是將藝術(shù)創(chuàng)作所需要的基本要素算法化,以形成AI創(chuàng)作所需的邏輯參數(shù),評(píng)估AI對(duì)這些邏輯參數(shù)進(jìn)行習(xí)得和轉(zhuǎn)化的現(xiàn)實(shí)可能性,從而回應(yīng)AI寫作的潛能等話題。這里的邏輯參數(shù)是指將藝術(shù)創(chuàng)作所涉及的人類所有思維內(nèi)容還原為明確的生理表征行為,描述為可被描述和必須被描述的要素,因?yàn)樗鼈兣c人類身體經(jīng)驗(yàn)直接相關(guān),因此又可被稱為具身習(xí)得的邏輯參數(shù)。這種具身習(xí)得的邏輯參數(shù)從人類自身經(jīng)驗(yàn)出發(fā),將與藝術(shù)創(chuàng)作相關(guān)的環(huán)節(jié)分解為最小的單元模塊。最小單元模塊是指在現(xiàn)有人類藝術(shù)經(jīng)驗(yàn)層面,以現(xiàn)象學(xué)還原的方式考察各種與藝術(shù)活動(dòng)相關(guān)的基礎(chǔ)范疇,所設(shè)定的可算的基礎(chǔ)藝術(shù)模塊。在集合論的意義上,它們又是可算化藝術(shù)活動(dòng)的最大單位。這些模塊本身是可微的,但從與人類藝術(shù)經(jīng)驗(yàn)的對(duì)應(yīng)關(guān)系來說,它們其實(shí)是一種最大的集合,即只有在這些集合條件下,人類那些被具身化的邏輯參數(shù)才處于彼此平行、可有交集但互不包容的狀態(tài)。當(dāng)然,還有必要指出的是,我們?cè)诖擞懻撍囆g(shù)活動(dòng)的具身化,絕不意味著所有藝術(shù)活動(dòng)的形式范疇都是一致或近似的,不同藝術(shù)形式所對(duì)應(yīng)的邏輯范疇自然有所側(cè)重,同一藝術(shù)形式之中也有非常復(fù)雜的邏輯范疇變異情況。
根據(jù)人類藝術(shù)的實(shí)踐經(jīng)驗(yàn),我們可以將相關(guān)可算的具身化邏輯參數(shù)分成三種基本類型。
第一類可稱為單純描述性的邏輯參數(shù)。這類參數(shù)一般涉及人類天賦的理性認(rèn)知能力,為全人類所共有,有希望以某種剛性的算法求得普通解(當(dāng)然,這是極端樂觀主義的猜想,這類所謂天賦能力完全有可能涉及神秘層次,最終并不能被徹底認(rèn)識(shí),這就無所謂“普通解”了)。語(yǔ)言問題就是其一。這里所說的語(yǔ)言只涉及音義傳播與理解問題(書面文字之間有更復(fù)雜的運(yùn)作機(jī)制,不能歸入基礎(chǔ)算法的層面)。從人類理解的層面來說,單純語(yǔ)音的交流是完全可能的;單純依靠語(yǔ)音而完成不同方言和語(yǔ)言體系的交流也是可能的,這足以證明人類擁有某種相同的關(guān)于語(yǔ)言習(xí)得和運(yùn)用的類的能力,也就是說,我們獲得關(guān)于語(yǔ)言的通解是可能的(盡管自喬姆斯基之后語(yǔ)言理論在這方面進(jìn)展有限)。再比如在圖形層面,人類也可能期望通過一種窮盡描述的方法獲得準(zhǔn)確的具身化邏輯參數(shù)。人類的圖形認(rèn)知,大致應(yīng)當(dāng)分為幾何式、符號(hào)式和具象感知等不同類型。根據(jù)康德、胡塞爾、榮格、皮爾斯、德里達(dá)等人的討論,也根據(jù)目前科學(xué)的發(fā)展(如費(fèi)爾馬大定理的證明等),在邏輯上AI有希望通過深度學(xué)習(xí)模式在這些方面獲得結(jié)構(gòu)性的突破進(jìn)展。此外,如果以人的身體為基準(zhǔn)作測(cè)量,進(jìn)行命名和限定,那么,運(yùn)動(dòng)辨認(rèn)、空間、時(shí)間,包括顏色、聲音、觸覺等感官認(rèn)知的內(nèi)容,也有可能通過剛性的力迫運(yùn)算,實(shí)現(xiàn)其中包含內(nèi)容的算法化。
第二類則是轉(zhuǎn)化性的邏輯參數(shù)。這一類邏輯參數(shù)所涉及的現(xiàn)象,大多與個(gè)體精神體驗(yàn)相關(guān),具有很大的個(gè)體差異性;并且它們牽涉部分大多缺乏客觀世界相對(duì)應(yīng)的客體事實(shí),因此AI似乎不可能對(duì)其做直接的窮盡描述。但盡管如此,這些藝術(shù)現(xiàn)象仍然能夠借助某些具身化手段,通過相關(guān)生理表征行為的抽樣、建模、統(tǒng)計(jì)、概率計(jì)算等手段予以轉(zhuǎn)化性的過渡描述。這類邏輯參數(shù),多與人類情感相關(guān)。各種欲望因素如性欲等,毫無爭(zhēng)議與藝術(shù)創(chuàng)作具有極為緊密的關(guān)聯(lián)。AI本身沒有欲望可言(可算化也許是其唯一欲望),它如果要深度習(xí)得人類的藝術(shù)創(chuàng)作能力,邏輯上說它應(yīng)當(dāng)有能力辨認(rèn)藝術(shù)實(shí)踐中那些與欲望相關(guān)的現(xiàn)象并把它們轉(zhuǎn)化為可算的邏輯單元。但欲望在創(chuàng)作中介入的深度因人而異,比如在《金瓶梅》《索多瑪?shù)?20天》等書中,很多意象都與性欲相關(guān),但在某些佛教作品中,性欲的因素差可歸結(jié)到無。如何從具身習(xí)得的角度出發(fā)描述此種現(xiàn)象,從目前來看,人們尚只能借助血壓、唾液、腎上腺素等的分泌、眼球轉(zhuǎn)動(dòng)等生理指標(biāo)的測(cè)量、計(jì)算、模型化等予以轉(zhuǎn)化性說明。這種轉(zhuǎn)化有多少有效性,目前來看自然是很值得質(zhì)疑的。但從長(zhǎng)遠(yuǎn)來看,如果樣本量足夠,且當(dāng)前的AI學(xué)習(xí)模式有長(zhǎng)足進(jìn)步,AI此種轉(zhuǎn)化性邏輯參數(shù)測(cè)定、可算化仍有一定的理論實(shí)現(xiàn)可能。人類的激情和沖動(dòng),如憤怒、悲憫、仇恨、嫉妒、愛好(癖好、習(xí)性)、報(bào)復(fù)(復(fù)仇)欲等,以及參與到藝術(shù)創(chuàng)作的各種感覺因素(包括嗅覺、味覺等),都屬于這個(gè)層次的問題。前面我們談到了此類參數(shù)轉(zhuǎn)化生成的可能性,但實(shí)踐中可能問題重重。如果將各類激情和沖動(dòng)都轉(zhuǎn)化為生物指標(biāo),這類轉(zhuǎn)化需要的人類學(xué)證據(jù)將是不可思議的龐大。如果還考慮到這些激情和沖動(dòng)同時(shí)還能夠構(gòu)成多少種復(fù)雜藝術(shù)現(xiàn)象,這些現(xiàn)象且自有其歷史演化過程,那么這種轉(zhuǎn)化性可算表達(dá)幾乎是不可能的。更何況過度依賴心電圖、血壓、分泌物等來作為藝術(shù)具身化的主要參考指標(biāo),看起來也過于線性與簡(jiǎn)單化了。
第三類為綜合的邏輯參數(shù)。人類藝術(shù)活動(dòng)的基本經(jīng)驗(yàn),除了來自那些類屬性和個(gè)體情感(這些都與身體經(jīng)驗(yàn)感知直接相關(guān)),還有部分與外在存在事實(shí)緊密相關(guān)。它們屬于被建構(gòu)的實(shí)體性精神事件:能夠被身體所感知、明證,但一般來說只存在于某一特定的群體中——且在這群體中存在著極大的差異空間,有時(shí)涉及重要的時(shí)間變量。比如說對(duì)特定國(guó)家之愛,對(duì)現(xiàn)代人來說,它肯定是一個(gè)能夠被理解的客體性事實(shí),但此種愛意,大多數(shù)情況下只存在于該國(guó)家的公民群體中,并且群體中個(gè)體差別極大,既有勇于為國(guó)家之愛奉獻(xiàn)生命者,也有背叛國(guó)家者??疾爝@類經(jīng)驗(yàn)的可算化問題,除了適當(dāng)引入前述描述性或轉(zhuǎn)化性研究的部分要素,還必須分析其中所包含的各種綜合性內(nèi)容,如歷史、地域、文化傳承、共同體性質(zhì)(政治、意識(shí)形態(tài))、群體間關(guān)系、技術(shù)條件等。文化傳承包含文字、倫理、信仰、趣味等,其中的信仰等內(nèi)容也必然是從世俗化一面來作思考的,是去神秘化的、可算的。這些綜合生成的東西,其根源盡管不是發(fā)自直接的身體經(jīng)驗(yàn),但對(duì)藝術(shù)創(chuàng)作往往具有強(qiáng)大的支配力,因此也可以將它們視同身體本能,必須歸納、總結(jié)某些特殊的邏輯參數(shù)形態(tài),比如關(guān)于文字的感覺、意識(shí)模式。再以技術(shù)背景為例,在透視法沒有被發(fā)明之前,它不可能被自覺地應(yīng)用到繪畫領(lǐng)域;在運(yùn)動(dòng)攝像技術(shù)沒有興起時(shí),便無所謂蒙太奇手法等問題。而在今天,透視、蒙太奇已成為現(xiàn)代人觀察世界、想象世界的精神本能,從這個(gè)角度說,現(xiàn)代視覺經(jīng)驗(yàn)包括精神測(cè)量世界的基本姿態(tài),就是包含著對(duì)現(xiàn)代視覺機(jī)器(技術(shù))的理解(想象)的。因此在藝術(shù)活動(dòng)中,它們就顯然需要被處理成為一個(gè)獨(dú)立的可算的集合(模塊)。這是第三類邏輯參數(shù)需要被單獨(dú)分立的理由。
截至目前,在AI藝術(shù)研發(fā)史上,繪畫是嘗試最多且成果最豐富的項(xiàng)目。無論是輔助繪畫、模仿繪畫,還是AI獨(dú)立創(chuàng)作技術(shù),都在不斷推陳出新,進(jìn)行著一場(chǎng)場(chǎng)技術(shù)革命,其中不少作品已明顯能夠通過圖靈測(cè)試。在此,我們以圖像為例結(jié)合上述分析從理論上還原AI創(chuàng)作的基本邏輯。第一步,分解各種圖像素材。無論進(jìn)行何種圖像創(chuàng)作,分解圖像素材都是基礎(chǔ)步驟。在這一過程中,可能涉及的基本分解邏輯是:(1)分解人、動(dòng)物、植物與圖形相關(guān)的基本構(gòu)造單元(如將臉部肌肉按解剖學(xué)意義分解);(2)按某些功能、組合命名某些表情傳意的最小單元(如笑、哭、恐懼等);(3)按照某些基本物理事態(tài)(如光影對(duì)比、輪廓變形等)分解最小的功能單位,如石頭、皮膚、水、草木等不同的反射率、色彩變化等;(4)分解圖形靜止態(tài)與運(yùn)動(dòng)態(tài)最核心的姿態(tài)差異(如電影《長(zhǎng)城》的穿幫鏡頭其原因就在于完全沒有考慮風(fēng)與毛發(fā)飄動(dòng)的關(guān)系)。第二步,按一定的邏輯組合、命名這些素材,以期形成更具表現(xiàn)能力的圖像模塊。第三步,在更大的尺度上定義某些人類活動(dòng)的精神運(yùn)動(dòng)態(tài)勢(shì),在此尺度上定義、分解某些人類工作的學(xué)習(xí)樣本,從而使AI學(xué)習(xí)并模仿生成。
以上是關(guān)于一般藝術(shù)創(chuàng)作所涉及的內(nèi)在算法邏輯架構(gòu)的基本思考,并以圖像生成為例嘗試分析了AI的藝術(shù)創(chuàng)作過程。然而,除卻以上的歸納是否還有其他要素類型?如何研究這些要素在不同的藝術(shù)形式和藝術(shù)類型之間的具體邏輯關(guān)系?上述籠統(tǒng)的要素分析其內(nèi)涵如何更明確地界定?……相當(dāng)多的問題都超出了現(xiàn)有科學(xué)與人文認(rèn)識(shí)的水平,在此只能略過不談。
前文討論了藝術(shù)活動(dòng)可能涉及的一般經(jīng)驗(yàn)領(lǐng)域如何實(shí)現(xiàn)可算的邏輯架構(gòu)問題,但現(xiàn)實(shí)中藝術(shù)活動(dòng)還有很多具體形式架構(gòu)規(guī)定性。簡(jiǎn)單來說,根據(jù)人類的藝術(shù)經(jīng)驗(yàn),上述要素還有某些結(jié)構(gòu)性的(也許是固化的)穩(wěn)定的形式樣態(tài)。這些形式樣態(tài)也需要做出可算化的邏輯描寫,這可能是當(dāng)前AI寫作想要取得明顯突破之處的關(guān)鍵。
總體來說,目前AI寫作(也包括其他藝術(shù)領(lǐng)域)的實(shí)踐分為抒情與敘事兩種基本形式類型,這也吻合人類藝術(shù)文體實(shí)踐的基本經(jīng)驗(yàn)。我們?cè)诖酥饕接懳淖謹(jǐn)⑹驴伤慊那疤帷?/p>
文字?jǐn)⑹聦懽鞯目伤慊挚煞譃閮纱蟀鍓K。
第一板塊是文字組合的規(guī)律性問題。文字組合的可算化,所需要考慮的邏輯參數(shù)至少包含如下七個(gè)層面的內(nèi)容。第一,文字符號(hào)的組合規(guī)律。涉及文字?jǐn)⑹碌难菟銌栴}首先要考慮的是文字演算過程中會(huì)涉及的符號(hào)組合規(guī)律,主要是語(yǔ)法問題。相對(duì)而言,第一項(xiàng)是最易掌握也最具規(guī)律性的,也是目前AI本身取得突破最大的層面。第二,字的層面。這一項(xiàng)主要涉及音、義、字之間可能的不同組合方式。像方塊文字、象形文字、表音文字等之間的組合均不一樣,不過對(duì)于計(jì)算機(jī)程序本身而言,實(shí)現(xiàn)這一層面的突破從理論上講并不困難,只要學(xué)習(xí)積累到一定層次,便可以較好地呈現(xiàn)出不同類型文字間的組合方式。第三,詞的層面。根據(jù)一般的詞性分類,在演算過程中必須考慮到名詞、代詞、動(dòng)詞、介詞、形容詞及其他如擬聲詞、數(shù)量詞等不同的詞性。一句話形成的關(guān)鍵在于詞和詞的搭配使用,從演算角度來講,詞的組合也是構(gòu)成一個(gè)句子表意的關(guān)鍵所在。這其中又涉及兩個(gè)難點(diǎn)。其一是詞與詞的組合,從現(xiàn)象上看描述的理論難度不大,但十分煩瑣(比如如何限定一個(gè)詞在什么樣的情況下可以與另一個(gè)詞搭配,且能夠準(zhǔn)確傳達(dá)敘事構(gòu)造所欲傳達(dá)的涵義)。其二的問題由第一點(diǎn)引發(fā)。從人類心智的角度看,習(xí)得詞的組合能力一定不是描述性的而是生成性的。原則上人類掌握不多的生成規(guī)律就能識(shí)別一切詞義組合的可能性。從這個(gè)角度說AI也應(yīng)當(dāng)具備生成性的詞義組合能力。這完全依賴于人類對(duì)各種類詞性的本質(zhì)功能界定和準(zhǔn)確描述。但從目前語(yǔ)言學(xué)界的研究看,在這方面取得大的突破可能還有很長(zhǎng)的路要走。比如說,如何令A(yù)I習(xí)得識(shí)別專有名詞及其向普通名詞轉(zhuǎn)化的能力,就可能是一件非常困難的事情。在所有的語(yǔ)法理論中,專有名詞均是一個(gè)自明的語(yǔ)言現(xiàn)象,但各家定義有所不同(有趣的是,人類心智在很早的階段就已具備這一能力)。第四,文字與聲音層面。眾所周知,所有的文字符號(hào)均來自聲音,以至于我們?cè)陂喿x文字時(shí)會(huì)不由自主地想象它的聲音。不過文字符號(hào)的組合又有擺脫聲音的過程。文字與聲音的關(guān)系需要更為充足的、特別是結(jié)構(gòu)主義語(yǔ)言學(xué)背景來予以支撐,但二者關(guān)系如何轉(zhuǎn)化為文字?jǐn)⑹滤惴梢粤?xí)得的邏輯框架仍是未知的問題。第五,文字的歷史演變。在設(shè)計(jì)文字演算過程時(shí),必須要考慮文字的歷史演變因素。像漢語(yǔ)便有古今異義詞的區(qū)分,一些詞語(yǔ)意義發(fā)展至今其內(nèi)涵也會(huì)有一定的發(fā)展變化。人類在創(chuàng)作過程中會(huì)有意無意間加入某個(gè)或某些詞的古意以形成一種特殊的敘事效果,但這些詞語(yǔ)如何進(jìn)行算法,這對(duì)AI來講目前還是一大難題。第六,外來詞、生造詞(如許多網(wǎng)絡(luò)語(yǔ)言)的運(yùn)用。人類對(duì)于外來詞的識(shí)別和轉(zhuǎn)化都不成問題,許多日常詞匯如沙發(fā)、咖啡等都屬于外來詞的范疇。但在面對(duì)一些較為生僻的外來詞時(shí),對(duì)計(jì)算機(jī)而言,要進(jìn)行合理的算法邏輯描述也具有一定的難度。第七,文字信號(hào)與因果律構(gòu)建。詞與詞之間、句與句之間邏輯上的因果構(gòu)造,某一些信號(hào)的聯(lián)系必然會(huì)導(dǎo)引出某一種預(yù)定的結(jié)果。但這種描述若轉(zhuǎn)化成相應(yīng)的算法則十分困難,因?yàn)槿祟愒谑褂梦淖謥磉M(jìn)行敘述時(shí),通過文字的組合形成的與事件相關(guān)的演算信號(hào),包含了許多因果律上的直觀見解,其中的典型代表便是敘事中的省略問題。對(duì)文學(xué)敘事而言,省略是最重要的因果律的構(gòu)建方式之一。而具體的省略如何進(jìn)行,何種因果條件可以不提及省略的前提,何種情況又可以不談及省略的過程,何種又不用論及結(jié)果,這些都是考驗(yàn)人類敘事能力最直觀的部分。但這種能力對(duì)于算法的描述而言相當(dāng)困難。不過,就文字信號(hào)和因果律這一層面而言,不排除在計(jì)算機(jī)層面可以被繞過的可能性(即通過算法與學(xué)習(xí)窮盡各種省略的必要條件)。關(guān)于這方面的具體討論則需要更為專業(yè)的思考。
第二板塊,即繞過文字組合規(guī)律的細(xì)節(jié),根據(jù)風(fēng)格論與敘事類型學(xué)的理論,在較大尺度上給出文字組合的基本模型。希望在足夠的樣本學(xué)習(xí)基礎(chǔ)上,通過恰當(dāng)調(diào)試,令A(yù)I掌握基本的文字表現(xiàn)形式,并通過圖靈測(cè)試。當(dāng)前AI文字寫作的基本邏輯構(gòu)造,看起來主要便基于第二板塊的邏輯構(gòu)造模式。根據(jù)這種模式,目前的AI抒情寫作與敘事寫作其實(shí)是一回事。從現(xiàn)實(shí)操作而言,二者的本質(zhì)邏輯是相同的,即通過有聯(lián)系的連續(xù)幾張圖像,提取其中可能包含的人物的情感色彩或故事的情節(jié)發(fā)展,以規(guī)定的文字方式呈現(xiàn)出來(參見圖1)。不過,AI敘事寫作就既有成果而言仍有很長(zhǎng)的路要走。比如像同樣基于圖像學(xué)習(xí)的微軟小冰敘事詩(shī)的創(chuàng)作,其生成重點(diǎn)更強(qiáng)調(diào)故事情節(jié)的連貫性與敘述的完整性。若要培養(yǎng)AI“自主創(chuàng)作”的發(fā)展方向,很有可能會(huì)無法兼顧AI的詩(shī)歌語(yǔ)言學(xué)習(xí),這就導(dǎo)致生成的詩(shī)歌走向“按圖說話”的模式,其敘事功能僅停留在表面,而忽略了詩(shī)歌的文學(xué)性和抒情功能的表達(dá),這也是敘事詩(shī)歌質(zhì)量較不穩(wěn)定的原因。而在更為復(fù)雜的長(zhǎng)篇敘事寫作中,AI則面臨著更多的挑戰(zhàn)。最新的語(yǔ)言生成算法模型GPT-3體現(xiàn)了自然語(yǔ)言處理取得的進(jìn)步。人工智能語(yǔ)言生成器中的挑戰(zhàn)之一是在長(zhǎng)文本范圍內(nèi)保持連貫性,像之前的GPT-2模型往往在幾句話之后便失去了一致性。GPT-3確實(shí)能夠在幾段文字上仍保持一定的話題性,這主要是因?yàn)镚PT-3最基本的功能是自動(dòng)補(bǔ)全,給它一個(gè)詞或句子,它就會(huì)逐字逐句地生成它認(rèn)為接下來該出現(xiàn)的詞句。但從根本上講,GPT-3不會(huì)帶來任何新變化,較GPT-2而言所擁有的只是訓(xùn)練數(shù)據(jù)集和“計(jì)算”量,而若想在模型中灌輸常識(shí)、因果推理或道德判斷,仍是AI目前不能實(shí)現(xiàn)的挑戰(zhàn)。
圖1 小冰創(chuàng)作詩(shī)歌的過程,[ 圖片引自Heung-Yeung Shum, Xiaodong He, Di Li.“From Eliza to XiaoIce: Challenges and Opportunities with Social Chatbots.”Rontiers of Information Technology & Electronic Engineering 19.no.1 (2018):10–26.]
基于深度學(xué)習(xí)的AI寫作技術(shù)想要真正取得突破必須具備一系列基本條件,包括須是單一任務(wù),任務(wù)邊界清楚,信息完備,結(jié)果判斷量化、明確,等等。但就目前而言,AI敘事從理論上來講就面臨著幾大難以突破的難題。首先,AI敘事缺乏目的,缺乏標(biāo)準(zhǔn),樣本量太大。事實(shí)上這種可再生成性的語(yǔ)匯的邏輯關(guān)系,還是需要獲得重大突破才可能形成一種內(nèi)在的可計(jì)算的、但是又能自由轉(zhuǎn)化的語(yǔ)言。其次,AI敘事對(duì)名詞的辨析較為困難。名詞,特別是作為普通名詞而言,往往包含了非常復(fù)雜的記憶性內(nèi)容。這種記憶性的內(nèi)容通常還包含家庭、宗教、社會(huì)以及文本、虛構(gòu)科技等要素。人要辨析一個(gè)普通名詞中所包含的特征即轉(zhuǎn)化機(jī)制非常容易,但是對(duì)于機(jī)器來說卻很困難。一旦小說涉及諸多非邏輯的話題如意志、欲望、敘事、暴力、道德、死亡等類似具身體驗(yàn)的東西,機(jī)器根本無法習(xí)得,就只能在一定邏輯框架中做外部模仿。再次,AI難以將虛構(gòu)內(nèi)容向?qū)嶓w性內(nèi)容轉(zhuǎn)化。實(shí)體性的內(nèi)容是一個(gè)客觀實(shí)在,它的存在不會(huì)因?yàn)閯e的任何方式的介入而改變或消失。從這一邏輯來講,敘事包含著兩種實(shí)體的天然的區(qū)別:一種實(shí)體能夠找到世界情況的客觀對(duì)應(yīng);另一種實(shí)體是人類虛構(gòu)的,若讓機(jī)器進(jìn)行這種虛構(gòu)向?qū)嶓w的轉(zhuǎn)變則十分困難。最后,AI難以習(xí)得純粹觀念性的內(nèi)容。機(jī)器最容易習(xí)得的是科學(xué)觀念性的內(nèi)容,但是對(duì)比如佛、上帝這種概念既找不到它的外延,也找不到它的內(nèi)涵。
就目前技術(shù)水平而言,AI敘事寫作之所以看起來像是敘事,是因?yàn)椋旱谝?,它用來組合的類型化樣本片段比較大,這種既有的樣本化素材本身就包含了一些事件的組合關(guān)系,根據(jù)格式塔心理,人們會(huì)強(qiáng)行為這些拼貼的樣本的事件之間補(bǔ)足因果關(guān)系;第二,這些類型學(xué)習(xí)的樣本內(nèi)在邏輯構(gòu)造是極其線性化與單調(diào)的。這種算法模型能否完成長(zhǎng)篇的、有內(nèi)在變化的因果律組合,頗可懷疑。
從算法角度出發(fā),就計(jì)算機(jī)與人腦可比較的層面而言,根據(jù)現(xiàn)有的計(jì)算機(jī)技術(shù)(包括算法等),拷問AI是否可能具有藝術(shù)能力,很可能本質(zhì)上就是一個(gè)緣木求魚的問題。就目前的AI技術(shù)而言,它參與人類活動(dòng)并能超越人類能力,一般都在可計(jì)算的領(lǐng)域。它的內(nèi)部邏輯構(gòu)造再?gòu)?fù)雜,其實(shí)目標(biāo)是單一且確定的。就像阿爾法狗圍棋上戰(zhàn)勝人類,其突破主要是在發(fā)明了一種通過概率計(jì)算的方法,繞過了龐大數(shù)據(jù)對(duì)技術(shù)能力的考驗(yàn)。但其邏輯目標(biāo)本身是簡(jiǎn)單的:設(shè)定一種程序,依照圍棋的規(guī)則,爭(zhēng)取在19路棋盤上達(dá)到或超過181點(diǎn)以上的點(diǎn)位,能夠完成這一目的計(jì)算即為成功,否則就是失敗。而對(duì)藝術(shù)工作而言,在大多場(chǎng)合都很難說有什么是非判斷的標(biāo)準(zhǔn);各藝術(shù)品之間也很難說有什么統(tǒng)一的標(biāo)準(zhǔn),那么如何能夠有效地根據(jù)一定的邏輯計(jì)算方法判定AI演算的有效性呢?即便人們?cè)谒囆g(shù)標(biāo)準(zhǔn)等方面達(dá)成了一些極有彈性的、通解方面的認(rèn)識(shí),文中談到的幾個(gè)前提仍將對(duì)相關(guān)的工作提出巨大考驗(yàn)。
盡管如此,當(dāng)前的AI藝術(shù)探索,仍然是極具價(jià)值的,我們不能排除AI未來會(huì)形成專屬于自己的敘事方法的可能性,也不排除會(huì)產(chǎn)生一種諸多要素具有通解的邏輯框架。此外,還有一種理論上的可能,那便是計(jì)算機(jī)通過超大樣本的學(xué)習(xí),使得AI敘事自動(dòng)覆蓋或超越人類敘事。因?yàn)榫陀?jì)算機(jī)與人腦的對(duì)比而言,人腦的演算精度與計(jì)算機(jī)相距太遠(yuǎn)。而是否有可能設(shè)想這就是智慧生命最終本質(zhì)的差距。如果情況是這樣,據(jù)人類創(chuàng)作過程架構(gòu)的邏輯框架對(duì)具有超精度計(jì)算能力的計(jì)算機(jī)而言,其本身就是一種不好的邏輯框架,我們依據(jù)人類藝術(shù)活動(dòng)經(jīng)驗(yàn)來規(guī)約、設(shè)想AI藝術(shù)的發(fā)展可能本身就是一種坐井觀天的想法。當(dāng)然,盡管科幻文藝在這方面已經(jīng)談了許多(如阿西莫夫的小說,如電影《銀翼殺手》),但從目前AI發(fā)展的情況來看,這些基本都可以歸于玄談,暫可存而不論。