摘要:人工智能藝術(shù)是一個新的藝術(shù)場域,它遵守的藝術(shù)創(chuàng)作原則與傳統(tǒng)藝術(shù)原則不同。以人工智能算法為代表,展現(xiàn)出多元創(chuàng)作能力的復雜性。本文對人工智能藝術(shù)進行梳理和辨析,嘗試從以下三個方面展開:一、人工智能藝術(shù)在媒介實踐中的出場;二、人工智能藝術(shù)對技術(shù)與藝術(shù)的雙重拓展;三、人工智能如何生成藝術(shù)創(chuàng)作力。以此為基礎,人工智能藝術(shù)直接將算法轉(zhuǎn)化為創(chuàng)作功能,開啟了人類新型的審美判斷,這不僅標志著人工智能藝術(shù)獨特的美學運作方式的轉(zhuǎn)向,更重要的是,它意味著媒介實踐為算法技術(shù)賦予了藝術(shù)形態(tài)、文化品格。
關鍵詞:算法,人工智能藝術(shù),藝術(shù)創(chuàng)作力,生成圖譜
Abstract: Artificial intelligence art is a new art field, it complies with the principles of artistic creation and traditional principles of art. Represented by artificial intelligence algorithm, it shows the complexity of multiple creative abilities. This paper combs and distinguishes the art of artificial intelligence, and tries to expand it from the following three aspects: first, the appearance of artificial intelligence art in media practice; sceond, the double expansion of artificial intelligence art to technology and art; third, how artificial intelligence generates artistic creativity. Based on this, artificial intelligence art directly transforms algorithms into creative functions, which opens a new type of aesthetic judgment of human beings. This not only marks the turn of the unique aesthetic operation mode of artificial intelligence art, but more importantly, it means that media practice gives artistic form and cultural character to algorithm technology.
Keywords: algorithm, the art of artificial intelligence, artistic creativity, generation map
自現(xiàn)代派藝術(shù)興起,關于藝術(shù)的定義就不斷游移。在各種對藝術(shù)進行鑒別、界定和理論爭斗的過程中可以發(fā)現(xiàn),技術(shù)與藝術(shù)之間存在著難以分割的關系。圖靈(Turing, A. M.)早在《計算機器與智能》的開篇就提出過“機器能否思考?”的問題,也宣布了人工智能(AI)時代的到來。大數(shù)據(jù)、芯片和算法成為人工智能應用的三大背景。應用智能學習算法,人工智能通過大數(shù)據(jù)剖析和機器學習來改善系統(tǒng)自身的性能,企圖理解智能的本質(zhì),并創(chuàng)造出一種新的能夠?qū)θ祟愔悄茏龀鲱愃品磻闹悄軝C器,處理包括言語辨認、圖像識別和專家處置等智慧“容器”信息。人工智能算法的不斷進化,呈現(xiàn)出更深入的認識論層面的思考——人工智能是否能夠進行藝術(shù)創(chuàng)作?成為人類場景下的質(zhì)詢,并日漸顯露出藝術(shù)的實踐本性。人工智能算法首先必須是“做”——文化技術(shù)實踐,而非“是”——藝術(shù)界定。與傳統(tǒng)的認識論相比,人工智能算法典型地呈現(xiàn)了認識論上的“存在論化”。智能算法的技術(shù)實踐是信息作為藝術(shù)和審美感受性關系的進一步融合和深化。它正以“本體化”的典型方式,更新人類的認識視域和創(chuàng)造認識活動。它以創(chuàng)造出的各種“先鋒”藝術(shù)觀念,證明并讓我們相信:人工智能能夠進行藝術(shù)創(chuàng)造,具有創(chuàng)造性,并挑戰(zhàn)了人類藝術(shù)的創(chuàng)造性。無疑,在藝術(shù)的范圍內(nèi),人工智能藝術(shù)創(chuàng)造的藩籬,顛覆了傳統(tǒng)的藝術(shù)創(chuàng)作方式,使藝術(shù)創(chuàng)作不再只是藝術(shù)家的專利。這不僅強烈地沖擊了傳統(tǒng)藝術(shù),也引發(fā)了人類對藝術(shù)定義的震蕩。而現(xiàn)在,人工智能算法在不斷的試錯與發(fā)展中正展現(xiàn)出其獨特的藝術(shù)創(chuàng)作能力。面對這種新的藝術(shù)形式,需要我們從認識論的維度重新審視技術(shù)對藝術(shù)的作用。
一、人工智能藝術(shù)在媒介實踐中的出場
媒介實踐是技術(shù)實踐的領域。媒介依賴于一定的物質(zhì)基礎,決定物質(zhì)特性的具體特點,也決定媒介特性的客觀性。但是怎樣去把握和發(fā)揮這些特性,屬于人類實踐活動的創(chuàng)造性領域。藝術(shù)實踐推動技術(shù)成為藝術(shù)媒介的過程是怎樣發(fā)生的?技術(shù)提供的可能性是如何產(chǎn)生的?藝術(shù)的影響如何經(jīng)由一些經(jīng)典的里程碑式的作品帶來了文化的沖擊?這個過程顯然不是一個自發(fā)發(fā)生的過程,而是一個由藝術(shù)活動、藝術(shù)實踐來推動的過程。麥克盧漢曾經(jīng)提到“兩種媒介雜交或者交匯的時刻,是發(fā)現(xiàn)真理和給人啟示的時刻,也是新的媒介形式誕生的時刻”[1]。人類追求技術(shù)的不斷進步,期望通過制造和使用工具代替繁重的體力勞動和腦力勞動,最終實現(xiàn)人的解放,而人工智能則是人類歷史上第一個對人類大腦進行模仿的技術(shù)。眾所周知,藝術(shù)是融合人類經(jīng)驗、思想與情感的創(chuàng)造性產(chǎn)物。作為人類大腦外化物的“智能大腦”——人工智能成為自動的藝術(shù)“創(chuàng)造者”。它借助龐大的數(shù)據(jù)庫,通過對人類思維的學習,并借助計算機算法不斷優(yōu)化系統(tǒng),創(chuàng)造出更多符合大眾審美的藝術(shù)作品。
人工智能藝術(shù)的發(fā)展可以分為三個階段?!俺鮿?chuàng)期”可以追溯到1805年,雅克德羅(Jaquet Droz)公司的機械師美拉德特制作出一部利用發(fā)條驅(qū)動,使用英語、法語自動寫作的機器。20世紀70年代,倫敦大學斯萊德美術(shù)學院成立首個人工智能藝術(shù)開發(fā)機構(gòu)。隨后,1973年科恩(Harold Cohen)開發(fā)自動繪畫程序AARON ,利用由算法定義的想象及審美標準進行繪圖。人工智能藝術(shù)早期的發(fā)展較為緩慢,大眾對機器人自動進行藝術(shù)創(chuàng)作的方式抱有懷疑的態(tài)度。
2001年,林鴻程成功開發(fā)古典詩歌創(chuàng)作軟件。2003年,曼扎諾·莫拉于設計并制造名為 Artsbot 的群體繪畫機器人以及之后的機械動作畫家RAP。這些機器人可以與其他機器人協(xié)作完成繪畫。2006年,科幻小說家劉欣慈開發(fā)出每秒200行的寫作軟件。2009年,美國職業(yè)棒球大賽聯(lián)盟季后,“StatsMonkey”完成了世界上第一篇新聞稿。這是人工智能藝術(shù)的“上升期”,也是人工智能作為藝術(shù)生產(chǎn)工具運用到藝術(shù)創(chuàng)作中的較為成熟階段。
2010年以降,人工智能進入“繁榮期”。2015年騰訊財經(jīng)的機器人寫手“Dream writer”撰寫了一篇名為《8月CPI漲2%創(chuàng)12月新高》的文章,這篇文章開啟了人工智能機器人寫作的熱潮。2016年人工智能創(chuàng)造的小說《電腦寫小說的那一天》,參加日本“新星一獎”的比賽;俄羅斯開發(fā)者開發(fā)的軟件Prisma,利用人工神經(jīng)網(wǎng)絡技術(shù),學習大師的繪畫風格,對照片進行處理,使其看起來極具名畫風格。在美國,《華盛頓郵報》上發(fā)表了 850 篇出自機器人Heliograf之手的報道。同時,在影視創(chuàng)作領域,IBM旗下的人工智能系統(tǒng)Watson,完成了一部電影預告片《摩根》的剪輯。2017年,微軟小冰創(chuàng)作的詩集《陽光失了玻璃窗》發(fā)布。這一年還出現(xiàn)了根據(jù)觀眾反映決定劇情的互動影院,打破了觀眾與銀幕的界限,實現(xiàn)了電影空間互動。2018年,人工智能繪畫作品《貝拉米家族的埃德蒙德·貝拉米》(根據(jù)GAN損失函數(shù)制作)在紐約佳士得拍賣會首次拍賣。
同年,央視紀錄片《創(chuàng)新中國》使用人工智能模擬去世配音員李易的聲音。2019年,經(jīng)過紐約藝術(shù)家本·斯內(nèi)爾訓練的人工智能Dio,學習了上千件雕塑作品,并最終設計出人形雕塑。與此同時,“非人類設計師”——深蘭科技 DeepVogue服飾輔助設計系統(tǒng)在中國國際服裝設計創(chuàng)新大賽中,殺出重圍,奪得了亞軍,并獲得最受大眾歡迎獎。
計算機技術(shù)最初產(chǎn)生的目的是立足數(shù)據(jù)研究、經(jīng)濟活動數(shù)據(jù)管理,而在使用過程中逐漸被改造成個人通訊的媒介。用戶使用推動了計算機技術(shù)發(fā)展的方向,不僅改變了媒介的用途,也改變了媒介的實踐過程。
二、人工智能藝術(shù)對技術(shù)與藝術(shù)的雙重拓展
人工智能藝術(shù)推動技術(shù)本身的擴展,也擴大了藝術(shù)本身的范圍。數(shù)字技術(shù)的文化生態(tài),由人類社會對技術(shù)的態(tài)度和具體運用構(gòu)成,而不是通過背后的科學原理。人類通過感受這種技術(shù)帶來的文化變革,主動參與實現(xiàn)人的創(chuàng)造性,展現(xiàn)人的創(chuàng)造能力,產(chǎn)生新的文化成果。這一過程恰恰是人的屬性的展現(xiàn),使得技術(shù)本身具有了藝術(shù)的力量、倫理的維度、思想的含量。傳統(tǒng)藝術(shù)分類標準大多從藝術(shù)語言、藝術(shù)作品的內(nèi)容等進行分類,這樣分類的出發(fā)點是藝術(shù)品本身的存在形態(tài)。人工智能藝術(shù)最大的突破就是消除藝術(shù)與受眾的界限,實現(xiàn)藝術(shù)創(chuàng)作本體與接受客體的雙向互動。從人工智能藝術(shù)的創(chuàng)作主體與接受客體的關系出發(fā),可以大致分為三種類型:技術(shù)生成態(tài)的藝術(shù)、主體間交互的藝術(shù)、全感知藝術(shù)。
(一)技術(shù)生成態(tài)的藝術(shù)
圖靈認為“人不過就是腦袋上頂了個計算機的肉機器而已”[2],而人工智能機器人的發(fā)展正是對人類思維的復刻與學習。這一類科技行為生成態(tài)的藝術(shù),最初產(chǎn)生是作為衡量技術(shù)進步的指標。其創(chuàng)作的產(chǎn)品有藝術(shù)性,但卻不是藝術(shù)行為,而是科技行為。各種算法平臺,把人類的作品輸入進去,通過學習,很快就能夠推出很多藝術(shù)作品。雖然從人類的作品看,人工智能藝術(shù)作品與其相差無幾,但其同樣不是一種藝術(shù)創(chuàng)作行為,而是由商業(yè)行為推動的藝術(shù)創(chuàng)作。依照目前的技術(shù)水平,人工智能在藝術(shù)創(chuàng)作中還有很大的局限性,但不可否認的是,人工智能技術(shù)對藝術(shù)的參與,徹底打破了人類創(chuàng)造藝術(shù)的專利。智能機器人利用計算機強大的信息運算能力,通過人工輸入的程序?qū)Υ罅繑?shù)據(jù)進行篩選、運算,最后輸出藝術(shù)品。其創(chuàng)造的初衷是模仿人類的思維,幫助人類完成大量繁瑣的工作。
作為技術(shù)生成態(tài)的藝術(shù),技術(shù)對藝術(shù)的介入是全方位的。
在繪畫、音樂、文學和影視制作等藝術(shù)領域,智能機器人都可以充當藝術(shù)“創(chuàng)作者”。譬如,智能機器人技術(shù)在文學領域的發(fā)展可謂碩果累累,寫新聞的“Dream writer”、創(chuàng)作小說《電腦寫小說的那一天》的“星新先生”以及寫詩的“小冰”,成為文學領域的佼佼者。2017年微軟推出人工智能“小冰”,實驗的過程是輸入一張圖片,通過復雜的算法,便可以輸出一首與圖片適配的詩歌。在繪畫領域,機械手臂機器人學習某一畫家的繪畫風格,通過不斷的學習和修正,人工智能機器人可以無限接近該藝術(shù)家的創(chuàng)作風格。2019年,人工智能機器人小冰學習了236位畫家的繪畫作品,在中央美院展出了大量與名家風格神似的繪畫作品。這些作品無論從繪畫風格還是色彩,都讓人難以相信是人工智能技術(shù)的產(chǎn)物。2020年,藝術(shù)家鐘愫君(Sougwen chuang)創(chuàng)造了自己的AI機器人道格(Doug),這款機器人可以與藝術(shù)家的腦電波數(shù)據(jù)鏈接起來,當藝術(shù)家和機器人繪畫時,它們通過共享的知識庫,以及實時的視覺和運動提示聯(lián)系在一起,并與鐘愫君完成團隊合作的繪畫創(chuàng)作。[3]美國工程師品達范阿曼設計的人工智能繪畫機器手臂“云畫家”,其通過抽象繪畫方式的學習,不斷提高繪畫水平。在紐約還有一個“夢境”藝術(shù)體驗館,工程師將紐約幾千萬張圖片導入數(shù)據(jù)庫,讓機器學習這些風景和建筑,讓人工智能機器創(chuàng)作出自己幻想的紐約市。這些毫無邏輯的圖片展示,給觀眾造成一種仿佛在夢幻中的錯覺。音樂領域,莫扎特、巴赫等藝術(shù)家的作品一直都是人工智能學習模仿的經(jīng)典之作。柯普公司曾進行過一個名為“音樂智能”(experiments in musical intelligence)的實驗,在這個實驗中誕生了人工智能作曲家“艾米”,它是學習巴赫作曲風格最成功的“創(chuàng)作者”,甚至聽眾很難區(qū)分出這是人工智能機器的“巴赫”音樂。人工智能將音符轉(zhuǎn)化為數(shù)學符號,通過對龐大數(shù)據(jù)的分析與學習,發(fā)現(xiàn)隱藏在藝術(shù)作品背后的規(guī)律。帕切特的“續(xù)作者”實驗就很好地證明了這一點?!袄m(xù)作者”通過對藝術(shù)家?guī)в袕娏覀€人特色的作品的學習,把握藝術(shù)家的創(chuàng)作世界。除此之外,蝦米音樂、網(wǎng)易云音樂,通過收集用于個人偏好,向用戶推薦適合的音樂內(nèi)容,還有通過照片的上傳,人工智能會根據(jù)照片的環(huán)境,定制適合該環(huán)境的歌曲。伊朗作曲家艾什·庫薩(Ash Koosha)成功創(chuàng)作了AI創(chuàng)作型歌手Yona,這個AI機器人可以創(chuàng)造歌詞、旋律、聲音,并將其組合成一首原創(chuàng)歌曲。它的聲音和歌曲具有自身獨特的風格,受到廣大網(wǎng)友的關注。它還曾在虛擬現(xiàn)實中開過演唱會,可以說這是藝術(shù)家利用科技創(chuàng)造藝術(shù)的一次成功實驗。影視領域,人工智能為電影的宣傳和營銷提供了強大的支撐?!缎请H穿越》預告片投入市場之時,通過對雎書(Facebook)和照片墻(Instagram)等用戶對預告片觀看信息的反饋和興趣點的收集,片方利用人工智能的數(shù)據(jù)分析定制個性化營銷方案,為第二部預告片的制作提供了數(shù)據(jù)分析。IBM利用人工智能系統(tǒng)沃森(Watson)完成了《摩根》電影預告片的剪輯。這是人工智能技術(shù)在影視領域的初次嘗試,也可以說是未來影視藝術(shù)制作工業(yè)化、大眾化的初探。
對比傳統(tǒng)的藝術(shù)創(chuàng)作需要藝術(shù)家結(jié)合自身經(jīng)驗和情感進行創(chuàng)作,同時藝術(shù)家的創(chuàng)作需要大量的精力和時間,技術(shù)生成態(tài)的人工智能藝術(shù)以科技行為進行藝術(shù)生產(chǎn),對人類的審美認知發(fā)起挑戰(zhàn)。
(二)主體間交互的藝術(shù)
主體間交互的藝術(shù),并不是藝術(shù)的自發(fā)選擇,而是可以根據(jù)人的動作和姿態(tài)做出一種反應,是重塑人機交互的過程。這類藝術(shù)形式與上文所述的“始終處于技術(shù)生成態(tài)的藝術(shù)”,在藝術(shù)創(chuàng)作方式上有本質(zhì)的不同。它是作品和觀眾之間的交互,更注重藝術(shù)的互動協(xié)作。雖然在傳統(tǒng)的藝術(shù)中,觀眾也可以實現(xiàn)心靈和經(jīng)驗的互動,但這種互動僅僅發(fā)生在意識層面,而人工智能藝術(shù)是直接性的、具身性的。
早在1920年,杜尚《旋轉(zhuǎn)的飾版》中就應用了藝術(shù)“互動”這一想法,即觀眾需要站在特定的位置才能看到特定的圖像。這一嘗試是藝術(shù)品與觀眾互動的開始,之后隨著媒介技術(shù)的不斷演進,藝術(shù)作品的創(chuàng)作致力于與觀眾的互聯(lián)、協(xié)作。以超文本藝術(shù)來看,交互與協(xié)作是其藝術(shù)生產(chǎn)的重要方式?!俺谋揪褪欠切蛄行裕?non-sequential) 的寫作——文本相互交叉并允許讀者自由選擇,最好是在交互性的屏幕上進行閱讀。根據(jù)一般的構(gòu)想,這是一系列通過鏈接而聯(lián)系在一起的文本塊,這些鏈接為讀者提供了不同的路徑?!保?]它的合作模式主要有:續(xù)寫,修改,碎片集成,以上三者的集合。[5]相較于傳統(tǒng)寫作方式,超文本寫作讓讀者獲得了更大的選擇權(quán)和主動權(quán)。以目前最具代表性的超文本寫作生產(chǎn)平臺“scp維基平臺”為例,這一平臺創(chuàng)造了一種集體協(xié)作和超文本敘事的獨特文學生產(chǎn)平臺,提供了一個虛擬的藝術(shù)創(chuàng)作空間,為用戶在寫作和閱讀上提供了極大的自由度。在寫作方面,超文本寫作又簡稱“超寫作”(hyperwriting),用戶從不同視角以及超鏈接的方式講述故事,可以在其中自由地添加想要表達的內(nèi)容?!癝CP維基平臺”,讓世界各地的用戶在同一主題下接力寫作,在用戶的不斷創(chuàng)作中形成自身獨特的藝術(shù)風格。大眾的“角色”從被動的接收者轉(zhuǎn)為藝術(shù)創(chuàng)作的主體,并將自身情感放置到藝術(shù)實踐當中。這里的藝術(shù)實踐需要技術(shù)人員 、平臺、用戶等共同協(xié)作,傳統(tǒng)藝術(shù)家的主體地位被顛覆。在閱讀方面,超文本閱讀又簡稱“超閱讀”(hyperreading),超文本閱讀使用超鏈接將文字、圖片、聲音、影像、代碼等與文本相連,最終通過作者的創(chuàng)作編織成一個龐大復雜的網(wǎng)絡,讀者在進入這個網(wǎng)絡之后,可以從任意節(jié)點進入,自由選擇不同的故事走向。譬如一部實驗性的超文本小說《下午:一個故事》,不同界面的鏈接隨意放置,這些沒有邏輯的材料讓讀者利用自己的主觀思維將其融合建構(gòu),而這部作品并沒有提供一個明確的結(jié)局走向,而是將這一權(quán)力交給讀者。超文本閱讀將讀者推向了藝術(shù)創(chuàng)作的主體地位,帶給讀者沉浸式的藝術(shù)體驗。在人工智能這一技術(shù)背景下,超文本藝術(shù)構(gòu)建了全新的藝術(shù)創(chuàng)作方式:利用超文本系統(tǒng),增強觀眾與藝術(shù)創(chuàng)作的關系,將碎片化文本,交由讀者創(chuàng)造組合,進而形成一種個人化的文本藝術(shù)。由此,主體間交互的藝術(shù)將真實和虛擬的邊界完全打開,使創(chuàng)作者和接受者完全融為一體。人工智能藝術(shù)作品與環(huán)境也是交融的,呈現(xiàn)一種藝術(shù)的新的走向——藝術(shù)不是環(huán)境的裝飾品、陳列品,而就是人生活的環(huán)境本身。
(三)全感知藝術(shù)
全感知藝術(shù),即以具身性沉浸的方式將被傳統(tǒng)藝術(shù)媒介分割的感性復歸,并最大限度地釋放感性。欣賞這一類藝術(shù),各種感官是綜合調(diào)動的,完全沉浸在影像提供的作品當中,同時要使用視覺、聽覺、觸覺等。這和傳統(tǒng)的藝術(shù)門類比較起來可以看出不同:傳統(tǒng)藝術(shù)是對應于某一單一感官,比如繪畫對應視覺、音樂對應聽覺,對感性起到一種分割;以交互沉浸式的全感知藝術(shù),重新調(diào)動我們的綜合體驗,使得原來被分割的感性得以復歸。
電影作為一種時空綜合藝術(shù),以藝術(shù)空間不斷拓展真實物理空間。海利希曾對未來電影發(fā)展有過這樣的期望“如果將電影擴展到不只是涉及味、觸與聞等感覺通道,便可以消除電影與戲劇的第四堵墻,使觀眾遷移到一個可居的虛擬世界?!保?]“數(shù)字演員”的誕生,使很多已故演員再次出現(xiàn)在銀幕上,為電影提供完整敘事,同時“數(shù)字演員”還可以實現(xiàn)大量現(xiàn)實演員難以完成的動作。2019年百度AI與上海電影制片產(chǎn)業(yè)合作,舉辦了童年英雄AI幻象展。這場展覽的超越性在于與影片角色實時互動,體驗者可以化身哪吒與龍王進行一場酣暢淋漓的對決,還可以成為各式各樣的經(jīng)典卡通人物,與影片中的角色互動。這個展覽讓觀眾進入虛擬世界,實現(xiàn)了與虛擬空間的實時互動。對比傳統(tǒng)電影與觀眾之間單向傳播的藝術(shù)形式,AI電影將觀眾置身其中,為觀眾提供了沉浸式的觀影體驗。在藝術(shù)設計領域,人工智能技術(shù)在現(xiàn)代展館中有大量的運用。2011年日本東京大學広瀬谷川研究小組發(fā)明了一款展示盒,用于對文物的虛擬化展示。通過這款盒子,觀眾可以實現(xiàn)縮小、放大、旋轉(zhuǎn)、全方位地觀看展品。2018年,Asian Art Works 與交互藝術(shù)實驗室 AMLAB 共同推出了智能體感交互藝術(shù)設計作品《水妖》。這個作品突破傳統(tǒng)藝術(shù)設計單一的藝術(shù)感知模式,運用“視覺”“聽覺”和“觸覺”的聯(lián)動,將觀眾帶入充滿污染的海洋深處,每一次的點擊觸摸,都會改變藝術(shù)自身的形態(tài),甚至隨著眼神的意動呈現(xiàn)出不同的狀況,讓觀眾全方位地體驗海底污染的嚴重性。在某種程度上,“全感知藝術(shù)”最大限度地解放了感性。這種藝術(shù)始終處于流動的、不斷生成的過程,永遠不是固定的。它致力于觀眾的參與、互動,所以其作品是持續(xù)的涌現(xiàn)、不斷的變化,每一剎那都是藝術(shù)的瞬間,但不是全部。顯然,這是此前的藝術(shù)所不具有的。
從上述三種類型看,人工智能藝術(shù)的技術(shù)底層是一樣的,但是人類的行為決定了藝術(shù)不同的走向,也決定了最終產(chǎn)生出來的作品,以及作品所帶來的文化影響和沖擊。人類行為構(gòu)成了藝術(shù)發(fā)展的方向,也構(gòu)成了在其中生存演化的生態(tài)環(huán)境。前兩種類型符合基于技術(shù)原理的定義,第三種類型則是藝術(shù)對技術(shù)的賦能。這種全新的藝術(shù)門類,其基本的形態(tài)是一種沉浸式的、交互的藝術(shù)作品。這樣產(chǎn)生出來的作品不僅在藝術(shù)上有創(chuàng)造性,也擴大了藝術(shù)所能產(chǎn)生的文化影響的范圍。
三、人工智能生成藝術(shù)創(chuàng)作力
對人工智能藝術(shù)的研究當中,我們需要去吸收和辨析來自技術(shù)批判的理論資源,首先就是涉及對人工智能藝術(shù)的基本定義?,敻覃愄亍げ┑菍θ斯ぶ悄苡羞@樣的界定——即“人工智能就是讓人類計算機完成人類心智(mind)能做的任何事情?!保?]換言之,人工智能藝術(shù)是基于數(shù)字技術(shù)而發(fā)展出來的一種藝術(shù)形式。受到人工智能藝術(shù)獨特媒介特性的影響,面對這樣一個研究對象,我們需要探討技術(shù)在其中扮演的角色,人在其中扮演的角色。尤其是技術(shù)提供的可能性,人提供的創(chuàng)造性,它們形成了怎樣的關系?這些問題都是研究人工智能藝術(shù)必須要考慮的核心問題。技術(shù)、媒介、社會文化三者之間的關系鏈條不是單向的,而是一種共生關系。
以虛擬數(shù)字人的藝術(shù)創(chuàng)作為例,“其本質(zhì)是在線社交媒體中的計算機算法,通過整合代碼的方式來模擬真實人思維并生產(chǎn)內(nèi)容?!保?]
(一)模擬人像圖像數(shù)據(jù)庫構(gòu)建
在非結(jié)構(gòu)化環(huán)境中,虛擬數(shù)字人需要完成的任務通常依靠視覺和觸覺反饋。但是,人工設計融合各個不同模態(tài)的機器人控制器并非易事。盡管深度強化學習已經(jīng)成功地應用于針對高維輸入的控制策略學習,但由于樣本復雜性,這些算法通常難以部署在實際的虛擬數(shù)字人上。米歇爾提出使用自監(jiān)督來學習感官輸入的緊湊和多模態(tài)表示,以用來提高策略學習的樣本效率。[9]在藝術(shù)生成過程中,機器人將操作任務建模為一個有限時間的離散馬爾科夫決策過程M,狀態(tài)空間S,動作空間A,狀態(tài)轉(zhuǎn)移動力學T: S×A → S,初始狀態(tài)分布ρ0,回報函數(shù)r:S×A→ R,時間T,折扣系數(shù)γ∈(0,1],為了確定最優(yōu)隨機策略π:S → P(A),自監(jiān)督多模態(tài)表示學習的神經(jīng)網(wǎng)絡結(jié)構(gòu)如圖4所示:
該網(wǎng)絡將來自三個不同傳感器的數(shù)據(jù)作為輸入:RGB 圖像、32ms 窗口上的 F/T 讀數(shù)以及末端執(zhí)行器的位置和速度。它將這些數(shù)據(jù)編碼并融合到一個多模態(tài)表示中,基于此,可以學習包含接觸操作的控制器。這種表示學習網(wǎng)絡是通過自監(jiān)督形式進行端到訓練端的。一旦經(jīng)過訓練,當用作用于強化學習的淺層神經(jīng)網(wǎng)絡策略的輸入時,該表示就保持固定。通過自我監(jiān)督來訓練表示模型,從而無需手動標注。實驗表明,接觸的任務需要視覺和觸覺的多模式反饋,此外,還進一步證明了多模態(tài)可以很好地遷移到其他新任務中。
2018年,在《英雄聯(lián)盟》職業(yè)聯(lián)賽(LPL)總決賽上,現(xiàn)場直播由虛擬數(shù)字人組成的K/DA虛擬偶像女團完成。這些數(shù)字偶像以面部動作編碼系統(tǒng)(FACS)模擬人臉近似的表情?!叭绻碌暮笕祟惾匀淮嬗谙笳鹘纾敲纯隙〞小环N新的邏輯僵局,一種新的真實界”。[11]
人類的面部表情是人的情感表達媒介,因此人臉圖像識別也是虛擬數(shù)字人情感識別的重要構(gòu)成部分。鑒于此,可以實現(xiàn)“有意義的人類控制”[12]。通常情況下,人臉表情識別主要有4個基本步驟:圖像獲取、圖像預處理、特征提取、表情分類。
首先,傳感器獲取人臉圖像信息,并滿足虛擬數(shù)字人藝術(shù)產(chǎn)品的人臉“跟蹤”[13]條件。藝術(shù)創(chuàng)作者根據(jù)人類的道德、情感因素及特定的運行環(huán)境下的相關事實,提出具體的設計方式;其次,根據(jù)人臉圖像的頭部姿態(tài)進行矯正和圖像分割的圖像預處理,然后進行人臉面部特征提取。主要方法有:提取幾何特征、統(tǒng)計特征、頻率域特征以及運動特征等;最后,根據(jù)表情特征進行分類。主要的方法包括隱馬爾可夫模型(HMM模型)、人工神經(jīng)網(wǎng)絡、支持向量機分類算法等。深度學習可以打破先特征提取再表情分類的傳統(tǒng)方法,實現(xiàn)特征提取與表情分類的同時進行。
《CryptoPunks》(Larva Labs創(chuàng)建,2017)是一個加密朋克NFT收藏品系列的實驗項目。該項目開發(fā)的靈感來源于二十世紀七十年代的倫敦朋克文化、威廉·吉布森的小說神經(jīng)漫游者、刀鋒戰(zhàn)士、捍衛(wèi)機密、以及電子音樂藝術(shù)家Daft Punk。他們試圖將代碼轉(zhuǎn)化為形象塑造中的反建制精神符號,并用以太坊區(qū)塊鏈的所有權(quán)證明建立一種帶有專屬性的存儲介質(zhì),這在一定程度上激發(fā)了現(xiàn)代加密藝術(shù)的興起。
這一項目是10000個像素化頭像的集合,包括由24x24像素的類似人類、僵尸、朋克、猿和外星人等的藝術(shù)圖像組成。每一個圖像都有專有的個人資料頁面,并由算法賦予發(fā)型、膚色、胡子、口紅、眼鏡、帽子等不同圖像的組合。圖像資料也會顯示其屬性以及所有權(quán)或出售狀態(tài)。正因為這樣的獨一無二模擬人像圖像數(shù)據(jù)庫,“加密朋克”成為全球最早的NFT——可收藏的數(shù)字貨幣藝術(shù)品之一。不依常規(guī)、特立獨行的審美觀,得益于算法數(shù)據(jù)庫賦予的假定個性和隨機生成的特征。
(二)藝術(shù)人像的情感特征提取
為實現(xiàn)高效并且可靠的人機交互,一個高智能化的虛擬數(shù)字人必須具備對外界環(huán)境的感知能力,從而對后續(xù)的情感分析建模提供基礎。在進行交互過程中,人的姿態(tài)一般會伴隨著過程的變化而發(fā)生變化,在傳達情感方面,身體的表達像面部表情一樣強大。因此讓機器人“讀懂”人類姿態(tài)所表達的內(nèi)涵對機器人準確地判斷人類的情感狀態(tài)也有一定的輔助作用。盡管“模仿藝術(shù)與真理相隔極遠”[14],以AI技術(shù)驅(qū)動的虛擬男性和女性,在人類情感層面仍然被賦予了和人類對話的能力,獲得人類的“伴侶”主體地位。人工智能框架——“小冰”,即通過手機個性化設置為其定制性格、喜好甚至三觀,從而在云計算空間里與用戶建立親密情感關系。其中,滿足用戶需求的姿態(tài)表情識別通過對人臉面部表情以外的動作進行識別,進而來輔助判斷人類的情感信息,實現(xiàn)互動生成。從人工智能驅(qū)動型虛擬數(shù)字人的技術(shù)研究來看,除了集成自然圖像模擬以外,大多關注于語義表情和表情細節(jié)動作的生成[15]。
目前的常見方法主要是識別人們?nèi)粘P袨閯幼髑楦行畔⒑妥藨B(tài)動作幅度、力度、節(jié)奏等時空特性的情感信息。
人工情感研究的基礎是情感建模。當情感被識別之后,計算機算法對識別的信號進行分析與處理,構(gòu)建情感模型并將情感進行量化,將人類的情緒模型化。目前人工情感模型的分類大致分為兩類:基于設計的模型;基于任務的模型?;谠O計的模型主要是模擬情感的自然發(fā)生過程,注重導致情感發(fā)生變化的內(nèi)部原因?;谌蝿盏哪P椭饕菫榱藢崿F(xiàn)具體的任務,注重對自然情緒所產(chǎn)生的行為、表現(xiàn)進行模型。
人工情感模型還可細分為以下幾種模型:
OCC模型:這種模型是第一個以計算機實現(xiàn)為目的,應用最為廣泛的情感模型。它以認知評價為基礎,將評價變量分為事件、主體、對象三組,再將每組變量評價為滿意的和不滿意的,然后將評價結(jié)果與情感生成規(guī)則進行匹配,確定當前的情感狀態(tài)。
HMM模型:這種模型中有三種情緒狀態(tài)(快樂、興趣和悲傷),但可以擴充為多個。HMM模型將情緒狀態(tài)認為是不可直接通過觀察得到,但可以通過觀察當時狀態(tài)的特征來推測可能的情感狀態(tài)。因此HMM模型適合觀察有不同情感組合起來的混合情感。
PEACTIDM情感模型:該模型的情感產(chǎn)生過程基于8個抽象的功能算子(接受、編碼、關注、理解、規(guī)劃、意圖、譯碼、行動)。每一次的情感生成,依次完成8個功能的循環(huán),再通過算法結(jié)果生成相應的情感。PEACTIDM情感模型的特點即利用算法進行復雜的邏輯推理生成情感。
(三)藝術(shù)風格的圖像、聲音拼接算法
虛擬數(shù)字人與人進行人機交互的時候,除了要識別和理解人的情感之外,同時還需要及時進行情感的反饋,在特定的操作環(huán)境中,這樣一種目標驅(qū)動,實際上以算法構(gòu)建了“合作式交互”[16]。虛擬數(shù)字人通過一系列的算法技術(shù),使用一堆冷冰冰的零部件將看不見摸不著的情感表達出來,使得人們獲得類似于與人進行交互的體驗。交互體驗的好壞,會對人的感知造成很大的影響。如果交互體驗更接近真人,且情感表達豐富,那么人們的交互意愿自然也會更強,人們會覺得這不是一個冷冰冰的機器,會有意愿與這類智能體進一步交互。虛擬數(shù)字人的情感表達方式與人類的方式相似,可以分為面部表情合成、情感語音合成以及姿態(tài)表情合成。
在虛擬數(shù)字人的開發(fā)過程中,計算機算法需要根據(jù)人面部的微幾何形狀、人眼模型、嘴唇及肌肉運動進行高精度的三維捕捉,同時對皮膚、頭發(fā)、牙齒等人類外觀進行圖像建模。這些三維圖像的運動對面部表情合成有重要的影響,為了避免數(shù)字人類面部表情的虛假感,還需要添加聲音?!叭祟惣毼⒌那楦邪ㄑ凵駛鬟_、凝視方向和注意焦點必須與角色的言語完全一致,人體的一切結(jié)構(gòu)才呈現(xiàn)連貫。”[17]語音識別就好似人類的聽覺系統(tǒng),通過計算機語音信號的轉(zhuǎn)換,虛擬數(shù)字人能夠識別和理解其所提供的文本內(nèi)容或者命令。一般情況下,語音識別系統(tǒng)由三部分組成,即語音特征提取、聲學模型與模型匹配、語音模型與語言處理。
以美國爆火的虛擬偶像歌手選秀節(jié)目《ALTER EGO》為例,自2021年9月22日在??怂闺娨暸_首播,有近285萬觀眾觀看。
與傳統(tǒng)選秀比賽不同,選手均為算法設定的虛擬形象。在節(jié)目中,動作捕捉技術(shù)展示虛擬歌手獨特的表演風格。這種表演風格對于游戲玩家來說并不陌生,KDA的英雄聯(lián)盟開場秀、Travis Scot和Ariana Grande堡壘之夜的演唱表演,都是虛擬偶像的表演。節(jié)目中的虛擬人物在身體和外部空間的感知之間建立了一個拼接融合的身體圖式系統(tǒng)。節(jié)目中人類與生俱來的肉身感知系統(tǒng)被重構(gòu)。人類的身體、骨骼被數(shù)字虛擬等因素重新定義和改造。在這一實踐過程中,計算機圖形技術(shù)基于對身體的設計進行了更高層次的思考,即算法能夠能動地調(diào)節(jié)和控制身體不同的姿態(tài)和運動,實現(xiàn)感知反射層、骨骼控制層和蒙皮驅(qū)動層的拼接協(xié)調(diào)。節(jié)目中的虛擬人通過感知環(huán)境信息來驅(qū)動身體運動和對外界的反饋,建立數(shù)字化的表演鏡像。
當然,上文中提到虛擬數(shù)字人其實并沒有人的主觀意識和情感的參與,只是進行藝術(shù)勞動的機器人。如果用發(fā)展的眼光看人工智能藝術(shù)的發(fā)展,假設人工智能發(fā)展到強人工智能階段,人工智能開始擁有像人類一樣的意識和情感時,虛擬數(shù)字人就有能力成為藝術(shù)的創(chuàng)作者,藝術(shù)家的定義也將會被再一次擴展。
結(jié)語
馬克思曾在《共產(chǎn)黨宣言》中寫道:“一切堅固的東西都煙消云散了”[18]這句話表達的含義,即我們生活在一個嶄新的、日異月殊、不斷變革的現(xiàn)代社會。人工智能為藝術(shù)領域帶來的改變,讓我們不僅看到“機器”創(chuàng)作者,還看到藝術(shù)的“參與者”。人類基于人工智能藝術(shù)所提供的媒介,正在進行一種全新的藝術(shù)范式的創(chuàng)作。具身性的沉浸和人與人之間的交互體驗,亦正在引發(fā)我們對藝術(shù)、媒介、人與世界、人與萬物的關系的全新思考。正如美國科普作家斷言“如果能夠從人腦中取得足夠的信息并把它在別處精心復制,你就能創(chuàng)造出人們的記憶以及他們內(nèi)心深處的想法和感情,等等。你將能夠除血肉之軀重新塑造一個人,甚至把人的整個大腦變成計算機,這樣做意味著什么現(xiàn)在尚難以下定論,但至少有一點是肯定的,即我們關于人類為何物的概念將永遠地改變”[19]因此,基于技術(shù)媒介的人工智能藝術(shù)創(chuàng)作力的生成是技術(shù)實踐的重要內(nèi)容,是構(gòu)建新的藝術(shù)形態(tài)和審美經(jīng)驗的重要力量,正是算法賦能實現(xiàn)、發(fā)展了技術(shù)中人的屬性,使技術(shù)具有了藝術(shù)的高光時刻。
本文系國家社科基金一般項目“數(shù)字時代公共藝術(shù)生產(chǎn)研究”(21BZW074);成都理工大學“雙一流”建設哲學社會科學重點建設項目“川劇臉譜藝術(shù)的數(shù)字化傳播研究”(ZDJS202215);“李冰文化的影像化及世界性表達研究”(LBYJ2022-002);成都市哲學社會科學規(guī)劃項目“四川網(wǎng)絡文學中的古蜀神話重述現(xiàn)象研究”(2021CZ003);成都市哲學社會科學重點研究基地成都歷史與成都文獻研究中心一般項目“四川網(wǎng)絡文學中古蜀神話書寫的ip化研究”(CLWX21012); 成都理工大學年度哲學社會科學研究基金項目一般項目“數(shù)字時代新媒介文藝理論話語建構(gòu)研究”(YJ2022-YB013)階段性成果。
作者簡介:孫婧,文學博士、博士后,成都理工大學傳播科學與藝術(shù)學院副教授、碩士生導師,研究方向:數(shù)字公共藝術(shù)、文藝傳媒。
注釋:
[1] 馬歇爾·麥克盧漢:《理解媒介—論人的延伸》,何道寬譯,商務印書館,2000年。
[2] 轉(zhuǎn)引自尼克:《人工智能簡史》,人民郵電出版社,2017年,第195頁。
[3] https://www.xianjichina.com/special/detail_461479.html.
[4] 萊恩·考斯基馬:《數(shù)字文學: 從文本到超文本及其超越》.單小曦、陳后亮,等譯,廣西師范大學出版社,2011年,第13頁。
[5] Landow ,George P. and paul Delany,“Hypertext ,Hypermedia ,and Literary Studies : The State of the Art”, Hypermedia and literary studies,eds. Paul Delany and George P.Landow, Combridge ,Masschustts and London ,England:The MIT Press ,1991, Fourth printing ,1994.
[6] 黃鳴奮:《新媒體與西方藝術(shù)學理論》,學林出版社,2009年。
[7] 瑪格麗特·博登:《AI:人工智能的本質(zhì)與未來》,孫詩惠譯,北京:中國人民大學出版社,2017年。
[8] 孫婧:《人工智能藝術(shù)的歷史生成與“參與”美學》,《當代文壇》, 2022年第6期,第183-189頁。
[9] Michelle A. Lee, Making Sense of Vision and Touch: Self-Supervised Learning of Multimodal Representations for Contact-Rich Tasks, IEEE International Conference on Robotics and Automation,2019.
[10] 此部分解釋參見清華大學、中國人工智能學會《2019人工智能發(fā)展報告》。
[11] Slavoj I ek,Disparity,London,NewYork: Bloomsbury Publishing,2016, p.362.
[12] Santoni de Sio F, Van den Hoven J., Meaningful Human Control Over Autonomous Systems: A Philosophical Account, Frontiers in Robotics and AI, No.5, 2018,p.15.
[13] Crootof R., A Meaningful Floor for Meaningful Human Control,Temp. Int'l & Comp. LJ, No.30, 2016, p.53.
[14] Plato, The RepublicⅡ, Cambridge: Harvard University Press, 1942, p.431.
[15] 張申、賈珈、王曉慧等:《基于語義維度的人臉表情生成》,清華大學學報(自然科學版),2011年第1期,第80—84頁。
[16] 許為、葛列眾、高在峰:《人-AI交互: 實現(xiàn)“以人為中心AI”理念的跨學科新領域》,《智能系統(tǒng)學報》,2021年第1期,第1—18頁。
[17] 孫婧:《人工智能藝術(shù)的歷史生成與“參與”美學》,《當代文壇》, 2022年第6期,第183—189頁。
[18]中共中央馬克思恩格斯列寧斯大林著作編譯局譯:《馬克思恩格斯全集》(第四卷),北京人民出版社,1958年。
[19] 里吉斯:《科學也瘋狂》,張明德、劉青青譯,北京:中國對外翻譯出版社,1994年。