溫韶琪 王華琳
(廣西藝術(shù)學院設(shè)計學院,廣西 南寧 530000)
作為新時代科技轉(zhuǎn)型升級的重要驅(qū)動力量,人工智能正不斷賦能人類生產(chǎn)生活的方方面面,已成為數(shù)字經(jīng)濟時代的創(chuàng)新應用產(chǎn)業(yè)。隨著技術(shù)發(fā)展,萬物互聯(lián)正逐漸向萬物皆媒、萬眾皆媒推進,以人工智能虛擬主播(以下簡稱AI虛擬主播)為代表的虛擬數(shù)字人已成為數(shù)字傳播領(lǐng)域的一大新興形式。艾媒咨詢機構(gòu)發(fā)布的《2023年中國虛擬人產(chǎn)業(yè)發(fā)展與商業(yè)趨勢研究報告》顯示,我國虛擬數(shù)字人于2022年帶動的核心市場規(guī)模及產(chǎn)業(yè)市場規(guī)模分別為120.8億元和1 866.1億元,且增長態(tài)勢強勁[1]。其中,AI虛擬主播以人工智能為內(nèi)核驅(qū)動,顛覆了傳統(tǒng)主播同觀眾間交互關(guān)系的傳播形態(tài)。人工智能技術(shù)的日益成熟為信息的傳播帶來了科技美感,觀眾也持續(xù)性地從AI虛擬主播中獲取技術(shù)娛樂性的審美體驗與情感滿足。作為網(wǎng)絡(luò)主播的一種新類型,AI虛擬主播一方面保留著真人的溝通交流能力,另一方面又被賦予了一種虛擬的外觀形象,表現(xiàn)出雙重復合效應[2]。文章以AI虛擬主播為核心,通過回顧其發(fā)展歷程,探討其與觀眾之間的情感互動機制,分析AI虛擬主播人物設(shè)計的視覺內(nèi)核與外核設(shè)計內(nèi)容,并進一步反思其在新時代背景下的價值構(gòu)建,為更好地引導這一新興技術(shù)發(fā)展提供理論參考。
虛擬數(shù)字人是指存在于虛擬世界中,以計算機、人工智能技術(shù)等為技術(shù)邏輯,并具有多重人類特征的復合體,虛擬主播、虛擬主持人皆包含其中[3]。二者雖以語言作為符號媒介進行互聯(lián)網(wǎng)虛擬互動,但在所處領(lǐng)域上仍有區(qū)別,虛擬主播更多傾向于文化娛樂行業(yè),虛擬主持人則多傾向于新聞、政務(wù)等行業(yè)。
AI虛擬主播最早的萌芽可追溯到2011年一位名為Ami Yamato的YouTube用戶在平臺上傳自己的生活類視頻。在這些視頻中,作者首次運用面部捕捉設(shè)備所創(chuàng)作的虛擬形象作為主人公,開展日常閑聊、體驗分享等。其后,世界第一位真正意義上的虛擬主播“絆愛”(Kizuna Ai)于2016年11月在日本Activ8數(shù)字制作公司誕生。這一長相甜美、頭戴粉色心型發(fā)卡的女性虛擬形象,以能夠24小時互動、唱歌跳舞等特點迅速成為市場焦點,截至2019年12月,“絆愛”開設(shè)的“AI Channel”頻道已擁有267萬訂閱者。因“絆愛”讓虛擬主播這一新型傳播形態(tài)進入了大眾視野,其已然成為AI虛擬主播行業(yè)的先驅(qū)者。而后,其他公司也相繼推出“阿拉娜”“電腦少女小白”“未來明”等虛擬主播。
直至2017年末,“虛擬口癖蘿莉狐娘YouTuber大叔”的出現(xiàn)引發(fā)了AI虛擬主播行業(yè)的大爆發(fā)。這一身著粉色日式巫女服裝的雙馬尾女孩是由一位有著失敗就職經(jīng)歷,依靠業(yè)余時間鉆研建模與VR技術(shù)的普通男性創(chuàng)作而成,其就業(yè)經(jīng)歷的真情吐露引發(fā)了廣大觀眾的共鳴,渾厚的男性嗓音又給予了觀眾強烈的反差沖擊,在YouTube平臺上吸引了大量受眾。同時,“虛擬口癖蘿莉狐娘YouTuber大叔”的出現(xiàn)也扭轉(zhuǎn)了虛擬主播領(lǐng)域由企業(yè)化運營團隊專業(yè)支持的“企業(yè)勢”,向大眾傳遞了一個普通人也可制作出優(yōu)秀視頻的“個人勢”信號。由此,AI虛擬主播行業(yè)進入發(fā)展的黃金時期,而我國也受到了這股熱潮的影響。
2018年,虛研社推出了我國首個“虛擬次元計劃”,并在嗶哩嗶哩平臺創(chuàng)作首位中文虛擬UP主“小希”,受到了國內(nèi)受眾的熱捧。除專營AI虛擬主播的團隊外,我國大型的互聯(lián)網(wǎng)公司也相繼推出自己的虛擬主播,如騰訊游戲利用其明星產(chǎn)品《王者榮耀》推出“王者榮耀虛擬偶像”;網(wǎng)易游戲依托《陰陽師》推出“平安京偶像計劃”,打造了人氣形象——“大天狗”;上海巨人網(wǎng)絡(luò)科技有限公司推出首位虛擬主播“七瀨胡桃”等。
作為傳播媒介迭代的產(chǎn)物,AI虛擬主播的崛起和發(fā)展離不開技術(shù)更新與文化發(fā)展。
一方面,AI虛擬主播由萌芽階段逐步過渡到現(xiàn)如今的發(fā)展成熟階段,其間經(jīng)歷了3D建模技術(shù)、手機移動互聯(lián)網(wǎng)端、人工智能、動作捕捉等技術(shù)迭代,可以說其迭代發(fā)展幾乎與技術(shù)的發(fā)展畫上等號。同時,以Chat GPT(Chat Generative Pretrained Transformer)為 首的大型語言模型的人工智能的出現(xiàn),亦導致了以人工智能為內(nèi)核的AI虛擬主播的相繼涌現(xiàn),而互聯(lián)網(wǎng)的無門檻化也致使其得到普遍傳播。
另一方面,“二次元”文化及網(wǎng)絡(luò)直播文化的融合為AI虛擬主播的發(fā)展創(chuàng)造了機遇。隨著數(shù)字經(jīng)濟的發(fā)展及移動端媒體的普及,人們的時間、注意力、媒介接觸日益呈現(xiàn)碎片化趨勢,各互聯(lián)網(wǎng)媒體為搶奪用戶關(guān)注,創(chuàng)造出了一個多元文化互相交融的網(wǎng)絡(luò)世界,如“吃飯直播”“二次元直播”等亞文化逐漸融入了網(wǎng)絡(luò)直播大潮中。作為“二次元”文化衍生出的新興事物,AI虛擬主播也伴隨著“二次元直播”的發(fā)展逐漸興起。同時,出生于信息時代的“Z世代人群”格外看重社交軟件的“精準匹配”,即通過網(wǎng)站標簽功能快速檢索網(wǎng)站內(nèi)容,可以迅速找到志同道合的網(wǎng)絡(luò)群體。而AI虛擬主播背后的“人設(shè)”文化恰好迎合了“Z世代人群”的這一需求,相較于真人,虛擬主播身上的人設(shè)標簽更加明顯,可省去諸多試錯時間,因此得到了受眾及媒介的廣泛青睞。
AI虛擬主播的視覺設(shè)計包括2個主要領(lǐng)域:一是視覺外核設(shè)計,即外在的虛擬形象設(shè)計;二是視覺的內(nèi)在核心設(shè)計,即以被稱為“中之人”的真人來充當內(nèi)在靈魂。視覺的內(nèi)在核心設(shè)計則以真人作為參照,為AI虛擬主播進行人設(shè)和核心功能的設(shè)計,具體體現(xiàn)為人格化設(shè)計、虛擬陪伴和情感鏈接3個內(nèi)在核心內(nèi)容。
人格化是將人格特質(zhì)賦予某一物體或抽象事物及現(xiàn)象[4]。AI虛擬主播在進行互聯(lián)網(wǎng)直播或發(fā)布視頻創(chuàng)作內(nèi)容時,需要營造出符合受眾的虛擬形象,通過彈幕、評論等交流方式進行溝通。因此,虛擬主播的創(chuàng)建者需要在創(chuàng)造虛擬形象之前,就針對目標群體進行“靶向人設(shè)”構(gòu)建,并同觀眾之間建立情感鏈接。合適的人設(shè)能夠更好地同特定的觀眾構(gòu)建情感共鳴,形成獨一無二的IP。AI虛擬主播的人設(shè)和人格化之間也有著密切的聯(lián)結(jié),即人設(shè)是人格化的基礎(chǔ),人格化是人設(shè)的延展,均賦予了虛擬主播靈魂和個性。人格化能夠增加AI虛擬主播的親和力,并以此同觀眾建立起情感聯(lián)結(jié)[5]。但同時AI虛擬主播沒有意識主體,無法進行自我體驗、感受、經(jīng)歷等意識活動,僅具備“擬主體性”[6]。觀眾與其進行的交流互動皆是與人工智能模擬的虛擬交流,不是真實存在的。
在虛擬主播所面向的文化娛樂領(lǐng)域中,身居城市中的“Z世代人群”是廣泛受眾的群體。移動互聯(lián)網(wǎng)技術(shù)使得每一個人皆可將自己同世界上的任何一個人、一個群體緊密相連。當虛擬網(wǎng)絡(luò)逐漸成為人們主要社交的場所時,其中刻意營造的交流方式則會逐漸替代現(xiàn)實物質(zhì)世界中復雜的社交活動。然而,網(wǎng)絡(luò)社交帶來的多是一種碎片化的弱連接,即虛擬網(wǎng)絡(luò)的社交雖讓人在虛擬世界中排解了現(xiàn)實中的苦悶不易,卻忽視了對于身體環(huán)境的在場延伸[7]。也正因如此,為盡可能彌補“身體”這一職能的缺失,才會有愈來愈多的“身體化”媒介技術(shù)的更新。
作為人工智能的衍生物,AI虛擬主播以全仿真的形態(tài)聯(lián)通著真實與虛擬的世界,為真實世界的消費者提供一種沉浸式的社交方式。隨著人機耦合度的遞進,作為“他身”存在的擬真身體儼然成為人類具身化的“第三持存”[8]。AI虛擬主播在此背景下,憑借具有智能和自我調(diào)節(jié)能力的“數(shù)字身體”給予了孤獨的當代人以具象的日常陪伴。
以數(shù)字媒介為基礎(chǔ)的網(wǎng)絡(luò)直播所帶來的虛擬陪伴具有匿名化體驗的特征,這是其他社交方式所無可比擬的。人們可將在虛擬互聯(lián)網(wǎng)中接觸到的他人視作為“陌生人”,進而把自己內(nèi)心深處的想法及感受盡情袒露[9]。并且這種深層次交流可實現(xiàn)自我表達,建立信任感。在通過人工智能的視覺技術(shù)、語義分析、情感計算等技術(shù)的處理與模擬后,同“陌生人”的交流在人工智能虛擬主播中得到進一步放大。這種隔著屏幕的神秘感,甚至于交流對象不是一個真實存在的人,既能避免真實社交的復雜,亦滿足了觀眾的獵奇心理。
但AI虛擬主播沒有真實存在的物質(zhì)實體,僅能從彈幕、評論等語言和聲音中得到訊息,未能滿足情感傳播中的“雙主體”原則,僅具備“擬主體性”特質(zhì),做不到真人主播所擁有的真實人物特質(zhì)。盡管如此,觀眾也常常會將AI虛擬主播同真人主播所混淆。因為人格化、人設(shè)賦予有效消除了人與數(shù)字訊息之間的隔閡,并創(chuàng)造出了人與技術(shù)之間的親切之感,由此建立起了特殊的情感鏈接。
AI虛擬主播的視覺外核設(shè)計是以內(nèi)核設(shè)計為基礎(chǔ),對AI虛擬主播進行基于風格、功能設(shè)定的外形視覺設(shè)計和角色形象設(shè)計,既可以是追求個性化的角色化、人格化的視覺形象,亦可是以物質(zhì)實體為基礎(chǔ)的數(shù)字分身。
基于內(nèi)核設(shè)計的外形視覺設(shè)計,即在賦予AI虛擬主播人格化的基礎(chǔ)上,營造出一個介于人與物之間的可交互存在,大體上可分為擬人、擬物的虛擬形象。
擬人類型的AI虛擬主播設(shè)計,要最大限度地還原現(xiàn)實世界,再造并傳遞出一種真實性。擬人的外形視覺設(shè)計常以數(shù)字技術(shù)對實體對象進行數(shù)字化構(gòu)建、模仿甚至是描摹,可將其視覺形象構(gòu)建技術(shù)劃分為“二次元”平面化的虛擬形象和3D建模的虛擬形象。其中,“二次元”平面化的設(shè)計常建立在“二次元”文化受眾之上,以手繪、板繪、AIGC等繪畫技術(shù)繪成,往往動漫感較為凸顯。而基于3D建模進行視覺設(shè)計的虛擬主播形象,則一般以專業(yè)3D建模師通過寫實擬真、三渲二等技術(shù)進行視覺構(gòu)建。視覺形象圍繞角色設(shè)定進行設(shè)計,目前已被廣泛運用于互聯(lián)網(wǎng)直播的文化娛樂領(lǐng)域之中。例如,2018年新華社推出了全球首位AI合成主播“新小浩”,就是以中國新聞主播邱浩為原型合成的虛擬形象,“新小微”“李小燕”“紀寧”等皆是此類型的代表。其以現(xiàn)實已有的新聞主持人、主播為原型,制成主體本身的數(shù)字分身,傳遞的內(nèi)容就是對于現(xiàn)實世界信息的模擬。
擬物類型的AI虛擬主播設(shè)計,要賦以更成熟的人設(shè)及更豐富的內(nèi)涵,并且該類型以物體象征AI虛擬主播本身。根據(jù)設(shè)定,以某一物象進行視覺形象的構(gòu)建,其可以是一塊石頭、一根木料甚至一堆交織的線條形狀,不需要專門的畫師、建模師等進行特殊的設(shè)計。但該類型視覺形象僅能有限重復形象的動作或神情,仍主要依靠視覺形象背后人工智能或真人主播的虛擬陪伴吸引觀眾。
AI虛擬主播的角色形象構(gòu)建與人設(shè)內(nèi)核同等重要。角色形象構(gòu)建好了,觀眾才能與其實現(xiàn)“面對面”交流,由此實現(xiàn)虛擬形象、人工智能、觀眾三者之間的情感共在與統(tǒng)一。好的角色形象能夠抓住觀眾記憶點、直達人心。在確定AI虛擬主播身份人設(shè)及其角色形象后,便需依照其核心符號進行衍伸設(shè)計,其中形狀輪廓、符號特征、色彩選取均是重點設(shè)定的設(shè)計內(nèi)容。
形狀輪廓應具有辨識度,讓觀眾即使通過剪影也可在大腦中補充出該角色,如“孫悟空”“哆啦A夢”等。因此,角色形象設(shè)計應從其剪影輪廓處開始,設(shè)計出具備美感和差異化的內(nèi)容;再通過各類圖形的組合,根據(jù)受眾的情感面向、人物設(shè)定等確立該形象的對應姿勢、形體,并框定好形象框架。
符號特征應具有記憶性,如“絆愛”頭上戴著的粉色蝴蝶結(jié)發(fā)箍、“泠鳶yousa”頭上的紅色小鳥等,皆為虛擬形象的視覺符號。且因這些視覺符號極具記憶性、辨識性,而成為符號特征,觀眾常在看到其符號特征時便會自動與其產(chǎn)生聯(lián)想。
色彩選擇應能反映出人物調(diào)性。人們在觀察事物時,色彩是第一視覺。在諸多視覺刺激中,色彩也同樣是最為敏感、迅速的。而虛擬形象的色彩選擇基于“人物設(shè)定”,需以角色的設(shè)定為出發(fā)點設(shè)計出代表該角色的主要色彩,同時還應具備情緒傾向。例如,虛擬主播團體A-SOUL中,虛擬主播共有5位,在做出了服飾、發(fā)型等區(qū)分后,還選定了特定的代表顏色,進而提升了辨識度和人物調(diào)性,且不同的顏色也反映出不同的角色性格。
AI虛擬主播的興起建立起了一個既區(qū)別于線上的“面對面”人機交往與人機傳播,又不同于線下的“面對面”人際交往與人際傳播的模式,使得觀眾與網(wǎng)絡(luò)主播均可忽略生物性的社會身份、身體及面孔,同時實現(xiàn)“真身缺席”與“符號在場”,更為純粹地沉浸于虛擬媒介世界。以此,構(gòu)建了一個既可達到視覺交往關(guān)系平衡,又可忽視時空結(jié)構(gòu)及現(xiàn)實身份交往負擔的真空社交場景。不可否認的是,這一極具輕松性、娛樂性、虛擬性的社交模式,為信息時代的社交關(guān)系提供了新的發(fā)展可能。然而,其時代價值的實現(xiàn)是建立在人工智能技術(shù)相對成熟的基礎(chǔ)之上,圖像識別、體感識別、動作識別等多模態(tài)識別算法雖使得AI虛擬主播能夠多媒介接收外界信息,實現(xiàn)與真實世界的感知互動,但距離其價值落地與市場爆發(fā)仍面臨技術(shù)瓶頸、內(nèi)核缺失等若干挑戰(zhàn)。本文將從智能升級、人設(shè)構(gòu)建、以人為本三方面給出具體的建議,以提升人工智能情境下虛擬主播視覺設(shè)計的價值。
人工智能技術(shù)大多通過在海量數(shù)據(jù)中尋找規(guī)律,并經(jīng)過訓練來完成各項任務(wù),是一種高效的機器學習。相對于僅回應受眾固定話語的程序,新時代的AI虛擬主播更需要“人情味”,以打造具有生命感、人格化、有情緒、能互動、能理解的客體。這可通過深度學習、神經(jīng)網(wǎng)絡(luò)等技術(shù)的加持來實現(xiàn)AI虛擬主播的自我思考,使得其更貼近現(xiàn)實人類的真實姿態(tài),有更好的意識表達、情感識別及聯(lián)想能力。
首先,AI虛擬主播需要通過知識圖譜技術(shù)的應用,建立對自身及受眾的認知,不斷完善用戶畫像,逐步了解受眾、理解受眾,建立自己的“世界觀”。當AI虛擬主播搭建了自己的知識圖譜后,其不再是一個不能交互的設(shè)定,而是一個不斷成長的AI虛擬生命,在與受眾進行交流互動時也能夠展示自己的性格特征及情緒變化。
其次,需要提升受眾的交互沉浸感。利用虛擬現(xiàn)實技術(shù)(VR)、全息影像等助力AI虛擬主播打破虛擬與現(xiàn)實的壁壘,為其走向線下提供技術(shù)前提,真正實現(xiàn)線上與線下、虛擬與現(xiàn)實的有效銜接。受成像介質(zhì)的局限,全息投影技術(shù)現(xiàn)僅能將影像投射于全息膜區(qū)域,這使得受眾與主播間仍存距離感,一定程度上減弱了交互的沉浸感;現(xiàn)有的VR技術(shù)也存在分辨率不高、疲勞感強、輻輳調(diào)節(jié)沖突等不足,使受眾不能身臨其境與直播同處一個空間,感官體驗有待提高。要想有效打破AI虛擬主播的“距離感”,就要實現(xiàn)其在現(xiàn)實空間的輸出,以此來加強虛擬數(shù)字與實際物理空間的互動。
AI虛擬主播的視覺呈現(xiàn)包括品行設(shè)定、畫面品質(zhì)、語言風格、外表形象等,其中,品行指的就是人設(shè),即利用標簽化的形式凸顯差異。品行設(shè)定一般由設(shè)計方預先賦予,后期可根據(jù)受眾的需求不斷完善。構(gòu)建獨特的人設(shè),不僅有利于AI虛擬主播快速出圈,實現(xiàn)更真實的情感陪伴,也能進一步提升其商業(yè)賦值。例如,浙江衛(wèi)視宋韻文化推廣人——谷小雨,以煙雨江南“女兒”的人設(shè)破圈,其身著宋韻服飾,對宋詞信手拈來;秦腔領(lǐng)域虛擬人——秦筱雅,被設(shè)定為“唱秦腔的數(shù)字女孩”,其以“旦角”形象亮相,在一顰一笑、水袖曼妙間傳遞著秦腔的獨特魅力;“柳夜熙”——一個會捉妖的虛擬美妝達人,將“國風”“懸疑”等元素相融合,獲得了一眾好評。由此可知,在AI虛擬主播的創(chuàng)設(shè)中,不僅要將其游戲性、表演性、娛樂性的內(nèi)容呈現(xiàn)給觀眾,還要合理地嵌入人文價值、中國故事、才藝才能等,并圍繞其人設(shè)進行獨特形象制作、聲音打造、行為配合等。
在消費主義意識形態(tài)及符碼的邏輯下,AI虛擬主播逐漸成了一種異化文化符號。當在AI虛擬主播身上尋求精神寄托與情感陪伴時,人們逐漸模糊了虛擬與現(xiàn)實的界限,也消弭了自身作為真實人的主體性。技術(shù)幻象導致人們脫離真實世界,在短暫化、淺表化的虛擬文化空間中逐漸失去了批判意識,尤其對于心智尚未成熟的廣大青年群體來說,AI虛擬主播可能會影響他們對價值的判斷,容易導致其迷失在“擬態(tài)世界”中。因此,AI虛擬主播的生產(chǎn)者、設(shè)計者需思考技術(shù)活動的目的、深層次價值及技術(shù)后果正當性等問題。在遵循媒介技術(shù)向善原則的基礎(chǔ)上,考慮個人隱私及尊嚴的保護,將以人為主體、以人為前提作為AI虛擬主播倫理構(gòu)建的核心。同時,社交平臺及機構(gòu)也要制定相關(guān)規(guī)定,避免虛擬主播傳播低俗、虛假、違法等不良內(nèi)容;而作為AI虛擬主播的受眾者,則需要具備一定的批判思維及媒介素養(yǎng),對AI虛擬主播傳遞的內(nèi)容保持審慎態(tài)度。
隨著技術(shù)發(fā)展進程愈加快速,未來AI虛擬主播亦會不斷進化迭代。本文基于AI虛擬主播的發(fā)展史、興起原因,探索了其外在形象設(shè)計及內(nèi)在功能設(shè)定的基本內(nèi)容,并針對其新時代價值的實現(xiàn)提出了增強互動功能、打造獨特人設(shè)、加強倫理約束的建議措施,為AI虛擬主播這一新型文化產(chǎn)品的規(guī)范運行提供了路徑支撐。虛擬主播同人工智能的有機融合彰顯了人機融合、人技融合的未來。歸根結(jié)底,AI虛擬主播同人類受眾之間的關(guān)系,就是人類與技術(shù)之間的關(guān)系。因此,在人工智能技術(shù)的發(fā)展過程中,找準人類自身的定位成了亟待思考的問題。