林一民 鄧香蓮
專題主持人
李武,男,博士,上海交通大學媒體與傳播學院教授。研究方向:媒介心理和出版閱讀。
主持人語
對于“閱讀”這一概念,幾乎所有人都認為它是一種從符號語言中獲取信息和意義的社會行為、實踐活動和心理過程。但是,對于“符號語言”的不同理解導致了閱讀在廣義和狹義層面上的意義分野。狹義的“符號”往往特指文字或以文字為主的符號體系,而廣義的“符號”除了文字之外,還包括聲音和影像等其他符號語言。在新媒體時代,閱讀的載體不再局限于紙張,電腦、手機、電子閱讀器等電子屏幕成為人們接觸閱讀的主要入口。與此同時,閱讀的對象也從印刷文字擴展為圖片、音頻、視頻等不同符號語言。
本專題是對上述這種變化潮流的一種積極回應(yīng)——“超越文字”。本專題共三篇文章,前兩篇聚焦于有聲閱讀,第三篇重在視頻閱讀。當下,新媒體的發(fā)展催生了新的移動場景,這種變化重新彰顯了聲音的重要性。與此同時,隨著AI及語言合成技術(shù)的發(fā)展,數(shù)字人的聲音已可以媲美真人。因此,探討有聲閱讀的用戶體驗、考察有聲閱讀中的人機互動等相關(guān)聲音傳播的問題是非常及時的,也是非常有價值的。本專題的最后一篇文章則以媒介融合理論為分析框架,從技術(shù)、產(chǎn)業(yè)和文化的層面探討在文字和聲音之外,在線視頻作為一種新型數(shù)字閱讀文本的可能性。
“超越文字”,不是說要拋棄文字閱讀,而是在文字閱讀的基礎(chǔ)上豐富其他的閱讀形態(tài)。有聲閱讀、視頻閱讀與文字閱讀共同構(gòu)筑新媒體時代的閱讀“新景觀”,這應(yīng)該要成為更多人的認識。本專題的初衷即在此。
摘 要:信息傳播技術(shù)革新發(fā)展塑造人類社會數(shù)字交往新范式,推動數(shù)字人新形態(tài)邁入文旅消費新領(lǐng)域?;趯?shù)字人有聲閱讀內(nèi)容生產(chǎn)技術(shù)機理與人機互動特征及其機制的考察,可以發(fā)現(xiàn),處于人機關(guān)系中的數(shù)字人有聲閱讀在聲景沉浸中建構(gòu)了從“人機互動”到“人機情感互動”再到“人機情感依戀”的互動程式。而與此同時,數(shù)字化隱憂也隨之生成。應(yīng)提高對數(shù)字對象依戀、虛擬伴讀依賴、碎片閱讀沉溺和粉絲文化泥淖等問題關(guān)注和應(yīng)對的程度,構(gòu)建健康的人機關(guān)系,從而使數(shù)字人有聲閱讀抵達信息內(nèi)容服務(wù)、知識傳習和文化傳播的本質(zhì)要義。
關(guān)鍵詞:數(shù)字人;有聲閱讀;人機互動;情感互動;情感依戀
DOI: 10.3969/j.issn.2097-1869.2024.01.002 文獻標識碼:A
著錄格式:林一民,鄧香蓮. 聲起數(shù)字人:有聲閱讀中的人機互動、情感依戀與可能關(guān)切[J].數(shù)字出版研究,2024,3(1):8-15.
1 研究緣起
信息傳播技術(shù)發(fā)展一日千里,將人類社會推向數(shù)字交往的全新范式。數(shù)字人的發(fā)展與產(chǎn)業(yè)革命一直是生命醫(yī)學和信息傳媒領(lǐng)域關(guān)注的重要議題。1989年,美國國立醫(yī)學圖書館(National Library of Medicine,NLM)即開始建立可供檢索查閱的人體結(jié)構(gòu)圖像資料庫,被稱為“可視人計劃”(Visible Human Project,VHP)。我國也在2001年和2003年兩次香山科學會議后,啟動了中國人體數(shù)據(jù)集的研究工作[1]。在信息傳媒領(lǐng)域,機器人、電子人一直是科幻文學和影視作品的重要主角。隨著AI、云計算、大數(shù)據(jù)、虛擬現(xiàn)實等技術(shù)群快速發(fā)展并廣泛應(yīng)用于信息傳媒產(chǎn)業(yè),數(shù)字人再次以全新面貌走進大眾視野。虛擬人、數(shù)字人、數(shù)智人等各種稱謂時見報端,呈現(xiàn)井噴態(tài)勢。而元宇宙產(chǎn)業(yè)的大熱,特別是ChatGPT的問世,則進一步突破了公眾對于AI的認知。
近年來,互聯(lián)網(wǎng)企業(yè)、文旅廣電與新聞出版機構(gòu)紛紛推出數(shù)字人,并在多領(lǐng)域?qū)崿F(xiàn)應(yīng)用。例如,上海廣播電視臺虛擬主播申?雅、國家博物館虛擬數(shù)智人員工艾雯雯、抖音虛擬美妝達人柳葉熙等。由燃麥科技開發(fā)的虛擬偶像、超寫實數(shù)字人(MetaHuman)AYAYI更是擔任天貓超級品牌日的數(shù)字主理人,成為阿里巴巴的首位數(shù)字人員工[2]。同樣地,數(shù)字人也已走入國內(nèi)有聲閱讀領(lǐng)域,2023年5月,數(shù)傳集團面向全國出版單位推出AI閱讀服務(wù)數(shù)字人小睿,開啟我國出版業(yè)的AI新時代[3]。2023年8月,番茄小說正式官宣虛擬數(shù)字人IP番卷卷,作為讀者閱讀的“小說搭子”[4]。在喜馬拉雅平臺上,已有以真人原型衍生的AI主播,其作品也獲得讀者關(guān)注。例如,單田芳AI書場、喜小道、蘇小刀等AI主播分別有2.2萬、9.3萬、2.0萬的粉絲訂閱,喜馬拉雅和閱文集團聯(lián)合出品的AI多人有聲劇《深空彼岸(第一季)》則有232.4萬播放量,成為數(shù)字人有聲閱讀內(nèi)容生產(chǎn)實踐先導。不過從總體來看,將數(shù)字人引入有聲閱讀產(chǎn)業(yè)的實際應(yīng)用還相對較少,處于發(fā)展初期。作為與數(shù)字平臺、數(shù)字技術(shù)緊密關(guān)聯(lián)的文化業(yè)態(tài),有聲閱讀無疑還將進一步拓展數(shù)字人應(yīng)用藍海。由此,數(shù)字人如何參與有聲閱讀內(nèi)容生產(chǎn),促成何種人機關(guān)系和文化消費體驗,成為開展本研究的核心關(guān)切。
2 文獻回顧
2.1 數(shù)字人及其界定
“數(shù)字人”概念主要源自電子人,即“賽博格”(Cyborg),該詞在1960年克萊因斯和克萊恩發(fā)表的《賽博格與空間》(Cyborg and Space)中被首次提出,直到1985年唐娜·哈拉維(Donna Haraway)發(fā)表的《賽博格宣言》將“賽博格”定義為“機器與有機體的混合體”[5]。孫瑋從媒介融合的視角分析媒介正在邁向主體層面的融合——技術(shù)與人的融合,這造就了新型主體賽博人,賽博人成為傳播主體,媒介因而轉(zhuǎn)為身體本身[6]。在他們的闡釋中,自然人是行動主體,而技術(shù)(媒介)的擴張和嵌入會進而導致人的電子化、賽博化或曰數(shù)字化。區(qū)別于“賽博人”的概念,沈浩和劉亭利將虛擬數(shù)字人定義為通過計算機圖形學、語音合成技術(shù)、深度學習、類腦科學、生物科技、計算科學等聚合科技(Converging Technologies)創(chuàng)設(shè),并具有人的外觀、行為甚至思想(價值觀)的可交互的虛擬形象[7]。同樣,郭全中指出,虛擬人和虛擬數(shù)字人都屬于數(shù)字人,虛擬數(shù)字人是最小的概念范疇,虛擬人包含虛擬數(shù)字人,是數(shù)字人的組成部分[8]。據(jù)此,本文將數(shù)智人理解為數(shù)字人高度智能化的理想形態(tài),并統(tǒng)稱虛擬人、虛擬數(shù)字人、數(shù)智人等為數(shù)字人。
2.2 有聲閱讀研究面向
近年來,國內(nèi)學者對有聲閱讀的研究主要圍繞以下幾個方面展開:有聲閱讀發(fā)展中的聽覺文化回歸及其場景化實踐的現(xiàn)實意義[9]、有聲閱讀對于促進兒童和青少年教育[10]、彌合老年人及視障人群數(shù)字閱讀鴻溝的作用[11]、公共圖書館有聲閱讀資源建設(shè)及其推廣等[12]。此外,用戶的有聲閱讀偏好和平臺消費特征也是有聲閱讀研究中的重要方向。例如,鄧香蓮以上海大學生為例,重點考察了新媒體環(huán)境下大學生的有聲閱讀行為特征[13];尹章池和徐景熙基于統(tǒng)計數(shù)據(jù)分析高校學生有聲閱讀行為特征及有聲閱讀推廣策略[14];韓生華等以可用性理論為視角對有聲閱讀App用戶體驗及發(fā)展策略進行了研究[15]??梢园l(fā)現(xiàn),有聲閱讀是當前出版與閱讀研究中的熱點領(lǐng)域,其文化消費特征和公共文化服務(wù)效益也更加受到關(guān)注。
2.3 數(shù)字人與有聲閱讀的關(guān)系
現(xiàn)有研究中,學者們主要關(guān)注數(shù)字化場景及AI技術(shù)支持下有聲閱讀的應(yīng)用和發(fā)展趨向,如探討智媒時代有聲出版的作用機理[16],流動空間中有聲書的敘事模式優(yōu)化[17],AIGC技術(shù)在音頻內(nèi)容生產(chǎn)和數(shù)字音樂創(chuàng)作等應(yīng)用場景的賦能潛力[18]等。另外,與之相關(guān)的人機傳播(Human-Machine Communication,HMC)、人機互動也是學者們關(guān)注的議題,不過研究對象主要集中于數(shù)字化環(huán)境下的新聞[19]、電視消費[20]等領(lǐng)域。當前,學界還較少直接探討數(shù)字人之于有聲閱讀(出版)的作用關(guān)系,雖然有部分研究關(guān)注到AI對于有聲閱讀內(nèi)容生產(chǎn)的促進作用,但也未能更多涉及其中的人機互動關(guān)系和情感轉(zhuǎn)向研究。
就此來看,以AI為重要技術(shù)支撐的數(shù)字人對于有聲閱讀的作用效果值得予以更多考察。為便于表述,本文將以數(shù)字人作為有聲閱讀內(nèi)容生產(chǎn)、傳播支持要素的有聲閱讀產(chǎn)品(包括采用某一數(shù)字人的專屬聲音或形象等進行的有聲內(nèi)容創(chuàng)作,也包括以某一數(shù)字人為內(nèi)容角色開展的有聲內(nèi)容創(chuàng)作)和服務(wù)統(tǒng)述為“數(shù)字人有聲閱讀”。
3 數(shù)字人有聲閱讀內(nèi)容生產(chǎn)與人機互動
當前,數(shù)字人仍屬于新生事物,數(shù)字人有聲閱讀的發(fā)展、應(yīng)用、實踐還有極大的探索空間??梢源_定的是,數(shù)字技術(shù)的賦能作用貫穿于數(shù)字人有聲閱讀各環(huán)節(jié)中,明確其內(nèi)容生產(chǎn)技術(shù)機理及人機互動特征和機制,有助于更好地從用戶需求出發(fā)推動數(shù)字人有聲閱讀的創(chuàng)新發(fā)展。
3.1 數(shù)字人有聲閱讀內(nèi)容生產(chǎn)技術(shù)機理
區(qū)別于普通的電子有聲讀物或網(wǎng)絡(luò)有聲讀物,數(shù)字人有聲閱讀具有明確的對話感和對象感。當前的數(shù)字人有兩種技術(shù)路線:一種是“中之人”虛擬人,是在通過CG建模、手繪等制作方式完成形象創(chuàng)作后,借助“中之人”聯(lián)合動捕和面捕技術(shù)實現(xiàn)虛擬數(shù)字人的驅(qū)動;另一種是超級自然虛擬人(AI Being),從創(chuàng)建、驅(qū)動、內(nèi)容生成到實現(xiàn)交互的全程均由AI技術(shù)完成,不需要自然人參與其中[21]。
從產(chǎn)業(yè)發(fā)展視角來看,將數(shù)字人引入有聲閱讀內(nèi)容生產(chǎn)是數(shù)字出版的必然趨向。有聲內(nèi)容的聲音來源可以分為三類:一是人聲朗讀錄制;二是基于文語轉(zhuǎn)化(Text to Speech,TTS)的機械語音合成;三是AI語音合成,以自然語言處理技術(shù)(Natural Language Processing,NLP)為技術(shù)核心。從藝術(shù)創(chuàng)造性來看,單純地將既有文本經(jīng)由人聲朗讀、錄制或通過TTS技術(shù)、AI技術(shù)實現(xiàn)的有聲化,不被認為具有藝術(shù)創(chuàng)造性,且可能存在合成語音語流不暢等問題,而“TTS+AI”的組合則可以使得電子合成語音愈發(fā)自然和準確[22]。當然,注入配音演員或有聲錄制工作者的設(shè)計與巧思的有聲創(chuàng)作則具備了藝術(shù)性。作為數(shù)字出版領(lǐng)域的新業(yè)態(tài),數(shù)字人有聲閱讀是以特定數(shù)字人(形象)的音色進行配音、合成或朗讀制作的有聲內(nèi)容,而在讀者實際的有聲閱讀消費過程中,該數(shù)字人的視覺形象則可以不出現(xiàn)。
3.2 數(shù)字人有聲閱讀人機互動特征
人機交互是一個專注于計算機技術(shù)的設(shè)計和使用,并研究人與計算機之間界面的領(lǐng)域[23]。數(shù)字人有聲閱讀則進一步創(chuàng)設(shè)了屏幕交互界面之下的人機互動,并呈現(xiàn)出四個方面的人機互動特征:一是數(shù)字人與內(nèi)容文本并置,提高讀者對數(shù)字人的關(guān)注。在以往的閱讀體驗中,閱讀內(nèi)容的有聲化以文本為核心基礎(chǔ),而隨著配音等有聲創(chuàng)作的興起,有聲化的藝術(shù)性得到不斷加強,數(shù)字人有聲閱讀的內(nèi)容生產(chǎn)提升了數(shù)字人的“創(chuàng)作”主體地位,進而促進了讀者與數(shù)字人之間的相互關(guān)注和互動。二是優(yōu)質(zhì)人物設(shè)定(一般簡稱“人設(shè)”)與仿真聲音,優(yōu)化讀者閱讀體驗?;趯?shù)字人的人設(shè)打造不斷豐滿數(shù)字人的形象表征,使其成為某種優(yōu)質(zhì)形象的代言人,而基于AI語音合成技術(shù),數(shù)字人的聲音表達能力更加趨近于真人,聲音中的抑揚頓挫、情感表達也更加貼合文本敘事基調(diào)。三是強烈的對象感受,提供讀者情感投射標的。數(shù)字人從外在形象到聲音傳遞愈發(fā)趨于真實,使得閱讀的對象感不斷增強,為讀者的閱讀提供了情感互動可能。四是高度的聽覺沉浸,營造讀者可想象空間。數(shù)字人有聲閱讀以特定數(shù)字人為聲音的主體,雖然在實際的閱讀產(chǎn)品中,數(shù)字人一般不以視覺形象出現(xiàn),但讀者已經(jīng)預(yù)知了閱讀內(nèi)容的聲音主體來源,視覺的“退場”反而增強了閱讀的聽覺沉浸性,為讀者的數(shù)字人有聲閱讀消費提供了更大的內(nèi)容想象空間。
3.3 數(shù)字人有聲閱讀人機互動機制
如果將數(shù)字人有聲閱讀看作基于機器(技術(shù))驅(qū)動所開展的內(nèi)容生產(chǎn)模式,那么讀者進行有聲閱讀消費的過程實質(zhì)就是“人”與“機”的互動過程。由此,數(shù)字人有聲閱讀的人機互動機制也趨于明朗:其一,媒介延伸、鏈接人機并建構(gòu)可溝通的人機關(guān)系。從麥克盧漢“媒介即人的延伸”的論斷出發(fā),面對數(shù)字人已然步入人類社會的現(xiàn)實,可以進一步將媒介視為數(shù)字人的延伸。內(nèi)容媒介和媒介內(nèi)容共同搭建起人機互動通道,讀者的有聲閱讀消費過程也就是人與數(shù)字人以有聲讀物為中間環(huán)節(jié)而展開的人機接觸、溝通和關(guān)系建構(gòu)過程。其二,有聲閱讀消費創(chuàng)設(shè)人機互動場域。數(shù)字人有聲閱讀涉及讀者的內(nèi)容選擇、內(nèi)容閱讀及內(nèi)容批評(如評論留言、點贊、收藏、轉(zhuǎn)發(fā)分享等)多個環(huán)節(jié),而這一流程的推進正是基于有聲閱讀活動場域所開展的人機互動的具體實踐。其三,社交屬性能激發(fā)人機互動的情感轉(zhuǎn)向?!叭绻覀円蜋C器人共享現(xiàn)實,我們就必須將機器人的行為看作世界‘正常的部分,我們可以像對待其他人一樣對待它?!?sup>[24]數(shù)字人有聲閱讀行為開展的前提在于讀者允許數(shù)字人進入自己的情感世界,數(shù)字人有聲閱讀的實質(zhì)就是以人機互動為底層邏輯的情感互動。其四,情感滿足需要持續(xù)驅(qū)動人機互動實踐。數(shù)字人有聲閱讀所呈現(xiàn)的人機對話等人機互動模式塑造強烈的對象感受和情感投射,“這樣的人機對話也會向情感互動方向發(fā)展,即使機器的情感是模擬的、機械的,也會給人們帶來一定的滿足?!?sup>[25]因此,情感滿足的需要會驅(qū)動讀者持續(xù)進行有聲閱讀消費并開展人機互動行為。
4 基于人機關(guān)系的聲景沉浸與情感互動
有聲閱讀為讀者搭建了基于文本內(nèi)容的聲音景觀,營造了一種特有的聲音沉浸模式。聲音景觀(Soundscape)由穆雷·謝弗(R.Murray Schafer)提出,其聲景理論聚焦于聲音、聽者、環(huán)境三者的互動關(guān)系[26]?;趯?shù)字人有聲閱讀的人機互動特征和人機互動機制的分析可知,處于人機關(guān)系中的數(shù)字人有聲閱讀在聲景沉浸中建構(gòu)了從“人機互動”到“人機情感互動”再到“人機情感依戀”的互動程式。
4.1 聲景沉浸強化人機互動
時下,不少開車族喜歡使用演藝明星的語音導航,一方面是出于新奇,另一方面則是因為相較于軟件默認的機械合成語音,演藝明星的語音導航通過聲音聯(lián)結(jié)了明星本人,塑造了一種非具身的聲音在場,形成了行車環(huán)境沉浸中人機互動下的人人(導航語音所對應(yīng)的聲音主體)互動。同樣地,在數(shù)字人有聲閱讀建構(gòu)的聲景沉浸中,往往能基于人機互動生產(chǎn)人人(數(shù)字人指向的自然人,或被想象為自然人的數(shù)字人)互動的聽覺幻象。對讀者而言,相較于日常化的人際對話關(guān)系,數(shù)字人是一位“熟悉的陌生人”,在關(guān)閉或弱化視覺體驗的同時,聽覺感官的信息接收效果得到強化。數(shù)字人有聲閱讀的基礎(chǔ)形式仍然是“你講我聽”,但讀者可以進一步通過語音對話(提示)操作收聽界面、選擇聽閱內(nèi)容、參與有聲內(nèi)容書寫。由此來看,數(shù)字人有聲閱讀以聲音搭建了超越文本的直接互動,又去除了數(shù)字人影像技術(shù)形態(tài)可能存在的破綻,進而提供了更多讀者對于文本、聲音及數(shù)字人的可想象空間。
4.2 人機互動牽引情感互動
閱讀是一種文本與讀者雙向思想交流與情感互動的文化活動。在蘭德爾·柯林斯(Randall Collins)看來,情感能量是人類交流互動的核心要素,人們參與傳播的動機實質(zhì)上應(yīng)歸結(jié)于“情感能量的理性選擇”,互動儀式的參與者在關(guān)注點與情感的相互連帶中,能夠產(chǎn)生一種共享的情感體驗與身份認同,進而形成新的社會定位與社會形象[27]。在數(shù)字人有聲閱讀活動中,既發(fā)生著讀者與文本的互動,也發(fā)生著讀者與數(shù)字人的互動。其核心動機來源于讀者對于有聲內(nèi)容的興趣選擇,又交織著讀者對于特定數(shù)字人的個性化偏好,其皆指向閱讀活動對讀者的情感牽引調(diào)動。讀者的內(nèi)容選擇既涉及讀者主動通過關(guān)鍵詞檢索進行的閱讀產(chǎn)品選擇,也包含平臺基于算法的閱讀內(nèi)容推薦。隨著數(shù)字人與GPT等大模型相結(jié)合,當讀者的需求提示進一步限定,由數(shù)字人提供及基于數(shù)字人創(chuàng)作的閱讀內(nèi)容都將更契合讀者的情感偏好。“多樣的情感形式誕生于身體的感觸經(jīng)驗,因際遇不同,情感總在悲苦與快樂間變化流轉(zhuǎn),這種情感的流變即是‘情動?!?sup>[28]在閱讀活動中,情動的發(fā)生鏈接讀者與數(shù)字人的情感互動,而這種互動更大程度上隱藏于內(nèi)容文本之下,在最初不為讀者所察覺。
4.3 情感互動催生情感依戀
持續(xù)的情感互動催生情感依戀?!扒楦幸缿佟保‥motional Attachment)作為心理學范疇的概念,由英國心理學家約翰·鮑比(John Bowlby)基于依戀理論提出。情感依戀起初用來解釋嬰兒與其養(yǎng)護者之間的親密聯(lián)系,后來被引入到管理學、消費者行為學、社會學等領(lǐng)域,強調(diào)消費者與特定消費對象(產(chǎn)品、品牌、企業(yè)等)之間形成的涵蓋認知、情感特性的心理紐帶和行為反應(yīng)[29]。數(shù)字人有聲閱讀既是一種文化活動,也是一種文化消費實踐,讀者之所以愿意持續(xù)這種消費行為,其情感本質(zhì)上反映的是讀者對于特定數(shù)字人的依戀。正如馬庫斯·沃爾法伊爾(Markus Wohlfeil)關(guān)于消費文化中的名人與粉絲的闡釋,“戀慕作為私人的名人”反映了粉絲對在媒體焦點外作為真實人類過著私人生活的影星或其他名人的情感依戀[30]。他們將數(shù)字人想象為真實存在的自然人,乃至形成對于有聲閱讀中數(shù)字人的粉絲式追隨。
5 數(shù)字人有聲閱讀的可能關(guān)切
信息傳播的數(shù)字化令數(shù)字人有聲閱讀內(nèi)容生產(chǎn)和閱讀消費搭上了“數(shù)字便車”,使得數(shù)字人在有聲閱讀活動中的存在感不斷增強。但是,其也可能引致讀者對于數(shù)字對象的依戀、虛擬伴讀的依賴和碎片化閱讀的沉溺,以及對于數(shù)字人的粉絲式追隨,這都是數(shù)字人有聲閱讀中需要加以重視的環(huán)節(jié)。應(yīng)當明確其中的文化需求,加強觀照應(yīng)對,從而使數(shù)字人有聲閱讀不脫離信息內(nèi)容服務(wù)、知識傳習和文化傳播的本質(zhì)要義。
5.1 正視數(shù)字對象依戀
如前所述,讀者在數(shù)字人有聲閱讀過程中,基于聲音的傳介生成了對于特定數(shù)字人的個性化想象,并在聲景沉浸和有聲會話過程中持續(xù)修正或深化這種個人專屬式的想象。一般的有聲閱讀主要體現(xiàn)的是讀者對文本內(nèi)容的偏好,當然其中也有對于配音演員、內(nèi)容主播或行業(yè)專家、文化學者的追捧,在這樣的有聲內(nèi)容產(chǎn)品背后,是實在的、具身化的自然人。
而一定程度上,數(shù)字人有聲閱讀則將數(shù)字人引向具體文本,與文本內(nèi)容并置、共在。在此情況下,讀者對于數(shù)字人有聲閱讀的消費實踐可能超越了對于內(nèi)容的需求,更表現(xiàn)為對數(shù)字人的對象化依戀。具體而言,數(shù)字人有聲閱讀在使得視覺感官暫時“退場”的同時,提供并放大了讀者對于數(shù)字人人設(shè)基礎(chǔ)上的個人想象,數(shù)字人成了讀者戀慕的對象。因此,需要正視讀者的數(shù)字對象依戀,把握其中的平衡點。一方面,不可否認其促進了讀者的有聲閱讀消費,滿足了讀者的文化需求。而另一方面,讀者持續(xù)的有聲閱讀消費不斷具象化對于數(shù)字人的想象,深化對數(shù)字對象的依戀,則可能忽視了文本的重要性,乃至模糊了數(shù)字人與自然人的情感真實。
5.2 抽離虛擬伴讀依賴
如同收音機時代的廣播節(jié)目給人以溫情陪伴,有聲閱讀既能復刻收音機式的陪伴,又可以憑借聲景打造沉浸式的聽閱體驗,在剝離視覺文化霸權(quán)主義的同時,給讀者創(chuàng)造了更多與內(nèi)容相關(guān)聯(lián)的想象空間。如此,可以牽動閱讀主體更多的主動思考,讀者對于有聲內(nèi)容產(chǎn)品的情感依賴更深,驅(qū)動閱讀趣緣社群的形成,讀者與有聲閱讀內(nèi)容的契合度及讀者群體之間的緊密性也就更高。在此基礎(chǔ)上,數(shù)字人有聲閱讀進一步強化了虛擬伴讀體驗,正如番茄閱讀上線的數(shù)字人“番卷卷”,其擅長推書、幫助讀者催更,乃至在和讀者共讀的過程中可以根據(jù)閱讀內(nèi)容實時呈現(xiàn)相應(yīng)表情,營造了強烈的閱讀陪伴感受。
然而,這也可能導致讀者自主文字閱讀能動性的消減,對于虛擬伴讀的依賴增強,不益于讀者的知識習得等基礎(chǔ)能力的培養(yǎng)。故需引導讀者抽離這種虛擬伴讀依賴,有聲閱讀平臺的陪伴式閱讀體驗的營造亦需考量讀者的接受閾值,既要為讀者提供更優(yōu)質(zhì)的聽閱體驗,又要避免形成程式依賴。
5.3 消解碎片閱讀沉溺
就整體出版行業(yè)來看,相較于實體書閱讀,數(shù)字閱讀特別是有聲閱讀的“聽書”方式更符合人們在碎片化時間的實際文化消費需求。數(shù)字閱讀使得實體書方寸隱于無形,一“屏”在手,既無需額外負重,也不必疲于翻動書頁。而有聲閱讀更進一步解放了雙眼,人們可以在更加碎片化的時間內(nèi)開展閱讀活動。
不過,有聲閱讀看似從空間與時間的雙維中解放了雙眼和雙手,卻也降低了文字性的閱讀接受,以碎片化形式進行數(shù)字人有聲閱讀容易僅成為一種娛樂行為,同時也容易使人們產(chǎn)生碎片閱讀沉溺,難于花費更長時間沉靜地開展閱讀,無法達成深閱讀式的知識學習效用。因此,做好有聲讀物的內(nèi)容把關(guān)、產(chǎn)品質(zhì)量提升和深化閱讀接受同樣重要。消解碎片閱讀沉溺,避免讀者慣于以碎片化的方式進行有聲閱讀,從而不背離閱讀的本質(zhì)價值,讓有聲閱讀不僅僅成為一種娛樂式的消遣活動,而是讓讀者讀一頁有一頁的意義,聽一分鐘有一分鐘的體悟,并愿意持續(xù)將閱讀進行下去。
5.4 跳脫粉絲文化泥淖
從虛擬歌姬“初音未來”,到虛擬歌手、虛擬偶像“洛天依”,再到文旅機構(gòu)、電視臺、互聯(lián)網(wǎng)平臺等推出的各式各樣的數(shù)字人,其人設(shè)塑造近趨完美。數(shù)字人憑借優(yōu)質(zhì)形象,或是成為文化藝術(shù)產(chǎn)品、文旅服務(wù)的代言人,或是為商業(yè)活動站臺背書,能夠在更短時間內(nèi)收獲大量關(guān)注,并且相較于真人演藝明星的出場成本更低,對于現(xiàn)有的二次元深度用戶也會產(chǎn)生更大的吸引力。
但是在數(shù)字人井噴的現(xiàn)實情況下,對于數(shù)字人的無限度追捧將催生用戶的粉絲式消費,或?qū)⒅率埂帮埲Α蔽幕浦踩霐?shù)字人圈層。雖然打榜、做數(shù)據(jù)、控評等粉絲經(jīng)濟行為表面上使得數(shù)字人產(chǎn)業(yè)愈加蓬勃,但用戶可能跌入粉絲文化泥淖,這是在數(shù)字人明星化日趨火熱的現(xiàn)實下必須重點關(guān)注的環(huán)節(jié)。進而言之,對于數(shù)字人有聲閱讀,或者說對于閱讀活動而言,跳脫粉絲文化泥淖,才可使得閱讀的本質(zhì)要義不被遮蔽。
6 結(jié)語
在技術(shù)的升級迭代和消費終端的持續(xù)普及之下,數(shù)字人有聲閱讀的聲音塑造和內(nèi)容呈現(xiàn)將更加符合人們的聽覺審美和自然感受,憑借更低成本、更高生產(chǎn)效率和更便捷的消費形式,其將成為數(shù)字閱讀的全新趨向。當然,數(shù)字人有聲閱讀內(nèi)容生產(chǎn)、傳播、消費的核心導向仍然是信息內(nèi)容和文化知識的服務(wù)和接受。數(shù)字人有聲閱讀提供了數(shù)字社會閱讀的全新形態(tài),但是新事物可能帶來的新問題也需要得到充分關(guān)注。應(yīng)當切實重視深度媒介化社會之中大眾閱讀消費活動面臨的人機關(guān)系應(yīng)對和數(shù)字交往平衡問題。有聲出版主體一要堅守有聲閱讀產(chǎn)品生產(chǎn)的初心,始終堅持把社會效益放在首位;二要重點把關(guān)有聲閱讀產(chǎn)品中數(shù)字人的積極形象塑造和文化價值引領(lǐng);三要借力發(fā)行營銷有意識地引導人們在數(shù)字世界的健康交往行為,營造風清氣正的數(shù)字文化空間。
未來,人與數(shù)字人的共生不無可能,構(gòu)建健康的人機關(guān)系,方能實現(xiàn)有聲閱讀內(nèi)容文化性和藝術(shù)性的充分呈現(xiàn)和傳播,進一步促進數(shù)字人有聲閱讀等數(shù)字文化新業(yè)態(tài)的創(chuàng)新增長,為廣大讀者在數(shù)字交往環(huán)境下提供更多供需匹配的優(yōu)質(zhì)文化產(chǎn)品和服務(wù)。
作者簡介
林一民,男,華東師范大學傳播學院(出版學院)博士研究生。研究方向:數(shù)字閱讀與文化產(chǎn)業(yè)。
鄧香蓮,女,博士,華東師范大學傳播學院(出版學院)教授。研究方向:國民閱讀、數(shù)字出版與新媒體傳播。
參考文獻
[1]鐘世鎮(zhèn).數(shù)字人:信息與生命科學結(jié)合的新領(lǐng)域[J].科技導報,2005(2):9-12.
[2]佩森.6億估值:超寫實數(shù)字人AYAYI從創(chuàng)意到資本的商業(yè)版圖[EB/OL].(2021-10-30)[2023-09-09].https://zhuanlan.zhihu.com/p/427462942.
[3]中國出版?zhèn)髅缴虉?首個AI閱讀服務(wù)數(shù)字人誕生,20多家出版單位已展開應(yīng)用[EB/OL].(2023-05-04)[2023-09-18]. https://www.sohu.com/a/672788413_121418230.
[4]36氪.小說搭子已上線,數(shù)字人的A面與B面[EB/OL].(2023-08-25)[2023-09-19].https://new.qq.com/rain/a/20230825A083AC00.
[5]阮云星,梁永佳,高英策.賽博格人類學:全球研究檢視與當代范式轉(zhuǎn)換[M].杭州:浙江大學出版社,2021:234-235.
[6]孫瑋.賽博人:后人類時代的媒介融合[J].新聞記者,2018(6):4-11.
[7]沈浩,劉亭利.虛實共融,若即若離:全面進擊的虛擬數(shù)字人[J].視聽界,2022(3):5-10.
[8]郭全中.虛擬數(shù)字人發(fā)展的現(xiàn)狀、關(guān)鍵與未來[J].新聞與寫作,2022(7):56-64.
[9]張莉.移動有聲閱讀場景分類與場景應(yīng)用路徑探析[J].出版科學,2020,28(2):103-107.
[10]趙光敏.兒童有聲閱讀的發(fā)展現(xiàn)狀與改進策略[J].上海教育科研, 2021(8):62-66.
[11]徐佳.有聲閱讀作為彌合視障人群數(shù)字鴻溝的場景研究:政策、技術(shù)與法律、市場[J].中國出版,2021(17):55-59.
[12]尚碩彤.公共圖書館有聲閱讀資源建設(shè)及推廣策略探究[J].出版廣角,2020(15):86-88.
[13]鄧香蓮.新媒體環(huán)境下大學生有聲閱讀行為特征研究:以上海大學生為例[J].圖書情報知識,2018(5):81-94.
[14]尹章池,徐景熙.高校學生有聲閱讀行為特征及其有聲閱讀推廣策略研究:基于SPSS統(tǒng)計數(shù)據(jù)分析[J].傳播與版權(quán),2023(3): 43-46.
[15]韓生華,鄭東和,李易蓉.可用性理論視角下有聲閱讀APP用戶體驗及發(fā)展策略探析[J].中國出版,2023(6):24-29.
[16]沈悅,金圣鈞.智媒時代有聲出版的作用機理及優(yōu)化路徑[J].中國編輯,2022(11):86-91.
[17]朱赫男,王鵬濤.聲音回歸與“理想聽者”:流動空間中有聲書敘事模式優(yōu)化研究[J].現(xiàn)代出版2023(5):103-112.
[18]李雅箏,劉宇星.AIGC技術(shù)賦能數(shù)字音頻內(nèi)容生產(chǎn):應(yīng)用場景、存在問題與應(yīng)對策略[J].數(shù)字出版研究,2023,2(3):13-20.
[19]陳陽,李宛真,張喆喆.數(shù)字新聞消費與人機關(guān)系:一項關(guān)于閱讀機器人新聞的在線實驗[J].新聞記者,2023(8):40-50,85.
[20]張藍姍,蔣亞娟.智能時代的電視社交化演進:人機分離、人機互動到人際交往[J].現(xiàn)代傳播(中國傳媒大學學報),2021,43(6):163-168.
[21]郭嘉.虛擬數(shù)字人在圖書出版領(lǐng)域的多元身份構(gòu)建研究[J].科技與出版,2022(8):56-63.
[22]李武,謝澤杭,楊飛.AI有聲書:價值優(yōu)勢與未來進路[J].科技與出版,2023(6):41-47.
[23]TABONE W, DE WINTER J. Using ChatGPT for human-computer interaction research: A primer[J].Royal Society Open Science,2023,10(9):231053.
[24]何雙百.“機器同伴”:新型親密關(guān)系下的“人機共情”現(xiàn)象思考[J].西南民族大學學報(人文社會科學版),2021,42(7):185-192.
[25]彭蘭.新“個人門戶”與智能平臺:智能時代互聯(lián)網(wǎng)發(fā)展的可能走向[J].新聞界,2023(9):1-12.
[26]侯丹丹.從電影聲景到聲景電影:基于聲景理論的電影聲音探究[J].電影文學,2023(12):47-52.
[27]吳迪,嚴三九.網(wǎng)絡(luò)亞文化群體的互動儀式鏈模型探究[J].現(xiàn)代傳播(中國傳媒大學學報),2016,38(3):17-20.
[28]汪民安.何謂“情動”?[J].外國文學,2017(2):113-121.
[29]沈鵬熠,李金雄,萬德敏.“以情動人”還是“以理服人”?人工智能聊天機器人角色對顧客情感依戀的影響研究[J/OL].南開管理評論:1-20.
[30]馬庫斯·沃爾法伊爾.消費文化中的名人與粉絲[M].劉津,譯.北京:社會科學文獻出版社,2022:232.
Voice from Digital Human: Human-Machine Interaction, Emotional Attachment and Possible Concerns in Audio Reading
LIN Yimin, DENG Xianglian
School of Communication (School of Publishing), East China Normal University, 200241, Shanghai, China
Abstract: The innovation and development of information and communication technology has shaped a new paradigm of digital communication in human society and promoted the new form of digital human to enter a new field of cultural and tourism consumption. Based on investigation of the technical mechanism of digital human audio reading content production and the characteristics and mechanism of human-machine interaction, it was found that digital human audio reading in human-machine relationship constructed an interactive paradigm from “human-machine interaction” to “human-machine emotional interaction” and then to “human-machine emotional attachment” in immersion of soundscape. At the same time, digitalization worries were also generated. Attention and response to possible problems such as digital object attachment, virtual companion reading dependence, fragmented reading addiction and fan culture quagmire should be developed to build a healthy human-machine relationship, so that digital human audio reading could be able to reach the essence of information content service, knowledge transmission and cultural communication.
Keywords: Digital human; Audio reading; Human-machine interaction; Emotional interaction; Emotional attachment