內(nèi)容提要:論文以“清穿文”這一網(wǎng)絡(luò)文學(xué)類型及其主要發(fā)表平臺(tái)晉江文學(xué)城為例,討論了從數(shù)字人文的理論視野出發(fā)開展網(wǎng)絡(luò)文學(xué)研究的可行性與必要性。分析了包括文學(xué)網(wǎng)站積分榜單計(jì)算公式在內(nèi)的網(wǎng)絡(luò)文學(xué)生產(chǎn)機(jī)制與數(shù)字人文思維之間纏繞共生的關(guān)系,由此指出相關(guān)研究工具的匱乏和數(shù)據(jù)資料庫(kù)的缺失。為了加強(qiáng)理論自覺,推進(jìn)學(xué)科建設(shè),當(dāng)前最迫切的工作,就是盡快開發(fā)具有針對(duì)性的研究工具,以及建設(shè)完善一個(gè)學(xué)術(shù)向的網(wǎng)絡(luò)文學(xué)資料數(shù)據(jù)庫(kù),抓緊搜集、保存現(xiàn)有的各種研究資料。
當(dāng)我們借助數(shù)字人文(Digital Humanities)的研究方法與問題意識(shí),去審視中國(guó)網(wǎng)絡(luò)文學(xué)的創(chuàng)作實(shí)踐,自不難發(fā)現(xiàn)二者之間客觀存在的適配性:網(wǎng)絡(luò)文學(xué)天然是數(shù)字人文的,它的整套生產(chǎn)機(jī)制,都是在互聯(lián)網(wǎng)這個(gè)數(shù)字媒介的環(huán)境之中,伴隨著數(shù)字技術(shù)的發(fā)展逐步確立并不斷更新的。
這事實(shí)上意味著,從數(shù)字人文的角度介入網(wǎng)絡(luò)文學(xué)研究,并不僅僅只是“可能的選項(xiàng)”,而理應(yīng)成為某種不可或缺的、內(nèi)在化的思維范式。由此反觀當(dāng)前網(wǎng)絡(luò)文學(xué)的前沿研究,如圍繞生產(chǎn)機(jī)制、粉絲社群文化的研究,又或是對(duì)類型文的研究(目前的方法主要是脈絡(luò)梳理+經(jīng)典文本細(xì)讀)等,如能被納入數(shù)字人文的理論框架,必將打開一重全新的視野。同時(shí),過往研究之中客觀存在的諸多困境,以及若干難以落實(shí)的推論,也有望運(yùn)用數(shù)字人文的工具、方法得到解決。當(dāng)然,更重要的是,在數(shù)字人文的思維模式下,還可能提出以當(dāng)下的研究視域很難預(yù)見的新問題。
為避免討論過于抽象,本論將以圍繞“清穿文”及其主要發(fā)表平臺(tái)晉江文學(xué)城①(以下簡(jiǎn)稱“晉江”)的研究為例,具體地闡釋數(shù)字人文的理論與方法介入網(wǎng)絡(luò)文學(xué)研究的可能性、面臨的困局以及解決的途徑。
“清穿文”是流行于網(wǎng)絡(luò)文學(xué)發(fā)展初期(2004—2007)的一個(gè)非常重要的創(chuàng)作潮流和子類型,通常描寫現(xiàn)代女性穿越②到清朝,與阿哥、親王們(或別的王公大臣、貴族子弟)戀愛的言情小說。其肇始之作,是2004年7月開始連載于晉江原創(chuàng)網(wǎng)③的《夢(mèng)回大清》(金子),與它齊名的作品,還包括《步步驚心》(桐華,晉江原創(chuàng)網(wǎng),2006)和《瑤華》(晚晴風(fēng)情,晉江原創(chuàng)網(wǎng),2006),即所謂的“清穿三座大山”。
中文學(xué)界對(duì)穿越/清穿小說的廣泛關(guān)注,大約始于2011年,即《步步驚心》電視劇熱播之后。這顯然是一種回溯性的肯定,遠(yuǎn)遠(yuǎn)晚于清穿文在網(wǎng)絡(luò)文學(xué)界內(nèi)部的流行,甚至也晚于影視資本對(duì)它的挖掘??紤]到文學(xué)網(wǎng)站通常為UGC(User Generated Content,用戶生產(chǎn)內(nèi)容)架構(gòu),刊載的作品均由用戶自主上傳,近乎于零門檻,印刷文明時(shí)代那種以編輯、學(xué)者為中心的、精英化的遴選機(jī)制,自然也就無從談起。海量文本泥沙俱下,清穿文卻在浩如煙海的網(wǎng)絡(luò)言情小說之中自成脈絡(luò),《步步驚心》也迅速脫穎而出,成為最受矚目的代表作。這便足以證明,在網(wǎng)絡(luò)文學(xué)的生產(chǎn)機(jī)制和閱讀反饋機(jī)制內(nèi)部,是存在著某種評(píng)判作品優(yōu)劣的標(biāo)準(zhǔn)以及相應(yīng)的推介渠道的。
這些標(biāo)準(zhǔn)和渠道的具象化,就是文學(xué)網(wǎng)站上常見的各類積分榜單。盡管不同網(wǎng)站內(nèi)部的榜單設(shè)置也不盡相同,但核心思路都是依據(jù)某種算法規(guī)則④,將網(wǎng)站上刊載的所有作品按照點(diǎn)擊量、付費(fèi)訂閱量或好評(píng)率等標(biāo)準(zhǔn)進(jìn)行量化排序。
參見晉江文學(xué)城頒布于2005年3月2日(正是清穿文最為流行的時(shí)期)的一版積分計(jì)算公式⑤:
全文點(diǎn)擊數(shù)/章節(jié)數(shù)×Ln(全文字?jǐn)?shù))×平均打分+(Ln(書評(píng)字?jǐn)?shù))×?xí)u(píng)打分)之和+精華書評(píng)特別加分
不難看出,在上述公式中,能影響到作品積分的系數(shù)主要包括三類:第一類是作品本身的客觀數(shù)據(jù),如全文字?jǐn)?shù);第二類則是對(duì)讀者瀏覽、評(píng)價(jià)作品的行為進(jìn)行的量化與賦值,如全文點(diǎn)擊數(shù)、書評(píng)字?jǐn)?shù)和平均打分等;第三類是網(wǎng)站編輯對(duì)作品的獎(jiǎng)勵(lì)和推薦,如精華評(píng)論特別加分。⑥套用這個(gè)公式計(jì)算出的最終數(shù)值,即一部小說的“作品積分”,是晉江在排列各種推薦榜單時(shí)的重要參考依據(jù),對(duì)于總分排行榜、半年榜、月榜和新晉作者榜等榜單而言⑦,甚至是唯一的依據(jù)。這些通過積分排序篩選出的作品,通常都是同時(shí)期最優(yōu)秀、最受歡迎的,而有幸登上榜單頁(yè)面,顯然也會(huì)為它們帶來更多實(shí)體出版和影視改編的機(jī)會(huì)。“清穿三座大山”早年間都曾是榜單上的??汀?/p>
相比起印刷文明時(shí)代的編輯審稿制和學(xué)院體系內(nèi)的精英批評(píng)話語(yǔ),文學(xué)網(wǎng)站訴諸積分算法,雖然的確是將選擇、評(píng)價(jià)一部小說的權(quán)力讓渡給了讀者⑧,卻也絕非僅止于此。最為關(guān)鍵的秘密,其實(shí)就隱藏在公式之中:盡管每位用戶(包括讀者和作者)的行為(點(diǎn)擊、寫書評(píng))與喜惡(打正分或負(fù)分),都經(jīng)由相對(duì)客觀、固定的渠道轉(zhuǎn)化成了數(shù)據(jù),但總積分?jǐn)?shù)值的輸出,卻是糅合了網(wǎng)站自身利益與傾向的加權(quán)計(jì)算。也就是說,雖然對(duì)小說的點(diǎn)擊和評(píng)分是由讀者決定的,每一章寫多少字是由作者決定的,但這些字?jǐn)?shù)、點(diǎn)擊和評(píng)分的數(shù)值最終能在多大程度上影響總積分的大小,卻是由文學(xué)網(wǎng)站決定的。通過調(diào)整算法,網(wǎng)站就能將當(dāng)下的運(yùn)營(yíng)理念貫徹到這個(gè)龐然大物的每一根毛細(xì)血管里。譬如,在晉江頒布于2016年的新版積分公式之中,就新增了作者簽約年限和版權(quán)授權(quán)狀況等系數(shù),這顯然是在當(dāng)時(shí)IP(Intellectual Property)運(yùn)營(yíng)熱潮的推動(dòng)下做出的修訂。⑨
晉江推出這套積分計(jì)算公式的根本目的,一方面是對(duì)讀者的閱讀時(shí)間、審美能力和判斷力加以征用,把原本由個(gè)別編輯、學(xué)者承擔(dān)的遴選任務(wù)分?jǐn)偨o每個(gè)用戶,對(duì)站內(nèi)數(shù)量龐大的小說展開地毯式摸底與分揀,為網(wǎng)站后續(xù)的版權(quán)運(yùn)營(yíng)工作(如洽談實(shí)體出版、售賣影視改編權(quán)等)提供依據(jù);另一方面,也是在利用算法引導(dǎo)和控制用戶的行為。事實(shí)證明,這種控制和引導(dǎo)是行之有效的:作者要想迅速提升人氣、嶄露頭角,就不免對(duì)積分規(guī)則多加鉆研,保持穩(wěn)定更新⑩;讀者為了支持自己喜歡的作者和作品,也會(huì)積極地、反復(fù)地進(jìn)行評(píng)論、點(diǎn)擊或打賞。[11]這些行為的最終結(jié)果,均為網(wǎng)站帶來了更多的流量和銷售額。除此之外,網(wǎng)站編輯往往也會(huì)通過參考積分?jǐn)?shù)值的變化,掌握并管理作者的創(chuàng)作情況。
盡管在積分計(jì)算公式的字里行間,的確暗含著網(wǎng)站對(duì)用戶的隱性剝削,但這僅僅是硬幣的一面,因?yàn)橛脩粢餐耆梢酝ㄟ^理解規(guī)則、利用規(guī)則來影響某部作品的積分,甚至于網(wǎng)站的決策。透過這行短短的積分計(jì)算公式,折射出的,是一個(gè)小型“文學(xué)場(chǎng)”內(nèi)部的各方博弈。其中,居于核心位置的公式,固然是在建構(gòu)階序(受歡迎的優(yōu)秀作品和平庸的、失敗的作品),卻也同時(shí)設(shè)定了規(guī)則與玩法。例如“平均打分”這個(gè)系數(shù),指的就是讀者對(duì)小說各個(gè)章節(jié)打出的所有評(píng)分的平均值,實(shí)際可選分值從正2分到負(fù)2分不等。這類口碑評(píng)價(jià)體系在互聯(lián)網(wǎng)行業(yè)并不罕見,豆瓣、大眾點(diǎn)評(píng)和滴滴打車等網(wǎng)站或應(yīng)用中,都包含這項(xiàng)功能。然而大多數(shù)文學(xué)網(wǎng)站,例如閱文系尤其是起點(diǎn)中文網(wǎng)(以下簡(jiǎn)稱“起點(diǎn)”),似乎還是更看重點(diǎn)擊、收藏[12]和訂閱這些實(shí)打?qū)嵉目陀^數(shù)據(jù),允許讀者對(duì)作品進(jìn)行評(píng)分并將其納入積分算法的主流文學(xué)網(wǎng)站,其實(shí)只有晉江。
乍看上去,打分畢竟是一種主觀好惡,似乎容易影響榜單的客觀性。但對(duì)于晉江這樣一個(gè)深耕粉絲文化的“女性向”[13]文學(xué)網(wǎng)站而言,卻有著獨(dú)特的意義。作為一種細(xì)水長(zhǎng)流的日常操作,針對(duì)每一章更新進(jìn)行的打分,顯然更容易在讀者和作者之間建立起深厚的羈絆關(guān)系。不僅如此,該評(píng)分系統(tǒng)的特殊之處還在于,它是可以打出負(fù)值的。這是一種暗含著攻擊性的設(shè)置,它意味著,晉江的用戶完全可以通過打負(fù)分,甚至是大量“刷負(fù)分”的操作,來降低一部作品的積分和排名。而相比之下,起點(diǎn)的用戶卻不可能通過任何操作削減作品的積分,而最多只能“還原”,例如取消之前的訂閱或收藏等。不同的規(guī)則也導(dǎo)向了不同的行為模式,在晉江,由于負(fù)分的存在,批判性的審美判斷、個(gè)人情緒的發(fā)泄甚至有組織的抵制行為,都成為可能。不同粉絲團(tuán)體(包括作者粉、作品粉等)之間的相互攻訐、黨同伐異,也往往通過“刷負(fù)分”來達(dá)成。[14]這正是當(dāng)前“女性向”網(wǎng)絡(luò)文學(xué)社群的基本生態(tài),它參差多變、難以一言蔽之,卻始終與網(wǎng)站算法互為因果,環(huán)環(huán)相扣。
文學(xué)網(wǎng)站本質(zhì)上屬于互聯(lián)網(wǎng)公司,甚至普遍具有游戲公司的背景,將算法視為指導(dǎo)網(wǎng)站運(yùn)營(yíng)的依據(jù)和建構(gòu)社群文化(企業(yè)文化)的基礎(chǔ),是很值得理解的策略。因?yàn)樗@然遵循著互聯(lián)網(wǎng)產(chǎn)品運(yùn)營(yíng)的基本邏輯,所能舉出的例子也絕不僅僅是前面列出的那些。[15]
上述一系列事實(shí),集中體現(xiàn)了數(shù)字媒介和數(shù)字技術(shù)對(duì)傳統(tǒng)人文學(xué)科的重要研究領(lǐng)域之一——文學(xué)——的生產(chǎn)機(jī)制的深度重構(gòu)。歸根結(jié)底,這種依靠積分算法評(píng)判作品優(yōu)劣、篩選人氣作品的機(jī)制,無論創(chuàng)造它的人是否有此自覺,但本質(zhì)上都是數(shù)字人文思維的產(chǎn)物。同理,當(dāng)這種數(shù)據(jù)化的、新媒體運(yùn)營(yíng)的理念開始與文學(xué)的創(chuàng)作、接受和傳播等各個(gè)環(huán)節(jié)緊密纏繞,直面這一新興文化現(xiàn)象的網(wǎng)絡(luò)文學(xué)研究者,只要曾經(jīng)直接深入網(wǎng)絡(luò)文學(xué)生產(chǎn)機(jī)制的內(nèi)部,那么無論自覺還是不自覺,他其實(shí)已經(jīng)在進(jìn)行著某種數(shù)字人文式的研究了。
眾所周知,數(shù)字人文研究起源于文獻(xiàn)典籍的數(shù)字化與數(shù)據(jù)庫(kù)化。然而經(jīng)過本節(jié)的討論,我們幾乎可以肯定,與必然需要經(jīng)歷數(shù)字化與數(shù)據(jù)庫(kù)化步驟的傳統(tǒng)人文學(xué)科不同,網(wǎng)絡(luò)文學(xué)的起點(diǎn),就是數(shù)字人文。甚至可以說,越是貼近網(wǎng)絡(luò)文學(xué)生產(chǎn)機(jī)制內(nèi)核的研究,就越和數(shù)字人文研究殊途同歸。而研究網(wǎng)絡(luò)文學(xué)的生產(chǎn)機(jī)制,也未嘗不能是研究數(shù)字人文本身。
盡管網(wǎng)絡(luò)文學(xué)與數(shù)字人文之間的聯(lián)系是如此緊密,但現(xiàn)有的適用于中文文本的數(shù)字人文研究工具和項(xiàng)目,顯然都不是針對(duì)網(wǎng)絡(luò)文學(xué)作品的研究需求開發(fā)的。以數(shù)字人文研究平臺(tái)Docusky[16]為例,該平臺(tái)所提供的半自動(dòng)標(biāo)記工具包含有多種功能:有的可以為研究者上傳的文檔標(biāo)注人名、地名、年代及官名,這無疑有助于古典文獻(xiàn)的分析和整理;有的能標(biāo)記小說中出現(xiàn)的對(duì)話的參與者、類別和次數(shù)等,對(duì)解讀長(zhǎng)篇小說的劇情走向及人物性格具有一定的參考價(jià)值;還有詞頻統(tǒng)計(jì)這個(gè)常見功能,可用于分析某個(gè)作者的用詞偏好、寫作習(xí)慣或者以關(guān)鍵詞為依據(jù)分析人文思潮的變遷等。
然而這些常規(guī)的分析工具對(duì)于網(wǎng)絡(luò)文學(xué)作品的研究而言,卻起不到太大的助益。網(wǎng)絡(luò)小說不同于古典文獻(xiàn),以幻想題材居多,標(biāo)記人名、地名本無太大意義;并且相對(duì)于劇情、人物性格等要素,類型和結(jié)構(gòu)的流變才是更為核心的問題;此外,網(wǎng)絡(luò)文學(xué)研究對(duì)具體某位作者的遣詞造句和寫作風(fēng)格也并不是特別關(guān)注。
如此看來,著眼于網(wǎng)絡(luò)文學(xué)作品的研究需求搜尋和開發(fā)更為恰當(dāng)?shù)姆治龉ぞ?,就成了?dāng)務(wù)之急??晒╅_拓的方向大致有以下幾種。
首先是能針對(duì)不同類型的網(wǎng)文,提煉出它們的敘事結(jié)構(gòu)的分析工具。長(zhǎng)篇類型小說在網(wǎng)絡(luò)文學(xué)中占據(jù)著非常顯著的位置,其最大的特征就是類型化,同類型的小說在敘事結(jié)構(gòu)和風(fēng)格上高度近似,而各大主流類型本身,又都是在復(fù)雜的演化、融合的過程中慢慢成型的。
“清穿文”就是一個(gè)非常典型的例子。作為穿越文中知名度最高的一個(gè)子類型,這批作品的故事背景和人物形象多取材于20世紀(jì)末21世紀(jì)初熱播的一批清宮劇,特別是《雍正王朝》。因受其影響,相當(dāng)一部分“清穿文”都將時(shí)間跨度設(shè)定在了康熙四十年左右至雍正繼位初期。如果我們將這批“清穿文”匯總到一處,再把每本書都提到過的關(guān)鍵性歷史節(jié)點(diǎn)標(biāo)記出來,例如康熙四十七年廢太子、或者康熙駕崩雍正繼位等,據(jù)此拉出一條公共的時(shí)間軸。再以這條時(shí)間軸為參照系,把每一部“清穿文”的劇情一層一層地疊加在這個(gè)時(shí)間軸上,凡遇到發(fā)生沖突的情況,例如有些小說里女主選上了秀女,有些小說則沒選上,就畫出分叉的兩條線索,以此類推。那么不難想象,最終形成的劇情流程總圖,就會(huì)像是一條從康熙四十年發(fā)源的長(zhǎng)河,先是迅速分裂出無數(shù)條平行的支流,偶爾收束,再分流,然后不斷向著雍正初年的入??诒加慷?。如果這些繁復(fù)而又有序的變化能通過工具批量化地加以處理并可視化,必將對(duì)“清穿文”的結(jié)構(gòu)類型分布做出更為全面的總結(jié)與展示。
其次可以考慮開發(fā)的,是提取小說主要角色的萌要素的分析工具。所謂“萌要素”[17],是日本學(xué)者東浩紀(jì)在其專著《動(dòng)物化的后現(xiàn)代》中提出的概念。特指ACG[18]作品中某些與角色形象相關(guān)的,風(fēng)格化、類型化的元素,包括著裝(水手服、女仆裝等)、發(fā)型(雙馬尾、黑色長(zhǎng)直發(fā)等)或性格特征(傲嬌、天然呆等)等。[19]東浩紀(jì)認(rèn)為,1990年代中期以后的日本御宅族[20]群體,由于身處后現(xiàn)代語(yǔ)境之中,早已不再執(zhí)著于作品背后的宏大敘事,轉(zhuǎn)而開始關(guān)注具體角色身上所攜帶的,能夠喚起讀者強(qiáng)烈愛意的“萌要素”。與這一趨勢(shì)相呼應(yīng),ACG作品中的角色,也逐漸轉(zhuǎn)變?yōu)楦鞣N萌要素拼貼、集合與再循環(huán)的產(chǎn)物。這批萌要素匯總一處,就是所謂的“萌要素?cái)?shù)據(jù)庫(kù)”,而御宅族群體對(duì)ACG作品及作品中人物的消費(fèi),本質(zhì)上其實(shí)是針對(duì)這個(gè)數(shù)據(jù)庫(kù)的消費(fèi)。[21]
這一消費(fèi)萌要素的趨勢(shì),也早已在中國(guó)的網(wǎng)絡(luò)文學(xué)界蔓延開來?!扒宕┪摹敝心切┤〔挠谇鍖m劇的人物形象,如康熙朝諸皇子,他們?cè)谶M(jìn)入“清穿文”的世界,成為女主人公情感、欲望的投射對(duì)象的過程中,顯然也遭遇過一次微妙的“人設(shè)化”[22]處理:先從電視劇的文本里拆解出若干較有辨識(shí)度的人物性格特征,例如四阿哥胤禛的堅(jiān)毅隱忍殺伐果決、八阿哥胤禩的謙謙君子溫潤(rùn)如玉等,將其“萌要素化”,再利用這些“萌要素”,拼貼出一個(gè)外表上看似與原形象相差無幾的“人設(shè)”來:四阿哥因此化身為“霸道總裁”,八阿哥則是公認(rèn)的“暖男”。而這些“人設(shè)”在“清穿文”的創(chuàng)作過程中,也經(jīng)由粉絲社群的交流討論,逐漸成為整個(gè)類型內(nèi)部通用的“公共知識(shí)”和“基本共識(shí)”。這暗示著一個(gè)耐人尋味的事實(shí),即網(wǎng)絡(luò)時(shí)代的作者和讀者,他們的欲望模式也同樣是數(shù)據(jù)庫(kù)化的。數(shù)字技術(shù)和數(shù)字媒介環(huán)境對(duì)網(wǎng)絡(luò)文學(xué)的影響與重構(gòu),又豈止停留在生產(chǎn)機(jī)制層面呢。
在理想的狀態(tài)下,如果可以利用分析工具解析海量文本中隱藏的萌要素,再加以匯總整理,必能得出有趣的結(jié)論,甚至最終形成一個(gè)由萌要素組成的字面意義上的“數(shù)據(jù)庫(kù)”。在數(shù)字人文分析工具“一葉·故事薈”[23]中,就包含了一個(gè)“人物側(cè)寫”的功能,即通過給出小說中主要人物的名稱,分析提取與之聯(lián)系最為密切的關(guān)鍵詞。但這個(gè)功能畢竟沒有針對(duì)萌要素的識(shí)別進(jìn)行過優(yōu)化,經(jīng)過筆者的幾輪試用,結(jié)果也確實(shí)不能盡如人意。不過既然有珠玉在前,此類分析工具的開發(fā),就已經(jīng)具備了相當(dāng)?shù)幕A(chǔ)。
除此之外,網(wǎng)絡(luò)文學(xué)的粉絲社群也是非常值得注意的研究對(duì)象,或可利用社會(huì)網(wǎng)絡(luò)分析的相關(guān)研究方法和工具進(jìn)行介入。最典型的例子仍然是“清穿文”的粉絲社群。由于整個(gè)“清穿文”的作者、讀者群體都是直接或間接的清宮劇粉絲,又往往容易將強(qiáng)烈的愛意投射到某個(gè)特定的人物身上,成為所謂的“角色粉”,例如四阿哥胤禛的粉絲團(tuán),就被稱為“四爺黨”,同理八阿哥胤禩的粉絲團(tuán)則被稱為“八爺黨”。姑且不論這些粉絲社群的組織形態(tài)本身就非常具有研究?jī)r(jià)值,它們對(duì)“清穿文”創(chuàng)作的反哺作用也是顯而易見的,比方說,這些“角色粉”的社群內(nèi)部就常常圍繞著相應(yīng)的人物形象展開交流討論以及史料挖掘等。盡管“清穿文”的創(chuàng)作熱潮早已過去,而當(dāng)年這些粉絲團(tuán)的討論現(xiàn)場(chǎng)也已消失殆盡,但與之類似的現(xiàn)象卻仍在不斷上演,例如起點(diǎn)中文網(wǎng)開啟本章說功能之后,某些作者就會(huì)從讀者評(píng)論里吸取有價(jià)值的想法融入自己的創(chuàng)作。這些讀者與讀者、讀者與作者之間的交往關(guān)系,無疑是網(wǎng)絡(luò)文學(xué)的生產(chǎn)、接受環(huán)節(jié)之中不可或缺的重要組成部分。
倘若不必將視野局限于網(wǎng)絡(luò)文學(xué)的文本,那便不難意識(shí)到,近十年來,網(wǎng)絡(luò)文學(xué)作品改編的影視劇已越來越常見?!恫讲襟@心》電視劇的熱播,正是這股潮流的開端。既然如此,利用包括多模態(tài)語(yǔ)篇分析[24](multimodal discourse analysis)在內(nèi)的各種理論,開發(fā)用于分析對(duì)比網(wǎng)絡(luò)文學(xué)文本及其改編影視劇的工具,似乎也是一個(gè)可行的方向。
在沒有數(shù)字人文技術(shù)介入的情況下,如果想要研究網(wǎng)絡(luò)文學(xué)之中的某個(gè)特定類型,例如“清穿文”,常見的做法是從中挑選出代表性的文本進(jìn)行細(xì)讀,再借此挖掘與闡釋整個(gè)類型的特征與發(fā)展脈絡(luò)。這一研究思路本身并無問題,卻終究只能從結(jié)果向前追溯,無法系統(tǒng)、完整地呈現(xiàn)一個(gè)類型在演變過程中所有枝節(jié),若引入數(shù)字人文的相關(guān)工具,或可處理此類問題。但對(duì)于“清穿文”而言,到遴選研究對(duì)象這一步,還是不免遇到一些困難:文學(xué)網(wǎng)站的庫(kù)存書目往往數(shù)以百萬計(jì),如何才能盡可能全面準(zhǔn)確地挖掘出符合條件的文本?目前為止,最具可行性的解決方案,就是利用內(nèi)嵌在文學(xué)網(wǎng)站主頁(yè)上的搜索欄,依據(jù)關(guān)鍵詞和標(biāo)簽進(jìn)行檢索。這就不免令人聯(lián)想起數(shù)字人文研究的核心成果與重要工具——學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù)的使用,事實(shí)上,單以保存/檢索數(shù)字文本這項(xiàng)功能而論,二者之間其實(shí)并不存在任何本質(zhì)差異。正如前文所言,數(shù)字人文研究起源于文獻(xiàn)典籍的數(shù)字化與數(shù)據(jù)庫(kù)化,網(wǎng)絡(luò)文學(xué)顯然直接越過了“數(shù)字化”這個(gè)步驟,那么,文學(xué)網(wǎng)站是否能夠直接承擔(dān)數(shù)據(jù)庫(kù)的功能呢?
仍以晉江文學(xué)城為例,該網(wǎng)站現(xiàn)有藏書331萬部,簽約版權(quán)作品也已超過25萬部。[25]為方便讀者查找書目,晉江在首頁(yè)上提供了兩種檢索方式,第一種是關(guān)鍵詞檢索,即依據(jù)作品、作者或主人公的姓名搜尋具體的某部作品;第二種則是通過限定時(shí)代(包括近代現(xiàn)代、古色古香等4種)、類型(包括愛情、武俠、仙俠、科幻等16種)和風(fēng)格(包括悲劇、正劇和輕松等5種)等標(biāo)簽,篩選出符合條件的作品列表。其中,“內(nèi)容標(biāo)簽”這個(gè)分類之下,就包含著一個(gè)叫作“清穿”的標(biāo)簽。[26]
乍看上去,這套標(biāo)簽檢索系統(tǒng)與學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù)中的某些功能倒也頗為相似,但作為以UGC為核心運(yùn)營(yíng)理念的文學(xué)網(wǎng)站,晉江站內(nèi)的標(biāo)簽編輯模塊,一直由作者自行打理。該模塊內(nèi)嵌在發(fā)布/修改小說的后臺(tái)頁(yè)面上,可以根據(jù)個(gè)人的理解與偏好自由選擇添加[27],并沒有統(tǒng)一的操作規(guī)范,也就無從苛求它的準(zhǔn)確性。除此之外,UGC這個(gè)屬性,還意味著內(nèi)容的積累與增殖,以及新的創(chuàng)作潮流和類型的不斷涌現(xiàn)。然而網(wǎng)站標(biāo)簽庫(kù)的更新卻要滯后許多,至少“清穿文”的命名和“清穿”標(biāo)簽的引入就絕不可能早于第一批“清穿文”的發(fā)表。事實(shí)上,連載于2004—2006年的“清穿文”,其常用標(biāo)簽就多為“穿越時(shí)空”和“靈魂轉(zhuǎn)換”,但在這兩個(gè)標(biāo)簽之中,卻又包含著大量并非“清穿文”的作品。
僅憑搜索標(biāo)簽,顯然是不夠的。那么能否利用爬蟲軟件,通過限定故事年代背景,再結(jié)合相應(yīng)標(biāo)簽等信息進(jìn)行抓取呢?確實(shí)未嘗不可,但晉江歸根結(jié)底是一個(gè)營(yíng)利性的商業(yè)網(wǎng)站,一旦站內(nèi)作品出現(xiàn)版權(quán)變動(dòng)或被某項(xiàng)新政策波及,那么相關(guān)頁(yè)面便會(huì)立即鎖定,無法瀏覽?!扒宕┪摹鼻『檬巧鲜鰞煞N狀況的重災(zāi)區(qū),前文提到過的“清穿三座大山”,即《步步驚心》《夢(mèng)回大清》和《瑤華》,目前均處于鎖定或部分鎖定的狀態(tài)。雖然上述幾部小說的紙質(zhì)書和電子文檔早已廣為流傳,但更多不那么知名的作品,或許便就此湮滅了。況且,原發(fā)布頁(yè)面的丟失也意味著一部小說連載至今的所有讀者評(píng)論、積分和點(diǎn)擊量等重要信息的損毀,這種缺憾是無可挽回的。
總而言之,盡管以晉江為代表的絕大多數(shù)文學(xué)網(wǎng)站在架構(gòu)和功能等方面與學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù)存在一定程度上的相似性,但作為一個(gè)UGC屬性的商業(yè)網(wǎng)站,它終究只需要對(duì)投資者和用戶(作者、讀者)負(fù)責(zé),既無義務(wù)也無意向?yàn)閷W(xué)術(shù)研究提供服務(wù)。并且,由于站內(nèi)發(fā)布文本的總量極其巨大,也就談不上對(duì)小說的錯(cuò)字病句進(jìn)行勘誤或者核實(shí)作品標(biāo)簽的準(zhǔn)確性,距離正規(guī)學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn),還差得很遠(yuǎn)。
盡管如此,從數(shù)字人文的研究視野出發(fā),利用檢索、爬蟲軟件抓取等手法遴選““清穿文””研究對(duì)象的基本思路,仍然是合理有效的。只不過一旦進(jìn)入實(shí)操環(huán)節(jié),就不免暴露出當(dāng)前中國(guó)網(wǎng)絡(luò)文學(xué)研究面臨的一層隱憂,即學(xué)術(shù)導(dǎo)向的數(shù)據(jù)資料庫(kù)的缺位。相比一些傳統(tǒng)人文學(xué)科(如歷史學(xué)、古代文學(xué)等)在文獻(xiàn)典籍?dāng)?shù)字化和數(shù)據(jù)庫(kù)化過程中投入的大量人力物力,網(wǎng)絡(luò)文學(xué)研究作為一門新興學(xué)科,亟需加快腳步。目前可以著手的工作有兩個(gè):一、與文學(xué)網(wǎng)站合作,開辟學(xué)術(shù)搜索端口;二、著手搭建專用的學(xué)術(shù)資料數(shù)據(jù)庫(kù),廣泛收集、整理和挽救網(wǎng)絡(luò)文學(xué)研究所需的各種數(shù)據(jù)信息和材料。
隨著信息時(shí)代的來臨,許多傳統(tǒng)人文學(xué)科早已通過文獻(xiàn)典籍?dāng)?shù)據(jù)庫(kù)的建設(shè)以及相關(guān)分析工具的開發(fā),翻開了數(shù)字人文的新篇章。而原本就生長(zhǎng)在互聯(lián)網(wǎng)算法規(guī)則與技術(shù)邏輯之中的文學(xué)網(wǎng)站及其內(nèi)部的創(chuàng)作實(shí)踐,卻在誕生的一刻,就注定了要與數(shù)字人文的思維緊密糾纏?;谔烊坏拿浇閮?yōu)勢(shì),如何一邊繼承過往研究成果,一邊借助數(shù)字人文的視野來推進(jìn)學(xué)科建設(shè)與理論自覺,必將成為未來的網(wǎng)絡(luò)文學(xué)研究者們面臨的最大挑戰(zhàn)。
注釋:
中國(guó)現(xiàn)代文學(xué)研究叢刊2020年8期