李 鶴 伊
(北京大學 藝術(shù)學院,北京100000)
在《探索歷史大數(shù)據(jù)——歷史學家的宏觀視角》一書中,學者肖恩·格雷厄姆、伊恩·米利根、斯科特·魏因加特認為“DH”的表述不同程度上同時適用于兩個領(lǐng)域,即“數(shù)字人文”(Digital Humanities)和“數(shù)字歷史”(Digital History)[1](P34)。在《數(shù)字人文:改變知識創(chuàng)新與分享的游戲規(guī)則》中,學者安妮·伯迪克、約翰·德魯克、彼得·倫恩費爾德、托德·普雷斯納、杰弗里·施納普提出:“亞里士多德認為我們讀史以認識世界了解過往之事,我們讀詩以想象世界激發(fā)孕育出新世界。數(shù)字人文學者同時具有史學家和詩人的特質(zhì),我們既積極研究過往的世界,也積極思考尚未誕生的新世界,然而數(shù)字人文學者利用新的工具技術(shù)和設(shè)計策略,采用將詩人和史學家的傳統(tǒng)創(chuàng)作實踐方式徹底改變的新認識方式來思考過去和未來?!盵2](P77)可見,數(shù)字人文與歷史研究有著無法割舍的聯(lián)結(jié),作為變革世界認知方式的跨學科領(lǐng)域,數(shù)字技術(shù)及工具打破了學界對人文、藝術(shù)及社會科學知識的傳統(tǒng)理解模式,貢獻了全球性的、超越歷史和媒介的新型學術(shù)模型和組織形式。歷史學家置身于數(shù)字化轉(zhuǎn)向的局面已經(jīng)無可避免地依賴數(shù)字化工具進行研究,依托大數(shù)據(jù)獲取史料已經(jīng)超出了人工無法企及的地位。2012年底Ithaka S+R 公司對歷史學家的調(diào)研報告就已指出,數(shù)字化轉(zhuǎn)向下的新興研究實踐和交流機制已經(jīng)被廣泛采納,這為研究既帶來了機遇,也帶來了挑戰(zhàn)。
“數(shù)字人文”作為快速發(fā)展的跨學科研究方法,目前學界對其詞源定義紛繁多樣,并無統(tǒng)一口徑(1)數(shù)字人文的百種定義可訪問詹森·赫普勒(Jason Heppler)創(chuàng)辦的網(wǎng)站 “What is Digital Humanities”或《數(shù)字人文宣言2.0》,包含50個對數(shù)字人文的理解與表述。,其涉及范圍可以指涉從媒介研究到電子藝術(shù),從數(shù)據(jù)挖掘到技術(shù)教育,從學術(shù)編輯到無政府博客,同時還囊括代碼迷、數(shù)字藝術(shù)家、專業(yè)領(lǐng)域書呆子、超人類主義者、游戲理論家、自由文化倡導者、檔案保管員、圖書管理員、自主創(chuàng)新式教育者等[4](P75)。計算領(lǐng)域?qū)?shù)字人文有較系統(tǒng)化的討論和紛繁的定義,而人文領(lǐng)域?qū)W者認識數(shù)字人文相對較晚。人文學中運用計算機的開端始于1949年,1949至1970年間“人文計算”作為數(shù)字人文發(fā)展的前身,直到2004年出版的《數(shù)字人文指南》標志著“數(shù)字人文”作為概念在學術(shù)界的開端[5](Pxxiii),再到2005年數(shù)字人文國際聯(lián)盟成立后,數(shù)字人文作為一個研究領(lǐng)域獲得國際學術(shù)界的普遍認可[6]。2005年至2009年是數(shù)字文人領(lǐng)域的確定期,研究主要圍繞語言學和文學等人文學科展開,2009至2019是數(shù)字人文的成熟期,著重跨學科領(lǐng)域的合作深化[7]。從計算機科學領(lǐng)域逐步演進使得電子版逐步代替了紙質(zhì)版文字,計算機語言的功用導致傳統(tǒng)語言的弱化。荷爾·波茨坦認為由于“人文計算”到“數(shù)字人文”有著“散漫的轉(zhuǎn)換”[8], 使得人文學者擔心新技術(shù)會徹底顛覆人文學科領(lǐng)域,所以部分學者對數(shù)字人文方法介入人文研究一直持有保留態(tài)度。
“數(shù)字歷史”可以追溯至20世紀50年代和60年代,隨著定量和計算史學的發(fā)展,歷史學家積極探究歷史的邊界問題,以跨越個體及時空的視角對歷史的不同時段進行探究。1970至1990年代,數(shù)學及統(tǒng)計學的廣泛應用推動著歷史研究的數(shù)字化轉(zhuǎn)向。數(shù)字人文與數(shù)字歷史的關(guān)系并沒有明確答案,有些認為數(shù)字人文比數(shù)字歷史更為寬泛且二者相互重疊。我們似乎更容易在學界普遍關(guān)注重點數(shù)字人文期刊《人文學科中的數(shù)字學術(shù)》與《數(shù)字人文季刊》以及數(shù)字人文國際聯(lián)盟論文集、《數(shù)字人文的爭論》中接觸到大量科技工作者、技術(shù)主義者、社會科學家對“數(shù)字人文”進行的定義和闡釋的學術(shù)成果,這樣相對掩蓋了人文學者在數(shù)字人文研究中的話語影響力。因此,這里選取了人文歷史學科下相對具有代表性的數(shù)字史學研究項目,并闡釋歷史項目研究者對數(shù)字人文以及數(shù)字歷史的理解與認知。凱莉·奧尼爾創(chuàng)建了俄羅斯歷史研究數(shù)字人文項目“帝國主義計劃”(2)凱莉·奧尼爾(Kelly O'Neill),哈佛大學戴維斯俄羅斯和歐亞研究中心,俄羅斯歷史、空間史學家。,她認為數(shù)字人文以創(chuàng)新的方式生產(chǎn)知識并解釋人類的經(jīng)驗。現(xiàn)今通過表格、定量數(shù)據(jù)和制圖材料,將數(shù)字材料納入研究方法之后能夠在空間上促使史學研究者提出新的問題,即詮釋歷史在“何處”發(fā)生的問題。將地理信息科學的方法應用于歷史,并建立交互平臺來創(chuàng)建“地圖故事”,從定位事物、地點和人物入手,以了解地理位置如何塑造個人、社會和國家。蘇珊·普雷斯頓·比利爾同樣提到數(shù)字人文是以一整套新技術(shù)的角度重新思考世界的方法,人文學者的突破關(guān)鍵是轉(zhuǎn)型過程的一部分。(3)蘇珊·普雷斯頓·比利爾(Suzanne Preston Blier),哈佛大學艾倫·懷特希爾(Allen Whitehill Clowes)美術(shù)史和非洲與非裔美國人研究教授。有關(guān)比利爾在該領(lǐng)域的貢獻于2013年春季哈佛大學研究生院刊物Colloquy文章《面對非洲藝術(shù)》中發(fā)表。她領(lǐng)導的電子地理空間數(shù)據(jù)庫Africamap成為擴展到Worldmap的站點,并將不同學科的學者納入研究體系。包弼德認為數(shù)字人文涉及規(guī)模巨大的信息和數(shù)據(jù),依托計算分析和社會網(wǎng)絡(luò)分析,可以發(fā)現(xiàn)人與人之間的聯(lián)系,以及在歷史上某一時刻形成的各種群體。(4)包弼德(Peter K. Bol),歷史學家和漢學家,哈佛大學東亞語言與文明教授,哈佛大學地理分析中心的創(chuàng)始主任,負責中國歷史地理信息系統(tǒng)(CHGIS)和中國傳記數(shù)據(jù)庫(CBDB)項目。在2020數(shù)字人文視角下的中國歷史研究會議上提出《從軼事到數(shù)據(jù):傳記數(shù)據(jù)的網(wǎng)絡(luò)和空間分布》。然而,有學者曾質(zhì)疑“數(shù)字人文”,后殖民文化學家艾達琳·寇爾提出“數(shù)字人文無法拯救你”的命題[9],她斥責數(shù)字人文主義者將計算置于文化之上,此舉只會讓人文學科變得更加無關(guān)緊要,成為 “STEM的女仆”,然而寇爾最終還是認可了數(shù)字人文主義者被要求更像媒體研究、科學、技術(shù)和社會研究或某種文化研究變體的學者,而不是被工程師、科學家和數(shù)學家所掩蓋的事實。面對計算史上的第三次浪潮(5)計算史上的第一次浪潮源自人文計算,第二次浪潮圍繞文本分析(H-net,Usenet和GIS),第三次浪潮經(jīng)歷數(shù)據(jù)儲存能力重大革新,開源工具軟件的興起是其核心。,歷史學家逐步從思考定量方法的利弊采取了“語言學轉(zhuǎn)向”,計算機科學家們也試圖尋求與人文社會學科相連的共同點并在網(wǎng)絡(luò)上建構(gòu)跨學科共享文件的語言。數(shù)字歷史學者面對計算大潮已然無法“躲進小樓成一統(tǒng)”,跨學科數(shù)字歷史研究模式早已成為變革世界知識生產(chǎn)的新方法。
作為歷史的電影史[10](P3),且電影作為一種協(xié)調(diào)、綜合、多元軌跡的媒體——產(chǎn)制出大量千變?nèi)f化的文本,需要多重的理解架構(gòu)[11],數(shù)字人文與文化分析就是實現(xiàn)多重理解架構(gòu)的新工具。當前中國電影史學者仍處于重寫電影史的階段中,致力于規(guī)避以論帶史和過度陷入史料不能自拔的陷阱,數(shù)字人文為重寫中國電影史提供了新型路徑與研究方法。然而,并非所有電影史學者必須啟用數(shù)字人文的研究方法,但是運用數(shù)字研究方法的電影史學者必定是電影史、電影研究的重要組成部分。數(shù)字人文影人年譜的構(gòu)建為重寫電影史貢獻基礎(chǔ)性價值,以代表性中國影人為研究對象和切入點,依托大數(shù)據(jù)開源獲取、文本分析可視化、地理信息系統(tǒng)分析與數(shù)字地圖繪制、主題建模、網(wǎng)絡(luò)分析、知識關(guān)聯(lián)、數(shù)據(jù)庫建構(gòu)等方式進行研究,對厘清電影本體與電影史的認知,理解不同時期社會、文化、消費、電影接受的觀念以及創(chuàng)新呈現(xiàn)中國電影史的敘事視角和空間建構(gòu)奠定堅實的基礎(chǔ)。同時,以影人搭建的數(shù)據(jù)庫力圖在世界范圍內(nèi)開源聯(lián)動,為中國電影史論研究的突破、跨國的中國電影史書寫以及人文藝術(shù)學科整體的未來發(fā)展提供豐富的理解架構(gòu)和突破傳統(tǒng)的研究資源。
2004年起,列夫·馬諾維奇的研究對象從“新媒體”變?yōu)?“更多媒體”下的“文化分析”。他創(chuàng)建了文化分析實驗室并將計算機解析全球人類“大規(guī)模文化”的使命貫穿了他之后的研究路徑。文化分析是指使用計算和設(shè)計方法(包括數(shù)據(jù)可視化、媒體和交互設(shè)計、統(tǒng)計和機器學習)來探索和分析文化的規(guī)模,是人文學科中使用計算機視覺最重要的成果。需要注意的是,文化分析不是用算法取代文化研究,而是通過新的接口和技術(shù)來觀察大量的文化數(shù)據(jù)集以增強人類的能力。傳統(tǒng)的文化分析方法已經(jīng)無法覆蓋人類的文化知識生產(chǎn)的高速率,數(shù)億文化生產(chǎn)者創(chuàng)造、想象出具有價值的產(chǎn)品和事件以及文化“更多信息”(網(wǎng)站、帖子、出版物、數(shù)據(jù)集)需要提出適合全球數(shù)字文化規(guī)模、速度、多樣性和連通性的新理論。
馬諾維奇在《文化分析、計算機視覺、人類感官和藝術(shù)的語言》中談到了文化分析與數(shù)字人文的關(guān)系。其中,文化分析與數(shù)字人文方法都屬于21世紀下半葉出現(xiàn)的利用大量文化和社會數(shù)據(jù)的研究范式,其他范式還包括計算社會科學、社會計算、數(shù)字人類學、數(shù)字歷史、城市科學、城市信息科學和文化經(jīng)濟學,二者都依托機器學習、計算處理對藝術(shù)史、電影和媒體研究、游戲研究、考古學等領(lǐng)域有著廣泛的應用。馬諾維奇對《人文學科中的數(shù)字學術(shù)》一文中 “數(shù)字人文重文字,輕可視化,模擬性差”的觀點提出了質(zhì)疑,認為這種觀點令人驚訝,因為計算機科學家早在20世紀50年代末就對圖像分析方法進行了開發(fā)[12](P7)。在計算機視覺和多媒體計算領(lǐng)域,研究者多年來持續(xù)發(fā)布新的算法以自動檢測歷史圖像內(nèi)容、藝術(shù)風格、早期攝影技術(shù)、電視和視頻的類型,并將其應用于逐漸龐大的歷史數(shù)據(jù)集。馬諾維奇主導的文化分析實驗室也一直使用數(shù)字人文和文化分析可視化結(jié)合的方法分析文化歷史和視覺媒體,如紐約現(xiàn)代藝術(shù)博物館收藏的20000張照片、奧地利電影博物館收藏的紀錄電影先驅(qū)吉加·維爾托夫的電影、100萬幅DeviantArt上的藝術(shù)作品以及其他數(shù)據(jù)集[13]??傮w來看,文化分析和數(shù)字人文都無法脫離計算機的共性且都受到了人文計算的影響,圖像分析方法影響了文化分析可視化與數(shù)字人文方法,二者可以從不同角度介入到電影史及其他藝術(shù)史的研究中。數(shù)字人文的大部分計算工作都集中在文學文本、歷史文本記錄和空間數(shù)據(jù)上,與此相比,文化分析更突出靜態(tài)和動態(tài)圖像以及交互式媒體等其他類型的媒體。
以“人及社群”為線索展開的數(shù)字人文個案項目在藝術(shù)史、文學史等研究領(lǐng)域比電影史研究領(lǐng)域起步相對較早。2013年,約翰娜-德魯克在 “數(shù)字藝術(shù)史”(使用計算技術(shù)的分析技術(shù))和“數(shù)字化藝術(shù)史”(建立在使用在線資源上的藝術(shù)史)之間做了一個顯著區(qū)分[14],她認為,前者是“數(shù)字藝術(shù)史的適當領(lǐng)域”,因為它以新穎的方式揭示藝術(shù)史文物的特征并拓展傳統(tǒng)的觀察和分析方法而產(chǎn)生創(chuàng)新的考察面比數(shù)字化藝術(shù)史研究更為深廣。2015年《國際數(shù)字藝術(shù)史期刊》成立,學界出現(xiàn)了對人與人、人與社群之間如何產(chǎn)生聯(lián)結(jié)這一話題感興趣的研究者。譬如重建弗朗西斯·培根的人物形象和最杰出人物之間的現(xiàn)代社會關(guān)系網(wǎng)絡(luò),他們掌握了從《牛津國民傳記詞典》中提取人名和推斷關(guān)系的自然語言處理工具和統(tǒng)計圖學習技術(shù),運用傳記文獻中推斷歷史社會網(wǎng)絡(luò)的統(tǒng)計方法[15]。2020年,第一本關(guān)于數(shù)字藝術(shù)史的卷集《勞特里奇數(shù)字人文藝術(shù)史》出版[16],著重論述數(shù)字人文是如何與藝術(shù)史、藝術(shù)理論、藝術(shù)創(chuàng)作者產(chǎn)生聯(lián)系的。作者對數(shù)字人文和藝術(shù)史研究之間的交叉點進行了廣泛的調(diào)查,不僅關(guān)注為藝術(shù)作品及藝術(shù)家的歷史而開發(fā)的新技術(shù),而且還思考這些工具的使用帶來的學科挑戰(zhàn),并追問計算方法能夠在何種程度上對藝術(shù)史的研究產(chǎn)生影響。同時,也對這種研究方式的概念性偏見進行了反思。國內(nèi)藝術(shù)史以“人及社群”研究的個案項目以董其昌的數(shù)字人文項目為經(jīng)典案例,研究嘗試引入機器學習、CNN (深度模型卷積網(wǎng)絡(luò))和圖像關(guān)聯(lián)AI引擎等方法,實現(xiàn)了以高清藏品圖像數(shù)據(jù)等為基點,可視化了董其昌的個體人文脈絡(luò),梳理鑒藏、交游、教育、傳承等多個人文脈絡(luò),以可視化的形態(tài)為董其昌的研究設(shè)計了一個“主體-表達-時代”的綜合維度。其次,參照CIDOC CRM等國際元數(shù)據(jù)標準,基于Linked Data設(shè)計明清文人書畫本體, 實現(xiàn)博物館的實物性特征所帶來的源于圖像本體的排比和深度分析,并將逐步形成繪畫元素標準樣本國際平臺,為研究范式轉(zhuǎn)變、傳播邊界拓展、內(nèi)涵顯性化以及知識創(chuàng)造提供一種新的思路[17]。此外,文學領(lǐng)域中,學者基于計算機算法與模型,挖掘文學史上的重要人物史料數(shù)據(jù)后進行空間研究、人際網(wǎng)絡(luò)及關(guān)系闡釋、知識圖譜構(gòu)建以及對該人物著述的深度翻譯、詞典和機器學習。例如冉從敬等學者的《數(shù)字人文視角下的莎士比亞學術(shù)傳播研究》、楊玲的《遠讀、文學實驗室與數(shù)字人文:弗朗哥莫萊蒂的文學研究路徑》等,將文學史、藝術(shù)史的作者、藝術(shù)家作為“人”的意義加以凸顯,是數(shù)字人文應用于人文學科的重要目標,通過詞頻分析、遠讀、遙讀等手段將定量的研究與定性的研究對接,對電影研究中影人年譜及影人社群網(wǎng)絡(luò)的時空構(gòu)建具有啟發(fā)性意義。
2018年出現(xiàn)了第一本采用數(shù)字人文方法量化可視單個導演作品的英語專著《數(shù)字人文與電影研究——視覺化吉加·維爾托夫電影》[18],不過,量化電影的分析方法和文化數(shù)據(jù)化作為電影研究可視化的方法之一可以追溯至上世紀。自1971年尤里·洛特曼在《藝術(shù)文本的結(jié)構(gòu)》一書中提出針對文本的符號學分析后,大量研究者使用對藝術(shù)形象中的元素、結(jié)構(gòu)以及其產(chǎn)生的意義、審美價值進行探究。電影研究者也發(fā)現(xiàn)計算機進行的文本分析能夠觸及自然語言中無法達到的精度,并能夠定性描述圖像的特征,亦可處理沒有明顯視覺元素的部分[19](P30)。以此為標志,依托計算機展開影像的量化分析、電影計量學、電影檔案學紛至沓來,電影文本量化分析學者偏向針對單個文本以及某一作者的系列文本進行規(guī)模較小的分析。在西方,1974年巴里·索爾特運用統(tǒng)計學來探究電影風格[20]。1987年羅杰·史密瑟在提出計算機的引入應使處理電影檔案館的藏品信息共享更容易,并認識到這種數(shù)據(jù)交換依賴于對共同標準和格式的接受這一問題[21]。20世紀后半期,無論是對電影的算法研究還是將電影作為證據(jù)的電影史研究被籠罩在后結(jié)構(gòu)主義之下,堅持認為電影是一種不同形式的證據(jù),需要對其進行解碼的特殊訓練,以對其制作時期的精神或時代精神進行無意識的物質(zhì)見證[22](P6)。這種依靠算法的定量的研究延伸至當今,杰森-薩拉文對文化模式進行了數(shù)據(jù)可視化,電影《泰坦尼克號》的畫面被簡化為單一的代表性顏色,這些顏色的小正方形被放置在一個矩形網(wǎng)格中,從而使電影中可見的視覺節(jié)奏成為可能[23]。在亞洲,日本學者大澤勝久提出數(shù)字化的電影研究在對長期保存大量信息的動態(tài)圖像的數(shù)字數(shù)據(jù)方面需要提出相應策略,與動態(tài)圖片一起使用的感光材料與數(shù)字技術(shù)結(jié)合作為創(chuàng)新性研究方法可以彌補數(shù)字技術(shù)在長期保存方面的不足[24]。韓國學者姜璲桓認為電影不再是基于賽璐珞膠片的藝術(shù)形式,而是變成了“文件”和“信息”。他從劇本的文本分析、視覺形象量化研究、敘事模式的研究三個方面將定量方法引入電影研究[25]。國內(nèi)近年來也開始對量化電影研究進行嘗試,楊世真探究了計量電影學的理論、方法與應用[26],陳剛通過Cinemetrics工具對于費穆導演的電影結(jié)構(gòu)進行了可視化的研究實踐等[27]。以上計量電影學的可視化分析與定量研究突出電影文本、電影風格、節(jié)奏、鏡頭的量化,尤其偏重“算法”“數(shù)據(jù)”對電影史研究的影響,依據(jù)這些數(shù)據(jù)延續(xù)了實用后現(xiàn)代主義的方式來理解文本的思想,“即所有的敘事形式,包括傳統(tǒng)的歷史,都被部署了相等的情節(jié)、猜測和選擇過程”[28]。
然而,這種研究方式引起了歷史學家以及羅伯特·艾倫、杰弗瑞·克萊諾奇、理查德·馬爾比、亞瑟·奈特等電影史、媒介史學者的反思,他們認為以電影研究為基礎(chǔ)的電影史是不夠的,電影作為大眾娛樂的媒介必須具有以超越電影文本的生產(chǎn)和實踐的方式來構(gòu)想。聚焦于文本的電影分析窄化且抑制了電影史的空間意義,且會在電影與歷史兩個學科之間造成不可跨越的隔閡。于是,21世紀初的前十年,電影史研究的國際趨勢從電影的內(nèi)容轉(zhuǎn)移到其循環(huán)和消費并將電影作為一個社會和文化交流的場所來研究,2007年,學者們在根特舉辦的具有突破性意義的電影研究論壇“他們眼中的光芒:關(guān)于電影文化、電影展覽和電影觀看的全球視角”中明確了“新電影史”的研究范式將轉(zhuǎn)換視角至電影的消費流通以及電影作為社會與文化交流的屬性。電影史研究者借助GIS系統(tǒng)著重關(guān)注歷史、地理、文化研究、經(jīng)濟學、社會學和人類學的關(guān)聯(lián),對電影史進行空間分析,試圖深入電影發(fā)行和展覽的商業(yè)活動等公共生活、電影的法律和政治話語以及特定電影觀眾的社會和文化歷史中搭建空間網(wǎng)絡(luò)及關(guān)系以發(fā)現(xiàn)新的歷史。此時可視化的電影研究不僅包括計量電影學等依托算法和數(shù)據(jù)的文本分析,亦走向了電影史學的空間研究,轉(zhuǎn)向了更為深廣的文化和社會的歷史視角。21世紀初,在谷歌檢索“GIS與電影研究”只能查到與好萊塢電影中第二次世界大戰(zhàn)的士兵形象相關(guān)的網(wǎng)站[29],之后隨著GIS在社會學女性研究、歷史學的廣泛應用,電影學者愈發(fā)認識到數(shù)字方法與社會、文化、空間、消費等層面的重要聯(lián)結(jié),電影史研究的空間轉(zhuǎn)向必然與文化地理學進行跨學科交叉。以著名電影史空間研究項目HOMER為例,它包括了四個數(shù)據(jù)庫案例:(1)電影院和觀眾研究項目(CAARP)研究電影放映、公司和場地的信息,對1928年引入聲音后南澳大利亞的電影發(fā)行模式、1949-1980年的移民電影院線路和觀眾、新南威爾士州農(nóng)村觀眾的文化體驗進行探索。(2)電影文本背景數(shù)據(jù)庫提供了荷蘭電影文化的基本要素:電影、影院、影人和電影公司。我們不僅可以找到關(guān)于人物、事件、地點和時間信息,還可以分析這些信息的模式和網(wǎng)絡(luò)。(3)早期倫敦電影商業(yè)數(shù)據(jù)庫是對1894-1914年倫敦電影企業(yè)的開源數(shù)據(jù)庫,記錄了第一次世界大戰(zhàn)前倫敦的電影院和電影企業(yè)。(4)威廉斯堡劇院數(shù)據(jù)庫是一個在線檔案數(shù)據(jù)庫,記錄了美國弗吉尼亞州威廉斯堡20世紀的電影觀看和日常文化生活的證據(jù),這個大西洋中部的小鎮(zhèn)同時也是美國的一個標志性地點。四個項目的共性在于使用定量信息,通過數(shù)據(jù)庫、空間分析和地理可視化等手段,提出了一系列關(guān)于電影人、電影院與社會群體關(guān)系的假設(shè),并期望這些假設(shè)通過其他定性手段得到驗證,從而發(fā)現(xiàn)新的電影史。無論是文化分析方式對圖像、視覺媒體的規(guī)模性呈現(xiàn),還是數(shù)字人文方法對計量電影、歷史空間的探尋,都注重可視化的呈現(xiàn)方式,即研究的視角由二維呈現(xiàn)為三維。與算法、人工智能的結(jié)合可以充分對歷史上的電影庫進行檢索、挖掘,盡可能地覆蓋各國家、各民族地區(qū)電影資料,提取出的是指數(shù)級增量電影文本、膠片、圖像、記憶以推動具有變革性意義的電影研究。電影等文化藝術(shù)不一定是被書寫的,而是被看的,是“可視”的。文化分析與數(shù)字人文下的可視化皆為中國電影史研究提供創(chuàng)新性的研究路徑。
數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)清洗與資料庫的構(gòu)建是數(shù)字人文研究的基礎(chǔ)與起點[6],可視化影人年譜和數(shù)據(jù)庫的建設(shè)是數(shù)字人文下的中國電影史研究不可忽視的基礎(chǔ)性工作,因為“影人年譜是一種在創(chuàng)新電影史觀的基礎(chǔ)上吁求中國史學傳統(tǒng)的電影研究方式,試圖在最大限度‘還原’社會歷史面貌和‘體認’影人生命軌跡的過程中,為中國的電影研究和電影史研究提供必要的知識積累和價值導向,并為‘重述’中國電影史以及構(gòu)建中國電影學派奠定不可或缺的學術(shù)基礎(chǔ)”[30],省略這一步驟則會出現(xiàn)研究的斷層或史料獲取的片面性。大部分早期影人年譜的書寫和出版物整理只能聚焦在紙質(zhì)版上,碎片化信息導致無法在兩岸三地電影史學建構(gòu)中形成網(wǎng)絡(luò)。計算機技術(shù)介入下的史料挖掘與數(shù)字化以機器學習、自然語言處理、可視化與GIS、關(guān)聯(lián)數(shù)據(jù)、網(wǎng)絡(luò)分析、數(shù)據(jù)管理、文本挖掘從根本上打破了傳統(tǒng)電影史影人研究空間的局限性,提高了史料的獲取效率和獲取范圍。
可視化影人年譜搭建的一條實踐路徑是早期影人史料的數(shù)據(jù)化和文本分析。與社科領(lǐng)域相對成熟化的數(shù)據(jù)庫進行比較,中國電影史學研究者可以獲取的電子化基礎(chǔ)性史料數(shù)量遠遠不夠,且需要以嚴謹?shù)膽B(tài)度甄別史料的來源,于是將電影史文字書寫轉(zhuǎn)換成數(shù)字時代的通用計算機語言屬于數(shù)字人文電影研究者、圖書館、影史檔案館的工作方向。在某些情況下,該過程可以依靠自動化輸入,例如設(shè)定限定詞,爬梳《國文天地》數(shù)據(jù)庫、大成老舊刊數(shù)據(jù)庫、愛如生數(shù)據(jù)庫、全國報刊索引數(shù)據(jù)庫等后篩選有效的影人資料,而在其他情況下(如珍稀影人日記、殘缺磨損的手稿等),則必須手動完成輸入。無論以哪種方式,任務都是艱巨的。文字史料轉(zhuǎn)化成數(shù)據(jù)后只有經(jīng)過分析解讀才具有存在意義,所以使用文本分析的方法才能激活龐大且靜態(tài)的影人史料,這里引用一個直觀的文本分析與歷史研究結(jié)合的案例用以說明。某位西方歷史學家認真閱讀一摞影印版的18世紀倫敦的庭審記錄,邊看邊抄錄案文。過程中她開始注意到用于描述年輕女性囚犯的語言似乎存在一些有趣的規(guī)律,于是她求助于Old Bailey Online法律在線數(shù)據(jù)庫并展開搜索。很快她就獲得了一個包含1000份有關(guān)女性囚犯的庭審訴訟資料。她下載完整的副本,并將其加載到文本分析工具Voyant Tools中, 沒過多久,她得到了文本中的關(guān)鍵詞和關(guān)鍵詞搭配,并使用頻率(詞語計數(shù))區(qū)分了語境中的關(guān)鍵詞,以及隨時間變化的圖表。這佐證了她自己的猜測,之后,她使用處理文本的java工具包Mallet開始尋找文本中潛在的語義結(jié)構(gòu),經(jīng)算法多次探索,最終表明每篇文本的大部分內(nèi)容都涉及23個常見主題[1](P iii)。同樣道理,影史研究者可以在經(jīng)過OCR的數(shù)據(jù)庫中根據(jù)涉及影人、城市的不同詞頻深入不同主題之中,并辨析影人與主題間的關(guān)系??墒褂脟H上文本分析的基本文本挖掘工具詞云、Markus、AntConc、斯坦福開發(fā)的Voyant Tools、Overview 等,依托詞語計數(shù)、N元頻率、語境關(guān)鍵詞技術(shù)語料庫等推進影人史料的可視化研究工作。目前,《基于社會網(wǎng)絡(luò)分析的蔡楚生創(chuàng)作研究》已對蔡楚生及其人物網(wǎng)絡(luò)關(guān)系進行可視化詞云研究,試圖挖掘出地理空間、人物、事件及影響力的內(nèi)在關(guān)聯(lián),是數(shù)字人文影人年譜工作在國內(nèi)的初步嘗試。
另一個可視化路徑是依托地理信息系統(tǒng)對影人及社群進行空間分析。地理信息系統(tǒng)(GIS)是一種綜合的基于計算機和網(wǎng)絡(luò)的技術(shù),允許用戶創(chuàng)建、管理、繪制、分析、建模和探索空間信息。GIS的電影空間史平臺可以支持小型、中型和大型研究,能夠允許多用戶多終端同時訪問并使用不同規(guī)模的證據(jù)來共同研究一個主題,集最局部的微觀數(shù)據(jù)和廣泛規(guī)模的統(tǒng)計數(shù)據(jù)為整體的綜合研究模式。以GIS建立影人年譜為例,用戶可以選擇不同軟件平臺,但使用平臺的方式具有共性。第一步,對影人和群體進行地理定位。地理定位既是一門藝術(shù),也是一門科學,其內(nèi)容包含批判地查證史料來源并明確其中包含的各種信息,評估史料的可拓展性,確定該來源的信息與其他來源中包含的信息相關(guān)的方式,將源信息重組為數(shù)據(jù),決定選用文檔,實現(xiàn)從源到電子表格的轉(zhuǎn)換。此過程適用于所有歷史來源:檔案文件、歷史地圖、繪畫、敘事文本、統(tǒng)計表。以上步驟通常需要重復執(zhí)行,不一定按必要順序執(zhí)行。然而,對于歷史學者而言,相對特殊且艱難的環(huán)節(jié)在于要處理地圖系統(tǒng)中找不到且在歷史地圖上出現(xiàn)過、證明過的地方。研究者根據(jù)史料了解到的影人出現(xiàn)過的具體位置與在地理信息系統(tǒng)上定位該信息具有很大區(qū)別,后者需要高精度和準確性。例如我們能否實現(xiàn)將20世紀三四十年代的上海城市以及影人所在或出現(xiàn)過的城市區(qū)域、街道的豐富性和可變性降低到一組坐標上?當前的數(shù)字地圖與史料中提供的地圖是否會不符?如果目前的地理定位系統(tǒng)精度無法達到文字史料提供的城市、鄉(xiāng)村的位置會發(fā)生什么?研究者可能在處理當前不存在的地理位置,因為隨著歷史的變遷,城市在不斷發(fā)展,河道隨著時間推移而變化,行政邊界也在不斷變化,影人的空間位置與歷史迭代出現(xiàn)實質(zhì)性的差異,所以技術(shù)層面上不斷對地圖進行數(shù)字化和地理配準可能是確定位置的最佳方法。同時,研究者需要時常反思:當我不知道一場放映或影人確切出現(xiàn)在哪里時,我怎么能確定該城市、街道或影院等空間就是我之后需要關(guān)注的重要的地理位置呢?這會不會產(chǎn)生預判性的錯誤和偏差?種種問題迫使研究者仔細思考如何概念化定義場所及其重要性,以及影人的生活、行為和觀念如何與我們定義的場所產(chǎn)生有意義的空間連結(jié)。目前國外研究者在處理類似問題時使用現(xiàn)有的地名詞典來定義其坐標,輔助手動構(gòu)建空間數(shù)據(jù)。對遺棄城市、廢墟城市及消失的地理位置進行重新的地理編碼,或回到大量的文獻資料中找到原始地圖并進行數(shù)據(jù)化,挖掘出沒有地理標識符的文檔。第二步,在確定好處理的內(nèi)容以及在何處定位后則可以開始進行影人年譜的可視化空間分析??臻g分析的目的是研究影人的行動、行為與地理之間的關(guān)系。它實現(xiàn)的前提在于研究者通過第一步知道“哪里”更為重要,如果不了解影人隨政治因素、社會環(huán)境、文化所變更的地理背景,就無法整合理解該影人牽動出的電影史問題。影人的空間分析意味著以多種不同方式工作:計數(shù)、測量、計算,將信息分層、重建網(wǎng)絡(luò)、識別模式等。盡管空間分析的步驟會復雜冗長,但它的存在是為了幫助研究者在影史研究中梳理出更加聚類、分散、連通性和相關(guān)性的命題??臻g分析突破了傳統(tǒng)的電影研究中聚焦文本、意識形態(tài)、類型研究等視角,以跨學科的思路強調(diào)了地理學在影史研究中的重要性,通過可視化的映射關(guān)系,各地、各影人信息之間的相關(guān)性會更多地激發(fā)史學研究者開始思考 “為什么”的問題。第三步,辨析影人關(guān)系。影人關(guān)系往往是按照一種可識別的邏輯運作的,即地點(一種由地理標識符或地名描述的事物)。有些關(guān)系是垂直的,按行政地理學的邏輯進行影人分類,例如多影人集中出現(xiàn)在上海、天津或北京等地,某地區(qū)包括某個村莊等。有些關(guān)系是主題性的,例如可以專門研究關(guān)于20世紀40年代中后期由內(nèi)地赴港的“南下影人”的空間軌跡和互動關(guān)系 [31]。有些是按時間順序的。例如,活躍在孤島期的影人、十七年后的影人或改革開放后的影人等。以上地點的分類闡明利于了解影史空間信息之間的影人關(guān)系。第四步:依托協(xié)同合作產(chǎn)生新發(fā)現(xiàn)。數(shù)字人文時代,史學研究者逐漸會從基于個體著述的時代轉(zhuǎn)入基于“項目”協(xié)同創(chuàng)作的時代[32]。一個成熟的數(shù)字人文研究項目需要在資金、專業(yè)、資源方面協(xié)同合作,例如俄羅斯“帝國主義計劃”項目中,需要地理分析中心、歷史學院、地圖中心、俄羅斯國家圖書館以及哈佛大學等合作者包括GIS 服務部門、數(shù)字學術(shù)孵化中心、地理分析中心下設(shè)的地圖空間技術(shù)中心、圖書館的社會科學與視覺化部門、數(shù)字制圖部門等部門的協(xié)同合作。以此為鑒,可視化影人年譜也需由傳統(tǒng)的獨立作者撰寫模式轉(zhuǎn)變成以多方合作為基礎(chǔ)的“項目”推進模式??梢暬叭四曜V的數(shù)據(jù)庫搭建需要多方機構(gòu)的協(xié)同合作與良性互動,形成數(shù)字人文研究活動的關(guān)系網(wǎng)絡(luò),各節(jié)點可以同時對某一項目在不同地點對資料進行訪問、獲取、增刪修改、應用。圖書館、電影資料館、檔案館、博物館在數(shù)字人文影人年譜和中國電影數(shù)據(jù)庫建構(gòu)中發(fā)揮重要作用,這些機構(gòu)與數(shù)字人文緊密聯(lián)結(jié),不僅能夠提供史料挖掘所需的基礎(chǔ)文本詞條與元數(shù)據(jù),還能在檢索、分類、開源獲取、數(shù)據(jù)關(guān)聯(lián)、資源共享與傳播、數(shù)據(jù)加工與維護多方面完善電影史研究的空缺。與此同時,數(shù)字人文影人年譜的數(shù)據(jù)化對圖書館、電影資料館、檔案館、博物館等機構(gòu)自身服務效率的提高與資源整合具有利好之處,機構(gòu)配合研究人員的需求不斷吸納更多史料并補充進數(shù)據(jù)庫,進一步提高館藏、檢索、組織、管理能力。所以為了提高機構(gòu)與數(shù)字影人年譜的互動效率,研究者應主動去圖書館、電影資料館、檔案館、博物館提出對某方面資源的需求和補充,積極與館內(nèi)科研人員提出查缺補漏的請求。
為從根本上改變當下中國電影知識圖譜的固態(tài)化、淺表化和孤島化狀況,為改善中國影人數(shù)據(jù)資源的離散化和斷片式特征[33],研究者需要擺脫對有偏見的檔案或典籍材料的依賴,在計算機的算法和傳統(tǒng)的電影史研究中尋求平衡點,探尋適合不同研究者個體的數(shù)字工具和路徑方法,開放包容地面對知識與歷史的多面闡釋。在應用數(shù)字技術(shù)、算法與人工智能的背景下,堅守以人文主義為核心和靈魂,在電影本體論和歷史、社會、文化的層面實現(xiàn)數(shù)字與人文的對接。