• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)時代人文研究前沿與探索
      ——南京大學(xué)“數(shù)字人文”學(xué)術(shù)研討會綜述*

      2018-02-09 08:52:00盧章平李永卉蘇文成
      圖書館論壇 2018年3期
      關(guān)鍵詞:數(shù)字人文人文數(shù)字

      劉 瓊,盧章平,李永卉,蘇文成

      隨著數(shù)字技術(shù)和數(shù)字媒體的不斷發(fā)展,人文學(xué)科結(jié)合數(shù)字技術(shù)的研究應(yīng)運而生。在國際上,數(shù)字人文研究在1968年開始萌芽,先后經(jīng)歷了1992-2007年的探索階段、2008-2012年的快速發(fā)展階段、2013年以后的繁榮階段[1]3。這兩年數(shù)字人文科學(xué)在中國越來越流行[2]140,相繼舉辦了一些數(shù)字人文研討會。比如,2014年6月20日上海市圖書館學(xué)會舉行2014年圖書館前沿技術(shù)論壇——“數(shù)字人文與語義技術(shù)”專題研討會;北京大學(xué)圖書館于2017年4月13日舉辦“北京大學(xué)數(shù)字人文工作坊”系列活動,并于5月26日舉行主題為“互動與共生:數(shù)字人文與史學(xué)研究”的第二屆北京大學(xué)數(shù)字人文論壇。2017年7月1-2日南京大學(xué)藝術(shù)研究院、歷史學(xué)院、地理與海洋科學(xué)學(xué)院等院系的青年教師發(fā)起召開“數(shù)字人文:大數(shù)據(jù)時代學(xué)術(shù)前沿與探索”學(xué)術(shù)研討會,旨在聚焦數(shù)字人文的重要議題,探討前沿思想與問題,促進學(xué)者間的交流,提升數(shù)字人文在國內(nèi)學(xué)術(shù)界的影響力和數(shù)字人文跨學(xué)科發(fā)展;來自哈佛大學(xué)、萊斯大學(xué)、臺灣大學(xué)、北京大學(xué)、中央美術(shù)學(xué)院等多家海內(nèi)外研究機構(gòu)的專家學(xué)者圍繞數(shù)字人文的前沿問題——“數(shù)字人文與計算”“歷史地理信息系統(tǒng)”“數(shù)據(jù)挖掘與文學(xué)研究”“圖像分析與藝術(shù)、數(shù)字博物館”“數(shù)字史學(xué)的方法與案例”“數(shù)字人文與學(xué)術(shù)出版”6個主題做了共32個報告。本文從會議報告嘉賓的研究背景,以及報告的主題、內(nèi)容等方面進行梳理,挖掘本次會議的內(nèi)涵,探討數(shù)字人文的前沿問題。

      1 數(shù)字人文研究學(xué)者的背景

      對本次會議報告嘉賓的所屬學(xué)科及研究方向進行網(wǎng)絡(luò)調(diào)查統(tǒng)計后,選取詞頻大于或等于2的詞繪制圖1。由圖1(a)可發(fā)現(xiàn),本次數(shù)字人文會議的研究涉及地理、歷史、統(tǒng)計學(xué)、資訊科學(xué)、建筑、經(jīng)濟、文學(xué)、藝術(shù)等學(xué)科。包弼德認為,歷史是有時間性的,僅做歷史研究是有限制的,地理研究雖沒有歷史學(xué)視野下的時間性,卻提供了關(guān)于人物活動和事件發(fā)生的環(huán)境信息,可以說歷史和地理一個注重時間一個注重空間,將這些信息都放在地圖上,就可以從空間的視角觀察中國歷史變遷[2]140。因此,隨著信息技術(shù)的發(fā)展,歷史學(xué)與地理學(xué)逐漸走向數(shù)字化。早在19世紀,歷史學(xué)家就開始將統(tǒng)計學(xué)引入歷史研究[3]13。圖1(b)更加細致地反映了數(shù)字人文的知識結(jié)構(gòu),除歷史、地理外,新媒體、信息系統(tǒng)、城市、環(huán)境、比較文學(xué)、數(shù)字圖書館等構(gòu)成了當前數(shù)字人文的應(yīng)用領(lǐng)域。然而,有關(guān)數(shù)字人文研究必不可少的理論方法及技術(shù)構(gòu)成相對較少,僅有少數(shù)學(xué)者有數(shù)據(jù)分析、機器學(xué)習(xí)、統(tǒng)計建模、文本分析等研究背景。數(shù)字人文被認為是一個典型的文理交叉領(lǐng)域,普遍認為研究人員既有傳統(tǒng)人文領(lǐng)域研究者、計算機技術(shù)和多媒體技術(shù)學(xué)者,也有從事數(shù)據(jù)清洗、處理、建模、分析、保存等的數(shù)據(jù)專家[4]33。但從本次會議報告嘉賓的研究背景卻發(fā)現(xiàn),數(shù)字人文的研究仍是大多數(shù)人文學(xué)科的獨角戲,研究多是采用現(xiàn)有的工具及方法進行詞頻統(tǒng)計、文本可視化、數(shù)字地圖繪制、數(shù)據(jù)庫建構(gòu)等,對研究所需的文本挖掘技術(shù)、數(shù)字建模、知識關(guān)聯(lián)、數(shù)據(jù)管理、VR/AR技術(shù)等少有探索。

      圖1 會議報告嘉賓的學(xué)術(shù)背景

      2 數(shù)字人文研究的主題

      將32場報告的標題進行主題詞梳理,剔除如“分析、研究、相關(guān)”等無意義的詞語,合并意義相近的詞,選取詞頻大于等于2的詞繪制圖2。毫不意外,歷史與地理是本次會議的熱詞,代表本次數(shù)字人文會議的探討熱點;從歷史時空來看,又以清代、近代的研究居多,北宋、三國、戰(zhàn)國、民國的史學(xué)研究略有涉及。文本、主題、數(shù)據(jù)、信息表示數(shù)字人文研究的基本單元,而期刊、文獻、資訊、詩歌等詞反映了文本是數(shù)字人文研究最重要的數(shù)據(jù)來源。山水畫、圖像的研究對計算機技術(shù)水平依賴性較大,因此研究難度相對較大。人口、動物、臺風(fēng)、海關(guān)、格局、進士等詞反映了數(shù)字人文的具體研究對象。通過一定的技術(shù)可對歷史中的環(huán)境、政治、經(jīng)濟、人口及動物的變遷與演化進行梳理,并實現(xiàn)可視化呈現(xiàn),因此,數(shù)據(jù)庫、可視化、地圖等詞表示數(shù)字人文研究結(jié)果的呈現(xiàn)方式。GIS為歷史地理領(lǐng)域的研究提供了新視角,是數(shù)字人文在歷史地理領(lǐng)域賴以發(fā)展的重要工具,以GIS為載體的各種主題性地理信息系統(tǒng)成為當前數(shù)字人文的重點研究項目。比如,復(fù)旦大學(xué)歷史地理研究中心建立了中國歷史地理信息系統(tǒng)(CHGIS)[5],臺灣大學(xué)數(shù)位人文研究中心開發(fā)的歷史數(shù)字圖書館采用GIS工具提供“臺灣堡圖”“地形圖”“衛(wèi)星地圖”“古今對照”“行政區(qū)域”五類地理分布圖[6]。設(shè)計、建構(gòu)、初探、構(gòu)想等詞表示數(shù)字人文研究的過程,初探一詞又進一步揭示了目前仍然處于數(shù)字人文研究的起步階段,數(shù)字人文的相關(guān)理論方法,以及從信息整理到知識傳承的實現(xiàn)都需要更長時間的探索。

      圖2 數(shù)字人文研究主題統(tǒng)計圖

      3 數(shù)字人文的學(xué)科結(jié)構(gòu)

      3.1 歷史地理信息技術(shù)

      以地理信息系統(tǒng)(GIS)技術(shù)為依托的空間分析法在經(jīng)濟學(xué)、歷史學(xué)、語言學(xué)、人類學(xué)等人文社會科學(xué)領(lǐng)域得到了深入應(yīng)用,逐漸形成了一套以“空間”為切入點的新型研究方法[7],吸引了眾多學(xué)者。圖3展示了本次會議中歷史地理信息技術(shù)研究的相關(guān)主題。我國臺灣“中研院”的中華文明時空框架以《中國歷史地圖集》以及“當代數(shù)字中國電子地圖”為基礎(chǔ)數(shù)據(jù),建立了中國歷史地理信息系統(tǒng)。我國臺灣“中研院”范毅軍以時空框架整合人、事、物的資訊,以時間為軸,統(tǒng)領(lǐng)不同時期的空間地理信息,形成以數(shù)字地球為基礎(chǔ)的4D時空數(shù)據(jù)整合平臺,提出“空間人文學(xué)”(GeoHumanities)的概念;認為基于大數(shù)據(jù)、大資料、大平臺的支撐,傳統(tǒng)的數(shù)字文檔、數(shù)字人類學(xué)將轉(zhuǎn)化為空間人類學(xué)。我國臺灣“中研院”白璧玲認為,借助歷史地理信息系統(tǒng)(HGIS),以歷史事件為時刻數(shù)據(jù)建構(gòu)模式,結(jié)合電子文獻數(shù)據(jù)庫標注技術(shù),發(fā)展圖文整合的時空信息平臺,可實現(xiàn)數(shù)字文史資源的整合,并向數(shù)字人文跨領(lǐng)域研究發(fā)展[8]。陜西師范大學(xué)的小林雄河和潘威通過挖掘歷史文獻,構(gòu)建東北亞歷史臺風(fēng)信息系統(tǒng),重建臺風(fēng)活動數(shù)據(jù),分析冷暖波動與臺風(fēng)活動的關(guān)系[9]。一套信息平臺僅僅是歷史地理信息的圖文展示,而研究歷史上中國政治、經(jīng)濟、文化的變遷過程,必須建立在準確而詳實的歷代政區(qū)變化基礎(chǔ)上。復(fù)旦大學(xué)徐建平對民國時期的行政區(qū)劃進行了重點研究,發(fā)現(xiàn)了行政區(qū)劃調(diào)整過程中自然因素、文化因素與政區(qū)、行政關(guān)系的互動關(guān)系[10],并展現(xiàn)了原本模糊的省級政區(qū)界限逐漸演變?yōu)榫_的幾何界線的動態(tài)過程[11-13]。徐建平所在的復(fù)旦大學(xué)歷史地理研究中心擬沿用CHGIS的研究方法,復(fù)原自民初至當今全國范圍內(nèi)的各級行政區(qū)劃,建立現(xiàn)當代(1912-2013年)中國行政區(qū)域基礎(chǔ)數(shù)據(jù)庫。

      圖3 歷史地理信息技術(shù)研究的相關(guān)內(nèi)容

      歷史地理信息化的發(fā)展方興未艾,還需積極借鑒與汲取相關(guān)學(xué)科的理論與方法,探索諸如歷史文獻的數(shù)字化、歷史地理數(shù)據(jù)不確定性與精度評價、歷史地名的空間定位與分析等重要問題[14]。北京大學(xué)朱本軍在《GIS與戰(zhàn)國歷史地理研究》的報告中闡述了運用GIS相關(guān)技術(shù)重新審視和回答戰(zhàn)國歷史地理研究中古地名方位定點標繪、交通線路與軍事地理等問題①。南京大學(xué)陳剛等在完成“南京城市古舊地圖數(shù)據(jù)庫”初步建設(shè)的基礎(chǔ)上,提出數(shù)據(jù)庫建設(shè)的主要原則和建設(shè)要點:在前期準備過程中,應(yīng)充分考慮城市歷史地名的類別特征,分析城市歷史地名的語義特征、類別構(gòu)成特征,建立城市歷史地名分類與編碼體系,解決城市歷史地名存儲、管理、查詢等過程中的分類問題[15]。南京師范大學(xué)程星華對三國歷史人物和事件進行梳理,以WebGIS的形式重現(xiàn)三國歷史場景,并提供豐富直觀的交互體驗②。南京師范大學(xué)劉龍雨與胡迪在《讀史方輿紀要》數(shù)據(jù)庫建設(shè)中提出地名挖掘、分類解析的基本原則和方法,為古籍地名數(shù)據(jù)庫建設(shè)和信息化提供借鑒[16]。

      在歷史地理數(shù)據(jù)時空建模、歷史地圖編繪、歷史地理信息系統(tǒng)等歷史地理信息化研究被廣泛關(guān)注的同時,數(shù)字人文為歷史時空中城市變遷、空間演變、地域文化特色的研究提供了新的思路。同濟大學(xué)徐磊青以2015年第一屆大數(shù)據(jù)研發(fā)SODA競賽和上海城市設(shè)計挑戰(zhàn)賽[17]的優(yōu)秀作品為例,通過數(shù)據(jù)平臺上下結(jié)合的方式,分析歷史街區(qū)的保護與更新,發(fā)現(xiàn)在快速發(fā)展的新數(shù)據(jù)環(huán)境下,對于歷史的城市設(shè)計不僅僅是回溯,還有待進行更多的構(gòu)想和探究。在新的研究范式下,地理空間技術(shù)可用于更好地建構(gòu)“空間敘事”及“深度繪圖”,營造一種反思性的、深循環(huán)的、合作性的研究環(huán)境,從而成為未來歷史學(xué)研究的里程碑[18]。天津大學(xué)何捷對空間和行為、認知、社會等現(xiàn)象的多種再現(xiàn)方法進行討論,解讀數(shù)字人文視角下城市歷史研究的途徑和可能③。

      數(shù)字人文一般聚焦于“非政治”的論題,然而,近年來學(xué)者們開始用數(shù)字人文的方法去探索與政治相關(guān)的問題[19]32。復(fù)旦大學(xué)路偉東、王新剛對清末宣統(tǒng)人口的“地理調(diào)查表”進行回溯,梳理現(xiàn)存甘肅調(diào)查表的節(jié)點和信息,近距離觸摸這次人口調(diào)查,發(fā)現(xiàn)城市行政等級與城市人口規(guī)模的真正關(guān)系[20]。中國人民大學(xué)胡恒利用清代州縣的“沖繁疲難”等級劃分制度,借助GIS技術(shù),從空間角度探討清代的政治地理格局,從中看到交通路線、行政事務(wù)以及民風(fēng)的空間差異,同時探討了如何將地理運用于政治研究之中④。

      上述研究與其說是數(shù)字人文在歷史地理領(lǐng)域的應(yīng)用,不如說是歷史地理信息借助GIS技術(shù)的數(shù)字化和信息化呈現(xiàn)。但是,在信息化過程中還需積極探索數(shù)據(jù)的可靠性、歷史空間的定位、文本處理的智能化,以及深化史學(xué)背景研究等問題,以推進歷史地理信息技術(shù)的發(fā)展,促進數(shù)字人文學(xué)科交叉融合的深度發(fā)展。

      3.2 數(shù)字史學(xué)

      19世紀歷史學(xué)家將統(tǒng)計學(xué)引入歷史研究中,被稱為歷史計量學(xué);而后,梁啟超等學(xué)者運用數(shù)學(xué)統(tǒng)計方法寫出歷史計量論著;20世紀后期,歷史計量學(xué)有了更加深入的發(fā)展,這被看成是數(shù)字史學(xué)的雛型[3]12。隨著計算機科學(xué)、信息科學(xué)的迅速發(fā)展,學(xué)界掀起了一股借助計算機技術(shù)、數(shù)學(xué)方法對歷史學(xué)進行研究的新流,也因此誕生了一大批歷史學(xué)典藏數(shù)據(jù)庫。然而,從數(shù)字人文的理念出發(fā),申斌等認為數(shù)字技術(shù)不僅是保存資料的典藏手段和查找資料的檢索工具,還可以協(xié)助研究者重新組織、分析資料,提供一個探索環(huán)境,成為一種數(shù)字史學(xué)的研究方式[21]。本次會議中不少學(xué)者從詞頻、篇章語句、人物的社交網(wǎng)絡(luò)等方面分析介紹了數(shù)學(xué)史學(xué)的方法和應(yīng)用案例(見圖4)。

      圖4 數(shù)字史學(xué)研究的相關(guān)內(nèi)容

      華東師范大學(xué)李林從計量學(xué)的角度,將清代武科進士的人數(shù)變化、年齡、分布區(qū)域、考生來源、競爭力度、文武進士比例等進行分析[22]。上海大學(xué)舒健基于漢語基督教書目文獻數(shù)據(jù)庫,從數(shù)量統(tǒng)計、歷史分期、分布特征等方面對民國天主教的中文報刊進行宏觀分析⑤。山東大學(xué)邱偉云借助“中國近代思想史專業(yè)數(shù)據(jù)庫(1830—1930)”,從詞匯史、概念史、話語論述等視角出發(fā),使用文本挖掘、敘述性統(tǒng)計方法、CUSUM分群法對文獻中“未來”一詞的分布進行視覺化處理,并對單一報刊及多份報刊的“未來”論述結(jié)構(gòu)進行比較分析,藉此拋磚引玉,對數(shù)字史學(xué)展開更多角度的研究⑥。中國科學(xué)院大學(xué)曹志紅等以華南虎為例,對中國歷史動物研究展開傳統(tǒng)史學(xué)與數(shù)字史學(xué)的討論。歷史動物研究脫胎于歷史動物地理學(xué),又超越歷史動物地理學(xué)的研究范疇。在傳統(tǒng)史學(xué)研究中,對歷史動物的研究始終以文獻考述為主,然而有時即使通讀全文也不得其要領(lǐng),因此引入數(shù)字人文技術(shù)和方法,繪制專題圖組,將動物變遷的過程實現(xiàn)直觀化、可視化呈現(xiàn)[23]。上海財經(jīng)大學(xué)王哲、吳松弟在舊海關(guān)對外和埠際貿(mào)易網(wǎng)絡(luò)前期研究[24-25]的基礎(chǔ)上,將多元和復(fù)雜格式的舊海關(guān)貿(mào)易數(shù)據(jù)、文本信息進行整理,建立舊海關(guān)生態(tài)圈,挖掘舊海關(guān)文獻的經(jīng)濟信息和歷史研究價值。

      3.3 圖像視覺化與文學(xué)

      人文科學(xué)包括現(xiàn)代與古典語言學(xué)、文學(xué)、歷史學(xué)、哲學(xué)、宗教學(xué)、神學(xué)、考古學(xué)、藝術(shù)等具有人文主義內(nèi)容和方法的學(xué)科[26]。從目前的國際數(shù)字人文研究來看,研究熱點主要分布于文化遺產(chǎn)數(shù)字化保護、數(shù)字歷史項目開發(fā)、數(shù)字人文基礎(chǔ)設(shè)施和面向數(shù)字人文的圖書館服務(wù)四大領(lǐng)域[1]1。在斯坦福大學(xué)弗朗科·莫瑞蒂(Franco Moretti)的“文學(xué)實驗室”成為具有全球影響力的數(shù)字人文和文學(xué)研究機構(gòu)后,加州大學(xué)、芝加哥大學(xué)相繼成立了類似的數(shù)字文學(xué)研究空間,國內(nèi)學(xué)界也開始關(guān)注這股新的學(xué)術(shù)潮流,開始利用數(shù)字技術(shù)探討文學(xué)、藝術(shù)的相關(guān)問題(見圖5)。

      圖5 圖像視覺化與文學(xué)研究內(nèi)容

      清華大學(xué)嚴程析取《魏其武安侯列傳》中主要人物的相關(guān)線索,在時間線性排列的基礎(chǔ)上標記空間、事件等關(guān)聯(lián)節(jié)點,以量化直觀的方式討論經(jīng)典史傳文章的敘事策略及其特點,展現(xiàn)《史記》所代表的古代敘事文學(xué)的突出成就[27]。浙江大學(xué)姜文濤等認為,“數(shù)字人文”作為一種新的學(xué)術(shù)潮流,正在改變傳統(tǒng)意義上的以紙媒為主要對象、細讀為主要方法的人文學(xué)科研究。他們將數(shù)字人文放在18世紀以來作為近代學(xué)科的英國文學(xué)研究的歷史之中,考察這段歷史對近代學(xué)科分工產(chǎn)生的影響,以及在知識生產(chǎn)轉(zhuǎn)型方面帶來的改變[19]26。浙江大學(xué)何輝斌用統(tǒng)計學(xué)的方法對20世紀翻譯出版的外國文學(xué)進行分析,研究其詞語的使用次數(shù)與排名的位次關(guān)系,最后繪制雙對數(shù)表,在省力原則與費力原則的共同推動下,形成一條有規(guī)律的齊普夫曲線。南京大學(xué)何成洲基于Franco Moretti的遠讀理論,將世界文學(xué)不再視為一個客體對象,而是在時空中形構(gòu)的一個行為或事件;以易卜生的《玩偶之家》為對象,研究小說中人物的思想、作品對中國新文化運動的影響等⑦。

      隨著數(shù)字媒介時代的來臨,由于技術(shù)的介入,圖像和文學(xué)的外部生存環(huán)境及內(nèi)部構(gòu)成要素發(fā)生了變化,造就當前“圖—文”文本轉(zhuǎn)換以及“圖—文”文本融合[28]的數(shù)字化研究環(huán)境,也因此打通了人文藝術(shù)學(xué)科中圖畫、圖像研究的數(shù)字技術(shù)障礙。南京大學(xué)陳靜從媒介轉(zhuǎn)型過程中圖像發(fā)生的改變?nèi)胧?,分析了圖像知識的生成、傳播、呈現(xiàn)方式,并從視覺知識生產(chǎn)的角度討論了數(shù)字人文中的圖像邏輯問題⑧。中國美術(shù)學(xué)院王平認為,綜合運用圖像信息分析、文本關(guān)鍵字研究技術(shù)和觀念史研究成果與技術(shù),能促進數(shù)字人文研究的推廣及新領(lǐng)域的開拓[29]。他以山水畫中出現(xiàn)的“舟船”為數(shù)據(jù)對象,利用數(shù)據(jù)化圖像分析和主題式文本挖掘技術(shù),構(gòu)建五代北宋山水畫的圖像信息數(shù)據(jù)模型,并驗證了圖書數(shù)據(jù)模型和數(shù)字人文研究方法在中國古代繪畫研究中運用的有效性⑨。清華大學(xué)向帆與必果科技CTO朱舜山合作開發(fā)了具有多個圖像關(guān)系映射模型間自由切換能力的Award Puzzle視覺化平臺[30],探討了大規(guī)模人文數(shù)據(jù)中有效挖掘信息的方法。不難發(fā)現(xiàn),不管是在歷史地理還是文學(xué)藝術(shù)學(xué)科的探索,歷史數(shù)據(jù)的獲取都是至關(guān)重要的,而數(shù)據(jù)主要來源于圖書館的古籍藏書、博物館的收藏、民間私藏。近年來互聯(lián)網(wǎng)數(shù)字博物館在我國發(fā)展極為迅速,數(shù)字博物館的平臺優(yōu)勢在很大程度上改變了博物館體制與觀眾視覺交往模式。南京大學(xué)殷曼楟認為,數(shù)字博物館大都延續(xù)了實體博物館的專業(yè)—知識型表征模式,從而導(dǎo)向了傳統(tǒng)的專業(yè)—知識型視覺性;數(shù)字博物館還采用了一種特殊的體驗式形象表征——“萌”,又導(dǎo)向了當下的消費型視覺性。她提出探索公共視覺性建構(gòu)的新路徑:需從如何發(fā)展“個人視覺趣味自覺推動下的形象分享與討論的視覺交往”模式著手[31]。

      3.4 數(shù)字人文的方法與技術(shù)

      科學(xué)技術(shù)的發(fā)展促進了人類文明與社會發(fā)展,可以說任何科學(xué)的發(fā)展都離不開技術(shù)的支持。數(shù)字人文的發(fā)展更離不開數(shù)字計算、關(guān)聯(lián)網(wǎng)絡(luò)、數(shù)據(jù)統(tǒng)計、文本識別、主題分類、數(shù)學(xué)模型等方法技術(shù)的相互映射。數(shù)字人文研究的技術(shù)體系包含了數(shù)字化技術(shù)、數(shù)據(jù)管理技術(shù)和分析技術(shù)、可視化技術(shù)、VR/AR技術(shù)、機器學(xué)習(xí)技術(shù)等,以構(gòu)造數(shù)字人文的資源基礎(chǔ)、應(yīng)用平臺、直觀形象、交互環(huán)境以及智能系統(tǒng),實現(xiàn)智慧服務(wù)[4]37。圖6展現(xiàn)了本次研討會中各位學(xué)者在數(shù)字人文研究中采用的方法與技術(shù)。

      圖6 數(shù)字人文研究的方法與技術(shù)

      文本識別挖掘技術(shù)中文檔到主題、主題到詞的模型構(gòu)造、文本自動分類與有序化是支撐數(shù)字人文研究的基石,也是數(shù)字人文研究走向智能化、大眾化的難點。潛在狄利克雷分配(Latent Dirichlet Allocation,LDA)主題模型是處理非結(jié)構(gòu)化文檔的有效工具,但該模型既不考慮文檔之間的順序關(guān)系,也不考慮單詞之間的順序關(guān)系,精度不高[32]。北京大學(xué)賈金柱介紹了多變點的主題動態(tài)模型方法,發(fā)現(xiàn)Gibbs Sampling算法可以實現(xiàn)Latent Dirichlet Allocation文檔主題生成模型,并用該方法對商業(yè)數(shù)據(jù)進行了模擬研究,證實了其有效性⑩。中國人民大學(xué)王菲菲等利用用戶在主題上相異的分布比例提取各自的興趣話題集合,基于興趣話題集合構(gòu)造一組話題相似性特征,進行間接內(nèi)容的挖掘[33],并認為Class Specified Topic Model(CSTM)作為LDA模型的擴展,可以有效解決文本分類和文本概括的問題,然后以20個新聞組數(shù)據(jù)集合進行實驗分析,證實使用CSTM的文檔分類模型效果更優(yōu)11。

      雖然有這些數(shù)字技術(shù)的支持,但離真正的數(shù)字人文定量研究還有多遠呢?廣西大學(xué)高劍波等介紹了多維尺度方法在小說情節(jié)發(fā)展的量化研究[34],采用分形分析技術(shù)對佛教石窟壁畫以及大量媒體數(shù)據(jù)進行定量研究。北京大學(xué)鄧柯等認為,統(tǒng)計學(xué)思想和方法在數(shù)字人文研究中常常被錯誤地使用和解讀,他們從統(tǒng)計學(xué)的本源出發(fā),從數(shù)據(jù)科學(xué)的視角討論了數(shù)字人文研究中的數(shù)據(jù)分析問題,并以《紅樓夢》《宋史》為例,介紹了無指導(dǎo)中文分析新范式[35]。南京大學(xué)王成軍等采用大規(guī)模的手機通信數(shù)據(jù)構(gòu)建注意力網(wǎng)絡(luò),揭示了線上注意力流動和線下移動行為的機制,以此討論注意力流網(wǎng)絡(luò)在計算傳播研究中的優(yōu)勢與局限性[36]。統(tǒng)計學(xué)和大數(shù)據(jù)技術(shù)為數(shù)字人文的研究注入了很多新的理論和方法,改變了人文學(xué)科傳統(tǒng)的主觀性研究手段,量化數(shù)據(jù)使人文研究的方法體系逐漸豐富和立體。

      4 總結(jié)與思考

      近年來,數(shù)字人文研究發(fā)展迅速,吸引了國內(nèi)學(xué)界的密切關(guān)注,學(xué)者們積極展開研究。本次會議呈現(xiàn)如下特點:(1)以實踐經(jīng)驗交流為主,對數(shù)字人文的概念內(nèi)涵、發(fā)展起源等理論體系少有探討。(2)數(shù)字人文的研究仍處于探索階段,未見固定的研究范式。(3)成果推廣展示較多,對研究方法、過程鮮有分享。(4)研究工作的熱點集中在歷史、地理上,重心停留在采用GIS技術(shù)進行各種主題的歷史數(shù)據(jù)庫建設(shè)上,對史料采集、信息挖掘、圖像轉(zhuǎn)化的智能化及信息化較少討論。(5)研究人員以人文學(xué)科的學(xué)者為主,有計算機、數(shù)學(xué)、統(tǒng)計學(xué)等學(xué)科背景的學(xué)者較少。(6)主要探討數(shù)字人文未來發(fā)展的新思路和新視角,對目前研究工作中的局限和困難少有思考??偠灾?,數(shù)字人文的研究為人文學(xué)科中事件、人物、環(huán)境、政治的變遷賦予了可追溯性及動態(tài)性,提高了歷史數(shù)據(jù)的可用性,為知識的傳播創(chuàng)造了新的途徑和機會。但數(shù)字人文的發(fā)展不是哪一學(xué)科或者哪一個單位的獨角戲,而是各個學(xué)科的協(xié)同創(chuàng)新,各種技術(shù)的有機融合才能有效促進學(xué)科間的資源共享和知識發(fā)現(xiàn),才能為數(shù)字人文的發(fā)展提供一個知識性、創(chuàng)造性的研究環(huán)境,才能為社會發(fā)展綿長歷史中人文精神的傳承起到推動作用。

      數(shù)字人文的研究與圖書館的業(yè)務(wù)發(fā)展息息相關(guān)。圖書館不僅在數(shù)字人文研究中起到史籍查閱、信息采集、資源保障的作用,還為研究中期的資源數(shù)字化、平臺搭建、空間協(xié)調(diào)以及研究后期的數(shù)據(jù)庫使用、成果展現(xiàn)與傳播提供重要支撐??梢哉f,圖書館作為信息資源保障及文化傳播機構(gòu),在數(shù)字人文的發(fā)展中擔(dān)任著資源保障員、信息咨詢員、平臺搭建者、成果傳播員、空間提供者、工具使用培訓(xùn)員等多種角色,為數(shù)字人文研究的多學(xué)科知識需求提供協(xié)同與融合的平臺。隨著數(shù)字人文研究需求的增長,圖書館將打破以紙質(zhì)文獻和電子數(shù)據(jù)庫為主體的傳統(tǒng)資源結(jié)構(gòu)及學(xué)科服務(wù)模式,未來將不斷增加人文專題的館藏資源,搭建文本挖掘、信息利用、知識傳播等多層次的可視化數(shù)字人文平臺,提供立體化的咨詢服務(wù)。數(shù)字人文技術(shù)的發(fā)展為圖書館的轉(zhuǎn)型發(fā)展帶來了新的契機,也帶來了新的挑戰(zhàn)。面對數(shù)字人文新的需求,圖書館應(yīng)當主動融入、積極參與,為數(shù)字人文的研究提供支持與保障,積極探索古籍文獻的收集與保藏,加快歷史資源的電子化及數(shù)字化進程,提高信息有效利用與快速傳播的能力。在數(shù)字人文的研究與實踐中,圖書館將繼續(xù)探索如何將數(shù)字人文的研究需求與自身的業(yè)務(wù)相結(jié)合,解決數(shù)字人文交叉學(xué)科的多重服務(wù)需求與目前讀者或?qū)W科服務(wù)模式的沖突,實現(xiàn)數(shù)字人文研究中知識傳播與文化傳承的相互推進。

      注釋

      ①-11均引自2017年6月30日至7月2日南京大學(xué)主辦的“數(shù)字人文:大數(shù)據(jù)時代人文研究前沿與探索”學(xué)術(shù)研討會中的報告內(nèi)容。

      [1]周晨.國際數(shù)字人文研究特征與知識結(jié)構(gòu)[J].圖書館論壇,2017(4):1-8.

      [2]張梅.以史為橋溝通哈佛與中國——訪哈佛大學(xué)副教務(wù)長包弼德教授[J].華中科技大學(xué)學(xué)報(社會科學(xué)版),2016,30(4):138-140.

      [3]陳海珠,包平.創(chuàng)新人文研究范式的數(shù)字人文——基于數(shù)字人文在史學(xué)研究領(lǐng)域應(yīng)用滲透的文獻考察[J].圖書館理論與實踐,2017(3):11-16.

      [4]劉煒,葉鷹.數(shù)字人文的技術(shù)體系與理論結(jié)構(gòu)探討[J].中國圖書館學(xué)報,2017,43(5):32-41.

      [5]葛劍雄.中國歷史地理學(xué)的發(fā)展基礎(chǔ)和前景[J].東南學(xué)術(shù),2002(4):31-39.

      [6]項潔.數(shù)字人文在歷史學(xué)研究的應(yīng)用[M].臺北:臺灣大學(xué)出版中心,2011.

      [7]ParkerR N,Asencio EK.GISand spatialanalysisfor the social sciences: coding,mapping,and modeling[M].London:JohnWiley,2009.

      [8]白璧玲.歷史地理信息系統(tǒng)于史料數(shù)字化成果之應(yīng)用價值與發(fā)展趨勢[J].國史研究通訊,2014(7):10-14.

      [9]小林雄河,潘威.基于歷史文獻資料的17世紀以來東北亞臺風(fēng)信息挖掘[J].地理研究,2016,35(7):1344-1352.

      [10]徐建平.互動:政府意志與民眾意愿——以民國時期婺源回皖運動為例[J].中國歷史地理論叢,2007,22(1):39-50.

      [11]徐建平.湖灘爭奪與省界成型——以皖北青冢湖為例[J].中國歷史地理論叢,2008,23(3):63-74.

      [12]徐建平.從界限到界線:湖灘開發(fā)與省界成型——以丹陽湖為例[J].史林,2008(3):122-139,194.

      [13]徐建平.民國時期南京特別市行政區(qū)域劃界研究[J].中國歷史地理論叢,2013,28(2):56-70.

      [14]陳剛.“數(shù)字人文”與歷史地理信息化研究[J].南京社會科學(xué),2014(3):136-142.

      [15]于靖,陳剛,李剛.城市歷史地名分類及編碼體系研究[C]//中國城市規(guī)劃學(xué)會.規(guī)劃60年:成就與挑戰(zhàn)——2016中國城市規(guī)劃年會論文集.北京:中國建筑工業(yè)出版社,2016:6.

      [16]劉龍雨,胡迪.《讀史方輿紀要》數(shù)據(jù)庫建設(shè)中地名解析的原則與方法[J].江蘇科技大學(xué)學(xué)報(社會科學(xué)版),2014,14(4):29-34,60.

      [17]文化×衡復(fù):D.A.C.A[EB/OL].[2017-04-02].http://sudc.qxqy.sh.cn/achievement/detail/17.

      [18]David J.Bodenhamer,孫頔,欽白蘭,等.超越地理信息系統(tǒng):地理空間技術(shù)及歷史學(xué)研究的未來[J].文化藝術(shù)研究,2014(1):148-156.

      [19]戴安德,姜文濤,趙薇.數(shù)字人文作為一種方法:西方研究現(xiàn)狀及展望[J].山東社會科學(xué),2016(11):26-33.

      [20]路偉東,王新剛.晚清甘肅城市人口與北方城市人口等級模式——一項基于宣統(tǒng)“地理調(diào)查表”的研究[J].復(fù)旦學(xué)報(社會科學(xué)版),2015,57(4):100-107.

      [21]申斌,楊培娜.數(shù)字技術(shù)與史學(xué)觀念——中國歷史數(shù)據(jù)庫與史學(xué)理念方法關(guān)系探析[J].史學(xué)理論研究,2017(2):87-95.

      [22]李林.清代武科鄉(xiāng)試中額及武舉人群體結(jié)構(gòu)試探[J].史林,2016(6):68-80.

      [23]曹志紅,趙彥風(fēng).人類活動記錄下的江西華南虎歷史分布[J].魯東大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2015,32(6):11-13.

      [24]王哲,吳松弟.中國近代港口貿(mào)易網(wǎng)絡(luò)的空間結(jié)構(gòu)——基于舊海關(guān)對外—埠際貿(mào)易數(shù)據(jù)的分析(1877-1947)[J].地理學(xué)報,2010,65(10):1299-1310.

      [25]王哲.晚清民國對外和埠際貿(mào)易網(wǎng)絡(luò)的空間分析[D].上海:復(fù)旦大學(xué),2010.

      [26]李醒民.知識的三大部類:自然科學(xué)、社會科學(xué)和人文學(xué)科[J].學(xué)術(shù)界,2012(8):9-37,292.

      [27]嚴程.《魏其武安侯列傳》的敘事策略[J].解放軍藝術(shù)學(xué)院學(xué)報,2016(3):133-137.

      [28]李佩穎.數(shù)字媒介時代的“圖—文”互文關(guān)系研究[D].合肥:安徽大學(xué),2016.

      [29]毛建波,王平.北宋山水畫的數(shù)字化研究[J].新美術(shù),2016(12):24-30.

      [30]向帆.視覺文獻的視覺化設(shè)計——全國美展獲獎油畫作品視覺化工具Award Puzzle設(shè)計探索[J].裝飾,2016(7):92-94.

      [31]殷曼楟.尷尬的公共視覺性——論中國數(shù)字博物館制度性依附下的形象表征策略[J].天津社會科學(xué),2016(3):122-127.

      [32]常東亞,嚴建峰,楊璐.基于中心詞的上下文主題模型[EB/OL].[2017-04-01].http://kns.cnki.net/kcms/detail/51.1196.TP.20170401.1739.062.html.

      [33]王菲菲,楊揚,蔣飛,等.面向用戶話題相似性特征的鏈路預(yù)測方法[J].西安交通大學(xué)學(xué)報,2016,50(8):103-109.

      [34]Gao J B,Jockers M L,Laudun J,et al.A multiscale theoryfor the dynamicalevolution ofsentiment in novels[C].//InternationalConferenceonBehavioral,Economic andSocio-CulturalComputing.IEEE,2017:1-4.

      [35]Deng K,Bol P K,Li K J,et al.On the unsupervised analysisof domain-specific Chinese texts[J].Proceedings ofthe NationalAcademy ofSciencesofthe United States ofAmerica,2016,113 (22):6154.

      [36]Wu Lingfei,Wang Chengjun.Tracing the attention of movingcitizens[J].ScientificReports,2016,6:33103.

      猜你喜歡
      數(shù)字人文人文數(shù)字
      人文
      北京紀事(2024年1期)2024-01-03 03:16:55
      答數(shù)字
      人文紹興
      中國三峽(2017年3期)2017-06-09 08:14:59
      數(shù)字學(xué)術(shù)與公眾科學(xué):數(shù)字圖書館新生態(tài)
      跨界與融合:全球視野下的數(shù)字人文
      跨界與融合:全球視野下的數(shù)字人文
      大規(guī)模古籍文本在中國史定量研究中的應(yīng)用探索
      數(shù)字看G20
      人文社科
      全國新書目(2016年5期)2016-06-08 08:54:10
      讓人文光輝照耀未來
      平果县| 讷河市| 卫辉市| 仪征市| 石台县| 四子王旗| 中宁县| 湘阴县| 隆化县| 高邑县| 安丘市| 滦南县| 安化县| 渭源县| 扎兰屯市| 屏山县| 通城县| 太康县| 平遥县| 敦煌市| 张家口市| 东安县| 瑞丽市| 松阳县| 巨鹿县| 和硕县| 行唐县| 长岭县| 封丘县| 南陵县| 孝义市| 天镇县| 修武县| 山阳县| 卢氏县| 东乌| 谷城县| 鹤庆县| 天柱县| 石景山区| 浠水县|