摘要:隨著數(shù)字人文研究領域熱度逐年上升,探究我國數(shù)字人文領域高被引文獻的特征有助于掌握該領域的發(fā)展現(xiàn)狀和研究熱點,為相關研究提供參考和借鑒。文章以中國知網(wǎng)收錄的數(shù)字人文領域高被引文獻為數(shù)據(jù)來源,運用文獻計量學方法及Excel工具對我國數(shù)字人文研究高被引文獻的期刊分布、被引頻次與作者分布、年代變化、機構分布、地區(qū)分布、主題分布、關鍵詞等進行分析與挖掘,并從創(chuàng)建數(shù)字人文研究環(huán)境、構建數(shù)字人文學科人才培養(yǎng)體系等方面提出我國圖書館界支持數(shù)字人文研究的策略。
關鍵詞:數(shù)字人文;高被引文獻;統(tǒng)計分析
中圖分類號:G353 文獻標識碼:A
DOI:10.13897/j.cnki.hbkjty.2021.0036
0 引言
數(shù)字人文(DigitalHumanities)起源于人文計算(HumanitiesComputing),是指運用計算機技術研究傳統(tǒng)人文科學中已有的問題、挖掘和發(fā)現(xiàn)新的“人文導向”的問題[1]。數(shù)字人文研究最早可追溯到20世紀中葉,意大利著名人文學者Roberto Busa為了研究意大利神學家ThomasAquinas所撰寫書籍的敘述方式和文本,與IBM公司合作,運用計算機技術啟動“阿圭那項目”[1]?!鞍⒐缒琼椖俊奔礊槿宋挠嬎愕氖讉€項目。國內(nèi)關于數(shù)字人文研究最早的論文是周瓊和胡禮忠在2012年發(fā)表的《圖書館員在“數(shù)字人文”中的作為——“2011數(shù)字人文國際大會”后的感想》[2],該文章也標志著數(shù)字人文研究開始在國內(nèi)起步。經(jīng)過十多年的發(fā)展,我國在數(shù)字人文領域的研究已經(jīng)取得一定成果。針對國內(nèi)數(shù)字人文研究高被引文獻的特征進行統(tǒng)計與分析,有助于了解國內(nèi)數(shù)字人文領域的發(fā)展現(xiàn)狀和研究熱點,為相關研究提供參考和借鑒。
1 研究方法
1.1 高被引文獻的確定
1.2 數(shù)據(jù)源的確定及檢索方法
本研究以中國知網(wǎng)期刊數(shù)據(jù)庫為數(shù)據(jù)來源,檢索時間為2020年12月7日。以主題或關鍵詞為檢索項,檢索式為“SU=(‘數(shù)字人文+‘人文計算)ORKY=(‘數(shù)字人文+‘人文計算)”,檢索結果為695條。由于已確定被引頻次≥8的文獻為數(shù)字人文的高被引文獻,檢索式為“(SU=(‘數(shù)字人文+‘人文計算) ORKY=(‘數(shù)字人文+‘人文計算))and CF>7”,統(tǒng)計出主題或關鍵詞為(‘數(shù)字人文+‘人文計算)且被引頻次大于7的文獻共133篇。通過人工對文獻數(shù)據(jù)進行清洗,剔除掉無關文獻后得到132篇高被引文獻,總被引頻次2 745次,將所有檢索結果導入Excel表中。本研究主要對這132篇論文進行文獻計量分析,同時采用Excel作為數(shù)據(jù)的主要分析工具和制圖工具。
2 統(tǒng)計結果與分析
2.1 高被引文獻期刊分布
132篇高被引文獻共發(fā)表在45種期刊上。發(fā)表2篇以上高被引文獻的有22種期刊,其余23種期刊各發(fā)表1篇。圖1展示了高被引文獻發(fā)表在圖書情報類期刊與非圖書情報類期刊的占比圖。其中圖書情報類期刊有34種,共發(fā)表高被引文獻119篇,占文獻總數(shù)的90.15%;非圖書情報類期刊11種,發(fā)表高被引文獻13篇,占文獻總數(shù)的9.85%。從表1可知,發(fā)表5篇以上的有8種期刊,共發(fā)表高被引文獻72篇,占文獻總數(shù)的54.55%;被引頻次合計1 752次,占全部高被引文獻總被引頻次的63.83%。發(fā)表5篇以上高被引文獻的8種期刊中,圖書情報學核心期刊8種,非核心期刊0種。
上述數(shù)據(jù)表明,國內(nèi)的圖書情報類期刊刊載了90%以上的數(shù)字人文高被引論文,對數(shù)字人文研究的貢獻最大。發(fā)表5篇以上高被引文獻的8種期刊全部為圖書情報類核心期刊,表明這8種期刊對數(shù)字人文研究成果的發(fā)表有更高的貢獻率,相關研究人員可以重點關注這8種期刊在數(shù)字人文方面的研究,從而更高效地獲取最新研究動態(tài)[6]。
2.2 高被引文獻被引頻次與作者人數(shù)分布
高被引文獻132篇,總被引頻次2 745次,篇均被引頻次20.8次。被引頻次≥50的有10篇;40-49次的3篇,30-39次的8篇,20-29次的17篇,10-19次的71篇,8-9次的23篇。圖2為高被引文獻的被引頻次分布圖,其中橫軸m為被引頻次,縱軸為高被引文獻篇數(shù)。
在132篇高被引文獻里,署名獨立作者的文獻有66篇,占全部高被引文獻的50%;署名2個作者的40篇,占30.3%;署名3個作者的20篇,占15.15%;署名4個及以上作者的6篇,占4.55%。文獻合作率是指由兩位及以上作者共同完成的文獻數(shù)與文獻總數(shù)的比率,由表2高被引文獻作者人數(shù)分布表可知,數(shù)字人文領域的文獻合著率為50%。論文作者合作度是在確定的時域內(nèi)樣本的每
篇論文的平均作者數(shù),它是期刊論文作者合作研究程度的重要指標[7]。數(shù)字人文領域的132篇高被引文獻共涉及173位作者,其作者合作度為1.31。
周晨在《國際數(shù)字人文研究特征與知識結構》[8]中以Web of Science為數(shù)據(jù)來源,統(tǒng)計得到475篇數(shù)字人文論文,作者917位,可知國外數(shù)字人文領域的作者合作度為1.93。高瑾在《量化數(shù)字人文綜述》[9]中提到,Henny-Krahmer與Sahle兩位學者通過分析德語地區(qū)的數(shù)字人文會議DHd2018的論文,發(fā)現(xiàn)其文獻合著率為72.7%。由此可知,雖然國內(nèi)數(shù)字人文領域的作者合作度與文獻合著率都較為不錯,但與國外相比,仍有一定的差距。
2.3 前20篇高被引文獻分析
被引頻次前20名的高被引文獻見表3,被引頻次最高的114次,最后1名33次。前20篇高被引文獻被引頻次合計1 114次,占高被引文獻總被引頻次40.58%,相當于15.15%的高被引文獻貢獻了40.58%的引用頻次。20篇高被引文獻中,上海圖書館的夏翠娟發(fā)表了3篇,北京大學圖書館的朱本軍和聶華、華東師范大學經(jīng)濟與管理學部的許鑫、上海圖書館的張磊、南京大學信息管理學院的趙生輝等5位作者各發(fā)表了2篇,其他作者各發(fā)表了1篇。
被引頻次前20名的文獻共發(fā)表在10種期刊上,其中圖書情報學專業(yè)期刊8種,發(fā)表18篇高被引文獻,另外2篇發(fā)表在《南京社會科學》和《浙江檔案》上。前20名的高被引文獻中,《中國圖書館學報》發(fā)表5篇,《圖書館雜志》發(fā)表4篇,《大學圖書館學報》和《圖書情報工作》各發(fā)表2篇,這4種圖書情報學核心期刊上發(fā)表了65%的前20名高被引文獻,成為數(shù)字人文研究高被引文獻發(fā)表最重要的陣地。
文獻的被引頻次在一定程度上反映了論文的重要程度[1]。根據(jù)表3可知,從被引頻次來看,被引用最高的為《數(shù)字人文的技術體系與理論結構探討》,該文從宏觀層面對數(shù)字人文的整體方法論和理論結構進行研究。從被引前20名文獻的研究對象來看,涉及圖書館、檔案館、博物館、歷史地理信息、家譜、古籍等,表明數(shù)字人文是一個多學科融合的領域,具有研究對象多樣化的特點[1]。從被引前20名文獻的文章主題來看主要包括以下方面:(1)3篇綜述性文獻說明國內(nèi)學者對數(shù)字人文領域的研究仍然處于初始階段,其中《跨界與融合:全球視野下的數(shù)字人文——首屆北京大學“數(shù)字人文論壇”會議綜述》和《國內(nèi)外數(shù)字人文領域研究進展分析》兩篇文獻從全球視角出發(fā),對國內(nèi)外數(shù)字人文領域的研究熱點、實踐和發(fā)展進行闡述;(2)研究數(shù)字人文的技術體系,探索文本可視化分析與挖掘在古籍中的應用、GIS技術在歷史地理信息化方面的應用、關聯(lián)數(shù)據(jù)在家譜服務方面的應用等;(3)研究數(shù)字人文對圖書館的影響,探索圖書館在數(shù)字人文研究中的參與問題和角色定位。
2.4 高被引文獻年代分布
國內(nèi)數(shù)字人文領域研究文獻從2012年開始出現(xiàn),當年即有高被引文獻,133篇高被引文獻分布在2012-2019年(圖3)。除2015年稍有回落外,2016-2018年呈現(xiàn)持續(xù)上升的趨勢。發(fā)表數(shù)字人文研究高被引文獻最多的年份為2016、2017、2018、2019四年,并在2018年達到最高峰47篇。被引頻次最高的文獻也分布在2016、2017、2018、2019四年??紤]到文獻發(fā)表時間的影響因素,理論上較早發(fā)表的文獻,被引用的次數(shù)應當相對較高。反之,引用頻次相同的文獻,如果單純以引用率為考察指標,則先發(fā)表文獻的影響力要低于后發(fā)表的文獻[4]。可見,數(shù)字人文研究領域的文獻,2016年-2019年發(fā)表的高被引文獻,無論從絕對數(shù)量還是影響力方面都更占優(yōu)勢。
2.5 高被引文獻機構分布
以第一作者統(tǒng)計,132篇數(shù)字人文研究高被引文獻分別來自82個機構,發(fā)表3篇以上高被引文獻的機構見表4。
高被引文獻涉及的82個機構中,公共圖書館3個,發(fā)表高被引文獻12篇;高校圖書館31個,發(fā)表高被引文獻44篇;高校院系、研究所47個,發(fā)表高被引文獻75篇;其他機構1個,發(fā)表高被引文獻1篇。高校圖書館、高校院系和研究所發(fā)文量大面廣,作者眾多,合計達到78個機構,占機構總數(shù)的95.12%;高校圖書館、高校院系和研究所發(fā)表的119篇高被引文獻,占高被引文獻總數(shù)的90.15%。由上可知,高校圖書館、高校院系和研究所在機構數(shù)量和高被引文獻篇數(shù)方面都占據(jù)絕對優(yōu)勢。由表5可知,高校圖書館、高校院系和研究所的高被引文獻篇數(shù)、總被引次數(shù)、高被引文獻百分比、篇均被引次數(shù)都比較高,表明高校圖書館、高校院系和研究所發(fā)文較為集中,文獻影響力相對也較大,在數(shù)字人文研究領域起到了理論引領的作用。
2.6 高被引文獻地區(qū)分布
數(shù)字人文研究132篇高被引文獻分布來自國內(nèi)24個地區(qū)及國外2個國家,高被引文獻產(chǎn)出5篇以上的地區(qū)有6個。其中,江蘇省31篇,占全部高被引文獻的23.48%,上海市29篇,北京市17篇,廣東省13篇,湖北省8篇,以上5省市分列高被引文獻數(shù)量的前5位,合計占全部高被引文獻數(shù)量的74.24%。江蘇省和上海市高被引文獻具備明顯優(yōu)勢,不僅數(shù)量大,而且高被引文獻輻射范圍廣,涵蓋了公共圖書館、高校圖書館、高校院系和研究機構。高被引文獻產(chǎn)出5篇以上的地區(qū)見圖4。
2.7 高被引文獻作者分布
以第一作者統(tǒng)計,發(fā)表數(shù)字人文研究高被引文獻5篇的1位,3篇的3位,2篇的13位,1篇的92位。發(fā)表2篇及以上高被引文獻的作者見表6。由表6可知,南京地區(qū)的作者最多,共有5位;其次是上海地區(qū)的作者,共有3位;廣東地區(qū)的作者共有2位。作者的地區(qū)分布與上文2.6中的高被引文獻地區(qū)分布趨勢一致。8位作者所屬機構為高校圖書館,6位作者所屬機構為高校院系與研究所,2位作者所屬機構為公共圖書館,1位作者所屬機構為高校檔案館,與上文2.5中的高被引文獻機構分布趨勢一致。[FL)0]
2.8 高被引文獻關鍵詞分析
文獻關鍵詞體現(xiàn)其學科主題和關注點,高頻關鍵詞則反映該領域的研究熱點。132篇高被引文獻共有288個關鍵詞,被引3次以上的高頻關鍵詞共計27個,見表7。
數(shù)字人文高被引文獻的高頻關鍵詞反映出以下幾點:(1)被引頻次最高的關鍵詞為“數(shù)字人文”123次,第三為“人文計算”14次,屬于數(shù)字人文的2種不同說法,因為數(shù)字人文的概念起源于人文計算。(2)被引頻次較高的是數(shù)字人文的研究主體,依次為“圖書館”20次,“高校圖書館”和“圖書館服務”各6次,“數(shù)字圖書館”4次,“數(shù)字人文館員”3次,表明圖書館是數(shù)字人文研究的主要陣地,尤其以高校圖書館最為活躍。(3)關聯(lián)數(shù)據(jù)、文本挖掘、數(shù)字化、可視化、知識圖譜、社會網(wǎng)絡分析、數(shù)據(jù)挖掘與數(shù)據(jù)倉儲等是進行數(shù)字人文研究的技術與方法,也是數(shù)字人文研究領域的研究熱點,相關關鍵詞共出現(xiàn)12個,分別為“關聯(lián)數(shù)據(jù)”和“文本挖掘”各7次,“大數(shù)據(jù)”6次,“數(shù)字化”和“GIS”各5次,“可視化”和“知識圖譜”各4次,“社會網(wǎng)絡分析”“數(shù)據(jù)挖掘”“數(shù)據(jù)倉儲”和“文本可視化”各3次。(4)其余高頻關鍵詞,概括來講主要是數(shù)字人文研究的應用領域,如特藏資源、知識服務、檔案、古籍文獻,其中“特藏資源”和“知識服務”各4次,“檔案”和“古籍文獻”各3次。
2.9 高被引文獻研究熱點分析
通過有計劃地閱讀梳理獲取到的期刊文獻摘要及全文,并結合上述高頻關鍵詞,得到數(shù)字人文領域研究熱點如下:
第一,數(shù)字人文的概念及研究范疇。數(shù)字人文作為一個新興的跨學科研究領域,由于研究背景和研究內(nèi)容的復雜性,在各領域的研究應用中沒有形成完全統(tǒng)一的研究范式[10],其定義也尚未形成統(tǒng)一認識。從“數(shù)字人文”概念的演化來看,其內(nèi)涵與界限是隨著數(shù)字技術和數(shù)字技術在人文領域的應用而不斷發(fā)展變化[11]。數(shù)字人文的落腳點在人文領域,其努力方向是將數(shù)字技術與人文領域相結合,運用數(shù)字技術提出、探索和解決人文領域的各種人文問題[11]。
第二,數(shù)字人文在人文領域的探索性應用。隨著數(shù)字技術的進步和數(shù)字人文的蓬勃發(fā)展,數(shù)字人文在多個人文領域進行了探索性應用,將其技術、方法與人文學科進行結合,進而提出新的思考方式、獲得新知識。在本文分析的高被引文獻中其應用領域主要集中在以下三個方面:一是檔案領域,二是古籍領域,三是歷史領域。
以歷史和社會記憶為研究對象的檔案領域是數(shù)字人文研究的重要對象和資源,有學者以威尼斯時光機器項目為例,構建數(shù)字人文框架下檔案信息資源開發(fā)模式[12],或是通過案例分析數(shù)字人文對檔案信息資源開發(fā)利用的影響[13]。古籍是人類知識文化的載體,利用數(shù)字人文的技術支持,對古籍進行數(shù)字化的處理、存儲、組織與分析,可以實現(xiàn)對古籍的再生性保護和對古籍所承載文化知識的傳播與傳承[14]。歷史研究在數(shù)字時代何去何從,這是史學理論的宏大問題。哈佛大學以宋代政治為例,從數(shù)字人文視角出發(fā),借助符號分析法對“中國歷代人物資料庫”進行實證探索與可視化分析,為研究宋代黨爭政治格局提供了一種新的思考方式,同時展現(xiàn)了數(shù)字人文技術在人文歷史領域研究中的可行性與巨大潛能[15]。
第三,圖書館與數(shù)字人文。數(shù)字人文是圖書館服務邊界延伸的新興領域,面向數(shù)字人文研究的服務是圖書館新的服務生長點。與高校院系和研究機構對數(shù)字人文研究的切入點不同,圖書館作為資源保存和服務中心,主要任務是利用新的技術手段重組資源,為人文研究者提供更好的服務,輔助人文研究[16]。一方面,引入“數(shù)字人文”的思維,可幫助館藏資源可視化研究擺脫封閉性等限制,最終實現(xiàn)館藏資源可視化的價值[17]。另一方面,圖書館具有館藏及知識優(yōu)勢、技術優(yōu)勢、協(xié)作優(yōu)勢等,所提供的數(shù)字資源管理、數(shù)字學術、文本挖掘、教育和培訓等服務內(nèi)容能夠促進數(shù)字人文研究的開展。
第四,數(shù)字人文教育。數(shù)字人文是近年人文社會學科的研究熱點,而我國在有關數(shù)字人文課程設置及人才培養(yǎng)方面尚未形成系統(tǒng)的框架體系[18]。國內(nèi)相關高被引文獻主要介紹歐美高校數(shù)字人文教育發(fā)展歷程和數(shù)字人文課程設置情況,提出我國數(shù)字人文課程及人才培養(yǎng)建議。
3 結語
經(jīng)過十多年的發(fā)展,數(shù)字人文已得到普遍關注和實踐,并成為人文社會學科的研究熱點。近些年來,數(shù)字人文研究論文連年增長,其發(fā)表陣地主要在圖書情報類期刊,表明數(shù)字人文研究已成為圖書館學情報學研究的持續(xù)熱點之一。數(shù)字人文學科分布呈現(xiàn)以圖書情報檔案學為中心向其他人文學科蔓延的趨勢[1]。
圖書館及高校在數(shù)字人文領域起到了引領的作用,有夏翠娟、劉煒、朱本軍、聶華、柯平等著名學者活躍在這一領域。同時,無論從數(shù)字人文高被引文獻的作者人數(shù)、發(fā)文篇數(shù)還是機構數(shù)量來看,圖書館及高校都是數(shù)字人文研究的主陣地,圖書館員及高校研究人員結合數(shù)字人文實踐發(fā)表了大量研究論文。相較于圖書館和高校,其他機構發(fā)表數(shù)字人文高被引論文的數(shù)量偏少,這也與數(shù)字人文的應用領域有關。
圖書館作為數(shù)字人文研究的主陣地之一,本身擁有大量的相關數(shù)據(jù)庫和古本珍本等館藏資源,這些資源是人文社科類研究人員進行數(shù)字人文研究的重要基礎[19]。針對數(shù)字人文研究的發(fā)展,我國圖書館界未來工作重點:(1)搭建跨學科、跨機構交流平臺,提供資源、技術、服務和空間支持,營造友好的數(shù)字人文研究環(huán)境[20];(2)與高校院系、研究機構合作,突破學科藩籬,構建完整科學的數(shù)字人文學科人才培養(yǎng)體系[1],培養(yǎng)新生代數(shù)字人文館員和數(shù)字人文研究員;(3)建設數(shù)字人文項目孵化器,同時為數(shù)字人文項目成果傳播和轉化提供途徑等方面為數(shù)字人文研究提供支持。
參考文獻
[1]鄧君,宋先智,鐘楚依. 我國數(shù)字人文領域研究熱點及前沿探析[J]. 現(xiàn)代情報,2019, 39(10): 154-164.
[2]周瓊,胡禮忠. 圖書館員在“數(shù)字人文”中的作為——“2011數(shù)字人文國際大會”后的感想[J]. 圖書館建設, 2012(3): 82-84.
[3]祝清松,冷伏海. 基于引文內(nèi)容分析的高被引論文主題識別研究[J]. 中國圖書館學報, 2014, 40(1): 39-49.
[4]李海霞,陳曙光. 閱讀推廣研究高被引論文的統(tǒng)計與分析[J]. 大學圖書情報學刊, 2015, 33(3): 117-122.
[5]劉煒,葉鷹. 數(shù)字人文的技術體系與理論結構探討[J]. 中國圖書館學報, 2017, 43(5): 32-41.
[6]顧琳. 基于文獻計量的我國數(shù)字人文主要研究力量分布分析[J]. 大學圖書情報學刊, 2020, 38(6): 111-116.
[7]劉瑞興. 圖書館學期刊的論文作者合作度[J]. 圖書情報工作, 1991(1): 24-26.
[8]周晨. 國際數(shù)字人文研究特征與知識結構[J]. 圖書館論壇, 2017, 37(4): 1-8.
[9]高瑾. 量化數(shù)字人文綜述[J]. 圖書館論壇 ,2020, 40(1): 54-72.
[10]李慧楠,王曉光. 數(shù)字人文的研究現(xiàn)狀——“2019數(shù)字人文年會”綜述[J]. 情報資料工作, 2020, 41(4): 49-59.
[11]朱本軍,聶華. 數(shù)字人文:圖書館實踐的新方向[J]. 大學圖書館學報, 2017, 35(4): 23-29.
[12]朱令俊. 基于數(shù)字人文的檔案信息資源開發(fā)模式構建和實施研究[J]. 浙江檔案, 2018(12): 21-23.
[13]董聰穎. 穿梭千年:數(shù)字人文對檔案信息資源開發(fā)利用的影響[J]. 檔案管理, 2018(2): 11-14.
[14]魏曉萍. 數(shù)字人文背景下數(shù)字化古籍的深度開發(fā)利用[J]. 農(nóng)業(yè)圖書情報學刊, 2018, 30(9): 106-110.
[15]嚴承希,王軍. 數(shù)字人文視角:基于符號分析法的宋代政治網(wǎng)絡可視化研究[J]. 中國圖書館學報, 2018, 44(5): 87-103.
[16]夏翠娟,張磊,賀晨芝. 面向知識服務的圖書館數(shù)字人文項目建設:方法、流程與技術[J]. 圖書館論壇, 2018, 38(1): 1-9.
[17]張衛(wèi)東,左娜. 面向數(shù)字人文的館藏資源可視化研究[J]. 情報理論與實踐, 2018, 41(9): 102-107.
[18]徐孝娟,侯瑩,趙宇翔,等. 國外數(shù)字人文課程透視——兼議我國數(shù)字人文課程設置及人才培養(yǎng)[J]. 圖書館論壇, 2018, 38(7): 1-11.
[19]王貴海. 我國數(shù)字人文研究演進路徑及圖書館支持策略探析[J]. 圖書館工作與研究, 2019(10): 106-113.
[20]柯平,宮平. 數(shù)字人文研究演化路徑與熱點領域分析[J]. 中國圖書館學報, 2016, 42(6): 13-30.
作者簡介:劉文秋(1987-),女,碩士,廣東財經(jīng)大學圖書館助理館員。研究方向:數(shù)字人文、閱讀推廣。
(收稿日期:2021-01-07 責任編輯:張長安)