王 京,周園春
(中國科學(xué)院 計算機(jī)網(wǎng)絡(luò)信息中心,北京 100190)
如何從大數(shù)據(jù)角度對研究對象的歷史脈絡(luò)進(jìn)行梳理,描繪出覆蓋全領(lǐng)域的學(xué)術(shù)知識圖譜,并圍繞這一主題展開研究趨勢預(yù)測,成了擺在研究者面前的重要命題。本文主要借用數(shù)據(jù)分析的CiteSpace軟件,對特定時空內(nèi)的女媧研究作出學(xué)術(shù)史分期及知識圖譜分析。CiteSpace作為一款基于Java運行環(huán)境的文獻(xiàn)計量分析和可視化軟件,主要基于共引分析(cocitation)理論和尋徑網(wǎng)絡(luò)算法(pathfinder network scaling,PF-NET)等,對特定領(lǐng)域文獻(xiàn)(集合)進(jìn)行計量,以探尋出學(xué)科領(lǐng)域演化的關(guān)鍵路徑及知識轉(zhuǎn)折點,通過一系列可視化圖譜的繪制來形成對學(xué)科演化潛在動力機(jī)制的分析和學(xué)科發(fā)展前沿的探測[1]。利用CiteSpace對CSSCI、CNKI等中文科學(xué)數(shù)據(jù)庫中的女媧神話文獻(xiàn)進(jìn)行主題領(lǐng)域發(fā)現(xiàn)、前沿?zé)狳c分析和歷史演進(jìn)解讀,無疑為本領(lǐng)域研究發(fā)展帶來新的觀察視角。
中國知網(wǎng)中女媧研究數(shù)據(jù)分析首先要合理進(jìn)行數(shù)據(jù)的選擇及篩選。運用CiteSpace對女媧研究文獻(xiàn)進(jìn)行計量分析的環(huán)節(jié)涉及了數(shù)據(jù)采集、數(shù)據(jù)處理、導(dǎo)入軟件、功能選擇、可視化生成圖譜和標(biāo)簽提取、圖譜解讀等幾個重要步驟。就本研究而言,文本數(shù)據(jù)的采集是分析的基礎(chǔ)與前提,鑒于絕大多數(shù)與女媧研究相關(guān)的文獻(xiàn)收錄于中國知網(wǎng)(CNKI)數(shù)據(jù)庫的現(xiàn)實考慮,故筆者在該數(shù)據(jù)庫以“女媧”為主題關(guān)鍵詞進(jìn)行檢索,以所得數(shù)據(jù)涵蓋“CAJD(中國學(xué)術(shù)期刊全文數(shù)據(jù)庫)”“博碩士學(xué)位論文數(shù)據(jù)庫”和“國內(nèi)外重要會議論文全文數(shù)據(jù)庫”等三個子數(shù)據(jù)庫,共獲取2968條文獻(xiàn)數(shù)據(jù)①相關(guān)信息的檢索時間截至2020年12月31日。。這些文獻(xiàn)數(shù)據(jù)的時間跨度為1962-2020年,以包含作者、發(fā)文機(jī)構(gòu)、題名、發(fā)表時間、關(guān)鍵詞、摘要等信息在內(nèi)的Refworks格式導(dǎo)出。
對知網(wǎng)采集的文獻(xiàn)進(jìn)行發(fā)文量年度趨勢分析,可以發(fā)現(xiàn)與女媧相關(guān)的研究以1962年的《女媧傳說史實探源》[2]和《記新疆新發(fā)現(xiàn)的絹畫伏羲女媧像》[3]為發(fā)端,至今已跨越了近60年,發(fā)文數(shù)量呈不斷增長的趨勢(見圖1)。1962-2000年的發(fā)文量一直維持在高位增長狀態(tài),2000年之后關(guān)于女媧的研究成果實現(xiàn)了明顯的數(shù)量積累,特別在2008-2017年十年間,隨著稽考辨古的不斷深入、田野調(diào)研的廣泛開展、研究方法的持續(xù)更新、研究口徑的不斷拓寬和與其他相關(guān)領(lǐng)域的融合發(fā)展,女媧相關(guān)的研究論文均穩(wěn)定在每年120篇以上,這一時期總發(fā)文量占知網(wǎng)收錄全部文獻(xiàn)的50.7%,內(nèi)容關(guān)涉神話人物流布與傳承、人物身份及族屬討論、人物關(guān)系之爭和其象征意義及歷史文化作用之討論,并大有向多學(xué)科、多領(lǐng)域滲透之勢,表現(xiàn)出極強(qiáng)的學(xué)術(shù)關(guān)注度。
圖1 1962-2019年“女媧”主題年度文獻(xiàn)數(shù)量及年度變化量
在運用CiteSpace對上述文獻(xiàn)進(jìn)行具體分析時,考慮到人文社科類在計量分析方面的特殊性,并使得基礎(chǔ)數(shù)據(jù)在“女媧研究”方面更加聚焦,研究首先要對初步搜集的檢索數(shù)據(jù)進(jìn)行篩選,通過“文獻(xiàn)管理中心”平臺將純文學(xué)創(chuàng)作類、文學(xué)教育類、簡訊類和其他明顯與研究分析方向偏離的文獻(xiàn)進(jìn)行刪選。其中純文學(xué)創(chuàng)作類的文章以抒情和傳達(dá)作者情感為核心,幾乎不涉及分析與特定結(jié)論,對研究的指導(dǎo)意義不大,如尹彥慈的《新女媧補(bǔ)天》。簡訊類文獻(xiàn)指的是刊登在期刊或報刊上的傳遞特定方面信息的簡短文章,這類文章一般以介紹性、匯報性和交流性為主,缺少關(guān)鍵詞和摘要,導(dǎo)致分析性和結(jié)論性的信息缺失,與研究本身的關(guān)聯(lián)性較小,如李強(qiáng)的《基于Herstory視角下的女性服飾研究——評陶輝的專著〈性別·服飾·倫理〉》和簡訊說明類文章等。還有一類文獻(xiàn)僅借鑒了“女媧”的名號或概念,以女媧之名,論他山之石,并未涉及女媧研究之根本,所以也排除在本研究的基礎(chǔ)數(shù)據(jù)范疇之外,如包含女媧設(shè)計元素的項目說明類文章《素心園》等。此外,有個別文章發(fā)表在不同的期刊上,為了盡可能保證數(shù)據(jù)的唯一性,通過CiteSpace軟件的除重功能對重復(fù)文獻(xiàn)進(jìn)行剔除,最終得到2236條數(shù)據(jù)。本研究將以這些數(shù)量的文獻(xiàn)為基礎(chǔ),重點就學(xué)界關(guān)注的研究主題、不同時期的研究熱點與女媧研究的發(fā)展趨勢進(jìn)行探討。
通過CiteSpace對1962-2020年的女媧研究者數(shù)據(jù)進(jìn)行分析。2236篇樣本文獻(xiàn)共涉及1917名作者,對其進(jìn)行作者共現(xiàn)分析,可以得到124個節(jié)點,10條連線,網(wǎng)絡(luò)密度為0.0013(見圖2)。其中節(jié)點大小代表發(fā)文數(shù)量多少,節(jié)點之間的連線表示作者之間存在合作關(guān)系,由圖2可見女媧研究作者間合作強(qiáng)度較弱,研究者們更偏向于相對獨立的研究狀態(tài)。
圖2 1962-2020年女媧研究作者合作分析
對本領(lǐng)域?qū)W者的成果展開深入分析發(fā)現(xiàn),發(fā)文量在5篇以上的相對高產(chǎn)作者有9位,他們在女媧研究領(lǐng)域擁有相對深刻和全面的見解,一定程度上可反映出本領(lǐng)域關(guān)注重點和方向側(cè)重(表1)。
表1 女媧研究領(lǐng)域高產(chǎn)作者發(fā)文量及研究內(nèi)容
關(guān)鍵詞是一篇論文主題的高度凝練,論文關(guān)鍵詞與論文主題息息相關(guān)。論文所包含的關(guān)鍵詞信息之間存在著一定的關(guān)聯(lián)性,而這種關(guān)聯(lián)可以用關(guān)鍵詞共現(xiàn)的頻次來表示。通常情況下,在同一篇文獻(xiàn)中出現(xiàn)的次數(shù)越多,則代表這兩個主題的關(guān)系越緊密[4]。共詞分析法(或關(guān)鍵詞共現(xiàn))便是通過全部文獻(xiàn)中的詞匯對或名詞短語共同出現(xiàn)的情況,來確定該文獻(xiàn)集所代表的研究領(lǐng)域中各主題之間的關(guān)系,據(jù)此形成共詞網(wǎng)絡(luò),從而可以直觀捕捉到該研究領(lǐng)域中的重點研究主題、研究熱點、發(fā)展歷程和結(jié)構(gòu)演化。
通過CiteSpace的關(guān)鍵詞共現(xiàn)分析功能對女媧神話相關(guān)論文進(jìn)行參數(shù)和設(shè)定并進(jìn)行圖譜分析。將時間區(qū)間(Time Slicing)劃定在 1962-2020年,時間切片(Tears Per Slice)為 1年,節(jié)點類型(Node Types)為關(guān)鍵詞(Keyword),選擇標(biāo)準(zhǔn)(Selection Criteria)設(shè)定為Top N=50,即從每個時間切片中選擇最常出現(xiàn)的前50個關(guān)鍵詞進(jìn)行分析,同時采用Pathfinder和Pruning the merged network的修剪方式對圖形進(jìn)行優(yōu)化,可以得到289個節(jié)點和293條連線,網(wǎng)絡(luò)密度為0.007。我們發(fā)現(xiàn):首先,出現(xiàn)頻率最高的前幾個關(guān)鍵詞分別為女媧、神話、伏羲、《故事新編》、女媧神話、伏羲氏、漢畫像石等,前10位的高頻關(guān)鍵詞中除“漢畫像石”之外,其首次出現(xiàn)時間均集中在1992-2002年。該段時間是女媧研究迅速發(fā)展的關(guān)鍵時期,研究主題在這段時期內(nèi)已基本定型,相關(guān)論文的數(shù)量及研究的深度與廣度也有了明顯膨脹與擴(kuò)張。其次,“漢畫像石”作為關(guān)鍵詞最早出現(xiàn)在1989年的《南陽漢畫像石中的神話與美學(xué)》[5]中,在此后的15年間該關(guān)鍵詞散見于對特定地區(qū)的葬俗及墓祠畫像石研究[6][7]、漢畫特定紋樣的神話學(xué)闡釋[8][9]等研究中,但大多作為考古及美學(xué)研究之附會,并沒有形成明顯的聚焦于女媧本身的研究主流。2004年之后,相關(guān)文獻(xiàn)大量涌現(xiàn),有59篇之多。涉及的研究專題更加廣泛,主要集中于藝術(shù)形式探討,繪本繪刻內(nèi)涵研究,女媧與伏羲、西王母等共現(xiàn)人物的關(guān)系研究,基于特定漢墓的女媧石刻畫像研究和漢代文化研究,等等。同時,以鄭州大學(xué)和南陽師范學(xué)院為代表的中原地區(qū)高校和研究機(jī)構(gòu)在本領(lǐng)域的研究成果數(shù)量較多,呈現(xiàn)出較為明顯的地域聚集效應(yīng)。第三,中介中心性作為測量節(jié)點在網(wǎng)絡(luò)中重要性的關(guān)鍵指標(biāo),可一定程度上揭示研究熱點之間的突變或轉(zhuǎn)化關(guān)系。具有高中心性的關(guān)鍵詞匯在建構(gòu)女媧研究網(wǎng)絡(luò)中起到了重要作用,結(jié)合時間序列將一定程度上揭示出女媧研究熱點的演進(jìn)規(guī)律。從表2所列的各高頻關(guān)鍵詞的中介中心性可以看出,具有重要影響的節(jié)點按照年份的推移在總體上呈現(xiàn)出如下軌跡:
表2 高頻關(guān)鍵詞及高中心性關(guān)鍵詞
1997年(伏羲)→2004年(中國神話)→2005年(文化內(nèi)涵)→2006年(比較)→2008年(伏羲時代)→2014年(圖像)
上述軌跡中,“比較”“伏羲”和“圖像”的中心性值位列前三位,分別為 0.54、0.47 和 0.46,表現(xiàn)出極強(qiáng)的熱點效應(yīng)。以與女媧相關(guān)的比較研究為例,主要分為以下幾個層次:(1)以女媧等為媒介的中外神話比較研究。進(jìn)行跨文化比較研究的一般前提是將女媧視為始祖神或始母,該類研究專注于探討中外神話女性形象差異、特定類型的文化傳播規(guī)律、文化心理乃至歷史宏觀背景中的文明差異研究,比較常見的地域集中在日本、希臘和泛指的“西方”概念之中。(2)以女媧相關(guān)事跡為關(guān)聯(lián)的民族間比較研究。女媧形象廣泛流傳于多個民族的歷史文化體系之中,與之相關(guān)的跨民族比較研究成果也非常豐富,如探討伏羲女媧在漢族和南方少數(shù)民族之中的流播,將漢族女媧造人神話與滿族三女神造人神話進(jìn)行比較溯源的研究[10],從川西北羌族地區(qū)考察女媧神話蹤跡[11]等。(3)女媧與其他女性神性人物之比較研究。如將女媧與媽祖進(jìn)行神格與價值方面的探討[12],將女媧與神塔婆進(jìn)行歷史功績和現(xiàn)實意義等方面的探討[13],以及通過儒家文化和倫理觀念對女媧與伊邪那美命滲透研究,揭示中日兩國不同的民族心理和文化內(nèi)涵[14]等。
在CiteSpace中,某個聚類所包含的突發(fā)節(jié)點越多,則表示該領(lǐng)域的活躍性越強(qiáng),也能在一定程度上表示出新興的研究熱點與趨勢[15]。對基于女媧研究的關(guān)鍵詞頻次進(jìn)行節(jié)點突發(fā)性探測(Burst detection),可以對其階段性研究熱點和研究方向的躍遷進(jìn)行考察。探測模型(detection model)的基本參數(shù)不變,當(dāng)γ=0.9時,可以得到女媧研究突現(xiàn)詞圖(見圖3)。
圖3 1962-2020年女媧研究突現(xiàn)詞
在與女媧相關(guān)的近60年的研究歷程中,根據(jù)不同時期研究對象、研究內(nèi)容大致可以劃分為三個階段。
第一階段(1962-1991),女媧研究的蓄勢發(fā)展期。該階段前沿問題不突出的主要原因是該時期收錄的文獻(xiàn)數(shù)量較少,無法通過算法進(jìn)行突現(xiàn)主題的獲取,也正是這一客觀原因反映出該時期學(xué)者對于女媧的關(guān)注視角較為分散,特別是隨著民族識別與民族政策的不斷推進(jìn)與完善,以及民族民間文化大調(diào)查,使得女媧研究在廣度和深度上都有了一定的發(fā)展。該時期的女媧研究涵蓋其作為中華民族始祖的溯源研究、新疆等地出土的考古發(fā)現(xiàn)研究、神話與史學(xué)的辯證討論、女媧在文學(xué)作品中的形象探析、民族起源比較研究等諸多方面。如侯哲安在《伏羲女媧與我國南方諸民族》[16]一文強(qiáng)調(diào)伏羲為三皇五帝人文始祖之一,章俊弟在《中國戲劇中的人神戀神話原型》[17]中圍繞中國戲劇中的女神神品與神格展開討論,賈雪楓等在《我國原始社會的性別圖騰》[18]中論證了女媧在自然崇拜和圖騰崇拜中的興衰,等等。上述研究從計量角度來看熱點并不聚焦,并沒有形成穩(wěn)定的關(guān)注熱點,學(xué)者們的興趣點還基本處于流動之中,但究其現(xiàn)實意義,不少在后世形成了重要的研究流派,甚至成為特定時期的研究主流,縱觀女媧研究的全生命周期,該時期起到了非常重要的奠基作用。
第二階段(1992-2002),女媧研究的吸納融合期。從圖3可以看出,該階段包含的突現(xiàn)關(guān)鍵詞有“伏羲氏”“煉五色”“《故事新編》”“伏羲”和“女媧”,其中“煉五色”和“伏羲氏”突現(xiàn)的時間跨度較長,分別為10年和6年,表現(xiàn)出較強(qiáng)的研究熱點效應(yīng)?!盁捨迳币辉~源自“煉五色石以補(bǔ)蒼天,斷鰲足以立四極”①相關(guān)信息的檢索時間截至2020年12月31日。,主要刻畫了女媧補(bǔ)天的過程。該詞不僅出現(xiàn)在民間文學(xué)、民俗學(xué)的研究領(lǐng)域,更延伸至氣象學(xué)、地學(xué)、環(huán)境科學(xué)、材料科學(xué)、邏輯學(xué)等相關(guān)專業(yè)領(lǐng)域范疇,所涉研究主題囊括臭氧層破壞與修復(fù)、古代大地震稽考、新型材料冶煉、二元互補(bǔ)論解讀,等等,借“女媧補(bǔ)天”之引申義實現(xiàn)對跨專業(yè)領(lǐng)域研究的吸引與聚焦的同時產(chǎn)生了更多符合當(dāng)下歷史時期生產(chǎn)生活語境中的新發(fā)展,實現(xiàn)了研究對象的融合和研究范圍的拓展?!胺恕焙汀胺耸稀钡耐滑F(xiàn),表明該時期將女媧與伏羲同時進(jìn)行研究的文獻(xiàn)數(shù)量明顯增多,據(jù)統(tǒng)計有62篇,這些研究主題包括兩者與婚姻制度的考據(jù)、漢墓磚畫中二者的形象探究、與伏羲女媧神話相關(guān)的信仰研究以及二者的關(guān)系研究,等等。相關(guān)論述包括田兆元在《論中華民族神話系統(tǒng)的構(gòu)成及其來源》[19]中提出伏羲女媧屬于中原神話的系統(tǒng);石宗仁在《亦談伏羲女媧》[20]中認(rèn)為伏羲女媧與南蠻中的苗、九黎等存在淵源關(guān)系;易謀遠(yuǎn)在《中華民族祖先是彝族祖靈葫蘆里的伏羲女媧嗎——和劉堯漢先生商討》[21]一文中反駁了中華民族“文化共祖”是彝族祖靈葫蘆里的龍女媧和虎伏羲,并通過民族融合遷移、文化傳播等相關(guān)論述,而得出中華民族的祖先應(yīng)為黃帝、炎帝的結(jié)論,等等。該時期伏羲和女媧逐漸成了一體化的研究對象,實現(xiàn)了研究領(lǐng)域內(nèi)的廣泛融合。
第三階段(2003-2020),女媧研究的多元聚焦期。該階段的研究熱點集中在“創(chuàng)世神話”“神話傳說”“原型”和“圖像”,特別是學(xué)術(shù)界對創(chuàng)世神話相關(guān)研究和圖像學(xué)方面的探究熱情持續(xù)時間均在5年以上,該時期研究主題的典型特征是“多元”與“聚焦”辯證共存。所謂多元,指的是該時期內(nèi)與女媧相關(guān)的研究主題在數(shù)量上實現(xiàn)了顯著的躍遷,在1925篇文獻(xiàn)中,文獻(xiàn)數(shù)量在10篇以上的主題有39個,聚類后涉及女媧神話、伏羲氏、漢畫像石、圖像學(xué)、創(chuàng)世神話、生殖崇拜、遺跡遺俗考據(jù)、人物形象分析、文化價值演變、中外神話人物比較、民間信仰探析、神話學(xué)、母系氏族社會、非物質(zhì)文化遺產(chǎn),等等。學(xué)科分布更加廣泛,涉及中國文學(xué)、宗教、考古、旅游、文化、美術(shù)書法、世界文學(xué)、歷史、地理、中國民族與地方史志、中國語言文學(xué)、哲學(xué)、社會學(xué)等30個學(xué)科,形成了百家爭鳴的學(xué)術(shù)繁榮景象。
而所謂“聚焦”,指的是在每一個主題之中,研究在內(nèi)容和方法論層面的視角更為集中,形成了具有影響力和持續(xù)力的小研究領(lǐng)域。以“創(chuàng)世神話”主題為例,與研究相關(guān)的文獻(xiàn)有84篇,首先,“中國神話”“民族神話”“神話學(xué)”“母題”“開辟神話”“與女媧相關(guān)的神話人物”等核心議題,眾關(guān)鍵詞彼此勾連形成緊密而復(fù)雜的關(guān)系網(wǎng)絡(luò),構(gòu)成了明顯的聚集。由此可見“女媧”與“創(chuàng)世神話”之間的互文與關(guān)照逐步深入,女媧越來越頻繁地出現(xiàn)在創(chuàng)世神話研究和史前文明研究的范疇中,女媧作為中華民族的始祖形象也逐漸得以穩(wěn)固。其次,以“提坦神”“丟卡利翁”等為核心的詞組,該類研究的重點放在了中西方創(chuàng)世神話比較研究和文化價值研究方面,視女媧為東方代表性神話人物之一,具有與西方同等地位女神相比較的必然性。該時期的研究者將女媧神話研究的視野擴(kuò)展到全亞洲乃至西方文明之中,以女媧研究為媒介,勾連起中西方神話研究的橋梁,在比較文學(xué)研究和跨境文化研究方面實現(xiàn)了長足發(fā)展。除此之外,聚集性并不顯著,在數(shù)量和聚集規(guī)模上都無法與前面兩類主題相比,一方面反映出特定研究方向?qū)W者群體的穩(wěn)定性,另一方面也反映出有限數(shù)量的核心主題對全領(lǐng)域研究視線的吸引,也更容易衍生出與之相關(guān)的研究熱點與創(chuàng)新之處。
從數(shù)據(jù)方法應(yīng)用的現(xiàn)實實踐而言,在自然科學(xué)的許多領(lǐng)域已取得實質(zhì)性的進(jìn)展,這主要是基于數(shù)據(jù)本身的客觀、精確與足夠多的數(shù)量。有研究者提出“大致而言,‘大數(shù)據(jù)’偏重于‘?dāng)?shù)據(jù)’的管理、加工和檢索,‘?dāng)?shù)字人文’偏重于數(shù)據(jù)的分析,歷史地理信息系統(tǒng)則偏重于用‘空間’來管理、整合和分析數(shù)據(jù)。且上述三者之間也不是完全可以明確區(qū)分的,如歷史地理信息系統(tǒng)可以被看成為整合大量數(shù)據(jù)的一種方式,從而類似于‘大數(shù)據(jù)’;由于其具有強(qiáng)大的數(shù)據(jù)分析功能,因此也可以被看成是‘?dāng)?shù)字人文’的一部分。同時,‘大數(shù)據(jù)’也囊括了對數(shù)據(jù)的分析,而‘?dāng)?shù)字人文’的分析也需要建立在海量數(shù)據(jù)基礎(chǔ)上。”[22]顯然,相對自然科學(xué)研究而言,人文社會科學(xué)數(shù)據(jù)數(shù)量的產(chǎn)出會影響到結(jié)論的形成,同時,許多分析對象本身具有明顯的主觀判斷成分,這對聚合成為最終具有客觀性的數(shù)據(jù)造成一定的困難。此外由于研究者研究領(lǐng)域和成果產(chǎn)出的個性差異,也會在一定程度上干擾數(shù)據(jù)結(jié)構(gòu)與分析結(jié)果。盡管如此,當(dāng)今信息技術(shù)已與各個領(lǐng)域的生存與發(fā)展緊密聯(lián)系在一起,大數(shù)據(jù)分析方法在社會科學(xué)中的應(yīng)用已經(jīng)顯示出巨大的優(yōu)勢。在今后這種研究新方法的學(xué)術(shù)實踐中,需要我們在查找不足中注意和改進(jìn)如下幾個方面的問題。
一是注意和避免數(shù)據(jù)來源的局限性。通過計量方式對特定領(lǐng)域進(jìn)行研究時,規(guī)范格式的數(shù)據(jù)輸出將起到?jīng)Q定性作用。目前,雖然已有專業(yè)研究機(jī)構(gòu)對古籍善本等文獻(xiàn)進(jìn)行了卓有成效的數(shù)字化工作,形成了一定規(guī)模的電子庫,但短時間內(nèi)難以覆蓋所有領(lǐng)域,更有如一些字跡模糊的碑刻拓帖尚僅停留在圖片存儲形式,大量珍貴的活態(tài)神話封存在影像之中,直接導(dǎo)致數(shù)據(jù)計量分析在溯古方面的斷裂。此外,近現(xiàn)代特別是當(dāng)代研究類成果大量問世,鑒于搜集整理的難度,且涉及版權(quán)問題,導(dǎo)致這些紙版書籍的數(shù)字化程度低,普及率不高,無法實時響應(yīng)數(shù)據(jù)計量分析的需要,無疑成了統(tǒng)籌分析方面的遺憾和缺失。這種情況需要在社科研究的數(shù)據(jù)處理中得到逐步解決。
二是數(shù)據(jù)檢索策略的不規(guī)范性。縱觀相關(guān)專業(yè)的計量分析論文中的數(shù)據(jù)來源,幾乎都鎖定在成熟開放數(shù)據(jù)庫上,而在同一數(shù)據(jù)庫中采取不同的檢索策略,所得結(jié)論也存在差異。數(shù)據(jù)庫的完整程度將直接決定計量分析結(jié)果的客觀性,為進(jìn)一步強(qiáng)化分析結(jié)果,建議遵循以下途徑:一是,若數(shù)據(jù)庫內(nèi)數(shù)據(jù)樣本數(shù)量較小,則需要適當(dāng)改變檢索策略,如增加附加檢索詞、降低檢索詞精確度、擴(kuò)充檢索數(shù)據(jù)庫等;二是,若所得分析結(jié)論與實際偏差過大,適當(dāng)加入研究者的經(jīng)驗與判斷進(jìn)行偏校,以增強(qiáng)結(jié)論的客觀性與科學(xué)性。
三是要努力實現(xiàn)數(shù)據(jù)的完整性。CiteSpace分析的數(shù)據(jù)是以WoS(Web of Science)數(shù)據(jù)為基礎(chǔ)的,這類數(shù)據(jù)結(jié)構(gòu)較為完整,通常包括PT(文獻(xiàn)類型)、AU(作者)、SO(期刊)、DE(關(guān)鍵詞)、AB(摘要)、CI(機(jī)構(gòu))以及CR(參考文獻(xiàn))等,同時包括數(shù)據(jù)庫本身對論文的分類標(biāo)引,所以將這些信息導(dǎo)入CiteSpace之后,將會最大化調(diào)動軟件的分析功能,得到更完整、全面的分析結(jié)論。而以CSSCI(中文社會科學(xué)引文索引)和CNKI等為代表的中文數(shù)據(jù)庫,其數(shù)據(jù)完整性較小,特別是CNKI導(dǎo)出的文獻(xiàn)數(shù)據(jù)中不包含參考文獻(xiàn)等相關(guān)信息,需要借助研究者的經(jīng)驗及判斷進(jìn)行進(jìn)一步分析,在共引分析方面的表現(xiàn)有所不足,甚至特定情況下需要借助傳統(tǒng)研究方法進(jìn)行補(bǔ)充、互證或反證,才能最終得到客觀且具有指導(dǎo)意義的結(jié)論與發(fā)現(xiàn)。