朱 雯,陳 榮,孫濟(jì)慶(華東理工大學(xué)科技信息研究所)
20 世紀(jì)中葉,人們就已經(jīng)意識(shí)到信息研究的關(guān)鍵是準(zhǔn)確地度量信息,而文獻(xiàn)計(jì)量學(xué)作為與信息科學(xué)關(guān)聯(lián)的定量研究領(lǐng)域,[1]其與科學(xué)計(jì)量學(xué)、信息計(jì)量學(xué)、網(wǎng)絡(luò)計(jì)量學(xué)和知識(shí)計(jì)量學(xué)既有聯(lián)系又有區(qū)別。[2-4]文獻(xiàn)計(jì)量學(xué)是信息計(jì)量學(xué)的基礎(chǔ),科學(xué)計(jì)量學(xué)的成果形成了信息計(jì)量學(xué)的重要內(nèi)容和發(fā)展基礎(chǔ),網(wǎng)絡(luò)計(jì)量學(xué)和知識(shí)計(jì)量學(xué)是文獻(xiàn)計(jì)量學(xué)在新時(shí)代的發(fā)展。目前,文獻(xiàn)計(jì)量學(xué)在數(shù)字文獻(xiàn)資源應(yīng)用、信息檢索等方面已得到廣泛應(yīng)用,[5-9]一方面,提高了文獻(xiàn)檢索的效率和效果,為學(xué)術(shù)影響力的評(píng)價(jià)提供數(shù)據(jù)支持;另一方面,有力助推了學(xué)術(shù)檢索系統(tǒng)的大數(shù)據(jù)技術(shù)的繁榮發(fā)展。在此時(shí)代背景下,學(xué)術(shù)文獻(xiàn)檢索系統(tǒng)作為信息時(shí)代的產(chǎn)物,人們對(duì)其提出了更高的要求。
Morris 等人指出基于某種關(guān)系的科學(xué)計(jì)量方法只能從某一方面反映出對(duì)科學(xué)領(lǐng)域的有限認(rèn)識(shí)。[10]伴隨著科技文獻(xiàn)數(shù)量的爆炸式增長(zhǎng)以及文獻(xiàn)類(lèi)型的不斷豐富,來(lái)自新渠道、新載體的新的數(shù)據(jù)類(lèi)型源源不斷的產(chǎn)生,拓展了可供科學(xué)計(jì)量分析的關(guān)系類(lèi)型,而如何充分利用當(dāng)前多類(lèi)型的數(shù)據(jù)和多種計(jì)量關(guān)系,并對(duì)多源數(shù)據(jù)的文獻(xiàn)計(jì)量功能進(jìn)行優(yōu)化,則成為提高科學(xué)計(jì)量分析能力的重要突破方向之一。
目前,多源數(shù)據(jù)還沒(méi)有一個(gè)較為統(tǒng)一的概念,參照化柏林[11]、許海云[12]等人的研究,筆者認(rèn)為多源數(shù)據(jù)是指不同類(lèi)型的來(lái)源信息或關(guān)系數(shù)據(jù)。在此基礎(chǔ)上,將學(xué)術(shù)數(shù)據(jù)庫(kù)和學(xué)術(shù)搜索引擎作為多源數(shù)據(jù)的研究對(duì)象。這里的學(xué)術(shù)數(shù)據(jù)庫(kù)是指在計(jì)算機(jī)可讀介質(zhì)上,使用一定方法將學(xué)術(shù)類(lèi)信息組織起來(lái)的信息集合,[13]其研究主要集中在檢索方法、收錄范圍、檢索結(jié)果分析比較等方面;[14-17]而學(xué)術(shù)搜索引擎是指通過(guò)組織、管理和維護(hù)網(wǎng)絡(luò)中的學(xué)術(shù)信息,用戶經(jīng)一個(gè)檢索入口,便能快速獲取網(wǎng)絡(luò)學(xué)術(shù)信息,[18]其研究主要探討文獻(xiàn)來(lái)源、檢索功能、檢索結(jié)果以及其與傳統(tǒng)數(shù)據(jù)庫(kù)的差別。[19-22]
綜觀多源數(shù)據(jù)的相關(guān)研究發(fā)現(xiàn),目前的研究較多聚焦于利用多源數(shù)據(jù)的文獻(xiàn)數(shù)據(jù)進(jìn)行文獻(xiàn)計(jì)量分析,[23-26]而對(duì)其文獻(xiàn)計(jì)量功能的研究涉及較少。本文以學(xué)術(shù)搜索引擎(谷歌學(xué)術(shù)、百度學(xué)術(shù))和學(xué)術(shù)數(shù)據(jù)庫(kù)(Web of Science、Scopus、中國(guó)知網(wǎng)和維普數(shù)據(jù)庫(kù))為研究對(duì)象,在研究多源數(shù)據(jù)的文獻(xiàn)計(jì)量功能發(fā)展歷程的基礎(chǔ)上,從數(shù)據(jù)來(lái)源、計(jì)量?jī)?nèi)容、計(jì)算方法和結(jié)果呈現(xiàn)方式四個(gè)方面比較學(xué)術(shù)搜索引擎與學(xué)術(shù)數(shù)據(jù)庫(kù)的文獻(xiàn)計(jì)量功能,分析文獻(xiàn)計(jì)量功能的發(fā)展特點(diǎn)及其差異,旨在促進(jìn)學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)完善文獻(xiàn)計(jì)量功能,提高用戶的使用效率,為學(xué)術(shù)研究提供更為科學(xué)準(zhǔn)確的文獻(xiàn)計(jì)量結(jié)果。
從20 世紀(jì)80 年代第一次出現(xiàn)文獻(xiàn)計(jì)量功能——“檢索結(jié)果排序”起,學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)的文獻(xiàn)計(jì)量功能已經(jīng)發(fā)展了近40 年,大致可以分為三個(gè)階段。① 簡(jiǎn)單排序計(jì)量階段(20 世紀(jì)80-90 年代)。20 世紀(jì)80 年代,光盤(pán)數(shù)據(jù)庫(kù)出現(xiàn),單一的檢索功能已不能滿足用戶需求,出現(xiàn)文獻(xiàn)發(fā)表年份排序等功能,方便用戶篩選出所需文獻(xiàn)。此時(shí)的文獻(xiàn)計(jì)量功能為簡(jiǎn)單計(jì)量階段,主要表現(xiàn)為相關(guān)性排序、發(fā)表年份排序等。②指數(shù)化和模型化階段(20 世紀(jì)90 年代末-2009 年左右)。20 世紀(jì)90 年代末,網(wǎng)絡(luò)版檢索系統(tǒng)出現(xiàn),用戶可以在短時(shí)間內(nèi)檢索到全球的文獻(xiàn),系統(tǒng)實(shí)現(xiàn)了簡(jiǎn)單文獻(xiàn)分析功能,如索引詞分析等。此時(shí)的文獻(xiàn)計(jì)量功能從簡(jiǎn)單排序計(jì)量轉(zhuǎn)向簡(jiǎn)單分析計(jì)量,計(jì)量?jī)?nèi)容不斷完善。隨著學(xué)科的不斷成熟,評(píng)價(jià)學(xué)術(shù)影響力的需求越來(lái)越大,不同數(shù)據(jù)源開(kāi)始利用自身數(shù)據(jù)資源優(yōu)勢(shì),構(gòu)建了各種復(fù)雜的評(píng)價(jià)指標(biāo)模型,如影響因子、h 指數(shù)等。③ 可視化和智能化階段(2009 至今)。[27]知識(shí)經(jīng)濟(jì)的發(fā)展以及可視化技術(shù)的成熟,不同數(shù)據(jù)源更加重視知識(shí)語(yǔ)義的挖掘,在結(jié)果呈現(xiàn)方面更加多樣化。如利用可視化技術(shù)顯示某領(lǐng)域論文發(fā)展數(shù)量年度分布、關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)等。
從學(xué)術(shù)數(shù)據(jù)庫(kù)文獻(xiàn)計(jì)量功能發(fā)展歷程看,主要經(jīng)歷了簡(jiǎn)單排序計(jì)量、簡(jiǎn)單分析、復(fù)雜的評(píng)價(jià)指標(biāo)分析以及可視化和智能化分析幾個(gè)階段,目前文獻(xiàn)計(jì)量功能發(fā)展到第三階段。
隨著文獻(xiàn)數(shù)據(jù)量的不斷擴(kuò)大,數(shù)據(jù)庫(kù)的檢索功能日益完善。如檢索結(jié)果排序功能,以列表的形式將檢索到的文獻(xiàn)按照文獻(xiàn)的類(lèi)型、文獻(xiàn)的作者、刊載文獻(xiàn)的出版物等內(nèi)容進(jìn)行排序,供用戶篩選。
評(píng)價(jià)分析功能是指學(xué)術(shù)數(shù)據(jù)庫(kù)利用自身引文數(shù)據(jù)等評(píng)價(jià)期刊或作者等的學(xué)術(shù)影響力,如Web of Science中的期刊影響因子、中國(guó)知網(wǎng)的作者h(yuǎn) 指數(shù)、維普數(shù)據(jù)庫(kù)的平均引文率、Scopus 的CiteScore 等。
隨著知識(shí)經(jīng)濟(jì)時(shí)代的到來(lái),文獻(xiàn)的內(nèi)容價(jià)值受到學(xué)者們的重視,學(xué)術(shù)數(shù)據(jù)庫(kù)憑借著深厚的數(shù)據(jù)資源,對(duì)文獻(xiàn)的關(guān)鍵詞、主題詞等進(jìn)行計(jì)量分析,計(jì)量結(jié)果的顯示方式從單一的列表方式向可視化方式發(fā)展,如中國(guó)知網(wǎng)的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖等。
與學(xué)術(shù)數(shù)據(jù)庫(kù)相比,學(xué)術(shù)搜索引擎起步較晚,目前學(xué)術(shù)搜索引擎的文獻(xiàn)計(jì)量功能也已發(fā)展到第三階段。學(xué)術(shù)搜索引擎在學(xué)術(shù)數(shù)據(jù)庫(kù)已有的文獻(xiàn)計(jì)量功能基礎(chǔ)上,不斷完善計(jì)量?jī)?nèi)容,開(kāi)發(fā)了具有自身特色的計(jì)量產(chǎn)品。
谷歌學(xué)術(shù)是谷歌旗下免費(fèi)的學(xué)術(shù)搜索平臺(tái),2004年11 月發(fā)布了第一個(gè)Beta 版,2006 年1 月擴(kuò)展到中文學(xué)術(shù)文獻(xiàn)領(lǐng)域,2012 年推出谷歌學(xué)術(shù)計(jì)量,用來(lái)評(píng)價(jià)各個(gè)領(lǐng)域雜志的影響力。該系統(tǒng)主要包括h 指數(shù)、h核心(h-core)、h 中值(h-median)等。[28]
百度學(xué)術(shù)是百度旗下的免費(fèi)學(xué)術(shù)搜索平臺(tái),旨在將資源檢索技術(shù)和大數(shù)據(jù)挖掘分析能力運(yùn)用于學(xué)術(shù)研究,自2014 年成立以來(lái)推出了研究點(diǎn)分析、相關(guān)熱搜詞分析,具有深入計(jì)量文獻(xiàn)的內(nèi)容特征。
本文從數(shù)據(jù)來(lái)源、計(jì)量?jī)?nèi)容、計(jì)算方法、結(jié)果呈現(xiàn)方式四個(gè)方面對(duì)多源數(shù)據(jù)的文獻(xiàn)計(jì)量功能進(jìn)行比較。
(1) 數(shù)據(jù)來(lái)源是文獻(xiàn)計(jì)量功能的基礎(chǔ),不同的數(shù)據(jù)來(lái)源是導(dǎo)致文獻(xiàn)計(jì)量結(jié)果產(chǎn)生差異的重要原因之一。本文主要從文獻(xiàn)種類(lèi)、文獻(xiàn)數(shù)量、學(xué)科范圍、時(shí)間范圍和國(guó)家范圍五個(gè)方面比較學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)的數(shù)據(jù)來(lái)源,旨在探析導(dǎo)致文獻(xiàn)計(jì)量差異的原因。
(2) 計(jì)量?jī)?nèi)容是文獻(xiàn)計(jì)量功能的重要組成部分,主要根據(jù)文獻(xiàn)的外部特征和內(nèi)容特征進(jìn)行計(jì)量。文獻(xiàn)的外部特征計(jì)量是基于文獻(xiàn)的機(jī)構(gòu)、作者、出版單位、來(lái)源等進(jìn)行計(jì)量,主要有簡(jiǎn)單計(jì)數(shù)統(tǒng)計(jì)和評(píng)價(jià)指標(biāo)統(tǒng)計(jì)兩種統(tǒng)計(jì)方式。簡(jiǎn)單計(jì)數(shù)統(tǒng)計(jì)是指學(xué)術(shù)搜索引擎或?qū)W術(shù)數(shù)據(jù)庫(kù)對(duì)文獻(xiàn)數(shù)量、下載量、被引量等的計(jì)數(shù)統(tǒng)計(jì);評(píng)價(jià)指標(biāo)統(tǒng)計(jì)是指學(xué)術(shù)搜索引擎或?qū)W術(shù)數(shù)據(jù)庫(kù)利用特定數(shù)理模型進(jìn)行計(jì)量分析,評(píng)價(jià)對(duì)象一般為作者和期刊。文獻(xiàn)的內(nèi)容特征計(jì)量是基于關(guān)鍵詞、主題詞、摘要等的計(jì)量。通過(guò)計(jì)量文獻(xiàn)內(nèi)容特征,可以了解某篇文獻(xiàn)的重點(diǎn)研究?jī)?nèi)容以及相關(guān)研究點(diǎn)的研究進(jìn)展等。
(3)計(jì)算方法是文獻(xiàn)計(jì)量?jī)?nèi)容的基礎(chǔ),其主要包含兩種計(jì)算方法:① 利用相關(guān)計(jì)算機(jī)軟件進(jìn)行統(tǒng)計(jì)發(fā)文量、被引量、詞頻等計(jì)數(shù)統(tǒng)計(jì);② 利用文獻(xiàn)信息計(jì)量學(xué)基本規(guī)律的數(shù)學(xué)表達(dá)式和相關(guān)計(jì)算機(jī)軟件建立數(shù)學(xué)模型。[27,29]
(4)結(jié)果呈現(xiàn)方式是學(xué)術(shù)搜索引擎或?qū)W術(shù)數(shù)據(jù)庫(kù)將計(jì)量得到的結(jié)果呈現(xiàn)出來(lái)的方式,而可視化是呈現(xiàn)計(jì)量分析結(jié)果的關(guān)鍵性技術(shù)路徑。[30]除可視化方式外,還包含表格方式。表格方式是利用表格顯示特定數(shù)據(jù),以列表呈現(xiàn)的計(jì)量?jī)?nèi)容主要有時(shí)間分布、語(yǔ)言分布、資源類(lèi)型分布、學(xué)科分布、來(lái)源分布、作者分布、機(jī)構(gòu)分布、國(guó)家/地區(qū)分布、各參考文獻(xiàn)、引證文獻(xiàn)、相關(guān)文獻(xiàn)等??梢暬绞绞峭ㄟ^(guò)圖形和圖像的方式顯示特定的數(shù)據(jù),并進(jìn)行相應(yīng)的交互處理。[31]根據(jù)可視化圖形圖像描述的信息特征關(guān)系不同,可視化分為縱向可視化、橫向可視化和交叉可視化三種主要形式。[32]縱向可視化表現(xiàn)的是某一計(jì)量?jī)?nèi)容隨時(shí)間變化的狀態(tài),用柱狀圖、條形圖、折線圖、散點(diǎn)圖等表示;橫向可視化表現(xiàn)的是在同一時(shí)間狀態(tài)下不同計(jì)量?jī)?nèi)容之間的相互關(guān)系,用柱狀圖、條形圖、網(wǎng)絡(luò)圖等表示;交叉可視化表現(xiàn)的是縱向可視化與橫向可視化相結(jié)合后的總體數(shù)據(jù)的狀態(tài),用網(wǎng)絡(luò)圖或知識(shí)圖譜表示。
本文對(duì)學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)收錄的數(shù)據(jù)來(lái)源進(jìn)行檢索查詢,檢索截止時(shí)間為2018 年4 月1 日,結(jié)果見(jiàn)表1。從表1 中可以看出學(xué)術(shù)搜索引擎中的引文數(shù)據(jù)來(lái)源大于學(xué)術(shù)數(shù)據(jù)庫(kù),谷歌學(xué)術(shù)和百度學(xué)術(shù)收錄的文獻(xiàn)數(shù)量較大,學(xué)科、時(shí)間以及國(guó)家覆蓋范圍廣于學(xué)術(shù)數(shù)據(jù)庫(kù)。原因是學(xué)術(shù)搜索引擎是網(wǎng)絡(luò)中學(xué)術(shù)文獻(xiàn)信息的第三方集成平臺(tái),僅提供網(wǎng)址鏈接,不提供文獻(xiàn)全文,所以數(shù)據(jù)來(lái)源廣泛;而學(xué)術(shù)數(shù)據(jù)庫(kù)是數(shù)據(jù)庫(kù)商與出版社等建立合作關(guān)系,將這些機(jī)構(gòu)出版的期刊、圖書(shū)等資源進(jìn)行數(shù)字化處理,集成在數(shù)據(jù)庫(kù)內(nèi)部,其數(shù)據(jù)來(lái)源少于學(xué)術(shù)搜索引擎。
表1 學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)的數(shù)據(jù)來(lái)源
從表2 中可以看出,① 簡(jiǎn)單計(jì)數(shù)統(tǒng)計(jì)方面,學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)均計(jì)量資源數(shù)量、發(fā)文量、被引量等,但學(xué)術(shù)數(shù)據(jù)庫(kù)的計(jì)量?jī)?nèi)容種類(lèi)多于學(xué)術(shù)搜索引擎,除此之外,Scopus 計(jì)量數(shù)據(jù)庫(kù)之外的文獻(xiàn)閱讀量,如提供文獻(xiàn)社交媒體的閱讀量;② 評(píng)價(jià)指標(biāo)統(tǒng)計(jì)方面,學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)均包含期刊和作者等影響力的計(jì)量;③ 中國(guó)知網(wǎng)注重提供合作作者網(wǎng)絡(luò)圖等計(jì)量?jī)?nèi)容,百度學(xué)術(shù)提供了研究點(diǎn)分析等計(jì)量?jī)?nèi)容;④ 在內(nèi)容特征計(jì)量方面,谷歌學(xué)術(shù)不涉及內(nèi)容特征計(jì)量,中國(guó)知網(wǎng)和維普數(shù)據(jù)庫(kù)重視挖掘各關(guān)鍵詞之間的關(guān)系,并提供專利研究熱點(diǎn)氣泡圖等。
由于內(nèi)容特征計(jì)量涉及的數(shù)學(xué)模型較復(fù)雜,故本文僅探討學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)中簡(jiǎn)單計(jì)數(shù)統(tǒng)計(jì)和評(píng)價(jià)指標(biāo)統(tǒng)計(jì)的計(jì)算方法。研究發(fā)現(xiàn),學(xué)術(shù)數(shù)據(jù)庫(kù)的簡(jiǎn)單計(jì)數(shù)統(tǒng)計(jì)和評(píng)價(jià)指標(biāo)統(tǒng)計(jì)的主要方法與學(xué)術(shù)搜索引擎相似,但也存在一些不同點(diǎn)。
表2 學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)的計(jì)量?jī)?nèi)容
(1)共同點(diǎn)主要有三個(gè)方面。①目的相同,均是評(píng)價(jià)學(xué)術(shù)影響力或?yàn)閷W(xué)術(shù)研究提供數(shù)據(jù)支持。②評(píng)價(jià)指標(biāo)的數(shù)據(jù)主要來(lái)源于被引次數(shù)。③計(jì)算公式主要有三種:一是簡(jiǎn)單求和的計(jì)算方式,如期刊被引量等;二是計(jì)算平均數(shù),如影響因子等;三是計(jì)算中位數(shù),如h 指數(shù)等。
(2)不同點(diǎn)主要有兩個(gè)方面。① 引文數(shù)據(jù)來(lái)源不同。學(xué)術(shù)搜索引擎統(tǒng)計(jì)的引文數(shù)量多于學(xué)術(shù)數(shù)據(jù)庫(kù),如,維普數(shù)據(jù)庫(kù)中學(xué)者h(yuǎn) 指數(shù)的數(shù)據(jù)來(lái)源于期刊;而百度學(xué)術(shù)學(xué)者h(yuǎn) 指數(shù)的數(shù)據(jù)來(lái)源于期刊論文、學(xué)位論文、會(huì)議論文、圖書(shū)、專利等。② 評(píng)價(jià)指標(biāo)統(tǒng)計(jì)時(shí)間范圍不同。如,百度學(xué)術(shù)的影響因子是期刊前2 年發(fā)表的文獻(xiàn)在當(dāng)年百度學(xué)術(shù)中的篇均被引次數(shù);Web of Science 中的立即指數(shù)是期刊當(dāng)年發(fā)表的文獻(xiàn)在當(dāng)年Web of Science 中的篇均被引次數(shù);Scopus 中的CiteScore 是期刊前3 年發(fā)表的文獻(xiàn)在當(dāng)年Scopus 中的篇均被引次數(shù)。
學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)的結(jié)果呈現(xiàn)方式也各異(見(jiàn)表3)。① 學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)的結(jié)果呈現(xiàn)均包含表格方式。② 學(xué)術(shù)數(shù)據(jù)庫(kù)結(jié)果呈現(xiàn)的可視化方式多于學(xué)術(shù)搜索引擎。如,谷歌學(xué)術(shù)不包含可視化方式;而學(xué)術(shù)數(shù)據(jù)庫(kù)中的四大研究對(duì)象均包含可視化方式。百度學(xué)術(shù)包含縱向、橫向和交叉可視化方式,可視化形式多樣;Web of Science 和Scopus 以縱向可視化為主,可視化形式較單一;而中國(guó)知網(wǎng)和維普數(shù)據(jù)庫(kù)還注重知識(shí)圖譜的構(gòu)建,維普數(shù)據(jù)庫(kù)將領(lǐng)域、作品、機(jī)構(gòu)、作者、主題等放于同一張知識(shí)圖譜中,直觀地顯示了各結(jié)點(diǎn)之間的關(guān)系,同時(shí)在任意一個(gè)結(jié)點(diǎn),還可以發(fā)現(xiàn)與之有關(guān)系的結(jié)點(diǎn)(見(jiàn)下圖)。
表3 學(xué)術(shù)搜索引擎和學(xué)術(shù)數(shù)據(jù)庫(kù)的結(jié)果呈現(xiàn)方式
圖 維普數(shù)據(jù)庫(kù)的交叉可視化方式
本文以多源數(shù)據(jù)——學(xué)術(shù)搜索引擎(谷歌學(xué)術(shù)、百度學(xué)術(shù)) 和學(xué)術(shù)數(shù)據(jù)庫(kù)(Web of Science、Scopus、中國(guó)知網(wǎng)和維普數(shù)據(jù)庫(kù))為研究對(duì)象,從計(jì)量功能發(fā)展歷程和功能比較兩個(gè)方面分析學(xué)術(shù)搜索引擎與學(xué)術(shù)數(shù)據(jù)庫(kù)文獻(xiàn)計(jì)量功能的特點(diǎn)及其差異,發(fā)現(xiàn)目前學(xué)術(shù)數(shù)據(jù)庫(kù)和學(xué)術(shù)搜索引擎的文獻(xiàn)計(jì)量功能已發(fā)展至可視化和智能化階段,而學(xué)術(shù)數(shù)據(jù)庫(kù)的文獻(xiàn)計(jì)量功能優(yōu)于學(xué)術(shù)搜索引擎。
(1)計(jì)量功能的發(fā)展歷程。學(xué)術(shù)數(shù)據(jù)庫(kù)的計(jì)量功能起步較早,經(jīng)歷了簡(jiǎn)單排序計(jì)量、指數(shù)化和模型化、可視化和智能化三個(gè)階段,結(jié)果呈現(xiàn)方式則從單一的表格呈現(xiàn)方式發(fā)展到可視化的呈現(xiàn)方式。相對(duì)而言,由于學(xué)術(shù)搜索引擎起步較晚,在學(xué)術(shù)數(shù)據(jù)庫(kù)已有的文獻(xiàn)計(jì)量功能基礎(chǔ)上,其著重于深入挖掘文獻(xiàn)內(nèi)容,為評(píng)價(jià)學(xué)術(shù)影響力推出一系列評(píng)價(jià)指標(biāo)。
(2) 計(jì)量功能的比較。① 數(shù)據(jù)來(lái)源。學(xué)術(shù)搜索引擎的數(shù)據(jù)來(lái)源多于學(xué)術(shù)數(shù)據(jù)庫(kù),但數(shù)據(jù)來(lái)源質(zhì)量有待考量。②計(jì)量?jī)?nèi)容。一方面,學(xué)術(shù)數(shù)據(jù)庫(kù)的計(jì)量?jī)?nèi)容種類(lèi)多于學(xué)術(shù)搜索引擎,二者也越來(lái)越重視在大眾社交類(lèi)(如社交媒體的文獻(xiàn)閱讀數(shù))、使用統(tǒng)計(jì)類(lèi)(如下載次數(shù)) 數(shù)量的計(jì)量;另一方面,學(xué)術(shù)數(shù)據(jù)庫(kù)與學(xué)術(shù)搜索引擎不斷完善影響因子和h 指數(shù)的缺點(diǎn),提出了5 年影響因子、h5 指數(shù)、半衰期、CiteScore等。③計(jì)算方法。學(xué)術(shù)數(shù)據(jù)庫(kù)在簡(jiǎn)單計(jì)數(shù)統(tǒng)計(jì)和評(píng)價(jià)指標(biāo)統(tǒng)計(jì)方面與學(xué)術(shù)搜索引擎相似,但在引文數(shù)據(jù)來(lái)源和評(píng)價(jià)指標(biāo)統(tǒng)計(jì)時(shí)間范圍與學(xué)術(shù)搜索引擎不同。④結(jié)果呈現(xiàn)方式。學(xué)術(shù)搜索引擎與學(xué)術(shù)數(shù)據(jù)庫(kù)在表格呈現(xiàn)方式方面無(wú)差異,但在可視化顯示方面存在顯著差異。如,谷歌學(xué)術(shù)不包含可視化方式,而維普數(shù)據(jù)庫(kù)包含縱向、橫向以及交叉三種可視化方式。
(1)加強(qiáng)社交媒體使用量的計(jì)量,以彌補(bǔ)被引量延遲問(wèn)題。隨著互聯(lián)網(wǎng)的普及以及各種社交媒體軟件的廣泛使用,單一形式的文獻(xiàn)傳播方式已不能滿足人們的需求,出現(xiàn)了多種形式的文獻(xiàn)傳播方式,如微信、微博、Twitter 等。因此,不能使用單一的被引次數(shù)來(lái)評(píng)價(jià)學(xué)術(shù)影響力,學(xué)術(shù)搜索引擎與學(xué)術(shù)數(shù)據(jù)庫(kù)應(yīng)加強(qiáng)社交媒體使用量等的計(jì)量,以此來(lái)彌補(bǔ)被引量延遲等問(wèn)題,為全面地評(píng)價(jià)學(xué)術(shù)影響力提供數(shù)據(jù)支持。
(2)構(gòu)建具有社會(huì)影響力的計(jì)量?jī)?nèi)容,深入探討主體間的相關(guān)關(guān)系。學(xué)術(shù)搜索引擎與學(xué)術(shù)數(shù)據(jù)庫(kù)均提供了一些計(jì)量?jī)?nèi)容,但某些計(jì)量?jī)?nèi)容在學(xué)術(shù)界并沒(méi)有得到廣泛使用,如百度學(xué)術(shù)的研究點(diǎn)分析。因此,學(xué)術(shù)搜索引擎與學(xué)術(shù)數(shù)據(jù)庫(kù)需要構(gòu)建具有社會(huì)影響力的計(jì)量?jī)?nèi)容,如,學(xué)術(shù)搜索引擎網(wǎng)羅文獻(xiàn)信息的各個(gè)社交媒體使用數(shù)據(jù)(如微博等網(wǎng)站的閱讀數(shù)),優(yōu)先提供文獻(xiàn)的社會(huì)影響力評(píng)價(jià)指標(biāo),為全面評(píng)價(jià)學(xué)術(shù)影響力提供數(shù)據(jù)支持;而學(xué)術(shù)數(shù)據(jù)庫(kù)深入挖掘作者合作網(wǎng)絡(luò)關(guān)系,為探討新型作者合作模式提供參考借鑒。
(3) 深入挖掘文獻(xiàn)知識(shí)語(yǔ)義,優(yōu)化可視化方式。目前可視化技術(shù)比較成熟,但在學(xué)術(shù)搜索引擎中的應(yīng)用范圍較窄。未來(lái)學(xué)術(shù)搜索引擎需要加強(qiáng)可視化方式,多元化呈現(xiàn)計(jì)量結(jié)果,學(xué)術(shù)數(shù)據(jù)庫(kù)要不斷完善可視化技術(shù),深入挖掘文獻(xiàn)的知識(shí)語(yǔ)義,將可視化技術(shù)運(yùn)用于顯示各個(gè)知識(shí)元之間的相互關(guān)系,有利于系統(tǒng)更好地為用戶提供知識(shí)服務(wù)以及幫助用戶發(fā)現(xiàn)更多相關(guān)研究點(diǎn),以拓寬研究思維。