大數(shù)據(jù)時代計量學(xué)在學(xué)科評價中的應(yīng)用研究

2016-10-21 09:26:46何文靜邱均平

圖書與情報 2016年4期

關(guān)鍵詞：計量學(xué)評價指標(biāo)大數(shù)據(jù)

何文靜邱均平

摘要：計量學(xué)在學(xué)科評價中的應(yīng)用歷史已久，大數(shù)據(jù)的涌現(xiàn)和計算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展，給計量學(xué)研究模式帶來了機(jī)遇和挑戰(zhàn)。文章從研究方法、研究工具、計量對象、評價結(jié)果四個角度，探究了大數(shù)據(jù)時代對計量學(xué)應(yīng)用于學(xué)科評價的影響。認(rèn)為自動化計量平臺將成為計量學(xué)應(yīng)用于學(xué)科發(fā)展網(wǎng)絡(luò)的下一步趨勢，學(xué)科評價中的計量學(xué)將主要從理論方法研究和在學(xué)科發(fā)展脈絡(luò)深層次粒度研究兩個方面展開。

關(guān)鍵詞：學(xué)科評價；計量學(xué)；大數(shù)據(jù)；評價指標(biāo)

中圖分類號： G25 文獻(xiàn)標(biāo)識碼： A DOI：10.11968/tsyqb.1003-6938.2016080

Metrological Application in Discipline Evaluation in the Background of Big Data

Abstract Metrology has been effectively applied in discipline evaluation for a long time， and now it confronts with challenges due to big data and rapid development of computer network. The paper analyzed the influences of big data on metrology-based discipline evaluation from the perspective of research methods， research tools， metric objects and evaluation results. The paper also claimed that the automated metric platform were supposed to come to stage soon. Then the metric researches of discipline evaluation will mainly focus on two sides， one is about theory and method of metrology， and the other lies in in-depth analysis of discipline development.

Key words discipline evaluation； metrology； big data； evaluation index

學(xué)科評價，即利用相關(guān)學(xué)術(shù)信息對學(xué)科發(fā)展的階段、現(xiàn)狀、水平、前景和學(xué)科結(jié)構(gòu)及學(xué)科之間的相關(guān)度等進(jìn)行評價。大數(shù)據(jù)時代下，越來越多的事物都以數(shù)據(jù)的形式存在，造成數(shù)據(jù)的海量增長。數(shù)據(jù)量龐大和計算機(jī)技術(shù)的發(fā)展，給基于計量的學(xué)科評價研究帶來了機(jī)遇和挑戰(zhàn)，計量對象、計量方法得到了極大地擴(kuò)充。因此，分析大數(shù)據(jù)對計量學(xué)應(yīng)用于學(xué)科評價帶來的影響，明晰基于計量的學(xué)科評價研究今后的研究方向，將具有重要的理論意義。

1 計量學(xué)在學(xué)科評價中的應(yīng)用

計量學(xué)是揭示學(xué)科發(fā)展脈絡(luò)的經(jīng)典方法，主要用于揭示學(xué)科發(fā)展脈絡(luò)的引用網(wǎng)絡(luò)、研究主題、研究熱點(diǎn)和學(xué)科前沿等內(nèi)容特征以及期刊、研究機(jī)構(gòu)、年度分布、作者分布等結(jié)構(gòu)特征。隨著時代的發(fā)展，計量學(xué)在學(xué)科發(fā)展脈絡(luò)中的應(yīng)用有著不同的體現(xiàn)。

20世紀(jì)40、50年代，隨著科技的發(fā)展，圖書、期刊、論文等學(xué)術(shù)文獻(xiàn)膨脹式發(fā)展，為了揭示文獻(xiàn)特征，逐漸形成文獻(xiàn)計量學(xué)。此時的文獻(xiàn)計量需要研究者手工收集整理龐大的文獻(xiàn)信息，費(fèi)時費(fèi)力。這一時期，解決計量分析的數(shù)據(jù)量龐大問題是主要需求。同時，早期文獻(xiàn)計量研究者克服困難，在對物理、化學(xué)等學(xué)科科技文獻(xiàn)的計量分析實(shí)踐中逐漸發(fā)現(xiàn)了布拉德福定律、齊普夫定律等定律，奠定了計量學(xué)的理論基礎(chǔ)、方法基礎(chǔ)。

20世紀(jì)70年代，索引數(shù)據(jù)庫的建立形成了引文數(shù)據(jù)庫，解決了計量分析的數(shù)據(jù)源問題，使研究者無需考慮計量數(shù)據(jù)源龐大的問題，極大地提高了計量的效率。眾多學(xué)者也紛紛以索引數(shù)據(jù)庫作為計量分析的數(shù)據(jù)源，采用計量方法揭示學(xué)科研究熱點(diǎn)、研究趨勢等研究脈絡(luò)。隨著信息技術(shù)的發(fā)展和各種計量軟件的出現(xiàn)，研究者無需考慮計算方法復(fù)雜的問題，可以方便快捷地發(fā)現(xiàn)某學(xué)科的研究脈絡(luò)并通過可視化手段直觀呈現(xiàn)。計量學(xué)在學(xué)科發(fā)展脈絡(luò)服務(wù)的效率得到進(jìn)一步提升。

可以說，索引數(shù)據(jù)庫、計量軟件的出現(xiàn)，解決了計量數(shù)據(jù)源、計量方法的難題，方便了研究者使用計量學(xué)方法研究學(xué)科發(fā)展脈絡(luò)，提升了科研效率。然而在大數(shù)據(jù)時代，索引數(shù)據(jù)庫和各種索引軟件無法完全解決數(shù)據(jù)量龐大、數(shù)據(jù)類型多樣、數(shù)據(jù)處理速度慢這些大數(shù)據(jù)帶來的問題。這是因為，索引數(shù)據(jù)庫是對結(jié)構(gòu)化數(shù)據(jù)的存儲，對于更多的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)無法直接處理，而大數(shù)據(jù)科學(xué)評價數(shù)據(jù)來源不僅局限于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)，數(shù)據(jù)的多樣性和復(fù)雜性給信息計量帶來了新的挑戰(zhàn)，索引數(shù)據(jù)庫只能作為大數(shù)據(jù)時代計量分析數(shù)據(jù)來源的一種；計量軟件雖然進(jìn)一步解決了計量方法的問題，但是處理的數(shù)據(jù)類型是固定的，不能對多類型數(shù)據(jù)進(jìn)行整合處理；索引數(shù)據(jù)庫和計量軟件都無法實(shí)現(xiàn)數(shù)據(jù)自動化快速處理，都需要研究者的人工參與。

為了解決上述問題，就需要進(jìn)一步推動計量學(xué)在學(xué)科發(fā)展脈絡(luò)中的應(yīng)用深度。對多種數(shù)據(jù)源、數(shù)據(jù)類型進(jìn)行多維聚合，將多種計量方法集成為數(shù)據(jù)模式，實(shí)現(xiàn)計量自動化，學(xué)科發(fā)展脈絡(luò)實(shí)時可視化展示的計量平臺，則是計量學(xué)應(yīng)用于學(xué)科發(fā)展網(wǎng)絡(luò)的下一步趨勢。

2 大數(shù)據(jù)時代對計量學(xué)應(yīng)用于學(xué)科評價的影響

信息網(wǎng)站及其學(xué)術(shù)論壇、專家博客等Web新型學(xué)術(shù)資源的不斷涌現(xiàn)，計算機(jī)技術(shù)、計量工具的不斷發(fā)展，對傳統(tǒng)的基于計量學(xué)的學(xué)科評價研究過程中的研究對象、研究方法、研究結(jié)果都產(chǎn)生了較大影響。

2.1 研究方法多元化

傳統(tǒng)計量方法主要依據(jù)科學(xué)文獻(xiàn)產(chǎn)出的數(shù)量和質(zhì)量，從文獻(xiàn)的內(nèi)容特征和結(jié)構(gòu)特征兩個方面對學(xué)科的發(fā)展現(xiàn)狀和水平做出客觀評價，主要運(yùn)用的研究方法是內(nèi)容分析法。隨著文獻(xiàn)數(shù)據(jù)庫的引入，基于引用行為、閱讀行為和下載行為的計量研究越來越多，引文分析方法和社會網(wǎng)絡(luò)分析方法被廣泛使用。社交媒體的發(fā)展給計量學(xué)研究方法也帶來了許多革新，隨著越來越多的科研人員在各種學(xué)術(shù)社區(qū)和社交媒體中發(fā)布、推薦、轉(zhuǎn)載學(xué)術(shù)信息，Altmetrics也應(yīng)運(yùn)而生，它作為一種Web2.0環(huán)境下新的計量方法，更多關(guān)注Web2.0環(huán)境下用戶行為的計量，可以計算用戶對于一篇文獻(xiàn)的瀏覽、下載、注釋、評分、推薦、引用等使用場景[1]，不再局限于依靠引文數(shù)據(jù)和信息系統(tǒng)上有限的用戶日志數(shù)據(jù)。

早期文獻(xiàn)計量學(xué)在學(xué)科評價中的應(yīng)用方法，主要集中在文獻(xiàn)增長、老化規(guī)律及文獻(xiàn)作者分布規(guī)律方面。傳統(tǒng)學(xué)科評價方法包括定量方法、定性方法，其中定量方法中的文獻(xiàn)計量法使用最廣泛，主要是引文分析法、內(nèi)容分析法、聚類分析法等。單一的計量方法對于跨學(xué)科評價并不合適，對自然科學(xué)和社會科學(xué)評價要區(qū)別對待，對受關(guān)注程度小的新領(lǐng)域的識別能力較差。因此，研究方法的整合顯得尤為重要，整合具體體現(xiàn)在定量方法與定性方法的結(jié)合，將不同分析方法組合起來揭示學(xué)科發(fā)展。越來越多的學(xué)者考慮將多種分析方法加以綜合利用。如共引聚類分析與詞頻分析的結(jié)合、共詞分析與引文網(wǎng)絡(luò)的結(jié)合以及同被引分析和文獻(xiàn)耦合分析的結(jié)合等[2]。隨著計算機(jī)技術(shù)的發(fā)展，科研人員在進(jìn)行計量研究時不再局限于簡單的數(shù)理統(tǒng)計分析，可以借助某些工具自動抓取網(wǎng)絡(luò)中可獲取的學(xué)術(shù)信息，并使用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)去人工化計量。此外，可視化方法的發(fā)展彌補(bǔ)了傳統(tǒng)只羅列數(shù)字和文字的簡單統(tǒng)計圖表的缺陷，合作網(wǎng)絡(luò)圖、關(guān)鍵詞圖、雷達(dá)圖等可視化展示方法能更清晰直觀地揭示學(xué)科結(jié)構(gòu)和發(fā)展脈絡(luò)[3]，使得評價指標(biāo)生動易讀。

2.2 計量工具平臺化

計量工具的發(fā)展主要經(jīng)歷了手工書目統(tǒng)計分析處理階段、系統(tǒng)支持的各種索引數(shù)據(jù)庫階段、各種計算機(jī)輔助數(shù)據(jù)處理分析工具階段、網(wǎng)絡(luò)化專用數(shù)據(jù)處理軟件階段、可視化和人工智能階段。目前，學(xué)科評價研究中使用的計量工具主要有SCI、Scopus、CSSCI等引文數(shù)據(jù)庫。由于不同數(shù)據(jù)庫的資源內(nèi)容以及內(nèi)容的揭示程度存在一定的差異，導(dǎo)致傳統(tǒng)使用單一計量工具對揭示學(xué)科結(jié)構(gòu)與發(fā)展存在的局限性，增加了科研人員處理和規(guī)范來源數(shù)據(jù)的難度。同時，不同計量工具對于輸入數(shù)據(jù)的格式不盡相同，對學(xué)科評價的側(cè)重點(diǎn)也存在較大差異，不同計量工具之間存在較強(qiáng)的互補(bǔ)性和結(jié)果上的對比性，多種工具的綜合和集成可以使得結(jié)果更全面準(zhǔn)確。計量工具的平臺化是大數(shù)據(jù)環(huán)境下學(xué)科評價的需要，平臺的典型特征是整合，不僅貢獻(xiàn)資源和服務(wù)，還形成網(wǎng)絡(luò)，充分利用外部資源和服務(wù)，對自有資源、外部資源進(jìn)行深度整合。計量平臺是對跨領(lǐng)域跨系統(tǒng)資源的深度整合，需要一種滿足不同來源、不同種類資源總體需求的抽象的框架化的數(shù)據(jù)模型，同時還要求數(shù)據(jù)在成熟的網(wǎng)絡(luò)框架基礎(chǔ)上與更多的外部數(shù)據(jù)相關(guān)聯(lián)。

現(xiàn)有階段的學(xué)科評價分析多是分項分析，或者是對分項的簡單總結(jié)，缺乏對學(xué)科發(fā)展的全局性總結(jié)分析。大量數(shù)據(jù)的易獲取性和評價方法的不斷優(yōu)化使得學(xué)科發(fā)展總結(jié)性描述與關(guān)鍵性突出同等重要，每個學(xué)科主題下的亮點(diǎn)分析、背景介紹及關(guān)鍵結(jié)論都可通過計量平臺進(jìn)行自動化展現(xiàn)?？蒲腥藛T不再受限于計量工具和計量方法，平臺可以自動整合不同資源，系統(tǒng)化輸出宏觀及微觀層面的學(xué)科評價結(jié)果，實(shí)現(xiàn)對學(xué)科發(fā)展、結(jié)構(gòu)及學(xué)科之間關(guān)系的精準(zhǔn)化、自動化揭示。

2.3 計量對象全面化

數(shù)據(jù)庫中科學(xué)論文作為計量的主要數(shù)據(jù)來源，為其提供了數(shù)量龐大且內(nèi)容豐富的研究對象。然而在大數(shù)據(jù)時代背景下，數(shù)據(jù)生成速度加快，采集實(shí)現(xiàn)自動化，運(yùn)輸和存儲成本降低，數(shù)據(jù)量膨脹，這些特點(diǎn)都對基于科學(xué)論文的傳統(tǒng)計量提出了挑戰(zhàn)。大數(shù)據(jù)和云存儲的發(fā)展為學(xué)科評價研究提供了良好的機(jī)遇，計量對象不再局限于科學(xué)論文，學(xué)術(shù)社區(qū)中的學(xué)術(shù)信息以及網(wǎng)絡(luò)中普遍存在的學(xué)術(shù)信息都可以作為計量研究對象。社會媒體工具打破了傳統(tǒng)以專著和期刊作為主要科學(xué)交流媒介的思想，越來越多的學(xué)者傾向于將自己的學(xué)術(shù)觀點(diǎn)發(fā)布在博客、社區(qū)論壇等非正式媒介上，將開放存取平臺和社交網(wǎng)絡(luò)媒體中的交流行為考慮在內(nèi)，使得計量學(xué)的研究對象得到了極大地擴(kuò)充。

科學(xué)計量的研究對象囊括了一切與科學(xué)發(fā)展相關(guān)的數(shù)據(jù)，隨著開放存取平臺的不斷完善，科研數(shù)據(jù)共享發(fā)展迅速，學(xué)者不再受制于文獻(xiàn)和信息載體，更多關(guān)注數(shù)據(jù)、學(xué)術(shù)記錄和研究者個人。與僅僅反映文獻(xiàn)參考文獻(xiàn)的引用記錄相比，數(shù)據(jù)層面的計量更全面、系統(tǒng)和科學(xué)。將科研生命周期中每個環(huán)節(jié)的科研數(shù)據(jù)視為計量對象，為超越文獻(xiàn)計量提供了全新的視角和觀念，擴(kuò)充了評價的計量對象。從科研人員的角度而言，科研內(nèi)容需要按學(xué)科、主題組織，只有一個研究內(nèi)容是不行的，按主題組織的開放出版物是符合這些要求的學(xué)術(shù)內(nèi)容集合，可以包括科研觀點(diǎn)、學(xué)術(shù)博客、學(xué)術(shù)論文、科研數(shù)據(jù)等內(nèi)容。隨著數(shù)據(jù)庫的不斷優(yōu)化和發(fā)展，傳統(tǒng)統(tǒng)計資料和調(diào)查報告均實(shí)現(xiàn)了電子化，科學(xué)計量的對象不僅僅局限于文獻(xiàn)數(shù)據(jù)庫中的科學(xué)論文，還可以擴(kuò)展使用其他數(shù)據(jù)來源，如國家統(tǒng)計資料、相關(guān)機(jī)構(gòu)網(wǎng)站上的數(shù)據(jù)、調(diào)查報告等。此外，隨著圖書專著的電子化，圖書作為傳統(tǒng)全面的學(xué)術(shù)信息資源，在一定程度上補(bǔ)充了學(xué)科評價體系。

2.4 評價結(jié)果系統(tǒng)化

大數(shù)據(jù)時代的計量是對所有學(xué)術(shù)信息的全面計量，隨著開放存取平臺的發(fā)展、數(shù)據(jù)獲取成本的降低，學(xué)科評價中的計量對象囊括了數(shù)據(jù)庫層面的學(xué)術(shù)文獻(xiàn)信息、學(xué)術(shù)社區(qū)中的學(xué)術(shù)信息以及網(wǎng)絡(luò)中普遍存在的學(xué)術(shù)信息，計量的結(jié)果也更加全面化、系統(tǒng)化。選擇不同的計量對象對于評價的結(jié)果往往會產(chǎn)生顛覆性的影響，在保證評價的合理性和客觀性的基礎(chǔ)上，盡可能選擇可以全面地揭示學(xué)科發(fā)展和結(jié)構(gòu)的對象，將極大地提高評價結(jié)果的科學(xué)性和可靠性。同時，對所有評價指標(biāo)的系統(tǒng)綜合計量也使得評價結(jié)果更加可靠。以閱讀數(shù)、標(biāo)簽數(shù)為代表的新型Altmetrics指標(biāo)與傳統(tǒng)計量指標(biāo)在評價上具有非對稱性，能從不同維度對文獻(xiàn)進(jìn)行揭示，結(jié)合當(dāng)前的學(xué)術(shù)信息環(huán)境，引入恰當(dāng)?shù)脑u價指標(biāo)，可以補(bǔ)充完善傳統(tǒng)的以被引數(shù)量為代表的計量評價指標(biāo)體系。評價對象的全面擴(kuò)充和評價指標(biāo)的優(yōu)化完善很大程度上提高了基于計量學(xué)的學(xué)科評價結(jié)果的科學(xué)性和系統(tǒng)性。

3 大數(shù)據(jù)時代計量學(xué)應(yīng)用于學(xué)科評價的發(fā)展方向

3.1 計量學(xué)基礎(chǔ)理論與方法研究

傳統(tǒng)的學(xué)科評價研究是理論、技術(shù)方法、應(yīng)用共同發(fā)展的。計量平臺化后，應(yīng)用都通過平臺自動化展現(xiàn)，研究方向則主要側(cè)重于對理論和方法的創(chuàng)新、完善和補(bǔ)充計量平臺底層的數(shù)據(jù)模式。以往學(xué)科評價研究中的計量結(jié)果是研究者自己計量統(tǒng)計的，現(xiàn)在通過平臺自動實(shí)現(xiàn)了，所以研究者只需查看結(jié)果即可。既然結(jié)果呈現(xiàn)的難題已經(jīng)解決，值得科研人員關(guān)注的是理論方法的深入研究。

3.1.1 基于多維數(shù)據(jù)聚合的學(xué)科評價

在目前的學(xué)科評價研究中，多數(shù)學(xué)者基于大型分析性數(shù)據(jù)庫對學(xué)科領(lǐng)域的科學(xué)論文進(jìn)行計量分析，運(yùn)用論文數(shù)、引文數(shù)、篇均被引數(shù)、高被引論文數(shù)等指標(biāo)對科研產(chǎn)出進(jìn)行評價。但現(xiàn)有的文獻(xiàn)計量研究中，其數(shù)據(jù)來源仍不足以全面客觀地對學(xué)科發(fā)展進(jìn)行評價，之所以不全面，是因為學(xué)科的發(fā)展水平和前景不僅體現(xiàn)在科學(xué)論文上，還體現(xiàn)在專利成果、研究報告和專著中。而且，隨著開放存取的不斷發(fā)展，網(wǎng)絡(luò)發(fā)表也成為了科研人員公開其科研成果的重要途徑，使得傳統(tǒng)的基于文獻(xiàn)數(shù)據(jù)庫中科研論文的計量方法缺乏全面性、系統(tǒng)性和科學(xué)性。

社交網(wǎng)絡(luò)環(huán)境下，學(xué)者們更愿意使用學(xué)術(shù)社交在線社區(qū)與開放存取平臺進(jìn)行學(xué)術(shù)交流和評論。基于出版物的引用已經(jīng)不是學(xué)術(shù)成果傳播的主要渠道，科學(xué)思想并不總是通過科學(xué)論文的出版進(jìn)行傳播[4]。越來越多的學(xué)者選擇在學(xué)術(shù)網(wǎng)絡(luò)社區(qū)中進(jìn)行評論和推薦。通過分析這些社會化數(shù)據(jù)，了解這些非結(jié)構(gòu)化內(nèi)容中所表達(dá)的學(xué)科發(fā)展趨勢和科研人員的學(xué)術(shù)觀點(diǎn)，使得學(xué)科評價研究能夠迅速準(zhǔn)確地捕捉學(xué)科領(lǐng)域研究前沿和熱點(diǎn)，從而使科研人員能夠更為主動地把握研究走向。這種通過正式文獻(xiàn)引用被程序忽視的科學(xué)知識，在基于科學(xué)交流的過程評價中需要被足夠重視。此外，國外已經(jīng)展開了數(shù)據(jù)級別計量所面對的數(shù)據(jù)出版、引用、共享等問題的相關(guān)研究，實(shí)現(xiàn)科研數(shù)據(jù)知識庫注冊系統(tǒng)以及數(shù)據(jù)元數(shù)據(jù)的整合，同時參考文獻(xiàn)服務(wù)就數(shù)字資源唯一標(biāo)識符（DOI）開展合作。此外，科研人員還可以整合檢索系統(tǒng)中的用戶行為數(shù)據(jù)，作為一種讀者的匿名開放數(shù)據(jù)，支持?jǐn)?shù)據(jù)級別計量的發(fā)展，數(shù)據(jù)級別的計量可為學(xué)科評價提供更為細(xì)致的分析和服務(wù)[5]。通過引入基于數(shù)據(jù)級別的計量，激勵科研人員共享科研數(shù)據(jù)，并為學(xué)科評價提供更為全面的計量對象。

由于期刊發(fā)表具有滯后性，增加學(xué)術(shù)開放平臺、學(xué)術(shù)社區(qū)、社交學(xué)術(shù)信息是否更能反映最新的研究進(jìn)展，都決定著評價結(jié)果的質(zhì)量。如何從海量分散的信息源中獲取準(zhǔn)確有效的揭示學(xué)科發(fā)展動態(tài)的信息，如何組織和處理大量的非結(jié)構(gòu)化數(shù)據(jù)，這些問題都需要科研人員解決。實(shí)現(xiàn)基于期刊文獻(xiàn)庫、學(xué)術(shù)博客、學(xué)術(shù)社區(qū)中的學(xué)術(shù)信息和網(wǎng)絡(luò)中普遍存在的學(xué)術(shù)信息的多維數(shù)據(jù)聚合，是未來計量學(xué)的主要研究方向。

3.1.2 計量評價指標(biāo)的拓展革新

傳統(tǒng)的學(xué)術(shù)文獻(xiàn)的計量評價指標(biāo)主要包括被引頻次和期刊影響因子等，但僅僅通過被引頻次等信息無法全面評估學(xué)術(shù)文獻(xiàn)的影響力[6]。JCR（Journal Citation Report）從期刊層面對學(xué)科的發(fā)展現(xiàn)狀、水平和前景等做出評價，共有六個評價指標(biāo)：總引文數(shù)、論文數(shù)、學(xué)科期刊數(shù)、學(xué)科集合影響因子、學(xué)科集合被引半衰期和學(xué)科集合即時指標(biāo)。有學(xué)者基于社會科學(xué)和自然科學(xué)兩個不同分類對學(xué)科進(jìn)行評價，認(rèn)為傳統(tǒng)JCR的六個指標(biāo)在學(xué)科評價中具有局限性，利用JCR或SCI的引文數(shù)據(jù)進(jìn)行科研評價只適用于單一學(xué)科，并不適用于邊緣學(xué)科或交叉學(xué)科[7]。

在新的學(xué)術(shù)交流模式下，傳統(tǒng)的計量評價指標(biāo)無法適應(yīng)大眾化參與的特點(diǎn)，如隨著數(shù)字化的不斷發(fā)展，科研成果的發(fā)布不再局限于期刊、圖書等正式出版渠道，更多科研成果會發(fā)布在提供開放存取的數(shù)字交流平臺中，科研人員也積極在各種學(xué)術(shù)社區(qū)中進(jìn)行多樣化學(xué)術(shù)交流，如評論、推薦、標(biāo)注、下載、轉(zhuǎn)發(fā)等。因此，新環(huán)境下必須引入多元化的指標(biāo)來對文獻(xiàn)影響力進(jìn)行更全面、更廣泛的測度。

Altmetrics是在社交網(wǎng)絡(luò)工具和開放存取廣泛應(yīng)用于科學(xué)交流活動和科學(xué)成果出版的背景下產(chǎn)生的[8]。它將開放存取平臺和學(xué)術(shù)社交網(wǎng)絡(luò)視為引文網(wǎng)絡(luò)，引入了知名度、熱點(diǎn)和標(biāo)簽密度等評價指標(biāo)。它是基于社會資源多樣化組合的計量，能夠提供更廣泛、更豐富、更及時的學(xué)科評價結(jié)果。Finbar G等[9]檢驗了社會網(wǎng)絡(luò)服務(wù)的計量應(yīng)用結(jié)果，證實(shí)了它們在單篇論文實(shí)際影響力的評估能力。美國國家信息標(biāo)準(zhǔn)組織項目部Nettie Lagace[10]認(rèn)為，引文分析無法對新的、普遍的文獻(xiàn)所產(chǎn)生的影響進(jìn)行衡量，如Twitter、Facebook、博客等社交網(wǎng)絡(luò)工具所產(chǎn)生的文獻(xiàn)。而且，新的學(xué)術(shù)成果形式，如數(shù)據(jù)集、軟件工具、算法或分子結(jié)構(gòu)等，已經(jīng)很常見但是不容易，甚至無法通過傳統(tǒng)的引用指標(biāo)來衡量?？紤]到將其他超越傳統(tǒng)期刊影響因子的新指標(biāo)納入評價體系，不再局限于使用期刊論文的引用數(shù)據(jù)來衡量科研成果的影響力。劉曉娟等[11]將以被引頻次為代表的傳統(tǒng)計量指標(biāo)與以閱讀數(shù)、標(biāo)簽數(shù)為代表的新型Altmetrics指標(biāo)互相結(jié)合，證實(shí)了以閱讀數(shù)和標(biāo)簽數(shù)為代表的選擇性計量指標(biāo)可以在一定程度上評估文獻(xiàn)的影響力，網(wǎng)絡(luò)影響力也應(yīng)當(dāng)作為重要評價指標(biāo)，二者的綜合利用會成為學(xué)科評價的主流。隨著Altmetrics評價內(nèi)容的豐富，會出現(xiàn)按學(xué)科、主題組織的開放出版物，這樣就形成了對開放出版物的評價。

評價內(nèi)容要更加全面，不僅考慮論文數(shù)、引文數(shù)、篇均被引數(shù)、高被引論文數(shù)等發(fā)文和合作主題的指標(biāo)，同時需要將資金投入產(chǎn)出、人員建設(shè)情況、人員流動及其影響考慮進(jìn)來，細(xì)致分析科研人員、機(jī)構(gòu)的合作水平，使得評價指標(biāo)體系更加全面科學(xué)。選擇合適的計量指標(biāo)，思考和評價計量指標(biāo)在學(xué)科評價中的適用范圍和評價功能，對于合理使用計量方法進(jìn)行學(xué)科評價顯得十分必要。隨著計量方法的改善和發(fā)展，學(xué)科評價會更加完善、合理和權(quán)威。其中，評價指標(biāo)從期刊粒度有核心期刊、論文粒度有被引次數(shù)，是否可以加上閱讀量、下載量、收藏、轉(zhuǎn)發(fā)這樣的指標(biāo)，指標(biāo)的權(quán)重如何設(shè)置，這些都是計量評價指標(biāo)需要研究的問題。

3.2 計量學(xué)在學(xué)科發(fā)展脈絡(luò)深層次粒度方面的研究

3.2.1 全文本計量

從手工計量到索引數(shù)據(jù)庫再到全文本數(shù)據(jù)庫、從計算機(jī)技術(shù)到大數(shù)據(jù)技術(shù)的發(fā)展帶來了計量模式的巨大變化?，F(xiàn)階段學(xué)科發(fā)展脈絡(luò)的計量研究中，科研人員在確定數(shù)據(jù)源后，主要通過學(xué)科類目、關(guān)鍵詞和期刊三種途徑進(jìn)行檢索，對于全文本的利用較少。而全文數(shù)據(jù)庫為科研人員提供了豐富的內(nèi)容資源，可以直接閱讀文獻(xiàn)全文，為學(xué)科發(fā)展脈絡(luò)的研究提供了完備的文本數(shù)據(jù)。因此，基于全文本的計量是未來學(xué)科發(fā)展脈絡(luò)研究的趨勢。

不同于以往的題錄或文摘等二次文獻(xiàn)，科研人員可直接獲取全文數(shù)據(jù)庫中的文獻(xiàn)原文，原文系統(tǒng)全面地展示了著者的研究思路及研究成果，囊括了研究方法、目的、數(shù)據(jù)來源等研究所涉及的各個方面。因此，不論是在文獻(xiàn)揭示的深度還是廣度方面，原文都優(yōu)于文摘或關(guān)鍵詞。由于數(shù)量限制，文摘或關(guān)鍵詞只能選取有限的能夠反映文獻(xiàn)內(nèi)容的信息，不能全面地揭示文獻(xiàn)主題，在一定程度上削弱了基于關(guān)鍵詞的計量研究的全面性和準(zhǔn)確性?；谌牡臋z索可以提高檢全率，從而改善計量效果。此外，依據(jù)關(guān)鍵詞對文獻(xiàn)內(nèi)容的揭示程度，可利用全文本分析方法給關(guān)鍵詞分配權(quán)重，關(guān)鍵詞越能反映文獻(xiàn)主題內(nèi)容，其分配的權(quán)重就越高。通過關(guān)鍵詞區(qū)分化，可以更準(zhǔn)確直觀地展示文獻(xiàn)主題，從而提高計量精度。

引文分析法常常用來解釋學(xué)科發(fā)展演化過程，傳統(tǒng)的計量研究中，引文網(wǎng)絡(luò)分析只是簡單利用各種數(shù)學(xué)模型和統(tǒng)計指標(biāo)，對文獻(xiàn)之間的引用和被引用現(xiàn)象進(jìn)行統(tǒng)計分析，通過這些數(shù)據(jù)揭示文獻(xiàn)引用的規(guī)律和特征，以此達(dá)到對學(xué)科發(fā)展趨勢的分析，然而，隨著研究的深入，引文分析也暴露出了一些不足。如引文信息不全面、作者的引用目的不清晰等，單純依靠數(shù)量指標(biāo)，將所有的引用關(guān)系做同等的對待，會造成一些問題。引用行為的復(fù)雜性決定了單純依靠引用和被引相關(guān)的統(tǒng)計指標(biāo)是無法準(zhǔn)確的進(jìn)行引文分析的。只有將引文內(nèi)容加入到引文分析中來，才能解決單純依靠被引頻次帶來的問題。全文本為引文內(nèi)容分析提供了可靠地支持，有學(xué)者就從引用功能[12]、引用重要性[13]、引用情感[14]等對引用內(nèi)容進(jìn)行分析。引文內(nèi)容分析可以彌補(bǔ)傳統(tǒng)計量研究中通過被引量來衡量文獻(xiàn)質(zhì)量的不足，能更為準(zhǔn)確全面地評價文獻(xiàn)的價值和作用，從而使得計量結(jié)果更加可靠。

3.2.2 研究軟件計量

隨著科學(xué)技術(shù)的飛速發(fā)展，學(xué)者在進(jìn)行科學(xué)研究時越來越依賴研究軟件或工具。學(xué)者在進(jìn)行科學(xué)研究時所使用的研究軟件或工具，在一定程度上也與相應(yīng)的科研發(fā)展現(xiàn)狀呈現(xiàn)正相關(guān)性，因此，研究軟件從側(cè)面反映了學(xué)科的發(fā)展脈絡(luò)及現(xiàn)狀。研究方法在各個學(xué)科領(lǐng)域的學(xué)術(shù)研究中都發(fā)揮著至關(guān)重要的作用，許多研究表明了研究方法在各學(xué)科領(lǐng)域的重要性[15-16]，以及領(lǐng)域內(nèi)研究人員對研究方法的重視程度?，F(xiàn)階段的學(xué)科評價研究主要是研究人員基于文獻(xiàn)內(nèi)容的研究主題提取論文中的研究方法、研究軟件，實(shí)現(xiàn)研究軟件和方法級別的計量，從而識別某學(xué)科研究方法、研究軟件的發(fā)展脈絡(luò)，以及規(guī)范軟件的引用。研究軟件和方法級別的計量使得研究人員對學(xué)科領(lǐng)域內(nèi)的研究方法的發(fā)展趨勢有更為清晰全面的了解，研究人員可以更好地選擇合適的研究方法或軟件來開展科學(xué)研究。研究軟件計量主要是通過全文分析提取所使用的研究軟件或研究方法，展示學(xué)科領(lǐng)域內(nèi)研究軟件或方法的發(fā)展脈絡(luò)，并直觀展現(xiàn)其所適用的研究問題和研究環(huán)境，為研究人員的選擇和使用提供可靠地參考。

參考文獻(xiàn)：

[1] 邱均平，余厚強(qiáng).替代計量學(xué)的提出過程與研究進(jìn)展[J].圖書情報工作，2013，57（19）：5-12.

[2] 蘇娜，張志強(qiáng).科學(xué)計量學(xué)中多重關(guān)系融合方法研究進(jìn)展及分析[J].情報科學(xué)，2010，28（9）：1309-1313.

[3] 胡澤文，孫建軍，武夷山.國內(nèi)知識圖譜應(yīng)用研究綜述[J].圖書情報工作，2013，57（3）：131-137.

[4] Priem J，Costello K L.How and why scholars cite on Twitter[J].Proceedings of the American Society for Information Science and Technology，2010，47（1）：1-4.

[5] 顧立平.數(shù)據(jù)級別計量——概念辨析與實(shí)踐進(jìn)展[J].中國圖書館學(xué)報，2015（2）：56-71.

[6] MacRoberts M，MacRoberts R.Problems of citation analysis：A critical review[J].Journal of the American Society for Informat

ion Science，1989，40（5）：342-349.

[7] 余以勝.JCR指標(biāo)的學(xué)科計量與評價研究——以JCR Social Sciences Edition為例[J].重慶大學(xué)學(xué)報（社會科學(xué)版），2008

（1）：76-80.

[8] 邱均平，余厚強(qiáng).論推動替代計量學(xué)發(fā)展的若干基本問題[J].中國圖書館學(xué)報，2015（1）：4-15.

[9] Finbar G，Sharon D C.Altmetrics：rethinking the way we measure[J].Serials Review，2013，1（39）：56-61.

[10] National Information Standard Organization.NISO to develop standards and recommended practices for Altmetrics[EB/OL].[2016-03-23].http：//www.niso.org/news/pr/view？item_key=72efc1097d4caf7b7b5bdf9c54a165818399ec86.

[11] 劉曉娟，周建華，尤斌.基于Mendeley與WoS的選擇性計量指標(biāo)與傳統(tǒng)科學(xué)計量指標(biāo)相關(guān)性研究[J].圖書情報工作，2015，59（3）：112-118.

[12] Abu-Jbara A，Ezra J，Radev D.Purpose and Polarity of Citation：Towards NLP-based Bibliometrics.[J].Hlt-Naacl，2013（6）：596-606.

[13] Wan X，Liu F.Are all literature citations equally important？Automatic citation strength estimation and its applications[J].Journal of the Association for Information Science and Technology，2014，65（9）：1929-1938.

[14] Athar A.Sentiment analysis of citations using sentence structure-based features[C].Proceedings of the ACL 2011 student session.Association for Computational Linguistics，2011：81-87.

[15] 張力，唐健輝，劉永濤，等.中外圖書情報學(xué)研究方法量化比較[J].中國圖書館學(xué)報，2012（2）：21-27.

[16] Ma L.Some philosophical considerations in using mixed methods in library and information science research[J].Journal of American Society for Information Science & Technology，2012，63（9）：1859-1867.

作者簡介：何文靜（1992-），女，武漢大學(xué)信息管理學(xué)院碩士研究生，研究方向：信息計量和科學(xué)評價；邱均平（1947-），男，武漢大學(xué)信息管理學(xué)院教授，博士生導(dǎo)師，研究方向：信息計量和科學(xué)評價。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

大數(shù)據(jù)時代計量學(xué)在學(xué)科評價中的應(yīng)用研究