• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于文獻(xiàn)計(jì)量學(xué)定律的大數(shù)據(jù)應(yīng)用領(lǐng)域發(fā)展規(guī)律研究

      2017-05-26 23:42:02張姣姣劉云程旖婕
      知識管理論壇 2016年5期
      關(guān)鍵詞:大數(shù)據(jù)應(yīng)用

      張姣姣+劉云+程旖婕

      摘要:[目的/意義] 研究大數(shù)據(jù)應(yīng)用領(lǐng)域的研究現(xiàn)狀和發(fā)展趨勢,并揭示其發(fā)展規(guī)律。[方法/過程] 制定大數(shù)據(jù)應(yīng)用技術(shù)的數(shù)據(jù)檢索策略,選取1990-2015年相關(guān)文獻(xiàn)研究數(shù)據(jù),借助計(jì)量軟件VP(Vantage Point)、統(tǒng)計(jì)分析軟件SPSS和Microsoft Excel等工具,分別從載文量分布、期刊分布和作者分布3個(gè)層面,驗(yàn)證并分析該領(lǐng)域文獻(xiàn)發(fā)展是否符合普賴斯科學(xué)文獻(xiàn)增長規(guī)律、布拉德福定律以及洛特卡定律。[結(jié)果/結(jié)論]大數(shù)據(jù)應(yīng)用領(lǐng)域相關(guān)論文自1990年開始,經(jīng)過一段時(shí)間的穩(wěn)步發(fā)展后,至2012年開始顯現(xiàn)突飛猛進(jìn)的發(fā)展,其文獻(xiàn)發(fā)展符合普賴斯科學(xué)文獻(xiàn)增長規(guī)律;文獻(xiàn)樣本的期刊分布基本符合布拉德福定律,并已形成核心期刊群,其中包括BMC BIOINFORMATICS、SENSORS等;該領(lǐng)域著者分布與洛特卡定律相差很大,尚未形成較具影響力的核心著者群。

      關(guān)鍵詞:大數(shù)據(jù)應(yīng)用 普賴斯科學(xué)文獻(xiàn)增長規(guī)律 布拉德福定律 洛特卡定律

      分類號:G250

      引用格式:張姣姣, 劉云, 程旖婕. 基于文獻(xiàn)計(jì)量學(xué)定律的大數(shù)據(jù)應(yīng)用領(lǐng)域發(fā)展規(guī)律研究[J/OL]. 知識管理論壇, 2016, 1(5): 384-392[引用日期]. http://www.kmf.ac.cn/p/1/50/.

      1 引言

      近年來,“大數(shù)據(jù)”引起各國政府、產(chǎn)業(yè)界和科技界的高度關(guān)注。全球范圍內(nèi),運(yùn)用大數(shù)據(jù)推動經(jīng)濟(jì)發(fā)展、完善社會治理、提升政府服務(wù)和監(jiān)管能力正成為趨勢,有關(guān)發(fā)達(dá)國家相繼制定實(shí)施大數(shù)據(jù)戰(zhàn)略性文件,大力推動大數(shù)據(jù)發(fā)展和應(yīng)用[1]。聯(lián)合國“數(shù)據(jù)脈動”計(jì)劃[2]、美國 “大數(shù)據(jù)”戰(zhàn)略[3]、日本“面向2020年的ICT綜合戰(zhàn)略”[4]、韓國大數(shù)據(jù)中心戰(zhàn)略[5]等先后開啟了大數(shù)據(jù)戰(zhàn)略的大幕。大量跨國企業(yè)也進(jìn)入大數(shù)據(jù)研究與開發(fā)領(lǐng)域,如傳統(tǒng)數(shù)據(jù)分析企業(yè)天睿公司(Teradata)、思愛普(SAP)、SPSS以及大數(shù)據(jù)資源企業(yè)谷歌、Facebook等[4]。2008年,Nature雜志出版??疊ig Data,基于多個(gè)學(xué)科的實(shí)際研究現(xiàn)狀系統(tǒng)地介紹了“大數(shù)據(jù)”所蘊(yùn)含的潛在價(jià)值與挑戰(zhàn)[6];2011年,Science雜志出版的??疍ealing with Data,這些研究標(biāo)志著“大數(shù)據(jù)”正式登上科學(xué)研究的大舞臺,并成為各個(gè)學(xué)科中的研究熱點(diǎn)問題。一個(gè)大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的時(shí)代即將到來[8]。

      大數(shù)據(jù)應(yīng)用(big data application,BDA)是運(yùn)用大數(shù)據(jù)的思維和方法,利用大數(shù)據(jù)分析的結(jié)果,為用戶提供輔助決策,發(fā)掘潛在價(jià)值的過程[9],越來越多的問題可以通過大數(shù)據(jù)的應(yīng)用來解決。其應(yīng)用不僅僅限于科學(xué)技術(shù)層面,在公共管理、基礎(chǔ)研究和應(yīng)用研究以及商業(yè)領(lǐng)域等層面,大數(shù)據(jù)都能夠帶來新理念和新思維,提供解決問題的新方法或新視角[8]。高小平[10]、李歡[11]、高霞[12]分別在國家治理變革創(chuàng)新、科技管理創(chuàng)新平臺構(gòu)建和科技評價(jià)方法等方面,運(yùn)用了大數(shù)據(jù)的思維和方法;從基礎(chǔ)和應(yīng)用研究角度,李振皓[14]和黃少芳[15]分別在中藥的質(zhì)量控制和地質(zhì)資料檔案信息化的相關(guān)研究中應(yīng)用了大數(shù)據(jù),N. O. E. Olsson和H. Bullberg [16]在項(xiàng)目評價(jià)的過程中結(jié)合了對大數(shù)據(jù)的應(yīng)用,S. R. Sukumar和 R. Natarajan [17]則將大數(shù)據(jù)方法應(yīng)用到了衛(wèi)生保健領(lǐng)域的相關(guān)研究中,M. C. Ebach和 M. S. Michael [18]等人曾研究了歷史科學(xué)和大數(shù)據(jù)的關(guān)系;此外,在商業(yè)領(lǐng)域,T. H. Davenport [19], J. Frizzo-Barker [20]和C. F. Hofacker [21]等運(yùn)用大數(shù)據(jù)分別從國際商業(yè)決策、商業(yè)獎(jiǎng)學(xué)金和消費(fèi)者行為等不同角度進(jìn)行了系列研究。可見“大數(shù)據(jù)”已經(jīng)在很多領(lǐng)域得到廣泛應(yīng)用,在本質(zhì)上已經(jīng)轉(zhuǎn)化為一種新的思維方式、一種新的問題解決方法[22]。

      大數(shù)據(jù)應(yīng)用的益處是多角度多方面的,不僅能夠優(yōu)化政府效能、管理決策、市場監(jiān)管、公共服務(wù)、城市設(shè)施、社會治安等,還可以為經(jīng)濟(jì)、教育、文化、衛(wèi)生、外交等領(lǐng)域帶來不菲的收益。我國互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)用戶規(guī)模居全球第一,擁有豐富的數(shù)據(jù)資源和應(yīng)用市場優(yōu)勢,大數(shù)據(jù)部分關(guān)鍵技術(shù)研發(fā)取得突破,涌現(xiàn)出一批互聯(lián)網(wǎng)創(chuàng)新企業(yè)和創(chuàng)新應(yīng)用,一些地方政府已啟動大數(shù)據(jù)相關(guān)工作[1]。充分利用我國的數(shù)據(jù)規(guī)模優(yōu)勢,實(shí)現(xiàn)數(shù)據(jù)規(guī)模、質(zhì)量和應(yīng)用水平同步提升,發(fā)掘和釋放數(shù)據(jù)資源的潛在價(jià)值,有利于更好發(fā)揮數(shù)據(jù)資源的戰(zhàn)略作用。因此,無論是科學(xué)技術(shù)層面、公共管理部門、基礎(chǔ)和應(yīng)用研究、商業(yè)領(lǐng)域等層面的大數(shù)據(jù)應(yīng)用,還是經(jīng)濟(jì)、教育、文化、衛(wèi)生、外交等領(lǐng)域的應(yīng)用研究,都具有較高的研究意義[8]。

      本研究著眼于大數(shù)據(jù)應(yīng)用,探索該領(lǐng)域的文獻(xiàn)發(fā)展規(guī)律,繼而進(jìn)行相關(guān)發(fā)展定律的驗(yàn)證與研究,以期系統(tǒng)地揭示BDA技術(shù)的發(fā)展特征、規(guī)律和趨勢,從而為后續(xù)相關(guān)研究提供參考。

      2 研究方法與數(shù)據(jù)來源

      關(guān)于大數(shù)據(jù)概念的起源說法不一,有人認(rèn)為最早是由全球知名咨詢公司麥肯錫提出的,也有人認(rèn)為是1998年由SGI的首席科學(xué)家 J. R. Mashey在一篇發(fā)表于USENIX 會議的名為“Big Data and the Next Wave of Infrastres”的文章中首次提出的[3];還有人認(rèn)為是由20世紀(jì)90年代數(shù)據(jù)倉庫之父B. Inmon提出的。本研究基于Web of Science數(shù)據(jù)庫,制定了相關(guān)數(shù)據(jù)檢索策略,將所有涉及BDA概念或運(yùn)用大數(shù)據(jù)思維或方法來解決有關(guān)問題的論文均作為研究分析的數(shù)據(jù)對象,檢索結(jié)果中的數(shù)據(jù)包含1990-2015年的數(shù)據(jù)信息,共計(jì)1 701項(xiàng)。研究使用的數(shù)據(jù)庫Web of Science,是一種綜合性文獻(xiàn)檢索工具,其數(shù)據(jù)來源于世界上40多個(gè)國家和地區(qū)中的學(xué)術(shù)期刊、專題文集和會議錄,以及大量的專利文獻(xiàn)和科技圖書等。涉及的學(xué)科包括生物學(xué)、農(nóng)學(xué)、醫(yī)學(xué)、化學(xué)、物理學(xué)、地球科學(xué)、生命科學(xué)等,是國際上收集科學(xué)論文相互引證最為完備的數(shù)據(jù)庫。本研究選取科學(xué)引文索引(SCI)為基礎(chǔ)數(shù)據(jù)源,制定相應(yīng)檢索策略,在此基礎(chǔ)之上進(jìn)行進(jìn)一步的研究和分析。

      科技文獻(xiàn)自產(chǎn)生以來便隨時(shí)間的推移而增長,普賴斯通過考察科技文獻(xiàn)的積累過程,從中發(fā)現(xiàn)了增長規(guī)律。這一成果被收集在他的代表著作《巴比倫以來的科學(xué)》中,對后世的科學(xué)文獻(xiàn)研究產(chǎn)生了深刻的影響[23]。普賴斯對摘要性雜志的增長率進(jìn)行了推算,以科技文獻(xiàn)量為縱軸,以歷史年代為橫軸,把不同年代的科技文獻(xiàn)量在坐標(biāo)圖上逐點(diǎn)描繪出來,然后用一條光滑曲線聯(lián)結(jié)各點(diǎn),十分近似的表征了科技文獻(xiàn)隨時(shí)間增長的規(guī)律,這就是著名的普賴斯曲線,其數(shù)學(xué)表達(dá)式為:

      F(t)=aebt(a>0,b>0) (1)

      其中F(t)表示科技文獻(xiàn)量,a為統(tǒng)計(jì)初始時(shí)刻(即t=0)的文獻(xiàn)量,e為自然對數(shù)底,b是期刊的持續(xù)增長率,是一個(gè)時(shí)間常數(shù)。

      布拉德福定律和洛特卡定律都屬于文獻(xiàn)計(jì)量學(xué)的重要定律,與齊普夫定律一起被并稱為文獻(xiàn)計(jì)量學(xué)的三大定律。布拉德福定律可以表述為:如果將科技期刊按其刊載某學(xué)科專業(yè)論文的數(shù)量多少,以遞減順序排列,那么可以把期刊分為專門面向這個(gè)學(xué)科的核心區(qū)、相關(guān)區(qū)和非相關(guān)區(qū)。各個(gè)區(qū)的文章數(shù)量相等,此時(shí)核心區(qū)、相關(guān)區(qū)、非相關(guān)區(qū)期刊數(shù)量呈的關(guān)系。布拉德福定律是以科學(xué)論文在期刊中的分散情況為基礎(chǔ)創(chuàng)建的,但卻可以派生出許多不同的應(yīng)用,對于確定核心期刊、制定文獻(xiàn)采購策略、優(yōu)化館藏、檢驗(yàn)工作情況、了解讀者閱讀傾向、檢索利用文獻(xiàn)等方面都有一定的指導(dǎo)作用[24]。

      洛特卡定律是美國人洛特卡在1926年發(fā)現(xiàn)的。該定律被認(rèn)為是第一次揭示了作者頻率與文獻(xiàn)數(shù)量之間的關(guān)系,描述科學(xué)生產(chǎn)率的頻率分布規(guī)律。廣義的洛特卡定律可以用以下公式表示:

      其中:f(x)表示在一定時(shí)間內(nèi),某一特定學(xué)科或主題領(lǐng)域中,撰寫了x篇論文的作者數(shù)(或作者頻率);c和n是兩個(gè)大于零的常數(shù)[25]。一般對洛特卡定律的描述為:發(fā)表兩篇論文的作者數(shù)量約為發(fā)表一篇論文的作者數(shù)量的1/4;發(fā)表三篇論文的作者數(shù)量約為發(fā)表一篇論文作者數(shù)量的1/9;發(fā)表N篇論文的作者數(shù)量約為發(fā)表一篇論文作者數(shù)量的1/n2 ……,而發(fā)表一篇論文作者的數(shù)量約占所有作者數(shù)量的60%(即取c=1,n=2)。本研究即采用這種方法進(jìn)行分析和驗(yàn)證。

      在采用以上3種文獻(xiàn)計(jì)量學(xué)方法的同時(shí),本研究還借助了計(jì)量軟件VP(Vantage Point)、統(tǒng)計(jì)分析軟件SPSS和Microsoft Excel等工具,對所獲取數(shù)據(jù)進(jìn)行載文、期刊和著者情況等層面的統(tǒng)計(jì)、分析和驗(yàn)證。

      3 統(tǒng)計(jì)結(jié)果分析

      3.1 載文量分析

      文獻(xiàn)發(fā)表數(shù)量從一定程度上反映出該領(lǐng)域的相關(guān)研究在既定時(shí)間的研究水平和發(fā)展趨勢。文獻(xiàn)的數(shù)量隨時(shí)間、地區(qū)、類型等變量分布,是文獻(xiàn)樣本的基本特征之一,也是最基礎(chǔ)、最簡單的分析項(xiàng)目之一[26]。本研究統(tǒng)計(jì)了1990-2015年這16年間BDA領(lǐng)域的文獻(xiàn)統(tǒng)計(jì)量的變化情況,見圖1。

      從所收錄相關(guān)文獻(xiàn)的時(shí)間來看,最早的文獻(xiàn)是1990年來自匈牙利布達(dá)佩斯科技經(jīng)濟(jì)大學(xué)的科學(xué)家T. Kantor所著的題為Novel Applications of halogenation Reactions in Atomic Spectrometry的文章。他將大數(shù)據(jù)應(yīng)用到原子光譜分析鹵化反應(yīng)的研究當(dāng)中,是早期應(yīng)用大數(shù)據(jù)進(jìn)行科學(xué)研究的良好范例。根據(jù)所獲得的時(shí)間-文獻(xiàn)量二維數(shù)據(jù)表,可以進(jìn)一步得到隨時(shí)間變化的載文量的趨勢和載文量增長率的變化情況(見圖1):①從1990年的第一篇文獻(xiàn)收錄開始,1991- 997年的7年間,文獻(xiàn)量均維持在10篇左右,大數(shù)據(jù)的應(yīng)用技術(shù)研究尚處在初期發(fā)展期間;②1998- 2011年,文獻(xiàn)量較上一階段有一定增長,除個(gè)別年份有較高增長率和負(fù)增長外,基本維持較低水平增長率,可將1990-2011年界定為BDA的初步穩(wěn)定發(fā)展期;③2012-2015年文獻(xiàn)量大幅增加,2015年收錄的文獻(xiàn)量已經(jīng)達(dá)到509篇,與初期發(fā)展階段(1990-2011年)的文獻(xiàn)總量603篇相差無幾;這4年間文獻(xiàn)量增長率也提升至50%左右,從文獻(xiàn)量的折線圖來看,基本呈現(xiàn)直線上升趨勢,增長勢頭較猛,2014年甚至達(dá)到92.02%,4年年均增長率達(dá)66.27%,可見該時(shí)期為BDA的迅速發(fā)展階段。

      為了更加科學(xué)合理地掌握BDA技術(shù)領(lǐng)域相關(guān)文獻(xiàn)研究的發(fā)展規(guī)律,本研究對該領(lǐng)域文獻(xiàn)研究的增長規(guī)律進(jìn)行了時(shí)間序列的統(tǒng)計(jì)研究,研究過程借助SPSS統(tǒng)計(jì)分析軟件對該領(lǐng)域的文獻(xiàn)增長情況進(jìn)行曲線擬合,以驗(yàn)證其發(fā)展規(guī)律是否符合普萊斯科學(xué)文獻(xiàn)增長規(guī)律。本研究以時(shí)間(年份)為自變量,以累計(jì)文獻(xiàn)量為因變量,在SPSS統(tǒng)計(jì)分析軟件中對相關(guān)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行了曲線擬合。其中包括線性擬合、二次曲線擬合、三次曲線擬合、對數(shù)函數(shù)擬合、復(fù)合函數(shù)擬合、增長曲線擬合以及指數(shù)擬合。根據(jù)擬合結(jié)果顯示,其中線性、對數(shù)函數(shù)擬合模型的相關(guān)系數(shù)R2較?。ǚ謩e為0.714和0.440),予以排除,其余相關(guān)系數(shù)較大的模型包括二次曲線擬合模型、三次曲線擬合模型、復(fù)合函數(shù)模型、增長函數(shù)模型以及指數(shù)模型,依據(jù)普賴斯文獻(xiàn)增長規(guī)律中刻畫的普賴斯曲線表達(dá)式。選擇指數(shù)擬合模型來計(jì)算BDA領(lǐng)域文獻(xiàn)量的擬合方程,可以得到如下表達(dá)式:

      F(t)=8.909×0.205t =8.909×0.205t (3)

      本模型中t(年份)的初始值為1,即1990年設(shè)置為1,之后依次遞增,該擬合模型的擬合分析結(jié)果(模型擬合情況表、方差分析表以及系數(shù)表)見表1,曲線擬合圖見圖2。對指數(shù)函數(shù)模型擬合的結(jié)果分析如下:

      (1)模型的擬合情況反映了模型對數(shù)據(jù)的解釋能力。修正的可決系數(shù)(調(diào)整R2)越大,模型的解釋能力越強(qiáng)。對表1的結(jié)果分析可知,本模型的R2為0.882,說明該模型對數(shù)據(jù)的解釋能力較好。

      (2)方差分析反映了模型整體的顯著性,一般將模型的檢驗(yàn)P值(Sig.)與0.05作比較,如果小于0.05,即為顯著。對表2的結(jié)果分析可知,該模型的顯著性水平為0.000,小于0.05,說明該模型是顯著的。

      (3)回歸系數(shù)是各個(gè)變量在回歸方程中的系數(shù)值,Sig.值表示回歸系數(shù)的顯著性,越小越顯著。對表2的結(jié)果分析可知,該模型中,常數(shù)項(xiàng)是8.909,年份的系數(shù)是0.157,t值是13.715,顯著性是0.000??梢妰蓚€(gè)結(jié)果都是顯著的。

      (4)圖2是線性、二次函數(shù)、三次函數(shù)和指數(shù)函數(shù)的擬合情況,圖中的圓圈表示實(shí)際值,不難看出,指數(shù)函數(shù)擬合模型的擬合效果是最好的。由表1-表3分析可知,該模型的值最高,整體P值最小,即擬合優(yōu)度最好,顯著性最好。

      由以上結(jié)果分析可以得到以下相關(guān)結(jié)論:BDA領(lǐng)域的文獻(xiàn)量處于指數(shù)增長期,即迅速發(fā)展的階段;由此可以推測,在未來一段時(shí)間內(nèi),該領(lǐng)域的相關(guān)研究還會繼續(xù)快速增長,文獻(xiàn)量也將呈指數(shù)增長(一定時(shí)期內(nèi))。綜合以上分析結(jié)果可以認(rèn)為,BDA領(lǐng)域的文獻(xiàn)發(fā)展符合普賴斯科學(xué)文獻(xiàn)增長規(guī)律。

      3.2 期刊分析

      英國著名文獻(xiàn)計(jì)量學(xué)家布拉德福最早提出了核心期刊的概念。雖然布拉德福的定義完全是按照期刊發(fā)表論文數(shù)量而確定的,具有一定局限性,而現(xiàn)在對于核心期刊的定義更多的考慮了期刊的使用率(包括被引率、文摘率、流通率)和學(xué)術(shù)影響力等因素,但布拉德福文獻(xiàn)集中分散定律一直是核心期刊評價(jià)的理論基礎(chǔ)[27]。本文采用布拉德福定律的分析方法對BDA領(lǐng)域文章的期刊分布規(guī)律進(jìn)行整理和研究。

      所選取數(shù)據(jù)源中的文獻(xiàn)來自于886種不同期刊,其中來自期刊Future Generation Computer Systems-The International Journal of Grid Computing and Escience的文章最多,為30篇;刊載文章超過10篇(含10篇)的期刊有14種。具體分析如下:

      根據(jù)布拉德福定律中關(guān)于核心區(qū)、相關(guān)區(qū)和非相關(guān)區(qū)期刊數(shù)量的比例關(guān)系,本研究將886種期刊的載文量分成大致3個(gè)區(qū)域,其中第一區(qū)域約占總數(shù)6.4%的期刊(57種期刊)發(fā)表了總量30%的文獻(xiàn),第二區(qū)域約占總數(shù)21.3%的期刊(189種期刊)發(fā)表了總量30%左右的文獻(xiàn),第三區(qū)域約占總數(shù)72.2%的期刊(640種期刊)發(fā)表了總量40%左右的文獻(xiàn),表明BDA領(lǐng)域的文獻(xiàn)呈現(xiàn)明顯的核心密集分布。3個(gè)區(qū)域期刊的分布數(shù)量比為57:189:640,這與布拉德福定律中的1:n:n2相擬合,其中n約為3.3。由以上數(shù)據(jù)和分析可以判斷,本研究文獻(xiàn)樣本的期刊分布基本符合布拉德福定律。從1990年時(shí)只有1本期刊發(fā)表1篇文章,發(fā)展至2015年累計(jì)共有886種期刊共發(fā)表1 701篇文章,BDA領(lǐng)域已經(jīng)形成廣泛的研究覆蓋范圍并形成自己的核心期刊群。具體如表4、表5、圖3所示:

      3.3 著者分布規(guī)律

      著者是論文的重要外部特征之一,是決定論文質(zhì)量的關(guān)鍵[23]。核心著者的評定需要綜合考慮多方面的因素和指標(biāo),洛特卡定律則只從發(fā)文量角度評定某一領(lǐng)域的核心著者,雖然這種評定方式忽略了對著者發(fā)文的“質(zhì)”的考量,同時(shí)忽視了在同一篇文章中不同著者的貢獻(xiàn)程度等因素,但運(yùn)用洛特卡定律來刻畫某領(lǐng)域文獻(xiàn)及著者的分布情況在一定程度上是不失公道的。

      研究統(tǒng)計(jì)1990-2015年在BDA領(lǐng)域發(fā)表文獻(xiàn)的實(shí)際著者情況,并計(jì)算出按照洛特卡定律所估計(jì)的著者數(shù),在此基礎(chǔ)之上比較二者的相對誤差。具體情況如圖4所示:

      從圖4可以看出,在高發(fā)文量的著者群中,其著者數(shù)過少,如發(fā)文量為12篇、11篇和9篇的著者均只有1人。而按照洛特卡定律估計(jì)來看,其文獻(xiàn)著者數(shù)量遠(yuǎn)不止這些,分別應(yīng)有26人、31人和47人。可見該領(lǐng)域的實(shí)際著者分布與按照洛特卡定律估計(jì)的著者分布相差較多。但發(fā)文1篇的作者為5 916人,洛特卡定律估計(jì)數(shù)量為3 809,實(shí)際情況遠(yuǎn)遠(yuǎn)超出估計(jì)。綜上所述,BDA領(lǐng)域的文獻(xiàn)著者分布與按照洛特卡定律估計(jì)的著者分布相差很大;從整體的分布情況來看,在一定程度上反映出大數(shù)據(jù)應(yīng)用的發(fā)展尚未達(dá)到成熟穩(wěn)定的階段。

      4 研究結(jié)論及啟示

      研究通過對普賴斯科學(xué)文獻(xiàn)增長規(guī)律、布拉德福定律和洛特卡定律的驗(yàn)證,分別從載文、期刊和著者3個(gè)層面,對BDA領(lǐng)域的文獻(xiàn)增長情況進(jìn)行了分析和研究。根據(jù)研究結(jié)果,可以得出以下幾方面的結(jié)論及啟示:

      (1)根據(jù)對載文的分析結(jié)果可以觀察到,自1990年起,BDA領(lǐng)域的相關(guān)文獻(xiàn)經(jīng)過一段時(shí)間的穩(wěn)步發(fā)展后,直至2012年開始顯現(xiàn)突飛猛進(jìn)的發(fā)展態(tài)勢,該領(lǐng)域文獻(xiàn)整體呈指數(shù)增長態(tài)勢,發(fā)展符合普賴斯科學(xué)文獻(xiàn)增長規(guī)律。采用此驗(yàn)證方法不僅可以較為簡單、準(zhǔn)確地描繪BDA領(lǐng)域過去的發(fā)展態(tài)勢,還可據(jù)此預(yù)測其未來幾年將繼續(xù)沿此態(tài)勢發(fā)展,可以更好地刻畫其發(fā)展軌跡和整體走向。

      (2)從期刊角度來看,BDA領(lǐng)域已形成核心期刊群,其中包括BMC Bioinformatics、Sensors等,該期刊群在一定程度上代表著該領(lǐng)域的發(fā)展前沿,此外,據(jù)分析結(jié)果顯示,文獻(xiàn)樣本的期刊分布基本符合布拉德福定律。依據(jù)此結(jié)論,可以針對核心期刊群的期刊及其所刊載的文章進(jìn)行深入研究,以更加及時(shí)、準(zhǔn)確地掌握該領(lǐng)域發(fā)展的前沿動態(tài)。

      (3)從著者分布情況來看,該領(lǐng)域著者分布與洛特卡定律相差很大,尚未形成較具影響力的核心著者群,在一定程度上反映出該領(lǐng)域的相關(guān)研究尚未成熟。此外,還可以認(rèn)為,對于一個(gè)發(fā)展尚未成熟、尚處于發(fā)展探索階段的新興領(lǐng)域,要想形成一個(gè)較權(quán)威較具影響力的核心研究群,是需要時(shí)間和經(jīng)驗(yàn)的積累。

      (4)本研究應(yīng)用經(jīng)典的計(jì)量學(xué)定律,研究和驗(yàn)證了BDA領(lǐng)域的發(fā)展規(guī)律。以此類推,對于其他的新興領(lǐng)域的研究,也可以運(yùn)用這種驗(yàn)證經(jīng)典定律的方法,以更好地掌握該新興領(lǐng)域的發(fā)展趨勢和狀態(tài)。

      從近年來大數(shù)據(jù)技術(shù)的迅猛發(fā)展來看,無論是各國政府、國際組織、社會企業(yè),還是高校機(jī)構(gòu)、各學(xué)科領(lǐng)域,都給予了極大的關(guān)注和良好預(yù)期,而最重要的環(huán)節(jié)當(dāng)屬對于大數(shù)據(jù)技術(shù)在各行各業(yè)的應(yīng)用。雖然在BDA技術(shù)上存在一定的挑戰(zhàn),但相信這更是一次良好的推動人類社會整體進(jìn)步的機(jī)遇,大數(shù)據(jù)應(yīng)用是大勢所趨,是社會進(jìn)步的新方向。本文分別從載文、期刊和著者層面揭示了BDA領(lǐng)域的現(xiàn)狀和發(fā)展趨勢,希望能夠在一定程度上揭示該領(lǐng)域的研究規(guī)律并預(yù)測未來的發(fā)展趨勢,以期為后續(xù)相關(guān)研究提供有價(jià)值的參考。

      研究過程中,由于條件有限,有許多因素尚未納入考慮范圍,這可能在一定程度上導(dǎo)致研究的不準(zhǔn)確和不全面。后續(xù)筆者將加強(qiáng)全方位的考慮,以更加準(zhǔn)確和全面的掌握BDA領(lǐng)域的發(fā)展情況。

      參考文獻(xiàn):

      國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知 [EB/OL]. [2016-04-21]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

      聯(lián)合國“全球脈動”計(jì)劃發(fā)布《大數(shù)據(jù)開發(fā): 機(jī)遇與挑戰(zhàn)》[EB/OL]. [2016-04-23]. http://www.docin.com/p-750680124.html.

      MASHEY J R. Big data and the next wave of infra stress[C]//Computer Science Division Seminar. Berkeley: University of California, Berkeley, 1997.

      蘇紅. 大數(shù)據(jù)對H公司科技創(chuàng)新戰(zhàn)略的影響[D]. 青島: 中國海洋大學(xué), 2014.

      羅梓超, 呂志堅(jiān). 韓國大數(shù)據(jù)發(fā)展及應(yīng)用分析[J]. 全球科技經(jīng)濟(jì)瞭望, 2014(3): 22-26.

      Nature Specials Archive. Big data[EB/OL]. [2016-04-29]. http://www.nature.com/news/specials/bigdata/index.html.

      Science, Special Online Collection. Dealing with data [EB/OL]. [2016-02-11]. http://www.sciencemag.org/site/spe-cial/data/.

      大數(shù)據(jù)時(shí)代降臨[EB/OL]. [2016-05-02]. http://www.banyuetan.org/jrt/120922/70953_1.shtml.

      張引, 陳敏, 廖小飛. 大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(S1): 216-233.

      高小平. 借助大數(shù)據(jù)科技力量尋求國家治理變革創(chuàng)新[J]. 中國行政管理, 2015(10): 10-14.

      李歡. 大數(shù)據(jù)背景下科技管理創(chuàng)新平臺構(gòu)建研究[J]. 科學(xué)管理研究, 2014, 32(3): 44-48.

      高霞. 基于大數(shù)據(jù)的科技評價(jià)研究[J]. 科技預(yù)測與評價(jià), 2015(11): 27-30.

      崔燕. 大數(shù)據(jù)時(shí)代的專利業(yè)務(wù)數(shù)據(jù)質(zhì)量評價(jià)探析[J]. 中國發(fā)明與專利, 2013(9): 68-71.

      李振皓, 錢忠直, 程翼宇. 基于大數(shù)據(jù)科技的中藥質(zhì)量控制技術(shù)創(chuàng)新戰(zhàn)略[J]. 中國中藥雜志, 2015, 40(17): 3374-3378.

      黃少芳, 劉曉鴻. 基于大數(shù)據(jù)的地質(zhì)資料檔案信息化與服務(wù)[J]. 資源與產(chǎn)業(yè), 2015, 17(6): 56-61.

      OLSSON N O E, BULLBERG H. Use of big data in project evaluations [J]. International journal of managing projects in business, 2015, 8(3): 491-512.

      SUKUMAR S R, NATARAJAN R, FERRELL R K. Quality of big data in health care [J]. International journal of health care quality assurance, 2015, 28(6): 621-634.

      EBACH M C, MICHAEL M S, SHAW W S, et al. Big data and the historical sciences: a critique [J]. Geoforum, 2016, 71: 1-4.

      DAVENPORT T H. How strategists use “big data” to support internal business decisions, discovery and production[J]. Strategy & leadership, 2014, 42(4): 45-50.

      FRIZZO-BARKER J, CHOW-WHITE P A, MOZAFARI M, et al. An empirical study of the rise of big data in business scholarship[J]. International journal of information management, 2016, 36(3): 403-413

      HOFACKER C F, MALTHOUSE E C, SULTAN F. Big data and consumer behavior: imminent opportunities[J].Journal of consumer marketing, 2016, 33(2): 89-97.

      金陵. 大數(shù)據(jù)與信息化教學(xué)變革[J]. 中國電化教育, 2013(10): 8-13.

      趙雙. 普萊斯對科學(xué)計(jì)量學(xué)的貢獻(xiàn)及當(dāng)代意義[C]. 第三屆全國科技哲學(xué)暨交叉學(xué)科研究生論壇. 北京: 中國自然辯證法研究會, 2010.

      邱均平. 信息計(jì)量學(xué)(四)第四講 文獻(xiàn)信息離散分布規(guī)律——布拉德福定律[J]. 情報(bào)理論與實(shí)踐, 2000(4): 315-320.

      王靜, 王宏鑫. 關(guān)于Lotka定律的研究——紀(jì)念洛特卡定律創(chuàng)立80周年[J]. 情報(bào)雜志, 2007, 26(4): 94-96.

      傅余洋子, 華薇娜. 基于Web of Science數(shù)據(jù)庫中云計(jì)算研究文獻(xiàn)的計(jì)量分析[J]. 新世紀(jì)圖書館, 2013(7): 57-64.

      劉雪立. 中文核心期刊評價(jià)指標(biāo)體系: 演進(jìn).問題.建議[J]. 編輯學(xué)報(bào), 2014, 26(1): 92-95.

      作者貢獻(xiàn)說明:

      張姣姣:設(shè)計(jì)研究框架,開展研究工作,撰寫論文;

      劉 云:協(xié)同構(gòu)思和設(shè)計(jì)研究框架,修改論文;

      程旖婕:收集和分析數(shù)據(jù),協(xié)助撰寫論文。

      Research on Developing Regulations of Big Data Application Technology Based on Bibliometrics Laws

      Zhang Jiaojiao Liu Yun Cheng Yijie

      School of Management and Economics, Beijing Institute of Technology, Beijing 100081

      Abstract: [Purpose/significance] This paper aims to study the trend over the past and the present situation of big data application, and indicate the development regulation and trend in the future. [Method/process] This paper analyzed literature year distribution, journal distribution and author distribution of big data application field, and was the first to verify whether or not its development corresponds to the three fundamental bibliometric laws, though there are lots of factors that have not been taken into consideration. [Result/conclusion] Results shows that starting in 1990, literatures related to big data application field went through a period of stable development, and appears to develop rapidly from 2012, whose development corresponds to Price law of scientific literature growth. Development of the literature sample in the study is in line with Bradfords law, and forms a group of core journals, including Bmc bioinformatics, Sensors and so on. In the view of the author distribution, distribution in this filed is far different from that in Lotkas law, and theres no doubt that it has not yet formed the core author group.

      Keywords: big data application Price law of scientific literature growth Bradfords law Lotkas law

      猜你喜歡
      大數(shù)據(jù)應(yīng)用
      廣電大數(shù)據(jù)平臺建設(shè)方案淺析
      科技傳播(2017年9期)2017-06-14 01:35:46
      大數(shù)據(jù)背景下數(shù)字校園建設(shè)的思考
      媒體融合下的春節(jié)晚會新思路探析
      新媒體研究(2017年6期)2017-05-12 07:14:59
      新形勢下推進(jìn)大數(shù)據(jù)應(yīng)用的若干思考
      大數(shù)據(jù)在科技新聞傳播領(lǐng)域的應(yīng)用研究
      科技傳播(2017年2期)2017-04-06 19:30:15
      淺析電信行業(yè)大數(shù)據(jù)應(yīng)用的路徑
      商情(2017年1期)2017-03-22 21:46:58
      大數(shù)據(jù)與圖書館管理創(chuàng)新
      基于電力光纖入戶的大數(shù)據(jù)應(yīng)用
      科學(xué)大數(shù)據(jù)的發(fā)展態(tài)勢及建議
      企業(yè)管理會計(jì)應(yīng)用大數(shù)據(jù)分析實(shí)例研究
      岳普湖县| 通州市| 霍林郭勒市| 曲麻莱县| 精河县| 崇州市| 昆明市| 桦川县| 方城县| 环江| 石河子市| 大兴区| 壤塘县| 高要市| 五大连池市| 邵阳县| 迁西县| 开阳县| 阜平县| 台中县| 城市| 贡山| 安泽县| 邵阳县| 资溪县| 皋兰县| 海安县| 沙田区| 太仓市| 高碑店市| 谷城县| 阿图什市| 嘉黎县| 上犹县| 噶尔县| 文水县| 颍上县| 商水县| 海原县| 兴宁市| 鹤山市|