• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      近十年我國大數(shù)據(jù)理論研究的可視化聚類分析
      ——基于五種常用文獻(xiàn)的計(jì)量與統(tǒng)計(jì)分析

      2018-06-08 01:12:46
      圖書館學(xué)刊 2018年2期
      關(guān)鍵詞:發(fā)文論文領(lǐng)域

      曲 悅

      (遼寧廣播電視大學(xué),遼寧 沈陽 110034)

      大數(shù)據(jù)這一概念無論在學(xué)術(shù)領(lǐng)域還是在現(xiàn)實(shí)社會(huì)中都已經(jīng)受到了極大的關(guān)注。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時(shí)代》中指出,大數(shù)據(jù)是指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。[1]關(guān)于大數(shù)據(jù)理論的研究現(xiàn)在發(fā)展到何種程度卻是一個(gè)值得探討的問題。筆者利用相關(guān)分析工具,基于5種常用文獻(xiàn)對(duì)于大數(shù)據(jù)理論的研究現(xiàn)狀進(jìn)行聚類分析,希望能夠?qū)Υ髷?shù)據(jù)相關(guān)研究人員提供一定的借鑒。

      1 統(tǒng)計(jì)源、統(tǒng)計(jì)策略及聚類分析工具

      為了能夠更加真實(shí)全面地反映近十年我國大數(shù)據(jù)理論的研究現(xiàn)狀,筆者將圖書、期刊、報(bào)紙、學(xué)位論文、會(huì)議論文5種常見的文獻(xiàn)作為數(shù)據(jù)統(tǒng)計(jì)對(duì)象,并利用超星發(fā)現(xiàn)平臺(tái)的海量數(shù)據(jù)作為主要統(tǒng)計(jì)源,將CNKI的相關(guān)數(shù)據(jù)作為輔助統(tǒng)計(jì)源。為了讓檢查結(jié)果更加準(zhǔn)確、可靠。筆者以“大數(shù)據(jù)”作為檢索詞,以題名和關(guān)鍵詞作為檢索入口,二者進(jìn)行“邏輯或”檢索,并將時(shí)間限定在2007-2016年之間。

      筆者以超星發(fā)現(xiàn)平臺(tái)作為聚類分析工具,因?yàn)樵撈脚_(tái)除了擁有海量的數(shù)據(jù)資源——期刊論文、學(xué)位論文等數(shù)據(jù)外,還擁有近300萬種的圖書資源及各類資源之間的相互引證關(guān)系,另外該平臺(tái)還可以通過分面聚類、引文分析、知識(shí)關(guān)聯(lián)分析等方式,實(shí)現(xiàn)高價(jià)值學(xué)術(shù)文獻(xiàn)發(fā)現(xiàn)、縱橫結(jié)合的深度知識(shí)挖掘、可視化的全方位知識(shí)關(guān)聯(lián)功能。這些功能非常適合本次分析研究。[2]

      根據(jù)上述檢索條件,截至2017年1月19日,得到檢索結(jié)果92444條,其中5類常用文獻(xiàn)83661條,即圖書706種,期刊論文41272篇,報(bào)紙文章38581篇,學(xué)位論文1370篇,會(huì)議論文1730篇。檢索到的其他相關(guān)文獻(xiàn)中,數(shù)量較多的是信息資訊、專利信息、視頻資源及法律法規(guī)。而5種常用文獻(xiàn)總量,占所有被檢索到的相關(guān)文獻(xiàn)總量的90.5%,這表明,通過對(duì)5類常用文獻(xiàn)的統(tǒng)計(jì)分析,能夠反映出大數(shù)據(jù)理論研究的現(xiàn)狀。

      2 基于超星發(fā)現(xiàn)和CNKI的五種常用文獻(xiàn)聚類分析

      2.1 大數(shù)據(jù)學(xué)術(shù)趨勢(shì)分析

      通過對(duì)各年發(fā)文量進(jìn)行統(tǒng)計(jì),可以看出某一研究領(lǐng)域的學(xué)術(shù)研究趨勢(shì)和關(guān)注程度。通過年發(fā)文量的趨勢(shì)圖可以看出該研究領(lǐng)域所處于的發(fā)展階段。[3]筆者將與大數(shù)據(jù)相關(guān)的5種常用文獻(xiàn)進(jìn)行年發(fā)文量統(tǒng)計(jì),并繪制趨勢(shì)曲線圖。由于期刊論文和報(bào)紙文章與其他3種文獻(xiàn)類型的年發(fā)文量在數(shù)量級(jí)上有差別,故分別制作曲線圖表以表示5種文獻(xiàn)的學(xué)術(shù)研究發(fā)展趨勢(shì),如圖1、圖2。

      圖1 大數(shù)據(jù)理論期刊論文、報(bào)紙文章學(xué)術(shù)趨勢(shì)圖

      圖2 大數(shù)據(jù)理論期刊論文、報(bào)紙文章學(xué)術(shù)趨勢(shì)

      根據(jù)圖1和圖2可以看出,大數(shù)據(jù)理論研究現(xiàn)在處于一個(gè)高速發(fā)展階段,尤其是2011年以后,各類文獻(xiàn)的發(fā)文量均呈現(xiàn)出幾何級(jí)增長趨勢(shì)。

      報(bào)紙文獻(xiàn)和期刊文獻(xiàn)能夠較為及時(shí)地反映出某一領(lǐng)域研究的重點(diǎn)方向。從圖1可以看出,2009年大數(shù)據(jù)的研究開始走進(jìn)研究人員的視野,到2011年,數(shù)據(jù)曲線開始呈現(xiàn)井噴狀,表明該領(lǐng)域的研究已經(jīng)受到學(xué)術(shù)界的極大關(guān)注,并且研究熱情持續(xù)高漲,一直到現(xiàn)在。

      從學(xué)位論文和會(huì)議論文曲線上看,同樣可以得出相同的結(jié)論,即大數(shù)據(jù)研究現(xiàn)在處于高速發(fā)展階段。雖然,會(huì)議論文曲線在2014年出現(xiàn)一個(gè)拐點(diǎn),但2014年和2015年的會(huì)議論文總量并沒有太明顯的差異,對(duì)于學(xué)術(shù)趨勢(shì)向上發(fā)展的結(jié)論并沒有產(chǎn)生影響。同時(shí),每年舉辦的相關(guān)學(xué)術(shù)會(huì)議場(chǎng)次也是有規(guī)律的,所以這一結(jié)果可以接受。而對(duì)于學(xué)位論文和會(huì)議論文在2016年均有所減少,這應(yīng)該是因?yàn)閿?shù)量統(tǒng)計(jì)結(jié)果是2017年初,很多相關(guān)的成果還沒有及時(shí)錄入到數(shù)據(jù)庫當(dāng)中所致。

      從圖書曲線來看,也可以反映出大數(shù)據(jù)理論研究的上升發(fā)展趨勢(shì)。從2011年出版第一部相關(guān)著作后,每年的圖書出版量都在迅速上升。因圖書出版周期較長,但仍然能夠長時(shí)間保持一種上升曲線,這對(duì)于大數(shù)據(jù)理論的發(fā)展趨勢(shì)是一個(gè)非常重要的印證。

      2.2 大數(shù)據(jù)相關(guān)關(guān)鍵詞聚類分析

      通過對(duì)某一研究領(lǐng)域的相關(guān)關(guān)鍵詞進(jìn)行聚類分析,可以了解到該研究領(lǐng)域的研究重點(diǎn)和研究熱點(diǎn),有利于其他研究者精準(zhǔn)選取研究方向,或者相關(guān)資源。筆者對(duì)與大數(shù)據(jù)相關(guān),且出現(xiàn)頻次超過300次的關(guān)鍵進(jìn)行了統(tǒng)計(jì),如表1。

      表1 大數(shù)據(jù)熱門相關(guān)關(guān)鍵詞統(tǒng)計(jì)

      根據(jù)統(tǒng)計(jì)結(jié)果可以看出,與大數(shù)據(jù)最相關(guān)的4個(gè)關(guān)鍵詞分別是云計(jì)算、數(shù)據(jù)挖掘、數(shù)據(jù)分析和物聯(lián)網(wǎng),這4個(gè)關(guān)鍵詞的出現(xiàn)頻次都超過了1000次。表明在大數(shù)據(jù)研究領(lǐng)域中這4個(gè)方面是最重要的研究方向。通過對(duì)所有熱門關(guān)鍵詞進(jìn)行分析可知,大數(shù)據(jù)理論的研究重點(diǎn)和熱點(diǎn)主要集中在以下幾個(gè)方面:一是大數(shù)據(jù)分析研究,如云計(jì)算、數(shù)據(jù)挖掘、數(shù)據(jù)分析、海量數(shù)據(jù),數(shù)據(jù)處理等。二是大數(shù)據(jù)用途研究,如電子商務(wù)、精準(zhǔn)營銷、物聯(lián)網(wǎng)數(shù)據(jù)應(yīng)用等。三是大數(shù)據(jù)相關(guān)技術(shù)與工具研究,如信息技術(shù)、hadoop等。四是大數(shù)據(jù)安全與隱私問題研究,如信息安全、隱私保護(hù)等。根據(jù)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖(如圖3),可以很直觀地看出這些關(guān)鍵詞之間復(fù)雜的共現(xiàn)關(guān)系。

      圖3 大數(shù)據(jù)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)

      2.3 大數(shù)據(jù)理論核心研究作者分析

      通過對(duì)某個(gè)領(lǐng)域的核心研究作者的成果進(jìn)行研讀和分析,可以了解該領(lǐng)域的最新研究方向和動(dòng)態(tài),同時(shí)也有利于研究人員更快地尋找合作伙伴。筆者對(duì)相關(guān)作者發(fā)表與大數(shù)據(jù)相關(guān)論文的總量和以第一作者或獨(dú)立作者身份發(fā)表大數(shù)據(jù)相關(guān)論文的發(fā)文量分別進(jìn)行統(tǒng)計(jì),結(jié)果見圖3。

      根據(jù)圖4可知,喻國明、楊光和王斌三位作者的相關(guān)發(fā)文總量和第一作者發(fā)文量都超過了30篇,表明這3位作者在大數(shù)據(jù)理論研究方面成果顯著,可以被認(rèn)定為該領(lǐng)域的核心研究作者。通過各位作者的第一作者發(fā)文量和相關(guān)發(fā)文總量進(jìn)行對(duì)比可知,大部大作者的這兩個(gè)數(shù)值都不相同,而且很多差別很大。這表明在大數(shù)據(jù)研究領(lǐng)域,研究者之間有較好的合作關(guān)系,這種合作關(guān)系對(duì)于大數(shù)據(jù)理論的橫向和縱深研究都有較好的推動(dòng)作用。

      圖4 大數(shù)據(jù)領(lǐng)域核心研究作者發(fā)文量統(tǒng)計(jì)

      2.4 大數(shù)據(jù)理論核心研究機(jī)構(gòu)分析

      某個(gè)研究領(lǐng)域的核心研究機(jī)構(gòu)同樣可以反映出研究領(lǐng)域的最新研究方向和動(dòng)態(tài),同時(shí),通過對(duì)核心研究機(jī)構(gòu)的研究成果進(jìn)行分析和綜合,可以梳理該研究領(lǐng)域的發(fā)展軌跡和脈絡(luò)。筆者通過對(duì)研究機(jī)構(gòu)的發(fā)文量進(jìn)行統(tǒng)計(jì),并將發(fā)文量排名前10位的研究機(jī)構(gòu)進(jìn)行降序排列,得到表2。

      從表2可以看出,在大數(shù)據(jù)理論研究領(lǐng)域,武漢大學(xué)和中國人民大學(xué)表現(xiàn)較為突出,發(fā)文量在300篇左右,可以認(rèn)定為大數(shù)據(jù)研究領(lǐng)域的核心研究機(jī)構(gòu)。而北京大學(xué)、清華大學(xué)和中科院3個(gè)機(jī)構(gòu)的發(fā)文量也都在250篇左右。說明,這3個(gè)研究機(jī)構(gòu)的研究成果也較為突出,在大數(shù)據(jù)理論研究領(lǐng)域也起到了較大的推動(dòng)作用。利用相關(guān)性氣泡圖(如圖5),可以清晰地看出這些機(jī)構(gòu)與大數(shù)據(jù)理論研究的密切程度。另外,核心研究機(jī)構(gòu)與核心研究作者有著非常密切的關(guān)系,核心研究作者很多都來自于核心研究機(jī)構(gòu),如喻國明和王斌來自于中國人民大學(xué),張鵬來自于中科院,王偉來自于武漢大學(xué)。

      表2 大數(shù)據(jù)領(lǐng)域核心研究機(jī)構(gòu)統(tǒng)計(jì)

      圖5 大數(shù)據(jù)理論與核心研究機(jī)構(gòu)關(guān)系氣泡圖

      2.5 學(xué)科分布聚類分析

      圖6 大數(shù)據(jù)學(xué)科分布及跨學(xué)科主題分布

      大數(shù)據(jù)理論在多個(gè)學(xué)科領(lǐng)域都擁有重要的研究價(jià)值,而哪個(gè)學(xué)科在大數(shù)據(jù)理論研究中效果更突出則是一個(gè)值得關(guān)注的問題,因此,筆者利用超星發(fā)現(xiàn)平臺(tái)和百度學(xué)術(shù)的學(xué)科聚類分析功能對(duì)“大數(shù)據(jù)”進(jìn)行綜合分析,結(jié)論為:大數(shù)據(jù)理論在中圖法中的T(工業(yè)技術(shù))、F(經(jīng)濟(jì))、G(文化、科學(xué)、教育、體育)、D(政治、法律)4個(gè)大類中研究成果較為突出,更為突出的分支學(xué)科分別為:計(jì)算機(jī)科學(xué)與技術(shù)、應(yīng)用經(jīng)濟(jì)學(xué)、信息與通信工程、教育學(xué)、圖書館與情報(bào)學(xué)、法學(xué)。另外,大數(shù)據(jù)的跨學(xué)科研究也發(fā)展迅猛,已經(jīng)衍生出多個(gè)交叉學(xué)科主題,[4]具體研究主題見圖6。

      2.6 經(jīng)典文獻(xiàn)分析

      每個(gè)學(xué)科都有其經(jīng)典文獻(xiàn),經(jīng)典文獻(xiàn)對(duì)于研究人員的指導(dǎo)和引領(lǐng)作用是非常明顯的。雖然,學(xué)術(shù)界對(duì)于經(jīng)典文獻(xiàn)定義暫時(shí)還不明確,但是高被引率應(yīng)該是衡量文獻(xiàn)是否經(jīng)典的一個(gè)得要指標(biāo),因此,筆者利用高被引著作和高被引論文對(duì)經(jīng)典文獻(xiàn)進(jìn)行一個(gè)簡單映射。利用超星發(fā)現(xiàn)平臺(tái)和CNKI數(shù)據(jù)庫,將與大數(shù)據(jù)相關(guān)的著作和論文按照被引用次數(shù)進(jìn)行降序排列,并對(duì)前10名進(jìn)行聚類分析,如表3和表4。

      根據(jù)表3可知,維克托和肯尼思所著的《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》和涂子沛老師所著的《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》備受關(guān)注,在短短3年之間被引次數(shù)都超過了500次,因此,這兩本書可以被認(rèn)定為大數(shù)據(jù)理論研究的經(jīng)典著作。同時(shí),涂子沛老師有兩本著作入被高被引著作,說明涂子沛老師是國內(nèi)大數(shù)據(jù)理論研究領(lǐng)域的領(lǐng)軍人物。如果想更快更全面地獲取大數(shù)據(jù)相關(guān)信息,可以對(duì)其著作進(jìn)行認(rèn)真研讀。高被引圖書中,有4本著作譯自于國外,這表明,我國在大數(shù)據(jù)理論研究方面在國外的借鑒方面做了很多努力。從出版社來看,清華大學(xué)出版社有3本入選,人民郵電出版社有兩本入選。研究人員在選擇研究著作時(shí),可以對(duì)這兩個(gè)出版社的圖書更加關(guān)注。同時(shí),2013年出版的著作占高被引著作的80%,因此,最近一段時(shí)間,可以更關(guān)注2013年的著作。

      根據(jù)表4的高被引論文列表可知,孟小峰和慈祥撰寫的《大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)》一文被引次數(shù)超過了1500次,遠(yuǎn)遠(yuǎn)超過其他論文,可以認(rèn)定為該領(lǐng)域的經(jīng)典論文。這篇論文值得所有研究人員認(rèn)真研讀。從發(fā)表刊物來看,《計(jì)算機(jī)學(xué)報(bào)》有3篇論文入選,表明該刊對(duì)大數(shù)據(jù)理論研究方面的論文收錄質(zhì)量更高,值得關(guān)注,同時(shí)也可以看出,高被引論文大部分都出自于計(jì)算機(jī)和軟件相關(guān)主題的刊物,這也從一個(gè)側(cè)面印證了大數(shù)據(jù)在計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域的分布規(guī)律。從高被引論文的發(fā)表年份來看,同樣是2013年表現(xiàn)突出,這一年的論文在經(jīng)過前期的鋪墊后,在質(zhì)量上有了較大的提升。

      表3 大數(shù)據(jù)領(lǐng)域高被引著作統(tǒng)計(jì)

      表4 大數(shù)據(jù)領(lǐng)域高被引論文統(tǒng)計(jì)

      3 結(jié) 語

      大數(shù)據(jù)的理論研究從2009年開始引起學(xué)術(shù)領(lǐng)域的重視,2011年開始呈高速發(fā)展趨勢(shì)。云計(jì)算、數(shù)據(jù)挖掘、數(shù)據(jù)分析和物聯(lián)網(wǎng)這4個(gè)研究方向成為大數(shù)據(jù)的研究重點(diǎn)和熱點(diǎn)。喻國明、楊光和王斌三位作者的相關(guān)發(fā)文總量和第一作者發(fā)文量都較其他作者有明顯的優(yōu)勢(shì)。因此可被認(rèn)定為大數(shù)據(jù)理論研究的核心研究作者。武漢大學(xué)和中國人民大學(xué)作為核心研究機(jī)構(gòu),在大數(shù)據(jù)理論研究方面也成果顯著。大數(shù)據(jù)理論研究在計(jì)算機(jī)科學(xué)與技術(shù)、應(yīng)用經(jīng)濟(jì)學(xué)、信息與通信工程、教育學(xué)、圖書館與情報(bào)學(xué)、法學(xué)領(lǐng)域研究更加深入,同時(shí)也衍生了很多交叉學(xué)科。維克托和肯尼思所著的《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》和涂子沛老師所著的《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》作為大數(shù)據(jù)理論研究領(lǐng)域的經(jīng)典文獻(xiàn)值得認(rèn)真研讀。孟小峰和慈祥發(fā)表的《大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)》一文對(duì)于研究人員的借鑒作用也非常明顯。另外,2013年的大數(shù)據(jù)理論研究成果無論是著作還是論文都成果顯著,在一段時(shí)間內(nèi)應(yīng)該引起該領(lǐng)域的重視。

      根據(jù)關(guān)鍵詞統(tǒng)計(jì)分析可以看出,雖然大數(shù)據(jù)的相關(guān)研究非常注重計(jì)算機(jī)科學(xué)與技術(shù)的應(yīng)用,但是對(duì)于大數(shù)據(jù)的存儲(chǔ)問題和分析工具并沒有成為研究重點(diǎn),但是數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)分析工具作為大數(shù)據(jù)處理的基礎(chǔ)工具理應(yīng)得到優(yōu)先的發(fā)展,才能保證大數(shù)據(jù)在其他領(lǐng)域的實(shí)際應(yīng)用。[5]同時(shí),由于大數(shù)據(jù)的普遍應(yīng)用,使得信息安全和隱私保護(hù)成為一項(xiàng)新的課題受備關(guān)注,而國內(nèi)并有沒相應(yīng)的法律法規(guī)作保障,只能依靠行業(yè)自律,這種情況很容易引起大數(shù)據(jù)應(yīng)用過程中的數(shù)據(jù)濫用等問題,因此,有必要將相應(yīng)的法律法規(guī)的制定提上日程。從經(jīng)典著作分析中可知,國內(nèi)更注重大數(shù)據(jù)理論框架的構(gòu)建,而國外更注重技術(shù)的突破。因此,我們有必要多借鑒國外的先進(jìn)技術(shù),做到理論和應(yīng)用共同進(jìn)步。另外,大數(shù)據(jù)的出現(xiàn)使得數(shù)據(jù)價(jià)值得到了空前的重視,而數(shù)據(jù)可視化分析也開始走進(jìn)研究人員的視野,這也將成為大數(shù)據(jù)研究的一個(gè)新的趨勢(shì)和熱點(diǎn)。[6]

      [1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].杭州:浙江人民出版社.2013:17.

      [2]超星發(fā)現(xiàn)系統(tǒng)核心功能[EB/OL].[2017-03-03].http://ss.zhizhen.com/about/about.html.

      [3]衣曉冰.近十年我國信息素養(yǎng)教育研究現(xiàn)狀分析——基于四類常用學(xué)術(shù)文獻(xiàn)的統(tǒng)計(jì)分析[J].圖書館界,2016(2):54-59.

      [4]百度學(xué)術(shù).大數(shù)據(jù)[EB/OL].[2017-03-20].http://xueshu.baidu.com/u/biye?tag=paper&wd=大數(shù)據(jù)&site=index_links

      [5]官思發(fā),等.大數(shù)據(jù)分析研究現(xiàn)狀、問題與對(duì)策[J].情報(bào)雜志,2015(5):98-104.

      [6]劉成山,李玉,王潔良.大數(shù)據(jù)在圖書情報(bào)領(lǐng)域的研究現(xiàn)狀及趨勢(shì)分析[J].情報(bào)理論與實(shí)踐,2016(4):20-26.

      猜你喜歡
      發(fā)文論文領(lǐng)域
      10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
      領(lǐng)域·對(duì)峙
      青年生活(2019年23期)2019-09-10 12:55:43
      校園拾趣
      爺孫趣事
      以牙還牙
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
      2013年5—12月最佳論文
      新聞前哨(2014年1期)2014-03-12 22:10:06
      苏尼特左旗| 神农架林区| 宁都县| 清丰县| 远安县| 吉隆县| 手机| 武义县| 洪湖市| 灵寿县| 青阳县| 沾化县| 惠州市| 南江县| 沐川县| 师宗县| 白水县| 清镇市| 定安县| 五华县| 邵阳市| 惠东县| 建昌县| 石林| 黑河市| 连山| 涪陵区| 厦门市| 平遥县| 芷江| 蒙自县| 望城县| 黄陵县| 阳高县| 长寿区| 深水埗区| 太康县| 潞城市| 利辛县| 壤塘县| 阿克|