袁潤 姚遠
摘要:文章通過文獻量的相關方法,對1994~2015年我國信息可視化的相關研究論文進行了檢索和統(tǒng)計,分析了論文的時間分布、核心作者、機構分布等。通過運用Netdraw網(wǎng)絡可視化繪圖軟件繪制高頻關鍵詞網(wǎng)絡圖得出:近年來我國信息可視化研究主題主要集中在“可視化—系統(tǒng)—數(shù)據(jù)庫”和“GIS—管理系統(tǒng)—管理” 、“可視化—知識圖譜—前沿研究”這三個核心知識群。
一、引言
信息可視化就是利用計算機支撐的、交互的、對抽象數(shù)據(jù)的可視表示,來增強人們對抽象信息的認知。隨著海量信息的猛增,信息可視化研究與應用也不斷深化;誠然,信息可視化已成為提高信息產(chǎn)品質量、追求更高經(jīng)濟效益與社會效益的重要手段。為了解我國信息可視化研究狀況,筆者對我國信息可視化研究文獻進行計量分析,以期探索我國信息可視化研究的現(xiàn)狀及趨勢。
二、數(shù)據(jù)收集、整理及分析方法
關于數(shù)據(jù)的收集整理,本文以中國學術期刊網(wǎng)全文數(shù)據(jù)庫(CNKI)和重慶維普作為統(tǒng)計來源,從中篩選出樣本文獻。在選取樣本時,主要采用“篇名=信息可視化OR摘要=信息可視化”的檢索策略,以精確查詢的方式分別從兩個數(shù)據(jù)庫中提取1994年至2015年的文獻作為研究數(shù)據(jù)。通過剔除無分析意義的文本、填補或刪除數(shù)據(jù)項缺失的文本、合并重復的文本等操作,最終獲得1548篇樣本文獻。
關于樣本的分析,本文主要通過文獻信息統(tǒng)計方法,并輔以內(nèi)容分析法,從論文總量的變化趨勢、核心作者、機構分布、高頻詞等方面對信息可視化領域的總體研究趨勢、研究主體及研究主題進行統(tǒng)計分析。
三、總體研究趨勢
首先,本文通過年度論文發(fā)表數(shù)量來分析信息可視化領域的總體研究趨勢。從信息可視化領域文獻數(shù)量增長趨勢圖(圖1)中可看出,1998年之前的有關信息可視化研究成果較少,究其原因是由于信息可視化還未受到足夠的重視,研究領域也較為局限,只是初步將科學可視化的研究成果應用于GIS、管理信息系統(tǒng)等。而從1999年開始,信息可視化領域逐漸受到不同學科領域、甚至是國家的重視,有關該領域的研究成果不斷涌現(xiàn),雖然在2005、2010年該領域的文獻量有所下降,但總體上,該領域的文獻量呈快速增長的趨勢,這從一定程度上反映了其受重視的程度。
四、研究主體分析
信息可視化領域的研究主體包括作者及所在機構。通過對核心作者及相應機構的分析,我們可以發(fā)現(xiàn)信息可視化領域的科研精英及核心研究力量。
(一)論文核心作者情況分析
信息可視化研究所涉及的核心作者及發(fā)文量也從另一個側面反映出該研究的成熟程度。本文應用普賴斯的杰出科學家定理,來計算核心作者,公式如下: M=0.794(Nmax)1/2式中M為論文篇數(shù),Nmax為統(tǒng)計樣本中發(fā)文最多的作者的論文數(shù),其中發(fā)文M篇以上的人即被定義為核心作者。本例中Nmax為28,因此發(fā)文在6篇以上的作者為核心作者,共有21人。表1列出了這些核心作者以及它們的發(fā)文數(shù)、所在機構。
從上述分析可以看出,信息可視化領域的學者較多,然而高產(chǎn)作者群還未成型,該領域還處于發(fā)展階段,需不斷發(fā)展。
(二)論文機構分布情況分析
通過對機構進行統(tǒng)計分析,發(fā)現(xiàn)高校在信息可視化研究領域發(fā)揮著重要科研作用。雖然也有企業(yè)的參與,但比例很小,在602個機構中僅有61個企業(yè),占總機構數(shù)的10.17%;而高校有344所,占總機構數(shù)的57.28%。表2所示為發(fā)文量排在前列的機構及其發(fā)文數(shù),通過對照排在前列的發(fā)文機構和核心作者所屬機構,可以發(fā)現(xiàn),正是這樣一大批杰出科技工作者的存在,使得他們所處的單位成為我國當前信息可視化研究的核心力量。
五、主要研究領域分析
關于研究領域的分析,本文主要采用內(nèi)容分析法,關鍵詞詞頻分析法、關鍵詞共現(xiàn)網(wǎng)絡圖譜相結合的方式來鎖定信息可視化的核心研究領域。
關鍵詞作為作者對論文內(nèi)容的高度概括和精確提煉,一定程度上反映出了論文的核心內(nèi)容和主題。樣本文獻中共包含有2037個關鍵詞,出現(xiàn)的總頻次為3474次。本文選去詞頻大于等于4的60個關鍵詞,運用Netdraw網(wǎng)絡可視化繪圖軟件,制作如圖2所示的高頻關鍵詞特征向量中心性網(wǎng)絡。
由圖2可知,信息可視化領域的主要研究領域為可視化、信息可視化及GIS領域;其次是知識數(shù)據(jù)庫、系統(tǒng)、信息、知識圖譜、科學可視化、信息管理等。結合表3分析,在高頻關鍵詞中,“信息可視化”的頻次最高,出現(xiàn)了308次;其次是可視化與GIS,分別出現(xiàn)了261次與104次,都遠高于其他關鍵詞詞頻。因此可以說,信息可視化領域主要是圍繞著可視化、信息可視化、GIS主題進行的。
進一步分析,首先,GIS在整個網(wǎng)絡中有較高地位的核心領域,主要的研究問題是通過探討可視化的GIS系統(tǒng)的數(shù)據(jù)庫、可視化、空間信息等技術,將GIS應用于各個領域;其次,知識圖譜在這個網(wǎng)絡中也有很高地位,它是可視化技術在研究信息資源的一種表現(xiàn)形式,主要是通過文獻計量繪制某一研究領域的知識圖譜來揭示該領域的研究前沿與研究熱點,其中Ucinet、CiteSpace軟件就是用來繪制知識圖譜的常用工具。
從圖2可知,信息可視化領域是以“可視化—系統(tǒng)—數(shù)據(jù)庫”、“GIS—管理系統(tǒng)—管理”及“可視化—知識圖譜—前沿研究”這三個核心知識群為主要的研究主題。在這三個知識群的外圈各個關鍵詞較為分散,沒有形成顯著的知識群。但大致有以下三個次級知識群:左下方的“數(shù)據(jù)挖掘”、“信息檢索”、“科學可視化”等關鍵詞是信息可視化技術在信息資源利用及管理、前沿研究方面的應用;右上方的“虛擬現(xiàn)實”、“信息系統(tǒng)”、“空間分析”等關鍵詞是信息可視化在需要展示空間信息、虛擬現(xiàn)實的信息系統(tǒng)中的應用;右側的“中間件”、“系統(tǒng)設計”、“Java3D”等關鍵詞是有關信息可視化系統(tǒng)建設的技術。
結合表3可以看出,信息可視化領域研究的“信息”涉及各種信息資源,包括空間信息、地質信息、多媒體信息、Internet信息、文獻信息。信息可視化領域的最核心主題就是信息可視化技術在信息管理與信息資源利用、前沿研究中的應用(如信息管理、人機交互、數(shù)據(jù)庫等)。另外,信息可視化領域不僅重視技術本身的研究(如科學可視化、信息可視化技術、三維可視化等),同時還非常注重可視化技術在各種系統(tǒng)的應用(如電子地圖、數(shù)字圖書館、管理信息系統(tǒng)等)。
六、總結
通過對1994~2015年我國信息可視化研究文獻的計量分析,可以看出我國信息可視化研究呈現(xiàn)不斷增長的趨勢;無論是學校還是國家都非常重視該領域的發(fā)展,且其關注度呈不斷上升的趨勢;雖然我國企業(yè)對該領域研究的關注度還不夠,但隨著該領域科研人員能力與水平的不斷提升,我國在該領域的研究水平與能力會逐漸受到國際的關注。
其次,我國信息可視化領域的研究還呈現(xiàn)出如下特點:信息可視化領域涉及的學科范圍雖廣,但主要集中在“自動化技術與計算機技術”、“信息與知識傳播”、“科學與科學研究”等學科領域;研究主題主要圍繞著“可視化—系統(tǒng)—數(shù)據(jù)庫”和“GIS—管理系統(tǒng)—管理” 、“可視化—知識圖譜—前沿研究”這三個核心知識群。
最后,信息可視化領域目前主要的研究主題是有關信息可視化在信息資源利用與信息資源管理方面的研究、學科主題研究現(xiàn)狀與前沿方面的研究以及以GIS為主的信息可視化在地質信息、虛擬現(xiàn)實等方面的研究。
參考文獻:
[1]邱均平,蘇金燕. 我國競爭情報研究文獻計量分析[J]. 情報科學,2008(12).
[2]韓麗影,劉偉.信息可視化——知識服務網(wǎng)站的新形象[J].情報理論與實踐,2005(06).
[3]趙煥芳,朱東華.信息可視化在技術監(jiān)測中的應用[J].情報雜志,2005(12).
[4]芮小平,張彥敏.空間信息可視化挖掘研究[J].測繪科學,2005(02).
[5]周靜怡,孫坦.信息可視化在數(shù)字圖書館中應用淺析[J].現(xiàn)代圖書情報技術,2005(01).
[6]陳悅,劉則淵.悄然興起的科學知識圖譜[J].科學研究,2005(02).
[7]李學靜,謝蓉.信息可視化與Web信息檢索[J].圖書館理論與實踐,2004(03).
[8]陳月莉,胡進,杜清運.基于Java3D的三維專題信息可視化研究[J].地理空間信息,2004(03).
[9]徐波,翁煥新,董成松.基于GIS的海洋環(huán)境信息數(shù)據(jù)庫在海洋環(huán)境信息可視化分析中的應用[J].浙江大學學報(理學版),2004(04).
[10]董獻洲,劉瓊,李露陽.信息可視化視圖的特征認知模式研究[J].情報科學,2008(07).
(作者單位:袁潤,江蘇大學圖書館;姚遠,江蘇大學科技信息研究所 )