沈小尉,李小濤
迄今為止,可視化技術(shù)的研究已經(jīng)歷了科學(xué)計(jì)算可視化、信息可視化和知識(shí)可視化3個(gè)階段[1]。將可視化技術(shù)引入到數(shù)字圖書(shū)館領(lǐng)域,不僅可以解決信息需求與服務(wù)的個(gè)性化、信息提供的個(gè)性化等問(wèn)題,還可能有助于解決數(shù)字圖書(shū)館發(fā)展中遇到的其他問(wèn)題。在用戶需求與科技發(fā)展的推動(dòng)下,圖書(shū)館可視化研究近年持續(xù)升溫,已形成圖書(shū)情報(bào)領(lǐng)域的一大研究熱點(diǎn)。
1.1 資料來(lái)源 以中國(guó)知網(wǎng)的中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)為數(shù)據(jù)源,以主題為檢索途徑,以“可視化and圖書(shū)館”為檢索詞,不限年份,共檢出文獻(xiàn)184篇,最后檢索時(shí)間為2012-06-05。將所有文獻(xiàn)題錄下載存貯其詳細(xì)格式為“.txt”文件,并將該數(shù)據(jù)庫(kù)提供的文獻(xiàn)被引頻次進(jìn)行記錄和保存。
1.2 研究方法 對(duì)文獻(xiàn)題錄進(jìn)行去空格和段落標(biāo)記的格式調(diào)整,然后切分字段并導(dǎo)入到Excel表中。通過(guò)Excel的排序、篩選、分類匯總功能,并結(jié)合使用武漢大學(xué)ROST統(tǒng)計(jì)軟件,對(duì)文獻(xiàn)的時(shí)間分布、單位分布、作者分布、基金資助情況、高頻關(guān)鍵詞、被引頻次等指標(biāo)進(jìn)行統(tǒng)計(jì)分析。
2.1 時(shí)間分布 檢索到的最早相關(guān)文獻(xiàn)為1996年《中國(guó)信息導(dǎo)報(bào)》刊載的“情報(bào)科學(xué)技術(shù)與虛擬圖書(shū)館”一文,提出了虛擬現(xiàn)實(shí)技術(shù)和數(shù)據(jù)可視化技術(shù)在圖書(shū)館的廣闊應(yīng)用前景。在隨后的時(shí)間里,有關(guān)圖書(shū)館可視化技術(shù)研究的文獻(xiàn)不斷增多,尤其是近幾年,文獻(xiàn)量和基金論文數(shù)出現(xiàn)了成倍增長(zhǎng)。1996~1999年是圖書(shū)館可視化技術(shù)的起步階段,文獻(xiàn)量很少。除1997年有5篇文獻(xiàn)(包括1篇基金論文)發(fā)表外,其它年份均只有1篇文獻(xiàn)。2000~2003年這方面的研究有了進(jìn)一步的發(fā)展,文獻(xiàn)量和基金論文數(shù)都略有增加。2004~2007年圖書(shū)館可視化研究逐漸吸引了更多研究者的關(guān)注,文獻(xiàn)量和基金論文數(shù)明顯增加;2008年至今,圖書(shū)館可視化研究的文獻(xiàn)量急劇增加,逐漸成為一個(gè)新興研究熱點(diǎn),僅2011年1年的文獻(xiàn)量就達(dá)到了40篇,其中包括基金論文15篇。各年的論文數(shù)量和基金論文數(shù)見(jiàn)表1,各階段文獻(xiàn)量的增長(zhǎng)趨勢(shì)見(jiàn)圖1?;鹳Y助論文基金資助論文是指由國(guó)家各級(jí)政府部門(mén)、各類基金組織和企事業(yè)單位提供科研經(jīng)費(fèi)而產(chǎn)生的研究論文,可以反映本專業(yè)領(lǐng)域內(nèi)理論與實(shí)踐研究的熱點(diǎn)問(wèn)題和最新的研究成果,具有較高的學(xué)術(shù)價(jià)值[2]。近年基金資助論文率的增高可以在一定程度上說(shuō)明圖書(shū)館可視化的研究水平上升,正日益成為學(xué)界同仁關(guān)注的熱點(diǎn),受到政府及相關(guān)行業(yè)的重視。
2.2 機(jī)構(gòu)分布 高校各院系發(fā)表論文最多,共95篇,其次是高校圖書(shū)館,發(fā)文67篇。91.23%的基金資助論文來(lái)自于高校各院系和高校圖書(shū)館,其他類型單位的基金論文相對(duì)較少??梢?jiàn)高校各院系和圖書(shū)館對(duì)于圖書(shū)館可視化的研究水平較高,課題來(lái)源較多,見(jiàn)表2。第一作者所在機(jī)構(gòu)進(jìn)行統(tǒng)計(jì),發(fā)文量最多的8家機(jī)構(gòu)見(jiàn)表3。南京大學(xué)發(fā)文10篇,位居第一,其次是中國(guó)科學(xué)院,共發(fā)文9篇。其他6家機(jī)構(gòu)發(fā)文3~7篇。對(duì)高被引論文的作者單位進(jìn)行統(tǒng)計(jì),高被引論文數(shù)最多的10家機(jī)構(gòu)見(jiàn)表4。武漢大學(xué)有7篇,位居第一;其次是南京大學(xué),共有6篇。其它8家機(jī)構(gòu)的高被引論文篇數(shù)為2~4篇??烧J(rèn)為這些機(jī)構(gòu)是目前國(guó)內(nèi)圖書(shū)館可視化研究的的主要力量。
表 1 1996~2012年的文獻(xiàn)量與基金論文數(shù)
圖 1 1996~2012年的文獻(xiàn)量與基金論文增長(zhǎng)趨勢(shì)
表 2 各類機(jī)構(gòu)的發(fā)文量
表 3 發(fā)文量最多的8家機(jī)構(gòu)
表 4 被引論文最多的10家機(jī)構(gòu)
2.3 作者分布 第一作者發(fā)文量最多的是劉麗和高飛,均為4篇,其他作者發(fā)文量均為1~2篇,此領(lǐng)域尚未出現(xiàn)較為突出的高產(chǎn)作者,見(jiàn)表5。共有90篇論文已被引用,對(duì)被引論文的第一作者進(jìn)行統(tǒng)計(jì),總被引頻次最多的10位作者見(jiàn)表6。第三軍醫(yī)大學(xué)基礎(chǔ)部的張紹祥已有2篇論文被引,總被引頻次為51次,其次是北京大學(xué)的吳慰慈,被引34次。這些作者的研究成果受到了國(guó)內(nèi)同行的較多的關(guān)注,見(jiàn)表6。
表 5 發(fā)文量最多的11位作者
2.4 研究熱點(diǎn)分析 對(duì)184篇文獻(xiàn)的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),共有389個(gè)關(guān)鍵詞,總頻次為672次。將關(guān)鍵詞按詞頻降序排列,詞頻≥3次的39個(gè)關(guān)鍵詞如表7所示。若某一關(guān)鍵詞在其所處領(lǐng)域的文獻(xiàn)中反復(fù)出現(xiàn),則說(shuō)明該關(guān)鍵詞所表征的研究主題是該領(lǐng)域的研究熱點(diǎn)[3],根據(jù)這39個(gè)高頻關(guān)鍵詞并結(jié)合實(shí)際情況可以歸納出圖書(shū)館可視化研究的四個(gè)主要的研究方向:信息組織可視化、信息檢索可視化、信息分析可視化、信息服務(wù)可視化。
表 6 總被引頻次最多的10位作者
表 7 關(guān)鍵詞詞頻統(tǒng)計(jì)
2.4.1 信息組織可視化 本體和語(yǔ)義網(wǎng)是新興的信息組織方式 ,引入可視化技術(shù)表現(xiàn)本體,能加深人們對(duì)信息的理解和認(rèn)識(shí)[1]。表征這一研究方向的高頻關(guān)鍵詞有:本體(6)、知識(shí)組織(3)、中國(guó)圖書(shū)館分類法(3)。此研究方向被引頻次較多的論文作者有靖培棟、歐陽(yáng)寧、曹樹(shù)金等人。
《中國(guó)圖書(shū)館分類法》(簡(jiǎn)稱《中圖法》)是我國(guó)圖書(shū)館和情報(bào)單位普遍使用的一部綜合性的分類法,在分類編目、組織文獻(xiàn)等方面有廣泛應(yīng)用。2005年,靖培棟等[4]使用Java技術(shù),實(shí)現(xiàn)了基于雙曲幾何的《中圖法》分類體系的可視化。隨后,歐陽(yáng)寧等[5]利用本體構(gòu)建工具Protégé,進(jìn)行了《中圖法》部分類目的可視化實(shí)踐,證明用Protégé實(shí)現(xiàn)《中圖法》可視化是可行的。曹樹(shù)金[6]認(rèn)為分類法的可視化更加有利于直觀呈現(xiàn)類目之間的關(guān)系和結(jié)構(gòu),《中圖法》的發(fā)展應(yīng)借鑒杜威十進(jìn)分類法和國(guó)際十進(jìn)分類法網(wǎng)絡(luò)化發(fā)展的經(jīng)臉,向網(wǎng)絡(luò)化和可視化方向發(fā)展,增強(qiáng)用戶交互性。
2.4.2 信息檢索可視化 信息檢索可視化就是將館藏資源和館藏資源之間的語(yǔ)義關(guān)系以一種可視化的方式展示出來(lái),實(shí)現(xiàn)檢索過(guò)程的可視化和檢索結(jié)果的可視化。信息檢索系統(tǒng)引入可視化技術(shù)可以優(yōu)化讀者體驗(yàn),為用戶提供更好的服務(wù)。表征這一研究方向的高頻關(guān)鍵詞有:信息檢索(4)、數(shù)據(jù)庫(kù)(3)、檢索結(jié)果(3)、檢索過(guò)程(3)。 此研究方向被引頻次較多的論文作者有吉雍慧、黃田青等人。
1997年,王寧等[7]以圖書(shū)館為例,結(jié)合信息檢索及Internet相關(guān)技術(shù),說(shuō)明了可視化信息檢索系統(tǒng)的總體結(jié)構(gòu)及主要實(shí)現(xiàn)技術(shù)。2008年,吉雍慧[8]探討了在數(shù)字圖書(shū)館的文獻(xiàn)檢索平臺(tái)中,集成實(shí)現(xiàn)檢索結(jié)果聚類、相關(guān)文獻(xiàn)的關(guān)聯(lián)推薦的方法,并運(yùn)用信息可視化技術(shù)來(lái)展示最后的檢索結(jié)果,使得用戶獲得比較直觀和滿意的體驗(yàn)。同年,黃田青等[9]論述了信息可視化的基本概念和方法,通過(guò)對(duì)Aquabrowser Library信息可視化應(yīng)用案例的分析,闡述了信息可視化與圖書(shū)館OPAC結(jié)合的意義,并指出了信息可視化技術(shù)存在的一些不足。2012年,王慶娟[10]結(jié)合圖書(shū)館資源的現(xiàn)狀,運(yùn)用網(wǎng)絡(luò)搜索引擎、可視化搜索引擎、音頻搜索引擎等各類搜索引擎,將數(shù)字圖書(shū)館的資源整合在OPAC系統(tǒng)的檢索功能里,為使用館藏資源提供了的更加簡(jiǎn)便、直觀的途徑。
2.4.3 信息分析可視化 數(shù)據(jù)挖掘是一種信息分析常用的技術(shù),但其算法較為復(fù)雜,一般的用戶難以理解和接受。把可視化技術(shù)引入到數(shù)據(jù)挖掘中,實(shí)現(xiàn)信息分析的可視化,可以為用戶提供了一種易于理解的信息分析工具,幫助人們更好地理解、利用信息。表征這一研究方向的高頻關(guān)鍵詞有:知識(shí)圖譜(21)、地理信息系統(tǒng)(10)、研究熱點(diǎn)(8)、圖書(shū)館學(xué)(6)、數(shù)據(jù)挖掘(5)、共詞分析(5)、共現(xiàn)分析(5)、文獻(xiàn)計(jì)量(4)、詞頻統(tǒng)計(jì)(4)、情報(bào)學(xué)(3)、共被引分析(3)、圖書(shū)情報(bào)學(xué)(3)。此研究方向被引頻次較多的論文作者有郝小花、宗乾進(jìn)等人。
2005年,張永梅等[11]討論了數(shù)字圖書(shū)館系統(tǒng)中可視化數(shù)據(jù)挖掘的理論、方法與實(shí)現(xiàn),采用Visual Basic和Matlab進(jìn)行數(shù)據(jù)挖掘,并利用Visual Basic中的可視化功能將結(jié)果以圖表方式動(dòng)態(tài)展示,以實(shí)際案例說(shuō)明了可視化數(shù)據(jù)挖掘的科學(xué)性與可行性。2008年郝小花等[12]提出,對(duì)于用戶社區(qū)的分析有利于分析不同用戶的信息相關(guān)性,采用二維的距離模型來(lái)建立用戶社區(qū)模型,在傳統(tǒng)數(shù)據(jù)描述的基礎(chǔ)上引入了相關(guān)可視化建模技術(shù),直觀地描述用戶與知識(shí)間的關(guān)系,進(jìn)而將數(shù)字圖書(shū)館用戶分為了四個(gè)類型:求學(xué)群體、教學(xué)群體、科研群體、管理與服務(wù)群體,并計(jì)算了上述群落的彼此相關(guān)性系數(shù),為圖書(shū)館的個(gè)性化服務(wù)提供了依據(jù)。2011年,宗乾進(jìn)等[13]利用自編程序與陳超美博士開(kāi)發(fā)的 Citespace II對(duì)2009年的中國(guó)圖書(shū)館學(xué)文獻(xiàn)進(jìn)行了分析,以可視化知識(shí)圖譜的方式展示了國(guó)內(nèi)圖書(shū)館學(xué)的研究熱點(diǎn)。研究結(jié)果顯示,我國(guó)圖書(shū)館學(xué)研究熱點(diǎn)主要有數(shù)字圖書(shū)館、機(jī)構(gòu)知識(shí)庫(kù)、信息共享空間、服務(wù)模式、知識(shí)管理、圖書(shū)館聯(lián)盟、學(xué)術(shù)評(píng)價(jià)等。
2.4.4 信息服務(wù)可視化 信息服務(wù)可視化是指充分發(fā)揮可視化技術(shù)在數(shù)字圖書(shū)館中的作用,將現(xiàn)有館藏資源最大限度地開(kāi)發(fā)利用,解決信息需求、信息提供與服務(wù)的個(gè)性化等問(wèn)題。表征這一研究方向的高頻關(guān)鍵詞有:信息資源(6)、虛擬現(xiàn)實(shí)(5)、面向?qū)ο螅?)、人機(jī)交互(4)、圖書(shū)館管理(3)、信息服務(wù)(3)、知識(shí)服務(wù)(3)、虛擬圖書(shū)館(3)、信息管理(3)、觸摸屏(3)、圖書(shū)館服務(wù)(3)、可視化信息系統(tǒng)(3)、個(gè)性化服務(wù)(3)。此研究方向被引頻次較多的論文作者有周靜怡、楊達(dá)等人。
盛小平[14]介紹了數(shù)字圖書(shū)館用戶界面的三種模式,即自適應(yīng)可視化界面、統(tǒng)一用戶界面、拖放多媒體界面,提出了數(shù)字圖書(shū)館用戶界面評(píng)價(jià)指標(biāo)和優(yōu)化數(shù)字圖書(shū)館用戶界面的措施。周靜怡等[15]介紹了信息可視化在數(shù)字圖書(shū)館中的初步應(yīng)用,包括信息檢索過(guò)程可視化、信息檢索結(jié)果可視化和知識(shí)領(lǐng)域可視化等方面。信息檢索結(jié)果可視化成果最為突出,她著重介紹了Xerox PARC關(guān)于數(shù)字圖書(shū)館研究的代表性研究成果。楊達(dá)[16]討論了數(shù)字圖書(shū)館環(huán)境下信息可視化的基本含義與特點(diǎn),并建立了信息可視化的主要研究框架。他認(rèn)為數(shù)字圖書(shū)館可視化研究的熱點(diǎn)研究領(lǐng)域包括:可視化變量研究,可視化模型的研究,符號(hào)系統(tǒng)研究,心理學(xué)與認(rèn)知科學(xué)研究,非空間數(shù)據(jù)可視化處理研究,知識(shí)管理研究,仿真和虛擬技術(shù)研究。隨后,劉鐘美[17]針對(duì)當(dāng)前個(gè)性化信息推薦服務(wù)的不足,提出了把知識(shí)地圖應(yīng)用到圖書(shū)館的個(gè)性化信息推薦服務(wù)中的建議:為用戶提供一個(gè)可視化環(huán)境,及時(shí)把有關(guān)信息自動(dòng)推送給相應(yīng)的用戶,提高服務(wù)效率。
以上研究結(jié)果表明,我國(guó)圖書(shū)館可視化研究正在興起,論文數(shù)量持續(xù)增多,基金資助率不斷上升,出現(xiàn)了以武漢大學(xué)、南京大學(xué)等為代表的高水平研究機(jī)構(gòu),產(chǎn)生了以劉麗、高飛為代表的作者群體,形成了信息組織可視化、信息檢索可視化、信息分析可視化和信息服務(wù)可視化等主要研究方向,研究水平逐漸提高。
但同時(shí)也要看到,圖書(shū)館可視化研究的發(fā)展中也存在著一些問(wèn)題。從研究機(jī)構(gòu)來(lái)看,高等各院系和高校圖書(shū)館是研究主力,基金論文也多來(lái)自這兩類單位。公共圖書(shū)館、科研院所對(duì)這方面的研究尚處于起步階段,無(wú)論是研究水平還是重視程度均遠(yuǎn)遠(yuǎn)不夠。為更好地滿足用戶需求,提高圖書(shū)館的服務(wù)質(zhì)量與核心競(jìng)爭(zhēng)力,各類圖書(shū)館對(duì)可視化技術(shù)的研究和應(yīng)用還有待加強(qiáng)。
從研究方向來(lái)看,關(guān)于圖書(shū)館信息分析可視化和信息服務(wù)可視化的論文較多,但多停留在理論研究階段,缺少實(shí)證研究;關(guān)于信息組織可視化和信息檢索可視化的研究論文較少,而且多為對(duì)國(guó)外圖書(shū)館可視化情況的介紹,自身的技術(shù)應(yīng)用與創(chuàng)新亟待突破。本體和語(yǔ)義網(wǎng)等新興的信息組織方式為突破信息組織可視化的技術(shù)瓶頸提供了工具,這方面的研究與應(yīng)用必將極大地推動(dòng)圖書(shū)館服務(wù)的可視化進(jìn)程。
另外,雖然近年來(lái)我國(guó)的圖書(shū)館可視化研究在之前的基礎(chǔ)上有了明顯的進(jìn)步,但不可避免地也存在一定的局限性。一方面,可視化是一門(mén)交叉學(xué)科,相關(guān)技術(shù)知識(shí)需要涉獵多學(xué)科背景知識(shí)才能掌握,而圖書(shū)館工作人員大多不是專業(yè)的技術(shù)工作者,研究和推廣可視化技術(shù)較為困難;另一方面,由于館藏資源的廣泛性與復(fù)雜性,憑借現(xiàn)有的技術(shù)和工具來(lái)對(duì)館藏進(jìn)行可視化的組織和檢索還比較困難,圖書(shū)館服務(wù)完全實(shí)現(xiàn)可視化還有待較長(zhǎng)時(shí)間的探索和實(shí)踐。
[1]劉 波,馬紅妹,徐學(xué)文.20年可視化發(fā)展歷程對(duì)情報(bào)學(xué)的影響[J].情報(bào)理論與實(shí)踐,2008,31(1):15-17.
[2]高 凡,王惠翔.我國(guó)圖書(shū)館學(xué)情報(bào)學(xué)基金論文產(chǎn)出力調(diào)查研究與定量分析[J].圖書(shū)情報(bào)工作,2004(10):12-16.
[3]李小濤,劉 巖,劉亞民,等.我國(guó)兩大醫(yī)學(xué)信息學(xué)期刊不同時(shí)期研究熱點(diǎn)的比較分析[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2011,20(1):10-14.
[4]靖培棟,郭宇峰.基于雙曲幾何的《中圖法》分類體系的可視化[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(1):40-42.
[5]歐陽(yáng)寧,包 平.基于本體《中國(guó)圖書(shū)館分類法》的可視化實(shí)現(xiàn)[J].圖書(shū)館雜志,2008,27(1):28-32.
[6]曹樹(shù)金.DDC,UDC網(wǎng)絡(luò)化對(duì)《中圖法》發(fā)展的啟示[J].國(guó)家圖書(shū)館學(xué)刊,2008(2):36-39,70.
[7]王 寧,葛家翔,胡運(yùn)發(fā).可視化信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程,1997,23(12):179-182.
[8]吉雍慧.數(shù)字圖書(shū)館中的檢索結(jié)果聚類和關(guān)聯(lián)推薦研究[J].情報(bào)分析與研究,2008(2):69-75.
[9]黃田青,曹 艷,陳清文.信息可視化在圖書(shū)館OPAC中的應(yīng)用———以AquabrowserLibrary為例[J].情報(bào)資料工作,2008(2):64-68.
[10]王慶娟.基于OPAC系統(tǒng)檢索功能的圖書(shū)館資源整合研究[J].圖書(shū)館學(xué)研究,2012,2012(7):15-17.
[11]張永梅,韓 焱,薛海麗.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書(shū)館中的應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,2005(10):33-38.
[12]郝小花,鄧小昭.基于數(shù)據(jù)挖掘的可視化數(shù)字圖書(shū)館用戶社區(qū)聚類與特征分析[J].情報(bào)科學(xué),2008,26(3):396-399.
[13]宗乾進(jìn),沈洪洲.2009年我國(guó)圖書(shū)館學(xué)研究熱點(diǎn)和知識(shí)來(lái)源譜系———南京大學(xué)知識(shí)圖譜研究組系列論文之一[J].圖書(shū)館雜志,2011,30(6):13-19.
[14]盛小平.數(shù)字圖書(shū)館用戶界面研究[J].圖書(shū)館雜志,2003(2):12-16.
[15]周靜怡,孫 坦.信息可視化在數(shù)字圖書(shū)館中應(yīng)用淺析[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(1):5-8.
[16]楊 達(dá).數(shù)字圖書(shū)館信息可視化的研究框架[J].沈陽(yáng)教育學(xué)院學(xué)報(bào),2005,7(3):127-130.
[17]劉鐘美.知識(shí)地圖在圖書(shū)館個(gè)性裕信息推薦服務(wù)中的應(yīng)用研究[J].圖書(shū)情報(bào)工作,2006,50(10):97-103.