陳大平
摘 要:近年來(lái)我國(guó)經(jīng)濟(jì)高速發(fā)展也帶動(dòng)了互聯(lián)網(wǎng)信息化的快速發(fā)展,大數(shù)據(jù)已成為科研的重要項(xiàng)目。
關(guān)鍵詞:圖書(shū)情報(bào);大數(shù)據(jù);熱點(diǎn)研究
在現(xiàn)代化計(jì)算機(jī)科學(xué)應(yīng)用技術(shù)的環(huán)境下,大數(shù)據(jù)研究已成為重要的組成部分,以互聯(lián)網(wǎng)“云計(jì)算”數(shù)據(jù)管理為核心的圖書(shū)情報(bào)領(lǐng)域的大數(shù)據(jù)研究也越來(lái)越受到社會(huì)各界的關(guān)注。本文將著重介紹我國(guó)圖書(shū)情報(bào)領(lǐng)域大數(shù)據(jù)研究熱點(diǎn),希望給圖書(shū)情報(bào)領(lǐng)域帶來(lái)些許的借鑒意義。
1 我國(guó)的圖書(shū)館學(xué)情報(bào)學(xué)的發(fā)展現(xiàn)狀
圖書(shū)館學(xué)情報(bào)學(xué)在我國(guó)的快速發(fā)展的網(wǎng)絡(luò)信息化進(jìn)程中漸漸形成了鮮明的欄目、網(wǎng)站。這極大的促進(jìn)了讀者獲取知識(shí)的能力,還進(jìn)一步的方便了作者、讀者和編者之間的相互經(jīng)驗(yàn)的交流。對(duì)于讀者來(lái)說(shuō),可以很快地獲取最新的咨詢,其中提供了豐富的內(nèi)容篩選功能,真正的做到了讀者對(duì)信息的“各取所需”。隨著圖書(shū)館學(xué)情報(bào)學(xué)的發(fā)展,對(duì)于期刊網(wǎng)絡(luò)信息化來(lái)說(shuō),不僅要努力滿足國(guó)內(nèi)的用戶的使用,還需要進(jìn)一步提升國(guó)際知名度。目前我國(guó)在國(guó)家的統(tǒng)籌規(guī)劃和協(xié)調(diào)處理之下,很大一部分的學(xué)術(shù)期刊形成了比較完備的學(xué)術(shù)期刊編輯部,編輯網(wǎng)絡(luò)的規(guī)范性也得到了一定的保證。以中國(guó)期刊網(wǎng)等各大型專(zhuān)業(yè)數(shù)據(jù)庫(kù)的協(xié)同運(yùn)作作為我國(guó)學(xué)術(shù)信息傳播的優(yōu)良的網(wǎng)絡(luò)發(fā)行平臺(tái),由全國(guó)范圍內(nèi)遴選各學(xué)科各專(zhuān)業(yè)權(quán)威專(zhuān)家組成的專(zhuān)門(mén)機(jī)構(gòu)作為學(xué)術(shù)成果的評(píng)價(jià)平臺(tái),實(shí)現(xiàn)開(kāi)放出版、開(kāi)放獲取,促進(jìn)我國(guó)圖書(shū)館學(xué)情報(bào)學(xué)期刊穩(wěn)定、可持續(xù)的發(fā)展。
2 我國(guó)圖書(shū)情報(bào)資源存在的問(wèn)題
2.1 缺乏統(tǒng)一的管理
因?yàn)槲覈?guó)情報(bào)機(jī)構(gòu)分屬的系統(tǒng)不一致,就難免使管理很難統(tǒng)一?,F(xiàn)今我國(guó)的圖書(shū)情報(bào)機(jī)構(gòu)分別屬于四個(gè)獨(dú)立的管轄機(jī)構(gòu)。分別是,隸屬于中國(guó)科學(xué)技術(shù)院的文獻(xiàn)情報(bào)系統(tǒng);隸屬于我國(guó)文化部的公共圖書(shū)館系統(tǒng);隸屬于教育部的高等院校圖書(shū)館系統(tǒng);隸屬于中國(guó)科技部的綜合科技情報(bào)系統(tǒng)。這就把圖書(shū)管理分割開(kāi)來(lái),難以統(tǒng)一有效管理,致使我國(guó)現(xiàn)今很難確立圖書(shū)館網(wǎng)絡(luò)技術(shù)信息資源建設(shè)較為統(tǒng)一的實(shí)施標(biāo)準(zhǔn)和規(guī)范,圖書(shū)館的鏈接和共享也受到了一定影響。
2.2 圖書(shū)資源數(shù)字化程度有待提升
盡管我國(guó)的紙質(zhì)圖書(shū)文獻(xiàn)十分豐富,無(wú)論是在類(lèi)別上還是數(shù)量上都很巨大,但是由于網(wǎng)絡(luò)化硬件建設(shè)的基礎(chǔ)還比較薄弱,加之本身的額數(shù)字化程度不高,就很難讓讀者從異地或者本地網(wǎng)絡(luò)上查閱到想查閱的信息資源,尤其是比較早期的一些比較珍貴的文獻(xiàn)資料。
2.3 數(shù)據(jù)對(duì)接的難度大,數(shù)據(jù)庫(kù)的建設(shè)缺乏規(guī)范完善的標(biāo)準(zhǔn)
現(xiàn)今我國(guó)的各圖書(shū)館的數(shù)據(jù)建設(shè)任然是先自行建設(shè)為主,數(shù)據(jù)庫(kù)的類(lèi)型也是花樣繁多,加之獨(dú)立建庫(kù),就導(dǎo)致了各個(gè)獨(dú)自建立的數(shù)據(jù)庫(kù)不能很好的實(shí)現(xiàn)無(wú)縫對(duì)接,增加了圖書(shū)館網(wǎng)絡(luò)化的成本。
2.4 資源共享共建缺乏統(tǒng)一的完善的建設(shè)規(guī)劃
信息資源建設(shè)是一項(xiàng)長(zhǎng)期的系統(tǒng)工程,這就要求各館要高度重視并認(rèn)真的完成,建設(shè)資金的投入要有連續(xù)性不能中斷,圖書(shū)館之間要有協(xié)調(diào)性,避免重復(fù)建設(shè)導(dǎo)致的資源浪費(fèi)。但是由于目前尚無(wú)至上而下的統(tǒng)一規(guī)劃,致使各館為了達(dá)到評(píng)估要求盲目上項(xiàng)目,使本來(lái)就數(shù)目不多的資金也沒(méi)有用在刀刃上。總體上使我國(guó)的信息資源建設(shè)處于一種混亂無(wú)序的狀況,這都不利于圖書(shū)館信息化、網(wǎng)絡(luò)化的發(fā)展。
2.5 版權(quán)問(wèn)題不能很好解決,信息安全無(wú)保障
目前我國(guó)的網(wǎng)絡(luò)安全形勢(shì)不容樂(lè)觀,網(wǎng)絡(luò)安全是發(fā)展網(wǎng)絡(luò)建設(shè)的重要保障。目前我國(guó)沒(méi)有建立完整的網(wǎng)絡(luò)信息資源保護(hù)法,導(dǎo)致黑客盛行肆意妄為。網(wǎng)絡(luò)安全問(wèn)題比較復(fù)雜嚴(yán)峻。今年我國(guó)的知識(shí)產(chǎn)權(quán)法進(jìn)一步的完善了,但是這也導(dǎo)致了出版物網(wǎng)絡(luò)化的版權(quán)問(wèn)題。使得許多圖書(shū)館信息資源網(wǎng)絡(luò)化時(shí)存在顧慮。如何在網(wǎng)絡(luò)資源共享與知識(shí)產(chǎn)權(quán)之間尋找一個(gè)平衡點(diǎn)是當(dāng)務(wù)之急。
2.6 人才的普遍缺乏
科學(xué)技術(shù)是第一生產(chǎn)力,而專(zhuān)業(yè)的技術(shù)人才是發(fā)展科學(xué)技術(shù)的保證。但是現(xiàn)今從全國(guó)范圍看,專(zhuān)業(yè)技術(shù)人才普遍比較少,館員的計(jì)算機(jī)信息技術(shù)知識(shí)普遍也比較匱乏,專(zhuān)業(yè)處理能力也比較低。由于整個(gè)共享系統(tǒng)處于初步建成運(yùn)行的狀態(tài),但是工作人員的微機(jī)水平不足,無(wú)法正確操作或維護(hù)而不能充分發(fā)揮應(yīng)有的作用,造成資源的浪費(fèi)。
3 情報(bào)學(xué)領(lǐng)域大數(shù)據(jù)熱點(diǎn)研究
3.1 構(gòu)建高頻關(guān)鍵詞矩陣
高頻關(guān)鍵詞表中“情報(bào)學(xué)”出現(xiàn)的頻次最高,但是其與本研究的內(nèi)容完全重合,故舍棄;圖書(shū)情報(bào)學(xué)與圖書(shū)館學(xué)情報(bào)學(xué)的意義相同,故將它們合并為圖書(shū)情報(bào)學(xué)。在此基礎(chǔ)上共計(jì)得到12個(gè)高頻詞作為共詞分析的原始數(shù)據(jù)。
將這12個(gè)高頻關(guān)鍵詞進(jìn)行兩兩組合,統(tǒng)計(jì)出它們同時(shí)出現(xiàn)在同一篇文獻(xiàn)中的次數(shù),形成共詞矩陣。該矩陣為對(duì)角矩陣,對(duì)角線上的數(shù)字代表任一關(guān)鍵詞自身出現(xiàn)的頻次,非對(duì)角線上的數(shù)字代表兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)的次數(shù)。為了更清晰有效地表示關(guān)鍵詞之間的某些關(guān)系,我們將用Ochiia系數(shù)計(jì)算關(guān)鍵詞相似矩陣,“Ochiia系數(shù)等于AB兩詞共同出現(xiàn)的頻次除以AB各頻次乘積的開(kāi)方。”
3.2 因子分析
用少數(shù)幾個(gè)因子來(lái)描述解釋原始的很多個(gè)變量因子之間的關(guān)系就是因子分析,因子分析可以反映原始資料里面的大部分有效信息。以下的5個(gè)特點(diǎn)是因子分析固有的,能減少計(jì)算量,因?yàn)橐蜃犹娲嗽械淖兞繀⑴c了數(shù)據(jù)建模;因子分析能反映原有變量的大部分信息;因子有命名解釋性;因子之間的線性關(guān)系不顯著;因子分析中所需提取的因子個(gè)數(shù)小于原有的變數(shù)量。
3.3 聚類(lèi)分析
俗話說(shuō)物以類(lèi)聚,那么在大數(shù)據(jù)研究里也是一個(gè)十分可行的方法?!八膶?shí)質(zhì)是建立一種分類(lèi)方法,將一批樣本數(shù)據(jù)按照它們?cè)谛再|(zhì)上的親密程度在沒(méi)有先驗(yàn)知識(shí)的情況下自動(dòng)進(jìn)行分類(lèi),同類(lèi)間較為相似,不同類(lèi)之間區(qū)別較大?!本唧w操作步驟一般分為兩點(diǎn),首先是,異矩陣導(dǎo)入SPSS19.0中,選擇分析――分類(lèi)――系統(tǒng)聚類(lèi);其次將所有變量選擇到右邊的變量列表中,依次設(shè)置聚類(lèi)分析的選項(xiàng),輸出內(nèi)容為統(tǒng)計(jì)量和圖。
在聚類(lèi)分析中時(shí)常用到樹(shù)狀圖加以解釋分析,它能比較完整清晰的展示聚類(lèi)分析中的每一次類(lèi)合并的狀況,達(dá)到最終的所有小類(lèi)合為一類(lèi),此時(shí)的類(lèi)間的距離已經(jīng)十分大了。
3.4 多維尺度分析
多維尺度分析屬于降維分析,各數(shù)據(jù)在空間中的位置是進(jìn)行分析解釋的重要前提和參照物,聚類(lèi)分析雖能確定相應(yīng)的組別,但是不能在空間中標(biāo)出觀測(cè)值,就難免影響了實(shí)際的判斷。因此就可以用多維尺度分析來(lái)對(duì)聚類(lèi)分析進(jìn)行更完善的補(bǔ)充說(shuō)明。具體操作步驟為:將相異矩陣導(dǎo)入SPSS19.0中,選擇分析――度量――多維尺度;將所有變量選擇到右邊的對(duì)應(yīng)的變量列表中,對(duì)模型、選項(xiàng)依次進(jìn)行合理的設(shè)置。
4 總結(jié)
近年來(lái),我國(guó)圖書(shū)情報(bào)學(xué)理論研究成果不斷增多不斷豐富,但是其中存在的問(wèn)題也較多,這就需要廣大的專(zhuān)業(yè)領(lǐng)域的工作者孜孜不倦的探索,努力做好本職工作。我國(guó)圖書(shū)情報(bào)領(lǐng)域大數(shù)據(jù)建設(shè)是一項(xiàng)基礎(chǔ)性核心工作,我們應(yīng)必須高度重視,我國(guó)圖書(shū)情報(bào)領(lǐng)域數(shù)據(jù)管理應(yīng)更多地借鑒國(guó)內(nèi)外相關(guān)學(xué)科的研究,從而使圖書(shū)情報(bào)資源,盡早實(shí)現(xiàn)共享。
參考文獻(xiàn)
[1]張文彥,武瑞源,于潔.大數(shù)據(jù)時(shí)代的圖書(shū)館初探[J]圖書(shū)與情報(bào);2012
[2]鄧仲華.大數(shù)據(jù)環(huán)境下嵌入科研過(guò)程的信息服務(wù)模式研究[J]圖書(shū)與情報(bào);2014
[3]周力青.大數(shù)據(jù)時(shí)代下的圖書(shū)館移動(dòng)服務(wù)創(chuàng)新研究[J]圖書(shū)與情報(bào);2015
[4]劉紅霞,白萬(wàn)豪.大數(shù)據(jù)背景下的應(yīng)用情報(bào)學(xué)研究[J]情報(bào)資料工作;2014
[5]王捷.大數(shù)據(jù)時(shí)代下圖書(shū)館開(kāi)展信息服務(wù)的對(duì)策[J]現(xiàn)代情報(bào);2013
[6]李小剛,程舒.大數(shù)據(jù)時(shí)代檔案館服務(wù)創(chuàng)新研究[J]北京檔案;2014