洪克詩(shī)
摘要:在大數(shù)據(jù)背景下,人們對(duì)圖書館的要求越來越高,圖書館扮演的角色越來越多樣,圖書館公共媒體數(shù)據(jù)庫(kù)的構(gòu)建得到了社會(huì)各界的廣泛關(guān)注。該文立足于現(xiàn)階段圖書館建設(shè)的現(xiàn)狀及問題,提出圖書館公共媒體數(shù)據(jù)庫(kù)建設(shè)具體方案,并著重分析了對(duì)圖書館公共媒體數(shù)據(jù)庫(kù)的應(yīng)用方向與方法,以期在大數(shù)據(jù)背景下,建設(shè)更加高效、科學(xué)的圖書館公共媒體數(shù)據(jù)庫(kù)平臺(tái),充分發(fā)揮圖書館作用。
關(guān)鍵詞:大數(shù)據(jù);圖書館;公共媒體;數(shù)據(jù)庫(kù)建設(shè)與利用
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)11-0008-02
Abstract: Under the background of big data, it requires more and more of the library, the library's role more and more diverse, to build public media library database has been widespread concern in the community. Based on the Present Status and Problems of Library Construction proposed public media library database building specific programs, and analyzes the application direction and methods of public media library database to the data of the large background, building a more efficient, Science Library public media database platform, give full play to the role of the library.
Key words: big data; library; public media; database construction and utilization
1 圖書館資源建設(shè)現(xiàn)狀與現(xiàn)存問題
我國(guó)圖書館在長(zhǎng)期數(shù)字化、信息化的影響下,取得了不錯(cuò)的成績(jī),同時(shí)我們也不得不承認(rèn)還有很多需待解決和優(yōu)化的問題存在。現(xiàn)階段圖書館資源建設(shè)中存在的問題主要包括:資源類型局限,缺乏高質(zhì)量灰色文獻(xiàn);主題分布不均,部分文獻(xiàn)資源不完善;資源落后,存在大量的過時(shí)信息;數(shù)據(jù)庫(kù)利用率低,開放程度不夠等。
在大數(shù)據(jù)的背景下,圖書館公共媒體數(shù)據(jù)庫(kù)的用戶本身及用戶行為有其顯著特征。主要體現(xiàn)在兩方面:一方面,體現(xiàn)在對(duì)信息量與信息種類的需求增長(zhǎng),用戶獲取信息的形式已不再局限于傳統(tǒng)的新聞報(bào)道、調(diào)查報(bào)告等,更包含社交網(wǎng)絡(luò)、音頻視頻網(wǎng)站等新興途徑,獲取的內(nèi)容也不再局限于消息本身,而是更大范圍的各種類型的數(shù)據(jù);另一方面,用戶對(duì)服務(wù)速度及質(zhì)量要求更高,比如,在進(jìn)行查詢時(shí),用戶希望能以最簡(jiǎn)便快捷的檢索方式來獲取高匹配度、具備高價(jià)值的信息,這對(duì)數(shù)據(jù)庫(kù)信息查詢與信息過濾能力將是不小的挑戰(zhàn),與此同時(shí),信息服務(wù)不再局限于傳統(tǒng)的信息檢索功能,而是朝著更加多元化、綜合化的方向發(fā)展。
2 大數(shù)據(jù)環(huán)境下圖書館公共媒體數(shù)據(jù)庫(kù)具體建設(shè)
1)總體框架
圖書館公共媒體數(shù)據(jù)庫(kù)系統(tǒng)在設(shè)計(jì)時(shí)的目標(biāo)為:將傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)管理模式與非結(jié)構(gòu)數(shù)據(jù)管理模式有機(jī)結(jié)合,構(gòu)建具備高度可擴(kuò)展性與靈活性的數(shù)據(jù)庫(kù)系統(tǒng),最終達(dá)到提供智能化個(gè)性服務(wù)的要求。圖書館公共媒體數(shù)據(jù)庫(kù)建設(shè)從生命周期角度研究可分為獲取階段、整合階段和分析階段,分別進(jìn)行數(shù)據(jù)資源獲取、數(shù)據(jù)存儲(chǔ)和組織、數(shù)據(jù)分析工作。公共媒體數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)包括用戶行為子數(shù)據(jù)庫(kù)、社交網(wǎng)絡(luò)子數(shù)據(jù)庫(kù)、公共管理子數(shù)據(jù)庫(kù)三個(gè)子數(shù)據(jù)庫(kù)。
2)用戶行為子數(shù)據(jù)庫(kù)的建設(shè)
當(dāng)用戶通過端口進(jìn)行瀏覽操作時(shí),服務(wù)器會(huì)自動(dòng)記錄相應(yīng)信息,并保存在原始日志文件中,用戶行為子數(shù)據(jù)庫(kù)便可通過服務(wù)器日志來獲取用戶瀏覽信息。在進(jìn)行數(shù)據(jù)整合時(shí),首先要進(jìn)行數(shù)據(jù)的篩選,即對(duì)信息數(shù)據(jù)進(jìn)行分類并分配權(quán)值,根據(jù)瀏覽行為分析出喜好與習(xí)慣;其次要進(jìn)行數(shù)據(jù)組織,即將精簡(jiǎn)后的數(shù)據(jù)按照分類分眾法進(jìn)行有序化;最后要進(jìn)行數(shù)據(jù)的存儲(chǔ)與索引,按照列式存儲(chǔ)方式進(jìn)行存儲(chǔ),便于求得行為數(shù)據(jù)總量及平均值。
3)社交網(wǎng)絡(luò)子數(shù)據(jù)庫(kù)的建設(shè)
社交網(wǎng)絡(luò)的子數(shù)據(jù)庫(kù)建設(shè)是對(duì)用戶評(píng)論信息、發(fā)表博文、收藏情況、標(biāo)簽添加、文獻(xiàn)貢獻(xiàn)等信息進(jìn)行搜集、分析與整合,最終形成社交網(wǎng)絡(luò)子數(shù)據(jù)庫(kù)。其中,數(shù)據(jù)的獲取主要是通過社交網(wǎng)絡(luò)爬蟲抓取的方式,而數(shù)據(jù)的整合主要采用人物分類法。
4)公共管理子數(shù)據(jù)庫(kù)的建設(shè)
公共管理大多數(shù)據(jù)是借助傳感器等實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)轉(zhuǎn)移的過程。公共管理中的數(shù)據(jù)數(shù)量大且具備較高的實(shí)時(shí)性,需結(jié)合大數(shù)據(jù)技術(shù)來實(shí)現(xiàn)數(shù)據(jù)的有序存儲(chǔ)與資源的快速搜索。
3 對(duì)大數(shù)據(jù)環(huán)境下圖書館公共媒體數(shù)據(jù)庫(kù)利用方式的整體探索
3.1圖書館用戶流失分析與價(jià)值分析
(1)用戶流失分析。對(duì)圖書館用戶流失與用戶價(jià)值進(jìn)行分析是對(duì)圖書館綜合評(píng)價(jià)的有力依據(jù),同時(shí)也能為圖書館改善方向及措施提供參考。在用戶使用圖書館公共媒體數(shù)據(jù)庫(kù)的過程中,導(dǎo)致用戶流失的原因大致包括信息可靠性、搜索便捷度、服務(wù)人性化程度、數(shù)據(jù)更新速度以及能否符合用戶需求與期望等幾個(gè)方面,這同時(shí)也是圖書館公共媒體數(shù)據(jù)庫(kù)應(yīng)不斷加強(qiáng)的地方,以用戶的角度不斷進(jìn)行優(yōu)化與完善,才可能避免用戶的流失,增強(qiáng)用戶對(duì)圖書館甚至政府的認(rèn)可度。
(2)用戶價(jià)值。用戶價(jià)值主要包括用戶知識(shí)價(jià)值與用戶口碑價(jià)值兩方面。用戶知識(shí)價(jià)值指用戶在與平臺(tái)交互過程中,生成的基于自身顯性或隱性知識(shí)的內(nèi)容,這對(duì)對(duì)平臺(tái)知識(shí)的更新和豐富具有推動(dòng)作用。用戶口碑價(jià)值體現(xiàn)在用戶在對(duì)圖書館自身感受的基礎(chǔ)上對(duì)外宣傳的價(jià)值,良好的口碑是圖書館擴(kuò)大用戶范圍,提高資源利用率的有利條件,也是圖書館平臺(tái)及政府應(yīng)當(dāng)努力的方向。
3.2開拓新的服務(wù)領(lǐng)域
在大數(shù)據(jù)背景下,圖書館的競(jìng)爭(zhēng)力已不再是單純的館藏資源量比拼,還包括對(duì)數(shù)據(jù)的組織分析能力和知識(shí)化服務(wù)能力,在大量信息資源、知識(shí)資源、用戶資源的基礎(chǔ)上,圖書館能發(fā)揮的職能種類更加多樣。
(1)知識(shí)咨詢服務(wù)。知識(shí)咨詢服務(wù)主要是面對(duì)用戶需求,解決用戶疑問,這就需要高質(zhì)量的知識(shí)數(shù)據(jù)來做支撐,圖書館公共媒體數(shù)據(jù)庫(kù)恰恰符合要求。同時(shí)知識(shí)咨詢服務(wù)涉及領(lǐng)域較多,很多時(shí)候會(huì)出現(xiàn)多個(gè)學(xué)科交叉的情況,圖書館現(xiàn)有的按專業(yè)分門別類的數(shù)據(jù)庫(kù)難以滿足要求,而功能公共媒體數(shù)據(jù)庫(kù)以主題分類,并涵蓋基于灰色文獻(xiàn)資源和系統(tǒng)跟蹤分析的大量數(shù)據(jù),服務(wù)專業(yè)性與可靠性更高。
(2)市場(chǎng)情報(bào)服務(wù)。市場(chǎng)情報(bào)服務(wù)可為企業(yè)提供大量的用戶行為數(shù)據(jù),為企業(yè)確定市場(chǎng)方向、進(jìn)行科學(xué)分析以及市場(chǎng)預(yù)測(cè)提供數(shù)據(jù)基礎(chǔ),同時(shí),大規(guī)模的公共媒體數(shù)據(jù)庫(kù)資源對(duì)于企業(yè)研究現(xiàn)存問題進(jìn)行分析并相應(yīng)作出優(yōu)化調(diào)整具有相當(dāng)強(qiáng)的可行性。
3.3公共危機(jī)預(yù)警與決策分析
(1)公共危機(jī)預(yù)警。公共媒體數(shù)據(jù)庫(kù)的預(yù)警功能是指在一些公共危機(jī)未產(chǎn)生萌芽前,借助數(shù)據(jù)分析與數(shù)據(jù)挖掘技術(shù),找出潛在關(guān)系鏈,對(duì)事態(tài)進(jìn)行分析預(yù)測(cè),及時(shí)向公眾發(fā)出警告,并協(xié)助引導(dǎo)積極走向。
(2)突發(fā)事件決策與輿論環(huán)境構(gòu)建。當(dāng)發(fā)生突發(fā)事件時(shí),政府的決策須實(shí)時(shí)、可靠、全面的信息作為決策支持,而當(dāng)事件處理過后,需重新建立政府與民眾間信任,恢復(fù)社會(huì)穩(wěn)定環(huán)境,此時(shí)圖書館公共媒體平臺(tái)可進(jìn)行正面宣傳,引導(dǎo)積極輿論導(dǎo)向。
4 結(jié)論
在信息更新快、數(shù)據(jù)數(shù)量大、種類多的大數(shù)據(jù)背景下,大數(shù)據(jù)可為圖書館公共媒體數(shù)據(jù)庫(kù)的資源制作提供數(shù)據(jù)篩選,促進(jìn)資源組織和管理能力的提升,并加速公共媒體服務(wù)的變革,從而最終滿足人們?nèi)找嬖鲩L(zhǎng)的知識(shí)需求。隨著圖書館館藏資源中數(shù)字資源比例的逐漸升高,加之計(jì)算機(jī)技術(shù)、物聯(lián)網(wǎng)技術(shù)以及云計(jì)算的普及,未來圖書館可能成為以數(shù)字資源為基礎(chǔ)的復(fù)合型圖書館。
參考文獻(xiàn):
[1] 張瑜.大數(shù)據(jù)環(huán)境下圖書館公共媒體數(shù)據(jù)庫(kù)建設(shè)與利用研究[D].遼寧師范大學(xué),2014.
[2] 陳巧玲.智慧時(shí)代國(guó)內(nèi)高校圖書館服務(wù)創(chuàng)新研究[D].福建師范大學(xué),2014.
[3] 劉穎.高校圖書館嵌入式學(xué)科服務(wù)研究[D].武漢大學(xué),2010.
[4] 劉峰.大數(shù)據(jù)時(shí)代的電視媒體營(yíng)銷研究[D].華東師范大學(xué),2014.