• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      如何利用大數(shù)據(jù)構(gòu)建圖書館新型知識(shí)服務(wù)體系

      2014-11-06 02:51陳國(guó)蘭
      現(xiàn)代情報(bào) 2014年9期

      陳國(guó)蘭

      〔摘要〕大數(shù)據(jù)時(shí)代已經(jīng)來臨,大數(shù)據(jù)也給高校圖書館帶來了機(jī)遇和挑戰(zhàn),文中結(jié)合大數(shù)據(jù)的背景,首先介紹大數(shù)據(jù)的定義和思維,接著分析了圖書館可利用的大數(shù)據(jù)來源,以及帶給圖書館的價(jià)值,最后探討了如何利用大數(shù)據(jù)構(gòu)建新型的知識(shí)服務(wù)體系,期望能夠?yàn)槲磥淼膱D書館知識(shí)服務(wù)創(chuàng)新體系提供理論參考。

      〔關(guān)鍵詞〕大數(shù)據(jù);大數(shù)據(jù)知識(shí)服務(wù);高校圖書館;大數(shù)據(jù)思維

      大數(shù)據(jù)是繼Web2.0,云計(jì)算等技術(shù)之后,近兩年IT界最為流行的關(guān)鍵詞。2008年9月,Nature推出《大數(shù)據(jù)》專刊,通過“the next Google”、“Data wrangling”、“Distilling meaning from data”等多篇文章,全方位介紹了大數(shù)據(jù)問題的產(chǎn)生及對(duì)各個(gè)領(lǐng)域的影響,首次將“大數(shù)據(jù)”這一概念引入科學(xué)家和研究人員的視野。全球知名咨詢公司麥肯錫把大數(shù)據(jù)稱作一種全新的資產(chǎn)類別,可以創(chuàng)造巨額財(cái)富。許多國(guó)際上著名的IT巨頭像IBM、微軟、谷歌、HP、SAS等紛紛加入大數(shù)據(jù)的研究行列,通過收購相關(guān)的大數(shù)據(jù)軟硬件技術(shù)平臺(tái),力求在大數(shù)據(jù)時(shí)代取得更加主動(dòng)的信息競(jìng)爭(zhēng)環(huán)境,利用大數(shù)據(jù)成為公司新的經(jīng)濟(jì)增長(zhǎng)點(diǎn)。

      大數(shù)據(jù)技術(shù)不僅受到產(chǎn)業(yè)界熱捧,在學(xué)術(shù)界也引起了廣泛的研究和探討。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)只是作為一種生產(chǎn)要素,要想變成商品,創(chuàng)造價(jià)值,還需要對(duì)其進(jìn)行數(shù)據(jù)分析,從中提取出有用的知識(shí)和情報(bào)。圖書館作為一個(gè)資源和情報(bào)提供部門,大數(shù)據(jù)技術(shù)必然會(huì)對(duì)傳統(tǒng)的圖書館咨詢服務(wù)造成強(qiáng)烈沖擊。

      OCLC的《Research Libraries,Risks,and Systemic Change》[1]研究報(bào)告指出,價(jià)值質(zhì)疑、技術(shù)障礙、人員隊(duì)伍無法適應(yīng)未來挑戰(zhàn)等重大問題已經(jīng)嚴(yán)重困擾著圖書館,高校教職工已經(jīng)逐步弱化了圖書館存在價(jià)值,用戶流失異常嚴(yán)重[2],2010年,美國(guó)聯(lián)機(jī)計(jì)算機(jī)圖書館中心的一項(xiàng)調(diào)研顯示,正撰寫論文的大學(xué)生查找資料已首選網(wǎng)絡(luò)搜索引擎;30%的大學(xué)生遇到難題待解,不再到圖書館找書,而是把難題貼到網(wǎng)上尋求答案。像Web2.0,云計(jì)算技術(shù)一樣,每一次新技術(shù)的應(yīng)用,都會(huì)帶動(dòng)圖書館的變革,需要圖書館轉(zhuǎn)變服務(wù)職能。大數(shù)據(jù)技術(shù)對(duì)圖書館來說是拐點(diǎn)還是終點(diǎn)?圖書館界能否在大數(shù)據(jù)時(shí)代抓住機(jī)遇,利用大數(shù)據(jù)技術(shù)應(yīng)對(duì)圖書館未來所面對(duì)的生存危機(jī),挽救圖書館在資源共享與數(shù)據(jù)分析中的頹勢(shì),是我們所有圖書館人需要深思的一個(gè)問題。

      本文結(jié)合大數(shù)據(jù)的時(shí)代背景,首先介紹大數(shù)據(jù)的定義和思維,接著分析了高校圖書館可利用的大數(shù)據(jù)來源,以及帶給圖書館的價(jià)值,最后探討了如何利用大數(shù)據(jù)構(gòu)建新型的知識(shí)服務(wù)體系,期望能夠?yàn)槲磥淼膱D書館知識(shí)服務(wù)創(chuàng)新體系提供理論參考。

      1何為大數(shù)據(jù)

      1.1大數(shù)據(jù)定義

      盡管“大數(shù)據(jù)”這個(gè)詞直到最近才受到人們的高度關(guān)注,但早在1980年,著名未來學(xué)家托夫勒在其所著的《第三次浪潮》中就熱情地將“大數(shù)據(jù)”稱頌為“第三次浪潮的華彩樂章”?!蹲匀弧冯s志在2008年9月推出了名為“大數(shù)據(jù)”的封面專欄。從2009年開始“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)技術(shù)行業(yè)中的熱門詞匯。

      維基百科和百度百科對(duì)大數(shù)據(jù)的定義很類似,都稱“大數(shù)據(jù)”(Bigdata)為巨量數(shù)據(jù),指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊[3]。

      維克托·邁爾—舍恩伯格和肯尼斯·克耶編寫的《大數(shù)據(jù)時(shí)代》中提出:“大數(shù)據(jù)”的4V特點(diǎn):Volume(數(shù)據(jù)量大)、Velocity(輸入和處理速度快)、Variety(數(shù)據(jù)多樣性)、Value(價(jià)值密度低)[4]。這些特點(diǎn)基本上得到了大家的認(rèn)可,凡提到“大數(shù)據(jù)”特點(diǎn)的文章,基本上采用了這4個(gè)特點(diǎn)。

      關(guān)于“大數(shù)據(jù)”有許多種定義,這種差別取決于你是一位計(jì)算機(jī)科學(xué)家,還是一位金融分析師,抑或是一位為風(fēng)險(xiǎn)投資人推銷一個(gè)概念的企業(yè)家。多數(shù)定義都反映了那種不斷增長(zhǎng)的捕捉、聚合與處理數(shù)據(jù)的技術(shù)能力,而這個(gè)數(shù)據(jù)集在數(shù)量、速率與種類上持續(xù)擴(kuò)大。就大數(shù)據(jù)而言,真正重要的是它能做什么。先且不論我們?nèi)绾伟汛髷?shù)據(jù)界定為一種技術(shù)現(xiàn)象,大數(shù)據(jù)分析那多元而廣闊的潛在用途將面臨一些關(guān)鍵性的問題,即我們的法律、倫理與社會(huì)規(guī)范在大數(shù)據(jù)時(shí)代是不是有足夠的能力保護(hù)個(gè)人隱私和其它價(jià)值。前所未有的計(jì)算能力與持續(xù)的改進(jìn)能力為我們的生活帶來了可能是先前從未預(yù)料到的發(fā)現(xiàn)、創(chuàng)新與進(jìn)步。

      縱觀多方定義,筆者對(duì)大數(shù)據(jù)的概念理解總結(jié)如下:(1)“大數(shù)據(jù)”擁有海量數(shù)據(jù),但絕不是有很多數(shù)據(jù)就叫大數(shù)據(jù);(2)大數(shù)據(jù)是一種數(shù)據(jù)分析方式,與傳統(tǒng)數(shù)據(jù)分析方式有著本質(zhì)上的不同;(3)大數(shù)據(jù)的特點(diǎn)是“關(guān)注相關(guān)性,不關(guān)注因果”,這是大數(shù)據(jù)最核心的東西;(4)大數(shù)據(jù)采用的是統(tǒng)計(jì)的方法;(5)大數(shù)據(jù)主要是結(jié)合人工智能進(jìn)行機(jī)器的自動(dòng)數(shù)據(jù)挖掘;(6)大數(shù)據(jù)主要是用來作預(yù)測(cè)的。而不是象一般的數(shù)據(jù)分析,只是分析出歷史情況和現(xiàn)狀,未來還是要靠人去預(yù)測(cè),大數(shù)據(jù)則是直接告訴你未來的結(jié)果。

      1.2大數(shù)據(jù)思維

      維克托·爾耶·舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》[4]中最具洞見之處在于,他明確指出,大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。這顛覆了千百年來人類的思維慣例,對(duì)人類的認(rèn)知和與世界交流的方式提出了全新的挑戰(zhàn)。

      大數(shù)據(jù)既是一種技術(shù),更是一種思維。在了解了大數(shù)據(jù)的概念后,我們還需要了解大數(shù)據(jù)技術(shù)的哲學(xué)基礎(chǔ)或內(nèi)在邏輯,即大數(shù)據(jù)思維。目前大數(shù)據(jù)技術(shù)好多還處在研究階段,還不能進(jìn)行廣泛的應(yīng)用,但我們可以學(xué)習(xí)大數(shù)據(jù)思維,做好相關(guān)基礎(chǔ)工作。在大數(shù)據(jù)時(shí)代來臨之際,圖書館應(yīng)該借助大數(shù)據(jù)思維創(chuàng)新其信息服務(wù)模式、擴(kuò)大信息服務(wù)范圍和提高信息服務(wù)質(zhì)量,同時(shí)也可為其他社會(huì)組織提供大數(shù)據(jù)源和創(chuàng)造信息價(jià)值[5]。endprint

      在舍恩伯格的《大數(shù)據(jù)時(shí)代》,重點(diǎn)討論了關(guān)于大數(shù)據(jù)的3個(gè)思維變化:(1)不是隨機(jī)樣本,而是全體數(shù)據(jù);(2)不是精確性,而是混雜性,尤其是大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法有效;(3)不是因果關(guān)系,而是相互關(guān)系。

      文獻(xiàn)[5]把大數(shù)據(jù)思維總結(jié)為規(guī)律性、無偏性、關(guān)聯(lián)性和開放性4個(gè)特征。并結(jié)合“圖書館立方”項(xiàng)目為例,探討了大數(shù)據(jù)思維在圖書館的應(yīng)用。圖書館要想利用大數(shù)據(jù)提升我們的服務(wù),首先要從思想觀念上對(duì)大數(shù)據(jù)有較清晰的認(rèn)識(shí)。筆者認(rèn)為圖書館要開展大數(shù)據(jù)服務(wù),需要對(duì)以下問題進(jìn)行反思和探討:

      (1)圖書館哪些數(shù)據(jù)屬于大數(shù)據(jù)的范疇,可以被用來分析和預(yù)測(cè)?圖書館人在面對(duì)“可能是機(jī)會(huì)的數(shù)據(jù)”時(shí),有沒有清醒的認(rèn)識(shí)?這個(gè)意識(shí)必須貫穿大數(shù)據(jù)的收集、整理、分析及預(yù)測(cè)各個(gè)階段。

      (2)圖書館有哪些大數(shù)據(jù)來源,這些數(shù)據(jù)來源有無延續(xù)性?獲取的數(shù)據(jù)來源具有的價(jià)值是否符合人力、物力、財(cái)力的投資回報(bào)?

      (3)圖書館如何利用大數(shù)據(jù)?圖書館擁有的大數(shù)據(jù)量在不斷的大幅度增加,但是能夠從中分析的數(shù)據(jù)比例卻在不斷降低。如何利用數(shù)據(jù)之間的關(guān)聯(lián)性,使用大數(shù)據(jù)分析技術(shù)從眾多的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中挖掘出隱藏在數(shù)據(jù)背后的價(jià)值?進(jìn)而為圖書館的服務(wù)模式、未來發(fā)展趨勢(shì)提供分析與預(yù)測(cè)。

      2大數(shù)據(jù)與圖書館

      2.1圖書館大數(shù)據(jù)的來源

      圖書館大數(shù)據(jù)的來源也呈多樣化特征,除了傳統(tǒng)的電子圖書、期刊、論文數(shù)據(jù)庫等結(jié)構(gòu)化數(shù)據(jù)資源外,還包括以下大量的非結(jié)構(gòu)化信息資源:

      2.1.1智能設(shè)備數(shù)據(jù)

      像RFID數(shù)據(jù)信息,裝有RFID圖書的信息,可以自動(dòng)實(shí)現(xiàn)資源的跟蹤和分析;像門徑系統(tǒng),保留有大量讀者的進(jìn)館出館信息,可以幫助我們根據(jù)讀者的來館時(shí)間,做好相應(yīng)的人員配備。提供更好的服務(wù)。

      2.1.2物聯(lián)網(wǎng)數(shù)據(jù)

      可以通過在圖書館不同位置或環(huán)境中放置傳感器,來對(duì)所處的環(huán)境和資源進(jìn)行數(shù)據(jù)采集,通過長(zhǎng)時(shí)間積累,可以產(chǎn)生巨大的數(shù)據(jù)量,有助于我們分析圖書館的使用情況,優(yōu)化資源配置。

      2.1.3互聯(lián)網(wǎng)數(shù)據(jù)

      隨著社交網(wǎng)站的普及應(yīng)用,這部分?jǐn)?shù)據(jù)的產(chǎn)生速度超過以往任何一個(gè)傳播媒介,由于參與用戶眾多,且數(shù)據(jù)中包含用戶豐富的情感特征,是圖書館服務(wù)的一大評(píng)價(jià)指標(biāo)來源。另外像OPAC讀者的檢索記錄、數(shù)據(jù)庫讀者的訪問記錄等一些用戶行為數(shù)據(jù),也包含著讀者豐富的信息。是圖書館大數(shù)據(jù)的重要組成部分。

      2.1.4科研共享數(shù)據(jù)

      高校圖書館作為一個(gè)科研服務(wù)中心,需要構(gòu)建科研數(shù)據(jù)共享平臺(tái)??蒲袛?shù)據(jù)是指數(shù)字形式的研究數(shù)據(jù),包括在研究過程中產(chǎn)生的能存貯在計(jì)算機(jī)上的任何數(shù)據(jù),也包括能轉(zhuǎn)換成數(shù)字形式的非數(shù)字形式數(shù)據(jù),如調(diào)研結(jié)果、神經(jīng)圖像、實(shí)驗(yàn)數(shù)據(jù)、傳感器讀取的數(shù)據(jù)、遙感勘測(cè)數(shù)據(jù)、來自測(cè)試模型的仿真數(shù)據(jù)等[6]??蒲袛?shù)據(jù)是研究過程中重要的研究成果,包含著巨大的研究?jī)r(jià)值。長(zhǎng)期以來,高校雖然有豐富的科研數(shù)據(jù),但是往往局限于本課題組、本單位使用,沒有經(jīng)過有效的整理和建庫共享,造成了科技資源的極大浪費(fèi)。因此科研共享數(shù)據(jù)是圖書館需要重點(diǎn)收集的一個(gè)大數(shù)據(jù)來源。

      2.1.5移動(dòng)互聯(lián)數(shù)據(jù)

      隨著高校移動(dòng)圖書館的普及,圖書館可以利用移動(dòng)互聯(lián)技術(shù),獲取大量讀者訪問數(shù)據(jù),從而分析讀者的使用習(xí)慣、閱讀傾向等,進(jìn)而幫助我們開展有效的分析、預(yù)測(cè)其知識(shí)服務(wù)需求。

      2.2大數(shù)據(jù)帶給圖書館的價(jià)值

      大數(shù)據(jù)的價(jià)值在于可以通過人工智能、計(jì)算機(jī)科學(xué)、數(shù)學(xué)統(tǒng)計(jì)、信息技術(shù)等多個(gè)交叉學(xué)科的大數(shù)據(jù)技術(shù)的應(yīng)用來挖掘找到隱藏在大數(shù)據(jù)背后的世界。筆者認(rèn)為目前圖書館利用大數(shù)據(jù)的價(jià)值主要包括以下幾方面:

      2.2.1為資源采購提供決策支持

      通過讀者使用資源的交互數(shù)據(jù),像圖書瀏覽、借還記錄、數(shù)據(jù)庫訪問、下載記錄等,可以有效的評(píng)估讀者對(duì)各種資源的使用情況,通過較集中的訪問歷史可以預(yù)測(cè)讀者關(guān)注的熱點(diǎn),從而為資源采購部門提供決策支持,對(duì)需求大的未購買資源增加訂購,而使用率不高的資源可以減少或取消訂購,從而讓有限的資金購買更適合讀者需要的資源。

      2.2.2為讀者提供個(gè)性化服務(wù)

      圖書館里包含有大量讀者個(gè)人使用圖書館的記錄,通過讀者的咨詢記錄、借閱記錄、數(shù)據(jù)庫訪問記錄、檢索記錄、下載記錄等用戶使用圖書館資源的所有足跡,同時(shí)可以結(jié)合讀者的專業(yè),及其教務(wù)部門提供的個(gè)人選課信息、成績(jī)情況等,可以分析讀者的興趣點(diǎn)、服務(wù)訴求、學(xué)科需求。從而把適合的資源向其主動(dòng)推送,為讀者提供個(gè)性化服務(wù),實(shí)現(xiàn)圖書館由被動(dòng)獲取轉(zhuǎn)為主動(dòng)服務(wù)的職能轉(zhuǎn)變。通過不斷地主動(dòng)為用戶進(jìn)行探測(cè)性的推薦服務(wù),持續(xù)性地獲取用戶的反饋信息,從而對(duì)其服務(wù)需求進(jìn)行修正,提高個(gè)性化服務(wù)的可靠度和精度。

      2.2.3為學(xué)科提供研究方向及熱點(diǎn)變化

      圖書館可以利用大數(shù)據(jù)對(duì)學(xué)科進(jìn)行聚類分析、熱點(diǎn)預(yù)測(cè)、網(wǎng)絡(luò)分析、可視化分析、引文分析、知識(shí)關(guān)聯(lián)分析等技術(shù)構(gòu)建學(xué)科的知識(shí)圖譜,從宏觀上分析相關(guān)學(xué)科領(lǐng)域的研究方向和熱點(diǎn),為科研人員特別是新進(jìn)入研究領(lǐng)域的學(xué)者,以及面臨選題困難的碩士生、博士生大幅度的提高研究、學(xué)習(xí)和創(chuàng)新的效率,讓他們可以節(jié)約文獻(xiàn)調(diào)研的時(shí)間,迅速地洞察學(xué)科領(lǐng)域的研究進(jìn)展,確定自己的研究方向。

      2.2.4為科研人員提供學(xué)術(shù)共享環(huán)鏡

      高??蒲腥藛T在長(zhǎng)期的科研活動(dòng)中,通過觀測(cè)、探測(cè)、試驗(yàn)、調(diào)查等科學(xué)手段積累了大量的科學(xué)數(shù)據(jù)[7],這是高校寶貴的數(shù)據(jù)財(cái)富。圖書館有義務(wù)采集這方面的數(shù)據(jù),同時(shí)利用科研人員相同或類似的資源需求,為相同學(xué)科或研究方向的科研人員構(gòu)建虛擬社區(qū),形成學(xué)術(shù)交流圈,共享科研數(shù)據(jù),創(chuàng)造良好的學(xué)術(shù)共享環(huán)境。

      3如何構(gòu)建新型知識(shí)服務(wù)體系

      3.1開發(fā)大數(shù)據(jù)資源建設(shè)平臺(tái)

      數(shù)據(jù)是圖書館利用大數(shù)據(jù)平臺(tái)分析的基礎(chǔ),因此首先必須建設(shè)圖書館的大數(shù)據(jù)資源庫。大數(shù)據(jù)資源建設(shè)包括數(shù)據(jù)資源的獲取、組織和管理:endprint

      3.1.1數(shù)據(jù)資源的獲取

      上節(jié)已經(jīng)介紹了圖書館大數(shù)據(jù)除了自身的館藏?cái)?shù)據(jù)外,還包括動(dòng)態(tài)的RFID數(shù)據(jù)、傳感器數(shù)據(jù)、用戶訪問數(shù)據(jù)、用戶網(wǎng)絡(luò)數(shù)據(jù)、科研共享數(shù)據(jù)、移動(dòng)互聯(lián)數(shù)據(jù)等。為了得到這些不同來源的非結(jié)構(gòu)化數(shù)據(jù),圖書館必須攻克針對(duì)大數(shù)據(jù)源的智能識(shí)別、感知、適配、傳輸、接入等技術(shù),開發(fā)自己的數(shù)據(jù)收集平臺(tái),收集跟用戶知識(shí)服務(wù)需求相關(guān)的所有有價(jià)值的數(shù)據(jù)。

      3.1.2數(shù)據(jù)資源的組織

      無序、分散的數(shù)據(jù)不論規(guī)模多么巨大,只要沒有建立數(shù)據(jù)之間的關(guān)聯(lián),沒有進(jìn)行數(shù)據(jù)分析與挖掘,其價(jià)值都很難發(fā)揮出來[8]。因此對(duì)數(shù)據(jù)應(yīng)該像圖書館的館藏一樣進(jìn)行有效組織,采用關(guān)聯(lián)技術(shù),將數(shù)據(jù)整合成數(shù)據(jù)網(wǎng)。另外對(duì)于海量的數(shù)據(jù)資源,可以借鑒國(guó)外對(duì)網(wǎng)絡(luò)資源的分級(jí)管理經(jīng)驗(yàn),像伯克利數(shù)字圖書館分為檔案級(jí)、服務(wù)級(jí)、鏡像級(jí)、鏈接級(jí)4個(gè)級(jí)別;加拿大國(guó)家圖書館則分為檔案級(jí)、服務(wù)級(jí)與鏈接級(jí)3個(gè)級(jí)別[9],我們可以將圖書館的大數(shù)據(jù)根據(jù)不同服務(wù)對(duì)象的服務(wù)需求分為基礎(chǔ)級(jí)、服務(wù)級(jí)、學(xué)科級(jí)與研究級(jí),以便于日后我們從不同的數(shù)據(jù)源進(jìn)行大數(shù)據(jù)分析。

      3.1.3數(shù)據(jù)資源的管理

      圖書館的大數(shù)據(jù)資源包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指可以利用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫進(jìn)行管理,而海量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)需要新的表述方法,更高效的處理技術(shù)。以Hadoop 為代表的HDFS文件系統(tǒng)和Google公司提出的MapReduce模型將結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)有效管理變?yōu)楝F(xiàn)實(shí)[10]。同時(shí)要注意數(shù)據(jù)的生命周期,需要不定期的對(duì)數(shù)據(jù)進(jìn)行整理,把新的數(shù)據(jù)進(jìn)行維護(hù)歸檔,過期失效的數(shù)據(jù)及時(shí)剔除。

      3.2學(xué)會(huì)使用大數(shù)據(jù)分析工具

      有了大數(shù)據(jù)資源,圖書館還需要利用大數(shù)據(jù)技術(shù)從海量、異構(gòu)的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的知識(shí)。大數(shù)據(jù)技術(shù),實(shí)際上就是借助各種大數(shù)據(jù)分析工具來對(duì)數(shù)據(jù)進(jìn)行分析預(yù)測(cè)。近年來,國(guó)內(nèi)外越來越多的圖書館借助資源發(fā)現(xiàn)系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)的分析、發(fā)現(xiàn)和預(yù)測(cè)。像Primo系統(tǒng)允許用戶在館舍內(nèi)搭建SOA架構(gòu)的服務(wù)系統(tǒng),同時(shí)也支持以云計(jì)算方式向圖書館用戶提供服務(wù),因此得到了全世界圖書館的廣泛應(yīng)用。還有完全基于云計(jì)算的EDS和Summon也是國(guó)際上比較有影響的知識(shí)發(fā)現(xiàn)系統(tǒng)。

      以上提到的發(fā)現(xiàn)系統(tǒng)都是國(guó)外系統(tǒng),對(duì)中文知識(shí)發(fā)現(xiàn)效果較差,因此國(guó)內(nèi)也出現(xiàn)了像超星發(fā)現(xiàn)、智立方、FIND+等知識(shí)發(fā)現(xiàn)系統(tǒng)。筆者所在的學(xué)校已經(jīng)開通了超星發(fā)現(xiàn)系統(tǒng),從使用的情況上看,可以較好的實(shí)現(xiàn)數(shù)據(jù)資源的整合,對(duì)海量的文獻(xiàn)實(shí)現(xiàn)知識(shí)關(guān)聯(lián)。但其主要針對(duì)圖書館的館藏?cái)?shù)字資源進(jìn)行一站式檢索,在學(xué)術(shù)文獻(xiàn)的深度知識(shí)挖掘方面還有待加強(qiáng)。圖書館員可以結(jié)合其他的數(shù)據(jù)挖掘軟件像Citespace、LiterMiner等可視化文獻(xiàn)分析工具,來繪制科學(xué)知識(shí)圖譜,有助于了解和預(yù)測(cè)科學(xué)前沿和動(dòng)態(tài),挖掘開辟新的未知領(lǐng)域。

      3.3加強(qiáng)多部門的互助合作

      圖書館大數(shù)據(jù)的來源除了自購資源和圖書館內(nèi)部數(shù)據(jù)資源外,還包括像科研共享數(shù)據(jù)、學(xué)生選課成績(jī)信息等外部的數(shù)據(jù)資源。為了獲取這些數(shù)據(jù),提供更全面的知識(shí)服務(wù),圖書館需要加強(qiáng)與其他部門間的合作。

      科研數(shù)據(jù)管理涉及數(shù)據(jù)組織、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)保護(hù)、數(shù)據(jù)共享等不同的環(huán)節(jié),對(duì)于很多科研人員來說還是比較新的事物。為了更好地為科研人員提供數(shù)據(jù)管理服務(wù),國(guó)外大學(xué)圖書館紛紛探索開展科研數(shù)據(jù)管理教育工作,通過開展專題研討會(huì)、培訓(xùn)課、在線教育等方式對(duì)科研人員進(jìn)行科研數(shù)據(jù)管理意識(shí)、知識(shí)和技能的培訓(xùn)[11]。同時(shí)圖書館還需建立專門的科研數(shù)據(jù)的存儲(chǔ)庫,便于科研人員可以長(zhǎng)期方便地進(jìn)行存儲(chǔ)、管理。

      為了較全面掌握讀者的信息,提供個(gè)性化服務(wù),也需要與其他部門合作多種渠道獲取數(shù)據(jù)。像澳大利亞臥龍崗大學(xué)圖書館開展的“圖書館立方”項(xiàng)目[5],就是與該???jī)效指標(biāo)管理中心(PIU)合作,將學(xué)生的圖書館使用記錄與績(jī)效中心的學(xué)生成績(jī)、選課記錄等進(jìn)行關(guān)聯(lián),這樣一方面可以評(píng)估圖書館使用情況對(duì)學(xué)生成績(jī)的影響;另一方面也能為學(xué)校的教學(xué)活動(dòng)提供信息反饋。

      3.4建立新型知識(shí)服務(wù)引擎

      知識(shí)服務(wù)成為新時(shí)期圖書館與其他類型信息機(jī)構(gòu)進(jìn)行角逐的領(lǐng)域,如何將知識(shí)服務(wù)推進(jìn)到一個(gè)新的高度,成為圖書館人為之奮斗的新目標(biāo)。知識(shí)服務(wù)引擎是在知識(shí)服務(wù)的基礎(chǔ)上,結(jié)合引擎的高度搜索功能,快速地實(shí)現(xiàn)用戶知識(shí)需求的滿足[12]。它與搜索引擎不同,其檢索結(jié)果是經(jīng)過智能加工的知識(shí)而非簡(jiǎn)單檢索詞匹配的信息,它是深度解決用戶問題的知識(shí)管理系統(tǒng)。讀者可以將其知識(shí)需求或需要解決的問題進(jìn)行搜索,該系統(tǒng)能夠根據(jù)其擁有的知識(shí)庫對(duì)用戶的問題或需求進(jìn)行智能地分析、整理,將相應(yīng)的知識(shí)或解決方案直接反饋給用戶。同時(shí)為了使反饋的形式更加直觀、具體,可以使用知識(shí)圖譜、可視化技術(shù)等有效的知識(shí)映射方式來對(duì)結(jié)果進(jìn)行關(guān)聯(lián)。

      大數(shù)據(jù)的知識(shí)庫、大數(shù)據(jù)存儲(chǔ)技術(shù)以及大數(shù)據(jù)分析技術(shù)為圖書館構(gòu)建新型知識(shí)服務(wù)引擎提供了可能。圖書館可充分利用知識(shí)服務(wù)引擎系統(tǒng)為用戶提供“界面更友好,服務(wù)更具體”的知識(shí)服務(wù)。另外用戶也可以根據(jù)自己的知識(shí)需求進(jìn)行個(gè)性化定制、同時(shí)對(duì)提供的服務(wù)內(nèi)容進(jìn)行用戶評(píng)價(jià),提出具體的使用意見,方便圖書館員調(diào)整服務(wù)策略,改進(jìn)知識(shí)服務(wù)引擎的框架體系,實(shí)現(xiàn)用戶

      和圖書館的互利雙贏?;诖髷?shù)據(jù)構(gòu)建的知識(shí)服務(wù)引擎,將使得圖書館真正實(shí)現(xiàn)角色轉(zhuǎn)變,從信息提供者轉(zhuǎn)變?yōu)橹R(shí)提供者,更好的應(yīng)對(duì)大數(shù)據(jù)的危機(jī)與挑戰(zhàn),為自身在大數(shù)據(jù)時(shí)代爭(zhēng)得一席之地。

      4結(jié)語

      毋庸置疑,大數(shù)據(jù)時(shí)代已經(jīng)來臨,高校圖書館要構(gòu)建新型的知識(shí)服務(wù)體系,需要數(shù)據(jù)+技術(shù)+思維三管齊下。第一由于數(shù)據(jù)的異質(zhì)、異構(gòu)的特性,圖書館需要解決大數(shù)據(jù)的可表示性、可處理性、可融合性及可靠性4個(gè)關(guān)鍵問題[13]。第二是大數(shù)據(jù)技術(shù)的應(yīng)用,圖書館需要一批會(huì)靈活使用大數(shù)據(jù)分析工具的數(shù)據(jù)分析師,需要從關(guān)注資源技術(shù)、圖書館技術(shù)轉(zhuǎn)變?yōu)殛P(guān)注知識(shí)技術(shù)和用戶技術(shù),從勞動(dòng)力密集服務(wù)轉(zhuǎn)變?yōu)榉椒?、工具與計(jì)算密集型服務(wù)[2]。最后比資源、技術(shù)更重要的是要實(shí)現(xiàn)觀念的轉(zhuǎn)變,即具有大數(shù)據(jù)思維。相信在不久的將來,圖書館將陸續(xù)步入大數(shù)據(jù)時(shí)代,盡管圖書館有資源的優(yōu)勢(shì),但在技術(shù)方面的劣勢(shì)將是圖書館開展大數(shù)據(jù)服務(wù)的一大挑戰(zhàn),圖書館如何揚(yáng)長(zhǎng)補(bǔ)短,避免自己地位邊緣化,將是每一個(gè)圖書館人必須深思的一大問題。endprint

      參考文獻(xiàn)

      [1]James Michalko,Constance Malpas,Arnold Arcolio.Research libraries,risks,and systemic change[OL].http:∥www.oclc.org/research/publications/library/2010/2010-03.pdf,2011-11-15.

      [2]張曉林.研究圖書館2020:嵌入式協(xié)作化知識(shí)實(shí)驗(yàn)室?[J].中國(guó)圖書館學(xué)報(bào),2012,(1):11-18.

      [3]http:∥baike.baidu.com/subview/6954399/13647476.htm?fr=aladdin[EB].

      [4]維克多·麥爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013.

      [5]和婷.大數(shù)據(jù)思維對(duì)圖書館信息服務(wù)工作的啟示[J].圖書館建設(shè),2014,(1):64-68.

      [6]李曉輝.圖書館科研數(shù)據(jù)管理與服務(wù)模式探討[J].中國(guó)圖書館學(xué)報(bào),2011,(5):46-52.

      [7]沈志宏,張曉林,黎建輝.Open CSDB:關(guān)聯(lián)數(shù)據(jù)在科學(xué)數(shù)據(jù)庫中的應(yīng)用研究[J].中國(guó)圖書館學(xué)報(bào),2012,(5):17-26.

      [8]孫卓.基于大數(shù)據(jù)構(gòu)建圖書館知識(shí)服務(wù)引擎研究[J].圖書館學(xué)研究,2013,(18):48-51.

      [9]曹霞.高校圖書館非結(jié)構(gòu)化大數(shù)據(jù)的D-SFSD管理模式研究[J].圖書館學(xué)研究,2014,(1):57-60.

      [10]張興旺.圖書館大數(shù)據(jù)體系構(gòu)建的學(xué)術(shù)環(huán)境和戰(zhàn)略思考[J].情報(bào)資料工作,2013,(2):12-17.

      [11]鄂麗君.國(guó)外大學(xué)圖書館的科研數(shù)據(jù)管理教育[J].情報(bào)資料工作,2014,(1):101-105.

      [12]孫卓.基于大數(shù)據(jù)構(gòu)建圖書館知識(shí)服務(wù)引擎研究[J].圖書館學(xué)研究,2013,(18):48-51.

      [13]秦曉珠,李晨暉,麥范金.大數(shù)據(jù)知識(shí)服務(wù)的內(nèi)涵、典型特征及概念模型[J].情報(bào)資料工作,2013,(2):18-22.

      (本文責(zé)任編輯:馬卓)endprint

      英超| 习水县| 泾川县| 青海省| 贵阳市| 沈丘县| 尉犁县| 吉木萨尔县| 都江堰市| 南涧| 长岭县| 涟水县| 红河县| 穆棱市| 富蕴县| 榕江县| 柘城县| 吴川市| 安吉县| 酒泉市| 兰溪市| 台东县| 泗水县| 灵山县| 万山特区| 宜宾县| 封丘县| 岳阳市| 宜黄县| 晋江市| 泗水县| 兴海县| 南川市| 茌平县| 乾安县| 防城港市| 连城县| 涞源县| 平南县| 瓦房店市| 噶尔县|