武漢大學(xué)圖書(shū)館 奚志紅
大數(shù)據(jù)時(shí)代,在計(jì)算機(jī)、網(wǎng)絡(luò)和生活中充斥著大量數(shù)據(jù),政府機(jī)關(guān)、科研機(jī)構(gòu)和企業(yè)的計(jì)算機(jī)和服務(wù)器中保存的文件及數(shù)據(jù)量成倍增長(zhǎng),用戶(hù)其實(shí)是非常希望從自己擁有的這些數(shù)據(jù)信息中得到他們想要的有價(jià)值的信息。雖然每個(gè)企業(yè)、商業(yè)公司和高等院校等部門(mén)都積累了海量數(shù)據(jù),實(shí)際上,只有很少一部分?jǐn)?shù)據(jù)被利用來(lái)進(jìn)行統(tǒng)計(jì)分析,也只是為了應(yīng)付年度將相關(guān)數(shù)據(jù)上報(bào)到學(xué)?;蛘邆€(gè)人工作述職需要做得最基本統(tǒng)計(jì)工作。因此在很多情況下,數(shù)據(jù)量過(guò)于龐大,難于管理,或者數(shù)據(jù)結(jié)構(gòu)本身太復(fù)雜了,不能進(jìn)行有效的分析,因而信息用戶(hù)面臨數(shù)據(jù)豐富而知識(shí)缺乏的問(wèn)題,迫切需要能自動(dòng)高效率地從海量數(shù)據(jù)中提取有價(jià)值的信息數(shù)據(jù)處理新技術(shù)。
對(duì)于大量的、多樣化的、快速化的豐富數(shù)據(jù)集的理解是幾乎所有商業(yè)、科學(xué)、工程領(lǐng)域的共同需求,在這樣的需求背景下,提取并利用隱藏在這些數(shù)據(jù)中的有用知識(shí)的能力變得越來(lái)越重要,數(shù)據(jù)挖掘技術(shù)就此應(yīng)運(yùn)而生。因此可以在原來(lái)傳統(tǒng)的數(shù)據(jù)分析方法和技術(shù)基礎(chǔ)上,利用現(xiàn)階段比較成熟的處理大量數(shù)據(jù)信息的優(yōu)秀算法和技術(shù),兩者結(jié)合起來(lái)處理數(shù)據(jù)信息,從數(shù)據(jù)中獲得并發(fā)現(xiàn)有用的知識(shí)的整個(gè)過(guò)程,就稱(chēng)之為數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘理論和技術(shù)是目前比較熱門(mén)的、新穎的一個(gè)交叉性學(xué)科,它主要涉及統(tǒng)計(jì)學(xué)、人工智能、模式識(shí)別、機(jī)器學(xué)習(xí)以及數(shù)據(jù)庫(kù)理論與技術(shù)等多門(mén)學(xué)科,數(shù)據(jù)挖掘自從它的概念誕生以來(lái),在各大小研究學(xué)術(shù)機(jī)構(gòu)和電子商務(wù)領(lǐng)域迅速掀起了數(shù)據(jù)挖掘的研究和應(yīng)用的浪潮,其地位變得越來(lái)越重要,其應(yīng)用也日益廣泛。20世紀(jì)90年代初期開(kāi)始,我國(guó)很多高校圖書(shū)館開(kāi)始引進(jìn)圖書(shū)館自動(dòng)化管理系統(tǒng),隨著網(wǎng)絡(luò)技術(shù)的成熟發(fā)展及技術(shù)推廣,數(shù)字圖書(shū)館迅速發(fā)展,圖書(shū)館的各項(xiàng)服務(wù)在功能有了新的需求變化,圖書(shū)館在館藏資源的查詢(xún)借閱的服務(wù)中,每天會(huì)有大量的讀者行為數(shù)據(jù)生成,例如圖書(shū)館網(wǎng)站的點(diǎn)擊查詢(xún)、商業(yè)數(shù)據(jù)庫(kù)檢索及下載、讀者入館門(mén)禁系統(tǒng)、座位系統(tǒng)預(yù)約、圖書(shū)資料的借閱及預(yù)約、OPAC檢索等數(shù)據(jù)、工作人員的圖書(shū)資料的采訪(fǎng)、編目、流通,以及日常的參考咨詢(xún)數(shù)據(jù)等。這些數(shù)據(jù)雖然從表面上看不出有什么內(nèi)在聯(lián)系,其實(shí)這些數(shù)據(jù)蘊(yùn)含著豐富的有價(jià)值的信息,例如圖書(shū)館哪些網(wǎng)站頁(yè)面讀者的點(diǎn)擊利用率最高,哪些商業(yè)數(shù)據(jù)最受歡迎,哪些圖書(shū)被頻繁的借閱,讀者個(gè)體的行為特點(diǎn),讀者與文獻(xiàn)資源的內(nèi)在關(guān)聯(lián)、不同學(xué)科之間的內(nèi)在聯(lián)系等等,這些關(guān)聯(lián)的信息是目前圖書(shū)館很多應(yīng)用系統(tǒng)所不能解決的,因此有必要引進(jìn)新的技術(shù)和方法,挖掘和發(fā)現(xiàn)隱藏在這些數(shù)據(jù)后面的信息則顯得尤為重要,有了數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)之間隱含的關(guān)聯(lián)問(wèn)題就會(huì)有途徑和辦法進(jìn)行解決。數(shù)據(jù)挖掘技術(shù)在圖書(shū)館的應(yīng)用,必然能提升圖書(shū)館的服務(wù)水平,對(duì)圖書(shū)館各項(xiàng)業(yè)務(wù)全面的發(fā)展起到了很大的促進(jìn)作用。
在圖書(shū)館的業(yè)務(wù)研究工作中引入數(shù)據(jù)挖掘技術(shù)是十分有必要的,應(yīng)用這一項(xiàng)技術(shù),對(duì)圖書(shū)館館藏借閱服務(wù)中生成的讀者借閱行為歷史數(shù)據(jù)進(jìn)行有效的挖掘,總結(jié)歸納出圖書(shū)資源的借閱情況、讀者對(duì)館藏資源需求的規(guī)律,為合理布局文獻(xiàn)資源,提高文獻(xiàn)資源的利用率,完善和提高圖書(shū)館的管理和服務(wù)質(zhì)量提供數(shù)據(jù)支持和決策參考。
(1)有利于優(yōu)化館藏。文獻(xiàn)資源采購(gòu)是圖書(shū)館非常重要的工作,也是圖書(shū)館決策者最為關(guān)心的問(wèn)題,一方面由于涉及年度采購(gòu)經(jīng)費(fèi)的配置問(wèn)題,另一方面是如何利用僅有的資金采購(gòu)到讀者需要的文獻(xiàn)資源,提升圖書(shū)館的服務(wù)水準(zhǔn)。一般來(lái)說(shuō),圖書(shū)館的文獻(xiàn)采購(gòu)中心是圍繞學(xué)校的學(xué)科建設(shè)來(lái)進(jìn)行的,然而受到傳統(tǒng)文獻(xiàn)資源的采購(gòu)慣性影響,文獻(xiàn)資源的采購(gòu)權(quán)只掌握在少數(shù)幾個(gè)采訪(fǎng)人員的手上,他們一般不太了解讀者的迫切需求,針對(duì)性不是很強(qiáng),常常憑著以往的經(jīng)驗(yàn)進(jìn)行文獻(xiàn)采購(gòu),導(dǎo)致采購(gòu)到的文獻(xiàn)資源不是十分準(zhǔn)確反映讀者的訴求,不太符合學(xué)校學(xué)科建設(shè)需要和發(fā)展規(guī)劃目標(biāo)。因此提取圖書(shū)館文獻(xiàn)資源的借閱記錄、資源檢索和預(yù)約請(qǐng)求、館藏資源的借閱頻率等信息,利用數(shù)據(jù)挖掘技術(shù)的聚類(lèi)分析以及關(guān)聯(lián)規(guī)則進(jìn)行相關(guān)數(shù)據(jù)的挖掘,歸納總結(jié)出文獻(xiàn)借閱的借閱頻率,文獻(xiàn)的利用情況,從而有針對(duì)性地進(jìn)行文獻(xiàn)采購(gòu),豐富館藏資源。同時(shí)也能發(fā)掘出很長(zhǎng)時(shí)間沒(méi)有被借閱過(guò)的館藏文獻(xiàn),將他們進(jìn)行剔除或者減少該文獻(xiàn)的副本量,優(yōu)化館藏資源配置,實(shí)現(xiàn)館藏文獻(xiàn)架位的合理布局,使得圖書(shū)館文獻(xiàn)資源采購(gòu)工作更科學(xué)更合理,讓有限的文獻(xiàn)資源采購(gòu)經(jīng)費(fèi)和有限的館舍資源配置效率得到提高。
(2)有利于讀者服務(wù)。目前圖書(shū)館的服務(wù)實(shí)現(xiàn)了從收藏文獻(xiàn)為主,發(fā)展到現(xiàn)在以利用文獻(xiàn)為主的功能轉(zhuǎn)變,用戶(hù)在圖書(shū)館日常工作中的地位越來(lái)越高和顯得十分重要。個(gè)性化服務(wù)是數(shù)字圖書(shū)館發(fā)展的主方向,開(kāi)展個(gè)性化服務(wù)就是要從讀者的個(gè)性化需求出發(fā),了解讀者,主動(dòng)為讀者提供方便快捷準(zhǔn)確的知識(shí)服務(wù)。數(shù)據(jù)挖掘技術(shù)主要是通過(guò)對(duì)圖書(shū)館系統(tǒng)中的讀者借閱數(shù)據(jù)進(jìn)行收集、加工和處理,發(fā)掘讀者群體的借閱行為,根據(jù)挖掘出來(lái)的信息,進(jìn)行歸納總結(jié)相應(yīng)群體的需求信息,為讀者提供個(gè)性化的服務(wù)。
(3)促進(jìn)服務(wù)管理水平的提升。圖書(shū)館是高校重要的服務(wù)型機(jī)構(gòu)之一,為廣大師生提供資源服務(wù),是為教學(xué)和科研服務(wù)的關(guān)鍵部門(mén)。高校圖書(shū)館不同于其他公共服務(wù)性質(zhì)的圖書(shū)館,服務(wù)的對(duì)象具有專(zhuān)業(yè)性、層次性和規(guī)律性的服務(wù)特征。不同院系不同專(zhuān)業(yè)的學(xué)生,他們對(duì)信息服務(wù)的需求也不同;不同類(lèi)型層次的讀者對(duì)圖書(shū)館信息的需求差別也很大;同一類(lèi)型的讀者利用資源的規(guī)律在每一個(gè)年度也有可能有變化,但也具有一定的周期性規(guī)律。因此,利用數(shù)據(jù)挖掘技術(shù)對(duì)圖書(shū)館集成系統(tǒng)中的讀者流通歷史數(shù)據(jù)進(jìn)行挖掘,發(fā)掘讀者與文獻(xiàn)資源之間存在的規(guī)律以及隱含的關(guān)聯(lián)性,為優(yōu)化圖書(shū)館文獻(xiàn)館藏資源、調(diào)整文獻(xiàn)資源的布局、合理地安排圖書(shū)館的人員和服務(wù)時(shí)間提供數(shù)據(jù)上的決策參考,提高圖書(shū)館的服務(wù)管理水平。
(4)完善圖書(shū)館的服務(wù)層次。通過(guò)數(shù)據(jù)挖掘,完善和改進(jìn)圖書(shū)館的服務(wù)方式和服務(wù)手段,使人性化服務(wù)更加完美,圖書(shū)館服務(wù)模式得到改變,提高了讀者服務(wù)的滿(mǎn)意度。因此進(jìn)行深層次的知識(shí)服務(wù)揭示,可以在很大程度上提升高校圖書(shū)館的服務(wù)層次。
數(shù)據(jù)預(yù)處理的初衷是為了提高數(shù)據(jù)質(zhì)量,使數(shù)據(jù)挖掘的過(guò)程更加容易、更加有效,同時(shí)也是為了提高數(shù)據(jù)挖掘的質(zhì)量。數(shù)據(jù)預(yù)處理的作用是處理數(shù)據(jù)源中含有的噪聲數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)、數(shù)據(jù)值是空的和數(shù)據(jù)結(jié)構(gòu)不完整的數(shù)據(jù)。數(shù)據(jù)預(yù)處理工作是在數(shù)據(jù)挖掘之前不可缺少的一個(gè)環(huán)節(jié)。數(shù)據(jù)預(yù)處理主要包含以下兩個(gè)方面的工作:
(1)數(shù)據(jù)清洗:數(shù)據(jù)挖掘的結(jié)論取決于數(shù)據(jù)質(zhì)量,數(shù)據(jù)清理過(guò)程主要是通過(guò)填寫(xiě)缺失數(shù)據(jù)值、識(shí)別或者刪除離群點(diǎn)、光滑這些數(shù)據(jù),并根據(jù)不一致性來(lái)清理數(shù)據(jù),以求達(dá)到這樣幾個(gè)目標(biāo)(格式標(biāo)準(zhǔn)化處理、糾正錯(cuò)誤的數(shù)據(jù)、異常數(shù)據(jù)清理、重復(fù)數(shù)據(jù)的清理),對(duì)于來(lái)自多個(gè)系統(tǒng)或者數(shù)據(jù)源的數(shù)據(jù),在生產(chǎn)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)清理過(guò)程中,重要的一個(gè)步驟是解決不正確拼寫(xiě)、沖突的數(shù)據(jù)和多個(gè)系統(tǒng)間拼寫(xiě)規(guī)則之類(lèi)的錯(cuò)誤。在數(shù)據(jù)中出現(xiàn)的錄入錯(cuò)誤,或者是編碼錯(cuò)誤會(huì)直接影響到數(shù)據(jù)挖掘的效果。數(shù)據(jù)清理能解決數(shù)據(jù)中的人為錯(cuò)誤,以及數(shù)據(jù)文件中對(duì)統(tǒng)計(jì)分析結(jié)果影響較大的有誤數(shù)值,提高數(shù)據(jù)挖掘的準(zhǔn)確性和有效性。
(2)數(shù)據(jù)轉(zhuǎn)換:數(shù)據(jù)轉(zhuǎn)換是根據(jù)數(shù)據(jù)對(duì)象不同可以分類(lèi)為兩大類(lèi),一類(lèi)是對(duì)于傳統(tǒng)的常規(guī)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,另外一類(lèi)是對(duì)非常規(guī)的數(shù)據(jù)進(jìn)行數(shù)據(jù)轉(zhuǎn)換。對(duì)于常規(guī)的數(shù)據(jù)轉(zhuǎn)換通常采用線(xiàn)性或者非線(xiàn)性的數(shù)學(xué)變化方法,將數(shù)據(jù)轉(zhuǎn)成適合當(dāng)前數(shù)據(jù)挖掘的數(shù)據(jù)形式。非常規(guī)數(shù)據(jù)的變換,一般根據(jù)數(shù)據(jù)的特性不同而又不同形式的轉(zhuǎn)換方式??梢哉f(shuō)數(shù)據(jù)轉(zhuǎn)換是數(shù)據(jù)挖掘過(guò)程中很重要的一個(gè)環(huán)節(jié),是決定數(shù)據(jù)挖掘是否有效的一個(gè)關(guān)鍵。
數(shù)據(jù)集成是將來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)根據(jù)一定的集成規(guī)則組織在一起,存放到事先準(zhǔn)備的數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中的一個(gè)過(guò)程。做數(shù)據(jù)集成的目的是對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行匯總、數(shù)據(jù)概念化等工作。由于來(lái)源于不同系統(tǒng)的數(shù)據(jù)集成涉及的問(wèn)題有很多,比如理論依據(jù)和數(shù)據(jù)規(guī)則,而不同數(shù)據(jù)表中的定義也有所不同,因此,數(shù)據(jù)集成可以說(shuō)是比較需要專(zhuān)業(yè)知識(shí)的一項(xiàng)工作,數(shù)據(jù)集成一般包括兩個(gè)部分:(1)數(shù)據(jù)集成:將來(lái)自不同數(shù)據(jù)源中的數(shù)據(jù)整合到一個(gè)數(shù)據(jù)倉(cāng)庫(kù)中;(2)模式集成:整合不同數(shù)據(jù)庫(kù)中數(shù)據(jù)的元數(shù)據(jù)。
數(shù)據(jù)集成需要相關(guān)的行業(yè)知識(shí),用這些知識(shí)來(lái)處理實(shí)體識(shí)別問(wèn)題,以匹配不同數(shù)據(jù)源中的現(xiàn)實(shí)實(shí)體。另外在數(shù)據(jù)集成中,我們需要檢測(cè)并解決數(shù)據(jù)值的沖突問(wèn)題。對(duì)現(xiàn)實(shí)世界中的數(shù)據(jù)同一實(shí)體,來(lái)自不同數(shù)據(jù)庫(kù)的屬性值可能不同??赡軟_突的原因有各種各樣,比如不同數(shù)據(jù)表示和量度也會(huì)不相同。數(shù)據(jù)集成的目的非常明確,就是把數(shù)據(jù)從不同的信息源整合到同一個(gè)數(shù)據(jù)平臺(tái)之中,以便于數(shù)據(jù)挖掘。
經(jīng)過(guò)前期的數(shù)據(jù)預(yù)處理和數(shù)據(jù)集成,在進(jìn)行數(shù)據(jù)進(jìn)行挖掘前,首先要選擇合適的挖掘算法,讓挖掘的一切工作系統(tǒng)都能自動(dòng)地完成。在算法的選擇上,應(yīng)該從下面兩個(gè)因素進(jìn)行考慮:第一是根據(jù)不同的數(shù)據(jù)有不同的特點(diǎn),我們就需要用與它們相關(guān)的算法來(lái)進(jìn)行挖掘;第二是要根據(jù)系統(tǒng)實(shí)際運(yùn)行的需求,調(diào)整挖掘技術(shù)策略。在此期間還要考慮數(shù)據(jù)特點(diǎn)和結(jié)果、以及知識(shí)描述方式方法,然后通過(guò)分析數(shù)據(jù),最終得到并且形成知識(shí)的模式模型。目前采用較多的挖掘技術(shù)有下面幾個(gè):決策樹(shù)、分類(lèi)、關(guān)聯(lián)規(guī)則、聚類(lèi)、遺傳算法、粗糙集、神經(jīng)網(wǎng)絡(luò)等。
常用的數(shù)據(jù)挖掘技術(shù)應(yīng)該可以分為三大類(lèi):一是統(tǒng)計(jì)分析類(lèi)型的有線(xiàn)性分析、時(shí)間序列分析、回歸分析、非線(xiàn)性分析、單變量分析、邏輯回歸分析、最近鄰算法、多變量分析和聚類(lèi)分析等;二是知識(shí)發(fā)現(xiàn)類(lèi)型術(shù)主要有人工神經(jīng)網(wǎng)絡(luò)、規(guī)則發(fā)現(xiàn)、遺傳算法、關(guān)聯(lián)順序和決策樹(shù)等;第三是其他類(lèi)數(shù)據(jù)挖掘技術(shù)一般包含有文本數(shù)據(jù)挖掘、分布式數(shù)據(jù)挖掘、空間數(shù)據(jù)挖掘和Web數(shù)據(jù)挖掘等。
1.數(shù)據(jù)挖掘工具分類(lèi)
市場(chǎng)上有很多比較成熟的數(shù)據(jù)挖掘工具,大概有以下幾 種:SAS Enterprise Miner、SGI MineSet、IBM Intelligent Miner、Partek、IBM Intelligent Miner、SQL Server BusinessIntelligence development studio、LEVEL5 Quest、SPSS Clementine、Oracle Darwin、KnowledgeSeeker、SAS Enterprise Miner、SE-Learn、Cognos Scenario、UnicaPRW等,常用的數(shù)據(jù)挖掘工具按照它們的適用范圍,大概可以分為基于神經(jīng)網(wǎng)絡(luò)、規(guī)則和決策樹(shù)、模糊邏輯和綜合多方法工具等幾大類(lèi)。
2.數(shù)據(jù)挖掘工具的選擇
數(shù)據(jù)挖掘是一個(gè)逐步完善的過(guò)程,在實(shí)際的數(shù)據(jù)挖掘過(guò)程中,需要根據(jù)業(yè)務(wù)的邏輯需求和挖掘工具緊密結(jié)合,在實(shí)施過(guò)程中不斷地調(diào)整和磨合,使流程規(guī)范化,挖掘工作才能取得成功。在選擇數(shù)據(jù)挖掘工具開(kāi)展業(yè)務(wù)工作時(shí),需要結(jié)合目標(biāo)的實(shí)際情況,因此選擇數(shù)據(jù)挖掘工具時(shí),要考慮的因素主要有:數(shù)據(jù)挖掘工具的模式種類(lèi)是否能夠完成數(shù)據(jù)挖掘任務(wù);數(shù)據(jù)挖掘工具是否具備解決復(fù)雜數(shù)據(jù)和數(shù)據(jù)量大的挖掘能力;數(shù)據(jù)挖掘工具的運(yùn)行性能,能否為用戶(hù)提供可視化的操作界面,以及挖掘結(jié)果是否具備圖形可視化工具展示,數(shù)據(jù)挖掘工具是否具備可視化,主要包括數(shù)據(jù)的可視化、數(shù)據(jù)挖掘模型的可視化、數(shù)據(jù)挖掘過(guò)程的可視化、數(shù)據(jù)挖掘后結(jié)果的可視化、可視化的展示深度和質(zhì)量等;還有一個(gè)是挖掘工具的開(kāi)放性要好,具備和大部分?jǐn)?shù)據(jù)庫(kù)系統(tǒng)有良好的兼容性和集成性。
文獻(xiàn)的采購(gòu)是豐富館藏資源的方式之一,有目的地豐富館藏資源,才能使讀者更加有興趣到圖書(shū)館來(lái)借閱圖書(shū),從而提高館藏圖書(shū)的利用率。目前高校圖書(shū)館采購(gòu)權(quán)限一般還是放在文獻(xiàn)采訪(fǎng)部門(mén),由于采訪(fǎng)人員不是一線(xiàn)服務(wù)的工作人員,也不是專(zhuān)門(mén)研究讀者借閱行為分析的研究館員,因此在采購(gòu)文獻(xiàn)時(shí),只憑借以往的工作經(jīng)驗(yàn)來(lái)采購(gòu)哪類(lèi)文獻(xiàn)以及采購(gòu)數(shù)量的多少。因此可能會(huì)采購(gòu)一些無(wú)人借閱的文獻(xiàn),而讀者迫切需要的文獻(xiàn)卻沒(méi)有購(gòu)買(mǎi)。因此可以通過(guò)對(duì)讀者借閱數(shù)據(jù)的挖掘分析,可以幫助我們掌握讀者的借書(shū)需求和閱讀趨向,在今后的采購(gòu)工作中有數(shù)據(jù)上的決策性依據(jù)??偟膩?lái)說(shuō)采購(gòu)文獻(xiàn)一方面要符合我校學(xué)科發(fā)展建設(shè)的需要,有豐富的館藏為廣大師生提供學(xué)習(xí)和科研方面的幫助,另一方面多采購(gòu)一些熱門(mén)的文獻(xiàn),可以解決因圖書(shū)資源短缺無(wú)充足館藏可借局面,提高圖書(shū)采購(gòu)經(jīng)費(fèi)的利用率。
“以人為本,讀者至上”是圖書(shū)館的服務(wù)理念,這一服務(wù)理念應(yīng)該始終貫穿在圖書(shū)館的各項(xiàng)工作之中,因此館藏的布局應(yīng)該以讀者為中心,切實(shí)考慮讀者對(duì)圖書(shū)的借閱需求,讓讀者能方便快捷地找到需要的圖書(shū)資源。結(jié)合圖書(shū)館的實(shí)際情況,以及在數(shù)據(jù)挖掘分析的基礎(chǔ)上從兩個(gè)方面進(jìn)行館藏布局的創(chuàng)新。
(1)以讀者為中心的館藏布局。根據(jù)工作經(jīng)驗(yàn)和數(shù)據(jù)挖掘的結(jié)果進(jìn)行對(duì)比,其實(shí)只有百分之二十的圖書(shū)是被讀者經(jīng)常借閱的,而剩下的百分之八十的圖書(shū)借閱量比較小,圖書(shū)館應(yīng)依據(jù)讀者對(duì)圖書(shū)借閱“二八”定理進(jìn)行館藏布局??梢岳萌€(xiàn)典藏的模式進(jìn)行館藏布局,提高館藏的布局合理性,方便讀者借閱,提高館舍的利用率。
(2)學(xué)科關(guān)聯(lián)一體化的館藏布局。在飛速發(fā)展的網(wǎng)絡(luò)時(shí)代,知識(shí)信息的傳播方式、服務(wù)手段、服務(wù)屬性都有所變化,傳動(dòng)的按照館藏文獻(xiàn)的載體形式布局的模式應(yīng)該進(jìn)行優(yōu)化變革,圖書(shū)館應(yīng)根據(jù)對(duì)讀者的借閱數(shù)據(jù)進(jìn)行學(xué)科關(guān)聯(lián)挖掘分析,找出學(xué)科之間的隱含的關(guān)系,進(jìn)行歸納匯總,逐步形成一套按學(xué)科關(guān)聯(lián)進(jìn)行圖書(shū)資料的館藏布局方案,引導(dǎo)讀者的借閱行為,激發(fā)讀者的借閱興趣,提高相關(guān)聯(lián)學(xué)科圖書(shū)的利用率。
雖然圖書(shū)館實(shí)現(xiàn)了借閱一體化的服務(wù)模式,給了讀者寬松舒適的借閱氛圍,讀者可以暢通無(wú)阻的借閱各種類(lèi)型的文獻(xiàn)資源?;旧献龅搅恕耙宰x者為中心”的服務(wù)理念,但圖書(shū)館在借閱服務(wù)及政策方面還有待改進(jìn)的地方。圖書(shū)館應(yīng)該依據(jù)集成系統(tǒng)的借閱歷史、OPAC查詢(xún)、入館學(xué)習(xí)等行文數(shù)據(jù),深入挖掘分析讀者的借閱行為,了解和預(yù)測(cè)讀者的隱含的需求,為讀者制定靈活的文獻(xiàn)借閱政策和提供準(zhǔn)確及時(shí)的個(gè)性化知識(shí)服務(wù)。
隨著網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)的飛速發(fā)展,挖掘技術(shù)在圖書(shū)館的應(yīng)用越來(lái)越成熟,利用成熟的數(shù)據(jù)挖掘技術(shù)分析讀者的借閱行為規(guī)律,預(yù)判讀者對(duì)館藏借閱的真實(shí)需求,為優(yōu)化藏布局和開(kāi)展個(gè)性化的知識(shí)服務(wù)提供數(shù)據(jù)依據(jù),盡一切可能提高圖書(shū)資源的利用率。