聶飛霞
(西北大學(xué)圖書館,陜西 西安 710127)
基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)圖書館個(gè)性化圖書推薦服務(wù)*
聶飛霞
(西北大學(xué)圖書館,陜西 西安 710127)
隨著信息技術(shù)和移動(dòng)網(wǎng)絡(luò)的發(fā)展,移動(dòng)圖書館已經(jīng)成為圖書館的延伸服務(wù)之一。通過分析國內(nèi)外移動(dòng)圖書館現(xiàn)有的服務(wù)模式及種類,提出了兩種基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)圖書館個(gè)性化圖書推薦服務(wù)。
移動(dòng)圖書館 數(shù)據(jù)挖掘 個(gè)性化圖書推薦服務(wù)
隨著手機(jī)的普及以及移動(dòng)網(wǎng)絡(luò)的發(fā)展,移動(dòng)圖書館(Mobile Library)開始進(jìn)入人們的生活。工信部統(tǒng)計(jì)數(shù)據(jù)顯示,到2013年3月底,我國共有11.46億移動(dòng)通信服務(wù)用戶,越來越多的人利用移動(dòng)設(shè)備瀏覽網(wǎng)頁、觀看視頻、進(jìn)行GPS地圖導(dǎo)航等。傳統(tǒng)媒體的數(shù)字化成為大趨勢,數(shù)字期刊、數(shù)字報(bào)紙、數(shù)字圖書、數(shù)字視頻等不斷涌現(xiàn),手機(jī)作為“第五媒體”的載體[1],已經(jīng)成為人們不可缺少的“日常用品”。自“移動(dòng)圖書館”這一概念2000年被提出以來,其在國內(nèi)外圖書館界迅速發(fā)展,目前已經(jīng)成功應(yīng)用于國內(nèi)外的眾多圖書館。近幾年隨著4G移動(dòng)通信技術(shù)的到來,移動(dòng)圖書館也面臨著新的機(jī)遇和挑戰(zhàn)。4G移動(dòng)通信技術(shù)是3G技術(shù)與WLAN技術(shù)結(jié)合的新通信技術(shù),其數(shù)據(jù)傳輸速率更快,而且可以高效率傳輸高清視頻圖像等數(shù)據(jù)[2]。如何更好地利用4G移動(dòng)通信技術(shù),使移動(dòng)圖書館更加人性化,是近年來的一個(gè)研究熱點(diǎn)。
目前國內(nèi)外圖書館開展的無線業(yè)務(wù),從服務(wù)模式來看,主要采取的是WAP站點(diǎn)服務(wù)、SMS短信服務(wù)以及APP應(yīng)用3種方式[3]。其中WAP站點(diǎn)服務(wù)是一種被動(dòng)拉取模式,短信服務(wù)是一種主動(dòng)推送模式,而APP應(yīng)用是近幾年發(fā)展起來的安裝于移動(dòng)客戶端的軟件。隨著Apple Store的發(fā)展,使得APP應(yīng)用開發(fā)炙手可熱,APP應(yīng)用服務(wù)將是移動(dòng)圖書館的發(fā)展趨勢。但是由于APP應(yīng)用需要大量的人力物力來支持,增加了圖書館的建設(shè)成本,因此目前國內(nèi)提供APP應(yīng)用的圖書館還不多。在國內(nèi)的移動(dòng)圖書館領(lǐng)域,移動(dòng)圖書館的服務(wù)方式并不是單一的以某種模式出現(xiàn),經(jīng)常是兩種或者3種模式結(jié)合起來為讀者提供服務(wù)。而國外尤其是歐美國家,移動(dòng)圖書館在2000年就已開始拉開帷幕[4]。2007年11月召開的“世界移動(dòng)圖書館會(huì)議”,以及2009年11月召開的“手持圖書館聯(lián)機(jī)會(huì)議”為國外圖書館界的學(xué)者們提供了交流的平臺(tái)[5]。美國的斯科基市公共圖書館設(shè)計(jì)的移動(dòng)圖書館是歐美移動(dòng)圖書館界的先河。近幾年歐美移動(dòng)圖書館的WAP站點(diǎn)服務(wù)已經(jīng)趨于成熟,而在國內(nèi)圖書館還為數(shù)不多的APP應(yīng)用服務(wù)在歐美圖書館界也逐步趨于潮流[6]。以下是移動(dòng)圖書館的3種服務(wù)模式。
1.1 SMS短信服務(wù)
SMS即Short Message Service。目前國內(nèi)外圖書館的SMS短信服務(wù)主要有兩種服務(wù)模式:一種是主動(dòng)推送型,如圖書館向讀者發(fā)送的到期提醒、欠款通知、講座通知、新書快送等;另一種則是讀者定制型,如對新書通報(bào)的定制、對書目查詢的定制等[7]。SMS短信服務(wù)目前是3種服務(wù)模式當(dāng)中最易實(shí)現(xiàn)的服務(wù),因?yàn)橹灰惺謾C(jī)就有收發(fā)短信的功能,不需要開通上網(wǎng)業(yè)務(wù)。
1.2 WAP站點(diǎn)服務(wù)
WAP即Wireless Application Protocol。是指一種無線應(yīng)用協(xié)議,該協(xié)議具有開放通用的特性。只要我們的移動(dòng)終端支持這一協(xié)議,即可通過移動(dòng)終端訪問圖書館的WAP站點(diǎn)。因此,隨著智能手機(jī)的普及,WAP站點(diǎn)服務(wù)已經(jīng)逐步超越了SMS短信服務(wù)模式。WAP站點(diǎn)服務(wù)提供的主要服務(wù)內(nèi)容包括圖書查詢、我的圖書館、公告新聞、新書通報(bào)等。從E線圖情和谷歌深度檢索的調(diào)查結(jié)果可以看出,截至2012年底,我國10余家公共圖書館包括上海圖書館、東莞圖書館等,以及大量的“211”高校圖書館包括清華大學(xué)圖書館、北京大學(xué)圖書館、南京師范大學(xué)圖書館、同濟(jì)大學(xué)圖書館等開始提供手機(jī)WAP網(wǎng)站服務(wù)[8]。
1.3 APP應(yīng)用服務(wù)
APP即Application的縮寫。國內(nèi)圖書館界開展APP應(yīng)用服務(wù)較晚,從2000年到現(xiàn)在,移動(dòng)圖書館主要提供的服務(wù)還是基于SMS短信服務(wù)以及WAP站點(diǎn)服務(wù)。2005年才開始嘗試開發(fā)利用APP應(yīng)用服務(wù)[9]。國內(nèi)首度推出移動(dòng)圖書館APP應(yīng)用服務(wù)的是上海圖書館的“手機(jī)圖書館”,其手機(jī)圖書館APP應(yīng)用服務(wù)有專門的移動(dòng)客戶端,讀者可以通過掃描二維碼或者檢索移動(dòng)圖書館名稱來安裝APP移動(dòng)客戶端。上海圖書館的APP應(yīng)用服務(wù)主要包括館藏目錄查詢、讀者借閱查詢、展覽講座、讀者服務(wù)、上圖信息等[10]。而國家圖書館在移動(dòng)圖書館APP服務(wù)方面做得也很出色,在推出“掌上國圖”APP應(yīng)用后,又將其館藏電子書資源做成了系列的APP應(yīng)用服務(wù)。從目前國內(nèi)圖書館APP應(yīng)用服務(wù)現(xiàn)狀來看,國內(nèi)圖書館開展APP應(yīng)用服務(wù)還處于起步階段,提供的服務(wù)類型也僅僅是傳統(tǒng)服務(wù)的“APP化”,也就是將原來傳統(tǒng)的圖書館服務(wù)做成APP軟件。移動(dòng)圖書館的APP應(yīng)用服務(wù)在個(gè)性化服務(wù)方面還有很大的發(fā)展空間。
移動(dòng)圖書館的3種服務(wù)模式從時(shí)間上來看是依次開展的,從最初的SMS短信服務(wù)到SMS短信服務(wù)與WAP站點(diǎn)服務(wù)相結(jié)合,再到現(xiàn)在的WAP站點(diǎn)服務(wù)與APP應(yīng)用服務(wù)并存的服務(wù)模式。而從服務(wù)內(nèi)容來看是逐步深入,從最初的SMS短信服務(wù)的單一服務(wù)到WAP站點(diǎn)服務(wù)與APP應(yīng)用服務(wù)的深層次多方面的服務(wù)模式。移動(dòng)圖書館的開發(fā)逐步向方便快捷、高效全面的方向發(fā)展。表1是移動(dòng)圖書館3種服務(wù)模式的優(yōu)缺點(diǎn)比較。
近幾年,國內(nèi)的移動(dòng)圖書館服務(wù)基本都是傳統(tǒng)服務(wù)的延伸,也就是將傳統(tǒng)桌面轉(zhuǎn)移到移動(dòng)介質(zhì)上,服務(wù)內(nèi)容特色化道路還很漫長[11]。有的學(xué)者提出在移動(dòng)圖書館客戶端設(shè)計(jì)用戶個(gè)性化定制服務(wù),也就是用戶可以添加自己所需資源,還可以根據(jù)自己的使用習(xí)慣來布置系統(tǒng)界面。還有的學(xué)者提出將二維碼以及RFID技術(shù)與移動(dòng)圖書館技術(shù)相結(jié)合,更科學(xué)有效地實(shí)現(xiàn)圖書定位服務(wù)。筆者將提出基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)圖書館特色推薦服務(wù),并對此展開記述。
2.1 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是指尋找隱藏在數(shù)據(jù)中的信息如趨勢、特征及相關(guān)性的過程。數(shù)據(jù)挖掘的一個(gè)重要過程就是從數(shù)據(jù)中挖掘知識的過程,也稱為數(shù)據(jù)庫中知識發(fā)現(xiàn)的過程和知識提取、數(shù)據(jù)采掘的過程等,并且可以在這一過程中用于發(fā)現(xiàn)概念、分類、關(guān)聯(lián)、預(yù)測、聚類、趨勢分析、偏差分析和相似性分析及結(jié)果的可視化[12]。筆者所提供的移動(dòng)圖書館個(gè)性化推薦服務(wù),主要運(yùn)用了數(shù)據(jù)挖掘中的聚類分析和關(guān)聯(lián)規(guī)則兩種算法。聚類分析(cluster analysis)的主要目的是將數(shù)據(jù)分成不同類或者簇的過程,筆者主要應(yīng)用了k-means算法。關(guān)聯(lián)規(guī)則(association rules)是找出既定事件或數(shù)據(jù)中能同時(shí)出現(xiàn)的頻繁數(shù)據(jù)(即高頻項(xiàng)目組)的一種方法,筆者采用了經(jīng)典的Apriori算法。
2.2 基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)圖書館個(gè)性化圖書推薦服務(wù)
基于數(shù)據(jù)挖掘技術(shù)的圖書推薦服務(wù)主要有兩個(gè)工作方面。一個(gè)是利用登錄移動(dòng)圖書館的讀者所留下來的歷史數(shù)據(jù)來預(yù)測用戶潛在的喜好和興趣,另一個(gè)是將挖掘出來的預(yù)測數(shù)據(jù)展示給讀者。移動(dòng)圖書館讀者訪問所產(chǎn)生的數(shù)據(jù)主要包括瀏覽數(shù)據(jù)、書目查詢數(shù)據(jù)、借閱數(shù)據(jù)等,這些海量數(shù)據(jù)將成為個(gè)性化圖書推薦的數(shù)據(jù)源。
基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)圖書館個(gè)性化圖書推薦流程如圖1所示,當(dāng)讀者用戶成功登錄系統(tǒng)后,系統(tǒng)將從讀者聚類推薦和讀者關(guān)聯(lián)推薦兩個(gè)方面進(jìn)行個(gè)性化推薦處理。
圖1 移動(dòng)圖書館個(gè)性化圖書推薦流程
2.2.1 讀者聚類個(gè)性化圖書推薦——您所在類別的讀者都借了什么書
移動(dòng)圖書館個(gè)性化推薦流程如圖1所示,第一種個(gè)性化圖書推薦方式是讀者的聚類推薦。讀者成功登錄以后,系統(tǒng)首先利用k-means聚類算法對系統(tǒng)內(nèi)所有讀者進(jìn)行聚類處理。k-means算法是給定一個(gè)k值,然后將所需要聚類的數(shù)據(jù)對象分為k個(gè)聚類。這些聚類的特點(diǎn)就是同在一個(gè)聚類的特性較相似,而不在同一個(gè)聚類的特性相似度較低。而這里的相似度是通過一個(gè)“中心對象”來計(jì)算的,“中心對象”是聚類中對象的均值。表2為讀者信息表,登錄后系統(tǒng)會(huì)識別用戶的名稱、證號、類型等信息,根據(jù)這些屬性對登錄讀者與聚類結(jié)果進(jìn)行比對。得到當(dāng)前讀者所屬分類中所有讀者所借閱的圖書,然后根據(jù)這些圖書的借閱量進(jìn)行排序并且排除當(dāng)前讀者已經(jīng)借閱過的圖書,最終得到一個(gè)根據(jù)讀者分類的推薦圖書清單。
表2 讀者信息
2.2.2 讀者關(guān)聯(lián)個(gè)性化圖書推薦——選擇該書的讀者還借了什么書
第二種個(gè)性化圖書推薦方法是對讀者的關(guān)聯(lián)推薦,也就是只要讀者有借閱記錄,系統(tǒng)就會(huì)根據(jù)借閱記錄進(jìn)行關(guān)聯(lián)分析,從而告訴讀者借過這本書的其他人還借了哪些書。表3為圖書信息結(jié)構(gòu)表,Apriori關(guān)聯(lián)規(guī)則算法提取的圖書特征值主要是BookIndex項(xiàng),即索取號項(xiàng)。如圖1所示,讀者成功登錄系統(tǒng)以后,系統(tǒng)首先判斷當(dāng)前讀者是否有借閱記錄,如果沒有借閱記錄,那么無法提供關(guān)聯(lián)推薦圖書,流程結(jié)束;如果有借閱記錄,那么找出所有借閱圖書并且利用Apriori關(guān)聯(lián)規(guī)則算法對所有借閱事務(wù)進(jìn)行關(guān)聯(lián)規(guī)則分析,得到當(dāng)前讀者關(guān)聯(lián)的圖書,然后根據(jù)置信度以及圖書的借閱量對圖書進(jìn)行排序并排除讀者已經(jīng)借閱過的圖書,最終得到一個(gè)基于關(guān)聯(lián)規(guī)則的興趣推薦圖書清單。
表3 圖書信息結(jié)構(gòu)
個(gè)性化推薦服務(wù)在很多網(wǎng)站都開展的很有特色,而且受到了廣大網(wǎng)民的青睞。例如當(dāng)當(dāng)網(wǎng)推出的“買過本商品的還買了什么”、淘寶網(wǎng)推出的“同類熱銷寶貝”、卓越網(wǎng)推出的“為我推薦”等都是基于關(guān)聯(lián)規(guī)則的個(gè)性化推薦服務(wù)。而淘寶網(wǎng)的用戶分類是對會(huì)員購買物品進(jìn)行離散分析,然后對會(huì)員進(jìn)行聚類挖掘。未來在移動(dòng)圖書館領(lǐng)域,我們希望讀者在登錄圖書館的APP應(yīng)用后既能夠享受到傳統(tǒng)的服務(wù)也能夠體驗(yàn)到個(gè)性化推薦服務(wù)。筆者所提出的移動(dòng)圖書館個(gè)性化推薦服務(wù),只要讀者成功登錄到APP應(yīng)用,就能為讀者提供讀者聚類個(gè)性化圖書推薦;而只要存在借閱記錄的讀者就能得到讀者關(guān)聯(lián)個(gè)性化圖書推薦清單。隨著4G網(wǎng)絡(luò)的啟用與成熟,移動(dòng)圖書館的發(fā)展也會(huì)日趨完善,個(gè)性化服務(wù)將成為移動(dòng)圖書館的評價(jià)標(biāo)準(zhǔn)之一。
[1]甘建偉.手機(jī)圖書館發(fā)展現(xiàn)狀與服務(wù)功能拓展研究[J].圖書館學(xué)研究,2011(6).
[2]李薔.基于4G的移動(dòng)圖書館服務(wù)平臺(tái)構(gòu)建[D].哈爾濱:黑龍江大學(xué),2012.
[3]夏南強(qiáng),殷克濤,趙富紅.論手機(jī)圖書館的信息服務(wù)[J].情報(bào)科學(xué),2009(11).
[4]張文彥,劉鐘美,張瑞賢.美國手機(jī)圖書館的發(fā)展概況[J].圖書館建設(shè),2009(11).
[5]覃起瓊.近年來國內(nèi)外移動(dòng)圖書館研究述評[J].圖書與情報(bào),2013(3).
[6]高春玲.中美移動(dòng)圖書館服務(wù)PK[J].圖書情報(bào)工作,2011(9).
[7]陳桂菊.我國手機(jī)圖書館信息服務(wù)研究[D].合肥:安徽大學(xué),2012.
[8]田蕊,陳朝暉,楊琳.基于手持終端的圖書館APP移動(dòng)服務(wù)研究[J].圖書館建設(shè),2012(7).
[9]陳新昕,黃麗霞.淺析我國圖書館APP類型、現(xiàn)狀及對策[J].科技資訊,2013(10).
[10]羅曉濤.探索移動(dòng)圖書館服務(wù)新模式——以上海圖書館“手機(jī)圖書館”為例[J].圖書館論壇,2013(2).
[11]陳麗冰.移動(dòng)互聯(lián)網(wǎng)時(shí)代的圖書館服務(wù)[J].圖書館,2013(2).
[12]Han Jiawei,Kamber Micheline.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2005.
聶飛霞女,1979年生。碩士,館員。研究方向:數(shù)字圖書館。
G250.78
2014-01-04;責(zé)編:王天泥。)
*本文系2013陜西社科信息學(xué)會(huì)科研培植項(xiàng)目“手機(jī)知識服務(wù)模式及效果研究”(項(xiàng)目編號shshx201303)成果之一。