鄭云濤 李 萍 沈晶晶 徐真真
(1.浙江農(nóng)林大學圖書館,浙江 杭州 311300;2.浙江農(nóng)林大學農(nóng)業(yè)與食品科學學院,浙江 杭州 311300)
近年來,隨著信息時代的到來和數(shù)字化圖書館的興起,大學生可以通過手機和互聯(lián)網(wǎng)獲取大量知識資源,這就導致紙質(zhì)圖書的借閱規(guī)模持續(xù)下降以及圖書資料應(yīng)用模式和使用方式的不斷變化,這對圖書借閱行為研究提出了新的挑戰(zhàn)?,F(xiàn)階段,為了提高圖書館閱讀推廣工作的實效性以及增強閱讀推廣工作的可持續(xù)性[1],須深入調(diào)查多層次讀者的借閱傾向,分析讀者的借閱心理[2],逐步形成精準化閱讀推廣體系,利用讀者的借閱偏好主動推送相應(yīng)的書籍[3],并進一步推進以讀者為中心、以讀者需求為驅(qū)動的一體化服務(wù)[4]。該文主要以浙江農(nóng)林大學本科生紙質(zhì)圖書借閱信息為例,通過實證研究高校大學生紙質(zhì)圖書讀者群借閱行為的內(nèi)在需求,為研究大學本科生的借閱行為偏好提供參考。
從學校圖書館的圖騰管理系統(tǒng)數(shù)據(jù)庫導出近五屆畢業(yè)生的讀者信息和圖書借閱記錄,為保護讀者隱私和學校圖書館管理系統(tǒng)的知識產(chǎn)權(quán),讀者信息表選取的關(guān)鍵字段僅為讀者號、性別、專業(yè)、入學年份和學院,圖書借閱記錄選取的關(guān)鍵字段僅為題名、館藏號、索書號和借書日期。研究人員篩選出東湖校區(qū)四年制本科應(yīng)屆畢業(yè)生的借閱記錄(不含獨立學院、專升本、退學、轉(zhuǎn)學、休學、延長學制和五年制的學生),最終得到15 205 名畢業(yè)生的529 975 條有效借閱記錄。
數(shù)據(jù)預(yù)處理是整個聚類挖掘中最為基礎(chǔ)的環(huán)節(jié),數(shù)據(jù)預(yù)處理的質(zhì)量直接決定了聚類分析的效果[5]。該文整合了借閱記錄和讀者信息,得到了43547 條讀者借閱信息。其后,為了保證A 類~Z 類借閱量的連續(xù)性,根據(jù)SPSS(Statistical Product and Service Solutions,最常用的社會科學統(tǒng)計軟件之一)的箱型圖、PP 圖和回歸曲線分析等對數(shù)據(jù)進行多次修正,修正后圖書大類借閱量呈正態(tài)分布或近正態(tài)分布;后期實踐結(jié)果證實了上述預(yù)處理的有效性。
讀者閱讀需求的抽樣調(diào)查分析結(jié)果表明,讀者有非常廣泛的閱讀需求。王哲將讀者購買圖書目的歸納為學術(shù)研究、工作需要、休閑娛樂、提高個人素質(zhì)和涵養(yǎng)、復習備考與其他六種目的[6]。鄧香蓮認為大學生出于學業(yè)發(fā)展、未來職業(yè)需求以及休閑娛樂等動機,有專業(yè)學習、興趣愛好、社會交往以及休閑娛樂等各種需求[7]。由此可見,不同研究者對讀者借閱區(qū)需求的分類差別較大。
該校22 個大類圖書借閱量統(tǒng)計結(jié)果揭示了學校本科生的整體借閱需求。從圖 1 可以看出,讀者借閱的I 類文學圖書最多,占總借閱量的27.59%,后面依次為T 類(15.7%)、H 類(13.62%)、J 類(10.83%)以及K 類(5.95%),體現(xiàn)了休閑娛樂、專業(yè)和英語借閱的需求。
從借閱實際來看,讀者借閱圖書時,往往會同時借閱其他大類的圖書,而不僅僅只借閱某個大類的圖書。那么僅對圖書大類做分析,就割裂了讀者的借閱需求,只體現(xiàn)了圖書的借閱特征而不是讀者的借閱特征。為了更加精準地了解各個讀者的借閱需求,需要對讀者進行聚類,研究各個聚類的讀者群圖書借閱的特征,并深入挖掘借閱的內(nèi)在需求。
常用的22 個大類借閱量聚類容易形成局部最優(yōu)解。該文創(chuàng)新性地采用了萃取因素,并根據(jù)權(quán)重選擇了最為主要的8 個萃取綜合決策因素作為聚類的考慮范疇,保證了主要聚類的精準度,使主要聚類的讀者范圍最大化;且萃取的綜合決策因素更側(cè)重考量讀者內(nèi)在需求,能更好地體現(xiàn)不同聚類讀者需求變化。
22 個大類圖書借閱量效度檢驗結(jié)果顯示KMO 值為0.850(SPSS 軟件的KMO 檢驗,KMO 值越接近于1,意味著變量間的相關(guān)性越強,原有變量越適合作因子分析),Bartlett 的球形檢驗大約卡方值為32 144.796,df 值為210,Sig值為0.000,適合作因子分析。df和Sig值反應(yīng)了是否適合做卡方分析,df值是最大值的平方與最小值的平方的差值,Sig值是相應(yīng)的概率,后面使用的Sig值均體現(xiàn)了相應(yīng)的概率,一般Sig值小于0.05 表示分析檢驗是有效的。
選取綜合決策因素成分矩陣圖中數(shù)值超過0.5 的圖書大類作為綜合決策因素的主要需求指標,并輔助考量借閱記錄中圖書題名,萃取了8 個綜合決策因素并命名如下。
3.1.1 因素1
語言表達因素成分矩陣圖中,I 類圖書指標值為0.775,H 類圖書指標值為0.637,K 類圖書指標值為0.558。分析讀者借閱的圖書題名,I 類圖書以中國文學為主包括部分經(jīng)典名著,可能主要滿足了讀者的休閑娛樂需求;H 類圖書以四六級考試為主,后面依次為托福、劍橋、雅思、考研等英語圖書,之后有部分日語圖書,說明讀者可能以完成學業(yè)目的為主,并可能有更高的層次需求;K 類圖書以人物傳記和旅游圖書為主。3 個圖書大類有其共同點,都是與提高語言表達能力有關(guān)的圖書,可能兼顧了讀者休閑娛樂的需求,因此萃取為語言表達因素。
3.1.2 因素2
財經(jīng)因素成分矩陣圖中,F(xiàn) 類圖書指標值為0.719,C 類圖書指標值為0.711。分析借閱圖書題名,F(xiàn) 類為經(jīng)濟類圖書,C 類主要借閱了管理類和組織類圖書。因為組織能力、管理能力和經(jīng)濟能力均為與財經(jīng)相關(guān)的能力,因此萃取為推測為財經(jīng)因素。
3.1.3 因素3
動植物養(yǎng)護因素成分矩陣圖中,Q 類圖書指標值為0.748,S 類圖書指標值為0.648;分析讀者借閱的圖書題名,Q 類和S 類主要借閱了植物栽培、植物養(yǎng)護、生態(tài)保護、動物養(yǎng)殖等圖書,故萃取為動植物養(yǎng)護因素。
3.1.4 因素4
設(shè)計修養(yǎng)因素成分矩陣圖中,J 類圖書指標值為0.687,T 類圖書指標值為0.685;分析讀者借閱的圖書題名,主要借閱了工程和藝術(shù)的交叉領(lǐng)域圖書,如工業(yè)設(shè)計、建筑設(shè)計等圖書,既包括了工業(yè)技術(shù)需求,又包括了設(shè)計需求,故萃取為設(shè)計修養(yǎng)因素。
3.1.5 因素5
環(huán)境學因素成分矩陣圖中,P 類圖書指標值為0.729,X類圖書指標值為0.693;從借閱圖書題名來看,大部分為地理、地貌、地球和測量圖書,故萃取為環(huán)境學因素。
3.1.6 因素6
興趣愛好因素成分矩陣圖中,E 類圖書指標值為0.704,Z 類圖書指標值為0.515;從借閱圖書題名來看,為軍事類和未解之謎圖書,在該校無相關(guān)專業(yè),故萃取為興趣愛好因素。
3.1.7 因素7
職業(yè)發(fā)展因素成分矩陣圖中,D 類圖書指標值為0.502;從借閱圖書題名來看,包括了法學、政治和公務(wù)員相關(guān)圖書,圖書的共同點凸顯了讀者對畢業(yè)去向的考量,故萃取為職業(yè)發(fā)展因素。
3.1.8 因素8
交通運輸因素成分矩陣圖中,U 類圖書指標值為0.902;從借閱圖書題名來看,主要包括了交通工程、汽車工程、橋梁工程等圖書,故萃取為交通運輸因素。
這8 個萃取的綜合決策因素即是讀者借閱圖書考量最多的8 個借閱內(nèi)在需求因素。
所謂聚類就是物以類聚,即將物理或抽象對象的集合分成相似的對象類的過程聚類的目的是將相似的事物分類歸為同一個簇,使同簇中的事物相對于某些變量來說是彼此相似的,而簇與簇之間卻是有顯著差異[7]。
集群分析并沒有根據(jù)事先明確定義的類別進行分類,讀者群是根據(jù)讀者的相似性形成集群,而集群的意義也是需要事后解讀結(jié)果才能得知的。對8 個萃取因素經(jīng)過類簇數(shù)從3到12 的二階聚類和K-均值聚類效果比對后,發(fā)現(xiàn)K值設(shè)定為8 的時候,輪廓值最大為0.798,聚類效果最佳。選擇K值為8 做K-均值聚類,結(jié)果如圖2 所示(這里的K值是指從n個樣本中隨機抽取k個,作為最初的類中心,數(shù)字沒有單位;一般經(jīng)過多次迭代,會找到最適合的類中心。一般用模塊值和輪廓值進行相應(yīng)聚類檢驗輪廓值是判斷聚類效果的一個函數(shù),值沒有單位)。
聚類后,需要從技術(shù)角度分析,主要綜合考慮聚類的群內(nèi)相似度、群間相似度及相對均勻程度判斷聚類分群效果的穩(wěn)定性和結(jié)果分布的合理性。該文采用了判別分析、單因子多變量變異數(shù)分析和單因子變異數(shù)分析3 種分析Sig值均為0.000,說明8 個聚類在0.05 水平上存在顯著性差異,說明了聚類結(jié)果的合理性。
通過聚類的變異數(shù)分析可得,Sig值均為0.000,說明8個類簇對影響因素考慮側(cè)重點有顯著不同,即說明萃取因素聚類的合理性和有效性。各類簇讀者中,認為影響因素均值≥60 為主要考慮因素,影響因素均值介于50~60 為次要因素。從圖2 的影響因素均值來看,類簇1 主要考慮的是因素4 和因素6;類簇2 主要考慮的是因素1;類簇3 主要考慮的是因素5、因素3 和因素1;類簇4 無主要考慮因素;類簇5 主要考慮的是因素7、因素8、因素3 和因素2;類簇6 主要考慮的是因素4 和因素1,類簇7 主要考慮的是因素3;類簇8 主要考慮的是因素2。
影響因素結(jié)果表明,讀者借閱借閱圖書考量的因素往往超過一個,是多因素綜合考量的結(jié)果。
以讀者借閱歷史數(shù)據(jù)為基礎(chǔ),利用聚類分析的方法對讀者群體進行細分,基于不同屬性依據(jù)進行聚類可以分別獲得基于不同角度的讀者類型群體。以讀者借閱圖書類型作為屬性依據(jù),聚類結(jié)果能夠清晰地揭示讀者群體的需求結(jié)構(gòu)[8]。聚類后,將聚類結(jié)果標記在讀者借閱信息上,統(tǒng)計8 個類簇讀者群的22 個大類借閱量和借閱人數(shù),計算生均借閱量并做雷達圖,結(jié)果如圖3 所示。
統(tǒng)計結(jié)果表明,8 個類簇均包括了所有專業(yè)的讀者,與專業(yè)統(tǒng)計分析結(jié)果對比,發(fā)現(xiàn)該聚類方式明顯優(yōu)于專業(yè)分析統(tǒng)計,更能體現(xiàn)出各個聚類的讀者差異。
從圖3 可以看出,8 個類簇均具有鮮明的特點,在借閱種類上體現(xiàn)了顯著差異。類簇1 借閱范圍最狹窄,僅大量借閱了T 類圖書;類簇2 中大量借閱了I 類和H 類圖書;類簇3 中O 類圖書借閱量最高;類簇4 圖形類似于類簇2,但其借閱總量低很多;類簇5 中D 類圖書借閱量最高;類簇6 中J 類圖書借閱量最高;類簇7 中S 類圖書借閱量最高,類簇8 中F 類圖書借閱量最高。共有的特征是I 類圖書均占有較高的比例,在各類簇圖書大類借閱量中均處于前五的位置,表明文學類圖書幾乎在所有讀者中受歡迎[9];在類簇2 中最受歡迎,而在類簇1 中受歡迎程度最低。
3.4.1 讀者群借閱共性需求
獲取每個類簇中的全部借閱圖書題名,題名數(shù)量多位于3 萬~11 萬。對題名進行特殊符號如“《》”、“—”等刪除處理后統(tǒng)計詞頻,取各個類簇中前100 的高頻詞分別形成詞云,結(jié)果如圖4 所示。
圖4 中可以發(fā)現(xiàn),8 個類簇中有一些共有詞云。
首先,字體最大的3 個高頻詞為“教程”、“英語”和“大學”,圖書類別統(tǒng)計結(jié)果表明讀者借閱最多的H 類語言類圖書為H3 常用外國語并在各個類簇類別排行榜中處于前五的位置,反映了各個類簇讀者都對常用外國語尤其是英語的需求。
其次,圖3 表明8 個類簇讀者借閱了大量I 類文學圖書,其中以I2 中國文學為最,在圖書類別統(tǒng)計表中均處于前五的顯要位置;在圖4 中未有顯著表現(xiàn),說明大學生對文學類圖書閱讀需求雖然較高,但對人文經(jīng)典的閱讀需求較低,未形成明顯的共性特征[10]。
再者,8 個類簇中均出現(xiàn)了較大地“設(shè)計”字樣,借閱了較多地J2 繪畫圖書,說明讀者對提高美術(shù)素養(yǎng)的需求。
最后,8 個類簇中均出現(xiàn)了較小地“傳記”字樣,借閱了較多地K8 人物傳記圖書和旅游類圖書,說明讀者開拓視野的需求。
3.4.2 讀者群借閱特性需求
除了上述4 種共同的需求,各個類簇讀者還表現(xiàn)出迥異于其他類簇的個性需求。
類簇1 詞頻最高的是“設(shè)計”,其次是“建筑”、“景觀”和“技術(shù)”。圖書類別統(tǒng)計結(jié)果表明借閱量排前三位的是TU建筑科學、TP 自動化技術(shù)、計算機技術(shù)和TS 輕工業(yè)、手工業(yè)、生活服務(wù)業(yè),體現(xiàn)了讀者對建筑、計算機科學和工業(yè)設(shè)計方面知識的需求。
類簇2“英語”詞頻最高,其次為“大學”、“詞匯”、“考試”、“教程”和“四級”。圖書類別統(tǒng)計結(jié)果表明借閱量排前三位的是中國文學、常用外國語和歐洲各國文學,說明讀者在詞匯記憶、考試等方面有強烈地需求,體現(xiàn)了文學尤其是外語的需求特征。
類簇3 詞頻最高的依次為“英語”、“大學”、“數(shù)學”、“教程”、“考研”和“習題”,讀者大量借閱了常用外國語、數(shù)學和中國文學圖書,體現(xiàn)了讀者對英語和數(shù)學的強烈需求。
類簇4 為借閱量非常低的讀者,各個專業(yè)各個年級的讀者均有,占讀者總數(shù)的一半以上,體現(xiàn)了對英語和美術(shù)等需求。
類簇5 詞頻最高的依次為“英語”、“考試”、“教程”、“大學”、“設(shè)計”、“案例”、“考研”、“司法考試”和“公務(wù)員”,圖書類別統(tǒng)計結(jié)果表明借閱量排前四位的是法律、中國文學、常用外國語和政治,體現(xiàn)了讀者對考研、司法考試、考取公務(wù)員等考試的強烈需求。
類簇6 詞頻最高的依次為“設(shè)計”、“英語”、“教程”、“藝術(shù)”、“大學”和“攝影”,讀者大量借閱了繪畫、中國文學、工藝美術(shù)和藝術(shù)理論圖書,體現(xiàn)了讀者對藝術(shù)學的強烈需求。
類簇7 中“設(shè)計”、“英語”和“技術(shù)”詞頻接近排在前列,其后為“植物”、“園林”、“教程”和“栽培”,讀者大量借閱了中國文學、園藝和古生物學,體現(xiàn)了植物栽培特征。
類簇8 兼具了類簇3 的考試特征和類簇5 的考研特征;又出現(xiàn)了獨有的“營銷”“經(jīng)濟學”等字樣,雖相對其他類簇獨有特征不夠顯著,但也說明了其獨有的經(jīng)濟學和管理學特征。
紙質(zhì)圖書借閱行為抽樣調(diào)查研究表明,隨著年級的增加,讀者的閱歷的變化,興趣愛好可能隨之遷移[10]?;诖?,該文研究讀者群隨年級增長發(fā)生的借閱需求不斷變化。
在借閱總體上,2015~2019 屆畢業(yè)生生均借閱結(jié)果顯示,隨著年級增長借閱量在持續(xù)走低,從大一的生均借閱量14.3冊下降到大二的13.0 冊再降到大三的12.0 冊最后降至大四的7.5 冊圖書。借閱種類各年級有所不同,大一借閱量最多地依次為I 類、T 類和H 類;大二借閱量最多地依次為I 類、T 類和J 類,其中I 類小說借閱量顯著下降,T 類和J 類等圖書顯著上升;大三與大二借閱量基本持平;大四各大類圖書借閱量均顯著下降。
具體到8 個類簇上,統(tǒng)計各個類簇讀者不同年級的生均借閱量。結(jié)果表明,每個類簇中22 個大類借閱量有變化,并且與總體借閱量變化有顯著差異。獲取每個類簇中不同年級借閱的全部圖書題名,對題名經(jīng)過處理后統(tǒng)計詞頻,并取排名前10 的高頻詞進行對比。兩者結(jié)合分析,能夠更加精準地分析出借閱需求隨著年級增長發(fā)生的變化。
類簇1 生均借閱量達到了20.4 冊,主要借閱了T 類、J類、I 類和H 類等4 個大類圖書。借閱圖書題名前十高頻詞來看,高頻詞由大一的設(shè)計初步到大二的室內(nèi)設(shè)計到大三的城市規(guī)劃反映出,學生對于園林建筑等工程類專業(yè)規(guī)劃設(shè)計專業(yè)知識逐漸加深的過程。
類簇2 生均借閱量僅為12.1 冊。主要借閱了I 類文學、H 類語言、K 類地理和B 類哲學圖書。借閱圖書題名前十高頻詞結(jié)果表明,英語、詞匯、教程和考試貫穿了全程;從詞匯變化來看,從四級到專業(yè)四級到考研再到雅思,體現(xiàn)了英語專業(yè)知識逐漸加深的過程。
類簇3 生均借閱量達到了22.4 冊。主要借閱了O 類數(shù)學、H 類語言、I 類文學、R 類醫(yī)藥、T 類工業(yè)技術(shù)和B 類哲學。借閱圖書題名前十高頻詞結(jié)果表明,數(shù)學、英語、習題貫穿全程;高頻詞結(jié)果表明,從大一的高等數(shù)學到大二的數(shù)理統(tǒng)計和概率論再到大三的高等數(shù)學,表明該類簇讀者對數(shù)學和英語的強烈需求。
類簇4 不活躍,讀者數(shù)占各專業(yè)讀者數(shù)的30%~60%,占讀者總數(shù)的52.02%。每學年生均借閱量僅4.3 冊,主要借閱了I 類圖書和T 類圖書,其中T 類圖書從大一到大三持續(xù)顯著增長,到大四有顯著下降。借閱圖書題名前十高頻詞結(jié)果表明,設(shè)計、英語、詞匯貫穿全程。該分析結(jié)果說明讀者對專業(yè)知識的需求逐漸增高。
類簇5 生均借閱量達到了20.9 冊。主要借閱了D 類政治法律、H 類語言、I 類文學、R 類醫(yī)藥、T 類工業(yè)技術(shù)和B類哲學圖書。借閱圖書題名前十高頻詞結(jié)果表明,英語和考試始終如一;其余的高頻詞變化較大,體現(xiàn)出該類簇讀者大一主要學習英語和數(shù)學,到大二學習刑法和民法,大三側(cè)重于司法考試、公務(wù)員考試和考研,大四則明顯偏重于公務(wù)員的申論考試。
類簇6 的活躍度最高,生均借閱量達到了27.8 冊圖書,但同時也是涉獵圖書種類最少的一個類簇。主要借閱了J 類藝術(shù)學、I 類文學、T 類工業(yè)技術(shù)、K 類歷史、H 類語言和B類哲學圖書。借閱圖書題名前十高頻詞結(jié)果表明,設(shè)計、教程貫穿全程;其余高頻詞從大一的色彩、平面素描到大二的創(chuàng)意、技法到大三的藝術(shù)創(chuàng)作,體現(xiàn)了藝術(shù)學專業(yè)知識逐漸增強的變化過程。
類簇7 生均借閱量達到了27.8 冊圖書,主要借閱了S 類農(nóng)業(yè)科學、I 類文學、Q 類生物科學、T 類工業(yè)技術(shù)和H 類語言圖書。借閱圖書題名前十高頻詞結(jié)果表明,植物、園林、設(shè)計、技術(shù)和英語貫穿全程;其余高頻詞從圖鑒到昆蟲到栽培搭配生物化學,體現(xiàn)了動植物專業(yè)知識需求的轉(zhuǎn)變過程。
類簇8 生均借閱量達到了16.3 冊圖書。主要借閱了F 類經(jīng)濟、I 類文學、H 類語言、B 類哲學和C 類社會科學圖書。借閱圖書題名前十高頻詞中,英語和教程貫穿全程;其余高頻詞從大一側(cè)重于英語和數(shù)學,到大二轉(zhuǎn)變?yōu)榻?jīng)濟學和會計學,大三的心理學和營銷,大四的營銷、SPSS,體現(xiàn)了經(jīng)濟學學習注重實踐的特點。
上述分析表明,各個類簇讀者總體上持續(xù)關(guān)注了教輔材料、文學和英語。除了類簇4,其他各個類簇的專業(yè)圖書借閱量均高于I 類圖書借閱量,意味著活躍人群更注重專業(yè)需求。結(jié)合各類簇圖書題名分析表明,隨著年級增加,專業(yè)相關(guān)圖書和畢業(yè)去向相關(guān)圖書總體上呈逐年上升趨勢,而其他大類圖書總體上呈現(xiàn)逐年下降的趨勢;并且專業(yè)圖書內(nèi)容逐漸深化。
任何專業(yè)的讀者均包括四類讀者群體,不活躍讀者、I類活躍讀者、專業(yè)活躍讀者和考研考公出國讀者。
與專業(yè)相關(guān)的圖書以及與畢業(yè)去向相關(guān)的圖書隨著年級增加其借閱比例呈上升的趨勢,表明讀者的借閱行為在總體上呈良性發(fā)展的趨勢。
讀者有4 個共性需求:1)專業(yè)習需求。2)文學需求。3)英語需求。4)繪畫需求。
數(shù)據(jù)采集僅以農(nóng)林院校為例,但張恒[11]的圖書借閱排行榜表明,雖然不同高校各個類簇的讀者的比例也不同,但讀者群體的屬性基本一致。從這一點來說,該文的研究結(jié)論適用于我國大部分雙一流高校、部屬高校和省屬高校。