吳旭東 陳正軍 馮璐遠(yuǎn) 李映曦
摘要:該文通過與學(xué)校網(wǎng)絡(luò)中心及教務(wù)處聯(lián)系,對(duì)學(xué)校圖書館數(shù)據(jù)庫與教務(wù)管理系統(tǒng)數(shù)據(jù)庫進(jìn)行對(duì)接。利用數(shù)據(jù)挖掘的常用算法BP神經(jīng)網(wǎng)絡(luò)算法,抽取圖書館數(shù)據(jù)庫中學(xué)生的借閱數(shù)據(jù)和教務(wù)管理數(shù)據(jù)庫中學(xué)生成績(jī)數(shù)據(jù)進(jìn)行分析。對(duì)學(xué)院陶瓷藝術(shù)設(shè)計(jì)專業(yè)400多名學(xué)生,在校期間20多門主干課程的成績(jī)與圖書借閱相結(jié)合,利用BP神經(jīng)網(wǎng)絡(luò)算法找出陶瓷藝術(shù)設(shè)計(jì)專業(yè)學(xué)生在校期間圖書借閱行為和學(xué)習(xí)成績(jī)之間的關(guān)系,并建立了學(xué)習(xí)預(yù)警機(jī)制,進(jìn)而為提高圖書館的讀者服務(wù)、學(xué)生的學(xué)習(xí)效果、學(xué)校的教學(xué)管理,提供一些參考性的建議。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);圖書借閱;學(xué)生成績(jī);預(yù)警機(jī)制
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)36-0157-02
1 實(shí)驗(yàn)數(shù)據(jù)
通過對(duì)原數(shù)據(jù)庫的分析,該數(shù)據(jù)庫不能直接運(yùn)用SPSS Clementine進(jìn)行挖掘。對(duì)圖書館的數(shù)據(jù)庫中的數(shù)據(jù)和教務(wù)管理系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行聯(lián)合操作,用SQL語言對(duì)讀者信息表、文獻(xiàn)信息表、條碼表、流通信息表、學(xué)生成績(jī)表進(jìn)行操作。如圖1通過SQL查詢分析器查詢所需要的記錄,為分析圖書館中圖書的借閱情況、學(xué)生成績(jī)情況,運(yùn)用數(shù)據(jù)庫的視圖功能建立虛擬表。
通過分析,發(fā)現(xiàn)數(shù)據(jù)庫視圖表中還存在一些問題,如果這些數(shù)據(jù)直接用于數(shù)據(jù)挖掘?qū)?duì)結(jié)果產(chǎn)生較大的影響。記錄中存在讀者借閱圖書重復(fù)的信息,某條記錄存在字段信息不全。鑒于以上問題,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以保證信息的準(zhǔn)確性,刪除重復(fù)、信息不全的記錄,如表1所示為學(xué)生成績(jī)的圖書館借閱表的部分信息。
2 神經(jīng)網(wǎng)絡(luò)算法
神經(jīng)網(wǎng)絡(luò)的全稱Artificial Neural Network,簡(jiǎn)稱ANN。神經(jīng)網(wǎng)絡(luò)系統(tǒng)是在1943年心理學(xué)家McCulloch和數(shù)學(xué)家Pitts提出的神經(jīng)元生物學(xué)模型(簡(jiǎn)稱M-P模型),已經(jīng)有70多年的歷史了。神經(jīng)網(wǎng)絡(luò)是由大量的處理單元(神經(jīng)元)互相連接而成的網(wǎng)絡(luò)。為了模擬大腦的基本特性,在神經(jīng)科學(xué)研究的基礎(chǔ)上,提出了神經(jīng)網(wǎng)絡(luò)的模型。根據(jù)連接方式不同,神經(jīng)網(wǎng)絡(luò)的神經(jīng)元之間的連接有前向網(wǎng)絡(luò)、有反饋的前向網(wǎng)絡(luò)、層內(nèi)有互相結(jié)合的前向網(wǎng)絡(luò)、相互結(jié)合型網(wǎng)絡(luò)幾種形式。BP網(wǎng)絡(luò)是一種單向傳播的多層前向網(wǎng)絡(luò), BP網(wǎng)絡(luò)具有三層或三層以上的神經(jīng)網(wǎng)絡(luò),包括輸入層、中間層(隱含層)和輸出層。上下層之間實(shí)現(xiàn)全連接,每層神經(jīng)元之間無連接。當(dāng)一對(duì)學(xué)習(xí)樣本提供給網(wǎng)絡(luò)后,神經(jīng)元的刺激活值從輸入層經(jīng)各隱含層向輸出層傳播,在輸出層的各神經(jīng)元獲得網(wǎng)絡(luò)的輸入響應(yīng)。接下來,按照減少目標(biāo)輸出與實(shí)際誤差的方向,從輸出層經(jīng)過各中間層逐層修正各連接權(quán)值,最后回到輸入層,這種算法稱為“誤差逆向傳播算法”。所以,BP算法是隨著這種誤差逆的傳播修正不斷進(jìn)行,網(wǎng)絡(luò)對(duì)輸入模式響應(yīng)的正確率不斷上升。
3 實(shí)驗(yàn)過程
通過上述兩個(gè)算法分析,充分說明成績(jī)等級(jí)與圖書借閱行為高度相關(guān)。那么我們可以根據(jù)學(xué)習(xí)成績(jī)和借閱量建立一個(gè)學(xué)習(xí)預(yù)警機(jī)制,如果學(xué)生的學(xué)習(xí)成績(jī)較好,而他在圖書館的借閱量又非常低,那么自動(dòng)觸發(fā)預(yù)警機(jī)制。對(duì)此類學(xué)生進(jìn)行詳細(xì)查詢,圖書借閱量,專業(yè)課書籍借閱量數(shù)據(jù),平時(shí)課堂表現(xiàn),課后自學(xué)情況等分析,此類學(xué)生成績(jī)是否真實(shí)等。
利用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建模型,對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行挖掘,對(duì)數(shù)據(jù)源的各個(gè)字段類型進(jìn)行合適的設(shè)置??紤]到學(xué)生專業(yè)學(xué)習(xí)成績(jī)和圖書借閱量有一定的聯(lián)系,那么可以通過學(xué)生的學(xué)習(xí)成績(jī)來預(yù)測(cè)圖書的借閱量。把陶瓷設(shè)計(jì)專業(yè)的學(xué)生的18門課程:設(shè)計(jì)素描、設(shè)計(jì)色彩、裝飾設(shè)計(jì)基礎(chǔ)、國畫山水、陶瓷產(chǎn)品造型設(shè)計(jì)與制作1、花鳥人物、設(shè)計(jì)美學(xué)、書法、裝飾雕塑、貼花紙?jiān)O(shè)計(jì)制作、陶瓷彩繪裝飾等課程成績(jī)作為輸入項(xiàng),借閱量作為輸出量。如圖2、圖3所示。
訓(xùn)練樣本共349人,本學(xué)年陶瓷專業(yè)所有課程成績(jī)作為輸入層,共計(jì)18個(gè)神經(jīng)元,隱藏層有3個(gè)神經(jīng)元,輸出層有1個(gè)神經(jīng)元。建立BP神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)人數(shù)為88人,假設(shè)他們的借閱量是未知的,預(yù)測(cè)結(jié)果如圖4,準(zhǔn)確率為90.479%。其中紅色折線為未知預(yù)測(cè)借閱量,藍(lán)色為實(shí)際借閱量,預(yù)測(cè)的相對(duì)誤差平均值為1.88%,準(zhǔn)確率非常高。
利用神經(jīng)網(wǎng)絡(luò)建立學(xué)生學(xué)習(xí)成績(jī)與圖書借閱行為預(yù)警機(jī)制。如圖5所示,輸入課程成績(jī),利用建立好的網(wǎng)絡(luò)模型預(yù)測(cè)學(xué)生借閱量,如果預(yù)測(cè)值與真實(shí)借閱量的差值在10以內(nèi)則說明正常,如果差值超過10,則開始預(yù)警,表示學(xué)生的學(xué)習(xí)成績(jī)與通常情況下圖書借閱量不符。認(rèn)真分析查找原因,首先查詢學(xué)生的詳細(xì)借閱記錄,看是否借閱過多非專業(yè)圖書而分散學(xué)習(xí)精力;其次,與學(xué)工處及輔導(dǎo)員聯(lián)動(dòng)查看該學(xué)生平時(shí)學(xué)習(xí)表現(xiàn),或者是否參加課外補(bǔ)習(xí)和其他兼職活動(dòng)等,可以與輔導(dǎo)員或者學(xué)生本人進(jìn)行溝通,找出原因,提醒學(xué)生學(xué)習(xí)的方式方法,為學(xué)生更好而全面發(fā)展出謀劃策??傊?,預(yù)警機(jī)制的建立為圖書館與學(xué)生學(xué)習(xí)效果之間建立了一座橋梁,為豐富學(xué)生的第二課堂產(chǎn)生了積極的影響。
4 結(jié)論
本文從圖書館數(shù)據(jù)庫中的借閱行為記錄出發(fā),與教務(wù)處學(xué)生成績(jī)數(shù)據(jù)相結(jié)合,通過建立一些典型的模型來證明圖書借閱行為與成績(jī)等級(jí)高度相關(guān),并得出了一些有趣的結(jié)論。利用神經(jīng)網(wǎng)絡(luò)BP算法建立訓(xùn)練樣本349人,預(yù)測(cè)人數(shù)為88人,準(zhǔn)確率為90.479%,預(yù)測(cè)的相對(duì)誤差平均值為1.88%,準(zhǔn)確率較高。通過課程成績(jī)來較準(zhǔn)確的預(yù)測(cè)學(xué)生的圖書借閱量,并在此基礎(chǔ)上建立了學(xué)習(xí)預(yù)警機(jī)制,提醒學(xué)生尤其是學(xué)習(xí)成績(jī)偏低的學(xué)生在學(xué)習(xí)過程中注意學(xué)習(xí)方式、方法。
參考文獻(xiàn):
[1] Hu Peng,Song Xiaoquan.On PSO based BP neural network[C]//2nd International Conference on Precision Mechanical Instruments and Measurement Technology,Chongqing,China,2014:2413-2416.
[2] Liu Guiling,Gao Feng.PSO-BP combined artificial neural network method research[C]//3rd International Conference on Civil Engineering,Architecture and Building Materials,Jinan,China,2013:3537-3540.
[3] Wang H S,Wang Y N,Wang Y C. Cost Estimation of Plastic Injection Molding Partsthrough Integration of PSO and BP Neural Network[J].Expert Systems with Applications,2013,40(8):418-428.
[4] 楊新涯,袁輝,等.高校學(xué)生成績(jī)與借閱行為關(guān)系的初步研究——以重慶大學(xué)為例[J].數(shù)字圖書館論壇,2013(9).
[5] 藍(lán)石.社會(huì)科學(xué)定量研究的變量類型、方法選擇及范例解析[M].重慶大學(xué)出版社,2011.
[6] 黃斯達(dá).基于圖書館借書信息的學(xué)生成績(jī)挖掘模型研究[J].現(xiàn)代計(jì)算機(jī),2008(10).
[7] 唐海萍.基于數(shù)據(jù)挖掘技術(shù)在圖書館管理模式[J].現(xiàn)代情報(bào),2008(9):109-110
[8] 于徽.數(shù)據(jù)挖掘技術(shù)及其在圖書館的應(yīng)用[J].黑龍江科技信息,2008(9):97-98
[9] 臧衛(wèi)華.數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用研究[J].現(xiàn)代情報(bào),2008(3):38-39.