朱晴
摘 ?要: 為提升高校教學管理的水平與效率,設計融合關聯(lián)規(guī)則挖掘算法的信息化教學管理系統(tǒng)。該系統(tǒng)的關鍵組成部分為客戶端、服務器和數(shù)據(jù)庫,客戶端和服務器分別負責面向用戶的交互功能呈現(xiàn)和系統(tǒng)應用程序的邏輯運行,系統(tǒng)通過創(chuàng)建涵蓋教學管理不同方面數(shù)據(jù)的數(shù)據(jù)庫體系,采用改進關聯(lián)規(guī)則挖掘算法,從系統(tǒng)數(shù)據(jù)庫內挖掘用戶各方面教育信息關聯(lián)數(shù)據(jù),并通過客戶端主界面為用戶提供教學、選課、課程等服務。以某高校信息平臺為例測試該系統(tǒng)性能,結果表明,該系統(tǒng)能夠實現(xiàn)課程查詢功能,客戶端兼容性較好,能夠應用于各類瀏覽器及操作系統(tǒng)內,應用性較強,且具有良好的數(shù)據(jù)挖掘性能。
關鍵詞: 教學管理; 關聯(lián)規(guī)則; 挖掘算法; 數(shù)據(jù)挖掘; 數(shù)據(jù)庫管理; 課程查詢
中圖分類號: TN02?34; G434 ? ? ? ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)23?0159?05
Abstract: In order to improve the level and efficiency of teaching management in colleges and universities, an information?based teaching management system integrating the association rule mining algorithm is designed. The key components of the system are client?side, server and database. The client?side and server are respectively responsible for the presentation of user oriented interactive functions and the logical operation of system application program. The improved association rule mining algorithm is used in the system to mine the association data in each aspect of user′s education information from the system database by creating a database system covering the data in different aspects of teaching management, and provide users with services such as teaching, course selection and courses in the main interface of client?side. The performance of the system is tested by taking a university information platform as an example. The results show that the system can achieve the function of course query, its client?side compatibility is good, it can be used in various browsers and operating systems, and it has strong applicability and good data mining performance.
Keywords: teaching management; association rule; mining algorithm; data mining; database management; course query
0 ?引 ?言
當前各高校管理中的重點即為教學管理,有效的教學管理不但需要管理人員設定良好的管理制度,而且應具備理想的信息管理系統(tǒng)[1]。由于各高校的管理方式與教學模式各不相同,因而各高校所應用的教學管理系統(tǒng)也有區(qū)別,各高校的日常教學管理中,教師信息、學生信息、課程信息及成績信息等數(shù)據(jù)信息對于教學管理人員來說較為繁瑣,但若通過教學管理系統(tǒng)依據(jù)各自的管理特點將此類信息數(shù)據(jù)與不同管理方向相結合,便可有效地降低管理人員的壓力,同時將教學管理系統(tǒng)的效果最大程度地發(fā)揮出來[2?4]。作為當前一種新穎的教學管理方式的信息化教學管理被逐漸引入高校管理中[5],能夠從根本上簡化管理人員的工作內容,因而設計信息化教學管理系統(tǒng)成為各高校管理的重中之重。
數(shù)據(jù)挖掘(Data Mining)是指由數(shù)據(jù)庫內將感興趣的知識提取出來,關聯(lián)規(guī)則挖掘為數(shù)據(jù)挖掘領域內的研究重點[6?7]。關聯(lián)規(guī)則是指數(shù)據(jù)庫內某組對象間某種聯(lián)系的規(guī)則,其挖掘對象通常為事務數(shù)據(jù)庫[8]。由于高校的教學管理中會持續(xù)累積大量的歷史數(shù)據(jù),其中包括很多有價值的信息,將關聯(lián)規(guī)則數(shù)據(jù)挖掘應用在高校的信息化教學管理中,能夠分析并挖掘出教學管理中的有用信息,為高校教學管理人員實現(xiàn)科學有效地管理提供幫助[9]。
基于以上分析,本文設計融合關聯(lián)規(guī)則挖掘算法的信息化教學管理系統(tǒng),可提升高校教學管理效率與管理水平,為實現(xiàn)科學全面地管理高校教學奠定基礎。
1 ?融合關聯(lián)規(guī)則挖掘算法的信息化教學管理系統(tǒng)
1.1 ?系統(tǒng)設計
1.1.1 ?系統(tǒng)總體結構設計
通過客戶端、服務器、數(shù)據(jù)庫三個關鍵部分共同組成信息化教學管理系統(tǒng),其結構如圖1所示。其中,向用戶提供呈現(xiàn)與交互功能的為客戶端的核心功能[10],完成應用程序的邏輯運行則通過服務器核心功能實現(xiàn)??蛻舳嗽诖讼到y(tǒng)內應用C/S結構模式,重點針對當下普遍使用的智能手機移動終端;服務器在系統(tǒng)內可應用B/S與C/S兩種結構模式,并且通信協(xié)議能夠兼容HTTP與SOCKET。分析圖1可得,在分層原理的基礎上開發(fā)信息化教學管理系統(tǒng),系統(tǒng)數(shù)據(jù)庫采用關系型在線處理分析(ROLAP)方法儲存全部數(shù)據(jù),利用融合關聯(lián)規(guī)則挖掘算法有效挖掘數(shù)據(jù)后,通過客戶端的主界面呈現(xiàn)系統(tǒng)信息化管理各項功能,如成績管理、課程管理、選課管理等,并在系統(tǒng)網(wǎng)絡內通過防火墻等方式提升系統(tǒng)及數(shù)據(jù)信息的安全性。
1.1.2 ?系統(tǒng)數(shù)據(jù)庫設計
采用SQL Server 2009軟件設計系統(tǒng)數(shù)據(jù)庫。數(shù)據(jù)庫中包含學生表、教師表、學習調查表、課程表等,完全涵蓋教學管理中不同方面的數(shù)據(jù)。數(shù)據(jù)庫中的數(shù)據(jù)模型如圖2所示。
基于數(shù)據(jù)模型圖中的數(shù)據(jù),創(chuàng)建系統(tǒng)數(shù)據(jù)庫,為簡化數(shù)據(jù)挖掘流程并提升挖掘效率,設計系統(tǒng)數(shù)據(jù)庫體系架構,如圖3所示。具體過程描述為:通過數(shù)據(jù)抽取、轉換及裝載等過程將數(shù)據(jù)源放入數(shù)據(jù)集內,整合數(shù)據(jù)集之后生成數(shù)據(jù)庫,同時通過ROLAP方法儲存數(shù)據(jù);當用戶登錄系統(tǒng)后,可通過數(shù)據(jù)挖掘及查詢等工具實現(xiàn)對數(shù)據(jù)庫的訪問,同時能夠管理、維護數(shù)據(jù)庫數(shù)據(jù);將經(jīng)由數(shù)據(jù)挖掘后獲取的知識通過客戶端的主界面向用戶呈現(xiàn)。
1.2 ?關聯(lián)規(guī)則挖掘算法應用
1.2.1 ?數(shù)據(jù)挖掘過程設計
數(shù)據(jù)挖掘過程為:將需要挖掘的數(shù)據(jù)類型進行確準,對數(shù)據(jù)庫中的數(shù)據(jù)實行轉換、清洗等預處理,依據(jù)確準的數(shù)據(jù)類型通過關聯(lián)規(guī)則挖掘算法實行數(shù)據(jù)挖掘,完成挖掘之后,分析評估挖掘結果,經(jīng)由客戶端向用戶展現(xiàn)。系統(tǒng)的數(shù)據(jù)挖掘詳細過程如圖4所示。
1.2.2 ?關聯(lián)規(guī)則挖掘算法設計
1) 關聯(lián)規(guī)則挖掘算法
通??蓪㈥P聯(lián)規(guī)則挖掘算法Apriori的根本思想分為兩個子問題:
① 頻繁項目集的發(fā)現(xiàn)[11]。依據(jù)用戶所給定的最小支持度(minsupport)對全部大于等于最小支持度的頻繁項目集(Frequent Itemset)予以找尋,所找尋的頻繁項目集或許存在包含關系,通常情況下僅對不包含在其余頻繁項目集內的頻繁大項集(Frequent Large Itemset)的集合予以找尋,此類頻繁大項集即為生成關聯(lián)規(guī)則的根本。
② 關聯(lián)規(guī)則的生成[12]。以用戶給定的最小可信度(minconfidence)為依據(jù),由各最大頻繁項目集內將可信度(confidence)大于等于最小可信度的關聯(lián)規(guī)則找尋到。
2) Apriori算法核心
為實現(xiàn)全部頻繁集的生成,Apriori算法運用遞推的方式,具體如下:
[K1=]{large 1?itemsets}
For([l]=2;[Kl-1≠μ];[l]++) do begin
[Al=]apriori?gen([Kl-1]) //新候選集
For all transactions [t][JB] do begin
[At=]subset[(Al,t)] //事務[t]內所含候選集
For all candidates c[J] [At] do
c.count++
End
[Kl]={c[J][Al]c.count3minsup}
End
Reply =[l?Kl]
頻繁第一項集[K1]與頻繁第二項集[K2]相繼生成,直至出現(xiàn)某個[u]值令[Ku]為空,算法終止。在第[l]次循環(huán)中,將候選[l]項集的集合[Al]生成,[Al]內各項集的作用是生成頻集的候選集,各項集的生成是通過([l-2])連接僅存在一個不同項的[Kl-1]頻集完成的,最終生成的頻集[Kl]一定為[Al]的某個子集。需在數(shù)據(jù)庫內驗證[Al]內的各個元素,確定各元素能否向[Kl]內加入,驗證時需數(shù)次對數(shù)據(jù)庫實行掃描,若頻集內最多有12項,則應對數(shù)據(jù)庫實行12次掃描,需較大的I/O負載,且數(shù)次循環(huán)將生產(chǎn)大量候選集,為此造成驗證時仍需多次掃描數(shù)據(jù)庫。故Apriori算法的缺點即為候選集生成量過大且反復多次掃描數(shù)據(jù)庫導致掃描時間過長,此為Apriori算法的瓶頸。
3) Apriori算法改進
為改進Apriori算法,提升算法的效率,將修剪技術加入算法中,降低候選集[Al]量的大小。修剪技術向算法內加入所依據(jù)的性質為:某個項集屬于頻集并且其全部子集均為頻集[13],若[Al]內某個候選項集存在一個([l-1])子集不屬于頻集([Kl-1]),可將此候選項集修剪掉,此方法能夠將運算全部候選集的支持度代價降低。
1.2.3 ?改進Apriori算法在系統(tǒng)中的應用
依據(jù)改進Apriori算法獲得在約束基礎上的關聯(lián)規(guī)則。
定義1:設[n]個不同項目的集合為[J=j1,j2,…,jn],針對[J]的管理集合為[B],每一次管理包括數(shù)個項目[j1,j2,…,jl],關聯(lián)規(guī)則可表示成:
將以上關聯(lián)規(guī)則挖掘算法應用于信息化教學管理系統(tǒng)中,能夠挖掘出用戶各方面的教育信息,以挖掘的關聯(lián)信息為依據(jù)進行相應的管理[14],提升系統(tǒng)的管理性能。
1.3 ?查詢課程實現(xiàn)
課程查詢主要包含選課信息查詢及課程成績查詢。由教學管理人員設置開設的課程,學生進行網(wǎng)絡選課,教師能夠隨時查看不同選課的學生名單,并在課程結束之后將課程成績錄入到系統(tǒng)內,學生可隨時通過系統(tǒng)查看自身課程成績。期間教學管理人員不僅能夠查看教師的信息,而且能夠查看與統(tǒng)計學生的成績信息,教學管理人員通過系統(tǒng)實現(xiàn)對所開設課程的管理[15]。課程查詢過程圖如圖5所示。用戶輸入“課程查詢”關鍵字之后,點擊開始查詢即可進入課程查詢選擇頁面,選取選課信息或成績查詢后,點擊開始,若系統(tǒng)內有相關信息,查詢到結果后可退出,若用戶想繼續(xù)查詢其他信息,可點擊返回查詢,重新回到輸入頁面;若無相關信息則自動跳轉到初始輸入頁面。
2 ?系統(tǒng)性能測試
以某高校為例,將本文系統(tǒng)應用于此高校的信息平臺中,通過檢驗本文系統(tǒng)在此平臺運行時的課程查詢功能、兼容性及數(shù)據(jù)挖掘各方面性能,測試本文系統(tǒng)的總體性能。本文系統(tǒng)的運行環(huán)境為:酷睿i5 CPU,1 TB硬盤容量、8 GB內存、華為USG6330防火墻、Windows 8操作系統(tǒng)及谷歌瀏覽器。
2.1 ?系統(tǒng)功能測試
從實驗高校某班級中隨機挑選出一名學生,采用本文系統(tǒng)對其課程成績進行查詢,測試查詢過程中本文系統(tǒng)的查詢課程功能。學生進入課程成績查詢界面后,界面顯示如圖6所示。由圖6中的課程成績查詢界面可看出,本文系統(tǒng)能夠實現(xiàn)課程查詢功能,且界面顯示清晰。
2.2 ?系統(tǒng)兼容性測試
對本文系統(tǒng)客戶端實行兼容性測試,測試中對各種瀏覽器與操作系統(tǒng)環(huán)境下程序能否正常運行實行檢測,測試中主要針對當前比較常用的谷歌瀏覽器、IE瀏覽器、360瀏覽器及火狐瀏覽器等實行測試,操作系統(tǒng)為Windows 8和Windows XP操作系統(tǒng)。以兩臺電腦分別安裝兩種操作系統(tǒng)、兩種瀏覽器實行本文系統(tǒng)的兼容性測試。
從實驗高校的某班級中隨機挑選一名學生和一名教師分別對兩臺電腦實行操作,操作內容為:輸入個人驗證信息登錄本文系統(tǒng)后,進入到各自所需的信息查詢頁面,查詢個人成績與選課名單,然后退出登錄。對整個操作過程中本文系統(tǒng)能否按不同用戶需求正常運行進行記錄,記錄結果如表1所示。
通過表1可看出,本文系統(tǒng)僅在應用IE瀏覽器時查詢信息的文本顯示格式略有誤差,但數(shù)據(jù)準確且運行正常,不影響日常使用,其余瀏覽器下應用均正常,且數(shù)據(jù)準確,由此說明,本文系統(tǒng)能夠實現(xiàn)在不同瀏覽器下正常運行,系統(tǒng)客戶端具備較好的兼容性,能夠應用于各類瀏覽器及操作系統(tǒng)內,應用性較強。
2.3 ?系統(tǒng)數(shù)據(jù)挖掘性能分析
為檢驗本文系統(tǒng)數(shù)據(jù)挖掘的性能,從實驗平臺中隨機抽選21 000條數(shù)據(jù),通過本文系統(tǒng)對所抽選數(shù)據(jù)實行課程信息、教師信息、檔案信息及成績信息等關聯(lián)規(guī)則數(shù)據(jù)挖掘,檢驗所挖掘結果的漏檢與誤檢情況,分析本文系統(tǒng)的數(shù)據(jù)挖掘性能,檢驗結果如表2所示。
通過分析表2中數(shù)據(jù)可知,本文系統(tǒng)在對實驗平臺中的關聯(lián)規(guī)則數(shù)據(jù)實行挖掘時,對小于12 000條數(shù)據(jù)的關聯(lián)規(guī)則數(shù)據(jù)挖掘精準度更高,未出現(xiàn)漏檢與誤檢的情況,隨著數(shù)據(jù)量總數(shù)的增加,漏檢率與誤檢率略有上升, 但上升趨勢不明顯,說明,本文系統(tǒng)整體數(shù)據(jù)挖掘性能良好,能夠實現(xiàn)關聯(lián)規(guī)則數(shù)據(jù)的有效挖掘。
3 ?結 ?論
本文設計一種融合關聯(lián)規(guī)則挖掘算法的信息化教學管理系統(tǒng),關聯(lián)規(guī)則挖掘算法可實現(xiàn)從海量數(shù)據(jù)中通過某種關聯(lián)規(guī)則挖掘所需信息的目的,通過此方法挖掘的信息為高校實行信息化教學管理提供了科學有效的依據(jù),本文通過此方法從數(shù)據(jù)庫中挖掘實施教學管理的所需信息,實現(xiàn)信息化教學管理,并通過實驗驗證本文系統(tǒng)的查詢課程功能、客戶端兼容性及數(shù)據(jù)挖掘各方面優(yōu)越性能,未來的研究中將繼續(xù)檢驗本文系統(tǒng)的運行性能及其他功能性能,驗證本文系統(tǒng)的實際應用性,擴大本文系統(tǒng)的應用范圍。
參考文獻
[1] 常凱,趙艷莉,黃文峰.“新常態(tài)”下的研究生教育管理信息化系統(tǒng)設計:以福州大學為例[J].中國遠程教育(綜合版),2017(1):71?76.
[2] 余舒萍,熊越強.基于OpenKM的高校校院二級教學檔案管理系統(tǒng)的設計與應用[J].山西檔案,2017(6):78?80.
[3] 黃波,朱昌平,黃健元,等.基于用戶視角的教學管理信息化建設績效評價:以教學管理信息系統(tǒng)建設為例[J].中國電化教育,2018(9):69?74.
[4] 張寶君,邢西深,楊辰,等.邁向2.0時代的天津市基礎教育信息化調查研究[J].中國電化教育,2019(7):127?133.
[5] 李尚濱,王德才.基于網(wǎng)絡平臺的高校體育教師評教系統(tǒng)設計與實現(xiàn)[J].繼續(xù)教育研究,2017(10):81?83.
[6] 張曉楓,郭芳,王利軍,等.基于關聯(lián)規(guī)則挖掘算法的審計綜合管理系統(tǒng)研究[J].電網(wǎng)與清潔能源,2017,33(12):48?51.
[7] 李濤,郁美辰,陸正邦,等.基于關聯(lián)規(guī)則挖掘的氣象觀測設備一致性檢測算法[J].電子測量與儀器學報,2017,31(10):1568?1573.
[8] 劉亞男.一生一檔·對癥施策:基于大數(shù)據(jù)挖掘的區(qū)域教學改進[J].中小學管理,2019(2):30?33.
[9] 張琳,李小平,來林靜,等.基于游戲教學的分層數(shù)據(jù)挖掘方法研究與應用[J].中國電化教育,2019(2):87?94.
[10] 劉軍煜,賈修一.一種利用關聯(lián)規(guī)則挖掘的多標記分類算法[J].軟件學報,2017,28(11):2865?2878.
[11] 王玲,李樹林,徐培培,等.基于頻繁項集樹的時態(tài)關聯(lián)規(guī)則挖掘算法[J].控制與決策,2018,33(4):591?599.
[12] 劉莉萍,章新友,牛曉錄,等.基于Spark的并行關聯(lián)規(guī)則挖掘算法研究綜述[J].計算機工程與應用,2019,55(9):1?9.
[13] 黃文成,賈立,彭道剛,等.基于Apriori的關聯(lián)規(guī)則算法及其在電廠中的應用[J].系統(tǒng)仿真學報,2018,30(1):266?271.
[14] 侯燕,劉辛.基于主從架構和GA的模糊關聯(lián)規(guī)則挖掘算法[J].控制工程,2017,24(2):276?282.
[15] 胡玉寧,丁明,伊鵬.基于數(shù)據(jù)挖掘的大學生虛擬社群社會網(wǎng)絡分析[J].中國成人教育,2017(8):64?68.