方林 于燕平
關(guān)鍵詞:數(shù)據(jù)挖掘;Apriori算法;專業(yè)設(shè)置;關(guān)聯(lián)性分析
1引言
隨著“互聯(lián)網(wǎng)+”時(shí)代的到來,各行各業(yè)高速積累的數(shù)據(jù)流填滿了每個(gè)社會(huì)參與者的時(shí)空環(huán)境,挖掘海量數(shù)據(jù)中的有用信息是各行各業(yè)研究者孜孜不倦的追求目標(biāo)。本文利用Apriori算法對(duì)鐵道供電技術(shù)專業(yè)學(xué)生往年的成績(jī)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,找出各課程之間的關(guān)聯(lián)性,為科學(xué)規(guī)劃和設(shè)置專業(yè)課程體系提供參考依據(jù)。
2研究背景
鐵道供電技術(shù)專業(yè)旨在培養(yǎng)從事電氣化鐵道供電系統(tǒng)及其設(shè)備的運(yùn)行、檢修、維護(hù)與施工等的高素質(zhì)技術(shù)技能型人才。開設(shè)公共基礎(chǔ)課、專業(yè)基礎(chǔ)課、專業(yè)核心課、專業(yè)主干課、專業(yè)限選課等5類課程,其中專業(yè)核心課是鐵道供電技術(shù)專業(yè)課程體系中最核心、最重要的課程,專業(yè)基礎(chǔ)課是為專業(yè)學(xué)習(xí)奠定必要基礎(chǔ)的課程。即便近年來專業(yè)課學(xué)時(shí)一再地縮減,這兩類課程的學(xué)時(shí)也維持不變或少量增長(zhǎng),由此也說明專業(yè)基礎(chǔ)課和專業(yè)核心課在專業(yè)人才培養(yǎng)中的重要性。
專業(yè)課程設(shè)置遵循專業(yè)建設(shè)指導(dǎo)委員會(huì)的意見和建議,但在課程落實(shí)到具體專業(yè)后,各專業(yè)也會(huì)根據(jù)本專業(yè)師資、實(shí)驗(yàn)實(shí)訓(xùn)條件等適當(dāng)調(diào)整課程學(xué)時(shí)、學(xué)分等,而調(diào)整的依據(jù)一般僅依靠本專業(yè)教師的經(jīng)驗(yàn),缺乏科學(xué)依據(jù)。本文的研究目的是通過對(duì)鐵道供電技術(shù)專業(yè)的基礎(chǔ)課程和專業(yè)核心課程成績(jī)的數(shù)據(jù)挖掘,發(fā)掘出專業(yè)核心課與專業(yè)基礎(chǔ)課潛在的關(guān)聯(lián)性,為課程建設(shè)、專業(yè)人才培養(yǎng)方案的制定等提供更科學(xué)的決策依據(jù)。
3Apriori算法
Apriori算法是挖掘產(chǎn)生布爾關(guān)聯(lián)規(guī)則所需頻繁項(xiàng)集的基本算法。該算法利用了一個(gè)層次順序搜索的循環(huán)方法來完成頻繁項(xiàng)集的挖掘工作。這一循環(huán)方法就是利用k項(xiàng)集來產(chǎn)生k+1-項(xiàng)集,即首先找出頻繁1項(xiàng)集,記為L(zhǎng)i;然后利用Li來挖掘L2,即頻繁2一項(xiàng)集;不斷如此循環(huán),直到無法發(fā)現(xiàn)更多的頻繁項(xiàng)集為止。挖掘出所有的頻繁項(xiàng)集后,產(chǎn)生滿足最小支持度和最小信任度的強(qiáng)關(guān)聯(lián)規(guī)則。
Apriori算法可分為兩個(gè)步驟:(1)通過迭代,檢索出數(shù)據(jù)庫(kù)中的所有頻繁項(xiàng)集,即支持度不低于用戶設(shè)定的閾值的項(xiàng)集;(2)利用頻繁項(xiàng)集構(gòu)造出滿足用戶最小信任度的規(guī)則。
4基于Apriori算法的課程關(guān)聯(lián)性分析
4.1數(shù)據(jù)準(zhǔn)備
本次研究采集了柳州鐵道職業(yè)技術(shù)學(xué)院2016級(jí)、2017級(jí)鐵道供電技術(shù)專業(yè)6門課程的學(xué)生期末成績(jī),其中包含2門專業(yè)基礎(chǔ)課,4門專業(yè)核心課。因?yàn)閿?shù)據(jù)庫(kù)中的學(xué)生成績(jī)是以數(shù)值形式表示的,不便于進(jìn)行數(shù)據(jù)挖掘,所以需要對(duì)各科成績(jī)進(jìn)行離散化處理。本文采用了以下兩個(gè)步驟進(jìn)行數(shù)據(jù)預(yù)處理。
(1)以離散字符替代課程名稱。以離散字符D1,D2,D3,D4,D5,D6分別替代表示“電路分析與測(cè)試”“電子技術(shù)基礎(chǔ)”“變電所運(yùn)行與維護(hù)”“電力線路運(yùn)行檢修與施工”“接觸網(wǎng)運(yùn)行檢修與施工”“電氣化鐵路供電系統(tǒng)運(yùn)行與管理”六門課程。
(2)對(duì)連續(xù)型數(shù)據(jù)進(jìn)行離散化分類。設(shè)定90分以上為優(yōu)秀,70~89分為良好,60~69分為合格,60分以下為不合格。將以上分段分別以A-優(yōu)秀、B-良好、C——合格、D-不合格四個(gè)等級(jí)替代表示。經(jīng)過預(yù)處理后的學(xué)生成績(jī)?nèi)绫?所列,其中學(xué)生總?cè)藬?shù)為275人,分別對(duì)應(yīng)275條記錄。
4.2結(jié)果與分析
4.2.1挖掘結(jié)果
本文采用Microsoft SQL Server 2008軟件進(jìn)行數(shù)據(jù)挖掘,將預(yù)處理好的、已滿足Apriori算法要求的數(shù)據(jù)導(dǎo)人,即可直接使用Apriori模型進(jìn)行分析。關(guān)聯(lián)規(guī)則如表2所列。
通過挖掘分析,分別獲得:(I)D1-D2;(2) D1,D2-D3,D4,D5,D6;(3) D3,D4,D5-D6的關(guān)聯(lián)規(guī)則表,如表3~表5所列。
4.2.2結(jié)果分析
挖掘的關(guān)聯(lián)規(guī)則并不是所有條目都具有實(shí)際意義,接下來我們進(jìn)一步地對(duì)挖掘出的規(guī)則進(jìn)行分析,得出有意義的知識(shí)。
(1)學(xué)習(xí)“電路分析與測(cè)試”課程是學(xué)習(xí)“電子技術(shù)基礎(chǔ)”課程的基礎(chǔ),如果“電路分析與測(cè)試”課程學(xué)習(xí)基礎(chǔ)打不好,在學(xué)習(xí)“電子技術(shù)基礎(chǔ)”課程時(shí)就會(huì)受影響較大。
在表3中,D1電路分析與測(cè)試=D-D2電子技術(shù)基礎(chǔ)=D,支持度0.517,置信度0.6458。電路分析與測(cè)試和電子技術(shù)基礎(chǔ)同時(shí)是D的概率為51.7%,電路分析與測(cè)試為D中64.58%的人電子技術(shù)基礎(chǔ)也為D,說明如果“電路分析與測(cè)試”課程基礎(chǔ)未打牢,“電子技術(shù)基礎(chǔ)”課程也較難學(xué)好。
(2)學(xué)好“電路分析與測(cè)試”“電子技術(shù)基礎(chǔ)”兩門專業(yè)基礎(chǔ)課是學(xué)好專業(yè)核心課(“變電所運(yùn)行與維護(hù)”“電力線路運(yùn)行檢修與施工”“接觸網(wǎng)運(yùn)行檢修與施工”)的基礎(chǔ)。如果專業(yè)基礎(chǔ)課基礎(chǔ)打不牢,也會(huì)影響后面專業(yè)課的學(xué)習(xí)。表4數(shù)據(jù)說明,“電路分析與測(cè)試”和“電子技術(shù)基礎(chǔ)”課程學(xué)不好,51.61%的人可能也學(xué)不好“電氣化鐵路供電系統(tǒng)運(yùn)行與管理”課程。
(3)專業(yè)核心課“變電所運(yùn)行與維護(hù)”“電力線路運(yùn)行檢修與施工”“接觸網(wǎng)運(yùn)行檢修與施工”的學(xué)習(xí)與“電氣化鐵路供電系統(tǒng)運(yùn)行與管理”的學(xué)習(xí)關(guān)聯(lián)性較強(qiáng)。
從表5可以看出.D6電氣化鐵路供電系統(tǒng)運(yùn)行與管理成績(jī)的好壞很有可能與D3變電所運(yùn)行與維護(hù)、D4電力線路運(yùn)行檢修與施工、D5接觸網(wǎng)運(yùn)行檢修與施工三門課程成績(jī)有關(guān)。D4電力線路運(yùn)行檢修與施工、D3電所運(yùn)行與維護(hù)同時(shí)為A,D6電氣化鐵路供電系統(tǒng)運(yùn)行與管理也為A的支持度0. 813,置信度0.99894;D5接觸網(wǎng)運(yùn)行檢修與施工、D3電所運(yùn)行與維護(hù)同時(shí)為A,D6電氣化鐵路供電系統(tǒng)運(yùn)行與管理也為A的支持度0.769,置信度0.9462; D5接觸網(wǎng)運(yùn)行檢修與施工、D4電力線路運(yùn)行檢修與施工同時(shí)為A,D6電氣化鐵路供電系統(tǒng)運(yùn)行與管理也為A的支持度0.75.置信度0.9723。這表明前三門課程成績(jī)優(yōu)異,很有可能電氣化鐵路供電系統(tǒng)運(yùn)行與管理課程成績(jī)也優(yōu)異。但如果D3電所運(yùn)行與維護(hù)、D4電力線路運(yùn)行檢修與施工同時(shí)為D,D6電氣化鐵路供電系統(tǒng)運(yùn)行與管理也為D的支持度0.8,置信度0.5589; D3電所運(yùn)行與維護(hù)、D5接觸網(wǎng)運(yùn)行檢修與施工為D,D6電氣化鐵路供電系統(tǒng)運(yùn)行與管理為D的支持度0.72,置信度0.5726。即前三門D3,D4,D5課程成績(jī)不及格,也有可能導(dǎo)致D6課程成績(jī)不及格。
(4)本次挖掘結(jié)果表明:選取的2門專業(yè)基礎(chǔ)課與專業(yè)核心課之間存在較強(qiáng)的依賴關(guān)系。課程設(shè)置時(shí)盡可能保持專業(yè)基礎(chǔ)課的學(xué)時(shí)、學(xué)分不縮減。另外,“電氣化鐵路供電系統(tǒng)運(yùn)行與管理”課程的綜合性較強(qiáng),需要以其他課程作為基礎(chǔ),應(yīng)考慮將其放在其他理論課程學(xué)完后的學(xué)期進(jìn)行開設(shè)。
5結(jié)束語
利用關(guān)聯(lián)規(guī)則中的Apriori算法對(duì)鐵道供電技術(shù)專業(yè)的2門專業(yè)基礎(chǔ)課和4門核心課成績(jī)進(jìn)行關(guān)聯(lián)性挖掘,從而探究各課程之間存在的內(nèi)在聯(lián)系,并將挖掘結(jié)果應(yīng)用于該專業(yè)課程設(shè)置,可以為專業(yè)設(shè)置提供更可靠的理論依據(jù)。后續(xù)也可以將該方法應(yīng)用于專業(yè)的其他課程,為專業(yè)建設(shè),甚至是學(xué)生學(xué)習(xí)、教師的教學(xué)提供更科學(xué)的指導(dǎo)。
計(jì)算機(jī)應(yīng)用文摘·觸控2022年23期