侯海鳳
(肇慶市端州中學(xué),廣東 肇慶 526040)
由于高中階段的高考是目前中國社會最重要的考試,因此社會、學(xué)校、家庭甚至高中生本人,都非常重視高中階段的學(xué)習(xí)。研究如何提高中學(xué)生的學(xué)習(xí)成績,以及影響中學(xué)生學(xué)習(xí)成績的學(xué)習(xí)習(xí)慣等方面的問題,受到國內(nèi)外學(xué)者的重視,并且已開展了較深入的研究。文獻(xiàn)[1]指出長期的學(xué)習(xí)和升學(xué)壓力,導(dǎo)致很多高中生經(jīng)常出現(xiàn)精神萎靡不振、身體疲憊不堪的現(xiàn)象。文獻(xiàn)[2]指出好的學(xué)習(xí)習(xí)慣,猶如物理學(xué)中的慣性力量,讓學(xué)生可以堅持學(xué)習(xí)下去。文獻(xiàn)[3]研究發(fā)現(xiàn),學(xué)生在完成任務(wù)時的動機(jī)很大程度上受他們自我觀念的影響。本文中,筆者將運(yùn)用關(guān)聯(lián)分析法,研究中學(xué)生課前學(xué)習(xí)習(xí)慣、課堂學(xué)習(xí)習(xí)慣、課后學(xué)習(xí)習(xí)慣以及課外愛好等因素之間的關(guān)聯(lián)性,尋找影響學(xué)生學(xué)習(xí)成績的主要因素。
1993年Agrawal[4]等人提出的關(guān)聯(lián)分析法,可以發(fā)現(xiàn)存在于大型數(shù)據(jù)集中的數(shù)據(jù)項之間的關(guān)聯(lián)性,其發(fā)現(xiàn)模式通常用關(guān)聯(lián)規(guī)則或頻繁項集的形式表示。關(guān)聯(lián)規(guī)則的一般形式是X→Y(規(guī)則支持度,規(guī)則置信度),其中X稱為規(guī)則的前項;Y稱為規(guī)則的后項。依據(jù)樣本數(shù)據(jù)可以得到很多關(guān)聯(lián)規(guī)則,但要獲得有價值的關(guān)聯(lián)規(guī)則,則需要采用支持度和置信度等測度指標(biāo)。
支持度(Support)表示項目X和項目Y同時出現(xiàn)的概率,其數(shù)學(xué)表達(dá)式如公式(1)所示。
置信度(Confidence)表示包含項目X的事務(wù)中同時包含項目Y的概率,其數(shù)學(xué)表達(dá)式如公式(2)所示。
簡單關(guān)聯(lián)規(guī)則技術(shù)的核心算法Apriori算法[5-9]包含兩部分:第一,產(chǎn)生頻繁項集;第二,依據(jù)頻繁項集產(chǎn)生關(guān)聯(lián)規(guī)則。
頻繁項集是指包含項目A的項集C,如果其支持度大于等于用戶指定的最小支持度,即
則稱A(A)為頻繁集。包含一個項目的頻繁項集稱為1-項集,記為L1;包含k個項目的頻繁項集稱為k-項集,記為Lk。
Apriori尋找頻繁項集的過程是一個不斷迭代的過程,每次迭代都包含兩個步驟:第一,產(chǎn)生候選集Ck,所謂候選集就是可能成為頻繁項集的項目集合;第二,基于候選集Ck,計算支持度并確定頻繁項集Lk。
本文的基本思路是先采用SPSS軟件中的K-均值算法,對調(diào)查問卷中的35個問題進(jìn)行粗關(guān)聯(lián)分析,在粗關(guān)聯(lián)分析的基礎(chǔ)上,再用Apriori算法進(jìn)行精關(guān)聯(lián)分析。具體步驟如下:先采用SPSS軟件中的K-均值算法將調(diào)查問卷中的35個問題分成n類,把這n類視為n個綜合項目;再用Apriori算法找出這n個綜合項目的頻繁項集Lk。
本文算法步驟具體如下:
步驟1 計算問卷調(diào)查中35個問題的每一個問題選“A”“B”“C”和“D”所占的比例,并由這4個比例數(shù)構(gòu)成一個4維向量。
步驟2 采用SPSS軟件中的K-均值算法,將步驟1產(chǎn)生的35個4維向量分成n類,即n個綜合項目。
步驟3 對每一個問題制定相應(yīng)的評分標(biāo)準(zhǔn),根據(jù)評分標(biāo)準(zhǔn),給出選“A”“B”“C”和“D”項相應(yīng)的分?jǐn)?shù)。同時,根據(jù)第二步的綜合項目計算每一個樣本的綜合項目分,綜合項目分由綜合項目所含項目的平均分構(gòu)成。
步驟4 制定相應(yīng)的平均分分級標(biāo)準(zhǔn),給出n類的每一個樣本的綜合項目的等級。
步驟5 采用Apriori算法找出這n個綜合項目的頻繁項集Lk。
調(diào)查問卷針對中學(xué)生課前學(xué)習(xí)習(xí)慣、課堂學(xué)習(xí)習(xí)慣、課后學(xué)習(xí)習(xí)慣以及課外愛好共4個方面設(shè)計了35個問題,問題如表1所示。筆者向肇慶市某普通高級中學(xué)的88名學(xué)生發(fā)放了調(diào)查問卷,共收回88份有效問卷。
根據(jù)本文的算法步驟1,計算問卷調(diào)查中35個問題的每一個問題選“A”“B”“C”和“D”所占的比例,統(tǒng)計結(jié)果如表1所示。
表1 調(diào)查問卷統(tǒng)計表
根據(jù)本文算法的步驟2,采用SPSS軟件中的K-均值算法,將步驟1產(chǎn)生的35個4維向量分成9類,即9個綜合項目,具體分類情況如表2所示。
表2 K-均值算法分類結(jié)果
根據(jù)表2的數(shù)據(jù)顯示,學(xué)習(xí)計劃(問題1)、學(xué)習(xí)成績是否進(jìn)步(問題9)、表達(dá)見解(問題17)具有很強(qiáng)的關(guān)聯(lián);課前預(yù)習(xí)(問題2)、作業(yè)改正(問題7)、聽課方法(問題14)、使用手機(jī)時長(問題23)、和誰聊天(問題25)、手機(jī)是否影響學(xué)習(xí)(問題26)具有很強(qiáng)的關(guān)聯(lián)。問題3、6、16、18、20、22和27具有很強(qiáng)的關(guān)聯(lián);問題4、19、24、28和30 具有很強(qiáng)的關(guān)聯(lián);問題5、15、31、33、35具有很強(qiáng)的關(guān)聯(lián);問題10、11、29具有很強(qiáng)的關(guān)聯(lián);問題12、13具有很強(qiáng)的關(guān)聯(lián);問題21、34具有很強(qiáng)的關(guān)聯(lián)。
由于有些類中包含兩個方面的問題,即選項的意思剛好相反,因此對該類拆分為兩類,最后分類結(jié)果如表3所示。
表3 修正后的分類結(jié)果
根據(jù)本文算法的步驟3,制定第一個問題的選項A(優(yōu)秀)、B(良)、C(合格)、D(不合格),4個選項的分?jǐn)?shù)分別為100、75、50、25分,其他問題根據(jù)情況類似制定。根據(jù)表3的分類結(jié)果,計算每個樣本綜合項目的分?jǐn)?shù),具體如表4所示。
表4 每個樣本綜合項目的分?jǐn)?shù)
本文制定的分級標(biāo)準(zhǔn)如表5所示,根據(jù)表5的分級標(biāo)準(zhǔn),獲得表6所示的每個樣本的綜合項目的分類等級。
本文采用的最小支持度Smin=30%,最小置信度Cmin=60%。
首先計算頻繁1-項集,候選項集={A1,B1,C11,C21,D1,E11,E12,F1,G1,H11,H21,I1,J1}。
計算支持度大于最小支持度Smin的候選項如下:
所以頻繁1-項集={C11,C21,D1,E11,E21,J1}。
其次計算頻繁2-項集,計算支持度大于最小支持度Smin的候選項如下:
表5 學(xué)生評價分類標(biāo)準(zhǔn)表
表6 全部樣本的綜合項集等級
計算置信度大于等于最小置信度Cmin的候選集如下:
再次計算頻繁3-項集,計算支持度大于最小支持度Smin的候選項如下:
計算置信度大于等于最小置信度Cmin的候選集如下:
最后通過計算沒有頻繁4-項集。
經(jīng)過Apriori算法計算,可獲得6條關(guān)聯(lián)規(guī)則,結(jié)果如下:
規(guī)則1表明:C11與D1的支持度(support)=36.36%,置信度(confidence)=100%。即教師在課堂上是否面向全體學(xué)生、教師的課堂教學(xué)方式與課堂筆記、手機(jī)花費(fèi)情況、使用手機(jī)年限、對戀愛的看法之間是正關(guān)聯(lián)的。
規(guī)則2表明:C11與J1的支持度(support)=30.68%,置信度(confidence)=84.38%。即教師在課堂上是否面向全體學(xué)生、教師的課堂教學(xué)方式與成績之間是正關(guān)聯(lián)的。
規(guī)則3表明:C21與D1的支持度(support)=54.54%,置信度(confidence)=88.89%。即課堂聽課情況、課后作業(yè)、手機(jī)數(shù)量、與誰聯(lián)系、早戀時間與課堂筆記、手機(jī)花費(fèi)情況、使用手機(jī)年限、對戀愛的看法之間是正關(guān)聯(lián)的。
規(guī)則4表明:C21與J1的支持度(support)=37.50%,置信度(confidence)=61.11%。即課堂聽課情況、課后作業(yè)、手機(jī)數(shù)量、與誰聯(lián)系、早戀時間與成績之間是正關(guān)聯(lián)的。
規(guī)則 5表明:C11,D1與J1的支持度(support)=30。68%,置信度(confidence)=84.38%。即教師在課堂上是否面向全體學(xué)生、教師的課堂教學(xué)方式、課堂筆記、手機(jī)花費(fèi)情況、使用手機(jī)年限、對戀愛的看法與成績之間是正關(guān)聯(lián)的。
規(guī)則 6 表明:D1,C21與J1的支持度(support)=34.09%,置信度(confidence)=62.50%。即課堂筆記、手機(jī)花費(fèi)情況、使用手機(jī)年限、對戀愛的看法、課堂聽課情況、課后作業(yè)、手機(jī)數(shù)量、與誰聯(lián)系、早戀時間與成績之間是正關(guān)聯(lián)的。
筆者根據(jù)中學(xué)生的課前學(xué)習(xí)習(xí)慣、課堂學(xué)習(xí)習(xí)慣、課后學(xué)習(xí)習(xí)慣以及課外愛好等方面制作了35個問題的調(diào)查問卷,并將調(diào)查問卷發(fā)給肇慶市某中學(xué)的88位學(xué)生進(jìn)行調(diào)查,之后對收回的調(diào)查問卷進(jìn)行統(tǒng)計分析。分析結(jié)果顯示,學(xué)生的課堂學(xué)習(xí)習(xí)慣、課外學(xué)習(xí)習(xí)慣和業(yè)余時間的愛好等方面存在較強(qiáng)的關(guān)聯(lián)性。
[1]郭斌.高中物理學(xué)習(xí)中遇到的問題及解決方法[J].中學(xué)生數(shù)理化(學(xué)研版),2013,12(6):28-28.
[2]王興梅.高中生學(xué)業(yè)自我、成就動機(jī)對學(xué)習(xí)倦怠的影響研究[D].成都:四川師范大學(xué),2012:32-34.
[3]黃仁輝.自我概念、成就動機(jī)及應(yīng)對方式對大學(xué)生抑郁的影響研究[D].南昌:江西師范大學(xué)教育學(xué)院,2006:34-36.
[4]傅亞莉.基于Apriori算法的高職院校課程相關(guān)性分析[J].長春工程學(xué)院學(xué)報(自然科學(xué)版),2013,14(4):108-111.
[5]宋中山,趙祖應(yīng),丁勇,等.基于Apriori算法的購物籃關(guān)聯(lián)規(guī)則分析[J].江西科學(xué),2012,30(1):96-98.
[6]陳濤,王萬榮.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘技術(shù)在教學(xué)評價及學(xué)生成績關(guān)系之間的應(yīng)用研究[J].安徽科技學(xué)院學(xué)報,2013,27(6):62-65.
[7] 王晨綾,劉偉,鄭世玨.基于Apriori算法的對微信熱點(diǎn)事件的關(guān)聯(lián)分析與研究[J].計算機(jī)與數(shù)字工程,2016,44(1):31-34.
[8]劉忠鐵.基于Apriori算法的遠(yuǎn)程教學(xué)成績影響因素分析研究[J].電腦知識與技術(shù),2013,3(31):7 006-7 008.
[9]陳濤,王萬榮.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘技術(shù)在教學(xué)評價及學(xué)生成績關(guān)系之間的應(yīng)用研究[J].安徽科技學(xué)院學(xué)報,2013,27(6):62-65.