范 娟 巴桑卓瑪
(西藏大學(xué)理學(xué)院 西藏 拉薩 850000)
R是用于設(shè)計(jì)支持統(tǒng)計(jì)計(jì)算和圖形繪制的一類編程語言,也
指實(shí)現(xiàn)該語言的軟件環(huán)境,同時(shí)更是一款免費(fèi)的開放自由軟件。R是一個(gè)GNU項(xiàng)目,這即確保了R的開源優(yōu)勢,許多不同領(lǐng)域的工作者致力于研究編寫各專業(yè)的安裝包和函數(shù),為R的普及發(fā)展和便捷應(yīng)用提供了良好重要的現(xiàn)實(shí)基礎(chǔ)。本文基于R語言的學(xué)生成績解析作為實(shí)例主題而展開研究。
下面將借助R語言實(shí)例應(yīng)用環(huán)節(jié)計(jì)算和作圖分析,本文以高三一班69個(gè)同學(xué)的理科成績?yōu)閿?shù)據(jù)對象,課程包括語數(shù)英外物化生,原始數(shù)據(jù)存儲為表,數(shù)據(jù)分析前數(shù)據(jù)導(dǎo)入到R語言。
(一)學(xué)生成績分布
了解學(xué)生成績的分布,可采用直方圖、莖葉圖,所以本文判斷學(xué)生成績是否屬于正態(tài)分布,結(jié)合R語言的Q-Q圖,使用函數(shù)qqnorm()和qqline()驗(yàn)證樣本是否正態(tài)分布,然后擬合正態(tài)分布曲線,最后對試卷評估。
本文以英語和理綜/文綜成績?yōu)闃颖具M(jìn)行實(shí)例應(yīng)用,畫出兩科成績的直方圖和Q-Q圖,判斷語文和數(shù)學(xué)成績是否屬于正態(tài)分布,評估試卷的出題質(zhì)量難易。
圖1 兩科直方圖與Q-Q圖
從圖中英語和理綜/文綜成績基本上服從正態(tài)分布,命題相對更科學(xué),質(zhì)量要更好些。最后,使用shapiro.test函數(shù),p值表示的是服從正態(tài)分布的概率,語文和數(shù)學(xué)成績P值分別為0.417和0.102,都大于0.05,兩科成績分布都屬于正態(tài)分布。
2.初步統(tǒng)計(jì)分析
通過R語言的函數(shù)功能來實(shí)現(xiàn)對學(xué)生學(xué)習(xí)成績的初步分析,以高三一班6個(gè)考試科目成績?yōu)槔?進(jìn)行分析。
表1 初步統(tǒng)計(jì)表
看表1發(fā)現(xiàn)變異強(qiáng)度最低的是語文學(xué)科,其次是數(shù)學(xué)學(xué)科,除了上面的函數(shù)外,還可以通過summary()函數(shù)來簡單地得到成績的信息。
2.學(xué)生學(xué)習(xí)成績的差異性
結(jié)合R語言中stars()函數(shù),我們據(jù)學(xué)生的成績數(shù)據(jù)畫出學(xué)生成績星圖。
Stars()函數(shù)能處理三到五維的數(shù)據(jù),英語、化學(xué)/歷史的變異系數(shù)太大,所以選取除此的五門數(shù)據(jù)進(jìn)行處理,如圖2所示,從圖中可以看到69個(gè)學(xué)生關(guān)于五個(gè)科目的成績輪廓圖,班上學(xué)習(xí)成績差異較大。
R是一套強(qiáng)大的數(shù)據(jù)統(tǒng)計(jì)、分析和制圖的軟件系統(tǒng)。本文中將R語言引入教學(xué)分析,介紹了幾個(gè)相對簡單易學(xué)的圖,在平時(shí)生活中常見的圖例都可以運(yùn)用R語言得到設(shè)計(jì)實(shí)現(xiàn)。另外,通過本次研究可知,相比通過語言描述理解計(jì)算的方式,利用圖示能夠更趨生動形象地地呈現(xiàn)數(shù)據(jù)價(jià)值,并基于當(dāng)下學(xué)生成績,有的放矢調(diào)整教學(xué)方案,逐步達(dá)到客觀理想的教學(xué)目標(biāo)。
圖2 成績星圖