陳宇 潘瑩瑩 王嫻 祖冠群 孫曉松 艾玉波
摘 要:文中利用SPSS軟件對統(tǒng)計專業(yè)學(xué)生的成績進行聚類分析,將學(xué)生分為四類,分析了每類學(xué)生的能力傾向,并進行了相應(yīng)的就業(yè)指導(dǎo)。
關(guān)鍵字:SPSS;聚類分析;能力傾向;就業(yè)指導(dǎo)
注:本文為江蘇省2013年大學(xué)生實踐創(chuàng)新項目論文。
1 聚類分析原理
聚類分析是統(tǒng)計學(xué)中研究“物以類聚”問題的多元統(tǒng)計分析方法,它能夠?qū)⒁慌鷺颖荆ɑ蜃兞浚?shù)據(jù)根據(jù)其諸多特征,按照在性質(zhì)上的親疏程度在沒有先驗知識的情況下進行自動分類,產(chǎn)生多個分類結(jié)果。類內(nèi)部個體特征具有相似性,不同類個體特征的差異性較大。
聚類分析中,個體之間的“親疏程度”是極為重要的,它將直接影響最終的聚類結(jié)果。對“親疏程度”的測度一般有兩個角度:第一,個體間的相似程度;第二,個體間的差異程度。衡量個體間的相似程度通??刹捎煤唵蜗嚓P(guān)系數(shù)或等級相關(guān)系數(shù)等。個體間的差異程度通常通過某種距離來測度。
定義個體間距離的方法也有很多,比如:歐氏距離、平方歐氏距離、切比雪夫距離、Block距離、明考斯基距離等。
常見的聚類分析方法有層次聚類和K-Means聚類。
2 數(shù)據(jù)來源
本文選取了08級統(tǒng)計班31名學(xué)生的24門主干課程,分別為:思想道德修養(yǎng)與法律基礎(chǔ)、大學(xué)生體育、統(tǒng)計學(xué)原理、微積分、政治經(jīng)濟學(xué)、心理健康教育、線性代數(shù)、大學(xué)英語、應(yīng)用統(tǒng)計學(xué)、國民經(jīng)濟統(tǒng)計學(xué)、線性規(guī)劃、普通話口語、統(tǒng)計預(yù)測與決策、統(tǒng)計信息管理、管理信息系統(tǒng)、調(diào)查數(shù)據(jù)分析、統(tǒng)計實務(wù)、概率論與數(shù)理統(tǒng)計、運籌學(xué)、抽樣技術(shù)、企業(yè)經(jīng)濟統(tǒng)計學(xué)、財務(wù)管理、SPSS在統(tǒng)計中的應(yīng)用、消費者行為學(xué)。
將這24門課程的成績輸入SPSS19.0軟件對其進行聚類分析。
3 實證檢驗
本文采用層次聚類方法進行聚類分析,那么,在衡量數(shù)據(jù)間的親疏程度時涉及兩個方面的問題,一是度量個體間的親疏程度,本文采用平方歐氏距離;二是度量個體與小類之間、小類和小類之間的親疏程度,這方面的度量也是通過距離來測度的,并且,這里的距離是在個體間距離的基礎(chǔ)上定義的,常見的距離有最近鄰居距離、最遠鄰居距離、組間平均鏈鎖、組內(nèi)平均鏈鎖、重心距離和離差平方和法。本文的類間距離采用平均組間鏈鎖距離。
并且,因為數(shù)據(jù)不存在數(shù)量級上的差異,因此無須進行標準化處理。
3.1 聚類分析樹形圖
聚類分析的樹形圖如圖1所示。
從樹形圖可以看出:全班31名同學(xué)可以分成四類,周利靜、朱瀟瀟、夏玉濤這三位同學(xué)為一類,郭勇一人為一類,夏正娟、楊歡為一類,剩余25位同學(xué)為一類。
3.2 各類別能力傾向分析
圖1 生成的聚類分析樹形圖
通過比較各類別的成績,解釋各類別的學(xué)生能力傾向特點。
各類別的成績分布如表1所示。(考慮到頁面的限制,表1的課程只列舉了其中的一部分。)
從表1的成績,可以得到如下的分析結(jié)果:
第一類:有周利靜、朱瀟瀟、夏玉濤三位同學(xué)。這三名學(xué)生各科成績都普遍不錯,有多門功課成績都是名列前茅,總平均成績也是全班的前三名。她們是各科普遍優(yōu)秀的典型代表,因此可以定義她們?yōu)椤皟?yōu)秀型學(xué)生”。
第二類:有陳佩佩等25位同學(xué),是最大的一個類別。從成績看,他們的各科成績比較平均?;旧蠜]有特別好的也沒有特別差的,都維持在中游的水平,因此可以定義他們?yōu)椤傲己眯蛯W(xué)生”。
第三類:只有郭勇一位同學(xué)。他的成績沒有高分但也沒有不及格的,但是縱向比較可以看出,比如他的《大學(xué)英語》課程,考了68分,但是排在班級倒數(shù)第二,再比如說,《統(tǒng)計信息管理》課程,考了63分,全班倒數(shù)第一。因此,雖然他的總平均分也能達到75分,但他跟第二類的同學(xué)們顯然還是有差距的。因此,可以定義他為“合格型學(xué)生”。
第四類:有夏正娟和楊歡兩位同學(xué)。這兩位同學(xué)都存在著課程不及格現(xiàn)象,夏正娟的《應(yīng)用統(tǒng)計學(xué)》和《國民經(jīng)濟統(tǒng)計學(xué)》兩門課程不及格,楊歡《應(yīng)用統(tǒng)計學(xué)》和《統(tǒng)計實務(wù)》不及格,且不及格成績很低。他們都屬于統(tǒng)計學(xué)方面的應(yīng)用實務(wù)方面掌握得很差。因此可以定義她們?yōu)椤安患案駥W(xué)生”。
3.3 相應(yīng)就業(yè)指導(dǎo)
對于“優(yōu)秀型學(xué)生”,不論是理論、實踐還是技能操作,她們都能夠勝任。應(yīng)該努力培養(yǎng)她們成為統(tǒng)計工作崗位的骨干力量。
對于“良好型學(xué)生”,他們具備良好的統(tǒng)計知識和技能,只是學(xué)得不太精,這部分同學(xué)應(yīng)該根據(jù)自身愛好,發(fā)揮各自所長,培養(yǎng)成為統(tǒng)計工作崗位的技術(shù)能手。
對于“合格型學(xué)生”,他的統(tǒng)計專業(yè)素養(yǎng)不是很好,但他的統(tǒng)計軟件動手操作能力不錯,建議在統(tǒng)計工作崗位中成長為數(shù)據(jù)分析軟件能手。但要想走得遠,必須還要進一步地重溫統(tǒng)計專業(yè)基礎(chǔ)知識。
對于“不合格學(xué)生”,她們的統(tǒng)計應(yīng)用型課程存在不及格,且其他課程成績一般,因此建議她們可以改選其他方面工作,不要拘泥在統(tǒng)計工作崗位上。
參考文獻
[1]薛薇.基于SPSS的數(shù)據(jù)分析[M].北京:中國人民大學(xué)出版社,2006.
[2]周蕾.聚類分析在學(xué)生成績分析中的應(yīng)用[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2010(5).
[3]林治.聚類分析在學(xué)生成績管理中的應(yīng)用探析[J].福建電腦,2009(12).
[4]王亮紅,宋代清,徐娜.聚類分析在學(xué)生成績分析中的應(yīng)用[J].東北電力大學(xué)學(xué)報,2009(4).
[5]劉璐,楊景明,趙會仁,李丹丹,田玉民.主成分聚類分析在學(xué)生成績綜合評價中的應(yīng)用[J].遼寧工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2012(3).
[6]羅家國,羅浩,仲佳嘉.基于SPSS的學(xué)生能力傾向聚類分析研究[J].高等工程教育研究,2012(6).