王 軍
(安徽財(cái)貿(mào)職業(yè)學(xué)院 公共教學(xué)部,安徽 合肥 230601)
大學(xué)生是我國(guó)社會(huì)經(jīng)濟(jì)發(fā)展的主力軍,大學(xué)生擁有健康的體質(zhì)是社會(huì)可持續(xù)發(fā)展的基本條件.經(jīng)調(diào)查研究我國(guó)大學(xué)生的體質(zhì)健康狀況的總體情況不容樂觀,大學(xué)生的身體素質(zhì)呈緩慢下降的趨勢(shì).如何改變大學(xué)生體質(zhì)健康的下降趨勢(shì),進(jìn)一步增強(qiáng)體質(zhì),增進(jìn)大學(xué)生的身體健康已是迫切需要解決的問題.
目前廣大學(xué)者對(duì)學(xué)生的體質(zhì)健康現(xiàn)狀、學(xué)生體質(zhì)健康評(píng)價(jià)、學(xué)生體質(zhì)健康測(cè)試進(jìn)行了大量的研究,并且針對(duì)各地、各區(qū)域高校學(xué)生體質(zhì)健康的研究較多.但是這些研究大部分都是簡(jiǎn)單的統(tǒng)計(jì)比較和數(shù)據(jù)處理,文獻(xiàn)[1-2]提出了影響大學(xué)生體質(zhì)測(cè)試成績(jī)的因素剖析,給出了影響體質(zhì)測(cè)試成績(jī)的因素體系;文獻(xiàn)[3-6]提出了各個(gè)國(guó)家地區(qū)的大學(xué)生體質(zhì)測(cè)試成績(jī)分析,給出了數(shù)據(jù)的簡(jiǎn)單比較分析;文獻(xiàn)[7] 提出一種基于因子分析的大學(xué)生體質(zhì)測(cè)試成績(jī)的影響因素研究;文獻(xiàn)[8-9]中給出了高等學(xué)校中學(xué)生體測(cè)數(shù)據(jù)分析,給出了簡(jiǎn)單的比較分析方法.有些模型也只是停留在理論上,沒有根據(jù)事實(shí)存在的數(shù)據(jù)進(jìn)行處理,也沒取得很好的效果,更談不上幫助教師及學(xué)生更好地了解學(xué)生的體質(zhì)狀態(tài),選擇鍛煉方法,提高大學(xué)生健康質(zhì)量.
為此本文通過適當(dāng)?shù)臄?shù)學(xué)模型深度挖掘體測(cè)數(shù)據(jù)的所隱藏的信息,建立具有代表性、科學(xué)性,又有實(shí)用性、可操作性的指標(biāo)體系,分析大學(xué)生體質(zhì)健康的類別和綜合評(píng)價(jià)級(jí)別,提供操作簡(jiǎn)單的評(píng)估方法,對(duì)于科學(xué)地評(píng)價(jià)與監(jiān)測(cè)大學(xué)生的體質(zhì)健康狀況和為學(xué)生提供適當(dāng)?shù)腻憻挿椒ň哂蟹浅V匾默F(xiàn)實(shí)意義.
研究所用數(shù)據(jù)來自于合肥市5所同類型高校大學(xué)生體測(cè)數(shù)據(jù),本文采取整群抽樣方法,從2011-2018級(jí)身體健康、無重大疾病的在校學(xué)生中擬抽取10000 人,男女分級(jí),剔除無效數(shù)據(jù),以此10000名學(xué)生作為樣本,在此基礎(chǔ)上展開實(shí)證分析.
選取的樣本數(shù)據(jù)依據(jù)《國(guó)家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》對(duì)身高、體重、握力、肺活量、立定跳遠(yuǎn)、速度等指標(biāo)量化評(píng)分,本研究是在量化評(píng)分的基礎(chǔ)上做定量分析.
1.2.1 構(gòu)建多層次結(jié)構(gòu)的評(píng)價(jià)指標(biāo)體系
體質(zhì)健康測(cè)試成績(jī)?cè)u(píng)價(jià)體系的構(gòu)架關(guān)鍵在于如何設(shè)計(jì)評(píng)價(jià)指標(biāo)體系,其首要問題是指標(biāo)設(shè)計(jì)有客觀的標(biāo)準(zhǔn)可以度量.從考察大學(xué)生體質(zhì)健康測(cè)試成績(jī)的全面性,根據(jù)《大學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》以及指標(biāo)設(shè)定的針對(duì)性、科學(xué)性和合理性原則,參照國(guó)內(nèi)院校大學(xué)生體質(zhì)健康測(cè)試成績(jī)測(cè)評(píng)體系建立多層次結(jié)構(gòu)的評(píng)價(jià)指標(biāo)體系,具體內(nèi)容見表1.
表1 大學(xué)生體質(zhì)健康測(cè)試成績(jī)?cè)u(píng)價(jià)指標(biāo)體系
模型中評(píng)價(jià)指標(biāo)的確定是大學(xué)生體質(zhì)健康綜合評(píng)價(jià)的關(guān)鍵,選擇的變量不同,最終預(yù)測(cè)的效果也自然各異.依據(jù)《國(guó)家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》,其指標(biāo)的確定由學(xué)生體質(zhì)綜合評(píng)價(jià)研究小組推出的,具有一定權(quán)威性與科學(xué)性,對(duì)最終模型都是有顯著貢獻(xiàn)的.因此,從身體形態(tài)發(fā)育水平、生理機(jī)能水平、身體素質(zhì)與運(yùn)動(dòng)能力發(fā)展水平3個(gè)方面選取了身高、體重、握力、肺活量、立定跳遠(yuǎn)、速度6項(xiàng)指標(biāo),確定為構(gòu)建模型的評(píng)價(jià)指標(biāo).由于各個(gè)評(píng)價(jià)指標(biāo)影響不同,故權(quán)重分配尤為重要,分配權(quán)重系數(shù)本文采用二元對(duì)比排序法和專家調(diào)查法相結(jié)合的方法確定,結(jié)合實(shí)時(shí)數(shù)據(jù),確定權(quán)重真實(shí)反映大學(xué)生的體質(zhì)狀況.
現(xiàn)結(jié)合模糊綜合評(píng)價(jià)分級(jí)模型,對(duì)某一學(xué)生的體質(zhì)健康測(cè)試成績(jī)進(jìn)行綜合評(píng)價(jià)分級(jí),其中權(quán)重的確定是采用專家調(diào)查法得到A=(0.24,0.35,0.41),A1=(0.29,0.30,0.41),A2=(0.55,0.45),A3=(0.47,0.53).其評(píng)價(jià)結(jié)果為:
一級(jí)指標(biāo)的評(píng)價(jià)向量:
計(jì)算綜合評(píng)價(jià)結(jié)果以及模糊綜合評(píng)價(jià)值:
根據(jù)評(píng)價(jià)分級(jí)原則,B中最大隸屬度為0.5084,超過0.5,說明其成績(jī)等級(jí)屬于“優(yōu)秀”級(jí)別.其模糊綜合評(píng)價(jià)值為
(0.5084,0.2363,0.1579,0.1047)·(100,85,70,30)T=85.1116
因此,該學(xué)生體測(cè)成績(jī)的模糊綜合評(píng)價(jià)值為85.1116,屬于“優(yōu)秀”級(jí)別.
模糊C均值聚類算法作為無監(jiān)督機(jī)器學(xué)習(xí)的主要技術(shù)之一,是用模糊理論對(duì)重要數(shù)據(jù)分析和建模的方法,建立了樣本類屬的不確定性描述,能比較客觀地反映現(xiàn)實(shí)世界,它通過優(yōu)化目標(biāo)函數(shù)得到每個(gè)樣本點(diǎn)對(duì)所有類中心的隸屬度,從而決定樣本點(diǎn)的類屬以達(dá)到自動(dòng)對(duì)樣本數(shù)據(jù)進(jìn)行分類的目的.模糊C均值算法的步驟如下:
模糊C均值聚類算法是一個(gè)逐步迭代來完成的.但傳統(tǒng)的模糊C均值聚類算法采用基于高斯最小二乘法的數(shù)值優(yōu)化方法,需要函數(shù)的導(dǎo)數(shù)信息,容易出現(xiàn)不收斂、局部極小點(diǎn)問題,而遺傳算法原理本身可保證實(shí)現(xiàn)全局最優(yōu)逼近,可避免收斂到局部最優(yōu)點(diǎn)上,從而具有良好的收斂性、內(nèi)在的隱并行性和很強(qiáng)的全局尋優(yōu)能力,且不依賴于目標(biāo)函數(shù)的梯度信息,克服了基于梯度的下降法的一些缺點(diǎn).遺傳算法的基本操作主要包括:編碼、生成初始種群、適應(yīng)度函數(shù)、選擇、交叉、變異.基于遺傳算法的模糊C均值聚類算法的步驟:
1、對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;
2、計(jì)算初始指標(biāo)權(quán)重;
3、將數(shù)據(jù)進(jìn)行編碼,選擇方式簡(jiǎn)單、易于理解的二進(jìn)制編碼;
4、利用遺傳算法中選擇、交叉和變異算子進(jìn)行運(yùn)算;
5、利用終止條件去確定聚類中心的個(gè)數(shù)m和m個(gè)聚類中心點(diǎn)的坐標(biāo);
6、計(jì)算變化后的模糊分類矩陣;
7、計(jì)算變化后的指標(biāo)權(quán)重;
利用SPSS軟件對(duì)10000名學(xué)生樣本進(jìn)行數(shù)據(jù)處理,采取一般的K均值聚類算法得到表2中的初始聚類中心和表3最終聚類中心:
表2 10000名學(xué)生的體質(zhì)測(cè)試成績(jī)初始聚類中心
表3 10000名學(xué)生的體質(zhì)測(cè)試成績(jī)最終聚類中心
通過利用K均值聚類算法和SPSS得到表3中10000名學(xué)生的體質(zhì)測(cè)試成績(jī)的分類情況如下:
表4 10000名學(xué)生的體質(zhì)測(cè)試成績(jī)的分類情況分布表
針對(duì)10000名學(xué)生體測(cè)數(shù)據(jù),用遺傳—模糊C-均值聚類算法進(jìn)行體測(cè)數(shù)據(jù)的分類,根據(jù)指標(biāo)類型把學(xué)生體質(zhì)分成若干類,并進(jìn)行判別,這些類型由算法本身自動(dòng)生成.在Matlab軟件環(huán)境下數(shù)據(jù)處理結(jié)果,見表5和表6.
表5 10000名學(xué)生的體質(zhì)測(cè)試成績(jī)最終聚類中心
表6 10000名學(xué)生的體質(zhì)測(cè)試成績(jī)的分類情況分布表
根據(jù)表6的聚類結(jié)果可以看出,遺傳—模糊C均值聚類算法相比較K均值聚類算法,迭代次數(shù)少,收斂速度快,得到的聚類結(jié)果較理想,聚類結(jié)果顯示:2類肺活量欠缺,這一類大學(xué)生應(yīng)該加強(qiáng)耐力的鍛煉,可通過長(zhǎng)跑、登山、騎自行車等方式進(jìn)行鍛煉;1類中肺活量和彈跳力不足,這一類大學(xué)生除了增加肺活量的鍛煉以外,還應(yīng)加強(qiáng)“負(fù)重深蹲”、蛙跳、俯臥背起,懸垂舉腿等活動(dòng)的練習(xí);3類跑步等速度指標(biāo)不足,這一類大學(xué)生應(yīng)進(jìn)行速度類鍛煉,可通過蹲踞式起跑、高抬腿、快速起跳等方式鍛煉速度素質(zhì);5類中力量指標(biāo)明顯低于其他指標(biāo),這一類大學(xué)生可以多做一些力量活動(dòng)的練習(xí),比如手臂運(yùn)動(dòng)、啞鈴等等;而4類中指標(biāo)比較均衡,4類中的數(shù)量占樣本總數(shù)的38%左右,這一類中可以認(rèn)為是優(yōu)秀類型.根據(jù)不同類型的欠缺和不足項(xiàng)目,建立學(xué)生體質(zhì)健康狀況評(píng)價(jià)模塊,用以幫助教師及學(xué)生更好地了解學(xué)生的體質(zhì)狀態(tài),對(duì)每位學(xué)生提出合理建議,選擇鍛煉方法,提高學(xué)生健康質(zhì)量.
針對(duì)近年來大學(xué)生的體質(zhì)健康水平呈下降趨勢(shì),本研究以身高、體重、臺(tái)階指數(shù)、肺活量、立定跳遠(yuǎn)、握力6項(xiàng)指標(biāo)作為模型構(gòu)建的指標(biāo)體系,運(yùn)用模糊綜合評(píng)價(jià)方法對(duì)樣本進(jìn)行了多元判別分析,構(gòu)建了分級(jí)模型;采用基于遺傳算法的模糊C均值聚類算法,在一定程度上避免了模糊C均值算法對(duì)初始值敏感和容易陷入局部最優(yōu)解的缺陷,給出一種對(duì)大學(xué)生體質(zhì)健康測(cè)試成績(jī)模糊分類的方法,量化評(píng)價(jià)學(xué)生體質(zhì)健康情況,根據(jù)每位學(xué)生身體素質(zhì)得分對(duì)學(xué)生進(jìn)行分類,了解每位學(xué)生體質(zhì)發(fā)展?fàn)顩r,對(duì)提高不同學(xué)生的體質(zhì)健康水平提出有效性的建議.