李昌鋒 張星 林福生 林增榮
(福建生物工程職業(yè)技術(shù)學院 福建福州 350002)
基于Fisher判別分析的大學生體質(zhì)健康綜合評價分級模型研究
李昌鋒 張星 林福生 林增榮
(福建生物工程職業(yè)技術(shù)學院 福建福州 350002)
本文旨在研究通過Fisher線性判別分析建立大學生體質(zhì)健康綜合評價分級模型。樣本數(shù)據(jù)來自福建生物工程職業(yè)技術(shù)學院在校大學生的體質(zhì)測試數(shù)據(jù),從中隨機抽取訓練集樣本1100例和測試樣本集550例,利用MATLAB軟件來完成模型的建立與驗證測試。測試結(jié)果表明,采用此模型能夠快速有效地對該校大學生體質(zhì)健康狀況進行綜合評價,實現(xiàn)對學生體質(zhì)健康類別的快速分類。
大學生體質(zhì)健康 Fisher線性判別 評價模型 MATLAB
近年來,大學生體質(zhì)健康水平呈下降趨勢。如何科學有效地評價大學生的體質(zhì)健康狀況,對促進大學生進行科學有效的體育鍛煉,養(yǎng)成良好的體育鍛煉習慣及促進學校體育教學改革都具有十分重大的意義。本文旨在研究一種基于Fisher判別分析的分級評價模型,該模型能夠有效、科學地對大學生體質(zhì)健康進行分級綜合評價,能夠?qū)Υ髮W生體質(zhì)發(fā)展趨勢進行分析,為制定大學生運動處方、促進大學生自我評價、加強大學生體育鍛煉提供有效依據(jù)[1]。
本文以福建生物工程職業(yè)技術(shù)學院在校大學生的體質(zhì)健康測試數(shù)據(jù)為樣本,測試指標分別為身高、體重、肺活量、50m跑、立地跳遠、坐位體前屈、1000m跑(女生為800m跑)、引體向上(女生為1min仰臥起坐)等8個項目。根據(jù)《國家學生體質(zhì)健康標準》,測試結(jié)果分為優(yōu)秀、良好、及格、不及格四個等級??紤]到男生和女生的體質(zhì)健康評分標準不同,所以將數(shù)據(jù)樣本分為男生和女生兩類進行處理,并建立各自的評級模型。所有的數(shù)據(jù)樣本都是通過Microsoft Excel進行篩選,將測試項目不全的、離散程度超過3S的數(shù)據(jù)剔除,并從4個等級的樣本集中隨機抽取男女生訓練樣本集1100例和測試樣本集550例。
Fisher是一種可以利用大量已有的同構(gòu)標記數(shù)據(jù)(源域)設(shè)計小樣本訓練數(shù)據(jù)(目標域)分類器的算法。Fisher準則基本原理:找到一個最合適的投影軸,使兩類樣本在該軸上投影之間的距離盡可能遠,而每一類樣本的投影盡可能緊湊,從而使分類效果為最佳[2]。
數(shù)據(jù)分為4個樣本集合{優(yōu)秀、良好、及格、不及格},所以為了實現(xiàn)兩兩進行判別比較,需要分別建立6個Fisher算法分類器:
其中:
X為樣本數(shù)據(jù)(x1,x2,x3,x4,x5,x6,x7,x8);
Yk為分類器判別函數(shù)式;
w*k為分類器各維數(shù)系數(shù)向量;
w0k為分類器閾值。
表1 男生Fisher線性判別系數(shù)表
表2 女生Fisher線性判別系數(shù)表
k=1,表示分類器1:優(yōu)秀與良好判別分類;
k=2,表示分類器2:優(yōu)秀與及格判別分類;
k=3,表示分類器3:優(yōu)秀與不及格判別分類;
k=4,表示分類器4:良好與及格判別分類;
k=5,表示分類器5:良好與不及格判別分類;
k=6,表示分類器6:及格與不及格判別分類。
整個算法設(shè)計是根據(jù)樣本數(shù)據(jù)的分類進行分支處理,通過給定的訓練數(shù)據(jù),確定Fisher線性判別函數(shù)的投影方向W和閾值W0,然后根據(jù)這個線性判別函數(shù),對測試數(shù)據(jù)進行測試得到測試數(shù)據(jù)的類別。
Fisher分類器的具體算法步驟實現(xiàn)如下[3]:
(2)樣本類內(nèi)離散度矩陣:Si=∑x∈Xi(x?mi)(x?mi)T,,i=1,2,3,4。
(3)總類內(nèi)離散度矩陣:Swk=Si+Sj。
(4)求最佳向量:w?k=Swk?1mi?mj。
(3)(4)(5)中k=1,2,3,4,5,6,(i,j)∈{(1,2),(1,3),(1,4),(2,3),(2,4),(3,4)。
模型求解使用MATLAB軟件完成,分別得到男生和女生的Fisher線性判別系數(shù)表,如表1,表2所示。
應(yīng)用測試樣本集對模型進行測試檢驗,測試結(jié)果為:男生體質(zhì)健康分級評價模型測試總的準確率為93.1%,誤判率為6.9%;女生體質(zhì)健康分級評價模型測試總的準確率為94.2%,誤判率為5.8%??梢哉J為該模型具有較好的分級區(qū)分度,效果顯著。
另外,女生總的分級效果略好于男生。從原始數(shù)據(jù)分布特點來看,男生各項指標的數(shù)據(jù)分布離散度比女生略大,導(dǎo)致男生數(shù)據(jù)在4個等級類別的交叉邊界處存在重疊樣本數(shù)的可能性增大,而在邊界數(shù)據(jù)的判別上Fisher準則的準確度會略微降低。這個結(jié)果符合模型的特點,也是后續(xù)需要進一步改進優(yōu)化的地方。
該模型具有計算快速、實用性強、極具推廣性等優(yōu)勢。該模型算法可以針對不同群體樣本進行推廣適用。比如:將樣本集擴充到福建省大學生體質(zhì)健康數(shù)據(jù),那么通過Fisher準則訓練,便可得到相應(yīng)的適用模型參數(shù)。同樣還可以推廣到中老年人群的體質(zhì)健康評測。
本文選用Fisher算法來建立大學生體質(zhì)健康綜合評價分級模型,并對其準確度和實用性進行了驗證。樣本測試結(jié)果表明,用本評價模型對學生個體進行評價具有較高的準確度,其設(shè)計思想與大學生體質(zhì)健康水平分布的實際情況相符合,運用本模型可對學生個體或群體進行綜合評價,實現(xiàn)對學生體質(zhì)類別的科學快速分類。
該評價模型與《國家學生體質(zhì)健康標準》的綜合評價方法相比,減少了程序,只需要進行一次算法調(diào)用運算,便能得出學生個體或群體的體質(zhì)等級,免去查找各指標得分并要進行權(quán)重計算的繁雜過程。同時,這種方法能夠充分考慮到人在評估過程中的主觀能動作用,能夠克服人為評價的局限性??傊?,該分級評價模型對于監(jiān)測大學生體質(zhì)健康狀況和預(yù)測大學生體質(zhì)發(fā)展能夠起到有效積極的作用。
[1]石娟娟.大學生體質(zhì)健康綜合評價分級模型構(gòu)建的研究[D].武漢:華中科技大學,2011.
[2]盧卓,鄧方貞.基于Fisher分類算法的水稻種子品種識別[J].南方農(nóng)機,2015(10):10-11.
[3]陳國華,韋程東,蔣建初,等.數(shù)學模型與數(shù)學建模方法[M].天津:南開大學出版社,2012.
G804
A
2095-2813(2017)10(b)-0020-02
10.16655/j.cnki.2095-2813.2017.29.020