曹 浚
西安市高新三中
基于模式識(shí)別的男女體重控制認(rèn)知行為研究
曹浚
西安市高新三中
本文以182名大學(xué)生的真實(shí)體重和期望體重?cái)?shù)據(jù)為研究對(duì)象,利用Matlab編程建立正態(tài)分布假設(shè)下的最小錯(cuò)誤率貝葉斯分類器,進(jìn)行體重?cái)?shù)據(jù)的性別分類,以探究男女性別在體重控制認(rèn)知行為上的差異。
男女性別;體重?cái)?shù)據(jù);模式識(shí)別;貝葉斯決策;Matlab編程
體重是人體的一個(gè)重要生理指標(biāo),與人的健康和外在形象息息相關(guān)。對(duì)于女性而言,體重是一個(gè)預(yù)測(cè)身體吸引力的重要指標(biāo)。近年來(lái),根據(jù)調(diào)查顯示,許多女大學(xué)生認(rèn)為自己太胖,從而有減肥意向,而實(shí)際上女大學(xué)生的超重率小于10%。為此,一些學(xué)者進(jìn)行了女性體重控制認(rèn)知行為失調(diào)的研究。
目前國(guó)內(nèi)外關(guān)于體重控制認(rèn)知行為的研究多集中在女性,對(duì)于男女性別差異在體重控制認(rèn)知行為中的影響研究較少。本文采用模式識(shí)別中的最小錯(cuò)誤率貝葉斯決策方法,基于182個(gè)大學(xué)生的真實(shí)體重?cái)?shù)據(jù)和期望體重?cái)?shù)據(jù)對(duì)性別進(jìn)行分類,進(jìn)而驗(yàn)證男女性別對(duì)體重控制認(rèn)知行為的影響,為后續(xù)男女體重控制認(rèn)知行為提供一定理論基礎(chǔ)。
2.1分類方法介紹
我們所采用的分類方法為最小錯(cuò)誤率貝葉斯決策。將所研究的對(duì)象分為ω1和ω2這兩類,假設(shè)對(duì)象的特征x的數(shù)據(jù)可以通過(guò)某種方式獲得。用P(ω1|x)和P(ω2|x)分別表示這個(gè)時(shí)候ω1類和ω2類的后驗(yàn)概率。由條件概率公式可知,后驗(yàn)概率P(ωi| x)(i=1,2)表示為:
其中P()ωi為ω1和ω2這兩類的先驗(yàn)概率。我們稱
為最小錯(cuò)誤率貝葉斯決策原理。在本課題中,x是一個(gè)二維向量,且我們假設(shè)概率密度函數(shù)P(x|ωi)滿足正態(tài)分布。雙變量正態(tài)分布聯(lián)合概率密度函數(shù)如公式(2-3)所示:
其中-∞〈x,y〈+∞;-∞〈μ1,μ2〈+∞;σ1,σ2〉0;-1≤ρ≤1;μ1,μ2分別是x,y的均值,分別是x,y的方差,ρ是x,y的相關(guān)系數(shù)。
2.2數(shù)據(jù)集說(shuō)明
本課題所用數(shù)據(jù)來(lái)自美國(guó)賓夕法尼亞州立大學(xué)Mind on Statistic公開(kāi)數(shù)據(jù)集。該數(shù)據(jù)集統(tǒng)計(jì)了182名大學(xué)生(女性119名,男性63名)的真實(shí)體重和他們各自所期望的身體重。
隨機(jī)選取數(shù)據(jù)集中少量男性數(shù)據(jù)和女性數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練集中的性別為已知量;剩余數(shù)據(jù)(或全部數(shù)據(jù))為測(cè)試集,測(cè)試集中性別為未知量。將測(cè)試集的分類結(jié)果與真實(shí)性別進(jìn)行對(duì)比即可得出分類錯(cuò)誤率。
隨機(jī)選取19名女性數(shù)據(jù)和9名男性數(shù)據(jù)作為訓(xùn)練集,包含真實(shí)體重(記為actual)、期望體重(記為ideal)這兩個(gè)特征。為了充分挖掘數(shù)據(jù)集中所蘊(yùn)含的信息,計(jì)算真實(shí)體重和期望體重之差(記為diff),作為第三個(gè)特征。
從上述三個(gè)特種兩兩選擇,分別計(jì)算各種特征選取方式下的概率密度函數(shù)參數(shù),如表3.1所示。
表3.1各種特征選取方式下的概率密度函數(shù)參數(shù)
由表3.1可以看出,當(dāng)選擇ideal和diff作為特征時(shí),男性與女性的相關(guān)系數(shù)均最小。
利用第3章中各種特征選取情況下建立起的最小錯(cuò)誤率貝葉斯分類器對(duì)測(cè)試集數(shù)據(jù)進(jìn)行性別分類,并根據(jù)測(cè)試集的真實(shí)性別計(jì)算男性的決策錯(cuò)誤率P(error男)和女性的決策錯(cuò)誤率P(error女)。分別用數(shù)據(jù)集中男女性別的人數(shù)百分比作為男性和女性的先驗(yàn)概率,最后分別用兩種性別的先驗(yàn)概率對(duì)兩種性別的錯(cuò)誤率進(jìn)行加權(quán)求和得到總錯(cuò)誤率P(error總)。結(jié)果如表4.1所示:
表4 .1各種特征選取情況下的決策錯(cuò)誤率
由表4.1可知,選取ideal和diff為特征時(shí),總的決策錯(cuò)誤率最小。
5.總結(jié)與展望
體重是影響人體外在形象的重要指標(biāo)。本文用模式識(shí)別的方法,研究了男女性別在體重控制認(rèn)知行為上的差異。研究結(jié)果顯示,相對(duì)男性大學(xué)生而言,女性大學(xué)生對(duì)自己體重的期望值偏離真實(shí)值更多,也即女性更期望獲得一個(gè)更小的體重。這對(duì)于后續(xù)研究男女審美及體質(zhì)健康均具有一定的理論價(jià)值和意義。
[1][英]斯瓦米,[英]富氽漢姆.魅力心理學(xué)[M].華夏出版社,2011.
[2]高德順,鄒大華,沈勛章,等.東亞地區(qū)四大城市女大學(xué)生青春期減肥意向的比較研究——自我體型的誤區(qū)與社會(huì)性體型焦慮的現(xiàn)狀[J].體育科研,2002(2)∶38-40.
[3]高德順,陳海濤,丁洪祥.關(guān)于青春期女大學(xué)生減肥的調(diào)查研究[J].中國(guó)體育科技,2002,38(6)∶36-38.
[4]尹小儉,季成葉,李世昌.大學(xué)生肥胖的現(xiàn)況與體質(zhì)健康的相關(guān)性研究[J].現(xiàn)代預(yù)防醫(yī)學(xué),2007,34(23)∶4527-4530.
[5]石巖,周璠.女性體重控制認(rèn)知行為失調(diào)的三維模型構(gòu)建[J].體育科學(xué),2012,32(9)∶23-30.
[6]周璠.女大學(xué)生體重控制認(rèn)知行為失調(diào)研究[D].山西大學(xué),2014.
曹浚(1999-),男,陜西省旬陽(yáng)縣人,就讀于陜西省西安市高新第三中學(xué),高中在讀,研究方向:模式識(shí)別與人工智能。