粟瓊
【摘要】正態(tài)分布又叫高斯分布,是反映自然界中事物“發(fā)生—到達頂峰—消亡”過程的規(guī)律總結,它在自然界,人類社會等都有大量體現(xiàn)。本文就一維正態(tài)分布與二維正態(tài)分布的特點做出分析,研究其特征。
【關鍵詞】正態(tài)分布;一維;二維
正態(tài)分布是也叫常態(tài)分布或者高斯分布,最早由棣莫弗在求二項分布的漸近公式中得到,是一個在數(shù)學、物理及工程等領域都非常重要的概率分布,同時在統(tǒng)計學中都有很廣泛的運用,影響極其深遠。
一、一維正態(tài)分布的定義及密度曲線的分析
(一)一維正態(tài)分布定義
在多次高爾頓釘板試驗中,掉入中間槽的球的個數(shù)多于掉入兩邊的槽的球的個數(shù),并且從中間往兩邊遞減。如果我們將球槽從左至右編號,以這些編號為橫坐標,以每個球槽落入的小球個數(shù)為縱坐標建立坐標系,則可以做出頻率分布直方圖,將頻率分布直方圖上方中點用直線連接起來畫出頻率分布折線圖,當我們的球槽足夠多足夠密時,這些折線近似一條光滑的曲線,我們把它稱為總體密度曲線,在高爾頓釘板試驗中的總體密度曲線就像一個倒扣的鐘形,兩頭低中間高,并且兩邊對稱,我們也把它叫做“鐘形曲線”,也叫“正態(tài)分布密度曲線”。
(二)一維正態(tài)分布密度曲線的分析
正態(tài)分布密度曲線公式中的參數(shù)和為常數(shù),它們的值決定了曲線的位置與高度,下面研究這兩個常數(shù)的變化對正態(tài)分布密度曲線的影響。
1.當取固定值分別取值x1、x2、x3時,曲線圖形如圖所示:
2.當取固定值分別取值、1、2時,曲線圖形如圖所示:
由圖可知只影響曲線的位置,不影響曲線的形狀,只影響曲線的形狀,不影響曲線的位置,越小,標準差就越小,圖形就越“瘦高”,就越集中在期望的附近。
二、二維正態(tài)分布的定義及密度曲線的分析
在統(tǒng)計學中,正態(tài)分布的影響力極其深遠,一維正態(tài)分布不管是定義還是性質都比較容易理解,但是現(xiàn)實生活中,對某一事物產生影響的不僅僅是一個變量,可能會有兩個甚至多個變量,那也就需要二維甚至多維的正態(tài)分布數(shù)據(jù)進行分析。下面就二維正態(tài)分布作出分析:
在三維空間中,為了更形象地描述二維正態(tài)分布,我們在空間直角坐標系中研究二維正態(tài)分布密度曲線,其函數(shù)的圖形像一個倒扣在xOy平面上的鐘,中心點對應xoy平面中的點,由一維正態(tài)分布的經驗我們容易知道不改變其它參數(shù),只改變、的值,則該函數(shù)曲線的形狀不會發(fā)生改變,只會改變這個“鐘形”的中心位置。
我們考慮單個的值變化時圖形的改變,下圖從左至右是取固定值2時,分別取值1、2、3、4這四個值時對應的圖形,顯然,當?shù)闹翟酱髸r,在x軸方向上,圖形就越“矮平”,X的值就越分散。
同理,如果我們只考慮的變化,則的值越大時,在y軸方向上,圖形就越“矮平”,Y的值就越分散。
最后我們考慮的值對圖形的影響,我們保持其他四個參數(shù)的值不變,的值分別取值0、0.25、-0.5、0.9這四個值,對應的圖形分別如下圖所示:
從圖形可以看得出來,隨著的值的絕對值越大,圖形對應更“集中”,更集中在中心線的周圍,所以我們也更容易理解,當?shù)慕^對值越大時,X與Y的線性相關關系就越強,的正負則說明了X與Y是正相關還是負相關的關系。
二維正態(tài)分布的兩個邊緣分布均為一維正態(tài)分布,X~,Y~。
二維正態(tài)分布的應用也比較廣泛,比如當我們研究男女性別對學生數(shù)學成績的影響時,我們就可以收集大量的成績數(shù)據(jù),利用二維正態(tài)分布模型就很容易看得出來性別差異與數(shù)學成績的關系。
其實,實際問題中,當影響結果的變量較多時,也可以用多維正態(tài)分布來分析,在此文中就不再討論了。
三、正態(tài)分布的應用
正態(tài)分布在變量分析中有非常廣泛地應用,它描述了自然界中“產生——發(fā)展——高潮——消亡”的過程,能夠用于輔助判斷自然界中出現(xiàn)的事物的發(fā)展過程。大量的數(shù)據(jù)與實驗結果表明,自然界中的現(xiàn)象大部分都可以看成服從或者近似地服從正態(tài)分布,所以,正態(tài)分布在人類社會中具有很廣泛的研究應用價值和指導價值,正態(tài)分布的研究反過來也有利于促進人類的發(fā)展與進步。
現(xiàn)在,通過正態(tài)分布研究,我們可以確定在社會生產活動和科學實驗中,很多變量的概率分布都可以近似地用正態(tài)分布來描述。例如,人類社會中某種疾病的出現(xiàn)和發(fā)展過程;某個地區(qū)一年的降水量的情況;人類在某個年齡段的身高、體重、脂肪率等情況;同一種植物種子的發(fā)芽情況;同一批考生的考試成績情況;某個工廠同一批次的產品的質量情況等等,均近似地呈現(xiàn)正態(tài)分布的特點。
在關于正態(tài)分布的研究中,有一個很有趣的現(xiàn)象,很多事物的分布原本并不服從或者近似地服從正態(tài)分布,但是,當我們將樣本容量擴充到一定程度以后,反倒服從或者近似地服從正態(tài)分布了。所以,正態(tài)分布是我們認識這個世界的有力武器,為我們揭示自然界的規(guī)律提供了強有力的指導。
既然正態(tài)分布能夠解釋這么多事物的規(guī)律,那滿足什么樣的特點的事物或者現(xiàn)象才服從正態(tài)分布或近似地服從正態(tài)分布呢?一般說來,只要某個事物或現(xiàn)象發(fā)生的最終結果是受到很多相互獨立的微小因素的影響的,我們就認為這個事物或者現(xiàn)象符合正態(tài)分布的規(guī)律。比如,10歲女孩的身高情況,既受到先天因素的影響,又在后天也會受到多重因素的影響。先天因素當中包括父母的遺傳因素,母親的孕期營養(yǎng)等,后天因素包括睡眠、飲食、營養(yǎng)等等,由于有多種相互獨立的隨機因素影響女孩的身高情況,我們可以把這個年齡段的女孩身高情況看成服從或者近似地服從正態(tài)分布,從而加以研究。
當然,正態(tài)分布也不能解釋這個世界上的所有事物,它的使用也受到一定的限制,這種限制主要表現(xiàn)在:
1.正態(tài)分布只能用來解釋同一事物或者現(xiàn)象的分布情況,可以體現(xiàn)出同一事物或現(xiàn)象在自然狀態(tài)下的規(guī)律,也能說明不同個體在這一規(guī)律下的差異,但是無法將其他不同的事物或者現(xiàn)象混合在一起解釋。
2.正態(tài)分布只能用來描述在多種隨機因素影響下的事物或者現(xiàn)象,如果是確定性的因素則無法描述,比如,函數(shù)關系這種確定性的關系則不能用正態(tài)分布來表達。
3.正態(tài)分布所描述的事物或現(xiàn)象的結果往往有非常多種,結果數(shù)量很有限的事物則往往無法用正態(tài)分布來解釋,比如拋一枚硬幣,其結果只有“正面向上”和“反面向上”兩種結果,那么它的規(guī)律就無法用正態(tài)分布來解釋。
總而言之,正態(tài)分布是我們研究、認識這個世界,揭示人類社會生產實踐和科學研究,改造世界的強大武器。
參考文獻:
[1]鄭文兵.正態(tài)分布的哲學本質及世界觀意義研究[J].畢節(jié)學院學報,2012(1).
[2]韓苗,周圣武.二維正態(tài)分布及其常用結論[J].數(shù)學學習與研究,2019.