李沁杭
摘要:為了彌補傳統(tǒng)正態(tài)分布概率查表計算的局限性,本文根據(jù)定積分的極限定義,融合計算機的快速計算能力,設計和實現(xiàn)正態(tài)分布機器計算。數(shù)據(jù)仿真表明本文提出的機器計算精度達到了工程要求。
關鍵詞:正態(tài)分布;概率;機器計算
1.引言
由大數(shù)定理和中心極限定理可知[1],自然界的許多隨機變量均可由正態(tài)分布來模擬。如醫(yī)學中同質群體的身高、紅細胞數(shù)、血紅蛋白量均呈現(xiàn)正態(tài)或近似正態(tài)分布,實驗中的隨機誤差也可按正態(tài)分布規(guī)律處理。正態(tài)分布是一個在數(shù)學、物理及工程等領域都非常重要的概率分布,甚至在統(tǒng)計學的許多方面存在重大的影響力。
連續(xù)性正態(tài)分布的密度函數(shù) 為:
(1)
式中表示隨機變量,是隨機變量均值,是隨機變量的方差。正態(tài)分布的密度函數(shù)的特點是:關于對稱且在該處最大值,在正(負)無窮遠處取值為0,在處有拐點, 它的形狀是中間高兩邊低。當是為標準正態(tài)分布,如圖1所示。服從正態(tài)分布的隨機變量的概率規(guī)律為:鄰近的概率大,而遠離的概率越小;越小,分布集中在附近,反之,分布越分散。
對于標準正態(tài)分布概率計算常常采用查表計算方法,正態(tài)分布的概率計算一般使用將原來的分布轉化為標準正態(tài)分布利用查表進行計算。
傳統(tǒng)查表計算正態(tài)分布概率必須具有標準正態(tài)分布表,同時需要人為進行必要的的計算。上述因素使得傳統(tǒng)計算方法效率較低,為了彌補這些不足,本文運用定積分的極限定義,結合計算機的快速計算能力,實現(xiàn)正態(tài)分布概率的快速計算。
2.機器計算
設隨機變量服從期望為方差為 的正態(tài)分布,隨機變量在區(qū)間的概率:
(2)
(2)無法運用牛頓積分法得到其解析解。本文運用定積分的極限定義[2],將區(qū)間等間隔劃分為個子區(qū)間,如圖2所示。運用矩形面積逼近(2)式:
(3)
(3)式的取值決定了得精度,越大,其精度越高,但計算量較大。
在實際應用中,除了計算區(qū)間的概率外,還存在和兩種概率的計算,由于計算無法對進行數(shù)值計算,本文根據(jù)正態(tài)分布的對稱性,將的概率轉化為:
(4)
同理可得
(5)
3.實驗仿真
為了驗證本文算法的有效性,在1.6GHz主頻CPU和4G RAM的個人計算機上,運用C語言編程實現(xiàn)[3],本文未采用任何優(yōu)化計算,對服從標準正態(tài)分布的任意區(qū)間概率進行計算,并與人工查表計算相比較,部分結果如表1所示。本文算法的運行時間較短,其中最大為2.710ms。相對于人工計算,本文算法最大相對誤差為0.877%,滿足工程要求。
為了進一步驗證本文算法的有效性,對服從期望為方差為 的正態(tài)分布的任意區(qū)間概率進行計算,并與人工查表計算相比較,部分結果如表2所示。本文算法的運行時間較短,其中最大為2.882ms。相對于人工計算,本文算法最大相對誤差為0.961%,滿足工程要求。
4.結論
傳統(tǒng)查表計算正態(tài)分布概率必須具有標準正態(tài)分布表,效率較低,同時需要人為進行必要的的計算。為了彌補為了彌補傳統(tǒng)正態(tài)分布概率查表計算的局限性這些不足,本文運用定積分的極限定義,結合計算機的快速計算能力,實現(xiàn)正態(tài)分布概率的快速計算。仿真結果表明,本文算法的計算效率較高,且計算精度滿足工程要求。
參考文獻:
[1]劉紹學 普通高中課程標準試驗教科書 數(shù)學選修2-3 人民教育出版社,2009年4月第3版 2015年6月成都第7次印刷
[2]劉紹學 普通高中課程標準試驗教科書 數(shù)學選修2-2 人民教育出版社,2007年1月第2版 2015年5月成都第7次印刷
[3]譚浩強 C程序設計(第四版)清華大學出版社 2012年07月