第五河清
在一次高三練考中,一道試題引起大家的討論,試題是這樣的:對某籃球運動員在100場比賽中的得分情況進(jìn)行統(tǒng)計,得分統(tǒng)計表如下:
在所進(jìn)行的100場比賽中,按表格中各分值區(qū)間的場數(shù)分布采用分層抽樣法取出10場比賽,再從這10場比賽中隨機選出2場作進(jìn)一步分析,記這2場比賽中得分不低于30分的場數(shù)為,求的分布列和數(shù)學(xué)期望。
考試中出現(xiàn)了兩種不同的解法:
解法一:按照分層抽樣法,在[0,10),[10,20),[20,30),[30,40)內(nèi)抽出的比賽場數(shù)分別為1,2,3,4,的取值為0,1,2,按超幾何分布建立的分布列,
求得E=0·+1·+2·=
解法二:的取值為0,1,2,按照二項分布的分布列,求得E=0·+1·+2·=
分布列不一樣,為什么期望卻一致?是巧合還是必然?我們嘗試改變數(shù)據(jù)進(jìn)行檢驗。
改變1:將隨機選出2場改為隨機選出3場,所得期望分別如下:
二項分布:=np=3×=,超幾何分布:
改變2:將隨機選出2場改為隨機選出4場,所得期望分別如下:
二項分布:E=,超幾何分布:E=
結(jié)果是期望依然相等,而且,隨著數(shù)據(jù)的增大,兩種不同分布列對應(yīng)概率之間的差距逐漸縮小,我們做出這樣的猜想:樣本個數(shù)越大二項分布和超幾何分布的對應(yīng)概率之間的差距越小,當(dāng)樣本個數(shù)無窮大時,二項分布和超幾何分布的對應(yīng)概率相等,換言之,超幾何分布的極限就是二項分布,即=Cnkpk(1-p)n-k。參考有關(guān)資料,證明我們的直觀思想正確,當(dāng)產(chǎn)品總數(shù)很大而抽出的產(chǎn)品較少時,每次抽出產(chǎn)品后,次品率近似不變。這樣就可以近似看成每次抽樣的結(jié)果是相互獨立的,抽出產(chǎn)品中的次品件數(shù)近似服從二項分布,人們在實際工作中常利用這一點,把抽取對象數(shù)量較大時的無放回抽樣(例如破壞性試驗發(fā)射炮彈,產(chǎn)品的壽命試驗等),當(dāng)作有放回來處理。
編輯 謝尾合