■王 飛 劉大鳴(特級教師)
本文針對統(tǒng)計解題中常見的易錯、易混、易忘的典型問題進行錯解剖析,幫助同學(xué)們識破命題者精心設(shè)計的陷阱,希望對同學(xué)們的學(xué)習(xí)有所幫助。
例1中央電視臺動畫城節(jié)目為了對本周的熱心觀眾給予獎勵,要從2014名小觀眾中抽取50名幸運小觀眾。先用簡單隨機抽樣從2014人中剔除14人,剩下的2000人再按系統(tǒng)抽樣方法抽取50人,則在2014人中,每個人被抽取的可能性( )。
A.均不相等
B.不全相等
錯解:應(yīng)選A或D。
剖析:對個體入樣的可能性與抽樣間隔理解不透,導(dǎo)致錯選。對于A,認(rèn)為剔除14人,被抽取的機會就不相等了。對于D,認(rèn)為被抽取的機會相等,計算時利用了剔除后的數(shù)據(jù)。
正解:在系統(tǒng)抽樣中,若所給的總體個數(shù)不能被樣本容量整除,則應(yīng)先剔除幾個個體。本題先剔除14人,然后再分組,在剔除過程中,每個個體被剔除的機會相等,所以每個個體被抽到的機會都相等,均為應(yīng)選C。
警示:當(dāng)總體容量較大,總體可以分為均勻的幾個部分時,用系統(tǒng)抽樣較為合理;當(dāng)總體容量除以樣本容量不是整數(shù)時,要先在總體中剔除部分個體,總體中的每個個體被剔除的機會是均等的,也就是說每個個體不被剔除的機會也是均等的。由此可知在整個抽樣過程中,每個個體被抽到的機會仍然相等。設(shè)在第一段內(nèi)用簡單隨機抽樣方法確定的個體編號為a1,按系統(tǒng)抽樣法,則抽取樣本an滿足
例2某單位有老年人28人,中年人54人,青年人81人,為了調(diào)查他們的身體情況,需從中抽取一個容量為36的樣本,則適合的抽樣方法是( )。
A.簡單隨機抽樣
B.系統(tǒng)抽樣
C.直接運用分層抽樣
D.先從老年人中剔除1人,再用分層抽樣
錯解:因為總體由差異明顯的三部分組成,所以考慮用分層抽樣???cè)藬?shù)為28+54+81=163,樣本容量為36,抽樣比為這時無法得到整數(shù)解,因此考慮先剔除1人,則抽樣比變?yōu)槿魪睦夏耆酥须S機地剔除1人,則老年人應(yīng)抽取27×6(人),中年人應(yīng)抽取54×12(人),青年人應(yīng)抽取81×=18(人),即組成容量為36的樣本。應(yīng)選D。
剖析:若用簡單隨機抽樣先從老年人中剔除1人,則老年人被抽到的概率顯然比其他人群小了,這不符合隨機抽樣的特征,即每個個體入樣的概率相等。注意“先從老年人中剔除1人”與“從總體中隨機剔除1人”是不一樣的。
正解:直接運用分層抽樣法。老年人,中年人和青年人中應(yīng)抽取的人數(shù)分別為
警示:當(dāng)總體可以分層,層與層之間有明顯差異時,選用分層抽樣,確定抽樣比k是分層抽樣的關(guān)鍵。一般地,先確定抽樣比k=為總體容量,n為樣本容量),再按抽樣比k在各層中抽取個體,就能確保抽樣的公平性。在每層抽樣時,應(yīng)采用簡單隨機抽樣或系統(tǒng)抽樣的方法。
例3有一容量為500的樣本,把數(shù)據(jù)分成7組,它的頻率分布直方圖如圖1所示。
圖1
根據(jù)頻率分布直方圖,請你估計數(shù)據(jù)落在[15.5,24.5)內(nèi)的樣本數(shù)量。
錯解:由頻率分布直方圖可知,數(shù)據(jù)落在[15.5,18.5)內(nèi)的頻率為0.054,數(shù)據(jù)落在[18.5,21.5)內(nèi)的頻率為0.06,數(shù)據(jù)落在[21.5,24.5)內(nèi)的頻率為0.075。所以數(shù)據(jù)落在[15.5,24.5)內(nèi)的樣本數(shù)量為500×(0.054+0.06+0.075)=94.5。所以估計數(shù)據(jù)落在[15.5,24.5)內(nèi)的樣本數(shù)量大約為95。
剖析:沒有看懂縱坐標(biāo)所表示的意義,錯把縱坐標(biāo)表示的數(shù)據(jù)作為頻率了,其實縱坐標(biāo)表示的是若要計算頻率,則要找出組距,從橫坐標(biāo)中明顯看出組距為3。
正解:由頻率分布直方圖可知,數(shù)據(jù)分成7組,其組距為3,所以數(shù)據(jù)落在[15.5,18.5)內(nèi)的頻率為0.054×3,數(shù)據(jù)落在[18.5,21.5)內(nèi)的頻率為0.06×3,數(shù)據(jù)落在[21.5,24.5)內(nèi)的頻率為0.075×3。所以數(shù)據(jù)落在[15.5,24.5)內(nèi)的樣本數(shù)量為500×(0.054×3+0.06×3+0.075×3)=283.5。
所以估計數(shù)據(jù)落在[15.5,24.5)內(nèi)的樣本數(shù)量大約為284。
警示:正確地認(rèn)識頻率分布直方圖:縱坐標(biāo)表示的是而非頻率;頻率=;小矩形的面積=頻率。利用頻率分布直方圖可求眾數(shù),中位數(shù)和平均數(shù):最高小矩形底邊中點的橫坐標(biāo)即是眾數(shù);中位數(shù)左邊和右邊的小矩形的面積之和是相等的;平均數(shù)是頻率分布直方圖的“重心”,平均數(shù)等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標(biāo)之和。
例4某市對上下班情況作了抽樣調(diào)查,上下班時間各抽測了12輛機動車的車速如下(單位:km/h):
上班時間:30,33,18,27,32,40,26,28,21,28,35,20;
下班時間:27,19,32,29,36,29,30,22,25,16,17,30。
用莖葉圖表示以上數(shù)據(jù)。
錯解:機動車行駛速度的莖葉圖如圖2所示。
圖2
剖析:對莖葉圖畫法規(guī)則和特征理解不到位,莖葉圖中重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄。上述解法漏掉了3個重復(fù)的數(shù)據(jù)。
正解:畫莖葉圖時,需要將每個數(shù)據(jù)分為“莖”和“葉”兩部分,表示“莖”的數(shù)字按照大小順序由上到下排列,表示“葉”的數(shù)字,重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄。
畫出莖葉圖,如圖3所示。
圖3
警示:用莖葉圖分析數(shù)據(jù)直觀、清晰,所有信息都可以從莖葉圖中得到。莖葉圖在樣本數(shù)據(jù)較少,較為集中且位數(shù)不多時比較適用。由于它較好地保留了原始數(shù)據(jù),所以可用來分析樣本數(shù)據(jù)的一些數(shù)字特征,如眾數(shù)、中位數(shù)、平均數(shù)等。
例5甲、乙兩種冬小麥試驗品種連續(xù)5年的平均單位面積產(chǎn)量如表1所示(單位:t/km2)。
表1
若某村要從中引進一種冬小麥大量種植,請給出你的建議。
錯解:由表1中的數(shù)據(jù)可得=10,則甲、乙兩種冬小麥的平均產(chǎn)量都等于10,所以可以引進兩種冬小麥的任意一種。
剖析:上述解法只對兩種冬小麥的平均產(chǎn)量進行了比較,而忽視了對冬小麥產(chǎn)量穩(wěn)定性的討論。
正解:由表1中的數(shù)據(jù)可得(10.1-10)2+(10-10)2+(10.2-10)2]=(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244。由于甲、乙兩種冬小麥的平均產(chǎn)量都等于10,且s2甲<s2乙,所以產(chǎn)量比較穩(wěn)定的為甲種冬小麥,應(yīng)推薦引進甲種冬小麥大量種植。
警示:平均數(shù)反映的是樣本個體的平均水平,方差和標(biāo)準(zhǔn)差則反映了樣本的波動、離散程度。對于形如“誰發(fā)揮更好、誰更穩(wěn)定、誰更優(yōu)秀”之類的題目,除了比較數(shù)據(jù)的平均數(shù),還應(yīng)比較方差或標(biāo)準(zhǔn)差的大小,以作出更為公正合理的判斷。
例6一次數(shù)學(xué)知識競賽中,兩組學(xué)生的成績?nèi)绫?所示。
表2
經(jīng)計算,已知兩個組的平均分都是80分,請根據(jù)所學(xué)過的統(tǒng)計知識,進一步判斷這次競賽中哪個組更優(yōu)秀,并說明理由。
錯解:由于乙組90分以上的人數(shù)為24,甲組90分以上的人數(shù)為20,所以乙組更優(yōu)秀。
剖析:對一組數(shù)據(jù)進行分析時,應(yīng)從平均數(shù),眾數(shù),中位數(shù),方差,極差等多個角度進行分析和判斷。
正解:(1)甲組成績的眾數(shù)為90,乙組成績的眾數(shù)為70,從成績的眾數(shù)這一角度看,甲組成績好些。
因為s2甲<s2乙,所以甲組的成績比乙組的成績更穩(wěn)定。
(3)甲、乙兩組成績的中位數(shù)、平均數(shù)都是80,其中甲組成績在80分以上(含80分)的有33人,乙組成績在80分以上(含80分)的有26人,從這一角度看,甲組的成績總體較好。
(4)從成績統(tǒng)計表看,甲組成績大于或等于90分的有20人,乙組成績大于或等于90分的有24人,可知乙組成績在高分段的人數(shù)多,同時,乙組滿分比甲組多6人,從這一角度看,乙組成績較好。
警示:正確解答此題,首先,要抓住問題的關(guān)鍵,全方位地進行計算,不能僅從平均數(shù)與樣本方差的大小去判斷哪一組的優(yōu)劣,對于這樣的實際問題,要從實際的角度去分析,如本題中的“高分段人數(shù)”“滿分人數(shù)”等;其次,要在恰當(dāng)?shù)卦u估后,作出正確的結(jié)論。