陳忠
用樣本分布估計(jì)總體分布是從樣本分布狀況的角度分析總體的規(guī)律,涉及的內(nèi)容有圖表和數(shù)字特征. 其中圖表包括頻率分布表及直方圖、折線圖、散點(diǎn)圖、莖葉圖. 數(shù)字特征包括平均數(shù)、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差等. 考綱對(duì)這部分內(nèi)容的要求是識(shí)圖、讀圖和估計(jì). 本文將通過(guò)幾個(gè)實(shí)例分析這類題型的解法.
數(shù)據(jù)特征
例1 為評(píng)估一種農(nóng)作物的種植效果,選了[n]塊地作試驗(yàn)田.這[n]塊地的畝產(chǎn)量(單位:kg)分別為[x1],[x2],…,[xn],下面給出的指標(biāo)中可以用來(lái)評(píng)估這種農(nóng)作物畝產(chǎn)量穩(wěn)定程度的是( )
A. [x1],[x2],…,[xn]的平均數(shù)
B.[x1],[x2],…,[xn]的標(biāo)準(zhǔn)差
C.[x1],[x2],…,[xn]的最大值
D.[x1],[x2],…,[xn]的中位數(shù)
解析 刻畫評(píng)估這種農(nóng)作物畝產(chǎn)量穩(wěn)定程度的指標(biāo)是標(biāo)準(zhǔn)差.
答案 B
點(diǎn)評(píng) 眾數(shù):一組數(shù)據(jù)出現(xiàn)次數(shù)最多的數(shù)叫眾數(shù),眾數(shù)反應(yīng)一組數(shù)據(jù)的多數(shù)水平. 中位數(shù):一組數(shù)據(jù)中間的數(shù)(起到分水嶺的作用),中位數(shù)反應(yīng)一組數(shù)據(jù)的中間水平. 平均數(shù):反應(yīng)一組數(shù)據(jù)的平均水平. 方差:反映和中心偏離的程度,用來(lái)衡量一批數(shù)據(jù)的波動(dòng)大?。催@批數(shù)據(jù)偏離平均數(shù)的大?。?,并把它叫作這組數(shù)據(jù)的方差.在樣本容量相同的情況下,方差越大,說(shuō)明數(shù)據(jù)的波動(dòng)越大,越不穩(wěn)定.標(biāo)準(zhǔn)差是方差的算術(shù)平方根,意義在于反映一個(gè)數(shù)據(jù)集的離散程度.
頻率分布表及頻率分布直方圖
例2 某手機(jī)賣場(chǎng)對(duì)市民進(jìn)行國(guó)產(chǎn)手機(jī)認(rèn)可度的調(diào)查,隨機(jī)抽取100名市民,按年齡(單位:歲)進(jìn)行統(tǒng)計(jì)的頻數(shù)分布表和頻率分布直方圖如下. 求頻率分布表中[x,y]的值,并補(bǔ)全頻率分布直方圖.
解析 由圖知,[P(25≤x<30)=0.01×5=0.05],
故[x=100×0.05=5].
[P(30≤x<35)]=1-(0.05+0.35+0.3+0.1)=1-0.8=0.2,
故[y]=100×0.2=20.
圖中缺失部分:[頻率組距=0.25=0.04](畫圖略).
點(diǎn)評(píng) 用樣本估計(jì)總體是統(tǒng)計(jì)的基本思想,而利用頻率分布表和頻率分布直方圖來(lái)估計(jì)總體則是用樣本的頻率分布去估計(jì)總體分布的兩種主要方法. 頻率分布表在數(shù)量表示上比較準(zhǔn)確,頻率分布直方圖比較直觀. 頻率分布表中的頻數(shù)之和等于樣本容量,各組中的頻率之和等于1;在頻率分布直方圖中,各小長(zhǎng)方形的面積表示相應(yīng)各組的頻率,所以,所有小長(zhǎng)方形的面積的和等于1.
例3 某大學(xué)藝術(shù)專業(yè)400名學(xué)生參加某次測(cè)評(píng),根據(jù)男、女學(xué)生人數(shù)比例,使用分層抽樣的方法從中隨機(jī)抽取了100名學(xué)生,記錄他們的分?jǐn)?shù),將數(shù)據(jù)分成7組:[20,30),[30,40),…,[80,90],并整理得到如下頻率分布直方圖.
(1)從總體的400名學(xué)生中隨機(jī)抽取一人,估計(jì)其分?jǐn)?shù)小于70的概率;
(2)已知樣本中分?jǐn)?shù)小于40的學(xué)生有5人,試估計(jì)總體中分?jǐn)?shù)在區(qū)間[40,50)上的人數(shù);
(3)已知樣本中有一半男生的分?jǐn)?shù)不小于70,且樣本中分?jǐn)?shù)不小于70的男女生人數(shù)相等.試估計(jì)總體中男生和女生人數(shù)的比例.
解析 (1)根據(jù)頻率分布直方圖可知,樣本中分?jǐn)?shù)不小于70的頻率為[(0.02+0.04)×10=0.6].
所以樣本中分?jǐn)?shù)小于70的頻率為[1-0.6=0.4].
所以從總體的400名學(xué)生中隨機(jī)抽取一人,其分?jǐn)?shù)小于70的概率估計(jì)為0.4.
(2)根據(jù)題意知,樣本中分?jǐn)?shù)不小于50的頻率為[(0.01+0.02+0.04+0.02)×10=0.9],分?jǐn)?shù)在區(qū)間[[40,50)]上的人數(shù)為[100-100×0.9-5=5].
所以總體中分?jǐn)?shù)在區(qū)間[[40,50)]上的人數(shù)估計(jì)為[400×5100=20].
(3)由題意知,樣本中分?jǐn)?shù)不小于70的學(xué)生人數(shù)為[(0.02+0.04)×10×100=60],樣本中分?jǐn)?shù)不小于70的男生人數(shù)為[60×12=30].
所以樣本中男生人數(shù)為[30×2=60],女生人數(shù)為100-60=40,男生和女生人數(shù)的比例為60∶40=3∶2.
所以根據(jù)分層抽樣原理,總體中男生和女生的人數(shù)比例估計(jì)為3∶2.
點(diǎn)評(píng) 利用頻率分布直方圖求眾數(shù)、中位數(shù)和平均數(shù)時(shí),應(yīng)注意三點(diǎn):①最高的小長(zhǎng)方形底邊中點(diǎn)的橫坐標(biāo)即為眾數(shù);②中位數(shù)左邊和右邊的小長(zhǎng)方形的面積和是相等的;③平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個(gè)小長(zhǎng)方形的面積乘以小長(zhǎng)方形底邊中點(diǎn)的橫坐標(biāo)之和.
折線圖
例4 某城市為了解游客人數(shù)的變化規(guī)律,提高旅游服務(wù)質(zhì)量,收集并整理了2014年1月至2016年12月期間月接待游客量(單位:萬(wàn)人)的數(shù)據(jù),繪制了下面的折線圖.
根據(jù)該折線圖,下列結(jié)論錯(cuò)誤的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相對(duì)7月至12月,波動(dòng)性更小,變化比較平穩(wěn)
解析 觀察折線圖知,每年7月到8月折線圖呈現(xiàn)下降趨勢(shì),月接待游客量減少,選項(xiàng)A錯(cuò)誤;折線圖整體呈現(xiàn)出增長(zhǎng)的趨勢(shì),年接待游客量逐年增加,選項(xiàng)B正確;每年的接待游客量7,8月份達(dá)到最高點(diǎn),即各年的月接待游客量高峰期大致在7,8月,選項(xiàng)C正確;每年1月至6月的月折線圖平穩(wěn),月接待游客量波動(dòng)性更小,7月至12月折線圖不平穩(wěn),月接待游客量波動(dòng)性大,選項(xiàng)D正確.
答案 Aendprint
點(diǎn)評(píng) 折線圖能比較明顯地反映數(shù)據(jù)的變化趨勢(shì).折線圖是頻率分布直方圖的近似,但它比頻率分布表更直觀、形象地反映了樣本的分布規(guī)律.
莖葉圖
例5 某公司為了解用戶對(duì)其產(chǎn)品的滿意度,從A,B兩地區(qū)分別隨機(jī)調(diào)查了20個(gè)用戶,得到用戶對(duì)產(chǎn)品的滿意度評(píng)分如下.
A地區(qū): 62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地區(qū): 73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
根據(jù)兩組數(shù)據(jù)完成兩地區(qū)用戶滿意度評(píng)分的莖葉圖,并通過(guò)莖葉圖比較兩地區(qū)滿意度評(píng)分的平均值及分散程度(不要求計(jì)算出具體值,給出結(jié)論即可);
解析 兩地區(qū)用戶滿意度評(píng)分的莖葉圖如圖.
通過(guò)莖葉圖可以看出,A地區(qū)用戶滿意度評(píng)分的平均值高于B地區(qū)用戶滿意度評(píng)分的平均值;A地區(qū)用戶滿意度評(píng)分比較集中,B地區(qū)用戶滿意度評(píng)分比較分散.
點(diǎn)評(píng) 由莖葉圖可以清晰地看到數(shù)據(jù)的分布情況,這一點(diǎn)同頻率分布直方圖類似. 它優(yōu)于頻率分布直方圖的有兩點(diǎn):(1)從莖葉圖中能看到原始數(shù)據(jù),沒(méi)有任何信息損失;(2)莖葉圖便于記錄和表示. 其缺點(diǎn)是當(dāng)樣本容量較大時(shí),作圖較煩瑣. 利用莖葉圖對(duì)樣本進(jìn)行估計(jì)時(shí),要注意區(qū)分莖與葉,莖是指中間的一列數(shù),葉是從莖的旁邊生長(zhǎng)出來(lái)的數(shù).
散點(diǎn)圖
例6 為了研究某班學(xué)生的腳長(zhǎng)[x](單位:厘米)和身高[y](單位:厘米)的關(guān)系,從該班隨機(jī)抽取10名 學(xué)生,根據(jù)測(cè)量數(shù)據(jù)的散點(diǎn)圖可以看出[y]與[x]之間有線性相關(guān)關(guān)系,設(shè)其回歸直線方程為[y=bx+a].已知[Σi=110xi=225,Σi=110yi=1600,b=4,]該班某學(xué)生的腳長(zhǎng)為24,據(jù)此估計(jì)其身高為( )
A. 160 B. 163
C. 166 D. 170
解析 由線性回歸方程為[y=4x+a,]
則[x=110Σi=110xi=22.5,y=Σi=110yi=160.]
則數(shù)據(jù)的樣本中心點(diǎn)(22.5,160).
由回歸直線方程樣本中心點(diǎn)得,
則[a=y-4x=160-4×22.4=70.]
所以回歸直線方程為[y=4x+70.]
當(dāng)[x=24]時(shí),[y=4×24+70=166.]
則估計(jì)其身高為166.
例7 下面的4個(gè)散點(diǎn)圖中,兩個(gè)變量具有相關(guān)關(guān)系的是( )
[③④][①②]
A. ①② B. ①③
C. ②④ D. ③④
解析 由圖可知:①是一次函數(shù)關(guān)系,不是相關(guān)關(guān)系;②的所有點(diǎn)在一條直線附近波動(dòng),是線性相關(guān)關(guān)系;③不具有相關(guān)系;④在某曲線附近波動(dòng)是非線性相關(guān)關(guān)系. 所以兩個(gè)變量具有相關(guān)關(guān)系的是②④.
答案 C
點(diǎn)評(píng) 散點(diǎn)圖一般用來(lái)判斷相關(guān)關(guān)系或者進(jìn)行線性回歸分析. 線性回歸分析時(shí),要注意樣本點(diǎn)不一定在回歸直線上,但樣本點(diǎn)的中心[(x,y)]一定在回歸直線上.endprint