■謝紅霞
抽簽法適用于總體中個體數(shù)較少的情況,隨機(jī)數(shù)法適用于總體中個體數(shù)較多的情況。一個抽樣試驗?zāi)芊裼贸楹灧?關(guān)鍵看兩點:一是抽簽是否方便,二是號簽是否易攪勻。一般地,當(dāng)總體容量和樣本容量都較小時可用抽簽法。
例1完成下列兩項調(diào)查:①從某社區(qū)125戶高收入家庭,280戶中等收入家庭,95戶低收入家庭中選出100戶,調(diào)查社會購買能力的某項指標(biāo);②從某中學(xué)的15名藝術(shù)特長生中選出3名調(diào)查學(xué)習(xí)負(fù)擔(dān)情況。宜采用的抽樣方法依次是( )。
A.①簡單隨機(jī)抽樣,②系統(tǒng)抽樣
B.①分層抽樣,②簡單隨機(jī)抽樣
C.①系統(tǒng)抽樣,②分層抽樣
D.①②都用分層抽樣
解:因為社會購買能力的某項指標(biāo)受到家庭收入的影響,而社區(qū)中各個家庭收入差別明顯,所以①用分層抽樣法。從某中學(xué)的15名藝術(shù)特長生中選出3名調(diào)查學(xué)習(xí)負(fù)擔(dān)情況,個體之間差別不大,且總體和樣本容量較小,②用簡單隨機(jī)抽樣法。
應(yīng)選B。
跟蹤練習(xí)1:某方便面生產(chǎn)線上每隔15min抽取一包進(jìn)行檢驗,該抽樣方法為①,從某中學(xué)的40名數(shù)學(xué)愛好者中抽取5人了解學(xué)習(xí)負(fù)擔(dān)情況,該抽樣方法為②,那么①和②分別為( )。
A.①系統(tǒng)抽樣,②分層抽樣
B.①分層抽樣,②系統(tǒng)抽樣
C.①系統(tǒng)抽樣,②簡單隨機(jī)抽樣
D.①分層抽樣,②簡單隨機(jī)抽樣
提示:由隨機(jī)抽樣的特征可知,①為等距抽樣,也就是系統(tǒng)抽樣;②為簡單隨機(jī)抽樣。
應(yīng)選C。
例2將參加夏令營的600名學(xué)生編號為001,002,…,600。采用系統(tǒng)抽樣方法抽取一個容量為50的樣本,且隨機(jī)抽取的號碼為003。這600名學(xué)生分住在三個營區(qū),從001到300在第Ⅰ營區(qū),從301到495在第Ⅱ營區(qū),從496到600在第Ⅲ營區(qū),三個營區(qū)被抽中的人數(shù)依次為( )。
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
解:由題意及系統(tǒng)抽樣的定義可知,將這600名學(xué)生按編號依次分成50組,每組各有12名學(xué)生,第k(k∈N*)組抽中的號碼是3+12(k-1)。
應(yīng)選B。
跟蹤練習(xí)2:總體由編號為01,02,03,…,49,50的50個個體組成,利用隨機(jī)數(shù)表1(以下摘取了隨機(jī)數(shù)表中第1行和第2行)選取5個個體,選取方法是從隨機(jī)數(shù)表第1行的第9列和第10列數(shù)字開始由左向右讀取,則選出來的第4個個體的編號為( )。
表1
A.05 B.09
C.11 D.20
提示:從隨機(jī)數(shù)表第1行的第9列和第10列數(shù)字開始,依次是14,05,11,09,則第四個數(shù)字是09。
應(yīng)選B。
依據(jù)各層的個體數(shù)與樣本數(shù)之比,確定抽樣比;由某層個體數(shù)(或樣本數(shù))確定該層的樣本數(shù)(或總體數(shù));依據(jù)題意,求出各層的抽樣比,再求出各層的樣本數(shù)。
例3某校有高級教師26人,中級教師104人,其他教師若干人。為了解該校教師的工資收入情況,按分層抽樣從該校的所有教師中抽取56人進(jìn)行調(diào)查,已知從其他教師中共抽取了16人,則該校共有教師人。
解:設(shè)該校其他教師有x人,則,可得x=52。故全校教師共有26+104+52=182(人)。
跟蹤練習(xí)3:某工廠生產(chǎn)甲,乙,丙三種型號的產(chǎn)品,產(chǎn)品數(shù)量之比為3∶5∶7,現(xiàn)用分層抽樣方法抽取容量為n的樣本,其中甲種產(chǎn)品有18件,則樣本容量n等于( )。
A.54 B.90
C.45 D.126
提示:依題意可得,解得n=90,即樣本容量為90。
應(yīng)選B。
例4某中學(xué)高一年級有560人,高二年級有540人,高三年級有520人,現(xiàn)用分層抽樣的方法抽取容量為81的樣本,則在高一,高二,高三這三個年級抽取的人數(shù)分別為( )。
A.28,27,26 B.28,26,24
C.26,27,28 D.27,26,25
解:根據(jù)題意可得,分層抽樣的抽樣比為則在高一年級抽取的人數(shù)是在高二年級抽取的人數(shù)是在高三年級抽取的人數(shù)是
應(yīng)選A。
跟蹤練習(xí)4:某單位有老年人27人,中年人54人,青年人81人,為了調(diào)查他們的身體狀況的某項指標(biāo),需從他們中間抽取一個容量為42的樣本,則分別應(yīng)抽取老年人,中年人,青年人的人數(shù)是( )。
A.7,11,18
B.6,12,18
C.6,13,17
D.7,14,21
提示:因為該單位共有人數(shù)為27+54+81=162,樣本容量為42,所以應(yīng)按的抽樣比分別從老年人,中年人,青年人中抽取樣本,則分別抽取的人數(shù)是7,14,21。
應(yīng)選D。
準(zhǔn)確理解頻率分布直方圖的數(shù)據(jù)特點,頻率分布直方圖中縱軸上的數(shù)據(jù)是各組的頻率除以組距的結(jié)果,不要誤認(rèn)為縱軸上的數(shù)據(jù)是各組的頻率,不要和條形圖混淆;頻率分布直方圖中各小長方形的面積之和為1;利用頻率分布直方圖可估計總體分布。
例5為了調(diào)查某校學(xué)生體質(zhì)健康達(dá)標(biāo)情況,現(xiàn)采用隨機(jī)抽樣的方法從該校抽取了m名學(xué)生進(jìn)行體育測試。根據(jù)體育測試得到了這m名學(xué)生的各項平均成績(滿足100分),按照以下區(qū)間分為7組:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到頻率分布直方圖,如圖1所示。已知測試平均成績在區(qū)間[30,60)內(nèi)有20人。
圖1
(1)求m的值及中位數(shù)n。
(2)若該校學(xué)生測試平均成績小于n,則學(xué)校應(yīng)適當(dāng)增加體育活動時間。根據(jù)以上抽樣調(diào)查數(shù)據(jù),該校是否需要增加體育活動時間?
解:(1)由頻率分布直方圖可知,第1組,第2組和第3組的頻率分別是0.02,0.02和0.06,則m×(0.02+0.02+0.06)=20,解得m=200。
由頻率分布直方圖可知,前四組的頻率為0.32,第5組的頻率為0.4,所以中位數(shù)n位于[70,80)內(nèi),則0.02+0.02+0.06+0.22+0.04(n-70)=0.5,解得n=74.5。
(2)設(shè)第i(i=1,2,3,4,5,6,7)組的頻率和頻數(shù)分別為pi和xi。由頻率分布直方圖可知p1=0.02,p2=0.02,p3=0.06,p4=0.22,p5=0.4,p6=0.18,p7=0.1。由xi=200×pi,可得x1=4,x2=4,x3=12,x4=44,x5=80,x6=36,x7=20,故該校學(xué)生測試平均成績?yōu)椤?35x1+45x2+55x3+65x4+75x5+85x6+95x7)=74<74.5,由此可知該校應(yīng)該適當(dāng)增加體育活動時間。
跟蹤練習(xí)5:近年來高校招生改革的呼聲越來越高,在贊成高校招生改革的市民中按年齡分組,得到的樣本數(shù)據(jù)的頻率分布直方圖如圖2所示,其中年齡在區(qū)間[30,40)內(nèi)的有2500人,在區(qū)間[20,30)內(nèi)的有1200人,則m的值為( )。
圖2
A.0.013 B.0.13
C.0.012 D.0.12
提示:由題意可得,年齡在區(qū)間[30,40)內(nèi)的頻率為0.025×10=0.25,則贊成高校招生改革的市民人數(shù)為=10000。因為年齡在區(qū)間[20,30)內(nèi)的有1200人,所以m=
應(yīng)選C。
平均數(shù)和方差都是重要的數(shù)字特征,是對總體的一種簡明的闡述。平均數(shù),中位數(shù),眾數(shù)描述總體的集中趨勢,方差和標(biāo)準(zhǔn)差描述波動大小。平均數(shù),方差公式的推廣:若數(shù)據(jù)x1,x2,…,xn的平均數(shù)為,方差為s2,則數(shù)據(jù)mx1+a,mx2+a,…,mxn+a的平均數(shù)為m,方差為m2s2。
例6某選手的7個得分去掉1個最高分,去掉1個最低分,剩余5個得分的平均數(shù)為91,如圖3,該選手的7個得分的莖葉圖中有一個數(shù)據(jù)模糊,無法辨認(rèn),在圖中用x表示,則剩余5個得分的方差為( )。
圖3
解:由莖葉圖可知,最低分為87分,最高分為99分。
應(yīng)選C。
跟蹤練習(xí)6:若數(shù)據(jù)x1,x2,x3,…,xn的平均數(shù)為=5,方差s2=2,則數(shù)據(jù)3x1+1,3x2+1,3x3+1,…,3xn+1的平均數(shù)和方差分別為( )。
A.5,2 B.16,2
C.16,18 D.16,9
提示:由x1,x2,x3,…,xn的平均數(shù)為5,可 得所以16。由x1,x2,x3,…,xn的方差為2,可得3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18。
應(yīng)選C。
判斷變量之間有無相關(guān)關(guān)系,一種簡便可行的方法就是繪制散點圖,根據(jù)散點圖很容易看出兩個變量之間是否具有相關(guān)性,是否存在線性相關(guān)關(guān)系,是正相關(guān)還是負(fù)相關(guān),相關(guān)關(guān)系是強(qiáng)還是弱。判定兩個變量正、負(fù)相關(guān)性的三種常用方法:①利用散點圖,點的分布從左下角到右上角,兩個變量正相關(guān),點的分布從左上角到右下角,兩個變量負(fù)相關(guān)。②利用相關(guān)系數(shù),當(dāng)r>0時,正相關(guān),當(dāng)r<0時,負(fù)相關(guān)。③利用線性回歸方程,當(dāng)b>0時,正相關(guān),當(dāng)b<0時,負(fù)相關(guān)。
例7當(dāng)變量x的取值為3,4,5,6,7時,變量y對應(yīng)的值依次分別為4,2.5,-0.5,-1,-2;當(dāng)變量u的取值為1,2,3,4時,變量v對應(yīng)的值依次分別為2,3,4,6。則變量x和y,變量u和v的相關(guān)關(guān)系是( )。
A.變量x和y是正相關(guān),變量u和v是正相關(guān)
B.變量x和y是正相關(guān),變量u和v是負(fù)相關(guān)
C.變量x和y是負(fù)相關(guān),變量u和v是負(fù)相關(guān)
D.變量x和y是負(fù)相關(guān),變量u和v是正相關(guān)
解:變量x增加,變量y減少,所以變量x和y是負(fù)相關(guān)。變量u增加,變量v增加,所以變量u和v是正相關(guān)。
應(yīng)選D。
跟蹤練習(xí)7:某中學(xué)的興趣小組在某座山測得海拔高度、氣壓和沸點的6組數(shù)據(jù)繪制成散點圖如圖4所示,則下列說法錯誤的是( )。
圖4
A.沸點與海拔高度呈正相關(guān)
B.沸點與氣壓呈正相關(guān)
C.沸點與海拔高度呈負(fù)相關(guān)
D.沸點與海拔高度、沸點與氣壓的相關(guān)性都很強(qiáng)
提示:結(jié)合散點圖進(jìn)行判斷。
由散點圖可知,沸點與氣壓呈正相關(guān),B正確。由氣壓與海拔高度呈負(fù)相關(guān),沸點與氣壓呈正相關(guān),可知沸點與海拔高度呈負(fù)相關(guān),A不正確,C正確。結(jié)合選項B,C的說法可知D正確。
應(yīng)選A。