■張文偉
(1)抽簽法適用于總體中個體數(shù)較少的情況,隨機(jī)數(shù)法適用于總體中個體數(shù)較多的情況。(2)一個抽樣試驗(yàn)?zāi)芊裼贸楹灧?,關(guān)鍵看兩點(diǎn):一是抽簽是否方便,二是號簽是否易攪勻。一般地,當(dāng)總體容量和樣本容量都較少時可用抽簽法。
例1某班級有男生20人,女生30人,從中抽取10人作為樣本,其中一次抽樣結(jié)果是抽到了4名男生、6名女生,則下列命題正確的是( )。
A.這次抽樣可能采用的是簡單隨機(jī)抽樣
B.這次抽樣一定沒有采用系統(tǒng)抽樣
C.這次抽樣中每個女生被抽到的概率大于每個男生被抽到的概率
D.這次抽樣中每個女生被抽到的概率小于每個男生被抽到的概率
解:這次抽樣可以采用的是簡單隨機(jī)抽樣,A正確。這次抽樣可以采用系統(tǒng)抽樣,男生編號為1~20,女生編號為21~50,間隔為5,依次抽取1號,6號,…,46號即可,B錯誤。這次抽樣中每個女生被抽到的概率等于每個男生被抽到的概率(等可能抽樣),C和D錯誤。應(yīng)選A。
跟蹤練習(xí)1:總體由編號為01,02,…,19,20的20個個體組成。利用隨機(jī)數(shù)表(如表1)選取5個個體,選取的方法是從隨機(jī)數(shù)表第1行的第5列和第6列數(shù)字開始由左到右依次選取兩個數(shù)字,則選出來的第5個個體的編號為( )。
表1
提示:選出的5個個體的編號依次是08,02,14,07,01。應(yīng)選D。
系統(tǒng)抽樣的步驟:①先將總體的N個個體編號。②確定分段間隔k(k∈N*),對編號進(jìn)行分段,當(dāng)(n是樣本容量)是整數(shù)時,?、墼诘?段用簡單隨機(jī)抽樣確定第1個個體編號l(l≤k)。④按照一定的規(guī)則抽取樣本,通常是將l加上間隔k得到第2個個體編號(l+k),再加上k得到第3個個體編號(l+2k),依次進(jìn)行下去,直到獲取整個樣本。
例2為規(guī)范學(xué)校辦學(xué),省教育廳督察組對某所高中進(jìn)行了抽樣調(diào)查。抽到的班級一共有52名學(xué)生,現(xiàn)將該班學(xué)生隨機(jī)編號,用系統(tǒng)抽樣的方法抽取一個容量為4的樣本,已知7號,33號,46號同學(xué)在樣本中,那么樣本中還有一位同學(xué)的編號應(yīng)是( )。
A.13 B.19 C.20 D.51
解:由系統(tǒng)抽樣的特點(diǎn),可知抽樣的間隔為,故抽取的樣本的編號分別為7,7+13,7+13×2,7+13×3,即7,20,33,46。應(yīng)選C。
跟蹤練習(xí)2:將參加夏令營的600名學(xué)生按001,002,…,600進(jìn)行編號。采用系統(tǒng)抽樣的方法抽取一個容量為50的樣本,且隨機(jī)抽得的號碼為003。這600名學(xué)生分別住在3個營區(qū),從001到300在第一營區(qū),從301到495在第二營區(qū),從496到600在第三營區(qū),這3個營區(qū)被抽中的人數(shù)依次為( )。
提示:由題意及系統(tǒng)抽樣的定義可知,將這600名學(xué)生按編號依次分成50組,每組各有12名學(xué)生,第k(k∈N*)組抽中的號碼是3+12(k—1)。令3+12(k—1)≤300,得k≤,因此第一營區(qū)被抽中的人數(shù)是25。令300<3+12(k—1)≤495,得,因此第二營區(qū)被抽中的人數(shù)是42—25=17,由此可得第三營區(qū)被抽中的人數(shù)為50—25—17=8。應(yīng)選B。
分層抽樣的常見求法:①依據(jù)各層總數(shù)與樣本數(shù)之比,求出抽樣比。②直方圖中縱軸表示由某層總體個數(shù)(或樣本數(shù))求出該層的樣本數(shù)(或總體個數(shù))。③利用抽樣比,求出各層的樣本數(shù)。
例3甲、乙兩套設(shè)備生產(chǎn)的同類型產(chǎn)品共4800件,采用分層抽樣的方法從中抽取一個容量為80的樣本進(jìn)行質(zhì)量檢測。若樣本中有50件產(chǎn)品由甲設(shè)備生產(chǎn),則乙設(shè)備生產(chǎn)的產(chǎn)品總件數(shù)為____。
解:分層抽樣中各層的抽樣比相同。若樣本中甲設(shè)備生產(chǎn)的有50件,則乙設(shè)備生產(chǎn)的有30件。在4800件產(chǎn)品中,甲、乙設(shè)備生產(chǎn)的產(chǎn)品總數(shù)比為5:3,所以乙設(shè)備生產(chǎn)的產(chǎn)品的總件數(shù)為
跟蹤練習(xí)3:某大學(xué)為了解在校本科生對參加某項(xiàng)社會實(shí)踐活動的意向,擬采用分層抽樣的方法,從該校四個年級的本科生中抽取一個容量為300的樣本進(jìn)行調(diào)查。已知該校一年級、二年級、三年級、四年級的本科生人數(shù)之比為4:5:5:6,則應(yīng)從一年級本科生中抽取的學(xué)生人數(shù)為____。
提示:由分層抽樣的特點(diǎn),可知從一年級本科生中應(yīng)抽取的學(xué)生人數(shù)為300=60。
解決頻率分布直方圖問題要注意的幾點(diǎn):①直方圖中各小長方形的面積之和為1。,每組樣本的頻率,即小長方形的面積。③直方圖中每組樣本的頻數(shù)=頻率×總體數(shù)。
例4在樣本的頻率分布直方圖中,共有9個小長方形,若中間一個小長方形的面積等于其他8個小長方形的面積和的,且樣本容量為140,則中間一組的頻數(shù)為( )。
解:設(shè)中間一個小長方形的面積為x,則其他8個小長方形的面積為x。由x+,解得,所以中間一組的頻數(shù)為應(yīng)選B。
跟蹤練習(xí)4:某校為了解高一年級全體學(xué)生的體能情況,抽取了部分學(xué)生進(jìn)行1m i n跳繩次數(shù)測試,將所得數(shù)據(jù)整理后,畫出頻率分布直方圖(如圖1所示),圖中從左到右各小長方形的面積之比為2:4:17:15:9:3,第二小組的頻數(shù)為12。
圖1
(1)第二小組的頻率是多少?樣本容量是多少?
(2)若次數(shù)在110以上(含110次)為達(dá)標(biāo),則該校高一年級全體學(xué)生的達(dá)標(biāo)率是多少?
提示:(1)頻率分布直方圖是以面積的形式反映數(shù)據(jù)落在各小組內(nèi)的頻率大小的,因此第二小組的頻率為0.08。又因?yàn)榈诙〗M的頻率=所以樣本容量 =
(2)由頻率分布直方圖可估計(jì)該校高一年級全體學(xué)生的達(dá)標(biāo)率為
由莖葉圖可以清晰地看到數(shù)據(jù)的分布情況,這與頻率分布直方圖類似。從莖葉圖中能看到原始數(shù)據(jù),沒有任何信息損失,莖葉圖便于記錄和表示。當(dāng)樣本容量較大時,作圖較煩瑣。
例5圖2所示的莖葉圖是某班學(xué)生在一次數(shù)學(xué)測試時的成績。
圖2
根據(jù)莖葉圖,得出該班男、女生數(shù)學(xué)成績的四個統(tǒng)計(jì)結(jié)論,其中錯誤的一項(xiàng)是( )。
A.15名女生成績的平均分為78
B.17名男生成績的平均分為77
C.女生成績和男生成績的中位數(shù)分別為82,80
D.男生中的高分段和低分段均比女生多,相比較男生兩極分化比較嚴(yán)重
解:由圖可知15名女生成績的平均分為78,A正確。17名男生成績的平均分為77,B正確。觀察莖葉圖,對男生、女生成績進(jìn)行比較,可知男生兩極分化比較嚴(yán)重,D正確。根據(jù)女生和男生成績數(shù)據(jù)分析可得兩組數(shù)據(jù)的中位數(shù)均為80,C錯誤。應(yīng)選C。
跟蹤練習(xí)5:在某雜志的一篇文章中,每個句子中所含的字?jǐn)?shù)如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17。在某報紙的一篇文章中,每個句子中所含的字?jǐn)?shù)如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22。
(1)將這兩組數(shù)據(jù)用莖葉圖表示。
(2)將這兩組數(shù)據(jù)進(jìn)行比較分析,得到什么結(jié)論?
提示:(1)畫出莖葉圖,如圖3所示。
圖3
(2)雜志文章中每個句子的字?jǐn)?shù)集中在10~30之間,中位數(shù)為22.5;而報紙文章中每個句子的字?jǐn)?shù)集中在10~40之間,中位數(shù)為27.5??梢钥闯鲭s志文章中每個句子的平均字?jǐn)?shù)比報紙文章中每個句子的平均字?jǐn)?shù)要少,說明雜志作為讀物更通俗易懂、簡明扼要。
平均數(shù)和方差都是重要的數(shù)字特征,是對總體的一種簡明的闡述。平均數(shù)、中位數(shù)、眾數(shù)描述總體的集中趨勢,方差和標(biāo)準(zhǔn)差描述波動大小。平均數(shù)、方差公式的推廣:若數(shù)據(jù)的平均數(shù)為x,方差為s2,則數(shù)據(jù)的平均數(shù)為方差為
例6為了解某校九年級1600名學(xué)生的體能情況,隨機(jī)抽查了部分學(xué)生,測試1m i n仰臥起坐的成績(次數(shù)),將數(shù)據(jù)整理后繪制成如圖4所示的頻率分布直方圖,根據(jù)統(tǒng)計(jì)圖的數(shù)據(jù),下列結(jié)論錯誤的是( )。
圖4
A.該校九年級學(xué)生1m i n仰臥起坐的次數(shù)的中位數(shù)為26.25
B.該校九年級學(xué)生1m i n仰臥起坐的次數(shù)的眾數(shù)為27.5
C.該校九年級學(xué)生1m i n仰臥起坐的次數(shù)超過30的人數(shù)約為320
D.該校九年級學(xué)生1m i n仰臥起坐的次數(shù)少于20的人數(shù)約為32
解:由頻率分布直方圖可知,中位數(shù)是頻率分布直方圖中的左右面積等分線對應(yīng)的數(shù)值(橫坐標(biāo)),容易判斷中位數(shù)位于第三組,可計(jì)算得到中位數(shù)為26.25。眾數(shù)是最高小矩形底邊中點(diǎn)的橫坐標(biāo),即眾數(shù)為27.5。1m i n仰臥起坐的次數(shù)超過30的頻率為0.04×5=0.2,所以估計(jì)1m i n仰臥起坐的次數(shù)超過30的人數(shù)為320。1m i n仰臥起坐的次數(shù)少于20的頻率為0.1,所以估計(jì)1m i n仰臥起坐的次數(shù)少于20的人數(shù)為160。應(yīng)選D。
跟蹤練習(xí)6:甲、乙兩位選手參加射擊選拔賽,其中連續(xù)5輪比賽的成績(單位:環(huán))如表2所示。
表2
則甲、乙兩位選手中成績最穩(wěn)定的選手的方差是____。
求回歸直線方程前應(yīng)通過散點(diǎn)圖或相關(guān)系數(shù)進(jìn)行相關(guān)性檢驗(yàn),確定是否有必要根據(jù)公式求回歸直線方程,從而有依據(jù)地進(jìn)行預(yù)測。求線性回歸方程的步驟:①計(jì)算②計(jì)算③計(jì)算系數(shù)b=;④寫出回歸方程
例7在一組樣本數(shù)據(jù)(x1,y1),(x2,的散點(diǎn)圖中,若所有樣本點(diǎn)都在曲線附近波動,經(jīng)計(jì)算,則實(shí)數(shù)b的值為____。
解:令t=x2,則曲線方程變?yōu)榫€性回歸方程,即,此時,把的坐標(biāo)代入可得,解得
跟蹤練習(xí)7:某單位為了制訂節(jié)能減排的計(jì)劃,隨機(jī)統(tǒng)計(jì)了某4天的用電量y(單位:度)與當(dāng)天氣溫x(單位:℃),并制作了對照表(如表3)。由表中數(shù)據(jù),得線性回歸方程,當(dāng)某天的氣溫為—5℃時,預(yù)測當(dāng)天的用電量約為____度。
表3
提示:氣溫的平均值10—1)=10,用電量的平均值34+38+64)=40。因?yàn)榛貧w直線必經(jīng)過樣本中心點(diǎn),所以40=—2×10+a,解得a=60,故回歸方程為
為研究語文成績和英語成績之間是否具有線性相關(guān)關(guān)系,統(tǒng)計(jì)某班學(xué)生的兩科成績得到如圖5所示的散點(diǎn)圖(x軸,y軸的單位長度相同),用回歸直線方程?y=b x+a近似地刻畫其相關(guān)關(guān)系,根據(jù)圖5,以下結(jié)論最有可能成立的是( )。
圖5
A.線性相關(guān)關(guān)系較強(qiáng),b的值為1.25
B.線性相關(guān)關(guān)系較強(qiáng),b的值為0.83
C.線性相關(guān)關(guān)系較強(qiáng),b的值為—0.87
D.線性相關(guān)關(guān)系較弱,無研究價值
提示:由散點(diǎn)圖可以看出兩個變量所構(gòu)成的點(diǎn)在一條直線附近,所以線性相關(guān)關(guān)系較強(qiáng),且為正相關(guān),所以回歸直線方程的斜率為正數(shù)。從散點(diǎn)圖觀察,回歸直線方程的斜率應(yīng)該比直線y=x的斜率要小一些。應(yīng)選B。