張青云
?
例談頻數(shù)分布表的分組
張青云
在進行數(shù)據(jù)統(tǒng)計時,有時需要列出數(shù)據(jù)的頻數(shù)分布表,或是以條形統(tǒng)計圖直觀地呈現(xiàn)頻數(shù)分布情況,這些都涉及對數(shù)據(jù)進行分組的問題.數(shù)據(jù)分組的實質(zhì)就是將數(shù)據(jù)分類,關(guān)鍵在于不重不漏.出于降低問題難度的目的,有時對數(shù)據(jù)已預(yù)先確定好組距及組數(shù),但這個組距及組數(shù)是如何確定出來的,很多同學(xué)仍認(rèn)識模糊.下面以蘇教版教材八年級下冊第24頁習(xí)題第2題為例,對此進行分析說明.
問題:小麗調(diào)查了她所在班級50名同學(xué)的身高,結(jié)果如下(單位:cm):
一、分組的第一步:計算數(shù)據(jù)的極差
找出樣本數(shù)據(jù)中的最大值與最小值,求它們的差.比如該問題的極差是:172-141=31.
二、第二步:決定組距與組數(shù)
組距是指各組的邊界值之差.比如有一組顯示為4.0≤x<4.3,則組距就是0.3.通常在研究頻數(shù)分布時,采用的都是等距分組,即每一組的邊界值之差相等,其原因也是為了使后面畫的頻數(shù)分布直方圖更直觀.在頻數(shù)分布直方圖中,每一小組對應(yīng)一個長方形,并以小長方形面積的大小來表示各小組內(nèi)取值的頻率.容易知道,條形長方形的面積=組距×條形的高,所以,在組距相同的情況下,條形的高可以直接與小組的頻數(shù)相對應(yīng).頻數(shù)越大,條形越高;頻數(shù)越小,條形越低.
組距如何定?組距×組數(shù)≥極差.通常一組樣本容量在100左右的數(shù)據(jù),其組數(shù)適宜在7~12.比如:如果組距定為3,31÷3,那組數(shù)就定為11組;如果組距定為4,31÷4,那組數(shù)就定為8組;如果組距定為5,31÷5,那組數(shù)就定為7.具體選哪一種,要依問題的實際要求來定.本題樣本容量是50,組距可以為4或5.
三、分組確定各組的邊界值
有兩種確定方法:一是直接從最?。ɑ蜃畲螅┲甸_始,每一組以a≤x<b(或a<x≤b)的形式呈現(xiàn),比如,如果組距取5,則可這樣來列頻數(shù)分布表.
另一種方式,是以比樣本數(shù)據(jù)精確度更高一位的a<x<b形式呈現(xiàn)各小組.比如問題中各數(shù)據(jù)是精確到個位,那么就可以用
精確到十分位的邊界值來列頻數(shù)分布表.
也可以以組距為4,采用上述兩種方式來列頻數(shù)分布表,讀者可自行完成.當(dāng)頻數(shù)分布表完成后,畫頻數(shù)分布直方圖就很容易了.
在教材第28頁第2題,已經(jīng)給定組距為5,教材第34頁第8題要求更高,需要自行決定組數(shù)與組距,通過閱讀本文,大家可以再次研究這兩道題目.
(作者單位:廣東省東莞市東莞中學(xué)松山湖學(xué)校)