■張祎冰
在樣本抽樣時,將總體按其屬性特征分成若干類型(也稱為層),然后在每個類型中按照所占比例隨機抽取一定的樣本,這種抽樣方法叫分層抽樣,也叫類型抽樣。分層抽樣的適用范圍:當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣。若樣本容量為n,總體的個體數(shù)為N,則每個個體被抽到的可能性都是
例1(1)某地區(qū)為了解居民家庭生活狀況,先把居民按所在行業(yè)分為幾類,然后每個行業(yè)抽的居民家庭進行調(diào)查,這種抽樣方法是
(2)分層抽樣又稱類型抽樣,即將相似的個體歸入一類(層),然后每類抽取若干個個體構成樣本,所以分層抽樣為保證每個個體等可能抽樣,必須進行( )。
A.每層等可能抽樣
B.每層可以不等可能抽樣
C.所有層按同一抽樣比等可能抽樣
D.所有層抽取個體數(shù)量相同
解:(1)由于居民按行業(yè)可分為不同的幾類,符合分層抽樣的特點,所以這種抽樣方法是分層抽樣。
(2)保證每個個體等可能地被抽取是三種基本抽樣方法的共同特征,為了保證這一點,分層抽樣時必須在所有層都按同一抽樣比等可能抽取。應選C。
評析:分層抽樣的適用條件是總體可以分層,層與層之間有明顯區(qū)別,而層內(nèi)個體間的差異較小。
例2交通管理部門為了解機動車駕駛員(簡稱駕駛員)對某新法規(guī)的知曉情況,對甲,乙,丙,丁四個社區(qū)進行分層抽樣調(diào)查。假設四個社區(qū)駕駛員的總人數(shù)為N,其中甲社區(qū)有駕駛員96人。若在甲,乙,丙,丁四個社區(qū)抽取駕駛員的人數(shù)分別為12,21,25,43,則這四個社區(qū)駕駛員的總人數(shù)N為
解:由題意可知,甲社區(qū)駕駛員的抽樣比為四個社區(qū)駕駛員總人數(shù)的抽樣比為由分層抽樣可得解得N=808。
評析:對于分層抽樣,總體容量等于各層容量之和。解題時要注意區(qū)分樣本容量與總體容量。
例3某工廠甲,乙,丙三個車間生產(chǎn)了同一種產(chǎn)品,其產(chǎn)品數(shù)量分別為120件,80件,60件。為了解它們的產(chǎn)品質量是否存在顯著差異,用分層抽樣方法抽取了一個容量為n的樣本進行調(diào)查,其中從丙車間的產(chǎn)品中抽取了3件,則
解:由分層抽樣的特征,可得解得n=13。
評析:理解分層抽樣的抽樣比是解答本題的關鍵。
例4某單位最近組織了一次健身活動,活動分為登山組和游泳組,且每個職工至多參加其中一組。在參加活動的職工中,青年人占42.5%,中年人占47.5%,老年人占10%,登山組的職工占參加活動總人數(shù)的且該組中,青年人占50%,中年人占40%,老年人占10%。為了解各組不同的年齡層的職工對本次活動的滿意程度,現(xiàn)用分層抽樣的方法從參加活動的全體職工中抽取容量為200的樣本。
試求:(1)游泳組中,青年人,中年人,老年人分別所占的比例。
(2)游泳組中,青年人,中年人,老年人分別應抽取的人數(shù)。
解:(1)設登山組人數(shù)為x,設游泳組中,青年人,中年人,老年人各占比例分別為a,b,c,則由題意可得由此解得b=50%,c=10%。所以a=1-50%-10%=40%。故游泳組中,青年人,中年人,老年人所占的比例分別為40%,50%,10%。
評析:在分層抽樣中,若各層個體數(shù)之比為m1∶m2∶…∶mk,樣本容量為n,則每層抽取的個體數(shù)為(i=1,2,…,k)。
例5一個單位有職工500人,其中不到35歲的有125人,35歲至49歲的有280人,50歲及50歲以上的有95人。為了解這個單位職工與身體狀態(tài)有關的某項指標,要從中抽取100名職工作為樣本,職工年齡與這項指標有關,應該怎樣抽取?
解:用分層抽樣法抽取樣本,步驟如下。
①分層,按年齡將500名職工分成三層,即不到35歲的職工,35歲至49歲的職工,50歲及50歲以上的職工。②確定每層抽取的個體數(shù),各層分別按簡單隨機抽樣法抽取樣本。抽樣比為,則在不到35歲的職工中抽取125×=25(人),在35歲至49歲的職工中抽取280×=56(人),在50歲及50歲以上的職工中抽取95×=19(人)。③匯總每層抽樣,組成容量為100的樣本。
評析:分層抽樣的步驟:①計算樣本容量與總體個數(shù)之比。②將總體分成互不交叉的層,按比例確定各層要抽取的個體數(shù)。③用簡單隨機抽樣或系統(tǒng)抽樣在各層中抽取相應數(shù)量的個體。④將各層抽取的個體合在一起,就得所需樣本。
為了評估某學校的教學水平,將抽取這個學校高三年級的部分學生本學年的考試成績進行考察。為全面反映實際情況,采取以下三種方式進行抽查(已知該學校高三年級共有20個班,并且每個班內(nèi)的學生按隨機方式編好了學號,假定該校每班學生人數(shù)都相同):①從全年級20個班中任意抽取一個班,再從該班任意抽取20人,考察他們的學習成績;②每個班都抽取1人,共計20人,考察這20個學生的學習成績;③把學生按成績分成優(yōu)秀,良好,普通三個級別,從中共抽取100名學生進行考察(若按成績分,該校高三學生中優(yōu)秀生共150人,良好生共600人,普通生共250人)。
(1)上面三種抽取方式中,其總體,個體,樣本分別指什么?按每一種抽取方式抽取的樣本中,其樣本容量分別是多少?
(2)上面三種抽取方式中,各采用何種抽樣方法?
提示:(1)上面三種抽取方式中,其總體都是高三全體學生本學年的考試成績,個體都是指高三年級每個學生本學年的考試成績。第一種抽取方式中,樣本為所抽取的20名學生本學年的考試成績,樣本容量為20。第二種抽取方式中,樣本為所抽取的20名學生本學年的考試成績,樣本容量為20。第三種抽取方式中,樣本為所抽取的100名學生本學年的考試成績,樣本容量為100。
(2)第一種抽取方式采用的是簡單隨機抽樣法,第二種抽取方式采用的是系統(tǒng)抽樣法和簡單隨機抽樣法,第三種抽取方式采用的是分層抽樣法和簡單隨機抽樣法。