■周樂一
平均數(shù)、中位數(shù)、眾數(shù)是用樣本估計總體的重要數(shù)字特征,它們從不同的側面對樣本和總體進行了描述,從而可幫助我們更全面地把握事物的態(tài)勢,為正確決策提供定性的支持?,F(xiàn)分別介紹如下,希望對同學們掌握這“三數(shù)”能有所幫助。
1.“三數(shù)”的概念。
(1)平均數(shù):一組數(shù)據的總和除以數(shù)據的個數(shù)所得的商就是平均數(shù)。
(2)中位數(shù):如果將一組數(shù)據按從小到大的順序依次排列,當數(shù)據有奇數(shù)個時,處在最中間的一個數(shù)就是這組數(shù)據的中位數(shù);當數(shù)據有偶數(shù)個時,處在最中間的兩個數(shù)的平均數(shù)是這組數(shù)據的中位數(shù)。
(3)眾數(shù):在一組數(shù)據中,出現(xiàn)次數(shù)最多的數(shù)就是這組數(shù)據的眾數(shù)。若有兩個或多個數(shù)據出現(xiàn)的次數(shù)最多,且出現(xiàn)的次數(shù)一樣,則這些數(shù)據都是這組數(shù)據的眾數(shù)。若一組數(shù)據中,每個數(shù)據出現(xiàn)的次數(shù)一樣多,則認為這組數(shù)據沒有眾數(shù)。
2.在頻率分布直方圖中也可以找到“三數(shù)”的有關信息。平均數(shù)是頻率分布直方圖的“重心”,它等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和;在頻率分布直方圖中,中位數(shù)左右兩側的直方圖的面積應該相等,因而可以估計中位數(shù)的值;眾數(shù)是頻率分布直方圖中最高的小矩形的底邊的中點。利用頻率分布直方圖求出的平均數(shù)、中位數(shù)、眾數(shù)均為近似值,往往與實際得出的數(shù)據不一致,但能粗略地估計平均數(shù)、中位數(shù)和眾數(shù)。
3.實際問題中求得的平均數(shù)、中位數(shù)、眾數(shù)都應帶上單位。
平均數(shù)、中位數(shù)、眾數(shù)都是描述數(shù)據集中趨勢的特征數(shù),它們都有各自的特征。
1.由于平均數(shù)與每一個樣本數(shù)據都有關,所以任何一個樣本數(shù)據的改變都會引起平均數(shù)的改變,這是中位數(shù)、眾數(shù)都不具有的性質。正因如此,與中位數(shù)、眾數(shù)比較起來,平均數(shù)可以反映出更多的關于樣本數(shù)據總體的信息,因而其應用最為廣泛,特別是在進行統(tǒng)計推理時有著重要的作用。但它的計算比較煩瑣,并且容易受到極端數(shù)據的影響。
2.中位數(shù)是樣本數(shù)據所占頻率的等分線,它不受少數(shù)極端值的影響。但用中位數(shù)作為一組數(shù)據的代表,可靠性比較差,它對極端值的不敏感有時會成為缺點,因為這些極端值有時是不能忽視的。
3.眾數(shù)體現(xiàn)了樣本數(shù)據的最大集中點,它不受極端數(shù)據的影響,其求法也比較簡便。當一組數(shù)據中個別數(shù)據變動較大時,適宜選擇眾數(shù)表示這組數(shù)據的集中趨勢。但用眾數(shù)作為一組數(shù)據的代表,可靠性也比較差,由于它對其他數(shù)據信息的忽視,使得其無法客觀地反映總體特征。
1.求“三數(shù)”。
例1某次體檢,6位同學的身高(單位:m)分別為1.72,1.78,1.75,1.8,1.69,1.77,則這組數(shù)據的中位數(shù)是____m。
將這6位同學的身高(單位:m)按照從低到高排列為1.69,1.72,1.75,1.77,1.78,1.8,這6個數(shù)的中位數(shù)是1.75與1.77的平均數(shù),即為1.76,故這組數(shù)據的中位數(shù)是1.76m。
本題主要考查中位數(shù)的概念,是一道基礎題。從歷年的高考題目來看,涉及統(tǒng)計的題目往往不難,主要考查考生的識圖、用圖能力,以及應用數(shù)學知識解決實際問題的能力。
跟蹤練習1:某樣本中共有5個個體,其值分別為a,0,1,2,3。若樣本的眾數(shù)為1,則樣本的中位數(shù)為( )。
A.0 B.1
C.2 D.3
提示:因為樣本的眾數(shù)為1,所以a=1,所以樣本的中位數(shù)為1。故選B。
2.利用“三數(shù)”進行估計。
例2某工廠人員及他們的周工資(單位:元)構成如表1所示。
表1
(1)求該工廠人員周工資的眾數(shù)、中位數(shù)、平均數(shù)。
(2)這個問題中,平均數(shù)能客觀地反映該工廠人員的工資水平嗎?為什么?
(1)由表1可知,該工廠人員周工資的眾數(shù)為200元,中位數(shù)為220元,平均數(shù)為(2200+1500+1100+2000+100)÷23=300(元)。
(2)雖然該工廠人員周工資的平均數(shù)為300元,但由表1中所列出的數(shù)據可知,只有經理的周工資在平均數(shù)以上,其余人員的周工資都在平均數(shù)以下,故用平均數(shù)不能客觀地反映該工廠人員的工資水平。
平均數(shù)受數(shù)據中極端值的影響較大,妨礙了對總體估計的可靠性,這時平均數(shù)反而不如眾數(shù)、中位數(shù)更客觀。
跟蹤練習2:某校兩組學生知識競賽的成績統(tǒng)計如表2所示。
表2
已經算得兩組的平均分都是80分,請根據你所學過的統(tǒng)計知識,試從成績的眾數(shù)、中位數(shù)及平均分以上(包括平均分)的人數(shù)等不同角度比較甲、乙兩組的成績。
提示:甲組成績的眾數(shù)是90分,乙組成績的眾數(shù)是70分;甲組成績的中位數(shù)和乙組成績的中位數(shù)都是80分;甲組平均分以上(包括平均分)的人數(shù)是33人,乙組平均分以上(包括平均分)的人數(shù)是26人。顯然,甲組成績好于乙組成績。
3.利用頻率分布直方圖估計“三數(shù)”。
例3一學校舉行某次月考后,從所有考生中隨機抽取50名,對他們的數(shù)學成績進行統(tǒng)計,得到的頻率分布直方圖如圖1所示,則這次考試成績的中位數(shù)的估計值是( )。
圖1
由圖1和選項可知,中位數(shù)應介于70~80之間,設中位數(shù)為70+x,依題意得10×(0.002+0.006+0.012+0.024)+0.036x=0.5,解得所以中位數(shù)的估計值為分。故選B。
頻率分布直方圖是重要的統(tǒng)計圖,它從各個小組數(shù)據在樣本容量中所占比例大小的角度來表示數(shù)據分布規(guī)律,能夠很好地反映數(shù)據的變化趨勢。利用頻率分布直方圖,既能計算樣本中的頻率、頻數(shù)等有關數(shù)據,也可以求眾數(shù)、中位數(shù)、平均數(shù)等數(shù)字特征的估計值。本題是通過讀懂頻率分布直方圖,設出中位數(shù)并列方程進行求解的。
跟蹤練習3:我國是世界上嚴重缺水的國家,某市為了制定合理的節(jié)水方案,對居民用水情況進行了調查,通過抽樣,獲得了某年100位居民每人的月均用水量(單位:t),將數(shù)據按照[0,0.5),[0.5,1),…,[4,4.5]分成9組,制成了如圖2所示的頻率分布直方圖。
圖2
(1)求圖中a的值。
(2)估計該市居民月均用水量的中位數(shù)。
提示:(1)由頻率分布直方圖可知,月均用水量在[0,0.5]的頻率為0.08×0.5=0.04。同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]幾組的頻率分別為0.08,0.21,0.25,0.06,0.04,0.02。由1—(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.3。
(2)設中位數(shù)為x。因為前5組的頻率之和為0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4組的頻率之和為0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x≤2.5。由0.5×(x—2)=0.5—0.48,解得x=2.04。所以估計該市居民月均用水量的中位數(shù)為2.04 t。
4.分類尋找數(shù)據。
例4一組數(shù)據共有7個數(shù),記得其中有10,2,5,2,4,2,還有一個數(shù)沒有記清,但知道這組數(shù)的平均數(shù)與眾數(shù)的和是中位數(shù)的2倍,則這個數(shù)的所有可能值的和為( )。
A.9
B.3
C.6
D.7
設沒有記清的這個數(shù)為x。由題意知眾數(shù)是2,平均數(shù)是
若x≤2,則中位數(shù)為2,此時2×2=2+,解得x=—11;
若2<x<4,則中位數(shù)為x,此時2x=,解得x=3;
若x≥4,則中位數(shù)為4,此時4×2=2+,解得x=17。
綜上可知,沒有記清的這個數(shù)的所有可能值的和為—11+3+17=9。故選A。
本題在分類討論的基礎上,利用平均數(shù)、中位數(shù)和眾數(shù)的關系,去找尋沒有記清的數(shù)據,既考查了對樣本數(shù)字特征的進一步理解,又考查了分析問題和解決問題的能力。
跟蹤練習4:樣本x1,x2,…,xn的平均數(shù)為x,樣本的平均數(shù)為y),若樣本的平均數(shù)為,且n>m,則實數(shù)a的取值范圍為____。
提示:由題意知
又因為n>m,所以
故實數(shù)a的取值范圍為