田載今
從計(jì)算結(jié)果可知,甲、乙的平均訓(xùn)練成績(jī)差距不大,甲比乙略高。
(2)將甲的全部訓(xùn)練成績(jī)(共100個(gè))按環(huán)數(shù)從小到大依次排列,這100個(gè)數(shù)據(jù)中處于正中間位置的是第50個(gè)數(shù)據(jù)7和第51個(gè)數(shù)據(jù)8。這兩數(shù)的平均數(shù)為7.5,即為甲訓(xùn)練成績(jī)的中位數(shù)。
將乙的全部訓(xùn)練成績(jī)(共99個(gè))按環(huán)數(shù)從小到大依次排列,這99個(gè)數(shù)據(jù)中處于正中間位置的是第50個(gè)數(shù)據(jù)8,即為乙訓(xùn)練成績(jī)的中位數(shù)。
從計(jì)算結(jié)果可知,一般情形下,甲發(fā)揮中等水平時(shí)成績(jī)介于7環(huán)和8環(huán)之間的可能性較大,乙發(fā)揮中等水平時(shí)成績(jī)是8環(huán)的可能性較大。
(3)在甲的全部訓(xùn)練成績(jī)(共100個(gè))中,出現(xiàn)次數(shù)最多的是7環(huán)(26次),7即這組數(shù)據(jù)的眾數(shù)。
在乙的全部訓(xùn)練成績(jī)(共99個(gè))中,出現(xiàn)次數(shù)最多的是7環(huán)(25次)和8環(huán)(25次),7和8即這組數(shù)據(jù)的眾數(shù)。
從計(jì)算結(jié)果可知,雖然每次射箭成績(jī)可能會(huì)有變化,但在一般情形下,甲射中7環(huán)比射中其他環(huán)數(shù)的可能性要大,乙射中7環(huán)或8環(huán)比射中其他環(huán)數(shù)的可能性要大。
(4)由前面的平均數(shù)及方差公式,可得s2甲≈1.95,s2乙≈1.84。
從訓(xùn)練成績(jī)的方差看,甲略大于乙,這說(shuō)明甲的數(shù)據(jù)比乙的數(shù)據(jù)的離散程度略高,也即成績(jī)的起伏略大。乙的成績(jī)相對(duì)來(lái)說(shuō)穩(wěn)定些。
從上面這個(gè)例子可以看出,四種數(shù)據(jù)代表的求法不同,所表示的意義也各異。
平均數(shù)是所有數(shù)據(jù)之和除以數(shù)據(jù)的個(gè)數(shù)所得的商,它是分析和比較數(shù)據(jù)的集中趨勢(shì)時(shí)最常用的數(shù)據(jù)代表。平均數(shù)的計(jì)算利用了一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)。任何一個(gè)數(shù)據(jù)的變化。都會(huì)影響平均數(shù)的大小。如果一組數(shù)據(jù)中有少數(shù)數(shù)據(jù)的值明顯地過(guò)大或過(guò)小,最好不要僅僅使用平均數(shù)來(lái)考量,因?yàn)閭€(gè)別過(guò)大或過(guò)小的極端值會(huì)導(dǎo)致平均數(shù)與數(shù)據(jù)的實(shí)際集中點(diǎn)有較大差距。這時(shí),最好用中位數(shù)作為數(shù)據(jù)代表,因?yàn)橹形粩?shù)不受極端值的影響。有時(shí),為了決定是用平均數(shù)還是用中位數(shù)作為代表來(lái)分析一組數(shù)據(jù)的集中趨勢(shì),最好把這兩個(gè)數(shù)據(jù)代表都算出來(lái)。如果它們的值很接近,則使用平均數(shù);如果它們有很大的不同,則使用中位數(shù)。
根據(jù)一組數(shù)據(jù)的中位數(shù),可以把數(shù)據(jù)分成同等數(shù)目的兩組,其中一組數(shù)據(jù)的值不小于中位數(shù),而另一組數(shù)據(jù)的值不大于中位數(shù)。將一組數(shù)據(jù)由小到大排列,有奇數(shù)個(gè)數(shù)據(jù)時(shí),處于正中間位置的數(shù)就是中位數(shù):有偶數(shù)個(gè)數(shù)據(jù)時(shí),取處于正中間位置的兩個(gè)數(shù)的平均數(shù)作為中位數(shù)??梢钥闯?,中位數(shù)并不一定是原始數(shù)據(jù)之一。但它很好地代表了一組數(shù)據(jù)的“中點(diǎn)”,而且很容易找出它。
眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)。它一定是這組數(shù)據(jù)中的某個(gè)數(shù)據(jù)。有時(shí),眾數(shù)可能不止一個(gè)。如上例中乙的訓(xùn)練成績(jī)就有兩個(gè)眾數(shù)。如果一組數(shù)據(jù)中各個(gè)不同的數(shù)值出現(xiàn)的次數(shù)完全一樣,則這組數(shù)據(jù)就沒(méi)有眾數(shù)。找眾數(shù)只需要比較各數(shù)據(jù)的個(gè)數(shù),而不需要計(jì)算。眾數(shù)反映了一組數(shù)據(jù)的最大集中點(diǎn)。由眾數(shù)可知這個(gè)數(shù)據(jù)在這組數(shù)據(jù)中出現(xiàn)的次數(shù)最多,但由它并不能知道這個(gè)數(shù)據(jù)具體出現(xiàn)了多少次,以及它比其他數(shù)據(jù)的出現(xiàn)次數(shù)多到何種程度。和中位數(shù)一樣,眾數(shù)也不受極端值的影響。
平均數(shù)、中位數(shù)和眾數(shù)的側(cè)重點(diǎn)不同,反映一組數(shù)據(jù)的集中趨勢(shì)的角度不同。因此,應(yīng)根據(jù)實(shí)際問(wèn)題的需要,選取合適的數(shù)據(jù)代表來(lái)研究數(shù)據(jù)的集中趨勢(shì)。
從方差的計(jì)算公式可以看出。它實(shí)際上是各數(shù)據(jù)與平均數(shù)之差的平方的平均數(shù)。之所以用差的平方,是因?yàn)椴畋旧碛姓?fù)。而平方后則不存在負(fù)數(shù),相加求平均數(shù)時(shí)不會(huì)正負(fù)相抵,從而能更準(zhǔn)確地刻畫(huà)各數(shù)據(jù)與平均數(shù)的平均偏離程度。圖1是數(shù)據(jù)散點(diǎn)圖。其中(1)(2)里的點(diǎn)分別表示兩組數(shù)據(jù)。直觀上可以發(fā)現(xiàn),(1)中數(shù)據(jù)點(diǎn)分布的離散程度較高,各點(diǎn)與平均數(shù)對(duì)應(yīng)的水平線的偏離度大;(2)中數(shù)據(jù)點(diǎn)分布的離散程度較低,各點(diǎn)與平均數(shù)對(duì)應(yīng)的水平線的偏離度小。這里的偏離度不是就個(gè)別數(shù)據(jù)點(diǎn)而論的。而是就所有數(shù)據(jù)點(diǎn)的偏離度的平均水平而言的。(1)中數(shù)據(jù)的方差較大,(2)中數(shù)據(jù)的方差較小。這是數(shù)據(jù)離散程度的幾何解釋。