徐傳勝
大千世界充滿著不確定性:明天晴否?成年后你身高多少?下次數(shù)學(xué)考試成績?nèi)绾危繉韽氖潞畏N職業(yè)?和誰結(jié)婚生子?等等。從遠(yuǎn)古時代起,估計(jì)各種可能性就是人類的一件要事。為研究不確定性。人們開始了數(shù)據(jù)統(tǒng)計(jì)以及數(shù)據(jù)分析,以求對自然和社會現(xiàn)象作出較為客觀的近似估計(jì)。原始數(shù)據(jù)的提煉應(yīng)盡可能抓住事物的本質(zhì)特征。這就有了統(tǒng)計(jì)量。反映研究對象集中程度的統(tǒng)計(jì)量主要有平均數(shù)、中位數(shù)和眾數(shù)。它們都已有較長的歷史。
一、平均數(shù)
平均數(shù)的應(yīng)用很多,不過它最早是用來估計(jì)較大的數(shù)據(jù)。約公元4世紀(jì)。印度有棵枝葉茂盛的大樹,某人想估計(jì)其果實(shí)的數(shù)目。他首先計(jì)算了根部一條細(xì)枝上果實(shí)的數(shù)目,再數(shù)出整棵大數(shù)的細(xì)枝的數(shù)目,然后將兩數(shù)相乘得到估計(jì)值為2095。盡管不能確定他如何選擇那條細(xì)枝,但猜測他應(yīng)該是選擇了一條具有平均大小的細(xì)枝。類似地。我們可以估計(jì)某市某街道一天通過的車輛數(shù)。也可以估計(jì)我們掌握的英文單詞數(shù)量。
天文學(xué)的發(fā)展促進(jìn)了統(tǒng)計(jì)學(xué)的發(fā)展。也使得平均數(shù)更有用武之地。1585年,荷蘭數(shù)學(xué)家斯蒂文(1548-1620)系統(tǒng)地探討了十進(jìn)制記數(shù)法,并發(fā)明了小數(shù)。這就為平均數(shù)推廣到n個數(shù)的情形提供了便利。當(dāng)時,天文學(xué)家需要計(jì)算多個觀測值的平均數(shù)。以便把誤差降低到較小的程度。最為典型的是,丹麥天文學(xué)家第谷(1546-1601)把對觀察數(shù)據(jù)分組的技巧引入了天文學(xué)。1572年11月11口,第谷發(fā)現(xiàn)了仙后座中的一顆新星。后來。他受丹麥國王的邀請,在汶島建造了天文觀象臺。經(jīng)過20年的天文觀測,第谷發(fā)現(xiàn)了許多天文現(xiàn)象,其觀測精度之高,令同時代的學(xué)者望塵莫及。比如,為獲得某天文學(xué)數(shù)值的估計(jì)量,他先從1582年的天文觀察數(shù)值中。挑選了3個數(shù)據(jù);又把1582年至1588年的24個數(shù)據(jù),兩兩任意分組,分別求出其平均數(shù),得到12個數(shù)據(jù);最后求出所得的15個數(shù)據(jù)的平均數(shù),作為真值估計(jì)。第谷所編制的恒星表相當(dāng)準(zhǔn)確,至今仍有學(xué)術(shù)價值。開普勒(1571~1630)就是在第谷天文觀測數(shù)據(jù)的基礎(chǔ)上。發(fā)現(xiàn)了行星運(yùn)動的三大定律。
英國科學(xué)家、數(shù)學(xué)家哈雷(1656-1743)的名字永遠(yuǎn)和哈雷彗星聯(lián)系在一起。1705年,他根據(jù)天文觀測數(shù)據(jù)。發(fā)現(xiàn)了一個彗星的運(yùn)動周期,預(yù)言其將于1758年返同地球。雖然哈雷沒能親眼看到預(yù)言實(shí)現(xiàn),但1758年彗星再次照亮了夜空!哈雷在處理數(shù)據(jù)方面也有特色才能。他根據(jù)統(tǒng)計(jì)數(shù)據(jù)得出布雷斯勞市一些人口方面的結(jié)論:平均每年出生1238人,其中平均有348個嬰兒不到1歲就夭折,平均有692人的壽命為70歲;平均每年有1174人去世等。
英國天文學(xué)家、數(shù)學(xué)家辛普森(1710-1761)是個自學(xué)成才者。他試圖推廣天文學(xué)界計(jì)算平均數(shù)的方法,但并不為人們所接受。辛普森證得。若以觀測值的平均數(shù)去估計(jì)真值。誤差將比單個觀測值要小。而且隨著觀測次數(shù)的增加誤差會進(jìn)一步減小。同學(xué)們不妨考察投擲硬幣的情形,就會理解這是一個很了小起的研究成果。
1809年,高斯(1777-1855)在、《天體運(yùn)動州論》中指出:在相同條件下,對研究對象通過幾次直接觀測,則觀測值的平均數(shù)提供了其最可靠的取值,即使不太嚴(yán)格。但至少十分接近真值。現(xiàn)在,高斯的這個觀點(diǎn)幾乎被看作公理。廣泛應(yīng)用于自然現(xiàn)象和現(xiàn)實(shí)社會之中。
二、中位數(shù)
據(jù)史料記載,中位數(shù)的第一次應(yīng)用是應(yīng)用于航海。大海航行中指南針是個重要工具,其用來確定輪船在海上的位置。由于海浪的影響,指南針觀察數(shù)據(jù)會有很大的差異。而盡可能保證數(shù)據(jù)的準(zhǔn)確性則很重要。1599年。愛德華·賴特描述了他確定指南針位置的方法。他把所有指南針觀察值列成一個表格。在各個不同的數(shù)據(jù)中。位于最中間位置者最可能接近真實(shí)值。
中位數(shù)幾乎是作為平均數(shù)的替代品而出現(xiàn)的。1924年。費(fèi)希爾(1890-1962)借助于天文學(xué)的方法,應(yīng)用中位數(shù)來描述社會和心理現(xiàn)象。他1912年畢業(yè)于劍橋大學(xué)。是英同統(tǒng)計(jì)學(xué)家、生物進(jìn)化學(xué)家、數(shù)學(xué)家、遺傳學(xué)家和優(yōu)生學(xué)家,被譽(yù)為現(xiàn)代進(jìn)化論的首席設(shè)計(jì)師。他創(chuàng)立了雌雄雙方生物性狀互相促進(jìn)的進(jìn)化理論,是達(dá)爾文(1809-1882)之后最偉大的生物進(jìn)化學(xué)家。
1882年,高爾頓(1822-1911)第一次他用“中位數(shù)”術(shù)語,取得了統(tǒng)計(jì)觀念上的突破。但其研究對象幾乎都是對稱的,故中位數(shù)和平均數(shù)沒有太大的區(qū)別。高爾頓是達(dá)爾義的表弟,深受其進(jìn)化論思想的影響。他從遺傳角度研究個別差異的形成原因。開了優(yōu)生學(xué)的先河。1889年,高爾頓在研究祖先與后代身高之間的關(guān)系時發(fā)現(xiàn)了有趣的“回歸現(xiàn)象”。高爾頓搜集了1078對父與子的身高數(shù)據(jù)。他發(fā)現(xiàn),當(dāng)父親高于平均身高時。其兒了比父親矮的可能性大;父親矮于平均身高時,其兒子比父親高的可能性大??梢娚衩氐娜俗匀痪哂幸环N約束力,使人類身高相對穩(wěn)定而不致于產(chǎn)生兩極分化。類似的“回歸現(xiàn)象”還有很多。如期中考試得高分的一組同學(xué)在期末考試中的平均分會有所降低。而期中考試分?jǐn)?shù)低的一組同學(xué)期末考試的平均分會有所提高。
與高爾頓同時代的艾德沃斯(1845- 1926)發(fā)現(xiàn)平均數(shù)對極端值具有敏感性,因此選擇以中位數(shù)代替平均數(shù)。這可能源于艾德沃斯對經(jīng)濟(jì)學(xué)的研究,因?yàn)槠渲写蠖嗍且恍┎灰?guī)則的數(shù)據(jù)。中位數(shù)對極端值不敏感。比如,目前我國高收入者較少,低收入者較多,若按平均數(shù)計(jì)算,平均收入會低于中間收入。隨著統(tǒng)計(jì)學(xué)越來越涉及不規(guī)則的數(shù)據(jù),中位數(shù)的應(yīng)用已日趨廣泛。
三、眾數(shù)
眾數(shù)是具有集中趨勢特點(diǎn)的一個數(shù)值,是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)。眾數(shù)一般用M表示。緣于其英文第一個字母。
同學(xué)們是否知道戰(zhàn)爭也能促進(jìn)數(shù)學(xué)的發(fā)展?第一次眾數(shù)應(yīng)用的實(shí)例就出現(xiàn)在古希臘的伯羅奔尼撒戰(zhàn)爭之中。這是以雅典為首的提洛同盟與以斯巴達(dá)為首的伯羅奔尼撒聯(lián)盟之間的戰(zhàn)爭。戰(zhàn)爭從公元前431年一直持續(xù)到公元前404年,雙方曾幾度停戰(zhàn),最后斯巴達(dá)獲勝。公元前428年冬。普拉鐵阿人被伯羅奔尼撒人和皮奧夏人包圍了。前者很快出現(xiàn)了糧食短缺,此時雅典人的援助已經(jīng)無望,也沒有安全突圍的方法。無奈之下,普拉鐵阿人計(jì)劃冒險突圍,他們打算做梯子,然后翻過城墻。這就要求梯子的高度須與城墻高度一樣。為此可以通過數(shù)城墻上上磚塊的層數(shù)來計(jì)算城墻的高度。在那段時間里,小少人數(shù)出了磚塊的層數(shù),但有些人可能數(shù)錯了,不過大多數(shù)人可能得到了一個真實(shí)的數(shù)日。他們選取這些數(shù)據(jù)中的眾數(shù)。從而設(shè)計(jì)出梯子的高度。最后成功突圍。
現(xiàn)在投票選舉已司空見慣。如同學(xué)們選舉班干部、優(yōu)秀學(xué)生等。民主選舉的規(guī)范形式是差額選舉。讓選民擇優(yōu)選擇。易見當(dāng)一組數(shù)據(jù)呈現(xiàn)明顯集中的趨勢時,宜采用眾數(shù)作為代表,并且眾數(shù)還是一個衡量非數(shù)字類型數(shù)據(jù)的統(tǒng)計(jì)量。
我們現(xiàn)在處于大數(shù)據(jù)時代。人人都淹沒在數(shù)據(jù)的海洋之中。當(dāng)分析一組數(shù)據(jù)時,可獲得大量的信息。人們期望據(jù)此來了解和推斷總體的特性。不過,從樣本數(shù)據(jù)推斷總體的性質(zhì)時可能會出現(xiàn)一些錯誤。比如在19世紀(jì),有些科學(xué)家對罪犯頭顱的大小進(jìn)行了研究,試圖找出其頭顱大小或形狀與常人的差異。再如過去100多年間。智力測驗(yàn)成為了一項(xiàng)專題研究,人們期望由此發(fā)現(xiàn)天才學(xué)生。這些以偏概全的做法,現(xiàn)在都已被淘汰。
中學(xué)生數(shù)理化·八年級數(shù)學(xué)人教版2016年5期