陳玲玲
戈賽特(Gosset)是t檢驗(也叫student t檢驗)的創(chuàng)始人。與許多學(xué)者一樣,他當(dāng)時并沒有直接從事統(tǒng)計學(xué)的研究,畢竟,在100多年前,統(tǒng)計學(xué)甚至還算不上一門學(xué)科。他從事的是啤酒釀造行業(yè),然而就是在這一似乎與統(tǒng)計無關(guān)的行業(yè)里,他做了一項研究,想弄清楚發(fā)酵時需要加多少酵母最合適。當(dāng)時戈賽特做出了結(jié)果并準(zhǔn)備將其發(fā)表,可惜他所在的是釀酒行業(yè),貿(mào)然發(fā)表的話會有泄露商業(yè)機(jī)密之嫌。但戈賽特又確實想發(fā)表這一文章,因此采取了折中的辦法:匿名發(fā)表。他采用了一個筆名,也就是現(xiàn)在我們?nèi)钥梢栽诮y(tǒng)計學(xué)教材上見到的“student”。
戈賽特最重要的一個貢獻(xiàn)就是提出了小樣本的檢驗思想。現(xiàn)在我們看起來似乎并無任何出奇,但在當(dāng)時,統(tǒng)計學(xué)幾乎就是大樣本的科學(xué),一提起統(tǒng)計學(xué),就想到大樣本。當(dāng)時卡爾·皮爾遜幾乎所有的工作都是基于大樣本的假設(shè)。但戈賽特根據(jù)自己的經(jīng)驗認(rèn)為,有的情況下,大樣本對于研究者來講太過于奢侈了,必須專注于小樣本。不過一旦用小樣本分析,無可避免地會牽扯到誤差的問題。在大樣本情況下,你可以假定沒有誤差或者誤差很小可以忽略不計,而小樣本必須考慮到這一問題。那么小樣本情況下,誤差有多大呢?這就是戈賽特所關(guān)注的。
戈賽特通過不斷地演算,最終于1908年發(fā)表了一篇極為重要的文章《The probable error of the mean》,提出了t分布,這也是至今我們?nèi)栽趶V泛應(yīng)用的t檢驗的基礎(chǔ)??紤]一下當(dāng)時的條件,可想而知戈賽特做出了多少次的計算才得出這一結(jié)論。他需要一次一次地計算均數(shù)、標(biāo)準(zhǔn)誤,以確定相關(guān)數(shù)據(jù)的概率分布。現(xiàn)在條件下通過計算機(jī)模擬可能很快得出結(jié)果,但當(dāng)時顯然是很復(fù)雜的。不管如何,戈賽特通過努力,最終發(fā)現(xiàn)了小樣本的分析規(guī)律,并奠定了小樣本分析的基礎(chǔ)?,F(xiàn)在,人們通常稱其為小樣本理論的鼻祖。
(作者單位:江蘇省海安市李堡中學(xué))