陳玲玲
(作者單位:江蘇省海安市李堡中學)
戈賽特(Gosset)是t檢驗(也叫studentt檢驗)的創(chuàng)始人。與許多學者一樣,他當時并沒有直接從事統(tǒng)計學的研究,畢竟,在100多年前,統(tǒng)計學甚至還算不上一門學科。他從事的是啤酒釀造行業(yè),然而就是在這一似乎與統(tǒng)計無關的行業(yè)里,他做了一項研究,想弄清楚發(fā)酵時需要加多少酵母最合適。當時戈賽特做出了結果并準備將其發(fā)表,可惜他所在的是釀酒行業(yè),貿(mào)然發(fā)表的話會有泄露商業(yè)機密之嫌。但戈賽特又確實想發(fā)表這一文章,因此采取了折中的辦法:匿名發(fā)表。他采用了一個筆名,也就是現(xiàn)在我們?nèi)钥梢栽诮y(tǒng)計學教材上見到的“student”。
戈賽特最重要的一個貢獻就是提出了小樣本的檢驗思想?,F(xiàn)在我們看起來似乎并無任何出奇,但在當時,統(tǒng)計學幾乎就是大樣本的科學,一提起統(tǒng)計學,就想到大樣本。當時卡爾·皮爾遜幾乎所有的工作都是基于大樣本的假設。但戈賽特根據(jù)自己的經(jīng)驗認為,有的情況下,大樣本對于研究者來講太過于奢侈了,必須專注于小樣本。不過一旦用小樣本分析,無可避免地會牽扯到誤差的問題。在大樣本情況下,你可以假定沒有誤差或者誤差很小可以忽略不計,而小樣本必須考慮到這一問題。那么小樣本情況下,誤差有多大呢?這就是戈賽特所關注的。
戈賽特通過不斷地演算,最終于1908年發(fā)表了一篇極為重要的文章《Theprobableerrorofthemean》,提出了t分布,這也是至今我們?nèi)栽趶V泛應用的t檢驗的基礎。考慮一下當時的條件,可想而知戈賽特做出了多少次的計算才得出這一結論。他需要一次一次地計算均數(shù)、標準誤,以確定相關數(shù)據(jù)的概率分布。現(xiàn)在條件下通過計算機模擬可能很快得出結果,但當時顯然是很復雜的。不管如何,戈賽特通過努力,最終發(fā)現(xiàn)了小樣本的分析規(guī)律,并奠定了小樣本分析的基礎?,F(xiàn)在,人們通常稱其為小樣本理論的鼻祖。