從啤酒釀造業(yè)走出的統(tǒng)計學(xué)家

2019-04-22 01:22:34陳玲玲

初中生世界·八年級 2019年3期

陳玲玲

戈賽特（Gosset）是t檢驗（也叫student t檢驗）的創(chuàng)始人。與許多學(xué)者一樣，他當(dāng)時并沒有直接從事統(tǒng)計學(xué)的研究，畢竟，在100多年前，統(tǒng)計學(xué)甚至還算不上一門學(xué)科。他從事的是啤酒釀造行業(yè)，然而就是在這一似乎與統(tǒng)計無關(guān)的行業(yè)里，他做了一項研究，想弄清楚發(fā)酵時需要加多少酵母最合適。當(dāng)時戈賽特做出了結(jié)果并準(zhǔn)備將其發(fā)表，可惜他所在的是釀酒行業(yè)，貿(mào)然發(fā)表的話會有泄露商業(yè)機(jī)密之嫌。但戈賽特又確實想發(fā)表這一文章，因此采取了折中的辦法：匿名發(fā)表。他采用了一個筆名，也就是現(xiàn)在我們?nèi)钥梢栽诮y(tǒng)計學(xué)教材上見到的“student”。

戈賽特最重要的一個貢獻(xiàn)就是提出了小樣本的檢驗思想。現(xiàn)在我們看起來似乎并無任何出奇，但在當(dāng)時，統(tǒng)計學(xué)幾乎就是大樣本的科學(xué)，一提起統(tǒng)計學(xué)，就想到大樣本。當(dāng)時卡爾·皮爾遜幾乎所有的工作都是基于大樣本的假設(shè)。但戈賽特根據(jù)自己的經(jīng)驗認(rèn)為，有的情況下，大樣本對于研究者來講太過于奢侈了，必須專注于小樣本。不過一旦用小樣本分析，無可避免地會牽扯到誤差的問題。在大樣本情況下，你可以假定沒有誤差或者誤差很小可以忽略不計，而小樣本必須考慮到這一問題。那么小樣本情況下，誤差有多大呢？這就是戈賽特所關(guān)注的。

戈賽特通過不斷地演算，最終于1908年發(fā)表了一篇極為重要的文章《The probable error of the mean》，提出了t分布，這也是至今我們?nèi)栽趶V泛應(yīng)用的t檢驗的基礎(chǔ)?？紤]一下當(dāng)時的條件，可想而知戈賽特做出了多少次的計算才得出這一結(jié)論。他需要一次一次地計算均數(shù)、標(biāo)準(zhǔn)誤，以確定相關(guān)數(shù)據(jù)的概率分布。現(xiàn)在條件下通過計算機(jī)模擬可能很快得出結(jié)果，但當(dāng)時顯然是很復(fù)雜的。不管如何，戈賽特通過努力，最終發(fā)現(xiàn)了小樣本的分析規(guī)律，并奠定了小樣本分析的基礎(chǔ)?，F(xiàn)在，人們通常稱其為小樣本理論的鼻祖。

（作者單位：江蘇省海安市李堡中學(xué)）