劉忠廣 河南工程學(xué)院工商管理學(xué)院
標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤差是統(tǒng)計(jì)學(xué)的重要概念。標(biāo)準(zhǔn)差是根據(jù)原始數(shù)據(jù)計(jì)算的,反映一組原始數(shù)據(jù)的離散程度。而標(biāo)準(zhǔn)誤差是根據(jù)樣本統(tǒng)計(jì)量計(jì)算的,反映統(tǒng)計(jì)量的離散程度。標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤差的區(qū)別還在于求標(biāo)準(zhǔn)差僅需要一個(gè)樣本的數(shù)據(jù),但是求標(biāo)準(zhǔn)誤差需要多個(gè)樣本的數(shù)據(jù)。而在實(shí)際應(yīng)用中,往往是根據(jù)一個(gè)樣本的數(shù)據(jù)來(lái)計(jì)算標(biāo)準(zhǔn)誤差的,這時(shí)計(jì)算的標(biāo)準(zhǔn)誤差就是估計(jì)標(biāo)準(zhǔn)誤差。這幾個(gè)概念比較抽象,理解起來(lái)比較困難。同時(shí),不同的教材對(duì)標(biāo)準(zhǔn)誤差也有多種叫法,如標(biāo)準(zhǔn)誤[1]、抽樣平均誤差[2][3]、抽樣標(biāo)準(zhǔn)差[4]等等。另外,在統(tǒng)計(jì)學(xué)教學(xué)內(nèi)容的線性回歸部分,不同教材對(duì)殘差均方的平方根的叫法也有不同,如估計(jì)標(biāo)準(zhǔn)誤差[5][6]、預(yù)測(cè)標(biāo)準(zhǔn)誤差[7]、回歸估計(jì)的標(biāo)準(zhǔn)誤差[8]等,這些都給統(tǒng)計(jì)初學(xué)者帶來(lái)了困惑和不解。
標(biāo)準(zhǔn)差的英文單詞是standard deviation, standard是典型或平均的意思,deviation的含義是離差,指一個(gè)分布中的一個(gè)取值與該分布的平均取值之差。所以標(biāo)準(zhǔn)差是一個(gè)分布單個(gè)取值與均值之間的典型或平均離差[9]。具體計(jì)算時(shí)各變量值與其算術(shù)平均數(shù)(也稱(chēng)均值)離差平方的平均數(shù)稱(chēng)為方差,方差的平方根即為標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差反映了每個(gè)變量值與其均值相比平均相差的數(shù)值,能準(zhǔn)確地反映出數(shù)據(jù)的離散程度,標(biāo)準(zhǔn)差是應(yīng)用最廣泛的反映數(shù)據(jù)離散程度的測(cè)度值。標(biāo)準(zhǔn)差的計(jì)算為:
如果獲取的是總體的數(shù)據(jù),反映總體數(shù)據(jù)離散程度的可用總體標(biāo)準(zhǔn)差,其計(jì)算公式為:
σ=,μ為總體均值,N為總體數(shù)據(jù)的個(gè)數(shù)
一般來(lái)說(shuō),我們獲取的數(shù)據(jù)大多是樣本數(shù)據(jù),反映樣本數(shù)據(jù)離散程度的為樣本標(biāo)準(zhǔn)差,其計(jì)算公式為:
s=為樣本均值,n為樣本容量(下同)
標(biāo)準(zhǔn)誤差(Standard Error)是某一統(tǒng)計(jì)量(如樣本均值、樣本均值之差、樣本比例、相關(guān)系數(shù)等)抽樣分布的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤差用于衡量樣本統(tǒng)計(jì)量的離散程度,在參數(shù)估計(jì)和假設(shè)檢驗(yàn)中,它是用于衡量樣本統(tǒng)計(jì)量與總體參數(shù)之間差距的重要尺度。在實(shí)際應(yīng)用中,標(biāo)準(zhǔn)誤差往往是根據(jù)樣本數(shù)據(jù)計(jì)算來(lái)的,根據(jù)樣本數(shù)據(jù)計(jì)算的標(biāo)準(zhǔn)誤差實(shí)際上是估計(jì)標(biāo)準(zhǔn)誤差(在用統(tǒng)計(jì)軟件計(jì)算時(shí)給出的都是估計(jì)標(biāo)準(zhǔn)誤差)。常見(jiàn)的標(biāo)準(zhǔn)誤差有樣本均值的標(biāo)準(zhǔn)誤差、樣本比例的標(biāo)準(zhǔn)誤差、樣本相關(guān)系數(shù)的標(biāo)準(zhǔn)誤差、線性回歸方程斜率及截距的標(biāo)準(zhǔn)誤差、回歸估計(jì)的標(biāo)準(zhǔn)誤差等。
【例】從某一高校的女生中隨機(jī)抽取10名學(xué)生,測(cè)其身高和體重?cái)?shù)據(jù)見(jiàn)表1.
表1:某高校10名女生身高和體重?cái)?shù)據(jù)
表2:某高校10名女生身高和體重的描述統(tǒng)計(jì)
從表2可以看出這10名女生的平均身高為161.7cm,平均體重為61.1kg.表中標(biāo)準(zhǔn)差是身高和體重的樣本標(biāo)準(zhǔn)差.標(biāo)準(zhǔn)誤差分別是身高和體重的估計(jì)標(biāo)準(zhǔn)誤差,是根據(jù)估計(jì)標(biāo)準(zhǔn)誤差的公式計(jì)算出來(lái)的,即:
可以估計(jì)全校女生的平均身高和平均體重95%的置信區(qū)間分別為:
表3 :某高校女生身體和體重的回歸統(tǒng)計(jì)
從表3可以得到相關(guān)系數(shù)為0.87,可以計(jì)算相關(guān)系數(shù)的標(biāo)準(zhǔn)誤差
5.12 > 2.306 ,所以拒絕原假設(shè),結(jié)論是該校女生身高和體重相關(guān)關(guān)系顯著.
表中的標(biāo)準(zhǔn)誤差為回歸估計(jì)的標(biāo)準(zhǔn)誤差,其意義為,根據(jù)身高來(lái)預(yù)測(cè)體重時(shí),平均的預(yù)測(cè)誤差為3.91kg.
表4:某高校女生身高和體重的方差分析表
根據(jù)表4方差分析表,由于P=0.00 < 0.05,所以,身高與體重的線性關(guān)系顯著.
表5:某高校女生身高和體重的回歸分析表
標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤差和估計(jì)標(biāo)準(zhǔn)誤差這三個(gè)概念字面相似,但代表的含義有不同,標(biāo)準(zhǔn)差是根據(jù)原始觀測(cè)數(shù)據(jù)計(jì)算出來(lái)的,計(jì)算標(biāo)準(zhǔn)差僅需要一個(gè)樣本數(shù)據(jù)。標(biāo)準(zhǔn)誤差是根據(jù)統(tǒng)計(jì)量抽樣分布計(jì)算出來(lái)的,從理論上講計(jì)算標(biāo)準(zhǔn)誤差需要所有可能樣本的數(shù)據(jù),但在實(shí)際應(yīng)用中,是根據(jù)一個(gè)樣本的數(shù)據(jù)來(lái)計(jì)算標(biāo)準(zhǔn)誤差的,這時(shí)的標(biāo)準(zhǔn)誤差即為估計(jì)標(biāo)準(zhǔn)誤差。