高藝祥,楊民紅,李蘭會
(1.河北農(nóng)業(yè)大學(xué)動物醫(yī)學(xué)院,河北 保定 071001;2.河北省新樂市農(nóng)林畜牧局農(nóng)業(yè)行政綜合執(zhí)法大隊(duì),河北 新樂050700;3.河北農(nóng)業(yè)大學(xué)動物科技學(xué)院,河北 保定 071001)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)是臨床醫(yī)學(xué)、基礎(chǔ)醫(yī)學(xué)、公共衛(wèi)生學(xué)和醫(yī)療衛(wèi)生服務(wù)研究的一門基礎(chǔ)學(xué)科[1],研究對象主要是醫(yī)學(xué)中具有不確定性結(jié)果的事物,其主要作用是通過數(shù)據(jù)的偶然性揭示內(nèi)在的規(guī)律性[2]。統(tǒng)計(jì)分析的要點(diǎn)是正確地選用統(tǒng)計(jì)分析方法,并結(jié)合專業(yè)知識做出科學(xué)的結(jié)論??茖W(xué)的任務(wù)就在于,從看起來錯綜復(fù)雜的偶然性中揭露出潛在的必然性,即事物的客觀規(guī)律性。這種客觀規(guī)律性是在大量現(xiàn)象中發(fā)現(xiàn)的,例如臨床要觀察某種療法對某病的療效時,如果觀察的病人較少,便不容易正確判斷該療法對某病是否有效;但當(dāng)觀察病人的數(shù)量足夠多時,就可以得出該療法在一定程度上有效或無效的結(jié)論,因此,醫(yī)學(xué)統(tǒng)計(jì)學(xué)是醫(yī)學(xué)科學(xué)研究的重要工具。
醫(yī)學(xué)統(tǒng)計(jì)學(xué)的內(nèi)容包括:①定量數(shù)據(jù)的統(tǒng)計(jì)描述。主要內(nèi)容包括集中趨勢的統(tǒng)計(jì)指標(biāo):算數(shù)均數(shù)、幾何均數(shù)、中位數(shù)和百分位數(shù)。變異程度的統(tǒng)計(jì)指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。②總體指標(biāo)的估計(jì)。醫(yī)學(xué)研究中實(shí)際觀測或調(diào)查的部分個體稱為樣本,研究對象的全體稱為總體。除用均數(shù)、率等統(tǒng)計(jì)指標(biāo)對調(diào)查或?qū)嶒?yàn)結(jié)果進(jìn)行描述外,更重要的是通過樣本的信息,來估計(jì)總體中相應(yīng)的統(tǒng)計(jì)指標(biāo),即參數(shù)估計(jì)。③假設(shè)檢驗(yàn)。就是依據(jù)資料性質(zhì)和所需解決的問題,先建立適當(dāng)?shù)募僭O(shè),然后采用適當(dāng)?shù)臋z驗(yàn)方法。④基本的運(yùn)算工具是假設(shè)檢驗(yàn)的方法工具:U檢驗(yàn)、t檢驗(yàn)、方差分析和 χ2檢驗(yàn)[3]。
以馬斌榮主編的醫(yī)學(xué)統(tǒng)計(jì)學(xué)教材為例[1],解釋說明應(yīng)用Excel和SPSS統(tǒng)計(jì)工具進(jìn)行獨(dú)立樣本t檢驗(yàn)的基本過程?!澳稠?xiàng)研究評估低氧環(huán)境對運(yùn)動者心肌血流量的影響,將17名男性志愿者隨機(jī)分為2組,分別在正常含氧環(huán)境(正常組)和低氧環(huán)境 (低氧組)中測定運(yùn)動后的心肌血流量[mL/(min·g)]:正常組為 3.5、3.1、3.1、2.7、2.5、2.3、2.3、2.2、2.2 mL/(min·g); 低氧組為 6.4、5.7、5.6、5.3、5.1、4.9、4.7、3.5 mL/(min·g)。 問 2 種環(huán)境中運(yùn)動者的心肌血流量有無差異?”。
表1 Excel的F檢驗(yàn)·雙樣本方差輸出結(jié)果(一)
兩獨(dú)立樣本t檢驗(yàn),又稱成組t檢驗(yàn),它適用于完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)比較,其目的是檢驗(yàn)兩樣本代表的總體均數(shù)是否相等,即通過x1和推斷μ1和μ2。該案例在于揭示氧氣濃度不同對運(yùn)動者的生理狀態(tài)是否有影響,將志愿者隨機(jī)分為2組,采用了完全隨機(jī)的試驗(yàn)設(shè)計(jì)方法,通過低氧和正常環(huán)境2種環(huán)境下志愿者運(yùn)動后的心肌血流量揭示氧氣濃度與生理狀態(tài)間是否存在關(guān)系。
利用Excel分析操作步驟分兩步,第一步是進(jìn)行F檢驗(yàn),工具→數(shù)據(jù)分析→F檢驗(yàn)·雙樣本方差,F(xiàn)檢驗(yàn)的目的在于分析兩樣本數(shù)據(jù)的總體方差和是否相等;第二步在F檢驗(yàn)的基礎(chǔ)上進(jìn)行t檢驗(yàn),推斷兩總體均值μ1和μ2是否相等,主要分兩種情況:如果方差相等,則進(jìn)行等方差假設(shè)的t檢驗(yàn),否則進(jìn)行異方差假設(shè)的t檢驗(yàn)[4]。
由Excel雙樣本方差輸出結(jié)果(見表1)可知,低氧組和正常組的心肌血流量樣本均值分別為5.15和2.66, 方差和分別為0.73和0.23,兩樣本的樣本含量分別為8和9,兩樣本自由度分別為7和8。F檢驗(yàn)的F檢驗(yàn)統(tǒng)計(jì)量為3.22,F(xiàn)為兩樣本方差的比值,即F==0.73/0.23=3.22,F(xiàn)值3.22在自由度df1和df2分別為7和8的F分布下出現(xiàn)的單尾概率P=0.06,該概率為F值小于3.22的區(qū)間概率,即F值為0~3.22在F分布總體0~+∞中所占的百分比,由此可知,F(xiàn)值的概率大于0.05,不是小概率,所以認(rèn)為兩樣本間的差異是由實(shí)驗(yàn)誤差引起的,兩總體方差和相等。同時輸出結(jié)果中F單尾臨界值3.50,即否定域和接受域的分界線為3.50,0~3.50的區(qū)域?yàn)榻邮苡颍現(xiàn)分布的右尾3.50~+∞的區(qū)域?yàn)榉穸ㄓ?,所以F值3.22落在接受域,不能否定H0,兩樣本所在總體方差相等。
表2 Excel的F檢驗(yàn)·雙樣本方差輸出結(jié)果(二)
Excel操作過程中重新進(jìn)行F檢驗(yàn),但變換變量1和變量2的區(qū)域,即低氧組設(shè)為變量2,正常組為變量1,輸出結(jié)果見表2。
通過表1和表2的對比可知交換變量后,正常組和低氧組的平均數(shù)、方差、觀測值、自由度、單尾P值都沒有變化,而統(tǒng)計(jì)量F值和F的單尾臨界值發(fā)生了改變。表2中,在自由度df1和df2分別為8和7的F分布下出現(xiàn)的單尾概率P=0.06,即F值為0~0.31在F分布總體0~+∞中所占的百分比為6%。表2中F單尾臨界值0.29,由于變化了兩個變量的位置,F(xiàn)值否定域改變?yōu)镕分布的左尾:0~0.29,0.29~+∞ 為接受域, 所以 F 值 0.31 落在接受域,不能否定H0,兩樣本所在總體方差相等,因此,交換變量后并沒有發(fā)生實(shí)質(zhì)性的變化,最后的結(jié)論依然不變。
Excel分析工具中有等方差假設(shè)和異方差假設(shè)的兩種獨(dú)立樣本t檢驗(yàn)工具[5],根據(jù)雙樣本方差分析結(jié)果,該例選用等方差假設(shè)的獨(dú)立樣本t檢驗(yàn),Excel輸出的t檢驗(yàn)結(jié)果見表3。根據(jù)t檢驗(yàn)的輸出結(jié)果,可以由4個統(tǒng)計(jì)量推斷低氧組和正常組兩總體均值心肌血流量是否相等,分別是單尾概率、單尾臨界值、雙尾概率和雙尾臨界值。
由表3可知,低氧組和正常組的合并方差t檢驗(yàn)統(tǒng)計(jì)量:
表3 Excel的等方差假設(shè)t檢驗(yàn)輸出結(jié)果
①由單尾概率推斷:t值7.58在自由度為15的t分布下出現(xiàn)的單尾概率P=8.33×10-7,該概率為t值大于等于7.58的區(qū)間概率,即t值為7.58~∞在t分布總體-∞~+∞中所占的百分比,由此可知,t值的概率小于0.05,是小概率,拒絕H0可認(rèn)為兩總體均值μ1和μ2不相等。
②由單尾臨界值推斷:t單尾臨界值1.75,即否定域和接受域的分界線為1.75,-∞~1.75的區(qū)域?yàn)榻邮苡颍?.75~+∞的區(qū)域?yàn)榉穸ㄓ颍詔值7.58落在拒絕域,否定H0,兩樣本所在總體均值不相等。
③由雙尾概率推斷:t值7.58在自由度為15的t分布下出現(xiàn)的雙尾概率P=1.67×10-6,該概率為t值7.58落在該t分布總體的兩個尾部的概率,即t值在-∞~-7.58和7.58~+∞2個尾部的區(qū)間概率。該概率小于0.05,根據(jù)小概率實(shí)際不可能原理拒絕H0,認(rèn)為兩總體均值不相等。
④根據(jù)t雙尾臨界值2.13,即自由度15的t分布總體中-∞~-2.13和2.13~+∞的區(qū)域?yàn)榫芙^域,-2.13~2.13的區(qū)域?yàn)榻邮苡?,所以t值7.58落在拒絕域,否定H0,兩樣本所在總體均值不相等。
利用SPSS分析操作步驟為分析→比較均值→獨(dú)立樣本t檢驗(yàn),輸出結(jié)果見表4。SPSS的獨(dú)立樣本t檢驗(yàn)結(jié)果中的內(nèi)容涵蓋了Excel的雙樣本方差檢驗(yàn)、兩樣本等方差t檢驗(yàn)和雙樣本異方差t檢驗(yàn)的結(jié)果。
SPSS的方差齊性檢驗(yàn)方法與Excel不同,采用的Levene檢驗(yàn)方法[6],從輸出結(jié)果的F值及其概率進(jìn)行推斷,概率為0.33>0.05,所以不能否定H0:,推斷兩總體方差相等,所以后面采用等方差假設(shè)的t檢驗(yàn)結(jié)果進(jìn)行推斷。t=-7.58,與Excel的結(jié)果完全一致,但表4中無單尾概率,只有雙尾概率0.00<0.05,也沒有臨界值,但推斷結(jié)論與Excel完全一致,否定H0,認(rèn)為μ1和μ2不相等。
表4同時給出平均值差值,即表面效應(yīng)和實(shí)驗(yàn)誤差分別為平均值差值:-=2.49和差值標(biāo)準(zhǔn)誤 SX1-X2=0.33,二者的比值即 t值(公式 2),t是表面效應(yīng)和實(shí)驗(yàn)誤差(差值標(biāo)準(zhǔn)誤)大小比較,如果表面效應(yīng)的大小遠(yuǎn)遠(yuǎn)超出實(shí)驗(yàn)誤差能解釋的數(shù)據(jù)變異范圍,即t值較大,那么表面效應(yīng)就不單純是由實(shí)驗(yàn)誤差引起的,還有本質(zhì)效應(yīng)μ1-μ2起作用;反之,表面效應(yīng)是由實(shí)驗(yàn)誤差引起的,本質(zhì)效應(yīng)不存在。表4同時給出了本質(zhì)效應(yīng)的估計(jì)值,差值95%的置信區(qū)間1.79~3.20,該區(qū)間大于0,不包括零假設(shè)的μ1-μ2=0,所以推斷本質(zhì)效應(yīng)存在,低氧組的心肌血流量高于正常組。這一研究結(jié)果提示人們鍛煉身體所處的環(huán)境對身體生理狀態(tài)有顯著影響,因此選擇舒適的外圍環(huán)境是強(qiáng)身健體的首選。
Excel中的方差齊性檢驗(yàn)為單側(cè)檢驗(yàn),當(dāng)大方差比小方差時,F(xiàn)值大于1,否定域位于F分布總體的右尾部;當(dāng)小方差比大方差時,F(xiàn)值小于1,否定域位于F分布總體的左尾部。該案例調(diào)換變量1和變量2的取值后,計(jì)算得到的F值互為倒數(shù),F(xiàn)臨界值也互為倒數(shù),F(xiàn)值出現(xiàn)的單尾概率不變,推斷結(jié)論不發(fā)生改變。
表4 SPSS的獨(dú)立樣本t檢驗(yàn)結(jié)果
根據(jù)雙樣本方差分析結(jié)果,即兩樣本所在總體方差是否相等,選擇等方差和異方差假設(shè)的t檢驗(yàn)推斷兩樣本總體均值是否相等。等方差假設(shè)t檢驗(yàn)進(jìn)行推斷估計(jì)的準(zhǔn)確度高,如果方差不等,對計(jì)算的t值或自由度進(jìn)行調(diào)整,如表4顯示異方差假設(shè)的t值和自由度都進(jìn)行了矯正,目的在于降低估計(jì)誤差,提高估計(jì)準(zhǔn)確度。
Excel的雙樣本t檢驗(yàn)的輸出結(jié)果中有單側(cè)概率及其臨界值和雙側(cè)概率及其臨界值,即分別是進(jìn)行單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)的推斷依據(jù)。單側(cè)和雙側(cè)檢驗(yàn)多數(shù)情況的推斷結(jié)論是一致的,但也有出現(xiàn)矛盾的時候,具體是按單側(cè)還是雙側(cè)則應(yīng)根據(jù)題干要求進(jìn)行選擇,如果分析兩個處理哪個高哪個低,則選擇單側(cè)檢驗(yàn);如果分析兩個處理是否相同或不同,則選擇雙側(cè)檢驗(yàn)。
SPSS的輸出結(jié)果更為完整,雖然沒有列出臨界值,臨界值的應(yīng)用是由于過去沒有計(jì)算機(jī),直接計(jì)算概率困難,借用臨界值作為標(biāo)準(zhǔn);現(xiàn)在計(jì)算簡單方便,計(jì)算得到統(tǒng)計(jì)量后,其概率可以直接得出,所以直接利用統(tǒng)計(jì)量的概率即可進(jìn)行推斷。另外,SPSS給出了表面效應(yīng)、實(shí)驗(yàn)誤差的大小,以及本質(zhì)效應(yīng)的估計(jì)值,也可以由本質(zhì)效應(yīng)進(jìn)行推斷。醫(yī)用生物統(tǒng)計(jì)課程性質(zhì)的特殊性決定了學(xué)習(xí)方式的靈活多樣性,生物統(tǒng)計(jì)學(xué)的生命在于應(yīng)用,統(tǒng)計(jì)的價值和魅力只有在解決實(shí)際問題的應(yīng)用中才能得以體現(xiàn)[7-8]。學(xué)生在上機(jī)實(shí)驗(yàn)時結(jié)合SPSS和Excel程序運(yùn)行統(tǒng)計(jì)分析、習(xí)題課等多種學(xué)習(xí)方式[9]可以有效提高其學(xué)習(xí)興趣,并能強(qiáng)化學(xué)習(xí)效果。