李湘鳴+王勁松
[摘 要]醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)離不開概率的計算。而在傳統(tǒng)的醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)中,概率是通過查相應(yīng)的密度函數(shù)分布表(如t值、u值(或Z值)、F值及χ2值表等)獲得的,無法滿足醫(yī)學(xué)科學(xué)發(fā)展的需求。隨著人民生活水平的提高、計算機和有關(guān)應(yīng)用軟件的普及,大學(xué)醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)應(yīng)與時俱進,可用計算機的密度函數(shù)取代現(xiàn)行的密度函數(shù)分布表。
[關(guān)鍵詞]計算機密度函數(shù);界值表;醫(yī)學(xué)統(tǒng)計學(xué)
[中圖分類號] G642 [文獻標(biāo)識碼] A [文章編號] 2095-3437(2016)04-0091-02在醫(yī)學(xué)研究中,人們要對醫(yī)學(xué)數(shù)據(jù)進行整理、分析、判斷,最后得出結(jié)論,而這一切都離不開醫(yī)學(xué)統(tǒng)計學(xué),所以醫(yī)學(xué)統(tǒng)計學(xué)是一門應(yīng)用性很強的學(xué)科。由于課程原理主要涉及高等數(shù)學(xué)的概率分布,且概念抽象、具有邏輯推理性,特別涉及密度函數(shù)的分布時,所計算出來的統(tǒng)計量,如t值、u值(或Z值)、F值及χ2值等,需通過查相應(yīng)的密度函數(shù)分布表(多數(shù)醫(yī)學(xué)統(tǒng)計學(xué)書稱之為界值表),獲得相應(yīng)的P值(即概率),然后進行判斷。由于密度函數(shù)分布表的有限性,它所得到的P值多數(shù)為一范圍值,如0.1>P>0.05或0.01
一、取消界值表的現(xiàn)實性與可行性
在60~70年代,學(xué)生上數(shù)學(xué)課或做課外數(shù)學(xué)作業(yè)時,經(jīng)常會用到平方表、算術(shù)平方根表、三角函數(shù)表、反三角函數(shù)表、對數(shù)表、反對數(shù)表以及隨機數(shù)字表等。隨著科學(xué)技術(shù)的發(fā)展、計算機的普及,這些表陸續(xù)退出了歷史的舞臺。
同樣,隨著我國人民生活水平的提高,筆記本電腦在大學(xué)生中已經(jīng)普及,在我校,平均一個大學(xué)生(包括貧困生)有一臺筆記本電腦。由此可以推斷:筆記本電腦如同手機一樣,已成為大學(xué)生的必備。同時,相應(yīng)的計算機軟件,如Office、WPS等辦公軟件,已經(jīng)得到普遍的應(yīng)用。這為醫(yī)學(xué)統(tǒng)計學(xué)取消有關(guān)界值表創(chuàng)造了良好的條件,也為理論教學(xué)與實踐(練習(xí))的結(jié)合打下了良好的基礎(chǔ),消除了以往的教學(xué)與實踐相脫節(jié)的弊端。
二、界值表與計算機函數(shù)
(一)標(biāo)準正態(tài)分布面積表與標(biāo)準正態(tài)分布函數(shù)
標(biāo)準正態(tài)曲線呈對稱分布,多數(shù)醫(yī)學(xué)統(tǒng)計學(xué)教材在設(shè)計面積分布表時,均給出1 / 2的概率分布,另一半則需要根據(jù)對稱性的原理進行推算。而且由于表的有限性,所給出的面積和u(或Z)的界值也十分有限。
眾所周知,標(biāo)準正態(tài)曲線下面積是從-∞向+∞積分所得,面積為1。在EXCEL或WPS表格的統(tǒng)計函數(shù)(Statistical)中,提供了NORMSDIST,格式為NORMSDIST(z)。參數(shù)Z為從-∞積分到當(dāng)前Z(或u)值的面積或概率。例如,公式“=NORMSDIST(-1.23)”的計算結(jié)果為0.109348552,即從-∞到-1.23的曲線下面積(或概率)為0.109348552。同時,NORMSDIST函數(shù)具有返回標(biāo)準正態(tài)累積分布函數(shù)(反函數(shù)),格式為NORMSINV(probability),返回從-∞到任意曲線下累積面積的u(或Z)的界值。例如,公式“=NORMSINV(0.109348552)”返回-1.23。
(二)t值表與t分布函數(shù)
t分布曲線形態(tài)是與自由度(Degree of freedom)大小有關(guān)的對稱分布曲線,與標(biāo)準正態(tài)分布曲線相比,曲線下面積仍為1,但是,自由度愈大,t分布曲線愈接近標(biāo)準正態(tài)分布。多數(shù)醫(yī)學(xué)統(tǒng)計學(xué)的t值表(或t界值表)分別有限地給出了在一定的自由度下,t分布曲線下雙尾側(cè)或單尾側(cè)的概率,實際上是任意一側(cè)的積分面積,或者兩側(cè)的積分面積之和。
在EXCEL或WPS表格的統(tǒng)計函數(shù)中,有TDIST函數(shù),返回t分布雙側(cè)或單側(cè)的概率,格式為TDIST(x,degrees_freedom,tails)。X為計算的t值;Degrees_freedom為自由度;Tails指明返回的分布函數(shù)是雙側(cè)或單側(cè)分布的概率。如果tails=2,函數(shù)TDIST返回雙側(cè)概率;如果tails=1,函數(shù)TDIST返回單側(cè)分布概率。使用此函數(shù)可以代替t分布的臨界值表。例如,t=2.343,degrees_freedom=10,公式“=TDIST(2.343,10,2)”返回0.041128661,即從-∞到-2.343與+∞到+2.343的兩側(cè)概率之和;如果Tails=1,自動返回左側(cè)或右側(cè)曲線下面積或概率(如為0.020564331,即0.041128661/2)。由此可見,t值必須為絕對值。同樣,TDIST函數(shù)具有TINV反函數(shù),TINV函數(shù)可返回某一概率和自由度t分布曲線下的t值,格式為TINV(probability,degrees_freedom)。參數(shù)Probability為對應(yīng)于雙側(cè)t分布的概率,Degrees_freedom為分布的自由度。例如,公式“=TINV(0.041128661,10)”返回2.343,即當(dāng)前曲線下,兩側(cè)的t值分別為-2.343和+2.343。
(三)F值表與F分布函數(shù)
F值表來自F分布,由于與兩個數(shù)據(jù)集的自由度變化有關(guān)以及表的有限性,僅有右側(cè)的0.05和0.01兩個概率值,無法滿足醫(yī)學(xué)科研的實際需要。而在EXCEL或WPS表格的FDIST函數(shù)中,可提供兩個數(shù)據(jù)集任意自由度變化的右側(cè)任何概率積分,格式為FDIST(x,deg_freedom1,deg_freedom2)。X為所計算的F值;Deg_freedom1為分子自由度;Deg_freedom2為分母自由度。例如,經(jīng)方差分析、計算,得F=5.343,分子自由度(組間)=3,分母自由度(組內(nèi))=28,公式“=FDIST(5.343,3,28)”返回0.004883957,即在F分布曲線下,從+∞到5.343右側(cè)的面積(概率)為0.004883957。同樣,F(xiàn)DIST有FINV反函數(shù)。FINV函數(shù)返回F分布右側(cè)概率的F界值,格式為FINV(probability,deg_freedom1,deg_freedom2)。Probability為F分布右側(cè)的概率,即P值;Deg_freedom1為分子自由度;Deg_freedom2為分母自由度。例如,已知F分布曲線下右側(cè)的概率(P)=0.005,分子自由度(組間)=3,分母自由度(組內(nèi))=28,那么其相應(yīng)的F界值是多少?可用公式“=FINV(0.005,3,28)”,返回5.317,即當(dāng)前的F分布曲線下,當(dāng)P=0.005時,其F界值為5.317。
(四)χ2值表與χ2分布函數(shù)
卡方(χ2)值表同t值表類似,與自由度有關(guān),所給出的概率和χ2值也是有限的。而EXCEL或WPS表格的CHIDIST函數(shù)可取代χ2值表,格式為CHIDIST(x,degrees_freedom),可返回χ2分布曲線下右側(cè)的概率。X為計算的χ2數(shù)值;Degrees_freedom為自由度。例如,經(jīng)卡方分析、計算,得χ2=8.643,自由度=3,公式“=CHIDIST (8.643,3)”返回0.034434,即在當(dāng)前的χ2分布曲線下,從+∞到8.643右側(cè)的面積(概率)為0.034434。同樣,CHIINV為CHIDIST的反函數(shù),計算χ2分布曲線下右側(cè)概率的反函數(shù)值,即χ2界值,格式為CHIINV(probability,degrees_freedom)。例如,已知當(dāng)前的χ2分布曲線下右側(cè)P=0.005,自由度=3,求其相應(yīng)的χ2界值。可用公式“=CHIINV (0.005,3)”返回12.838,即在當(dāng)前的χ2分布曲線下,當(dāng)右側(cè)面積(概率)為0.005時,其相應(yīng)的χ2界值為12.838。
至于在直線相關(guān)分析、秩和檢驗中所用到r界值表和T界值表,實際上來自t分布、χ2或u(Z)分布,可用其相應(yīng)的計算機函數(shù)代替。而在方差分析中,所用到的Q界值表等,在我國比較普及的SPSS或SAS等統(tǒng)計軟件提供了相應(yīng)的分布概率值。特別是SPSS軟件,因其為菜單式界面和對話框的特點,教師易于操作,只需點擊鼠標(biāo)就可完成,比較適合于在課堂教學(xué)中運用,也可為學(xué)生今后的學(xué)術(shù)發(fā)展打下一定的基礎(chǔ)。該軟件是在醫(yī)學(xué)界非專業(yè)人員應(yīng)用最多的統(tǒng)計分析軟件,也是國際醫(yī)學(xué)期刊引用最多的統(tǒng)計軟件。[4]
三、意義
(一)統(tǒng)計界值表的取消可促進教學(xué)效率的提高
在傳統(tǒng)的醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)中,教師多側(cè)重于某一章節(jié)理論知識的講授,然后安排學(xué)生到計算機房進行相應(yīng)的統(tǒng)計實習(xí)。由于實習(xí)課與理論課有一定的時間間隔,多數(shù)學(xué)生遺忘了理論知識,故容易出現(xiàn)理論與實際相脫節(jié)的現(xiàn)象。
在醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)中,取消有關(guān)統(tǒng)計界值表的教學(xué)內(nèi)容可促使教師將教學(xué)與計算機結(jié)合起來,將統(tǒng)計學(xué)理論與實踐結(jié)合起來,加深學(xué)生對統(tǒng)計學(xué)理論的理解,提高學(xué)生綜合運用理論和方法的能力。
例如,對于標(biāo)準正態(tài)分布,為何其標(biāo)準差為1,均數(shù)為0?以往的教學(xué)中,教師往往通過數(shù)學(xué)證明,或者讓學(xué)生死記,學(xué)生只知其然,不知其所以然。但是,如果教師課前將大樣本資料通過QQ群傳給學(xué)生,上課首先簡單地講解一下數(shù)學(xué)公式證明,然后讓學(xué)生用計算機求出樣本資料均數(shù)和標(biāo)準差,再通過均數(shù)和標(biāo)準差求出各觀察值u(Z),用計算機繪u(Z)直方分布圖,并求其均數(shù)和標(biāo)準差。不難發(fā)現(xiàn)u(Z)呈正態(tài)分布,其均數(shù)和標(biāo)準差為0。
(二)統(tǒng)計界值表的取消可提高學(xué)生的學(xué)習(xí)能力和教師的教學(xué)水平
將計算機直接引入課堂后,可以讓學(xué)生通過自身的電腦產(chǎn)生一個合理的隨機數(shù),并與課堂作業(yè)練習(xí)相結(jié)合。這樣將復(fù)雜統(tǒng)計資料的處理、運算與具體的實踐相融合,可大大激發(fā)學(xué)生的學(xué)習(xí)興趣,提高學(xué)生綜合分析、解決問題的能力,避免作業(yè)互相抄襲的現(xiàn)象。
統(tǒng)計界值表的取消必然要求學(xué)生“帶電腦進課堂”。由于學(xué)生所帶電腦的“檔次”不同,會出現(xiàn)不同版本的操作系統(tǒng)和應(yīng)用軟件。這迫使教師要在課前熟悉不同版本的操作系統(tǒng)和應(yīng)用軟件。課中主導(dǎo)與從屬地位的相互轉(zhuǎn)換,促進了教師與學(xué)生的互動,既可獲得良好的教學(xué)效果,又可極大地提高教師的教學(xué)水平。
[ 參 考 文 獻 ]
[1] 陳啟光,陳炳為.醫(yī)學(xué)統(tǒng)計學(xué)(第三版)[M].南京:東南大學(xué)出版社,2013:222-236.
[2] 高祖新.醫(yī)藥數(shù)理統(tǒng)計學(xué)方法(第五版)[M].北京:人民衛(wèi)生出版社,2013:268.
[3] 方積乾,徐勇勇.衛(wèi)生統(tǒng)計學(xué)(第七版)[M].北京:人民衛(wèi)生出版社,2012:458.
[4] 李英.淺談統(tǒng)計學(xué)基礎(chǔ)的教學(xué)改革[J].高校講壇,2011(2):265-266.
[責(zé)任編輯:鐘偉芳]