• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      如何正確運用χ2檢驗——χ2分布及相關內(nèi)容

      2021-03-24 03:48:44胡純嚴胡良平
      四川精神衛(wèi)生 2021年1期
      關鍵詞:連續(xù)型概率分布位數(shù)

      胡純嚴 ,胡良平 ,2*

      (1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

      在臨床資料中,定性資料(特指結果變量及其取值)[1-6]出現(xiàn)的頻率高。分析定性資料的統(tǒng)計分析方法主要有“差異性分析(通常適用于原因變量的個數(shù)≤2)[1-3]”和“l(fā)ogistic回歸分析(通常被用于原因變量的個數(shù)>2)[4-6]”兩大類。在前述提及的兩類統(tǒng)計分析方法中,“χ2檢驗”都是不可或缺的。

      在經(jīng)典統(tǒng)計學和貝葉斯統(tǒng)計學中,“概率分布”是統(tǒng)計分析的重要基礎[7-11],若離開了它,假設檢驗、區(qū)間估計、回歸分析、判別分析和多元分析幾乎無法進行。由數(shù)理統(tǒng)計知識可知,一旦掌握了某個隨機變量的概率分布,就等于掌握了其變化規(guī)律。概率分布的種類很多,通??梢苑譃閮纱箢?,即“離散型隨機變量的概率分布”和“連續(xù)型隨機變量的概率分布”。本文介紹的χ2分布是在統(tǒng)計分析中被廣泛使用的一個連續(xù)型隨機變量的概率分布,它具有兩種表現(xiàn)形式,即“χ2分布”和“非中心χ2分布”[10-11]。本文對χ2檢驗的基礎知識,即“χ2分布及相關內(nèi)容”進行介紹。

      1 χ2分布

      1.1 χ2分布的歷史

      χ2分布是從正態(tài)分布派生出來的一個連續(xù)型概率分布。盡管如此,由于許多分布可以用χ2分布來近似,甚至在多元統(tǒng)計分析中也常用到它,故χ2分布在數(shù)理統(tǒng)計中一直占有重要地位[11]。

      χ2分布分別由 I.J.Bienayme(1858)、F.R.Helmert(1876)和K.Pearson(1900)發(fā)現(xiàn),開始主要用于列聯(lián)表資料的“獨立性”分析和“評價回歸模型對資料擬合效果好壞”的擬合優(yōu)度檢驗[12];在定性資料回歸模型的構建過程中,χ2分布常用于篩選自變量[13];在廣義線性回歸模型和混合效應回歸模型的構建中,χ2分布常用于兩個回歸模型對同一個資料擬合效果的比較[13]。

      1.1.1χ2分布的定義

      設隨機變量Y1,Y2,…,Yn獨立同分布,且Yi~N(0,1),則隨機變量的分布稱為具有n個自由度的χ2分布,并記為。見式(1):

      1.1.2χ2分布的概率密度函數(shù)及其圖形

      χ2分布概率密度函數(shù)的圖形見下圖:

      1.1.3χ2分布的性質

      1.1.3.1χ2分布的極限分布為正態(tài)分布

      由圖1可看出如下特點:①自由度n越大,曲線越趨于對稱;②當自由度n→∞時,χ2分布趨向于正態(tài)分布。

      圖1 具有幾種不同自由度的χ2分布概率密度函數(shù)的圖形

      1.1.3.2χ2分布的期望和方差

      式(4)的“E”代表“期望(通俗的表述為‘均值’)”;“Vɑr”代表“方差”。

      1.1.3.3χ2分布具有可加性

      1.2 非中心χ2分布

      1.2.1 非中心χ2分布的定義

      設隨機變量Y1,Y2,…,Yn相互獨立,且Yi~N(μi,1),則隨機變量的分布稱為具有n個自由度且非中心參數(shù)為的χ2分布,并記為見式(6):

      在上式中,當δ=0時,非中心χ2分布就退化成為前面定義的χ2分布χ2n。

      【說明】因篇幅所限,該分布的性質從略。

      2 χ2分布與正態(tài)分布之間的關系

      χ2分布是從正態(tài)分布派生出來的一個分布;χ2分布的極限分布為標準正態(tài)分布[7,11]。用數(shù)學語言表述如下:

      若Xn~,n=1,2,…,則當n→∞時,有下面的關系式成立:

      另一方面,由來自正態(tài)分布的均值與離均差平方和或方差可構造出服從χ2分布的隨機變量。事實上,若X1,X2,…,Xn(n≥2)是從總體N(μ,σ2)中抽出的樣本,令:

      3 χ2檢驗統(tǒng)計量與Z檢驗統(tǒng)計量之間的關系

      由本文式(1)定義的χ2分布可知,它是由n個互相獨立且都服從標準正態(tài)分布的隨機變量的平方之和構成的,故當其自由度為1時,χ2檢驗統(tǒng)計量的平方根就是Z檢驗統(tǒng)計量(說明:在SAS軟件和部分統(tǒng)計學教科書中,通常用Z表示服從標準正態(tài)分布的隨機變量或檢驗統(tǒng)計量)。

      4 χ2分布的計算

      4.1 χ2分布曲線下累計概率的計算

      在SAS軟件中,χ2分布的分布函數(shù)為:

      probchi(x,df,nc)

      該函數(shù)計算服從自由度為df,非中心參數(shù)為nc的χ2分布的隨機變量小于給定x的事件的概率。如果nc沒有規(guī)定或取為0,那么被計算的就是中心χ2分布曲線下累計概率。

      【例1】試計算自由度為5,中心χ2分布曲線下χ2值小于20的概率值。

      【分析與解答】所需要的SAS程序如下:

      以上結果表明,當χ2=20、自由度df=5、非中心參數(shù)nc=0的條件下,χ2分布曲線下且位于橫坐標軸上“0~20”區(qū)間內(nèi)的累計概率為0.99875。

      4.2 χ2分布曲線下橫坐標軸上P分位數(shù)的計算

      在SAS軟件中,χ2分布的分位數(shù)函數(shù)為:

      cinv(P,df,nc)(0≤P≤1,df>0,nc≥0)

      該函數(shù)計算自由度為df,非中心參數(shù)為nc的χ2分布的P分位數(shù)。取nc=0或不規(guī)定此項參數(shù)時,表明是中心χ2分布。

      【例2】試計算自由度為3,非中心參數(shù)為4.5的χ2分布的P=0.95的分位數(shù)。

      【分析與解答】所需要的SAS程序如下:

      以上結果表明,當累計概率P=0.95、自由度df=3、非中心參數(shù)nc=4.5的條件下,χ2分布曲線下橫坐標軸上的分位數(shù)x=16.8463(注意:這里的“x”是一個服從自由度df=3、非中心參數(shù)nc=4.5的χ2分布的隨機變量)。

      【例3】試基于SAS函數(shù)“cinv(P,df,nc)”產(chǎn)生χ2分布臨界值表。

      【分析與解答】在很多統(tǒng)計學教科書的附錄中,一般都會給出常用統(tǒng)計用表,其中,χ2分布臨界值表可以利用SAS函數(shù)“cinv(P,df,nc)”且令nc=0計算出來?,F(xiàn)給出所需要的SAS程序如下:

      【程序說明】“D O d=1 T O 4 0,5 0,6 0,7 0,8 0,9 0,100”語句表明,自由度df的取值為1、2、…、39、40、50、60、70、80、90、100,共46種取值,即產(chǎn)生的χ2分布臨界值表有 46 行;“alpha=0.995,0.990,0.975,0.950,0.900,0.750,0.500,0.250,0.100,0.050,0.025,0.010,0.005;p=1-alpha;”兩個語句表明,χ2分布曲線下右側尾端概率分別為0.995、0.990、…、0.005,共13種取值。也就是說,以上SAS程序共計算出46×13=498個χ2分布臨界值(本質上就是χ2分布曲線下橫坐標上的“分位數(shù)”的數(shù)值)。

      【說明】因輸出的數(shù)據(jù)較多,此處從略。

      5 討論與小結

      5.1 討論

      χ2分布是一種連續(xù)型隨機變量的概率分布,然而,它不同于其他連續(xù)型隨機變量的概率分布(如“正態(tài)分布”等)。因研究者應用統(tǒng)計學的過程中,諸如“正態(tài)分布”“t分布”和“F分布”的連續(xù)型概率分布常作為“Z檢驗”“t檢驗”和“方差分析(或稱F檢驗)”的理論依據(jù),直接應用于定量資料的差異性分析;而χ2分布作為“χ2檢驗”的理論依據(jù),一般只應用于定性資料的差異性分析(如各種列聯(lián)表資料的差異性分析)、不同統(tǒng)計模型對同一個統(tǒng)計資料擬合優(yōu)度的比較等場合。但也有例外,即χ2檢驗可應用于單因素多水平設計一元定量資料多個方差的齊性檢驗之中。χ2分布和χ2檢驗之所以可以應用于前述提及的各種場合,因為在那些場合下所構造出的“檢驗統(tǒng)計量”服從χ2分布。

      5.2 小結

      本文針對處理定性資料所需要的χ2檢驗,介紹了與其有關的理論基礎,即χ2分布和非中心χ2分布。重點展示了χ2分布的定義、概率密度函數(shù)的圖形和主要性質;基于SAS軟件中的兩個SAS函數(shù)呈現(xiàn)了χ2分布的計算方法(包括累計概率的計算和分位數(shù)的計算)和結果解釋。

      科研方法專題策劃人——胡良平教授簡介

      胡良平,男,1955年8月出生,教授,博士生導師,曾任軍事醫(yī)學科學院研究生部醫(yī)學統(tǒng)計學教研室主任和生物醫(yī)學統(tǒng)計學咨詢中心主任、國際一般系統(tǒng)論研究會中國分會概率統(tǒng)計系統(tǒng)專業(yè)理事會常務理事、中國生物醫(yī)學統(tǒng)計學會副會長、北京大學口腔醫(yī)學院客座教授和《中華醫(yī)學雜志》等10余種雜志編委;現(xiàn)任世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會會長、國家食品藥品監(jiān)督管理局評審專家和3種醫(yī)學雜志編委;主編統(tǒng)計學專著48部、參編統(tǒng)計學專著10部;發(fā)表第一作者和通信作者學術論文300余篇、發(fā)表合作論文130余篇;獲軍隊科技成果和省部級科技成果多項;參加并完成三項國家標準的撰寫工作、參加三項國家科技重大專項課題研究工作。在從事統(tǒng)計學工作的30年中,為幾千名研究生、醫(yī)學科研人員、臨床醫(yī)生和雜志編輯講授生物醫(yī)學統(tǒng)計學,在全國各地作統(tǒng)計學學術報告100余場,舉辦數(shù)十期全國統(tǒng)計學培訓班,培養(yǎng)20多名統(tǒng)計學專業(yè)碩士和博士研究生。近幾年來,參加國家級新藥和醫(yī)療器械項目評審數(shù)十項、參加100多項全軍重大重點課題的統(tǒng)計學檢查工作。歸納并提煉出有利于透過現(xiàn)象看本質的“八性”和“八思維”的統(tǒng)計學思想,獨創(chuàng)了逆向統(tǒng)計學教學法和三型理論。擅長于科研課題的研究設計、復雜科研資料的統(tǒng)計分析和SAS與R軟件實現(xiàn)、各種層次的統(tǒng)計學教學培訓和咨詢工作。

      猜你喜歡
      連續(xù)型概率分布位數(shù)
      自變量分段連續(xù)型Volterra積分微分方程的配置法
      五次完全冪的少位數(shù)三進制展開
      離散型概率分布的ORB圖像特征點誤匹配剔除算法
      連續(xù)型美式分期付款看跌期權
      關于概率分布函數(shù)定義的辨析
      科技視界(2016年19期)2017-05-18 10:18:46
      基于概率分布的PPP項目風險承擔支出測算
      基于晶圓優(yōu)先級的連續(xù)型Interbay搬運系統(tǒng)性能分析
      遙感衛(wèi)星CCD相機量化位數(shù)的選擇
      關于二維連續(xù)型隨機變量函數(shù)分布的推廣和運算
      “判斷整數(shù)的位數(shù)”的算法分析
      河南科技(2014年11期)2014-02-27 14:09:41
      大余县| 托克逊县| 会宁县| 闽清县| 安徽省| 苍山县| 宁强县| 华安县| 昭苏县| 旺苍县| 和硕县| 安陆市| 阿勒泰市| 库伦旗| 息烽县| 全州县| 怀宁县| 比如县| 阳泉市| 鄱阳县| 响水县| 福安市| 海兴县| 上虞市| 锡林郭勒盟| 肥东县| 铁岭市| 玉环县| 宾川县| 南宫市| 桂东县| 金华市| 眉山市| 霍邱县| 永仁县| 阿克陶县| 南宫市| 马鞍山市| 哈尔滨市| 迭部县| 阳春市|