• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      如何正確運(yùn)用χ2檢驗(yàn)——橫斷面設(shè)計(jì)四格表資料的χ2檢驗(yàn)

      2021-03-24 03:48:46胡純嚴(yán)胡良平
      四川精神衛(wèi)生 2021年1期
      關(guān)鍵詞:四格橫斷面頻數(shù)

      胡純嚴(yán) ,胡良平 ,2*

      (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

      在生物醫(yī)藥學(xué)和流行病學(xué)研究中,基于橫斷面設(shè)計(jì)收集的四格表資料是常見的[1-2]。根據(jù)資料所滿足的前提條件不同,處理四格表資料的統(tǒng)計(jì)分析方法有多種,即“Pearson'sχ2檢驗(yàn)及其精確檢驗(yàn)”“校正的 Pearson'sχ2檢驗(yàn)”“似然比χ2檢驗(yàn)及其精確檢驗(yàn)”和“Fisher's精確檢驗(yàn)”[3],因篇幅所限,本文介紹“Pearson'sχ2檢驗(yàn)”“校正的 Pearson'sχ2檢驗(yàn)”“似然比χ2檢驗(yàn)”3種統(tǒng)計(jì)分析方法。

      1 橫斷面設(shè)計(jì)四格表資料的實(shí)例與模式

      1.1 實(shí)例

      【例1】在文獻(xiàn)[1]中,根據(jù)MINI 5.0中文版自殺模塊判斷未治療抑郁障礙患者有無自殺風(fēng)險(xiǎn),共6個(gè)條目,評(píng)分范圍0~33分。評(píng)分<6分為無自殺風(fēng)險(xiǎn),評(píng)分≥6分為有自殺風(fēng)險(xiǎn)。再將兩組受試者分別按“性別”“婚姻狀況”“有無精神障礙家族史”和“是否伴有精神病性癥狀”進(jìn)行劃分,可得4個(gè)“橫斷面設(shè)計(jì)四格表資料”,現(xiàn)將其中一個(gè)列在表1中。問:未治療抑郁障礙患者“有無自殺風(fēng)險(xiǎn)”與“婚姻狀況”之間是否存在關(guān)聯(lián)性?

      表1 未治療抑郁障礙患者“有無自殺風(fēng)險(xiǎn)”與“婚姻狀況”之間關(guān)系的調(diào)查結(jié)果

      【統(tǒng)計(jì)分析方法的選擇】?jī)蓚€(gè)屬性變量(本例為“有無自殺風(fēng)險(xiǎn)”與“婚姻狀況”)之間是否存在關(guān)聯(lián)性,可選用 Pearson'sχ2檢驗(yàn)、似然比χ2檢驗(yàn)等方法。由于統(tǒng)計(jì)學(xué)家依據(jù)不同的原理和條件推導(dǎo)出了不同的χ2檢驗(yàn)統(tǒng)計(jì)量,但它們通常都有一個(gè)共同的“檢驗(yàn)假設(shè)”,即“兩變量之間互相獨(dú)立或無關(guān)聯(lián)性”;而且,所有的χ2檢驗(yàn)統(tǒng)計(jì)量都必須服從χ2分布。

      【例2】在文獻(xiàn)[2]中,為了研究“中山市流動(dòng)人口與戶籍人口自殺率和自殺方式特征”,研究考察了“戶籍狀況(分為‘戶籍組’與‘流動(dòng)組’)”與“性別”“民族”“受教育程序”“婚姻狀況”和“職業(yè)”5 個(gè)屬性變量之間的關(guān)系,可得5個(gè)列聯(lián)表。現(xiàn)將其中一個(gè)列在表2中。問:中山市2015年-2017年戶籍組和流動(dòng)組自殺案例“戶籍狀況”與“民族”之間是否存在關(guān)聯(lián)性?

      表2 中山市2015年-2017年戶籍組和流動(dòng)組自殺案例“戶籍狀況”與“民族”之間關(guān)系的調(diào)查結(jié)果

      【統(tǒng)計(jì)分析方法的選擇】回答兩個(gè)屬性變量(本例為“戶籍狀況”與“民族”)之間是否存在關(guān)聯(lián)性,可選用Pearson'sχ2檢驗(yàn)、似然比χ2檢驗(yàn)等方法。理由前面已述及,此處從略。

      1.2 模式

      為了便于采用簡(jiǎn)單且易于理解的形式呈現(xiàn)橫斷面設(shè)計(jì)四格表資料的計(jì)算公式,特將表達(dá)橫斷面設(shè)計(jì)四格表資料的列聯(lián)表抽象成下面的兩種模式,分別見表3和表4。

      表3 同時(shí)按屬性變量A與B對(duì)受試對(duì)象進(jìn)行分組計(jì)數(shù)的模式一

      表4 同時(shí)按屬性變量A與B對(duì)受試對(duì)象進(jìn)行分組計(jì)數(shù)的模式二

      2 橫斷面設(shè)計(jì)四格表資料獨(dú)立性或關(guān)聯(lián)性分析的原理與計(jì)算公式

      2.1 獨(dú)立性與關(guān)聯(lián)性

      對(duì)于橫斷面設(shè)計(jì)四格表資料而言,通常假定兩個(gè)屬性變量之間的地位是平等的且并存的。也就是說,不認(rèn)為其中一個(gè)是原因變量、另一個(gè)是結(jié)果變量;也不認(rèn)為其中一個(gè)先出現(xiàn)、另一個(gè)后出現(xiàn)。研究者關(guān)心的是兩個(gè)屬性變量之間是否存在“關(guān)聯(lián)性”,而與其對(duì)立的是“獨(dú)立性”。在“兩屬性變量之間具有獨(dú)立性”的假設(shè)成立的條件下,當(dāng)基于實(shí)際數(shù)據(jù)和統(tǒng)計(jì)學(xué)原理計(jì)算的結(jié)果認(rèn)為應(yīng)拒絕此假設(shè),則認(rèn)為“兩屬性變量之間具有關(guān)聯(lián)性”。于是,其檢驗(yàn)假設(shè)可表述如下:

      H0:兩屬性變量之間相互獨(dú)立;H1:兩屬性變量之間不獨(dú)立或有關(guān)聯(lián)性。

      2.2 基于獨(dú)立性假設(shè)推導(dǎo)出計(jì)算理論頻數(shù)的公式

      基于表3中設(shè)定的符號(hào),假定“屬性變量A”與“屬性變量B”之間互相獨(dú)立,則依據(jù)概率論中計(jì)算條件概率的公式可推算出與4個(gè)觀察頻數(shù)“ɑ、b、c、d”對(duì) 應(yīng) 的 理 論 頻 數(shù)如下[4-5]:

      2.3 基于獨(dú)立性假設(shè)的Pearson's χ2檢驗(yàn)統(tǒng)計(jì)量

      K.Pearson于十九世紀(jì)末提出用檢驗(yàn)統(tǒng)計(jì)量來測(cè)量二維列聯(lián)表的各網(wǎng)格中觀測(cè)頻數(shù)(O)與理論頻數(shù)(T)之間的“差異程度”或“吻合度”[6]。如下式:

      在式(5)中,Oij、Tij分別為第(i,j)網(wǎng)格中的“觀測(cè)頻數(shù)”與“理論頻數(shù)”,R、C分別代表二維列聯(lián)表的“行數(shù)”與“列數(shù)”,K.Pearson證明了式(5)定義的近似地服從自由度為df=(R-1)(C-1)的χ2分布。

      將表3中設(shè)定的符號(hào)和式(1)~式(4)代入式(5),可得到分析橫斷面設(shè)計(jì)四格表資料的專用公式,見式(6)。

      由式(6)定義的漸近地服從自由度為1的χ2分布。

      【前提條件】當(dāng)四格表資料中n>40且沒有T(理論頻數(shù))<5時(shí),可以選用“Pearson'sχ2檢驗(yàn)”。

      2.4 基于獨(dú)立性假設(shè)的校正Pearson's χ2檢驗(yàn)統(tǒng)計(jì)量

      在四格表資料中,只要有一個(gè)網(wǎng)格上的理論頻數(shù)<5,若直接采用式(6)進(jìn)行計(jì)算,其結(jié)果都會(huì)明顯偏離χ2分布,故需要采用下式進(jìn)行校正。

      由式(7)定義的漸近地服從自由度為1的χ2分布。

      【前提條件】當(dāng)四格表資料中n>40,但有1<T(理論頻數(shù))<5時(shí),可以選用“校正Pearson'sχ2檢驗(yàn)”。

      2.5 基于獨(dú)立性假設(shè)的對(duì)數(shù)似然比χ2檢驗(yàn)統(tǒng)計(jì)量

      2.5.1 似然比統(tǒng)計(jì)量

      情形1:依據(jù)觀測(cè)的結(jié)果,得似然函數(shù)近似表達(dá)式:

      情形2:依據(jù)假設(shè)的結(jié)果,得似然函數(shù)近似表達(dá)式:

      上面兩式中的“∝”符號(hào)代表“呈正比”(例如,A與B呈正比,可表示為A∝B)。

      用式(8)除以式(9),得到似然比統(tǒng)計(jì)量如下:

      2.5.2 對(duì)數(shù)似然比χ2檢驗(yàn)統(tǒng)計(jì)量

      在文獻(xiàn)[3,7]中,介紹了另一種檢驗(yàn)兩屬性變量關(guān)聯(lián)性或獨(dú)立性的方法,叫做“似然比χ2檢驗(yàn)”。但實(shí)際上,其檢驗(yàn)統(tǒng)計(jì)量是對(duì)所構(gòu)造的“似然比統(tǒng)計(jì)量[見式(10)]”取對(duì)數(shù)后乘以2的結(jié)果。因此,其真實(shí)的名稱應(yīng)該叫做“對(duì)數(shù)似然比χ2檢驗(yàn)統(tǒng)計(jì)量”。于是,對(duì)式(10)取自然對(duì)數(shù)后乘以2,可得下式:

      在式(11)中,由所定義的檢驗(yàn)統(tǒng)計(jì)量漸近地服從自由度為1的χ2分布。其中,nij、Tij分別代表四格表中第(i,j)網(wǎng)格上的觀察頻數(shù)與理論頻數(shù),i,j=1,2。

      【前提條件】當(dāng)四格表資料中,無論是觀察頻數(shù)還是理論頻數(shù)中都沒有出現(xiàn)“零”時(shí),可以選用“對(duì)數(shù)似然比χ2檢驗(yàn)”。

      3 橫斷面設(shè)計(jì)四格表資料關(guān)聯(lián)性或獨(dú)立性分析的軟件實(shí)現(xiàn)

      3.1 基于SAS實(shí)現(xiàn)關(guān)聯(lián)性或獨(dú)立性分析

      沿用例1中的“問題與數(shù)據(jù)”,試進(jìn)行關(guān)聯(lián)性或獨(dú)立性分析。設(shè)所需要的SAS程序如下[3]:

      第1行與第3行分別為“Pearson'sχ2檢驗(yàn)”與“校正 Pearson'sχ2檢驗(yàn)”的結(jié)果,第 2行為“似然比χ2檢驗(yàn)(嚴(yán)格地說,為對(duì)數(shù)似然比χ2檢驗(yàn))”的結(jié)果。3種檢驗(yàn)方法所得的P值都小于0.01,都拒絕“H0:有無自殺風(fēng)險(xiǎn)與婚姻狀況之間互相獨(dú)立”,接受“H1:有無自殺風(fēng)險(xiǎn)與婚姻狀況之間存在關(guān)聯(lián)性”。

      【結(jié)論】因?yàn)椤坝凶詺L(fēng)險(xiǎn)”的“已婚比例為(13/52)×100%=25.00%”,而“無自殺風(fēng)險(xiǎn)”的“已婚比例為(33/65)×100%=50.77%”,這提示“有自殺風(fēng)險(xiǎn)”的未治療抑郁障礙患者的結(jié)婚比例明顯低于“無自殺風(fēng)險(xiǎn)”的未治療抑郁障礙患者的結(jié)婚比例。

      3.2 基于R實(shí)現(xiàn)關(guān)聯(lián)性或獨(dú)立性分析

      設(shè)所需要的R程序如下[8-9]:

      【程序說明】“>”代表R軟件運(yùn)行環(huán)境中的“提示符”,上文的R程序中共有4個(gè)提示符,說明共有4個(gè)R語句;第一句組織第一個(gè)“行向量”,代表四格表資料的第1行數(shù)據(jù);第二句組織第二個(gè)“行向量”,代表四格表資料的第2行數(shù)據(jù);第三句和第四句都是調(diào)用函數(shù)“chisq.test()”進(jìn)行χ2檢驗(yàn),其區(qū)別在于:選項(xiàng)“correct=FALSE”代表不進(jìn)行“校正”,而該選項(xiàng)的默認(rèn)值為“校正”,等價(jià)于寫“correct=TRUE”;而選項(xiàng)“rbind()”是將兩個(gè)行向量合并在一起,即構(gòu)成兩行兩列的四格表數(shù)據(jù)。

      【R主要輸出結(jié)果及解釋】

      以上為進(jìn)行了連續(xù)性校正的χ2檢驗(yàn)結(jié)果。

      以上R輸出結(jié)果與SAS輸出的結(jié)果是相同的(見上文SAS輸出結(jié)果中的第1行與第3行)。

      【結(jié)論】參見前文SAS輸出結(jié)果及結(jié)論,此處從略。

      4 討論與小結(jié)

      4.1 討論

      4.1.1 橫斷面設(shè)計(jì)的概念

      所謂橫斷面設(shè)計(jì),就是依據(jù)研究目的確定了一個(gè)研究的總體,在一個(gè)時(shí)點(diǎn)或時(shí)段上,研究者對(duì)該總體中的全部個(gè)體(屬于全面調(diào)查或普查)或按某種規(guī)則隨機(jī)抽取的部分個(gè)體進(jìn)行調(diào)查或測(cè)量。這種做法就被稱為“橫斷面研究設(shè)計(jì)”,簡(jiǎn)稱為“橫斷面設(shè)計(jì)”。

      4.1.2 橫斷面設(shè)計(jì)四格表資料的特點(diǎn)

      在表1和表2資料中,都有兩個(gè)“屬性變量”,通常,研究者同時(shí)按兩個(gè)屬性變量的水平對(duì)受試對(duì)象進(jìn)行分組計(jì)數(shù),而且,兩個(gè)屬性變量都是從受試對(duì)象身上“提取”出來的,換句話說,屬性變量是受試對(duì)象“自帶的”屬性(例如性別、民族);在多數(shù)場(chǎng)合下,兩個(gè)屬性變量之間不存在明顯的“原因變量”與“結(jié)果變量”之分,也就是說,它們之間更常見的是“相互關(guān)系”,而不是“因果關(guān)系”。

      若一個(gè)變量為“藥物種類(藥物A與藥物B)(研究者施加給受試對(duì)象的因素)”,另一個(gè)變量為“治療效果(‘有效’與‘無效’)”,此時(shí),前者可視為“原因變量”,后者可視為“結(jié)果變量”。一般來說,從患者“服藥”到出現(xiàn)“療效”的時(shí)間間隔不長(zhǎng)時(shí),可視為一個(gè)“時(shí)點(diǎn)或時(shí)段”,這樣的四格表資料仍可被稱為“橫斷面設(shè)計(jì)四格表資料”。然而,當(dāng)前述所指的“時(shí)間間隔”很長(zhǎng)時(shí),就不適合叫做“橫斷面設(shè)計(jì)四格表資料”了。

      值得注意的是,基于“藥物種類”與“治療效果”而形成的四格表資料與流行病學(xué)上常見的“隊(duì)列設(shè)計(jì)四格表資料(例如調(diào)查‘是否吸煙’與‘是否患肺癌’之間關(guān)系所得的資料)”是十分相似的。二者的區(qū)別在于以下兩點(diǎn):其一,原因變量的來源不同。“藥物種類”是研究者施加給受試對(duì)象的影響因素,而“吸煙與否”是受試對(duì)象自身的行為習(xí)慣;其二,獲得結(jié)果變量取值的時(shí)間長(zhǎng)度不同,通常,“服藥”與“療效”之間時(shí)間間隔不會(huì)很長(zhǎng);而“吸煙與否”與“患肺癌與否”之間時(shí)間間隔通常會(huì)比較長(zhǎng)。

      4.1.3 橫斷面設(shè)計(jì)四格表資料統(tǒng)計(jì)分析方法的合理選擇

      在檢驗(yàn)橫斷面設(shè)計(jì)四格表資料兩屬性變量之間“獨(dú)立性假設(shè)”的方法中,除了本文介紹的3種方法(運(yùn)用時(shí),請(qǐng)檢查前提條件是否滿足)之外,還有Fisher's精確檢驗(yàn)、Pearson'sχ2檢驗(yàn)的精確算法、似然比χ2檢驗(yàn)的精確算法[3],因篇幅所限,此處從略。

      在運(yùn)用SAS/STAT的FREQ過程時(shí),若使用“exact chisq/mc;”語句,輸出結(jié)果中會(huì)呈現(xiàn)4種精確檢驗(yàn)的結(jié)果[3],其中,除了前面提及的3種精確檢驗(yàn)結(jié)果之外,還給出了“Mantel-Haenszel'sχ2檢驗(yàn)及其精確檢驗(yàn)結(jié)果”。然而,這種檢驗(yàn)方法適用于“隊(duì)列設(shè)計(jì)”或“病例對(duì)照設(shè)計(jì)”四格表資料,其對(duì)應(yīng)的檢驗(yàn)假設(shè)為:“H0:RR=1,H1:RR≠ 1”(RR為相對(duì)危險(xiǎn)度)或“H0:OR=1,H1:OR≠ 1”(OR為優(yōu)勢(shì)比)[10],因這些內(nèi)容與本文的目的不吻合,故未做介紹。

      4.2 小結(jié)

      本文呈現(xiàn)了橫斷面設(shè)計(jì)四格表資料的實(shí)例和模式,詳細(xì)給出了3種檢驗(yàn)橫斷面設(shè)計(jì)四格表資料“關(guān)聯(lián)性或獨(dú)立性”假設(shè)的檢驗(yàn)方法的原理和計(jì)算公式;基于SAS和R軟件實(shí)現(xiàn)了對(duì)橫斷面設(shè)計(jì)四格表資料的3種假設(shè)檢驗(yàn),對(duì)軟件輸出的結(jié)果做出了解釋,并給出了統(tǒng)計(jì)和專業(yè)結(jié)論。

      猜你喜歡
      四格橫斷面頻數(shù)
      油爆四格
      城市道路橫斷面設(shè)計(jì)研究
      爆笑四格
      爆笑四格
      爆笑四格
      中考頻數(shù)分布直方圖題型展示
      廣州市健康體檢人群種植修復(fù)情況的橫斷面研究
      學(xué)習(xí)制作頻數(shù)分布直方圖三部曲
      2014年某院醫(yī)院感染橫斷面調(diào)查
      頻數(shù)和頻率
      金坛市| 新密市| 滦南县| 玛曲县| 英超| 镇沅| 崇信县| 凌源市| 彭山县| 驻马店市| 绵阳市| 河曲县| 大英县| 安顺市| 略阳县| 奈曼旗| 淮阳县| 吕梁市| 通城县| 富裕县| 临武县| 莱州市| 宝山区| 卢龙县| 天等县| 赣榆县| 罗定市| 威宁| 邵东县| 织金县| 塘沽区| 厦门市| 高碑店市| 五莲县| 太康县| 青铜峡市| 郴州市| 恩施市| 沂南县| 墨脱县| 昌平区|