利用SPSS軟件中M ixed model模塊處理致畸試驗中窩別效應(yīng)

2014-03-10 02:42:16鳳張晉昕唐小江

中國衛(wèi)生統(tǒng)計 2014年2期

周鳳張晉昕唐小江

周鳳1，2張晉昕1，△唐小江2

目的探討致畸試驗中由于窩別效應(yīng)存在時，如何利用SPSS軟件正確地進行統(tǒng)計處理。方法本文運用SPSS 20.0軟件分別采用傳統(tǒng)分析方法（忽略窩別效應(yīng)的t檢驗或χ2檢驗、窩平均法）與多水平模型處理致畸試驗中窩別效應(yīng)，其中包括定量變量及定性變量的統(tǒng)計分析，并比較其結(jié)果。結(jié)果傳統(tǒng)分析方法（t檢驗或χ2檢驗）未考慮窩別效應(yīng)的存在，會增加犯假陽性錯誤的概率；窩平均法可損失樣本的大量信息，會增加犯假陰性錯誤的概率；多水平模型考慮原始數(shù)據(jù)的內(nèi)在結(jié)構(gòu)，可有效處理具有層次結(jié)構(gòu)的數(shù)據(jù)。結(jié)論多水平模型可正確處理窩別效應(yīng)，且SPSS軟件中M ixed model過程操作簡單，易于掌握。

致畸試驗窩別效應(yīng) 多水平模型 SPSS

致畸試驗又稱胚體-胎體毒性試驗，是三段生殖毒性試驗中的第Ⅱ階段，它通過動物實驗評價母體自胚泡著床到硬腭閉合期間接觸受試物對妊娠雌體及胚胎-胎體發(fā)育的影響［1］。我國主管部門和有關(guān)管理機構(gòu)已把致畸試驗列為食品添加劑、保健食品、農(nóng)藥、新藥、化妝品以及首次進口化學(xué)品的安全性評價程序中不可或缺的項目［2］。

由于遺傳因素、宮內(nèi)發(fā)育環(huán)境、致畸物的代謝環(huán)境等的相似性，導(dǎo)致了同窩胎仔之間的非獨立性，即存在窩別效應(yīng)，統(tǒng)計分析中應(yīng)考慮這個效應(yīng)。研究者如果不能對仔體數(shù)據(jù)進行正確的統(tǒng)計分析，就可能導(dǎo)致得出有偏甚至錯誤的結(jié)論。衛(wèi)生部于2003年9月頒布GB 15193.14-2003《致畸試驗》［3］，但對數(shù)據(jù)處理的說明較為含糊，難以切實指導(dǎo)實驗者重視此問題。甘卉芳等［2］探討了常規(guī)致畸試驗及其結(jié)果判定的規(guī)范化問題，但并未提出如何進行規(guī)范的統(tǒng)計分析。王炳順等［4］采用了廣義估計方程處理致畸試驗窩效應(yīng)并采用SUDAAN軟件實現(xiàn)其分析過程，但多數(shù)醫(yī)學(xué)研究者并不了解SUDAAN軟件，導(dǎo)致其推廣受限。以“致畸試驗”作為主題詞，檢索關(guān)于“致畸試驗”的期刊論文，發(fā)現(xiàn)其中大部分的研究者或?qū)ζ浣y(tǒng)計分析方法含糊其辭，或采用“常規(guī)統(tǒng)計分析方法（方差分析或χ2檢驗）”來處理致畸試驗中的“非常規(guī)數(shù)據(jù)”（存在窩別效應(yīng)）。統(tǒng)計學(xué)方法的誤用勢必導(dǎo)致結(jié)果的可靠性降低。

目前可處理此類具有聚集性數(shù)據(jù)的方法有廣義估計方程（generalized estimation equations，GEE）、多水平模型（multi-level model）、混合效應(yīng)模型（mixed effectsmodel）等，可采用多種軟件完成統(tǒng)計分析過程，如SAS、R、MLw in、Stata等，不同的軟件在擬合模型時所用的模型估計方法和計算機算法有所差別，使得模型結(jié)果略有不同。本文探討采用多水平模型對致畸試驗仔體數(shù)據(jù)中窩別效應(yīng)進行統(tǒng)計處理，并介紹應(yīng)用廣泛且易于操作的SPSS 20.0軟件的實現(xiàn)過程，以期為正確處理致畸試驗數(shù)據(jù)提供參考。

問題背景

1.觀察指標

致畸試驗中，常用孕鼠作試驗對象，將其隨機分為兩組或多組，分別給予可疑致畸物及對照處理，待分娩后，觀察每個孕鼠及所產(chǎn)子代中發(fā)生畸形的情況。主要的觀察指標包括兩部分，一是對母體的觀察：體重變化、中毒癥狀、黃體數(shù)、著床數(shù)（率）、吸收胎數(shù)（率）、早死胎數(shù)（率）、晚死胎數(shù)（率）和活胎數(shù)（率）、胎盤重量等；二是對仔體的觀察：性別、體重、身長、外觀畸形、內(nèi)臟畸形、骨骼畸形和發(fā)育（骨化）情況等。

對于母體的觀察指標，由于各孕鼠間獨立，故采用常規(guī)的統(tǒng)計分析方法即可。而對于仔體的觀察指標，由于窩別效應(yīng)的存在，同一窩別的仔鼠的體重、發(fā)生畸形的概率趨于相同，而不同窩別仔鼠的體重、發(fā)生畸形的概率則趨于不同。這類資料的特點是存在層次結(jié)構(gòu)，即孕鼠-仔鼠。傳統(tǒng)的方差分析或χ2檢驗忽略了數(shù)據(jù)層次結(jié)構(gòu)的特征，可能導(dǎo)致錯誤的結(jié)論。多水平模型是處理這種具有聚集性資料的簡單且有效的統(tǒng)計分析方法［5］。胎仔體重是仔鼠發(fā)育的一個重要指標，而“是否畸形”是判斷受試物致畸性的主要指標。本文以上述兩個指標為例，分別介紹兩水平模型、兩水平logistic模型處理致畸試驗中具有窩別效應(yīng)的定量資料及定性資料。

2.兩水平模型原理

多水平模型是英國教育統(tǒng)計學(xué)家H.Goldstein于1986年提出，專門用于處理多層次或多水平結(jié)構(gòu)的資料［6］。致畸試驗的數(shù)據(jù)具有明顯的層次結(jié)構(gòu)，母鼠為2水平單位（level-2 unit），仔鼠為1水平單位（level-1 unit）。

（1）定量資料的兩水平模型

考慮一個簡單的2水平模型，結(jié)局變量為連續(xù)型隨機變量，且服從正態(tài)分布，只包含一個解釋變量，則

故上述2水平模型又可表示為yij＝β0＋β1x＋（u0j＋u1j＋εij），該模型由兩部分組成：固定部分和隨機部分。致畸試驗中解釋變量為組別（group），不考慮解釋變量的隨機效應(yīng)，故模型變?yōu)?/p>

（2）二分類定性資料的兩水平logistic模型

實際工作中結(jié)局變量為定性變量的情況不在少數(shù)，如是否發(fā)病、藥物是否有效、仔鼠是否有畸形等，此時，一般的線性模型不再適用。廣義線性模型（generalized linearmodel，GLM）被廣泛應(yīng)用于定性結(jié)局變量的數(shù)據(jù)處理，通過非線性函數(shù)（non-linear link function）將反應(yīng)變量與線性預(yù)測指標聯(lián)系起來。對于logistic回歸模型，選擇的連接函數(shù)為logit函數(shù)，即對結(jié)局變量進行l(wèi)ogit變換，含有一個解釋變量的logistic回歸模型可表示如下形式：

多水平模型也可以推廣到非正態(tài)情形。致畸試驗中模型為

實例分析及SPSS實現(xiàn)

下面結(jié)合實例來說明如何通過專業(yè)統(tǒng)計軟件SPSS實現(xiàn)分析過程。在研究某化學(xué)物質(zhì)的致畸試驗中，將26只孕鼠隨機分為對照組和實驗組，實驗組在孕早期每天給予一定劑量的受試物，對照組給予等量的蒸餾水。待孕鼠分娩后，測量仔鼠體重并且觀察仔鼠某種畸形的發(fā)生數(shù)。

現(xiàn)在要比較實驗組和對照組仔鼠的發(fā)育情況（體重作為測量指標）以及兩組的仔鼠畸形發(fā)生率。如果忽略窩別效應(yīng)，直接進行兩組的比較，如文獻中常采用的t檢驗或χ2檢驗，結(jié)果見表1。結(jié)果顯示實驗組仔鼠與對照組相比，體重和畸形發(fā)生率差異均有統(tǒng)計學(xué)意義（P＜0.05），且實驗組體重較低，畸形發(fā)生率較高。提示受試物可影響胎鼠的生長發(fā)育，亦可提高胎鼠的畸形發(fā)生率。

表1 忽略窩別效應(yīng)的統(tǒng)計分析結(jié)果

《致畸試驗（GB 15193.14-2003）》中指出“胎鼠身長、體重、窩平均活胎數(shù)、子宮連胎重量用t檢驗，胎鼠的數(shù)據(jù)以窩為單位進行統(tǒng)計。”這種方法可稱之為“窩平均法”，將每個孕鼠作為試驗單位，各指標以每窩均數(shù)為基礎(chǔ)來進行統(tǒng)計。如對于仔鼠體重，可先計算每窩胎鼠的平均體重，再進行t檢驗；對于畸形發(fā)生率，將每窩比率作平方根反正弦變換后作t檢驗。結(jié)果見表2。結(jié)果顯示與忽略窩別效應(yīng)時的結(jié)論相反，實驗組與對照組的體重和畸形發(fā)生率差異無統(tǒng)計學(xué)意義（P＞0.05）。

表2 “窩平均法”的統(tǒng)計分析結(jié)果

考慮致畸試驗中仔鼠數(shù)據(jù)的層次特征，即窩別效應(yīng)，現(xiàn)采用兩水平模型進行分析。檢驗結(jié)果見表3。SPSS操作過程見表4。對于體重來講，水平2單位（不同孕鼠間）的隨機效應(yīng)殘差（即窩別效應(yīng)）方差為0.1656，標準誤為0.0559，Wald檢驗結(jié)果χ2＝8.961，P＜0.001，認為不同窩別的仔鼠體重總體均數(shù)是不同的，即存在“窩別效應(yīng)”。同樣，對于畸形發(fā)生率來講，水平2單位（不同孕鼠間）的隨機效應(yīng)殘差（即窩別效應(yīng)）Z檢驗結(jié)果Z＝2.212，P＝0.027＜0.05，亦存在“窩別效應(yīng)”。故采用兩水平模型是合適的。在考慮了“窩別效應(yīng)”后，體重及畸形發(fā)生率在不同組間的差異均無統(tǒng)計學(xué)意義（P＞0.05）。因此，尚不能認為該受試物會影響仔鼠的生長發(fā)育或?qū)е伦惺蠡伟l(fā)生增加。

表3 兩水平模型的統(tǒng)計分析結(jié)果

表4 SPSS軟件處理傳統(tǒng)致畸試驗中仔體資料的操作過程

討論

1.由以上結(jié)果可以看出，將每個仔鼠作為試驗單位，忽略窩別效應(yīng)，簡單采用傳統(tǒng)的分析方法t檢驗或χ2檢驗是不對的，最終會導(dǎo)致統(tǒng)計推斷結(jié)論的偏倚。由于同一孕鼠所產(chǎn)m個胎仔之間不獨立，其提供的信息遠遠小于m個來自不同孕鼠所產(chǎn)胎仔的觀測值所提供的信息。窩別效應(yīng)存在時，均數(shù)的標準誤是要比獨立數(shù)據(jù)的標準誤大，因此，當用傳統(tǒng)方法計算時，會增加犯假陽性的概率。如本文實例中所呈現(xiàn)的情形。

2.窩平均法是將孕鼠作為分析的基本單元，將個體水平的信息整合到群體水平，這樣的做法會低估個體水平的變異，損失了大量樣本數(shù)據(jù)的信息。而且由于孕鼠水平的觀察單位數(shù)通常較少，樣本含量較小，檢驗效能降低，導(dǎo)致參數(shù)估計和統(tǒng)計推斷的不可靠，增加犯假陰性的概率。因此，窩平均法在致畸試驗中的應(yīng)用也不合適。

3.多水平模型是專門用于處理具有多層次或多水平結(jié)構(gòu)資料的分析方法，針對定量資料和定性資料均有相應(yīng)的模型進行統(tǒng)計分析。目前，已有多種統(tǒng)計分析軟件可實現(xiàn)多水平模型的分析，如MLw iN是用于多水平分析的專用軟件，SAS的M IXED、Glimmix、Nlmixed過程亦可擬合多水平結(jié)構(gòu)的線性或廣義線性模型，Stata統(tǒng)計軟件亦有相應(yīng)指令。但在實際工作中，研究者或?qū)Χ嗨侥Ｐ筒涣私?，或?qū)y(tǒng)計軟件不熟悉，或?qū)?fù)雜的編程望而生畏，從而制約了聚集性數(shù)據(jù)統(tǒng)計分析方法的實際應(yīng)用。本文中介紹的SPSS軟件操作相對簡單，結(jié)果讀取清晰明了，對多數(shù)醫(yī)學(xué)研究者來說易于掌握。

1.王心如，周宗燦.毒理學(xué)基礎(chǔ).人民衛(wèi)生出版社，2007.

2.甘卉芳，李百祥，剛葆琪.常規(guī)致畸試驗及其結(jié)果判定的規(guī)范化問題.中華預(yù)防醫(yī)學(xué)雜志，2002（2）：59-61.

3.中華人民共和國衛(wèi)生部.GB 15193.14-2003致畸試驗.2003.

4.王炳順，宮麗崑，高爾生等.常規(guī)致畸試驗窩效應(yīng)的統(tǒng)計處理及統(tǒng)計軟件實現(xiàn).中國衛(wèi)生統(tǒng)計，2003（4）：10-13.

5.楊珉，李曉松.醫(yī)學(xué)和公共衛(wèi)生研究常用多水平統(tǒng)計模型.北京大學(xué)醫(yī)學(xué)出版社，2007.

6.饒克勤.衛(wèi)生統(tǒng)計方法與應(yīng)用進展.第2卷.人民衛(wèi)生出版社，2008.

（責(zé)任編輯：郭海強）

1.中山大學(xué)公共衛(wèi)生學(xué)院（510080）

2.廣東省醫(yī)學(xué)實驗動物中心（528248）

△通信作者：張晉昕，E-mail：zhjinx＠m(xù)ail.sysu.edu.cn

利用SPSS軟件中M ixed model模塊處理致畸試驗中窩別效應(yīng)

問題背景

實例分析及SPSS實現(xiàn)

討 論

討論