孔博丹?許惠芳?孔博鑒
摘要:元分析是心理學(xué)研究中的重要手段。國內(nèi)元分析常出現(xiàn)發(fā)表性偏倚缺失以及誤用隨機效應(yīng)模型和固定效應(yīng)模型的問題。本文通過整理相關(guān)文獻,指出研究者應(yīng)當(dāng)遵循漏斗圖以及相關(guān)統(tǒng)計的指標(biāo)研究、識別并處理發(fā)表性偏倚,遵循假設(shè)以及異質(zhì)性檢驗的結(jié)果來選取適合的模型合并單個研究指標(biāo)。
關(guān)鍵詞:元分析;發(fā)表性偏倚;隨機效應(yīng)模型;固定效應(yīng)模型;異質(zhì)性檢驗
一、元分析常見問題
元分析是對已有的同類課題的研究進行綜合評價、分析,整合獨立研究的成果,以獲得普遍性、概括性結(jié)論的方法。元分析的優(yōu)勢有兩點,一是將哲學(xué)中的批判思想轉(zhuǎn)變成為可操作的方法,二是填補了定量分析方法與定性分析方法的鴻溝。在心理學(xué)界,元分析被越來越多地應(yīng)用于分析某領(lǐng)域研究的趨勢,整合不統(tǒng)一的研究結(jié)論,探尋新的研究方向。近年來,國內(nèi)介紹、應(yīng)用元分析的論文逐漸增多。但是,同國外的元分析論文相比,國內(nèi)元分析論文普遍存在兩方面的問題:一是發(fā)表性偏倚過程的缺失,發(fā)表性偏倚在元分析過程中是一個較為重要的步驟,但是國內(nèi)的元分析文獻中較少涉及此過程;二是隨機效應(yīng)模型和固定效應(yīng)模型選擇標(biāo)準(zhǔn)誤用。上述兩個問題如果處理不好均有可能影響元分析結(jié)果的準(zhǔn)確性,甚至有可能得到相反的結(jié)果。為此,本研究整理分析有關(guān)這兩個問題的文獻,期待通過對文獻的梳理,解決上述兩個問題。
二、發(fā)表性偏倚的識別及解決辦法
(一)如何識別發(fā)表性偏倚
發(fā)表性偏倚是指由于研究者不能完全占有相關(guān)領(lǐng)域的資料而造成元分析結(jié)果存在偏倚。發(fā)表性偏倚常被稱為“文件柜問題”,緣其類似于研究者沒有將結(jié)果不顯著的文獻用于分析,就像把它們放在文件柜里(Rosenthal,1979)[1]。造成偏倚的原因有二:一是元分析者很難收集到相關(guān)研究領(lǐng)域的所有文獻,很多沒有公開發(fā)表的文獻是不易獲取的;二是已經(jīng)發(fā)表的文獻中,證實了研究假設(shè)的居多,而有悖于研究假設(shè)的很少,同時元分析者也易將結(jié)果顯著的研究納入元分析中(Rosenthal,2001) [2]。偏倚一般體現(xiàn)為結(jié)果偏向于研究者的原假設(shè)。常用的評定方法有兩類:直觀的觀察法和統(tǒng)計的方法。
直觀的觀察法常用漏斗圖法(funnel plot),它由Light和Pillemer于1984年提出。漏斗圖將各個研究表示為直角坐標(biāo)系里的散點圖。一般來說,X軸是效應(yīng)量值,Y軸是樣本量。各個研究表示為坐標(biāo)系內(nèi)的點。漏斗圖的理論依據(jù)是樣本量越大,其對效應(yīng)量值的估計也就越準(zhǔn)確,樣本量越小,其誤差也越大。具體表現(xiàn)為漏斗圖里樣本量大的研究集中在圖的上方,平均效應(yīng)量值周圍;樣本量小的研究散落在圖的底部,離平均效應(yīng)量值較遠(yuǎn)。元分析者通過觀察圖形的形狀來確定偏倚是否存在。如果沒有,各個點應(yīng)該是成堆的、對稱的,聚集在平均效應(yīng)量周圍,就像一個倒著的漏斗一樣;如果有,圖形會有缺角。漏斗圖很直觀,且方便,易于操作,但是它的主觀性很強。而且漏斗圖只能夠提供定性的結(jié)論,并不能說明偏倚的程度有多大,以及在多大程度上對元分析結(jié)果造成影響。針對這些缺點,研究者提出了統(tǒng)計的方法。常見的統(tǒng)計方法包有Fail-safe N、Egger回歸系數(shù)、Trim and Fill。
(二)Fail-safe N法
羅森塔爾(Rosenthal,1979)提出了Fail-safe N法[3]。他指出,由于證實原假設(shè)的文章易發(fā)表,就造成了元分析的結(jié)果有偏倚。發(fā)表性偏倚的原因就是缺乏結(jié)論不顯著的文章。要確定這些文章的數(shù)量,可以通過計算需要合并多少個這些并未納入元分析的研究從而使原來元分析顯著的p值變?yōu)椴伙@著來實現(xiàn)。具體做法為:假定缺失的研究顯著性水平不足0.05,它們的效應(yīng)量值為0,計算出Z值,將這些Z值用特殊的方法合并到原來的結(jié)果中去,得出總效應(yīng)量的Z值。將合并后的Z值與p值為0.05的Z值相比較,計算出使前者小于后者需要的研究個數(shù)。
有研究者對Fail-safe N提出了批評:一是羅森塔爾所說的顯著,僅是局限于統(tǒng)計學(xué)意義上的顯著,而沒有從數(shù)量上說明;二是羅森塔爾的模型假定缺失的效應(yīng)量值均為0,然而缺失的研究的效應(yīng)量值并不總為0,另外研究的樣本量也未被考慮;三是顯著性水平p是聯(lián)合研究后計算出來的,而現(xiàn)在的元分析則是直接計算出p值(B.J.Becker,2005) [4]。
針對以上的這些缺陷,后來的一些研究者提出了改進了的Fail-safe N法。如奧溫(Orwin,1983)提出的另一種計算方法[5],在基本思路上仍然沿襲羅森塔爾,即確定需要多少研究才能使得結(jié)果的顯著性發(fā)生變化。與之不同的是,針對羅森塔爾方法中將缺失研究的效應(yīng)量值定義為0這個缺陷,奧溫則將缺失研究的效應(yīng)量值擴展為一定的數(shù)值,即計算出需要多少個效應(yīng)量值為某一確定值的研究才能夠使原先的效應(yīng)量值的顯著性水平發(fā)生變化。奧溫的方法好處在于研究者可以自己確定出缺失效應(yīng)量值的最低水平。羅森塔爾(1991)則進一步提出了Fail-safe N法的評定標(biāo)準(zhǔn),當(dāng)N值大于5k+10時就不存在發(fā)表性偏倚[6]。
(三)回歸系數(shù)
埃格爾(Egger,1997)提出可以利用回歸方程中的截距是否為0來推測發(fā)表性偏倚是否存在[7]。這種方法基于漏斗圖,將每個研究表示成效應(yīng)量值的Z分?jǐn)?shù)(θi/vi)為標(biāo)準(zhǔn)誤倒數(shù)的回歸的形式。
Zi為效應(yīng)量值對應(yīng)的Z分?jǐn)?shù),vi為標(biāo)準(zhǔn)誤。
如果沒有偏倚,漏斗圖是對稱的,那么直線就應(yīng)該穿過標(biāo)準(zhǔn)正態(tài)分布圖形的原點,也就是β0為0。研究者應(yīng)該報告β0=0時雙尾檢驗的p值。
埃格爾則認(rèn)為Z值以1/vi的形式加權(quán)是缺乏理論支持的,因此,他又提出了未加權(quán)的方法。埃格爾認(rèn)為上一種方法僅考慮將各個研究的方差的倒數(shù)作為權(quán)重,這種情形只適用于固定效應(yīng)模型。在隨機效應(yīng)模型中,方差被區(qū)分為被試內(nèi)方差vi和被試間方差τ2,會造成偏差。采用τ2和vi加權(quán)能適用于兩種模型,因為在固定效應(yīng)模型中τ2為0。
(四)Trim and Fill法
Trim and Fill法由杜瓦爾(Duval)和特威迪(Twe-edie)提出。這種方法同樣是基于漏斗圖。其基本思路為:如果漏斗圖是不對稱的,那么在左邊或者右邊就會有一些多余的散點,如果將這些散點刪去,那么漏斗圖又會變得對稱。Trim and Fill法采用迭代的方法將這些研究一個個去掉,直到圖形對稱了以后,再重新計算出效應(yīng)量值的無偏估計。由于去掉了一部分研究以后,會影響原來樣本的方差,使置信區(qū)間變小。因此還需采用一定的算法將刪去的研究還原,重新計算出樣本的方差。
(五)如何處理發(fā)表性偏倚
緣其究竟,發(fā)表性偏倚是由數(shù)據(jù)缺失造成的。因此,對發(fā)表性偏倚問題的處理等同于對缺失數(shù)據(jù)的處理。羅賓(Rubin,1976)將缺失數(shù)據(jù)劃分為三種類型:完全隨機缺失(missing completely at random)、隨機缺失(missing at random)、非隨機缺失(not missing at random)[8]。其中,完全隨機缺失數(shù)據(jù)和隨機缺失數(shù)據(jù)是正態(tài)分布,非隨機缺失數(shù)據(jù)是偏態(tài)分布的。不同的方法適用于不同的缺失值類型。
三、隨機效應(yīng)模型和固定效應(yīng)模型的原理及
選擇
元分析的核心是效應(yīng)量值,因此確定效應(yīng)量值的真實值θ以及確定其置信區(qū)間是最為重要的步驟。隨機效應(yīng)模型和固定效應(yīng)模型提供了兩種不同的計算方式,其原理大同小異,均是分別對樣本的效應(yīng)量值和方差進行估計。但是,由于兩種模型對誤差的定義不同,造成了最終的結(jié)果有所區(qū)別。
(一)固定效應(yīng)模型(Fixed-Effects Model)
固定效應(yīng)模型由赫奇斯(Hedges)于1982年提出[9]。他認(rèn)為,固定效應(yīng)模型中各個參數(shù)是固定的,需要采用一定的方法將這些參數(shù)估算出來。當(dāng)所納入的研究屬于同一分布時,各個研究中均包含有相同的真值(true effect size)。固定效應(yīng)模型中假定真值θ是由效應(yīng)量值的觀測值和誤差共同決定。用公式表達為:
確定真值θ需要估計兩個值:一個是平均效應(yīng)量值的觀測值Ti,另一個是誤差εi。在對平均效應(yīng)量值估計之前,首先需要確定權(quán)重。元分析中各個研究的被試個數(shù)差別可能特別大,所以就不能單純采取算術(shù)平均數(shù),或者是以各研究被試個數(shù)來加權(quán)。權(quán)重的最佳估計值是各研究方差的倒數(shù),記為wi:
wi為各個研究的權(quán)重,vi為各個研究的方差。
采用最大似然比法估計出平均效應(yīng)量值的觀測值T.為:
wi為個研究權(quán)重,Ti為各研究效應(yīng)量值。
下一步,需要估計樣本的方差。由于權(quán)重等于方差的倒數(shù)。那么,樣本的方差計算方法為:
權(quán)重是每個研究方差的倒數(shù),樣本方差的直接計算方法為:
其中,σ2為各個研究的標(biāo)準(zhǔn)誤,k是研究個數(shù),n為各項研究的被試個數(shù)。
在得到了平均效應(yīng)量值的估計值和方差的估計值以后,就可以推斷置信區(qū)間。采用Z分?jǐn)?shù)進行推斷,顯著性水平α通常設(shè)定為5%或者1%,可以得到置信區(qū)間為:
(二)隨機效應(yīng)模型(Random-Effects Model)
赫奇斯于1983年提出了隨機效應(yīng)模型[10]。當(dāng)所納入研究變化超過了預(yù)想的范圍,那么他們就不屬于同一分布。每一個研究均有一個真值,但是這些真值是各不相同的,對真值不能作準(zhǔn)確的估算。也就是說,在隨機效應(yīng)模型中,平均效應(yīng)量值是可變的,不是固定的??傮w的變異被區(qū)分為兩個部分,一部分是來自各個研究的變異,另一部分是來自平均效應(yīng)量值的變異。觀測值表示為:
Ti為效應(yīng)量值的觀測值,μ為隨機效應(yīng)模型中的效應(yīng)量值的真值,而變異則被劃分為來自效應(yīng)量值真值的變異ξi和來自各個研究的變異εi。
由于方差的不同,導(dǎo)致隨機效應(yīng)模型和固定效應(yīng)模型有兩點區(qū)別:一是權(quán)重不同,會影響到平均效應(yīng)量值的不同;二是方差的估計不同,導(dǎo)致置信區(qū)間不一致。
隨機效應(yīng)模型中同樣采用最大似然比法對平均數(shù)進行估計:
由于隨機效應(yīng)模型引進了來自效應(yīng)量值真值的變異ξi,所以總體方差就被區(qū)分成了兩個部分,表示為:
v*i是樣本方差,vi為各個研究的方差,τ2為效應(yīng)量值真值的方差。這種表述形式類似于方差分析,所以τ2常被稱為被試間方差(Qw),vi常被稱為被試內(nèi)方差(Qb)。
τ2的計算方法為:
其中c和Q分別為:
由此可以推算出效應(yīng)量值的標(biāo)準(zhǔn)誤SEM為:
計算出平均數(shù)和標(biāo)準(zhǔn)差之后,顯著性水平α下的置信區(qū)間為:
(三)異質(zhì)性檢驗(Heterogeneity)
異質(zhì)性檢驗是單個研究的效應(yīng)量值合成整體效應(yīng)量值中的關(guān)鍵步驟,其實質(zhì)為檢驗各個研究是否屬于同一分布。常用的判別方法有兩種:Q檢驗和I2檢驗。
1.Q檢驗
Q檢驗實際上是檢驗理論變異和觀測變異是否有區(qū)別,也就是Q和df在統(tǒng)計上是否有區(qū)別。統(tǒng)計量Q表示的是觀測變異,df表示的是理論變異。這兩者的差值服從χ2分布。
Q值的計算方法是:
wi為各個研究的權(quán)重,Xi為各效應(yīng)量值,X為平均效應(yīng)量值。Q實際上是加權(quán)平方和,表示觀測量的變異。
聯(lián)系Q和τ2的計算方法,我們可以看出Q檢驗的實質(zhì)是檢驗真實變異的方差τ2是否為0。在固定效應(yīng)模型中,效應(yīng)量值在所有研究中均是相同的,故τ2為0;在隨機效應(yīng)模型中,效應(yīng)量值在所有研究中不同,故τ2不為0。
2.I2檢驗
Q檢驗是檢驗τ2是否為0,它與研究數(shù)量的關(guān)系密切,因此也會出現(xiàn)偏差。例如,杰斐遜(Jefferson,2002)做的一項元分析[11],納入了8個藥物有效率的研究,有效率從16%變化至93%,這表明這幾項研究已經(jīng)是異質(zhì)的。但是Q檢驗的結(jié)果顯示p值為0.09,表明這幾項研究還是同質(zhì)的(Higgins,2003)[12]。針對Q檢驗的弊端,希金斯(Higgins,2003)提出了I2。I2檢驗真實變異占總變異的百分比,避免了對df的依賴。I2的計算方法為:
變異由方差表示,故I2的計算方法也可以寫成:
I2的變化范圍是0~1。不同的I2表示納入研究的不一致程度。希金斯(2003)將I2區(qū)分為25%、50%、75%,分別代表變異為低、中等、高。高的I2表示納入研究一致性高,需要采用例如回歸分析、子群分析來分析變異的原因(Borenstein & Hedges,2009) [13];低的I2表示一致性低,沒有必要對這些研究作進一步的分析。
(四)固定效應(yīng)模型和隨機效應(yīng)模型的選擇
赫奇斯(1982,1983)指出,兩種模型的選擇取決于異質(zhì)性檢驗的結(jié)果[14,15]。如果異質(zhì)性檢驗的結(jié)果為顯著,所有研究不屬于同一分布,采用隨機效應(yīng)模型;如果異質(zhì)性檢驗結(jié)果為不顯著,所有研究屬于同一分布,采用固定效應(yīng)模型。
赫奇斯和維瓦于1998年指出隨機效應(yīng)模型和固定效應(yīng)模型的選擇應(yīng)當(dāng)取決于元分析者所做的推論過程,異質(zhì)性檢驗只起到補充說明的作用[16]。從他們將研究的推論過程區(qū)分為條件推論(conditional inference)和非條件推論(unconditional inference)。條件推論是指元分析者試圖將結(jié)論應(yīng)用到與所納入研究相同的群體,例如被試的背景(如年齡、受教育程度、來源),干預(yù)實驗的程序等均相同。此時應(yīng)該采用固定效應(yīng)模型。非條件推論是指元分析者試圖將結(jié)論應(yīng)用到不同的研究背景,例如將初中生的結(jié)果推論及高中生,將一種實驗程序的結(jié)果推論及其他實驗程序。此時則應(yīng)該采用隨機效應(yīng)模型。
四、結(jié)論和建議
元分析中,研究者為了獲取更精確的研究結(jié)果需要嚴(yán)格篩選源文獻,處理發(fā)表性偏倚是其中一個重要的環(huán)節(jié),研究者應(yīng)當(dāng)遵循漏斗圖以及相關(guān)統(tǒng)計的指標(biāo),判別自己的研究是否存在發(fā)表性偏倚。隨機效應(yīng)模型和固定效應(yīng)模型的選取則應(yīng)當(dāng)遵循研究假設(shè)以及異質(zhì)性檢驗的結(jié)果來選取。
[1][3]Rosenthal R.The “File Drawer Problem” and tolerance for null results[J].Psychological Bulletin, 1979,86:638-641.
[2]Rosenthal R, DiMatteo M R.Meta-Analysis: Recent developments in quantitative methods for literature reviews[J].Annual Review of Psychology, 2001,52:59-82.
[4]Becker B J. Failsafe N or file-drawer number[M]// Rothstein H R, Sutton A J, Borenstein M (Eds.), Publication bias in meta-analysis: Prevention, assessment and adjustments. Chichester, West Sussex, England: Wiley.2005. 111–125.
[5]Orwin R G. A fail-safe N for effect size in meta-analysis[J].Journal of educational statistics, 1983,8:157-159.
[6]Rosenthal R.Meta-analytic procedures for social research[J].Journal of educational statistics, 1983,8:157-159.
[7]Egger M, Smith G D, Schneider M, Minder C. Bias in meta-analysis detected by a simple, graphical test[J]. Bmj, 1997,315(7109): 629-634.
[8]Rubin D B. Inference and missing data[J]. Biometrika,1976, 63(3): 581-592.
[9][14] Hedges L V. Estimation of effect size from a series of independen experiments[J]. Psychological Bulletin, 1982,92:490-499.
[10] [15]Hedges L V.A random effects model for effect size[J]. Psychological Bulletin, 1983, 93:388-395.
[11]Jefferson T, Demicheli V, Di Pietrantonj C, Rivetti D. Amantadine and rimantadine for influenza A in adults[J]. Cochrane Database Syst Rev, 2006.
[12] Higgins J P T, Thompson S G, Deeks J J, Altman D G. Measuring inconsistency in mata-analyses[J]. Education and debate, 2003,327:557-560.
[13]Borenstein M, Hedges L V, Higgins J, Rothstein H R. Fixed‐effect versus random‐effects models[J]. Introduction to Meta-analysis, 2009: 77-86.
[16]Hedges L V, Vevea J L. Fixed- and random-effects model in meta-analysis[J]. Psychological Methods, 1998,3:486-504.
欄目編輯 / 王晶晶.終校 / 任玉丹
變異由方差表示,故I2的計算方法也可以寫成:
I2的變化范圍是0~1。不同的I2表示納入研究的不一致程度。希金斯(2003)將I2區(qū)分為25%、50%、75%,分別代表變異為低、中等、高。高的I2表示納入研究一致性高,需要采用例如回歸分析、子群分析來分析變異的原因(Borenstein & Hedges,2009) [13];低的I2表示一致性低,沒有必要對這些研究作進一步的分析。
(四)固定效應(yīng)模型和隨機效應(yīng)模型的選擇
赫奇斯(1982,1983)指出,兩種模型的選擇取決于異質(zhì)性檢驗的結(jié)果[14,15]。如果異質(zhì)性檢驗的結(jié)果為顯著,所有研究不屬于同一分布,采用隨機效應(yīng)模型;如果異質(zhì)性檢驗結(jié)果為不顯著,所有研究屬于同一分布,采用固定效應(yīng)模型。
赫奇斯和維瓦于1998年指出隨機效應(yīng)模型和固定效應(yīng)模型的選擇應(yīng)當(dāng)取決于元分析者所做的推論過程,異質(zhì)性檢驗只起到補充說明的作用[16]。從他們將研究的推論過程區(qū)分為條件推論(conditional inference)和非條件推論(unconditional inference)。條件推論是指元分析者試圖將結(jié)論應(yīng)用到與所納入研究相同的群體,例如被試的背景(如年齡、受教育程度、來源),干預(yù)實驗的程序等均相同。此時應(yīng)該采用固定效應(yīng)模型。非條件推論是指元分析者試圖將結(jié)論應(yīng)用到不同的研究背景,例如將初中生的結(jié)果推論及高中生,將一種實驗程序的結(jié)果推論及其他實驗程序。此時則應(yīng)該采用隨機效應(yīng)模型。
四、結(jié)論和建議
元分析中,研究者為了獲取更精確的研究結(jié)果需要嚴(yán)格篩選源文獻,處理發(fā)表性偏倚是其中一個重要的環(huán)節(jié),研究者應(yīng)當(dāng)遵循漏斗圖以及相關(guān)統(tǒng)計的指標(biāo),判別自己的研究是否存在發(fā)表性偏倚。隨機效應(yīng)模型和固定效應(yīng)模型的選取則應(yīng)當(dāng)遵循研究假設(shè)以及異質(zhì)性檢驗的結(jié)果來選取。
[1][3]Rosenthal R.The “File Drawer Problem” and tolerance for null results[J].Psychological Bulletin, 1979,86:638-641.
[2]Rosenthal R, DiMatteo M R.Meta-Analysis: Recent developments in quantitative methods for literature reviews[J].Annual Review of Psychology, 2001,52:59-82.
[4]Becker B J. Failsafe N or file-drawer number[M]// Rothstein H R, Sutton A J, Borenstein M (Eds.), Publication bias in meta-analysis: Prevention, assessment and adjustments. Chichester, West Sussex, England: Wiley.2005. 111–125.
[5]Orwin R G. A fail-safe N for effect size in meta-analysis[J].Journal of educational statistics, 1983,8:157-159.
[6]Rosenthal R.Meta-analytic procedures for social research[J].Journal of educational statistics, 1983,8:157-159.
[7]Egger M, Smith G D, Schneider M, Minder C. Bias in meta-analysis detected by a simple, graphical test[J]. Bmj, 1997,315(7109): 629-634.
[8]Rubin D B. Inference and missing data[J]. Biometrika,1976, 63(3): 581-592.
[9][14] Hedges L V. Estimation of effect size from a series of independen experiments[J]. Psychological Bulletin, 1982,92:490-499.
[10] [15]Hedges L V.A random effects model for effect size[J]. Psychological Bulletin, 1983, 93:388-395.
[11]Jefferson T, Demicheli V, Di Pietrantonj C, Rivetti D. Amantadine and rimantadine for influenza A in adults[J]. Cochrane Database Syst Rev, 2006.
[12] Higgins J P T, Thompson S G, Deeks J J, Altman D G. Measuring inconsistency in mata-analyses[J]. Education and debate, 2003,327:557-560.
[13]Borenstein M, Hedges L V, Higgins J, Rothstein H R. Fixed‐effect versus random‐effects models[J]. Introduction to Meta-analysis, 2009: 77-86.
[16]Hedges L V, Vevea J L. Fixed- and random-effects model in meta-analysis[J]. Psychological Methods, 1998,3:486-504.
欄目編輯 / 王晶晶.終校 / 任玉丹
變異由方差表示,故I2的計算方法也可以寫成:
I2的變化范圍是0~1。不同的I2表示納入研究的不一致程度。希金斯(2003)將I2區(qū)分為25%、50%、75%,分別代表變異為低、中等、高。高的I2表示納入研究一致性高,需要采用例如回歸分析、子群分析來分析變異的原因(Borenstein & Hedges,2009) [13];低的I2表示一致性低,沒有必要對這些研究作進一步的分析。
(四)固定效應(yīng)模型和隨機效應(yīng)模型的選擇
赫奇斯(1982,1983)指出,兩種模型的選擇取決于異質(zhì)性檢驗的結(jié)果[14,15]。如果異質(zhì)性檢驗的結(jié)果為顯著,所有研究不屬于同一分布,采用隨機效應(yīng)模型;如果異質(zhì)性檢驗結(jié)果為不顯著,所有研究屬于同一分布,采用固定效應(yīng)模型。
赫奇斯和維瓦于1998年指出隨機效應(yīng)模型和固定效應(yīng)模型的選擇應(yīng)當(dāng)取決于元分析者所做的推論過程,異質(zhì)性檢驗只起到補充說明的作用[16]。從他們將研究的推論過程區(qū)分為條件推論(conditional inference)和非條件推論(unconditional inference)。條件推論是指元分析者試圖將結(jié)論應(yīng)用到與所納入研究相同的群體,例如被試的背景(如年齡、受教育程度、來源),干預(yù)實驗的程序等均相同。此時應(yīng)該采用固定效應(yīng)模型。非條件推論是指元分析者試圖將結(jié)論應(yīng)用到不同的研究背景,例如將初中生的結(jié)果推論及高中生,將一種實驗程序的結(jié)果推論及其他實驗程序。此時則應(yīng)該采用隨機效應(yīng)模型。
四、結(jié)論和建議
元分析中,研究者為了獲取更精確的研究結(jié)果需要嚴(yán)格篩選源文獻,處理發(fā)表性偏倚是其中一個重要的環(huán)節(jié),研究者應(yīng)當(dāng)遵循漏斗圖以及相關(guān)統(tǒng)計的指標(biāo),判別自己的研究是否存在發(fā)表性偏倚。隨機效應(yīng)模型和固定效應(yīng)模型的選取則應(yīng)當(dāng)遵循研究假設(shè)以及異質(zhì)性檢驗的結(jié)果來選取。
[1][3]Rosenthal R.The “File Drawer Problem” and tolerance for null results[J].Psychological Bulletin, 1979,86:638-641.
[2]Rosenthal R, DiMatteo M R.Meta-Analysis: Recent developments in quantitative methods for literature reviews[J].Annual Review of Psychology, 2001,52:59-82.
[4]Becker B J. Failsafe N or file-drawer number[M]// Rothstein H R, Sutton A J, Borenstein M (Eds.), Publication bias in meta-analysis: Prevention, assessment and adjustments. Chichester, West Sussex, England: Wiley.2005. 111–125.
[5]Orwin R G. A fail-safe N for effect size in meta-analysis[J].Journal of educational statistics, 1983,8:157-159.
[6]Rosenthal R.Meta-analytic procedures for social research[J].Journal of educational statistics, 1983,8:157-159.
[7]Egger M, Smith G D, Schneider M, Minder C. Bias in meta-analysis detected by a simple, graphical test[J]. Bmj, 1997,315(7109): 629-634.
[8]Rubin D B. Inference and missing data[J]. Biometrika,1976, 63(3): 581-592.
[9][14] Hedges L V. Estimation of effect size from a series of independen experiments[J]. Psychological Bulletin, 1982,92:490-499.
[10] [15]Hedges L V.A random effects model for effect size[J]. Psychological Bulletin, 1983, 93:388-395.
[11]Jefferson T, Demicheli V, Di Pietrantonj C, Rivetti D. Amantadine and rimantadine for influenza A in adults[J]. Cochrane Database Syst Rev, 2006.
[12] Higgins J P T, Thompson S G, Deeks J J, Altman D G. Measuring inconsistency in mata-analyses[J]. Education and debate, 2003,327:557-560.
[13]Borenstein M, Hedges L V, Higgins J, Rothstein H R. Fixed‐effect versus random‐effects models[J]. Introduction to Meta-analysis, 2009: 77-86.
[16]Hedges L V, Vevea J L. Fixed- and random-effects model in meta-analysis[J]. Psychological Methods, 1998,3:486-504.
欄目編輯 / 王晶晶.終校 / 任玉丹