• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      群體異質(zhì)性研究的潛變量分析方法

      2015-03-09 12:57:14李麗霞趙麗周舒冬張敏郜艷暉張巖波
      關(guān)鍵詞:亞類亞組類別

      李麗霞趙 麗周舒冬張 敏郜艷暉張巖波

      群體異質(zhì)性研究的潛變量分析方法

      李麗霞1趙 麗2周舒冬1張 敏1郜艷暉1張巖波3

      社會(huì)學(xué)、心理學(xué)、醫(yī)學(xué)等研究領(lǐng)域常常關(guān)注群體的異質(zhì)性,異質(zhì)性有時(shí)是可觀測(cè)的,有時(shí)則不可見(jiàn)。由可觀測(cè)變量(也稱顯變量)定義的亞組,例如按照性別、血型等顯變量分組,此時(shí)每個(gè)觀測(cè)所屬的組別已知,群體異質(zhì)性可見(jiàn),可采用多組比較的方法對(duì)數(shù)據(jù)進(jìn)行分析。但有時(shí)基于多個(gè)社會(huì)人口等分組變量來(lái)解釋數(shù)據(jù)的異質(zhì)性是不可行或不充分的,常常會(huì)產(chǎn)生大量分組,導(dǎo)致結(jié)果解釋比較困難。實(shí)際研究中有些異質(zhì)性不能直接觀測(cè)到,即引起人群異質(zhì)性的變量或來(lái)源未知,每個(gè)觀測(cè)屬于哪個(gè)亞類是未知的,觀測(cè)屬于哪一個(gè)亞類需要從數(shù)據(jù)中推斷[1]。

      異質(zhì)性在科學(xué)研究中普遍存在,現(xiàn)在很多預(yù)防和干預(yù)措施經(jīng)常在沒(méi)有考慮個(gè)體特征情況下實(shí)施,即沒(méi)有考慮人群中存在的異質(zhì)性,尤其是不可見(jiàn)的異質(zhì)性。不同特征的亞組對(duì)干預(yù)措施可能有不同的反應(yīng),將一個(gè)大的異質(zhì)性群體分為多個(gè)小的同質(zhì)性人群,根據(jù)觀測(cè)的反應(yīng)模式找到風(fēng)險(xiǎn)高的個(gè)體,針對(duì)小的同質(zhì)性人群實(shí)施不同的干預(yù)措施可以使效應(yīng)最大化,有針對(duì)性地進(jìn)行干預(yù)具有非常重要的現(xiàn)實(shí)意義[2]。

      傳統(tǒng)對(duì)不可見(jiàn)異質(zhì)性的探討主要采用系統(tǒng)聚類、動(dòng)態(tài)聚類或等級(jí)聚類等方法,聚類分析屬于非參數(shù)方法,應(yīng)用時(shí)需定義觀測(cè)間距離和類間距離,而距離的定義有多種方法,如最長(zhǎng)距離法、最短距離法、類平均法等,選擇距離計(jì)算的方法不同聚類結(jié)果可能有所不同,給使用者造成一定困擾。而且傳統(tǒng)聚類分析要求資料是具有相同測(cè)量尺度的定量變量,類內(nèi)方差相同等條件,該方法不能給出擬合統(tǒng)計(jì)量,結(jié)果不可重復(fù),且與初始值有關(guān),在實(shí)際應(yīng)用時(shí)這些條件往往很難滿足[3]。

      近年來(lái)對(duì)不可見(jiàn)異質(zhì)性的研究逐漸成為醫(yī)學(xué)、社會(huì)學(xué)和心理學(xué)等領(lǐng)域的研究熱點(diǎn),一系列分類潛變量的統(tǒng)計(jì)模型逐漸受到學(xué)者的關(guān)注,該類模型通過(guò)分類潛變量(categorical latent variable)來(lái)探測(cè)不能直接觀察到的異質(zhì)性,找到具有相似性個(gè)體所屬的潛在類別(latent class)實(shí)現(xiàn)分類。本文主要介紹潛在類別分析、潛在剖面分析、因子混合模型、增長(zhǎng)曲線混合模型等潛變量分析方法。

      潛在類別分析(latent class analysis,LCA)

      LCA屬于混合模型(m ixture modeling)的范疇,是一種以“個(gè)體”為中心的方法,傳統(tǒng)的LCA要求基于分類的可測(cè)變量為分類變量,利用模型中的分類潛變量來(lái)解釋人群中的異質(zhì)性。該模型假設(shè)每個(gè)觀測(cè)僅屬于潛變量的c個(gè)類別中的某個(gè)類,通常需要滿足局部獨(dú)立性假設(shè),即:給定潛變量的類別時(shí)顯變量間相互獨(dú)立,該假設(shè)意味著顯變量間的相關(guān)完全由不可測(cè)量的分類潛變量來(lái)解釋,顯變量之間沒(méi)有殘差的協(xié)方差[4]。

      假設(shè)有N個(gè)觀測(cè)數(shù)據(jù),則顯變量的聯(lián)合概率分布可表示為:

      式(1)中,c為分類的潛變量,u1、u2、…ur為r維二分類顯變量,P(c=k)為潛在類別概率,表示觀測(cè)屬于第k個(gè)類別的概率;P(ur|c(diǎn)=k)表示在類別k內(nèi)顯變量ur取值為某個(gè)水平的概率。當(dāng)某觀測(cè)的反應(yīng)模式為u1,u2,…,ur時(shí),可以據(jù)式(2)計(jì)算其屬于某個(gè)類別的概率。

      LCA中有兩種參數(shù):潛在類別概率和顯變量的條件概率,潛在類別概率可描述群體在各個(gè)類別中的分布,顯變量的條件概率表示潛變量的本質(zhì),類似于因子分析中的因子載荷,可反映顯變量和潛變量間的關(guān)聯(lián),能使研究者識(shí)別潛在類別的結(jié)構(gòu),并根據(jù)它們來(lái)對(duì)潛在類別命名。

      LCA利用一個(gè)或多個(gè)分類的潛在變量來(lái)解釋多個(gè)外顯分類變量之間的復(fù)雜關(guān)聯(lián),同時(shí)具有因子分析和聚類分析的功能,與傳統(tǒng)聚類方法相比,LCA在概率基礎(chǔ)上對(duì)人群進(jìn)行分類,即個(gè)體以一定的概率歸屬于各個(gè)類別,最終將被分到后驗(yàn)概率最高的那個(gè)類別,類別數(shù)的選擇標(biāo)準(zhǔn)不再主觀,不需要人為選擇分類的界值點(diǎn),不需要變量滿足正態(tài)分布,尤其可以處理非線性關(guān)系,具有分類客觀、不受變量類型限制、無(wú)需標(biāo)準(zhǔn)化、同時(shí)可考慮協(xié)變量等優(yōu)點(diǎn)。近年來(lái)協(xié)變量的引入、局部獨(dú)立性假設(shè)的放松等方面的擴(kuò)展拓寬了潛在類別模型應(yīng)用的領(lǐng)域。國(guó)外將其廣泛應(yīng)用于教育與心理測(cè)驗(yàn)、社會(huì)心理調(diào)查、疾病診斷、人才測(cè)評(píng)等方面。例如,Muthen等利用17個(gè)二分類的測(cè)量反社會(huì)行為的題項(xiàng)將研究對(duì)象分為4類[5];Sutfin等學(xué)者根據(jù)大學(xué)生過(guò)去一個(gè)月吸煙量、吸煙的頻數(shù)等指標(biāo)使用LCA將大學(xué)生的吸煙者分為5大類[6];在臨床心理學(xué)方面,Xian等人用LCA對(duì)戒煙復(fù)吸人群進(jìn)行分類,并研究復(fù)吸類型與精神疾病的關(guān)系[7]。

      潛在剖面分析(latent profile analysis,LPA)

      與LCA一樣,LPA假定潛變量為分類變量,不同之處在于LPA中可觀測(cè)變量為連續(xù)性變量,在潛變量指定的不同類別下顯變量的均值不同,同一類別內(nèi)個(gè)體間具有較小的變異,表現(xiàn)為較強(qiáng)的同質(zhì)性。

      LPA滿足兩個(gè)基本假設(shè):①在第k類潛在類別內(nèi),可測(cè)變量Y來(lái)自獨(dú)立多元正態(tài)分布N(μk,∑k),∑k中協(xié)方差為0,類間方差可以相等,也可不等。②在潛變量條件下可測(cè)變量間相互獨(dú)立,即滿足局部獨(dú)立性[8]。

      LCA和LPA都可探測(cè)人群中是否存在異質(zhì)性亞組,在不可見(jiàn)的異質(zhì)性群體中,顯變量間的關(guān)聯(lián)可由其背后共同的一個(gè)分類潛變量來(lái)解釋,與LCA一樣,LPA在醫(yī)學(xué)、心理、社會(huì)學(xué)等領(lǐng)域都有非常廣泛的應(yīng)用。例如Schmiege等依據(jù)某隊(duì)列研究中2232例吸煙者的咳嗽、咳痰等6個(gè)呼吸道癥狀(按照嚴(yán)重程度記為1~6分)將吸煙者分為3個(gè)亞類,14%的個(gè)體屬于高癥狀組,41%的個(gè)體為低癥狀組,研究發(fā)現(xiàn)45%的個(gè)體咳嗽、咳痰得分高,而其他癥狀輕微,定義為“氣道清除癥狀組”,在臨床工作中識(shí)別這個(gè)發(fā)病比例較高的群體并施加有效的干預(yù)有重要意義,研究者同時(shí)也探討了性別、目前吸煙狀況等協(xié)變量對(duì)分類的影響[9]。

      實(shí)際應(yīng)用時(shí)當(dāng)出現(xiàn)擬合LCA或LPA模型效果差而拒絕該模型時(shí)意味著局部獨(dú)立性假設(shè)不成立,此時(shí)可考慮以下替代方法:(1)放松局部獨(dú)立性的要求,在模型中增加一個(gè)或多個(gè)直接效應(yīng)參數(shù)來(lái)解釋外顯變量間的剩余關(guān)聯(lián);(2)當(dāng)存在很多冗余變量時(shí)可在模型中去除1個(gè)或多個(gè)外顯變量;(3)當(dāng)群體異質(zhì)性由多個(gè)維度構(gòu)成時(shí),可增加分類潛變量的數(shù)目,由多個(gè)分類潛變量支配顯變量,從多維度對(duì)人群進(jìn)行分類,并且可進(jìn)一步探討分類潛變量間的關(guān)聯(lián),有著重要的學(xué)術(shù)應(yīng)用價(jià)值;(4)在每個(gè)亞類內(nèi)引入連續(xù)型潛變量,即用類內(nèi)因子來(lái)解釋類內(nèi)顯變量的剩余相關(guān),稱為因子混合模型。

      因子混合模型(factor m ixturemodeling,F(xiàn)MM)

      傳統(tǒng)的因子分析假設(shè)樣本中的個(gè)體來(lái)自于同質(zhì)的研究總體,模型中公因子F為連續(xù)性潛變量,解釋可觀測(cè)變量間的相關(guān)性,探討潛在的構(gòu)念。FMM可以探測(cè)研究總體存在不可見(jiàn)異質(zhì)性的同時(shí)擬合潛在的因子結(jié)構(gòu),近年來(lái)成為研究的熱點(diǎn)。

      FMM屬于橫斷面混合分析的一種,該模型中同時(shí)含有連續(xù)性潛變量和分類潛變量,是因子分析和潛在類別模型的混合體,具有這兩種方法的優(yōu)勢(shì)。FMM中分類潛變量對(duì)觀測(cè)進(jìn)行分類的同時(shí),連續(xù)性的因子解釋類內(nèi)的異質(zhì)性,并且可以考慮測(cè)量誤差[10]。

      LCA/LPA中要求條件獨(dú)立性,可測(cè)變量的相關(guān)完全被分類潛變量所解釋,但可觀測(cè)變量的相關(guān)不僅僅是由于類別的不同引起的,與LCA/LPA不同,F(xiàn)MM在每個(gè)亞類內(nèi)顯變量沒(méi)有被假設(shè)為相互獨(dú)立,類內(nèi)的顯變量被允許共變,類內(nèi)的變異用連續(xù)性潛在因子解釋,分類的潛變量擬合未觀察到的總體的異質(zhì)性,并通過(guò)潛在類別模型對(duì)觀測(cè)進(jìn)行分類。FMM主要關(guān)注點(diǎn)是找到異質(zhì)性的亞類及類內(nèi)的潛在因子,可觀測(cè)變量的相關(guān)被分解為兩部分:類別的不同,類內(nèi)連續(xù)性因子不同。

      假設(shè)含有k個(gè)潛在類別,顯變量為y1、y2、…yp,則FMM可表示為:

      對(duì)于某一個(gè)亞類k,yik是觀測(cè)i的p維反應(yīng)模式,υk是測(cè)量截距,Λk是p×m維因子載荷矩陣,ηik為m維因子得分向量,εik為p維殘差向量,αk為m維因子均值向量,ζik為m維殘差向量,服從均值為0,方差為ψ的正態(tài)分布,協(xié)變量引起的異質(zhì)性也可以納入模型中。

      根據(jù)是否滿足測(cè)量不變性(measurement invariance,MI)和所構(gòu)建模型中連續(xù)性潛變量的分布形式,Muthen等人將FMM分成四個(gè)分支,見(jiàn)圖1。其中c為分類的潛變量,f為連續(xù)性潛變量,y為可測(cè)變量。前兩個(gè)分支(FMM-1、FMM-2)滿足MI條件,強(qiáng)調(diào)因子分析方面;后兩個(gè)分支(FMM-3、FMM-4)不滿足MI,更強(qiáng)調(diào)模型在分類方面的作用。這里的測(cè)量不變性指異質(zhì)性的亞類內(nèi)因子載荷、截距、殘差的方差是否相等[11]。

      FMM-1也稱為潛在類別因子分析模型(latent class factor analysis,LCFA),該模型中不同亞類內(nèi)因子的均值不同,可測(cè)變量的截距、因子載荷均相等,因子的方差協(xié)方差矩陣為0,表明沒(méi)有類內(nèi)的異質(zhì)性,圖2(a)的因子分布圖中,橫坐標(biāo)為4個(gè)亞類的4個(gè)因子得分,縱坐標(biāo)為因子得分的頻數(shù)。

      圖1 FMM示意圖

      圖2 (a) FMM-1中因子的分布

      圖2 (b) FMM-2中兩個(gè)亞類的因子分布

      FMM-2中不同的亞類有不同的因子均值αk,指向f的箭頭表明c不能解釋f的所有變異,仍存在不可解釋的類內(nèi)變異。圖2(b)顯示兩個(gè)亞類中公因子的均值和方差均不相同[12]。

      FMM-3和FMM-4中分類潛變量c直接指向可測(cè)變量,或c指向f到y(tǒng)的虛線表明不同亞類內(nèi)測(cè)量參數(shù)、因子的方差等都不相同。

      目前FMM在醫(yī)學(xué)、心理學(xué)等學(xué)科都有比較成功的應(yīng)用,例如,Clark等人將該模型成功用于行為障礙(conduct disorder,CD)的研究中,行為障礙的測(cè)量使用了13個(gè)二分類的題項(xiàng),共調(diào)查了1786名兒童,研究者使用FMM-2模型擬合非正態(tài)分布的行為障礙因子時(shí)將受試對(duì)象分為兩類:無(wú)CD癥狀類和CD癥狀類,對(duì)研究對(duì)象分類的同時(shí)估計(jì)兩個(gè)亞類的行為障礙因子的得分均值和方差。Viroli等采用FMM對(duì)856例老年人進(jìn)行認(rèn)知評(píng)價(jià),最終將人群分為正常人、認(rèn)知功能損傷、老年癡呆癥3類,同時(shí)識(shí)別出4個(gè)維度的連續(xù)性潛在因子[12-13]。

      結(jié)構(gòu)方程混合模型(structural equation m ixturemodel,SEMM)

      SEMM是FMM的擴(kuò)展,假設(shè)多變量分布是混合分布,對(duì)于某個(gè)潛在類別k,y服從正態(tài)分布N(μk,∑k),在每一個(gè)潛在亞類內(nèi)構(gòu)建潛在因子之間的回歸關(guān)系,不同的潛在類別中變量間的復(fù)雜關(guān)系不同,即亞類中的測(cè)量參數(shù)和結(jié)構(gòu)參數(shù)不同。這樣既可以通過(guò)分類潛變量處理客觀存在但沒(méi)有觀察到的異質(zhì)性,處理數(shù)據(jù)不服從正態(tài)分布的情況,又可以分析連續(xù)潛變量間的關(guān)系[14]。其示意圖見(jiàn)圖3,ξ、η為連續(xù)性潛變量,c為分類潛變量,c指向ξ、η的箭頭表明ξ的均值和η的截距在不同的亞類不同,c指向ξ到η的虛線表明不同亞類中ξ與η之間的回歸系數(shù)不同[15]。擬合SEMMs時(shí)運(yùn)算時(shí)間比較長(zhǎng),可能不收斂,可以先擬合限制較多的模型,然后逐步放松限制。

      圖3 SEMM示意圖

      SEMM在心理、社會(huì)、經(jīng)濟(jì)學(xué)等研究領(lǐng)域應(yīng)用前景巨大,例如Jedidi等采用SEMM研究消費(fèi)者對(duì)某新食品喜好的影響因素,結(jié)果顯示:研究總體中存在兩個(gè)不可觀測(cè)的亞類:一類人群主要重視愉悅感,另一類則重視健康,兩個(gè)不同亞類中兩個(gè)知覺(jué)維度“甜味程度”和“口味的豐富感”對(duì)食品的喜好的影響是不同的(甜味程度、口味豐富感分別被兩個(gè)可觀測(cè)的顯變量測(cè)量)[16]。

      增長(zhǎng)混合模型(Grow th m ixturemodel,GMM)

      傳統(tǒng)的增長(zhǎng)曲線模型假設(shè)觀測(cè)來(lái)自同一個(gè)總體,因此擬合簡(jiǎn)單的增長(zhǎng)軌跡就能很好的反映指標(biāo)的變化趨勢(shì),每個(gè)觀測(cè)的增長(zhǎng)軌跡圍繞平均增長(zhǎng)軌跡變動(dòng),而且假設(shè)影響增長(zhǎng)因子的協(xié)變量以相同的方式影響每一個(gè)觀測(cè)。但很多情況下大樣本數(shù)據(jù)是存在異質(zhì)性的,GMM是近年來(lái)出現(xiàn)的探測(cè)增長(zhǎng)軌跡異質(zhì)性的一種新的縱向數(shù)據(jù)分析技術(shù),可以幫助研究者探討總體中是否存在增長(zhǎng)軌跡不同的潛在亞組,容許不同亞組增長(zhǎng)曲線的截距、斜率因子及其方差不同,且協(xié)變量對(duì)它們的影響也可以不同,這一點(diǎn)通過(guò)模型中的分類潛變量來(lái)實(shí)現(xiàn),1999年Muthen等學(xué)者提出GMM模型,見(jiàn)式(4)。

      其中Yt為重復(fù)觀測(cè)的結(jié)果變量,ηk0為截距增長(zhǎng)因子,ηk1為斜率因子,εkt為測(cè)量誤差,k為不可觀測(cè)的亞組,αk0為第k類的截距因子的均值,αk1為第k類的斜率因子的均值,ζk0、ζk1分別為截距、斜率因子的殘差[17]。圖4為GMM示意圖,c表示潛在的分類變量。

      假設(shè)同一亞類的所有觀測(cè)是同質(zhì)的,不存在變異,即每個(gè)潛在類別的增長(zhǎng)因子的方差估計(jì)值為0,稱其為潛在類別增長(zhǎng)曲線模型(latent class grow th analysis,LCGA),它是GMM模型的特例,在擬合GMM模型以前,研究者可以先擬合LCGA,探測(cè)數(shù)據(jù)是否存在不可觀測(cè)的亞類,此時(shí)模型也比較容易收斂[18]。對(duì)GMM模型擴(kuò)展,考慮協(xié)變量和結(jié)局變量,見(jiàn)圖5,稱其為一般增長(zhǎng)混合模型(general grow th mixture modeling,GGMM)。

      圖4 GMM示意圖

      圖5 GGMM示意圖

      Muthen等采用GMM對(duì)美國(guó)公立學(xué)校7~10年級(jí)3102個(gè)學(xué)生4年的數(shù)學(xué)成績(jī)的隨訪資料進(jìn)行分析,同時(shí)研究性別、種族、母親教育程度、學(xué)生有無(wú)輟學(xué)想法等協(xié)變量對(duì)增長(zhǎng)軌跡的影響,結(jié)果發(fā)現(xiàn)存在3個(gè)潛在亞類,20%的學(xué)生數(shù)學(xué)成績(jī)的增長(zhǎng)較差,28%屬于中等情況,52%的比較好,并在模型中加入了輟學(xué)與否這個(gè)結(jié)局變量,構(gòu)建GGMM模型探討協(xié)變量、增長(zhǎng)軌跡對(duì)輟學(xué)的影響,研究結(jié)果對(duì)于幫助教育工作者找到輟學(xué)的高風(fēng)險(xiǎn)人群以早期施加干預(yù)具有重要的意義[17]。Walsh等對(duì)210例有高風(fēng)險(xiǎn)性行為的男性給予干預(yù)措施后隨訪12個(gè)月,構(gòu)建GMM模型識(shí)別出兩個(gè)亞類增長(zhǎng)軌跡不同,46%的受試對(duì)象(風(fēng)險(xiǎn)減少組)在干預(yù)措施后,無(wú)保護(hù)的性行為次數(shù)減少,而54%的受試者(風(fēng)險(xiǎn)持續(xù)組)在干預(yù)后仍然持續(xù)有高頻率的無(wú)保護(hù)性行為,為進(jìn)一步研究風(fēng)險(xiǎn)持續(xù)組的受試對(duì)象的特征并施加相應(yīng)的干預(yù)提供依據(jù)[19]。

      潛在轉(zhuǎn)換分析(latent transition analysis,LTA)

      LTA是潛在類別模型的縱向擴(kuò)展,模型中含有兩個(gè)或以上的潛在分類變量,容許觀測(cè)隨著時(shí)間的變化在兩個(gè)分類的潛在類別變量的類別間轉(zhuǎn)換,見(jiàn)圖6,C1為t時(shí)間點(diǎn)的潛在分類,C2為t+1時(shí)間點(diǎn)的潛在分類變量。在LTA中亞組稱為“潛在的狀態(tài)”(latent statuses),模型中有三種參數(shù)被估計(jì):(1)在不同的時(shí)間點(diǎn),觀測(cè)屬于某一個(gè)亞類的概率;(2)轉(zhuǎn)換概率:觀測(cè)從t時(shí)間點(diǎn)時(shí)的狀態(tài)轉(zhuǎn)為t+1時(shí)間點(diǎn)時(shí)另一個(gè)狀態(tài)的概率;(3)項(xiàng)目反應(yīng)概率:類似因子分析中的因子載荷。LTA可以進(jìn)行多組分析,其擴(kuò)展模型可以包含協(xié)變量和結(jié)局變量,對(duì)模型的詳細(xì)描述見(jiàn)相關(guān)文獻(xiàn)[20]。

      圖6 LTA示意圖

      上述含有分類潛變量的模型都可看成有限混合模型的亞類,目前有限混合模型是探索研究總體中是否存在不可見(jiàn)異質(zhì)性的廣泛使用的數(shù)據(jù)分析技術(shù),其主要作用是找到有相似反應(yīng)模式或增長(zhǎng)軌跡的有意義亞組。LCA、LPA、FMM和SEMM屬于橫斷面混合模型,GMM、LTA屬于縱向混合模型,LPA和LCA僅包含一個(gè)分類潛變量,而FMM、GMM則包含一個(gè)分類潛變量和一個(gè)或多個(gè)連續(xù)型的潛變量,見(jiàn)表1。

      表1 常見(jiàn)的混合模型特點(diǎn)

      以上模型的參數(shù)估計(jì)方法有多種,常用的有EM算法和牛頓—拉普森法,其中EM算法目前被廣泛地應(yīng)用,其優(yōu)點(diǎn)是不受初始值選擇的影響,具有穩(wěn)健性,缺點(diǎn)是迭代次數(shù)較多,且不提供標(biāo)準(zhǔn)誤的估計(jì)。Ver-munt建議將EM和NR算法結(jié)合使用,這樣同時(shí)兼顧了EM算法的穩(wěn)健性和NR算法速度快的優(yōu)點(diǎn)?;旌戏植冀?jīng)常存在多個(gè)局部最大值,當(dāng)潛在亞類比較多時(shí),往往會(huì)遇到不收斂的問(wèn)題,可以重復(fù)多個(gè)隨機(jī)的初始值。Monte Carlo模擬研究也表明樣本量、參數(shù)個(gè)數(shù)、潛在類的分離程度等都對(duì)模型的擬合結(jié)果有影響。

      混合模型應(yīng)用中最關(guān)鍵的問(wèn)題是解決如何確定研究總體中包含的不可觀測(cè)的亞組數(shù),即是否真的存在潛在的類別,Bauer等警告亞組的存在可能僅僅是因?yàn)閿?shù)據(jù)呈偏態(tài)或非正態(tài)分布導(dǎo)致,每一個(gè)亞組并沒(méi)有實(shí)際意義,可能會(huì)產(chǎn)生過(guò)度提取亞類的情況[21]。潛在類別數(shù)的確定對(duì)于結(jié)果解釋和統(tǒng)計(jì)推斷至關(guān)重要,一般采用AIC、BIC、aBIC等信息統(tǒng)計(jì)量指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià),許多模擬研究表明BIC是比較好的模型選擇指標(biāo)(BIC取值越小表明所選模型較優(yōu))。2001年Lo,Mendell,Rubin等學(xué)者提出了基于似然比為基礎(chǔ)的比較類和類模型的Lo-Mendell-Rubin似然比檢驗(yàn)(LMR LRT),值小表明含類的模型較優(yōu)。2002年Muthen等人提出SK檢驗(yàn)(skewness and kurtosis test)作為L(zhǎng)MR LRT的一個(gè)補(bǔ)充。Bootstrap似然比檢驗(yàn)(BLRT)也是目前用的比較多的一個(gè)方法,值小表明含類的模型較優(yōu)。模型的分類質(zhì)量可通過(guò)熵(Entropy)進(jìn)行評(píng)價(jià),取值在0到1之間,越接近1表明分類越明確。模型的選擇同時(shí)要結(jié)合理論知識(shí)、前人的研究結(jié)果及其它的輔助信息,最終的目的是選擇最佳模型,捕捉到有實(shí)際意義的亞組。

      近年來(lái)由于計(jì)算機(jī)技術(shù)的快速發(fā)展,分類潛變量模型的應(yīng)用變得越來(lái)越廣泛,但目前國(guó)內(nèi)使用FMM、GMM等分類潛變量模型探討數(shù)據(jù)異質(zhì)性的應(yīng)用尚未見(jiàn)報(bào)道,本文旨在通過(guò)對(duì)該類方法的介紹推動(dòng)其在實(shí)際數(shù)據(jù)分析中的應(yīng)用,為分類潛變量方法在研究工作中的正確選擇和應(yīng)用提供有意義的參考和指引。

      [1]M cLachlan GJ,Chang SU.M ixture modelling for cluster analysis.Stat Methods Med Res,2004,13(5):347-361.

      [2]Muthen B,Brown CH,Masyn K,et al,General grow th m ixturemodeling for random ized preventive interventions.Biostatistics,2002,3(4):459-475.

      [3]Magidson J,Vermunt JK.Latent classmodels for clustering:A comparison with K-means.Canadian Journal of Marketing Research,2002,20(1):36-43.

      [4]Hagenaars JA,M ccutcheon AL.Applied latent class analysis.New York:Cambridge University Press,2002:56-213.

      [5]Muthen B.Statistical and substantive checking in grow th m ixture modeling:comment on Bauer and Curran.Psychol Methods,2003,8(3):369-377.

      [6]Sutfin EL,Reboussin BA,M cCoy TP,et al.Are college student smokers really a homogeneous group?A latent class analysis of college student smokers.Nicotine Tob Res,2009,11(4):444-454.

      [7]Xian H,Scherrer JF,Madden PA,etal.Latent class typology of nicotine withdrawal:genetic contributions and association with failed smoking cessation and psychiatric disorders.Psychol Med,2005,35(3):409-419.

      [8]M clachlan G,Peel D.Finite m ixture models.New York:W iley,2000:66-345.

      [9]Schm iege SJ,Meek P,Bryan AD,et al.Latent variablem ixturemodeling:a flexible statistical approach for identifying and classifying heterogeneity.Nurs Res,2012,61(3):204-212.

      [10]Lubke GH,Muthen B.Investigating population heterogeneity with factorm ixturemodels.Psycholmethods,2005,10(1):21-39.

      [11]Muthen B.O.Beyond SEM:general latent variablemodeling.Behaviormetrika,2002,29(1),81-117.

      [12]Clark SL,Muthen B,Kaprio J,et al.Models and strategies for factor m ixture analysis:an example concerning the structure underlying psychological disorders.Struct Equ Modeling,2013,20(4):681-703.

      [13]ViroliC.Using factorm ixture analysis tomodel heterogeneity,cognitive structure,and determ inants of dementia:an application to the aging,demographics,and memory study.Stat Med,2012,31(19):2110-2122.

      [14]Lubke G,Tueller S.Evaluation of structural equation m ixturemodels parameter estimates and correct class assignment.Struct Equ Modeling,2010,17(2):156-192.

      [15]Muthén,L.K,Muthén,B.O.Mplus Version 5.0 User's Guide.Los Angeles,CA:Muthen and Muthen,2007:131-185.

      [16]Jedidi K,Japal HS,Desarbo WS.Finite-mixture structural equation models for response-based segmentation and unobserved heterogeneity.Marketing Science,1997,16(1):39-59.

      [17]Muthen B,Muthen LK.Integrating person-centered and variable-centered analyses:grow th m ixture modeling with latent trajectory classes.Alcohol Clin Exp Res,2000,24(6):882-891.

      [18]Ram N,Grimm KJ.Grow th mixturemodeling:a method for identifying differencesin longitudinal change among unobserved groups.Int JBehav Dev,2009,33(6):565-576.

      [19]Walsh JL,Senn TE,Scott-Sheldon Lori AJ,et al.Using grow th mixturemodeling to identify heterosexualmen who reduce their frequency of unprotected sex following a behavioral intervention.AIDS Behav,2012,16(6):1501-1510.

      [20]Lanza1 ST,Patrick ME,Maggs JL.Latent transition analysis:benefits of a latent variable approach tomodeling transitions in substance use.JDrug Issues,2010,40(1):93-120.

      [21]Bauer DJ,Curran PJ.The integration of continuous and discrete latent variablemodels:potential problems and promising opportunities.Psychol Methods,2004,9(1):3-29.

      (責(zé)任編輯:郭海強(qiáng))

      廣東省科技廳社會(huì)發(fā)展領(lǐng)域科技計(jì)劃項(xiàng)目(2013B021800269);國(guó)家自然科學(xué)基金(30972553)

      1.廣東藥學(xué)院公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室,廣東省分子流行病學(xué)重點(diǎn)實(shí)驗(yàn)室

      2.普瑞盛醫(yī)藥科技開(kāi)發(fā)有限公司

      3.山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室

      猜你喜歡
      亞類亞組類別
      基于Meta分析的黃酮類化合物對(duì)奶牛生產(chǎn)性能和血清免疫指標(biāo)影響的研究
      慢性阻塞性肺疾病患者膈肌移動(dòng)度分析
      基于草原綜合順序分類法的中國(guó)山地草地亞類分類研究
      槭葉鐵線蓮亞組的研究進(jìn)展
      園林科技(2021年3期)2022-01-19 03:17:32
      冠心病患者腸道菌群變化的研究 (正文見(jiàn)第45 頁(yè))
      免疫球蛋白G亞型檢測(cè)在小兒反復(fù)呼吸道感染中的應(yīng)用
      服務(wù)類別
      Evaluation of antidepressant polypharmacy and other interventions for treatment-resistant depression
      論類別股東會(huì)
      商事法論集(2014年1期)2014-06-27 01:20:42
      系統(tǒng)性硬化癥患者血清IgG亞類特點(diǎn)
      秀山| 信宜市| 吉林省| 彭泽县| 新和县| 新昌县| 丘北县| 安岳县| 师宗县| 岢岚县| 休宁县| 鄂尔多斯市| 宣恩县| 陇南市| 万荣县| 拉孜县| 阿拉尔市| 平泉县| 四平市| 临湘市| 伊春市| 黄山市| 绥宁县| 陵川县| 南阳市| 石城县| 临高县| 海宁市| 桦甸市| 如皋市| 新密市| 昆山市| 顺昌县| 静宁县| 达日县| 翁源县| 壤塘县| 安溪县| 吉安市| 临朐县| 会东县|