王一飛,吳琰婷,黃荷鳳1,
1.上海交通大學(xué)醫(yī)學(xué)院附屬國際和平婦幼保健院婦產(chǎn)科,上海200030;2.上海市胚胎源性疾病重點實驗室,上海200030;3.復(fù)旦大學(xué)附屬婦產(chǎn)科醫(yī)院生殖與發(fā)育研究院,上海200021
胎兒宮內(nèi)生長發(fā)育的評估和出生體質(zhì)量的預(yù)測是圍產(chǎn)醫(yī)學(xué)中一個非常重要的問題。對預(yù)測為低出生體質(zhì)量兒(出生體質(zhì)量<2 500 g)來說,正確估測胎兒估計體質(zhì)量(estimated fetal weight,EFW)有助于醫(yī)師評估胎兒是否存在宮內(nèi)發(fā)育遲緩(intrauterine growth retardation,IUGR),并及時進行處理,計劃分娩時間和方式。而對于巨大兒(出生體質(zhì)量≥4 000 g)來說,分娩時母嬰風(fēng)險均相對較高,可能出現(xiàn)如第二產(chǎn)程延長、胎兒宮內(nèi)窘迫、產(chǎn)傷、肩難產(chǎn)、臂叢神經(jīng)損傷、產(chǎn)后出血等問題[1-3];故而降低估測EFW 的誤差能夠幫助減少母嬰不良預(yù)后[4],并在出現(xiàn)可疑巨大兒、頭盆不稱等情況時,幫助醫(yī)師決定分娩方式[5]。目前對EFW 的評估依然缺乏非常準(zhǔn)確、便捷的手段和方法,在此領(lǐng)域不斷有新的研究和報道。本文對國內(nèi)外多種估測EFW 方法的準(zhǔn)確性、易用性和研究進展進行綜述。
不同文獻報道中評估EFW 誤差的方法不同,以下僅列舉幾種常用的評估預(yù)測準(zhǔn)確程度的參數(shù)及其優(yōu)劣。
平均百分比誤差(mean percentage error,MPE)是先計算百分比誤差,即每個個體實際出生體質(zhì)量(actual birth weight,ABW)減去EFW 得到的差值(有正負)占ABW 的百分比,再計算百分比誤差的平均值及標(biāo)準(zhǔn)差。此參數(shù)在比較同一公式或方法在不同胎兒體質(zhì)量組中的準(zhǔn)確率有一定意義[6]。但僅比較MPE 的平均值不能體現(xiàn)誤差的大小,只能夠顯示預(yù)測值是否有偏倚,必須與標(biāo)準(zhǔn)差結(jié)合進行比較。
平均絕對百分比誤差(mean absolute percentage error,MAPE)是指計算百分比誤差取絕對值,并求其平均值及標(biāo)準(zhǔn)差[7]。MAPE 較MPE 可更準(zhǔn)確地評估誤差的大小,但不能體現(xiàn)預(yù)測的傾向性即偏倚。
有部分研究者直接計算ABW 與EFW 的差值后取絕對值,并計算平均值及標(biāo)準(zhǔn)差,即為平均絕對誤差(mean absolute error,MAE)。MAE 的平均值和標(biāo)準(zhǔn)差均以g 為單位,與原始數(shù)據(jù)量綱一致,便于直接進行比較[8]。
均方根誤差(root mean square error,RMSE)是回歸分析中常用的評價指標(biāo),在使用回歸分析等方法的研究中常出現(xiàn),可準(zhǔn)確評估誤差大?。?-9]。RMSE 是計算每個個體ABW 與EFW 差值的平方和,再除以個體的數(shù)量。其量綱與原始數(shù)據(jù)相同,便于直接比較,但不能顯示預(yù)測的傾向性。
在婦產(chǎn)科學(xué)的傳統(tǒng)標(biāo)準(zhǔn)上,將EFW 與ABW 差值在±250 g 以內(nèi)的預(yù)測作為準(zhǔn)確的預(yù)測,將準(zhǔn)確預(yù)測的樣本數(shù)除以總體數(shù)計算預(yù)測符合率[10]。也有研究者將EFW 與ABW之間百分比誤差不超過10%的作為預(yù)測符合率。
使用孕婦參數(shù)估計胎兒體質(zhì)量的主要測量指標(biāo)包括宮 高 (fundal height, FH)、 孕 婦 腹 圍 (maternal abdominal circumference,mAC),預(yù)測準(zhǔn)確率取決于醫(yī)師的經(jīng)驗和測量的規(guī)范性。評估胎方位及胎頭下降的程度對矯正公式也有重要作用。
Johnson 公式[9]是使用孕婦參數(shù)估計EFW 較常用的公式,適用于單胎頭位胎兒。公式為:EFW=(FH?n)×155 (n=12,胎頭高于坐骨棘;n=11,胎頭不高于坐骨棘)。
Numprasert 等[11]報道的Johnson 公式的預(yù)測符合率(誤差不超過10%為符合)為71.5%(n=400)。其他簡便公式還包括:EFW=(FH×mAC)+500[12];EFW=FH×100[13];EFW=FH×mAC×1.076[14]等。三者報道[10]的預(yù)測符合率(誤差不超過250 g 為符合)分別為52.20%、54.70%、65.90%。
Mgbafulu 等[15]的 研 究 表 明,使 用 孕 婦 參 數(shù) 的Johnson 公式的預(yù)測符合率較超聲方法有明顯的差距,且常常傾向高估胎兒體質(zhì)量。誤差主要的來源是難以保證測量方法的一致性和準(zhǔn)確性,以及在肥胖、羊水過多等病理狀態(tài)下產(chǎn)生的系統(tǒng)誤差。但在沒有條件進行常規(guī)產(chǎn)前超聲檢查的地區(qū),以及緊急時難以進行超聲檢查等情況下,仍可被用于判斷胎兒是否有巨大兒的風(fēng)險。
超聲檢查測量的胎體參數(shù)較產(chǎn)前檢查醫(yī)師體檢測量的更為精確,影響因素也更少,且超聲檢查所需時間短,方法無創(chuàng)、無放射性,簡便經(jīng)濟,因此成為目前應(yīng)用最為廣泛的評估EFW 的方法。超聲檢查計算EFW 的方法通常是先測量樣本胎兒的多個參數(shù),將數(shù)據(jù)進行回歸分析并建立經(jīng)驗公式,在應(yīng)用時則直接將測量數(shù)據(jù)帶入經(jīng)驗公式即可。最常應(yīng)用的參數(shù)是雙頂徑(biparietal diameter,BPD)、頭圍(head circumference,HC)、胎兒腹 圍(fetal abdominal circumference,fAC) 和 股 骨 長(femur length,F(xiàn)L)。最常用的經(jīng)驗公式是Hadlock 公式[16]和Warsof 公 式[17]以 及 根 據(jù)Warsof 公 式 改 良 的Shepard公式[18]。大多數(shù)超聲設(shè)備均內(nèi)置這些公式,測量出指標(biāo)后可自動進行EFW的計算。
2018年Hammami等[19]在5 163名嬰兒群體中對上述公式進行了驗證,結(jié)果表明幾種Hadlock公式的MAPE差別不大,平均值在6.3%~7.3%之間,標(biāo)準(zhǔn)差均在5%左右,預(yù)測符合率(<10%為符合)為73.3%~79.9%;而Shepard 公式的MAPE 為(9.8±7.6)%,預(yù)測符合率僅為58.6%。Dudley 等[6]進行的一項系統(tǒng)評價也表明,在正常體質(zhì)量胎兒群體中,Hadlock 公式計算EFW 的MPE 在大多數(shù)研究中較穩(wěn)定,平均值均在±3%范圍內(nèi),與幾種Hadlock 公式使用了BPD(或HC)、fAC、FL 3 個參數(shù)估計有關(guān);僅在Sabbagha 等[20]的研究中為-6.7%,但標(biāo)準(zhǔn)差與其他方法區(qū)別不大。Shepard 公式及Warsof 公式在不同研究中的MPE 變化較大,可能是與這2 個公式多使用BPD和fAC 2個參數(shù)進行估計,在不同樣本群體中發(fā)生了偏倚。另外,孕晚期胎頭位置低,且胎頭入盆后發(fā)生變形,難以準(zhǔn)確測量BPD、HC 的切面,因此可能僅使用fAC、FL 的Hadlock公式能更準(zhǔn)確地估計孕晚期的胎兒體質(zhì)量。同時,系統(tǒng)評價[6]也表明,多種計算EFW 的方法隨機誤差均較大,約±10%,主要與測量者的隨機誤差有關(guān);有經(jīng)驗的超聲醫(yī)師、多次測量、提高超聲圖像質(zhì)量可以減小這方面誤差。
在低出生體質(zhì)量兒或小于胎齡兒中,大多數(shù)公式傾向于高估胎兒體質(zhì)量。在低出生體質(zhì)量兒的研究中,Hadlock 公式的穩(wěn)定性較差,MPE 平均值在-3%~10%之間,標(biāo)準(zhǔn)差多大于10%。而Sabbagha等[20]的方法在低出生體質(zhì)量兒或小于胎齡兒中表現(xiàn)最好;在使用此方法的Robson 等[21]和Jouannic 等[22]的研究中,MPE 分 別為(1.7±8.1)%和(2.8±9.1)%。
在巨大兒或大于胎齡兒中,Hadlock 公式等對EFW大多傾向于低估[6]。因此,相較于傳統(tǒng)的未調(diào)整的公式,根據(jù)預(yù)產(chǎn)期、妊娠女性的體質(zhì)量、身高和是否合并糖尿病等指標(biāo)進行調(diào)整后的Hadlock公式,在診斷巨大兒方面具有更好的敏感度;在95%特異度時將診斷巨大兒的敏感度從71.4%提高到85.7%[23]。同樣,Hart 等[24]的研究也表明,將妊娠女性體質(zhì)量作為一個單獨變量對巨大兒群體的EFW 公式進行調(diào)整,可提高預(yù)測的準(zhǔn)確性,MAPE為3.69%。
目前,根據(jù)胎兒超聲參數(shù)計算的EFW 因操作簡便,標(biāo)準(zhǔn)明確,在臨床應(yīng)用最為廣泛,但MAPE 仍在6.5%~10%,和臨床需求仍有一定差距;且多在正常體質(zhì)量胎兒群體中表現(xiàn)較好,而在大于和小于胎齡兒中誤差相對較大。因此,需要進一步增加測量的準(zhǔn)確性,減小隨機誤差,或增加更多的參數(shù)對公式進行調(diào)整和修正。
超聲測量主要通過胎兒的各項長度指標(biāo)計算EFW,忽略了胎兒各組織的密度差異。脂肪組織的密度較其他組織低,因而在脂肪組織較多的胎兒中,常規(guī)的超聲方法可能會高估胎兒體質(zhì)量。評估胎兒皮下脂肪厚度,可能有助于更準(zhǔn)確地估計EFW,鑒別正常及異常胎兒。研究[25]表明,在妊娠期糖尿病產(chǎn)婦的新生兒中,產(chǎn)前體質(zhì)量被高估的新生兒(n=22)與體質(zhì)量被低估的新生兒(n=8)相比,新生兒皮褶厚度、脂肪含量等均更高。盡管如此,在比較使用軟組織測量值與超聲測量值計算EFW 在診斷巨大兒的研究中,軟組織測量組并未獲得曲線下面積(area under the curve,AUC)更大的受試者操作特征(receiver operating characteristic,ROC)曲線[26]。因此,也有研究者[19]認為,胎兒組織脂肪含量增加5%,胎兒總體密度變化僅有0.5%,不足以引起EFW 較大的改變。但EFW 的變化也可能與胎兒四肢部的脂肪累積關(guān)系更大,三維超聲對胎兒四肢體積的精確測量可能有助于減少EFW的誤差[27]。
除了胎兒皮下脂肪外,還有一些參數(shù),如母親孕期增重(gestational weight gain,GWG)[28]、臍帶橫截面積[29]、羊水指數(shù)(amniotic fluid index,AFI)[30-31]、胎盤質(zhì)量[32]等均被認為可能與胎兒體質(zhì)量有很大的相關(guān)性。研究[28]表明,新生兒出生體質(zhì)量隨著GWG 的增加而增加(β=24.17±2.28,P<0.000 1)。臍帶橫截面積較大的胎兒中巨大兒比例顯著增高(54.7% vs 8.7%,P<0.000 1),以臍帶橫截面積預(yù)測巨大兒的敏感度為51.4%,特異度為91.3%[29]。孕晚期AFI百分位數(shù)在嚴重巨大兒組中也發(fā)生顯著增高[(72.4±22.5)vs(53.5±19.6);P<0.000 1)],以AFI 百分位數(shù)診斷巨大兒的ROC 曲線的AUC 為0.76,以AFI 百分位數(shù)>60%為截斷點效果最好,敏感度為74%,特異度為62%[30]。將新生兒按胎盤質(zhì)量進行分組,胎盤質(zhì)量過輕組出生體質(zhì)量較正常組低,胎盤質(zhì)量過重組則相反;Logistic 回歸分析結(jié)果顯示,胎盤質(zhì)量每增長92.0 g,導(dǎo)致巨大兒出生的風(fēng)險增加36%,而低體質(zhì)量兒的出生風(fēng)險則降低42%[32]。
使用以上指標(biāo)對利用常規(guī)超聲參數(shù)計算EFW 的公式進行調(diào)整,可能有助于更準(zhǔn)確地預(yù)測胎兒體質(zhì)量,但具體方法有待于進一步的研究證實。
使用超聲影像學(xué)估測胎兒體質(zhì)量的方法,是用二維物體參數(shù)對胎兒這個三維物體進行評估。胎兒身體各部位的不均勻生長可能對EFW 結(jié)果造成影響,而三維超聲技術(shù)的出現(xiàn),使我們可以更好地對胎兒的體積進行測量,對胎兒軟組織進行更準(zhǔn)確的分析。然而,驗證性研究[33]顯示,三維超聲預(yù)測出生體質(zhì)量的誤差并未明顯優(yōu)于二維超聲,但三維超聲的預(yù)測符合率較高。
將三維體積測量值(雙上臂、大腿及腹部的體積)和二維測量值BPD 進行聯(lián)合計算可能有助于改善EFW 的準(zhǔn)確性[34]。該方法計算出的EFW 的MAPE 為(6.1±5.00)%,而單純進行二維測量以Hadlock 公式計算EFW的MAPE為(7.5±5.53)%(n=65)[35]。
核磁共振成像(magnetic resonance imaging,MRI)是最準(zhǔn)確地估算胎兒體積的影像學(xué)方法。許多研究證實,MRI 掃描后進行回波平面成像(echo-planar imaging,EPI)并根據(jù)三維圖像計算胎兒體積(MRI-EPI 法)可以更準(zhǔn)確地預(yù)測胎兒體質(zhì)量;使用該方法計算的EFW 的MAPE 為3%[36],與實測值的相關(guān)系數(shù)r=0.95,顯著優(yōu)于超聲方法(Hadlock 公式)(r=0.77)[37]。以上研究均證明MRI-EPI 法確實能夠增加EFW 的準(zhǔn)確率,但該方法對硬件要求高,檢查時間長,費用昂貴,難以大范圍推廣應(yīng)用。
近年來,機器學(xué)習(xí)算法在語音識別、影像診斷等許多領(lǐng)域中取得了驚人的成果。人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)是一種模擬人腦神經(jīng)系統(tǒng)工作的機器學(xué)習(xí)模型,它通過在輸入層和輸出層之間建立聯(lián)系,并使用大量數(shù)據(jù)進行“訓(xùn)練”,不斷修正這些聯(lián)系的權(quán)重,最終達到系統(tǒng)的自適應(yīng)和穩(wěn)態(tài)。該方法用于計算EFW 無需經(jīng)驗公式,可以根據(jù)不同地區(qū)、人種、測量方法等進行調(diào)整,也適用于將更多可能相關(guān)的參數(shù),如母親體質(zhì)量、AFI等加入模型。
神經(jīng)網(wǎng)絡(luò)法用于計算EFW 的研究有一定歷史,最早由Farmer 等[38]使用神經(jīng)網(wǎng)絡(luò)模型計算100 例可疑巨大兒的EFW,MAPE 為4.7%,明顯優(yōu)于超聲方法的10%左右。但受限于當(dāng)時的計算能力,未進行大規(guī)模的驗證。
一 項 研 究[39]使 用BPD、枕 額 徑(occipitofrontal diameter,OFD)、fAC、FL、胎齡(gestational age,GA)及胎位(fetal position,F(xiàn)P)6 項參數(shù)輸入訓(xùn)練模型,訓(xùn)練組991 例,驗證組362 例,結(jié)果顯示MAPE 為6.15%,優(yōu)于傳統(tǒng)方法的7.50%。然而,當(dāng)體質(zhì)量小于2 500 g 或大于4 000 g時,該模型的準(zhǔn)確度下降[39],這可能是由于訓(xùn)練組樣本中巨大兒和低體質(zhì)量兒比例偏低所致。
李昆等[40]嘗試使用深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,DNN)構(gòu)建胎兒體質(zhì)量預(yù)測模型,結(jié)果顯示,DNN 模型對預(yù)測符合率提高不大,為57.94%(Hadlock公式法為57.48%)。朱海龍等[41]則利用孕婦產(chǎn)檢數(shù)據(jù),首先建立連續(xù)的體質(zhì)量變化模型,然后使用遺傳算法(genetic algorithm,GA)優(yōu)化神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,建立EFW 預(yù)測模型;研究結(jié)果表明,該方法將MAPE 從7.69%減少到5.95%,預(yù)測符合率由62.0%提高到75.9%,而且加快了模型的收斂。
機器學(xué)習(xí)算法理論上可以擬合任意非線性函數(shù),一方面使得對EFW 的計算更加精細,另一方面也很容易發(fā)生過擬合。并且其所建立的模型可能僅在樣本空間效果較好,但較傳統(tǒng)公式可推廣性差,需要進一步交叉驗證及外部驗證。
綜上,本文匯總了計算EFW 的代表性方法及相關(guān)文獻報道。目前國內(nèi)外臨床應(yīng)用較廣泛的方法是使用超聲測量胎體參數(shù)的Hadlock公式,對指導(dǎo)產(chǎn)科臨床工作有一定參考價值,但仍不及有經(jīng)驗的產(chǎn)科醫(yī)師進行的評估。減小EFW 的誤差、提高預(yù)測符合率的方法可能包括:探索減小測量誤差的更簡便、可操作性更強的方法;增加更多相關(guān)參數(shù)對現(xiàn)有的EFW 公式進行調(diào)整;使用新的三維超聲及MRI 等技術(shù)對胎兒的體積進行估計;用新的統(tǒng)計學(xué)算法建立EFW 模型等。更為精確的計算EFW 的方法能夠有效提高診斷IUGR及巨大兒的準(zhǔn)確度,對選擇分娩方式、減少產(chǎn)時并發(fā)癥、提高圍產(chǎn)兒存活率均具有重要的意義,對產(chǎn)科醫(yī)師的工作及患者產(chǎn)前的自我評估有較大的價值。