康 敏,王齊艷,蒲楊梅,丁 立,鄒雪瑾
(四川省婦幼保健院放射科,四川 成都 610042)
兒科臨床中,骨齡與生活年齡的差異對于診斷、治療及監(jiān)測兒童內分泌以及生長紊亂等疾病均有重要意義。目前臨床廣泛應用的骨齡評測方法為圖譜法和計分法。圖譜法簡單、便捷,以手腕部整體作為骨齡評測依據(jù),但某些疾病對兒童手腕部不同類型骨骼有不同影響[1]。計分法(如Tanner Whitehouse Ⅲ法,簡稱TW3法)分為掌指骨骨齡評分法、腕骨骨齡評分法。已有文獻[2-5]報道基于掌指骨骨齡的人工智能(artificial intelligence, AI)骨齡評測,但對于腕骨骨齡卻鮮有涉及,而后者對于診斷兒童性早熟、肥胖、生產(chǎn)緩慢等生長異常均有重要價值[6]。本研究探討AI系統(tǒng)評測兒童腕骨骨齡的可行性。
1.1 一般資料 回顧性分析2013年12月—2019年3月于我院接受骨齡分析的4 656份兒童左手骨齡片資料。納入標準:①包含左手掌骨、腕骨及尺橈骨遠側骨干3~4 cm正位數(shù)字化X線攝影(digital radiography, DR)片;②手部位置擺放正確,無骨骺缺失。排除標準:①嚴重骨畸形;②拍攝位置不佳;③年齡≥14歲。隨機抽取130幅1~13歲兒童骨齡片,每個年齡段10份,共130名兒童,男52名、女78名。
1.2 儀器與方法 采用GMM Hiris Rf43 X線機,按下列要求拍攝左手后前位X線片:①左手掌緊貼平板,五指自然分開,拇指與食指約呈30°,中指與橈尺骨中軸在一條直線上;②完全顯示腕部,橈骨及尺骨遠端顯示至少3 cm。將骨齡片以DICOM格式存儲于PACS系統(tǒng)。
1.3 骨齡評測方法
1.3.1 骨齡參考標準確定 招募接受過中華05系統(tǒng)培訓的3名中高年資放射科醫(yī)師(其中1名為主任醫(yī)師,1名為副主任醫(yī)師,1名為醫(yī)師),對左手骨齡片采用TW3-C腕骨評測方法,以軟讀片方式按照雙盲原則進行評測,取3名醫(yī)師評測結果的均值作為最終參考標準[7-8],并記錄評測時間。
1.3.2 AI評測骨齡 采用Dr.Wise AI骨齡評測系統(tǒng)(即Dr. Wise骨齡和生長發(fā)育預測軟件0531beta,http://label.deepwise.com,圖1,包括開源深度學習框架Pytorch 1.0及英偉達Titan Xp硬件平臺GPU)分析DICOM骨齡片,同時評測骨齡,記錄評測時間。
圖1 Dr. Wise AI骨齡評測系統(tǒng)
1.3.3 低年資醫(yī)師評測骨齡 選取3名經(jīng)中華05系統(tǒng)培訓、工作年限<3年的放射科醫(yī)師(分別設定為醫(yī)師1、醫(yī)師2、醫(yī)師3)按照雙盲原則分別獨立評測130名兒童7塊腕骨的發(fā)育等級,然后使用腕骨骨齡計算器(Dr.Wise骨齡和生長發(fā)育預測軟件)計算腕骨骨齡,記錄評測時間。
1.4 統(tǒng)計學分析 采用SPSS 17.0統(tǒng)計分析軟件。計算AI系統(tǒng)(以下簡稱模型)及低年資放射科醫(yī)師(以下簡稱醫(yī)師)與參考標準之間腕骨骨齡和腕骨成熟度分值(由各腕骨發(fā)育等級查TW3表得到各腕骨成熟度分值之后求和)的均方根誤差(root mean squared error, RMSE)及平均絕對誤差(mean absolute error, MAE)[9-10]。采用組內相關系數(shù)(intraclass correlation coefficient,ICC)評價模型與醫(yī)師評測骨齡結果的一致性,以配對t檢驗比較二者MAE,F(xiàn)檢驗比較二者之間RMSE。P<0.05為差異有統(tǒng)計學意義。
2.1 模型、醫(yī)師與參考標準間腕骨骨齡MAE、RMSE比較 模型與醫(yī)師1、2的MAE、RMSE差異均有統(tǒng)計學意義(P均<0.05),與醫(yī)師3的MAE、RMSE差異無統(tǒng)計學意義(P均>0.05)。見表1。
表1 模型、醫(yī)師與參考標準之間腕骨骨齡的MAE、RMSE比較
表2 模型、醫(yī)師與參考標準之間腕骨成熟度分值的MAE、RMSE比較
2.2 模型、醫(yī)師與參考標準之間腕骨成熟度分值的MAE、RMSE比較 模型與醫(yī)師1的MAE、RMSE差異均有統(tǒng)計學意義(P均<0.05),與醫(yī)師2、3的MAE、RMSE差異均無統(tǒng)計學意義(P均>0.05)。見表2。
2.3 不同年齡段評測結果 除1~3歲外,隨年齡增加,模型、醫(yī)師與參考標準間評測結果的MAE、RMSE均上升,但上升幅度模型低于醫(yī)師。見表3、圖2。
2.4 結果一致性模型與參考標準 間腕骨骨齡評測結果的ICC=0.997,95%CI(0.996,0.998);醫(yī)師1與參考標準之間ICC=0.994,95%CI(0.992,0.996);醫(yī)師2與參考標準之間ICC=0.996,95%CI(0.995,0.997);醫(yī)師3與參考標準之間ICC=0.997,95%CI(0.996,0.998)。
圖2 模型、醫(yī)師及參考標準對不同年齡段兒童腕骨骨齡測評結果
圖3 腕骨未重疊區(qū)域(左)重疊區(qū)域(右)
2.5 評測速度 模型測評腕骨骨齡用時(0.33±0.14)s,低年資醫(yī)師1、2、3分別用時(1.86±0.81)min、(2.70±1.19)min、(2.07±1.30)min;參考標準中,3位高年資醫(yī)師分別用時(2.76±1.54)min、(2.98±1.30)min、(1.61±0.77)min,AI模型測評速度均高于醫(yī)師(P均<0.001)。
評估腕骨骨齡主要依據(jù)頭狀骨、鉤骨、三角骨、月骨、舟骨和大、小多角骨等7枚腕骨骨骺的形態(tài)變化和關節(jié)面形成過程。腕骨早期發(fā)育階段在X線片上表現(xiàn)為密集的點,隨發(fā)育而不斷增大,最后增長至最佳大
表3 模型、醫(yī)師對不同年齡段兒童腕骨骨齡測評結果與參考標準間MAE、RMSE
小和特定形狀[11-12]。與長骨發(fā)育不同,腕骨在青春期之前發(fā)育較快,男孩在13歲左右、女孩在11歲左右腕骨骨齡已經(jīng)接近成熟。由于腕骨分期的個體差異較大,有學者[11]建議不宜采用腕骨評測兒童骨齡,尤其對年齡稍大的兒童,應使用長骨;但相對于手腕部長短管狀骨,腕骨生長發(fā)育對性激素的敏感性稍差,結合長骨骨齡的變化有助于早期診斷性早熟[1]。既往研究[13]表明,單純性生長激素分泌不足兒童骨成熟延遲,而腕骨延遲程度較長骨更嚴重,故評測腕骨骨齡對診斷及治療肥胖和生長遲緩等常見生長異常具有重要意義。男孩7歲左右、女孩5歲左右,7枚腕骨會出現(xiàn)重疊(圖3)。由于腕骨大小、形狀和方向均存在多樣性,加之軟組織不均勻性、骨結構與軟組織對比度較低等因素,自動識別和分割骨邊界極具挑戰(zhàn)。多數(shù)自動骨齡評測系統(tǒng)通過識別腕骨區(qū)域再提取特征來評測骨齡,但因不能準確識別出重疊區(qū)域的腕骨而影響最終評測結果,受主客觀因素影響大[14],且常比人工評測骨齡更為耗時[15]。
本研究發(fā)現(xiàn)采用AI骨齡評測系統(tǒng)可準確劃分不同腕骨(包括重疊部分),進而準確評測腕骨骨齡;AI與參考標準之間腕骨骨齡和腕骨成熟度分值的MAE、RMSE均低于對照醫(yī)師,且AI與醫(yī)師1之間差異有統(tǒng)計學意義,與醫(yī)師2、3間差異無統(tǒng)計學意義(表1、2)。在與參考標準的一致性方面,AI的一致性高于對照醫(yī)師1、醫(yī)師2,與醫(yī)師3相同。對不同年齡段腕骨骨齡的評測結果顯示,對3歲以前兒童,由于訓練數(shù)據(jù)有限以及TW3-C腕骨特征跨度較大,模型和醫(yī)師的骨齡評測誤差均較大;之后,隨兒童年齡增加,AI評測誤差與對照醫(yī)師評測誤差均上升,但AI誤差上升幅度低于醫(yī)師(表3),提示隨兒童年齡增加,AI骨齡評測系更趨準確,優(yōu)勢更加明顯。
骨齡評測繁瑣、耗時,腕骨骨齡評測的基本過程包括評定7塊腕骨發(fā)育等級,以及根據(jù)中華05標準圖表查詢對應分值和腕骨骨齡。臨床上可以通過骨齡計算器自動實現(xiàn)查詢對應分值和腕骨骨齡,而評定腕骨發(fā)育等級常需要醫(yī)師人工完成。本研究采用AI系統(tǒng)實現(xiàn)了全自動化骨齡評測,評測腕骨骨齡僅需時(0.33±0.14)s,顯著低于高年資醫(yī)師和低年資醫(yī)師。
本研究的不足:僅針對四川地區(qū)兒童,腕骨骨齡數(shù)據(jù)來源地域單一,拍攝左手骨齡DR片機型單一,樣本量小,且為回顧性研究。
綜上所述,AI骨齡評測系統(tǒng)能夠準確、快速評測兒童TW3-C腕骨骨齡,有待擴大樣本量、進行前瞻性分析以進一步觀察。