底錦熙,陳振賀,李曉東,李 潔,鐘定榮*,曹 磊
(1.中日友好醫(yī)院 病理科,北京 100029;2.島津企業(yè)管理中國(guó)有限公司 中國(guó)創(chuàng)新中心,北京 100020)
隨著超聲檢測(cè)技術(shù)的普及,甲狀腺結(jié)節(jié)檢出率越來(lái)越高。為明確結(jié)節(jié)的良惡性,行進(jìn)一步甲狀腺細(xì)針穿刺檢查的病例中,惡性腫瘤的診斷率約4%~8%,其中甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)為主要類型[3],約占所有甲狀腺惡性腫瘤的80%[1,2]。傳統(tǒng)的細(xì)胞學(xué)診斷方法為金標(biāo)準(zhǔn),但耗時(shí)耗力。2020年西湖大學(xué)的研究人員基于蛋白質(zhì)組學(xué)和人工智能技術(shù),發(fā)現(xiàn)了甲狀腺癌的分子標(biāo)記物,可用于甲狀腺結(jié)節(jié)組織樣本的快速診斷,臨床應(yīng)用準(zhǔn)確率達(dá)到了90%以上[4]。PTC 組織存在很多特異性的代謝物[5,6]。課題組提出了采用探針電噴霧離子化質(zhì)譜測(cè)量特征代謝物的離子強(qiáng)度,基于人工智能技術(shù)快速診斷PTC的技術(shù)方案。該方案尚未見(jiàn)任何文獻(xiàn)報(bào)道。
本研究以細(xì)胞病理診斷過(guò)程中產(chǎn)生的廢液作為樣本,該廢液包含一定濃度的特征代謝物,經(jīng)簡(jiǎn)單的處理后,應(yīng)用探針電噴霧離子化質(zhì)譜進(jìn)行分析,獲得特征代謝物的離子強(qiáng)度?;诩?xì)胞病理診斷結(jié)果,采用支持向量機(jī)建立分類器,然后用于未知樣本的良惡性的判定。
探針電噴霧離子化質(zhì)譜儀(DPiMS-8060,島津,日本)。BD保存液(畢迪醫(yī)療器械上海有限公司,批號(hào)491336);甲酸(Dikma,批號(hào)5885877),乙醇(Fisher,色譜級(jí),批號(hào)183349),超純水(Milli-Q,18.2MΩ.cm)。
收集2020年7月~12月期間在中日友好醫(yī)院行甲狀腺細(xì)針穿刺術(shù)的樣本292 例。據(jù)甲狀腺細(xì)胞學(xué)Bethesda診斷標(biāo)準(zhǔn)[3],由經(jīng)驗(yàn)豐富的病理醫(yī)生對(duì)樣本進(jìn)行診斷。PTC 鏡下形態(tài):(1)濾泡細(xì)胞呈乳頭狀和(或)成團(tuán)片狀,單層細(xì)胞排列,漩渦狀細(xì)胞排列;(2)濾泡細(xì)胞的核特征:核增大;核呈卵圓形或不規(guī)則,有時(shí)出現(xiàn)核擁擠和重疊;縱行核溝;核內(nèi)假包涵體;染色質(zhì)粉塵狀,核淡染蒼白;可出現(xiàn)單個(gè)或多個(gè)小核仁,位于細(xì)胞核周邊[3]。良性病變鏡下形態(tài):(1)含少量或中等數(shù)量的濾泡上皮細(xì)胞。(2)膠質(zhì)豐富,稀薄的水樣膠質(zhì)常呈“薄膜樣或玻璃紙樣”外觀,或出現(xiàn)較多皺褶,產(chǎn)生“碎石小徑樣”、“雞籠鐵絲網(wǎng)樣”或“馬賽克樣”的外觀;或是稠厚膠質(zhì)的質(zhì)地透明,且常有裂隙。(3)濾泡上皮細(xì)胞主要排列成單層片狀,并在其中均勻分布(呈“蜂窩狀”結(jié)構(gòu))[3]。剔除可疑及診斷不一致的病例,最終納入289例樣本。
PTC 和良性病例樣本各109 例用于建立分類模型。單盲測(cè)試樣本71 例用于評(píng)價(jià)分類模型,PTC 39例、良性病例32例。其中同時(shí)行BRAF 基因突變檢測(cè)70 例,基因突變34 例、非突變36 例。有超聲診斷71例,高危38例、低危33例。
采集甲狀腺細(xì)針穿刺樣本制片過(guò)程產(chǎn)生的廢液(離心后分離的上清液)0.4ml,加入1ml 含0.35% 甲酸的乙醇水溶液。吸取10μl 放入DPiMS-8060專用液體樣品盤(pán),啟動(dòng)分析。
采用探針電噴霧質(zhì)譜儀(DPiMS-8060)對(duì)樣本進(jìn)行分析,DPiMS-8060由島津三重四級(jí)桿質(zhì)譜LCMS-8060 和探針電噴霧離子源(PESI)組成。PESI 和三重四級(jí)桿質(zhì)譜參數(shù)如下:離子源采用PESI,脫溶劑線溫度250℃,掃描模式Q3,加熱塊溫度30℃。掃描時(shí)間:正負(fù)模式各0.1min;掃描范圍:50~2000道爾頓。
PESI 取樣時(shí)間50ms。探針電壓:正模式2.3kV、負(fù)模式-3.0kV。取樣位置46.0mm,探針清洗時(shí)間:正負(fù)模式各0.05min,離子化200ms,探針采樣頻率2.78Hz。
采集細(xì)胞學(xué)診斷為PTC和良性病變的樣本各109 例混合,建立數(shù)據(jù)庫(kù)。將細(xì)胞學(xué)診斷分組的上清液樣本進(jìn)行質(zhì)譜分析,獲得特征代謝的離子強(qiáng)度?;诓±韺W(xué)診斷結(jié)果對(duì)用于模型學(xué)習(xí)的樣品進(jìn)行分組后,導(dǎo)入eMSTAT 軟件(島津,日本),采用偏最小二乘回歸分析法(PLS-DA),歸一化方法為T(mén)IC,質(zhì)譜強(qiáng)度閾值1%,m/z識(shí)別范圍:0.2Da;數(shù)值處理方法:Log10。采用支撐向量機(jī)(support vector machine,SVM)方法,邊界約束(box constraint)和核函數(shù)范圍(kernel scale)均設(shè)為自動(dòng),交叉驗(yàn)證類型:re-substitution。
比較模型預(yù)測(cè)結(jié)果與細(xì)胞病理診斷、BRAF基因突變檢測(cè)和超聲檢測(cè)的結(jié)果。用靈敏性、特異性和準(zhǔn)確率來(lái)評(píng)價(jià)模型。
eMSTAT 軟件提供2 種分組方法:PCA 和PLS-DA。圖1和圖2(見(jiàn)封底)分別為探針電噴霧離子源在PLS-DA 正模式和PCA 負(fù)模式下的分組結(jié)果??梢?jiàn),正模式下PTC 組和良性組的樣本都能更好地聚集,而負(fù)模式下PTC 組和良性組的樣本相對(duì)分散。PCA負(fù)模式不能有效區(qū)分PTC組和良性結(jié)節(jié),因此,最終采用正模式數(shù)據(jù)進(jìn)行樣品分析。
圖1 PTC(藍(lán)色點(diǎn))和良性(紅色點(diǎn))樣本的分組結(jié)果(質(zhì)譜正模式)。
圖2 PTC(藍(lán)色點(diǎn))和良性(紅色點(diǎn))樣本的分組結(jié)果(質(zhì)譜負(fù)模式)
以細(xì)胞病理診斷結(jié)果為參照,正模式質(zhì)譜條件下的特異性、靈敏度和準(zhǔn)確率為68.8%、53.8%和60.6%;負(fù)模式質(zhì)譜條件下的特異性、靈敏度和準(zhǔn)確率為62.5%、48.7%和54.9%。正模式質(zhì)譜條件下,以BRAF 基因診斷、超聲診斷作為參照,機(jī)器分類結(jié)果的準(zhǔn)確率分別為60.0%和56.9%。
超聲引導(dǎo)下細(xì)針穿刺結(jié)合細(xì)胞病理學(xué)診斷是甲狀腺結(jié)節(jié)的良惡性鑒別最常采用的方法[7,8]。在常規(guī)的診斷流程中,對(duì)懷疑甲狀腺癌的患者行穿刺術(shù),或者穿刺液直接涂片,進(jìn)行鏡下觀察;或是經(jīng)過(guò)處理后顯微鏡下觀察,處理過(guò)程通常先將穿刺液保存在合適的液基細(xì)胞保存液中,然后通過(guò)固定、離心、去上清、清洗及再離心等步驟得到干擾成分少的甲狀腺細(xì)胞液基涂片,再進(jìn)行鏡下觀察。如果仍不能確診,還需要做分子病理檢查是否存在基因突變。臨床醫(yī)生綜合所有診斷結(jié)果做出最終診斷。人工智能閱片技術(shù)可以減少病理醫(yī)生的重復(fù)勞動(dòng)。有文獻(xiàn)回顧了基于深度學(xué)習(xí)算法分析超聲圖像區(qū)分甲狀腺結(jié)節(jié)良惡性的方法[9],還有文獻(xiàn)系統(tǒng)綜述了機(jī)器學(xué)習(xí)在甲狀腺腫瘤超聲診斷、細(xì)胞學(xué)診斷中的應(yīng)用[10,11]。蛋白質(zhì)組學(xué)技術(shù)與人工智能技術(shù)結(jié)合也被用于甲狀腺結(jié)節(jié)的快速診斷。
PTC 表現(xiàn)為細(xì)胞遺傳信息、蛋白質(zhì)表達(dá)、基礎(chǔ)代謝等發(fā)生改變[12~14]。基于BRAF 基因檢測(cè)的PTC 診斷方法已經(jīng)在包括中日友好醫(yī)院等眾多醫(yī)院得到廣泛應(yīng)用[4]?;诘鞍踪|(zhì)表達(dá)的變化和機(jī)器學(xué)習(xí)技術(shù)進(jìn)行疾病診斷的方法也有報(bào)道[5]。然而,基于基礎(chǔ)代謝變化和機(jī)器學(xué)習(xí)進(jìn)行疾病診斷的研究卻鮮未見(jiàn)報(bào)道。因此,我們?cè)O(shè)計(jì)了一種快速有效的PTC 診斷新方法:采用探針電噴霧離子化質(zhì)譜儀(DPIMS)進(jìn)行樣品分析,快速獲得樣品中化合物的質(zhì)核比(m/z)和離子強(qiáng)度。通過(guò)機(jī)器學(xué)習(xí)進(jìn)行多變量分析(如PCA 和PLS-DA 等方法),獲得在PTC 和其它疾病中種類和/或離子強(qiáng)度不同的化合物,并采用這些化合物去訓(xùn)練分類器,從而預(yù)測(cè)未知樣本的良惡性。細(xì)針穿刺診斷過(guò)程中產(chǎn)生的廢液(甲狀腺穿刺細(xì)胞保存液離心后的上清液)中含有少量的代謝物為癌細(xì)胞的特征代謝物。為驗(yàn)證上述方案的可行性,采集了這些上清液作為實(shí)驗(yàn)樣品。但是樣本中的代謝物濃度非常低,影響了質(zhì)譜檢測(cè)的準(zhǔn)確性和重復(fù)性,最終導(dǎo)致模型預(yù)測(cè)的準(zhǔn)確率低,不能應(yīng)用于臨床。從方法驗(yàn)證的角度,準(zhǔn)確率為60.6%,對(duì)后續(xù)研究具有顯著的指導(dǎo)意義。
基于特征代謝物在質(zhì)譜上的離子強(qiáng)度和機(jī)器學(xué)習(xí)構(gòu)建的分類器,能夠?qū)TC 和良性樣本進(jìn)行區(qū)分,但是準(zhǔn)確率較低,可能存在以下原因:(1)入組樣本的精細(xì)化區(qū)分。細(xì)胞病理學(xué)醫(yī)生診斷為良性病變的病例,是一組病變的總稱,又分為良性濾泡性結(jié)節(jié)、甲狀腺炎或其他少見(jiàn)病變。良性濾泡性結(jié)節(jié)是甲狀腺細(xì)胞學(xué)檢查中最常見(jiàn)的類型,包括一組具有相似細(xì)胞學(xué)特征的良性病變,相應(yīng)組織學(xué)診斷包括結(jié)節(jié)性甲狀腺腫、腺瘤性結(jié)節(jié)、膠質(zhì)結(jié)節(jié)和彌漫性甲狀腺腫(Graves’?。┑慕Y(jié)節(jié),以及一些濾泡性腺瘤亞型(大濾泡型)。甲狀腺炎癥性病變又包括淋巴細(xì)胞性甲狀腺炎、亞急性甲狀腺炎和急性甲狀腺炎等。入組病例雖然均診斷為良性病變,但病變實(shí)質(zhì)存在差異,對(duì)應(yīng)樣本的代謝產(chǎn)物及化合物也有所差異,強(qiáng)行統(tǒng)一進(jìn)入單一組別,將影響診斷的準(zhǔn)確性[3]。(2)入組和單盲測(cè)試樣本的有效性。分析發(fā)現(xiàn)當(dāng)前采用的樣本的代謝物濃度不高。穿刺液樣本首先制備涂片樣本,殘留在穿刺針上樣本在18~20ml的細(xì)胞保存液種進(jìn)行清洗和保存,然后離心并用高純水清洗后的樣本,再次制備液基細(xì)胞學(xué)涂片。我們采用的上清液樣本中,雖然含有少量的特征代謝產(chǎn)物,但是濃度比較低。在掃描離子模式下,平均離子強(qiáng)度在103~104數(shù)量級(jí),略高于噪聲水平,在測(cè)定過(guò)程中受到的干擾比較大。(3)入組樣本均一性。甲狀腺細(xì)針穿刺過(guò)程中,由于結(jié)節(jié)大小、穿刺醫(yī)生技術(shù)能力、患者配合度等多環(huán)節(jié)問(wèn)題,造成最終惡性腫瘤細(xì)胞在樣本中的含量有一定差異。
本次實(shí)驗(yàn)沒(méi)有對(duì)上述參數(shù)進(jìn)行有效控制和篩選,可能造成建模樣本有效物質(zhì)含量較低。以后可嘗試用穿刺原液和術(shù)中冰鮮組織樣本建庫(kù),提高樣本質(zhì)譜信號(hào)強(qiáng)度,來(lái)提高診斷準(zhǔn)確性。