高陽輝 劉傳文 李慧敏 劉 琳 白宗達
早發(fā)現(xiàn)早治療是改變肺癌患者預(yù)后的重要前提,血清腫瘤標記物是惡性腫瘤篩查及診斷的重要依據(jù)之一,且相比于病理活檢及影像學(xué)檢查,血清腫瘤標記物檢測創(chuàng)傷小、價格低廉,是包括肺癌在內(nèi)的多種惡性腫瘤的主要篩查方式。但單個腫瘤標記物在篩查惡性腫瘤中的靈敏度及特異度均較低,臨床應(yīng)用價值不高,而多個腫瘤標記物聯(lián)合檢測則有希望提高篩查效果[1-2]。建立一種基于多種腫瘤標記物檢測數(shù)據(jù)的只能診斷模型,在減輕臨床工作量,提高肺癌臨床篩查效果中具有重要意義[3]。
人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)具備大規(guī)模并行處理能力及信息存儲功能,在疾病智能診斷系統(tǒng)構(gòu)建等多個領(lǐng)域中均具有良好應(yīng)用價值[4]。本研究利用ANN對外周血循環(huán)腫瘤細胞(circulating tumor cells,CTC)、三葉因子3(trefoil factor3,TFF3)以及載脂蛋白C1(apolipoprotein,APOC1)等三項腫瘤標記物進行聯(lián)合檢測,為肺癌診斷提供參考。
將2019年1月至2021年1月間收治的92例肺癌患者,80例肺良性病變患者以及52例健康體檢合格的同齡健康志愿者分別納為肺癌組、肺良性病變組及健康對照組。其中肺良性病變組及肺癌組患者均經(jīng)病理檢查證實。其中92例肺癌患者中非小細胞肺癌79例,小細胞肺癌13例,肺癌患者采集血液標本前均未接受過肺癌相關(guān)放化療或手術(shù)治療,均未首次確診。80例肺良性病變患者中,肺結(jié)核26例,肺炎36例,慢性支氣管哮喘18例。其中肺癌組中男性60例,女性32例,年齡57~83歲,平均(69.74±10.01)歲,肺良性病變組中男性63例,女性17例,年齡55~80歲,平均(70.11±7.85)歲,健康對照組中男性41例,女性11例,年齡53~84歲,平均(72.03±8.41)歲。
血清CTC水平檢測:患者行肘靜脈穿刺使用游離DNA保存管采集外周血10.0 ml,通過陰性富集技術(shù)+免疫熒光原位雜交(imFISH)檢測外周血CTC表達情況。
血清TFF3以及APOC1水平檢測:采集被研究者外周血6 ml,3000 r/min快速離心15 min,分離上層血清,均分為兩份,分別用于血清TFF3以及APOC1水平檢測。ELISA檢測血清TFF3水平,試劑盒購自武漢優(yōu)爾生物技術(shù)股份公司。單克隆抗體法檢測血清APOC1水平,試劑盒購自武漢塞培生物。
人工神經(jīng)網(wǎng)絡(luò)sigmoid傳遞函數(shù)要求輸入的參數(shù)在[0,1]之間,首先進行歸一化處理,轉(zhuǎn)化公式為:y=(x-minvalue)/(maxvalue-minvalue),其中y、x、maxvalue、minvalue分別為歸一后的值、歸一前樣本測定值、歸一化前樣本最大及最小值。
為考察ANN預(yù)測模型的可靠性與泛化性,按照3∶1的比例將各組歸一化的數(shù)據(jù)集隨機分為訓(xùn)練集與測試集。
ANN預(yù)測模型采用訓(xùn)練集建立,并對各自相對應(yīng)的測試集進行預(yù)測,采用反向傳播(BP)學(xué)習(xí)法的BP網(wǎng)絡(luò)模型,設(shè)置參數(shù):確定BP網(wǎng)絡(luò)結(jié)構(gòu)。 已知一個三層的反向傳播神經(jīng)網(wǎng)絡(luò)可完成任意n維到m維的映射,本研究所采用的BP神經(jīng)網(wǎng)絡(luò)有3層結(jié)構(gòu),包括輸入層、隱含層及輸出層。輸入層神經(jīng)元3個(即輸入特征數(shù)),隱含層神經(jīng)元8個,輸出神經(jīng)元1個。使用函數(shù)newff創(chuàng)建前饋神經(jīng)網(wǎng)絡(luò)。隱含層采用S型激活函數(shù)tansig.m,輸出層采用線性激活函數(shù)purelin.m,訓(xùn)練函數(shù)采用trainlm。網(wǎng)絡(luò)訓(xùn)練預(yù)設(shè)迭代次數(shù)為3000次,每10次顯示一個誤差,預(yù)設(shè)目標誤差1×10-5,學(xué)習(xí)效率根據(jù)經(jīng)驗設(shè)置為0.7,為防止振蕩,有效加速收斂,本研究中加入動量項,動量因子mc=0.95。
肺癌組、肺良性病變組以及健康對照組患者外周血CTC陽性率、TFF3以及APOC1水平比較,差異具有統(tǒng)計學(xué)意義(P<0.05),見表1。
表1 三組外周血CTC、TFF3以及APOC1水平比較
設(shè)置健康對照組擬合輸出值為0.2,肺良性病變組擬合輸出值為0.6,肺癌組輸出值為1.0,BP神經(jīng)網(wǎng)絡(luò)開始訓(xùn)練后,隨著迭代次數(shù)的增加,誤差逐漸減少,在經(jīng)歷過400次迭代后,誤差達到預(yù)期目標,停止網(wǎng)絡(luò)訓(xùn)練。訓(xùn)練集識別結(jié)果:訓(xùn)練集中69例肺癌患者均被識別為肺癌,60例肺良性病變患者均被識別為良性,39例健康志愿者均被識別為正常。BP神經(jīng)網(wǎng)絡(luò)度訓(xùn)練集各組的識別率均達到100%。
圖1 人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練集識別結(jié)果
預(yù)測集中13例健康志愿者中有11例被識別為正常,20例肺良性病變者中有17例被識別為良性,23例肺癌患者中有21例被識別為肺癌,見表2。BP神經(jīng)網(wǎng)絡(luò)對預(yù)測集中健康對照組、肺良性病變組以及肺癌組的識別正確率分別為91.30%、85.00%及84.62%。
圖2 人工神經(jīng)網(wǎng)絡(luò)預(yù)測集識別結(jié)果
表2 人工神經(jīng)網(wǎng)絡(luò)預(yù)測集識別結(jié)果/例
由于肺癌臨床表現(xiàn)缺乏特異性,很多患者首次確診時,疾病就已發(fā)展至晚期,錯過最佳治療時間。血清腫瘤標記物蛋白芯片檢測系統(tǒng)能輔助早期肺癌篩查,且具有價格低廉、取材方便的特點。單一的腫瘤標記物的臨床應(yīng)用價值往往十分有限,聯(lián)合腫瘤標記物篩查則可有效提高單一指標的應(yīng)用效果[5-6]。但過多的標志物聯(lián)合檢測不僅會浪費醫(yī)療資源,還會增加檢測假陽性占比。
本研究選取CTC、TFF3以及APOC1 3種腫瘤標記物作為研究指標。CTC是指進入循環(huán)系統(tǒng)的腫瘤細胞,其不僅參與腫瘤隱性微轉(zhuǎn)移,也是腫瘤遠處轉(zhuǎn)移的基礎(chǔ),與肺癌的發(fā)生及發(fā)展間關(guān)系密切[7-8]。TFF3屬于三葉因子家族,是重要的消化系黏膜保護因子,能保護及修復(fù)上皮細胞,并參與細胞增殖、凋亡及腫瘤侵襲[9-10]。有研究表示[11-12],乳腺癌細胞內(nèi)TFF3呈高表達,并可促進腫瘤細胞增殖與浸潤。APOC1屬于載脂蛋白C家族,其不僅參與脂質(zhì)轉(zhuǎn)運與代謝,近年來有研究證實,APOC1還參與腫瘤的發(fā)生與發(fā)展,有學(xué)者發(fā)現(xiàn),結(jié)直腸癌、胰腺癌、乳腺癌等多種惡性腫瘤患者血清APOC1水平均異常升高。楊鳳鳴等[13]研究發(fā)現(xiàn),血清APOC1與肺癌腫瘤分期、分化程度及淋巴轉(zhuǎn)移間關(guān)系密切。綜上,外周血CTC、TFF3以及APOC1均與肺癌的發(fā)生及發(fā)展間存在密切聯(lián)系,可成為早期肺癌篩查的潛在標志物。本研究發(fā)現(xiàn),與肺良性病變者及健康對照組患者相比,肺癌患者外周血CTC、TFF3以及APOC1水平異常升高。
ANN是一種非線性信息處理工程系統(tǒng),其具有模擬人腦的組織結(jié)構(gòu)與運行機制,打處理大規(guī)模及分布式信息,并具有良好的自適應(yīng)性、自組織性、聯(lián)想功能及容錯性[14-15]。隨著ANN技術(shù)的不斷發(fā)展,ANN聯(lián)合多種腫瘤標記物篩查肺癌已成為臨床研究重點,本研究利用以上3種標記物建立了ANN聯(lián)合腫瘤標記物肺癌診斷模型。研究結(jié)果顯示,該診斷模型對預(yù)測集進行預(yù)測,結(jié)果顯示,預(yù)測集中13例健康志愿者中有11例被識別為正常,20例肺良性病變者中有17例被識別為良性,23例肺癌患者中有21例被識別為肺癌。BP神經(jīng)網(wǎng)絡(luò)對預(yù)測集中健康對照組、肺良性病變組以及肺癌組的識別正確率分別為91.30%、85.00%及84.62%。
綜上所述,基于外周血CTC、FTT3以及APOC1聯(lián)合檢測建立的ANN預(yù)測模型,能有效鑒別健康者、肺良性病變及肺癌患者,可用于臨床肺癌輔助診斷,提高肺癌篩查效果。