陳振崗 劉金波 林凌 謝輝 張文成 張洪博 王廣舜
肺癌已成為癌癥死亡的主要原因[1],且呈逐年上升趨勢,而其中非小細胞肺癌 (non-small cell lung cancer,NSCLC)約占肺癌總數(shù)的80%。雖然不斷改善NSCLC的各種診斷和治療方法,但60%NSCLC患者在接受治療時已處于晚期[2],其5年生存率不超過15%,而I期NSCLC的5年生存率卻高達70%[3],故在臨床診治中急需尋找一種NSCLC早期篩查和診斷的新方法。現(xiàn)階段在NSCLC研究中,一個重要的方向是使用基因和蛋白質(zhì)組學方法來探討NSCLC腫瘤細胞的生物學特性。近些年來,通過NSCLC患者尿液中獲得差異表達蛋白,從而為NSCLC預防、診斷和治療提供潛在生物標志物的研究越來越得到科研工作人員的普遍關(guān)注。我們通過應(yīng)用蛋白質(zhì)組學和生物信息技術(shù)對肺部良性疾病、健康志愿者和NSCLC患者尿液中差異表達蛋白質(zhì)分析,尋找出尿液蛋白LRG1、CA1、VPS4B和YWHAZ為NSCLC早期篩查、監(jiān)測預后和治療評估的生物標記物。
1.1 一般資料 來自天津醫(yī)科大學寶坻臨床學院腫瘤科2014年3月-2014年10月病理證實初診NSCLC患者尿液樣本40例。其中男性27例,女性13例;年齡44歲-84歲,平均年齡(64±10.2)歲;腺癌13例,鱗癌27例;I期3例,II期5例,III期20例,IV期12例。來自天津醫(yī)科大學寶坻臨床學院保健科與腫瘤科對照組尿液樣本30例:健康志愿者22例;肺部良性疾病8例,包括肺部錯構(gòu)瘤3例,肺部結(jié)核球2例,肺部炎性假瘤1例,肺部陰影2例。其中男性20例,女性10例;年齡24歲-86歲,平均年齡(59±15.5)歲。所有參與者均被告知尿液標本用于研究目的,在醫(yī)院進行晨起第一次中段尿液收集。受試人主體協(xié)議成立,進行內(nèi)部審查委員會批準。受試者知情同意。
1.2 主要試劑及儀器 二硫蘇糖醇(DTT)來自北京欣經(jīng)科生物技術(shù)有限公司;尿素來自西隴化學工業(yè)有限公司;三氨基甲烷(Tris)、十二烷基硫酸鈉(SDS)、丙烯酰胺、過硫酸鈉、乙醇均來自北京化學制劑公司;乙腈、碳酸氫銨來自J.D.Baker公司;考馬斯亮藍來自Merck KGaA公司。超高速低溫離心機為美國Berkman公司產(chǎn)品;550全自動酶標儀為美國BIO.RAD公司產(chǎn)品,分析軟件為Microsoft Excel軟件;ProteanTMPlusDodecaTMCell電泳槽、ProteanTMPlusDodecaTMCell染膠儀為美國BIO.RAD公司產(chǎn)品;MS-Thermo-Orbi-Trap-Velos質(zhì)譜儀為美國熱電公司產(chǎn)品。實驗軟件包括:4000 explorer 3.0軟件、GPS explorer 3.5軟件和NCBI-Human數(shù)據(jù)庫分析軟件。
1.3 尿液樣本采集處理 分別收取近3年內(nèi)未發(fā)現(xiàn)其他系統(tǒng)嚴重疾病,近2年無嚴重疾病用藥史,特別是近1個月內(nèi)無泌尿系統(tǒng)疾病史,女性不在月經(jīng)周期內(nèi)肺部良性疾病、志愿者及病理證實初診NSCLC患者晨起第一次中段尿液樣本各40 mL。液氮快速冷凍后,置于-800C冰箱凍藏保存?zhèn)溆谩?/p>
1.4 蛋白質(zhì)提取及定量測定 溶解冰凍樣本時進行多次渦旋,以最大程度的提高蛋白質(zhì)回收率[4]。采用200,000 g超高速離心沉淀法分離定容為20 mL尿液樣本提取其尿液蛋白質(zhì),并進行還原、烷基化和裂解。通過Branford法進行蛋白質(zhì)濃度測定,取出定量為20 μg樣本溶液進行蛋白質(zhì)分離。
1.5 一維電泳SDS-PAGE蛋白質(zhì)分離 取20 μg樣本溶液進行電泳分離,了解其差異凝膠條帶情況。實驗中切去高豐度蛋白質(zhì)集中的75 kDa凝膠條帶,將余下條帶等分為4-6等份,進行凝膠內(nèi)胰蛋白酶消化。最后,分別使用30%乙腈、0.3%三氟乙酸和100%乙腈進行胰蛋白酶肽段的萃取。
1.6 差異表達蛋白質(zhì)識別 使用MS-Thermo-Orbi-Trap-Velos質(zhì)譜分析儀對蛋白質(zhì)及肽段逐一予以分離并進行鑒定,所得質(zhì)譜數(shù)據(jù)通過進入HCBI-Human數(shù)據(jù)庫進行數(shù)據(jù)分析與蛋白質(zhì)識別,得出全部尿液蛋白質(zhì)。同時對所得蛋白質(zhì)數(shù)據(jù)進行搜索和分析,分別篩選出在NSCLC患者尿液中的上調(diào)和下調(diào)蛋白質(zhì)。最后,應(yīng)用SPSS 20.0軟件中受試者工作特征曲線 (receiver operating characteristic curve,ROC)對篩選出蛋白質(zhì)的敏感性和特異性進行統(tǒng)計學分析,確定出與NSCLC相關(guān)的差異表達蛋白質(zhì),初步認定為NSCLC早期篩查的候選生物學標記物。
1.7 差異蛋白敏感性、特異性驗證 雙盲法對20例驗證實驗樣本進行同上處理,對所得結(jié)果進行統(tǒng)計分析,得出差異表達蛋白對NSCLC早期診斷的敏感性和特異性。
1.8 統(tǒng)計學方法 采用SPSS 20.0統(tǒng)計軟件進行數(shù)據(jù)統(tǒng)計與分析。
2.1 1DSDS-PAGE電泳凝膠圖結(jié)果 非腫瘤組和NSCLC組尿液蛋白的差異表達主要出現(xiàn)在90 kDa、60 kDa和20 kDa-30 kDa凝膠條帶,而高豐度蛋白質(zhì)集中于75 kDa條帶處(圖1)。
2.2 質(zhì)譜數(shù)據(jù)采集結(jié)果 通過MS-Thermo-Orbitrap-Velos質(zhì)譜儀進行尿液蛋白質(zhì)提取分離,所得蛋白質(zhì)和肽段結(jié)果如下:實驗中NSCLC組鑒別出肽段數(shù)6,789-9,645,中位數(shù)7,762(7,189-8,672);蛋白質(zhì)數(shù)1,194-2,813,平均值2,001±363.1。非腫瘤組鑒別出肽段數(shù)6,277-8,700,中位數(shù)7,774(6,452-8,616);蛋白質(zhì)數(shù)1,313-2,774,平均值1,967±505.0。雙盲實驗中NSCLC組鑒別出肽段數(shù)5,919-9,045,平均值7,705±1,112.6;蛋白質(zhì)數(shù)1,194-2,408,平均數(shù)1,937±391.5。非腫瘤組鑒別出肽段數(shù)6,132-9,376,平均值7,870±1,050.2;蛋白質(zhì)數(shù)1,060-2,397,平均數(shù)1,876±409.9。實驗與驗證實驗各組所提取分離出的總平均肽段數(shù)為7,495±1,091.4,蛋白質(zhì)總數(shù)1,874±416.8,均滿足本實驗研究的要求,各組肽段與蛋白質(zhì)數(shù)量分布見圖2。
2.3 MS-Thermo-Orbitrap-Velos質(zhì)譜儀結(jié)果分析 得到的MS/MS數(shù)據(jù)進行NCBI-Human數(shù)據(jù)庫搜索,提取、確定出尿液樣本中包含的所有蛋白質(zhì)。實驗中通過align數(shù)據(jù)分析軟件設(shè)定蛋白質(zhì)肽段數(shù)≥2個肽段、蛋白質(zhì)上調(diào)比率>4倍條件,于NSCLC患者尿液蛋白質(zhì)中篩查出LRG1(25/30)、CA1(18/30)、PTGDS(23/30)、CD14(20/30)、ERLIN2(21/30)、ACTG1(21/30)6種明顯上調(diào)蛋白質(zhì)。同樣,設(shè)定蛋白質(zhì)肽段數(shù)≥2個肽段、蛋白質(zhì)下調(diào)比率>4倍條件,于所有NSCLC患者尿液蛋白質(zhì)中篩查出VPS4B(22/30)、IST1(23/30)、GNAI1(23/30)、UBB(20/30)、YWHAZ(18/30)5種明顯下調(diào)蛋白質(zhì)。最后,應(yīng)用SPSS 20.0軟件分別對上調(diào)蛋白質(zhì)、下調(diào)蛋白質(zhì)的敏感度和特異度進行ROC曲線圖分析,發(fā)現(xiàn)上調(diào)蛋白LRG1、CA1(圖3,表1)、下調(diào)蛋白VPS4B、YWHAZ(圖4,表2)的敏感性和特異性較高,曲線下面積均大于0.75,具有統(tǒng)計學意義。因此,考慮此4種尿液差異表達蛋白與NSCLC具有相關(guān)性,初步將其確定為NSCLC早期篩查的候選生物學標記物。
2.4 差異表達蛋白的敏感性、特異性 LRG1和CA1蛋白在NSCLC患者尿液中呈現(xiàn)高表達,LRG1蛋白敏感性83.0%(25/30)、特異性90.0%(18/20);CA1蛋白敏感性60.0%(18/30)、特異性90.0%(18/20)。VPS4B和YWHAZ蛋白在NSCLC患者尿液中呈現(xiàn)低表達,VPS4B蛋白敏感性73.3%(22/30)、特異性90.0%(18/20);YWHAZ蛋白敏感性60.0%(18/30)、特異性95.0%(19/20);LRG1、CA1、VPS4B和YWHAZ蛋白質(zhì)組合模式的敏感性和特異性分別為96.7%(29/30)和85%(17/20),見表3,表4。在本研究中蛋白質(zhì)組敏感性定義為各個生物標記物所提示的NSCLC患者均納入總數(shù),特異性定義為不出現(xiàn)任何一種生物標記物的實驗對象均納入總數(shù)。
2.5 驗證實驗結(jié)果 10例NSCLC樣本中正確篩查出了9例NSCLC患者;10例非腫瘤樣本中正確排除7例。采用差異表達蛋白質(zhì)組合模式雙盲下對NSCLC患者進行篩查和診斷,其敏感性和特異性分別為90.0%(9/10)和70.0%(7/10),其預測的陽性預測值(positive predictive value,PPV)和陰性預測值(negative predictive value, NPV)分別高達75.0%和87.5%(表5)。
圖1 NSCLC組與非腫瘤組尿液蛋白質(zhì)的電泳圖像。A:6例NSCLC患者尿液蛋白電泳圖;B:6例非腫瘤組尿液蛋白電泳圖。Fig 1 The electrophoresis images of urine proteins from NSCLC patients and non-neoplastic groups.A: The electrophoresis images of urine proteins from 6 NSCLC patients; B: The electrophoresis images of urine proteins from 6 non-neoplastic patients.
圖2 實驗中各組樣本提取分離出的尿液蛋白質(zhì)和肽段數(shù)Fig 2 The protein and peptideextracted from urine samples in different groups
圖3 上調(diào)蛋白質(zhì)ROC分析曲線圖Fig 3 ROC curve of up-regulating proteins
圖4 下調(diào)蛋白質(zhì)R0C分析曲線圖Fig 4 ROC curve of down-regulating proteins
在男性和女性中肺癌已成為全世界癌癥死亡的主要原因,每年有超過100萬人死于肺癌[5]。NSCLC約占肺癌患者中的80%,在過去十年中,肺癌診斷和治療策略雖然取得了一定進步,但NSCLC患者的預后仍很差,5年總生存率僅為15%-20%[6]。這主要是由于缺乏早期診斷手段,有超過60%患者診斷時即為晚期或已發(fā)生轉(zhuǎn)移性疾病[7],因此沒有獲得外科切除治療的機會。其主要原因為NSCLC早期階段的診斷非常困難,且在以往臨床診斷中我們很少應(yīng)用到生物標記物。在NSCLC治療中早期診斷是其治療成功的一個關(guān)鍵因素,只有通過早期診斷后選擇優(yōu)化的治療方案,才能增加其治愈成功的概率。因此,在臨床上尋找NSCLC的早期篩查方法和手段尤為重要。近些年來,應(yīng)用臨床蛋白質(zhì)組學策略發(fā)現(xiàn)NSCLC生物學標記物已成為臨床NSCLC診治的最新研究熱點。我們不但可以通過它來篩查NSCLC高危人群,去發(fā)現(xiàn)那些可測定但臨床上各項檢測尚不能確診的NSCLC,從而使NSCLC確診的比率得到提高。而且,早期NSCLC預測性生物學標記物還可以幫助我們鑒別NSCLC的侵襲程度、提示我們哪些治療會縮短患者生存率及幫助我們選擇哪些患者會在輔助治療中獲益等作用。
尿液是可通過無創(chuàng)傷收集來應(yīng)用于人類疾病診斷和預后研究的一種重要生物流體。因其具有實用性、易于收集和與疾病病理生理學相關(guān)等特性,已成為臨床蛋白質(zhì)組學一個最具有吸引力的材料來源。健康個體中,尿液蛋白質(zhì)組的70%來自腎臟和尿路,30%來自腎小球濾過[8]。因此,尿液蛋白質(zhì)組分析不僅能鑒定泌尿系統(tǒng)生物標志物,也能鑒定全身性疾病的生物標志物。最近許多研究工作表明,尿液蛋白質(zhì)組學的研究還可為非泌尿生殖系統(tǒng)疾病,特別是惡性腫瘤提供大量生物學信息,并可使之應(yīng)用于這些疾病的預防、診斷和治療。通過對臨床蛋白質(zhì)組學研究的不斷深入,尿液蛋白質(zhì)組學可能會具有迅速在臨床實用化的潛力。
本研究在NSCLC患者尿液蛋白質(zhì)中發(fā)現(xiàn)了4種差異表達蛋白,分別為上調(diào)蛋白LRG1、CA1和下調(diào)蛋白VPS4B、YWHAZ。LRG1屬于LRR蛋白質(zhì)家族成員。在過去的研究表明,LRG1參與機體重要的生理和病理過程,如蛋白質(zhì)相互作用、信號轉(zhuǎn)導和細胞粘附。LRG1也可在粒細胞分化過程中得到表達。近年來研究發(fā)現(xiàn)肝癌[9]、肺癌[10]和胰腺腺癌[11]患者血清中LRG呈高表達。此外,Heo應(yīng)用親和層析色譜及LC-MS/MS對腺癌患者血清進行分離,鑒定出LRG1是一個潛在肺癌血清生物標志物的結(jié)論[12]。本實驗結(jié)果表明LRG1在NSCLC患者尿液中呈高表達(敏感性83%,25/30;特異性90%,18/20),這說明NSCLC患者尿液中的LRG1蛋白可能是來自肺部腫瘤組織。同時也說明LRG1將有希望成為NSCLC相關(guān)的獨立尿液生物學標志物。
表1 上調(diào)蛋白質(zhì)ROC曲線下面積Tab 1 Area under ROC curve of up-regulating proteins
表2 下調(diào)蛋白質(zhì)ROC曲線下面積Tab 2 Area under ROC curve of down-regulating proteins
表3 獨立差異蛋白質(zhì)敏感性和特異性Tab 3 Sensitivity and specificity of differentially expressed proteins
表4 差異表達蛋白質(zhì)組敏感性和特異性Tab 4 Sensitivity and specificity of differentially expressed proteome
表5 驗證實驗的敏感性和特異性Tab 5 Sensitivity and specificity in double-blind experiment
碳酸酐酶(carbonic anhydrase, CA)同功酶在癌癥發(fā)展中起到重要作用。其中一些同功酶可通過控制瘤體內(nèi)pH值的平衡,呈現(xiàn)出調(diào)解惡性腫瘤細胞生物學行為的功能[13]。本研究發(fā)現(xiàn)在NSCLC患者的尿液中CA1蛋白質(zhì)表達水平呈現(xiàn)明顯上調(diào)(敏感性60%,18/30;特異性90%,18/20),而CA1過表達在結(jié)直腸癌[14]、口腔鱗狀細胞癌[15]、子宮內(nèi)膜癌[16]等惡性腫瘤研究中均有發(fā)現(xiàn)。因此,實驗中這種變化可能反映了一定的NSCLC發(fā)生和發(fā)展過程,也為CA1蛋白可能成為NSCLC相關(guān)尿液生物學標記物,提供了理論依據(jù)。
VPS4B蛋白是腺苷三磷酸酶蛋白質(zhì)家族的一員,主要存在于細胞漿中。VPS4B與多種細胞活性蛋白質(zhì)相關(guān),VPS4B通過與胞內(nèi)體膜結(jié)合來調(diào)控激活膜蛋白內(nèi)部和溶酶體降解[17,18]。VPS4B是胞內(nèi)體轉(zhuǎn)運復合物所需(endosomal sortingcomplex required for transport, ESCRT)物質(zhì)[19,20],其對多泡體(multivesicular body, MVBs)的形成和各種膜受體降解至關(guān)重要。膜受體包括表皮生長因子受體(epidermal growth factor receptor, EGFR)[17,21,22]和胰島素受體[23]。表皮生長因子受體由多泡體轉(zhuǎn)運,然后通過依賴VSP4B機制降解[18]。因此,VPS4B為ESCRT通路的重要調(diào)節(jié)器,并參與多泡體途徑的組成?;谥把芯?,VPS4B參與溶酶體降解途徑,EGFR損失不僅導致內(nèi)表皮生長因子受體退化延遲,同時也延長其激活持續(xù)時間[24,25],增加了腫瘤細胞增殖、生長、入侵和轉(zhuǎn)移。已有VPS4B通過抑制EGFR激活途徑抑制乳腺癌進展的報道[26,27]。VSP4B不僅具有調(diào)節(jié)ESCRT通路中囊泡轉(zhuǎn)運功能,還同樣參與了病毒發(fā)生[28,29]和胞質(zhì)分裂的脫落[30]。有報道[30]稱,VPS4B蛋白可以調(diào)節(jié)有絲分裂和細胞分裂的不同階段。直到目前為止關(guān)于尿液VPS4B蛋白與NSCLC相關(guān)性研究幾乎沒有任何報道。但考慮到不受控制的細胞分裂是腫瘤形成的一個特征,因此很容易推測到VPS4B在NSCLC發(fā)生、發(fā)展中必將發(fā)揮一定的作用。本研究結(jié)果表明VPS4B在NSCLC患者尿液中呈現(xiàn)低表達(敏感73.3%,22/30;特異性90%,18/20),進一步證實這一假設(shè)的存在,也增加了尿液VPS4B蛋白作為NSCLC生物標記物的可能性。但關(guān)于其具體影響過程到目前為止尚不是完全清楚,有待于我們后續(xù)的實驗研究來進一步解釋。
YWHAZ蛋白質(zhì)家族是通過綁定磷酸絲氨酸轉(zhuǎn)載蛋白質(zhì)進行基因調(diào)節(jié)信號轉(zhuǎn)導。雖然,其在腫瘤發(fā)展中的潛在機制尚未完全清楚,但YWHAZ蛋白已在包括NSCLC在內(nèi)的一些癌癥中被確定為是一種假定的腫瘤蛋白。人體中確定出了YWHAZ蛋白家族中的7個亞型[31],起初它們被認為是影響相關(guān)酪氨酸羥化酶活性的酶輔助因子[32]。但最近幾項研究發(fā)現(xiàn)YWHAZ蛋白與原癌基因和癌基因相關(guān),同時也參與了細胞轉(zhuǎn)化和促進細胞有絲分裂的信號通路[33,34],對人體腫瘤的發(fā)生與發(fā)展產(chǎn)生廣泛影響。YWHAZ蛋白一個明顯特征是能夠結(jié)合不同信號的多功能蛋白,包括激酶、磷酸酶和跨膜受體[35]。在這些蛋白相互作用的調(diào)控過程中YWHAZ發(fā)揮了重要作用,如引起細胞有絲分裂信號轉(zhuǎn)導、細胞凋亡和細胞周期調(diào)控等[36]。到目前為止YWHAZ蛋白家族已經(jīng)確定出超過100多個相關(guān)綁定蛋白[37],同時在細胞、動物模型和患者樣本中得到了越來越多的HWAZ與多種惡性腫瘤相關(guān)的證據(jù),如神經(jīng)母細胞瘤、星形細胞瘤及HeLa宮頸癌等。據(jù)趙[38]等報道,在NSCLC中YWHAZ與Hsp27結(jié)合成復合體,并對其功能產(chǎn)生重大影響。同時YWHAZ功能非常類似于Hsp27的作用功能。因此我們可以假設(shè)YWHAZ和Hsp27具有相同的信號通路來影響NSCLC的產(chǎn)生、發(fā)展過程。本研究發(fā)現(xiàn)NSCLC患者尿液中YWHAZ呈低表達(敏感性60.0%,18/30;特異性95%,19/20),進一步表明尿液YWHAZ蛋白的表達與NSCLC存在一定相關(guān)性。同時,我們更希望其成為一個獨立預測NSCLC的新分子目標,從而服務(wù)于臨床NSCLC的診療。
組成生物標記物的多肽或蛋白質(zhì)在結(jié)構(gòu)上存在明顯可變性,且大部分經(jīng)過機體排泄的多肽可能由于受到身體活動、飲食或藥物治療作用影響,其白天變化明顯[39,40]。所以單一生物標記物在臨床中實用價值是有限的,即使采用最優(yōu)的檢測和分析方法,獨立生物標志物應(yīng)用于臨床診斷中的敏感性依然很低。相比之下,單一生物標記變化不會導致標記物蛋白質(zhì)組合的明顯變化。因此,良好的多生物標記蛋白質(zhì)組合具有更高的敏感性和特異性。這就進一步表明生物標志物蛋白質(zhì)組合模式比獨立生物標志物模式在臨床診療評估中更有意義(如Theodorescu等[41]、Zimmerli等[42]),也將更具有良好的實用價值和前景。
實驗研究中存在2處不足之處:①實驗組NSCLC病例分期較晚;②對照組采用健康人群與肺部良性疾病。造成了獨立生物標記物的特異性明顯增高,故影響了其在臨床意義上的作用。LRG1、CA1、VPS4B和YWHAZ作為NSCLC標記物在其他惡性腫瘤中的具體表達情況,還有待進一步的實驗研究。