李 雙,葉 俏
(首都醫(yī)科大學附屬北京朝陽醫(yī)院,職業(yè)病與中毒醫(yī)學科,間質性肺疾病臨床診療與研究中心,北京 100020)
特發(fā)性肺纖維化(idiopathic pulmonary fibrosis,IPF)是一種慢性、進行性肺纖維化疾病,表現(xiàn)為逐漸加重的勞力性呼吸困難、肺功能障礙甚至發(fā)展為呼吸衰竭而死亡,確診后患者的生存期中位數(shù)為2.3~3.5年[1]。IPF是一種具有代表性的慢性纖維化性肺疾病,抗肺纖維化藥物吡非尼酮(pirfenidone)和尼達尼布(nintedanib),兩者在隨機對照試驗和真實世界研究表明,均可一定程度地延緩IPF患者肺功能的下降,部分地抑制病情進展[2-3]。近年,高通量技術的發(fā)展極大地增加了研究的生物數(shù)據(jù)量,為探索IPF的病因、發(fā)病機制及新藥治療靶點提供了新的思路,也為疾病的研究提供了新的手段。
高通量技術應用于各種“組學”,主要包括:①基因組學,用于檢測DNA突變;②轉錄組學,用于檢測mRNA表達;③表觀基因組學,在不改變序列的情況下,研究DNA的修飾變化對mRNA表達的影響;④蛋白質組學,用于檢測蛋白質組分;⑤代謝組學,用于測定代謝物的水平。組學技術可以分析和整合組織和細胞的特異性組學數(shù)據(jù),精確地展示疾病的生物學過程,識別環(huán)境及干預措施的影響,便于達到個體化精準醫(yī)療的目標。本文綜述以上5種高通量組學技術在闡明IPF的發(fā)病機制、尋找生物標志物和提供治療靶點中的應用研究進展。
基因組學是指對所有基因進行基因組作圖、核苷酸序列分析、基因定位和基因功能分析的一門技術。常用的研究方法有全基因組關聯(lián)分析研究(genome-wide association studies,GWAS)、全外顯子測序(whole-exome sequencing,WES)和全基因組測序(whole-genome sequencing,WGS)。GWAS主要用于發(fā)現(xiàn)單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)的等位基因或基因頻率在患者與健康人群中的差異,研究常見遺傳變異與疾病之間的關系。WES用于檢測功能性基因的突變。WGS檢測所有類型的DNA序列突變。隨著高通量測序成本的降低,WES和WGS已經(jīng)成為基因組學研究的首選技術,可以識別罕見和新型基因突變。
IPF基因組學研究從探討家族性間質性肺炎(familial interstitial pneumonia,F(xiàn)IP)開始。2011年,SEIBOLD等[4]對來自美國的83例FIP、492例IPF和322例非肺纖維化受試者的肺組織進行GWAS,發(fā)現(xiàn)11號染色體上的SNP,即MUC5B啟動子rs35705950與FIP和IPF易感性相關。MUC5B編碼黏蛋白5B,是黏液中主要的凝膠形成蛋白,由氣道上皮細胞表達,參與宿主防御。IPF中MUC5B的表達定位于遠端氣道、呼吸性細支氣管、蜂窩肺和支氣管上皮[5-6]。組織病理研究發(fā)現(xiàn),MUC5B在蜂窩肺中過度表達[5],提示MUC5B在IPF發(fā)病中起作用。MUC5B rs35705950啟動子多態(tài)性是非西班牙裔白種人IPF的最強遺傳危險因子,但它在亞洲人群中并不常見[7],影響亞洲人群IPF易感性的遺傳或環(huán)境因素有待進一步研究。一項類風濕關節(jié)炎相關間質性肺疾?。╮heumatoid arthritis-interstitial lung disease,RA-ILD)的多國家、多中心研究,入選620例RA-ILD、614例RA無ILD和5448例無RA無ILD受試者,檢測其MUC5B rs35705950啟動子多態(tài)性,發(fā)現(xiàn)MUC5B rs35705950陽性的RA受試者較其陰性者出現(xiàn)ILD的風險更高,且發(fā)生普通型間質性肺炎(usual interstitial pneumonia,UIP)型頻率增加,提示MUC5B rs35705950與RA-ILD尤其是表現(xiàn)為UIP型的易感性相關[8]。
端粒是染色體末端的重復核苷酸序列,保護染色體免于在正常細胞復制過程中進行性縮短。端粒酶恢復端粒長度需要2個主要成分:端粒酶逆轉錄酶(telomerase reverse transcriptase,TERT)和端粒酶RNA組分(telomerase RNA component,TERC)。FIP患者和無癥狀端粒酶基因突變攜帶者的平均端粒長度明顯短于未攜帶端粒酶基因突變的受試者,突變攜帶者的端粒長度與健康對照相比明顯縮短,同時FIP患者的端粒長度具有比無癥狀攜帶者更短的傾向[9]。日本和歐洲的2個研究分別用GWAS和WES方法發(fā)現(xiàn),與非肺纖維化人群相比,散發(fā)性IPF患者肺組織中端粒相關基因TERT、RTEL1和PARN突變增加[10-11],表明端粒功能障礙與散發(fā)性IPF易感性相關。CRONKHITE等[12]入選46例FIP、42例散發(fā)性IPF和201例非纖維化對照受試者,測量其端粒長度及端粒酶基因突變情況,發(fā)現(xiàn)與對照組相比,具有端粒酶基因突變的肺纖維化受試者端粒長度更短。值得注意的是,24%FIP和23%散發(fā)性IPF無TERT或TERC基因突變,但其端粒長度也較對照組明顯縮短,說明導致端粒長度縮短的因素不限于端粒酶基因突變。
橋粒在連接細胞并穩(wěn)定組織結構中起重要作用,橋粒斑蛋白(desmoplakin,DSP)是橋粒結構的關鍵組成部分。研究顯示,DSP基因多態(tài)性影響IPF患病風險,rs2076295的次要等位基因增加IPF易感性,而rs2744371的次要等位基因具有保護作用[13]。IPF肺組織DSP通常高表達,然而rs2076295基因表型的IPF患者DSP低表達,DSP的差異化表達可能提示IPF能夠分為不同亞組進行進一步研究[13]。一項GWAS研究表明,編碼表面活性蛋白C和A的基因與FIP易感性相關,但在散發(fā)性IPF中屬于罕見突變[14]。
一項GWAS研究入選了1400例IPF患者和1900例對照者,與對照組相比,IPF組肺組織的單核苷酸多態(tài)性Toll相互作用蛋白(Toll-interacting protein,TOLLIP)基因(rs111521887,rs5743894和rs5743890)、MUC5B(rs35705950)、MDGA2(rs7144383)和 SPPL2C(rs17690703)均存在差異[15]。回歸分析顯示,MUC5B與IPF易感性關聯(lián)最強。單變量薈萃分析顯示,主要等位基因rs5743890_A的攜帶者,IPF易感性增加,死亡率降低;次要等位基因rs5743890_G的攜帶者,IPF易感性降低,而死亡率增加[15]。研究表明,多個基因突變可能影響疾病的易感性和自然病程。細胞端粒長度是IPF患者生存時間的獨立預測因子[16-17],在具有自身免疫特征的間質性肺炎患者中,端粒長度<第10百分位數(shù)者比≥第10百分位數(shù)者肺功能下降更快,是無移植存期的危險因素[18]。
為確定TOLLIP和MUC5B多態(tài)性是否會改變IPF患者接受免疫抑制劑和抗氧化治療的療效,研究入選3組非西班牙裔白種人受試者,分為對照組、IPF組和具有TOLLIP或MUC5B基因型多態(tài)性的IPF組,分別接受安慰劑和N-乙酰半胱氨酸(N-acetylcysteine,NAC)治療,將死亡、肺移植、住院治療和用力肺活量占預計值百分比較基線降低>10%定義為復合終點事件。研究發(fā)現(xiàn),具有TOLLIP rs3750920 TT基因型的受試者服用NAC降低了復合終點風險;相反,CC基因型的IPF受試者接受NAC治療后復合終點風險增加[19]。遺傳變異影響IPF的易感性、結局和預后,不同基因型間治療效果的差異為個體化治療提供了方向,基因組學研究將使IPF個體化治療成為可能。
轉錄組學是從RNA水平研究細胞或組織的基因表達或轉錄調(diào)控通路的一門技術,易受健康狀態(tài)及環(huán)境暴露等條件影響,是動態(tài)過程中的某一靜態(tài)顯像。轉錄組學最初的檢測手段主要是基于已知RNA設計的基因表達微陣列,用于檢測已知基因的表達,隨著高通量技術的發(fā)展,轉錄組測序(RNA-sequencing,RNA-Seq)技術可以對細胞或組織中的整體轉錄活動進行檢測,能發(fā)現(xiàn)未知RNA并進行測序和定量,提供全面的轉錄組信息。
IPF患者基因表達和非編碼RNA水平較健康人群均有改變,微生物刺激也可以影響IPF基因表達。NANCE等[20]納入8例IPF患者和7例健康受試者,應用RNA-Seq技術檢測2組肺組織中基因表達差異,用PCR追溯基因外顯子差異,發(fā)現(xiàn)膠原蛋白Ⅵ型α3基因和骨膜素基因表達水平下調(diào)與IPF易感性相關。非編碼RNA和肺內(nèi)微生物群影響IPF的發(fā)生發(fā)展。在纖維化肺組織中調(diào)控基因表達的非編碼RNA:微RNA(microRNA,miRNA)-130b-3p下調(diào)和長鏈非編碼RNA(uc.77與2700086A05Rik)上調(diào)可促進上皮細胞-間充質轉化[21-22]。微生物-宿主防御機制研究顯示,微生物刺激改變宿主防御機制相關的核苷酸結合寡聚化結構域樣受體家族成員4基因、肽聚糖識別蛋白1基因、基質金屬蛋白酶9(matrix metalloproteinase 9,MMP9)基因、防御素α4基因及2種編碼特定抗菌肽分泌型白細胞蛋白酶抑制因子基因和組織蛋白酶抑制素抗菌肽基因的表達,下調(diào)核苷酸結合寡聚化結構域、Toll和RIG1樣受體途徑,并影響IPF無進展生存期,反映下呼吸道細菌群落對IPF損傷的肺泡造成反復持續(xù)性刺激,加劇病情進展[23-24]。LUZINA等[25]對3例IPF肺移植患者的患肺和3例供肺者的健康肺組織進行RNA-seq檢測,根據(jù)大體標本將患肺分為纖維化肺組織和纖維化旁肺組織。研究發(fā)現(xiàn),與健康對照組相比,纖維化肺組織中結締組織相關mRNA(膠原mRNA,MMP1、MMP7、威爾姆斯腫瘤蛋白和骨橋蛋白mRNA),與免疫和炎癥相關基因(CD3鏈、MS4A1/CD20、CD79A、CD40配體和FAS配體)的mRNA,細胞因子和趨化因子〔包括C-C基序趨化因子配體2(C-C motif chemokine ligand 2,CCL2)、CCL8、CCL18、CCL19、CCL22、CCL24和CCR7、CXC基序趨化因子配體12(C-X-C motif chemokine ligand 12,CXCL12)、CXCL13、CXCL14、CXCR3、白細胞介素13受體α2(interleukin-13 receptor-α2,IL-13Rα2)和IL-33〕及其mRNA表達水平均提高[25]。值得注意的是,纖維化旁肺組織呈現(xiàn)出與纖維化肺組織相似的轉錄組變化,提示未來IPF的治療方向可能由已發(fā)生纖維化病變的肺組織區(qū)轉向纖維化旁肺組織,抑制甚至阻止肺泡結構不可逆性破壞,保留肺泡完整性。
一項研究入選23例穩(wěn)定期IPF患者、8例急性加重期IPF患者和15例對照受試者,并對其肺組織進行基因表達微陣列分析研究發(fā)現(xiàn),與穩(wěn)定期IPF相比,細胞周期蛋白A2基因和α-防御素基因的表達在急性加重期上調(diào)[26]。生存分析顯示,以死亡或肺移植為終點指標,應用基因表達微陣列分析IPF患者外周血單核細胞基因表達,發(fā)現(xiàn)CD28、可誘導共刺激分子、淋巴細胞特異性蛋白酪氨酸激酶和IL-2誘導的T細胞激酶的基因表達下降與無移植存活時間減低顯著相關,提示它們可能是IPF患者生存期預測因子[27]。盡管轉錄組學尚無診斷或治療方面的突破點,但仍有助于發(fā)現(xiàn)靶基因及與病程變化和預后相關的生物標志物。隨著研究的深入、樣本量的不斷增加以及設計優(yōu)化,更多研究結果將向臨床轉化。
表觀基因組學是研究基因組修飾的一門技術?;蚪M修飾是指在不影響DNA序列的情況下調(diào)節(jié)基因表達活性和下游表型,這種調(diào)節(jié)可遺傳。常見的表觀基因組現(xiàn)象包括DNA甲基化、組蛋白修飾和非編碼RNA調(diào)控。目前已證實,IPF肺實質中存在廣泛的表觀遺傳因素導致的基因表達改變。誘發(fā)IPF的危險因素如吸煙會影響表觀遺傳標記[28]。常用的表觀基因組學包括以下檢測方法:①全基因組關聯(lián)研究,類似于GWAS,是一種無偏差的檢測方法,用于測量整個基因組的表觀遺傳修飾與疾病或表型之間的關聯(lián)[29],常用來檢測DNA甲基化差異;②染色質免疫沉淀測序(chromatin immunoprecipitation sequencing,ChIP-Seq),研究組蛋白修飾與基因表達的關系?;虮磉_和蛋白質豐度的表觀遺傳調(diào)節(jié)是一系列高度保守的生物過程,具有細胞和組織特異性,這種特性使表觀遺傳標記具有成為生物標志物和治療靶點的可能。
YANG等[30]應用針對相對甲基化的綜合高通量陣列發(fā)現(xiàn),與健康人群相比,IPF患者肺組織全基因組存在廣泛的差異甲基化區(qū)域,在2130個差異甲基化區(qū)域中,738個與顯著差異性基因表達相關,包括與IPF易感性相關的基因(NOTCH1,F(xiàn)BXO32和TOLLIP),表明表觀遺傳因素影響IPF的易感性。目前已經(jīng)發(fā)現(xiàn)一些與IPF易感性相關的基因和miRNA的差異表達、表觀基因組調(diào)控改變相關,如環(huán)氧合酶 2(cyclooxygenases-2,COX-2)[31]、趨化因子 IP-10[32]、Thy-1(CD90)[33]、p14ARF[34]、α-平滑肌肌動蛋白[35]和miR-17-92簇[36]。
最近一項研究入選160例IPF患者和108例非纖維化受試者,應用加權基因共表達網(wǎng)絡分析(weighted gene coexpression network analysis)檢測2組肺組織,IPF和對照組交叉驗證后將IPF的差異表達基因分為16個模塊(module eigengene,ME1-16),生物學功能相似的基因分在同一模塊中[37],其中與纖毛、DNA復制和修復、B細胞和未折疊蛋白反應以及細胞外基質相關的基因模塊上調(diào),與血管、T細胞和干擾素反應、白細胞活化和脫粒、表面活性劑代謝以及細胞代謝和分解代謝過程相關的基因模塊下調(diào)[37]。應用ChIP-Seq檢測IPF患者的外周血標本確定不同基因模塊相關的轉錄因子和miRNA,并對這些外周血RNA進行生存分析,發(fā)現(xiàn)ME1,ME8,ME9和ME12相關的miRNA與IPF患者生存率相關,其中纖毛相關模塊ME1與生存率關聯(lián)最大,可改善IPF 30月的生存率[37],這是首次發(fā)現(xiàn)外周血RNA可以作為IPF的生物標志物。GUIOT等[38]納入23例未治療的IPF患者、27例接受抗纖維化治療的IPF患者和27例健康受試者,收集受試者的血液樣本,根據(jù)表觀遺傳修飾,應用Nu.Q?酶聯(lián)免疫吸附測定游離核小體上的循環(huán)表位,發(fā)現(xiàn)在IPF患者中5-甲基胞嘧啶甲基化的核小體、結合高遷移率生長蛋白B1(high-mobility growth protein B1)的核小體和組蛋白H3在賴氨酸9或27殘基處乙?;暮诵◇w水平顯著低于健康受試者。根據(jù)以上4種游離核小體的表觀遺傳學修飾構建模型,其AUC達0.93(特異性80%和靈敏度91%),有可能作為IPF的生物標志物。
泛組蛋白去乙?;敢种苿┬炼1桨樊惲u肟酸(suberoylanilide hydroxamic acid,SAHA)通過3'端非翻譯區(qū)介導的轉錄后調(diào)控抑制轉化生長因子β1誘導的成纖維細胞中COX-2水平下調(diào),達到抑制纖維化的作用[39],促進原代IPF成纖維細胞凋亡,改善博來霉素誘導的小鼠肺纖維化病變,增加氣道順應性和降低氣道阻力[40]。SAHA目前被批準用于治療皮膚T細胞淋巴瘤,也是一種有前景的IPF候選藥物。表觀基因組學一直被應用于研究各種疾病,檢測多元化樣本,研究IPF的機制、生物標志物和治療靶點。
蛋白質組學是對蛋白質進行鑒定、定量、定位、修飾和其相互作用及功能檢測的一門技術。蛋白質表達水平反映細胞的代謝狀態(tài)和細胞過程。可用于檢測的標本范圍廣泛,包括誘導痰、支氣管肺泡灌洗液、血漿和血清等。常用的檢測方法包括定量蛋白質組學、組蛋白翻譯后修飾和磷酸化蛋白質組學。
我國最近一項研究應用蛋白質同位素標記的相對和絕對定量技術聯(lián)合反相色譜法及液相色譜-質譜,質譜聯(lián)用技術分析20例IPF患者肺組織和20例非纖維化受試者肺組織中的蛋白質表達。應用途徑富集分析發(fā)現(xiàn),IPF肺組織中上調(diào)的蛋白質主要與磷脂酰肌醇3-激酶-蛋白激酶信號通路、吞噬體、黏著斑、細胞外基質受體相互作用、碳代謝,以及人乳頭瘤病毒感染和核糖體通路有關,從蛋白質相互作用的途徑和調(diào)節(jié)節(jié)點描述IPF蛋白質組的改變[41]。
一項靶向蛋白質組學研究試圖從外周血中尋找IPF的蛋白質生物標志物,該研究測定了74例IPF患者和53例對照受試者血漿中的49種蛋白質濃度,對照組包括慢性阻塞性肺疾病、結節(jié)病和過敏性肺炎患者,發(fā)現(xiàn)IPF組較對照組中的MMP7和MMP1水平明顯升高,并可與對照組相鑒別[42]。從免疫細胞的變化看,蛋白質組學研究已經(jīng)鑒定出血清蛋白,包括MMP7和CCL18,與疾病嚴重程度和預后有關[43]。蛋白質組學不僅反映IPF患者蛋白質水平變化,還在不同時間和空間上反映蛋白質組成的復合物和信號網(wǎng)絡。蛋白質組學分析的高通量特性,提高了篩選生物標志物的效率。
代謝組學是指測量生物體內(nèi)所有代謝物的一門技術。代謝物包括內(nèi)源性(氨基酸、脂質、核酸和維生素)和外源性(藥物和毒素)化學物質,是參與生物體內(nèi)化學反應的小分子(<1 ku)。代謝組學反映細胞或組織活躍的生理狀態(tài),常用技術方法是核磁共振和高分辨率質譜[44-45]。目前已經(jīng)建立了公共人類代謝組數(shù)據(jù)庫(Human Metabolome Database)提供了代謝組學數(shù)據(jù),列出了42 000個代謝物可供參考[46]。多種生物樣本已用于肺部疾病的代謝組學研究,包括血清和血漿、誘導痰、呼出氣冷凝物、支氣管肺泡灌洗液以及肺組織。尿液在臨床環(huán)境中能以便捷、非侵入性的方式獲得,因此也作為檢測目標來鑒定代謝組學生物標志物。
ZHAO等[47]應用質譜法檢測8例IPF患者和8例健康受試者的肺組織,發(fā)現(xiàn)與對照組相比,IPF組存在鞘脂、精氨酸、能量代謝、血紅素和谷氨酸/天冬氨酸代謝的信號通路改變,反映IPF存在能量代謝紊亂、細胞外基質沉積、細胞增殖增加、肺結構重塑及氧化應激增加,從代謝組學角度解讀IPF發(fā)病機制。代謝物是生命活動的直觀表現(xiàn),是IPF尋找生物標志物的方向之一。一項研究納入22例未接受治療的IPF患者和18例健康受試者的血液樣本,應用超高效液相色譜結合四極桿飛行時間質譜檢測2組血漿中脂質差異,發(fā)現(xiàn)62種差異脂質,其中6種(R7,R9,R13,R16,R17和R21)可作為潛在的生物標志物,經(jīng)ROC分析可區(qū)分IPF患者與健康人群[48]。
一項研究收集了10例IPF患者和10例健康受試者的血清樣本,應用超高效液相色譜聯(lián)合高分辨率質譜的方法發(fā)現(xiàn)差異代謝物溶血磷脂酰膽堿(lysophosphatidylcholine,LysoPC),并在另外11例IPF患者和10例健康受試者中驗證LysoPC的差異性[49]。LysoPC 是溶血磷脂酸(lysophosphatidic acid,LPA)的前體,LPA是肺纖維化的已知介質,LPA1缺陷小鼠可使博來霉素誘導的肺纖維化明顯減輕[50]。這提示IPF患者血清中LysoPC升高,可能通過向LPA轉換,使LPA水平升高,從而起到促肺纖維化作用。自溶素是產(chǎn)生LPA的主要酶,GLPG1690是一種新型自分泌運動因子抑制劑,可抑制自溶素-LPA途徑。一項GLPG1690治療IPF的2a期隨機安慰劑對照試驗(FLORA),患者入選年齡≥40歲,不吸煙、不服用吡非尼酮或尼達尼布。其中20例患者完成研究,包括15例GLPG1690受試者組和5例安慰劑受試者組,其用力肺活量在第12周時較基線的平均變化分別為25 mL(95%可信區(qū)間:-75~124 mL)和-70 mL(-208~68 mL),同時GLPG1690表現(xiàn)出良好的耐受性。盡管該研究入選的樣本量小,但其用力肺活量結果仍提示GLPG1690治療有意義[51]。
IPF的發(fā)生和發(fā)展是一個多元化的復雜過程。目前,組學技術可以檢測肺組織、支氣管肺泡灌洗液、誘導痰或外周血中的DNA、RNA、蛋白質和代謝物,從不同角度、不同層次研究IPF的生物學特征。從疾病和干預治療兩方面研究,更全面地了解IPF的發(fā)生發(fā)展機制,尋找可用于早期診斷、預后評估的生物標志物,篩查治療靶點,篩選治療藥物,提供個體化精準治療的新思路。隨著技術快速發(fā)展,將出現(xiàn)多種組學方法的整合,運用現(xiàn)代高通量計算分析方法,進一步深化對疾病本質的理解,有助于開發(fā)出影響預后的新藥。