徐紅麗 李泓瀾 馬 驍 王 靜 舒曉鷗 項永兵&
上海交通大學醫(yī)學院附屬仁濟醫(yī)院 上海市腫瘤研究所 癌基因及相關基因國家重點實驗室和流行病學研究室1(200032) 美國范德堡大學流行病學中心2
背景:膽石癥是膽道系統(tǒng)最常見的疾病之一,有關膽石癥代謝組學的研究目前尚無報道。目的:應用非靶向代謝組學技術篩選膽石癥患者的血漿代謝標志物。方法:基于上海市男、女性健康隊列開展膽石癥血漿代謝譜預初實驗。應用超高效液相色譜-四級桿飛行時間質(zhì)譜(UPLC-QTOFMS)和氣相色譜-飛行時間質(zhì)譜(GC-TOFMS)技術檢測43例基線期膽石癥患者和43名年齡配對健康對照者的血漿代謝物,采用主成分分析(PCA)、正交偏最小二乘判別分析(OPLS-DA)以及t檢驗篩選膽石癥患者的特異性代謝物。通過Logistic回歸分析構建膽石癥預測模型,以ROC曲線對模型進行初步評價。結果:UPLC-QTOFMS和GC-TOFMS共檢測出血漿代謝物618個,根據(jù)OPLS-DA VIP>1.0且t檢驗P<0.05的篩選條件,篩選出差異代謝物30個,由其中的2-甲基-4-戊烯酸、磷脂酰乙醇胺PE(p-16∶0e/0∶0)、順式-4,7,10,13,16,19-二十二碳六烯酸、2-氨基丁酸、尿酸、瓜氨酸、S-異戊烯基-L-半胱氨酸、羥環(huán)己脲和2,3-環(huán)氧甲基萘醌九個代謝物構建的膽石癥預測模型ROC曲線下面積(AUC)為0.97,敏感性和特異性分別為95.4%和88.4%。結論:膽石癥患者的血漿代謝譜發(fā)生明顯變化,由其中9個差異代謝物構建的預測模型能較好地區(qū)分膽石癥患者與健康對照者。
膽石癥(cholelithiasis)是膽道系統(tǒng)最常見的疾病之一,主要發(fā)生于膽囊和肝內(nèi)、外膽管,是一種世界范圍內(nèi)高發(fā)的疾病。調(diào)查顯示,我國1989年膽石癥患病率為6.27%,隨著國人生活條件和營養(yǎng)狀況的改善,膽石癥發(fā)病率呈逐年上升趨勢[1]。膽石癥是膽囊癌發(fā)生的重要危險因素,并與肝癌的發(fā)生以及全人群死亡率增加有一定聯(lián)系[2-5]。膽石癥發(fā)病的危險因素包括性別、年齡、飲酒、蛔蟲史、肥胖、多次妊娠、膽石癥家族史等[6-7]。在膽石形成過程中,膽汁成分和理化性質(zhì)的改變起重要作用,膽固醇結石約占膽結石的90%,其發(fā)生與脂質(zhì)代謝異常尤其是膽固醇代謝異常密切相關[8],而年齡增長、肥胖、遺傳等多種因素均可影響膽固醇代謝。然而目前尚未見有關膽石癥代謝組學(metabolomics)的研究報道。本研究應用超高效液相色譜-四級桿飛行時間質(zhì)譜(UPLC-QTOFMS)和氣相色譜-飛行時間質(zhì)譜(GC-TOFMS)技術,對膽石癥患者和健康對照者的血漿樣本進行代謝組學檢測,探索膽石癥患者的血漿代謝標志物,以期為膽石癥發(fā)病機制和早期診斷的研究奠定實驗基礎。
質(zhì)譜儀:UPLC-QTOFMS(Waters公司),GC-TOFMS(LECO公司);臺式高速冷凍離心機(Eppen-dorf公司);甲醇、乙腈(Thermo Fisher公司);4-氯苯丙氨酸、十七烷酸、吡啶、甲氧胺、三甲基氯硅烷、雙(三甲基硅基)三氟乙酰胺以及所有標準品(Sigma公司)。
研究對象來源于上海市男性和女性健康隊列,包括43例膽石癥患者和43名健康對照者。病例為基線調(diào)查時曾被診斷為膽石癥的患者,健康對照者為年齡配對的基線調(diào)查時無膽石者。男性隊列建立于2002—2006年,包括61 478名上海市40~74歲男性居民;女性隊列建立于1996—2000年,包括74 940名上海市40~70歲女性居民。兩個隊列采集的基線資料包括人口統(tǒng)計學資料、生活方式、體力活動、疾病史、身體指標測量數(shù)據(jù)等;同時采集靜脈血,分離血漿、白細胞和紅細胞,樣本于-80 ℃長期儲存。研究方案經(jīng)上海市腫瘤研究所倫理委員會審核批準,所有參與者均簽署知情同意書。
1.樣本前處理
GC-TOFMS檢測樣本前處理流程:在50 μL血漿中加入10 μL 4-氯苯丙氨酸水溶液(0.1 mg/mL)和10 μL十七烷酸甲醇溶液(1 mg/mL)作為內(nèi)標,混勻后加入175 μL甲醇、氯仿混合劑(3∶1,v/v),旋渦混勻30 s后-20 ℃靜置10 min,繼以12 000 r/min離心20 min。取200 μL上清液于玻璃衍生瓶中,室溫真空干燥。干燥后樣品采用兩步衍生法進行衍生,先加入50 μL以吡啶溶解的甲氧胺(15 mg/mL)反應90 min,再加入50 μL含1%三甲基氯硅烷的雙(三甲基硅基)三氟乙酰胺反應60 min。
UPLC-QTOFMS檢測樣本前處理流程:在40 μL血漿中加入20 μL 4-氯苯丙氨酸水溶液(30 μg/mL)作為內(nèi)標,混勻后加入500 μL乙腈、甲醇混合液(9∶1,v/v),旋渦混勻2 min后-20 ℃靜置10 min,繼以12 000 r/min離心20 min。上清液轉(zhuǎn)入采樣瓶中。
為避免系統(tǒng)誤差,兩組血漿樣本按隨機順序進樣檢測,每檢測10個樣本插入1個質(zhì)控(QC)樣本。研究中QC樣本相對標準偏差(RSD)小于15%,表明儀器精密度良好,運行穩(wěn)定。
2.GC-TOFMS分析條件
氣相色譜條件:色譜柱為DB-5MS(30 m×250 μm I.D.,0.25 μm);進樣口溫度270 ℃;載氣為高純氦氣,流速1.0 mL/min。升溫程序:80 ℃,2 min;10 ℃/min升至180 ℃;6 ℃/min升至230 ℃;40 ℃/min升至295 ℃;295 ℃維持8 min。
質(zhì)譜條件:質(zhì)譜分析采用TOF/MS,電離方式為EI;電子能量70 eV;離子源溫度220 ℃;接口溫度270 ℃;掃描范圍30~600 m/z。
3.UPLC-QTOFMS分析條件
液相色譜條件:色譜柱為Waters BEH C18(2.1 mm×100 mm,1.7 μm)。正離子源(ES+)流動相為含0.1%甲酸的水溶液(A)和含0.1%甲酸的乙腈溶液(B);負離子源(ES-)流動相為水(A)和乙腈(B)。梯度洗脫程序:0~1 min,1%~20% B;1~3 min,20%~70% B;3~8 min,70%~85% B;8~9 min,85%~100% B;1 min,100% B。柱溫40 ℃;體積流量0.4 mL/min;進樣量5 μL。
質(zhì)譜條件:質(zhì)譜分析采用Q-TOF/MS,質(zhì)譜使用ESI離子源,于正、負離子(ESI+/ESI-)模式下采集數(shù)據(jù),毛細管電壓3.0 kV/2.5 kV(+/-),采樣錐電壓35 V/40 V(+/-),離子源溫度120 ℃,進樣錐氣流速度50 L/h,脫溶劑氣溫度450 ℃,脫溶劑氣流速度900 L/h。掃描范圍50~1200 m/z,掃描時間0.3 s。
GC-TOFMS數(shù)據(jù)由ChromaTOF 軟件(v 4.24,LECO公司)進行處理,轉(zhuǎn)化為含有樣本信息、峰保留時間和峰面積的CSV數(shù)據(jù)矩陣。采用內(nèi)標對數(shù)據(jù)進行標準化處理,并排除內(nèi)標峰、假陽性峰(包括噪音、柱流失和衍生物化學試劑峰),進行峰面積的歸一化。利用工作站自帶軟件將檢測結果與NIST 11數(shù)據(jù)庫(National Institute of Standards and Tech-nology Mass Spectral Library)標準質(zhì)譜圖進行比對(匹配度>70%),比對結果以自建標準品庫進行驗證(~1 200種內(nèi)源性代謝物)。UPLC-QTOFMS獲得的原始數(shù)據(jù)由MarkerLynx軟件(v 4.1,Waters公司)進行提取,完成去噪音、峰提取、峰排列、對齊、合并、縫隙填補、數(shù)據(jù)導出等處理,輸出保留時間、質(zhì)荷比和峰強度/面積的三維數(shù)據(jù)矩陣。
將GC-TOFMS和UPLC-QTOFMS獲得的數(shù)據(jù)矩陣導入多變量統(tǒng)計軟件SIMCA-P+(v 12.0.1,Umetrics公司)進行主成分分析(PCA)和正交偏最小二乘判別分析(OPLS-DA)。對于多維統(tǒng)計分析變量權重值(VIP)>1.0的差異代謝物,進一步采用兩獨立樣本t檢驗進行篩選(P<0.05)。最后,利用KEGG數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes,https://www.genome.jp/kegg/)對差異代謝物進行代謝通路富集分析[9]。
應用SAS 9.3統(tǒng)計學軟件,采用χ2檢驗或兩獨立樣本t檢驗分析病例組與對照組間性別、年齡、體質(zhì)指數(shù)(BMI)的差異;應用MedCalc 15.2.2統(tǒng)計學軟件,采用Logistic 逐步回歸構建膽石癥預測模型(納入標準為P<0.05),對所構建的預測模型進行ROC曲線分析,計算ROC 曲線下面積(AUC)以及模型敏感性和特異性[10]。P<0.05為差異有統(tǒng)計學意義。
病例組和對照組基本情況見表1,兩組間性別、年齡、BMI差異均無統(tǒng)計學意義(P>0.05)。
表1 病例組與對照組基本情況比較
GC-TOFMS和UPLC-QTOFMS共檢測出血漿代謝物618個。病例組和對照組樣本代謝組學數(shù)據(jù)的PCA得分圖顯示兩組樣本得分點存在較多重疊,區(qū)分度不理想(圖1),需進一步分析;進一步行OPLS-DA分析,由圖2可見兩組樣本能得到較好的區(qū)分,模型R2Ycum和 Q2cum分別為0.834和0.082。為檢驗模型數(shù)據(jù)是否過擬合、重現(xiàn)性是否良好,對模型進行1 000次內(nèi)交叉驗證,Q2回歸線與Y軸截距為負值,表明模型穩(wěn)定有效。
根據(jù)由OPLS-DA模型獲得的特征變量VIP值,篩選出VIP>1.0且t檢驗P<0.05的差異代謝物共30個(表2)。病例組血漿中多種脂肪酸、氨基酸、糖等代謝物水平出現(xiàn)異常。與對照組相比,病例組血漿2-甲基-4-戊烯酸、順式-4,7,10,13,16,19-二十二碳六烯酸、正纈氨酸、N-琥珀酰-L,L-2,6-二氨基庚二酸鹽、丙二酸丁乙酯等表達水平顯著升高,磷脂酰乙醇胺PE(p-16∶0e/0∶0)、5-十八炔酸、赤酮酸、葡萄糖醇、2-氨基丁酸等表達水平顯著降低。代謝通路富集分析顯示,精氨酸生物合成、丙氨酸/天冬氨酸/谷氨酸代謝、纈氨酸/亮氨酸/異亮氨酸生物合成、苯丙氨酸/酪氨酸/色氨酸生物合成四條代謝通路變化顯著(表3)。
圖1 PCA得分圖
圖2 OPLS-DA得分圖
通過Logistic逐步回歸構建膽石癥預測模型,ROC曲線分析模型預測效能,最終構建出由2-甲基-4-戊烯酸、磷脂酰乙醇胺PE(p-16∶0e/0∶0)、順式-4,7,10,13,16,19-二十二碳六烯酸、2-氨基丁酸、尿酸、瓜氨酸、S-異戊烯基-L-半胱氨酸、羥環(huán)己脲和2,3-環(huán)氧甲基萘醌九個差異代謝物組成的膽石癥預測模型,其AUC為0.97(95% CI: 0.90~0.99),敏感性和特異性分別為95.4%和88.4%(圖3),表明差異代謝物聯(lián)合預測模型能提高對膽石癥的預測效能。
代謝組學是繼基因組學、轉(zhuǎn)錄組學、蛋白質(zhì)組學后,系統(tǒng)生物學的又一重要研究領域,致力于高通量識別和小分子代謝物的代謝量化,可用于代謝性疾病發(fā)病機制的研究[11-12]。目前,代謝組學技術已應用于多種癌癥以及糖尿病、冠心病等慢性疾病的研究[13-17]。
表2 病例組與對照組血漿差異代謝物
本研究應用UPLC-QTOFMS和GC-TOFMS兩種代謝組學技術,共篩選出30個膽石癥特異性血漿差異代謝物和4條相關代謝通路,其中由2-甲基-4-戊烯酸、磷脂酰乙醇胺PE(p-16∶0e/0∶0)、順式-4,7,10,13,16,19-二十二碳六烯酸、2,3-環(huán)氧甲基萘醌等九個差異代謝物構建的膽石癥預測模型AUC為0.97,預測效能優(yōu)異。
表3 差異代謝物代謝通路分析
預測模型回歸方程:logit(P)=-0.970 5-0.000 006 324 1×2-氨基丁酸+0.003 093 0×2-甲基-4-戊烯酸+0.000 035 824×順式-4,7,10,13,16,19-二十二碳六烯酸-0.000 011 596×瓜氨酸+0.000 000 296 74×尿酸+0.001 374 8×2,3-環(huán)氧甲基萘醌+0.002 917 9×羥環(huán)己脲-0.004 758 3×磷脂酰乙醇胺PE(p-16∶0e/0∶0)-0.006 096 1×S-異戊烯基-L-半胱氨酸
圖3差異代謝物聯(lián)合預測模型ROC曲線分析
膽石癥患者篩選出的血漿差異代謝物包含2-甲基-4-戊烯酸、磷脂酰乙醇胺PE(p-16∶0e/0∶0)、順式-4,7,10,13,16,19-二十二碳六烯酸等多種脂類。脂質(zhì)代謝異常是膽石癥發(fā)生的重要因素之一。前期研究[18]發(fā)現(xiàn),膽石癥患者外周血中多種脂蛋白[高密度脂蛋白(HDL)、低密度脂蛋白(LDL)]和載脂蛋白(Apo A、Apo B)水平與健康對照者存在顯著差異?;羧蕽萚19]采用串聯(lián)質(zhì)譜技術檢測膽石癥患者與對照者血標本中的93個代謝指標(23個氨基酸、26個?;鈮A和44個相對應比值),發(fā)現(xiàn)膽石癥患者存在多種氨基酸水平顯著降低,如天冬酰胺、半胱氨酸、組氨酸等。本研究亦發(fā)現(xiàn)膽石癥患者的血漿差異代謝物中包含多個氨基酸,與既往研究結果相似。
差異代謝物代謝通路富集分析顯示,膽石癥患者存在多條氨基酸合成和代謝通路異常。精氨酸生物合成通路中,鳥氨酸水平升高,反丁烯二酸、谷氨酸、天冬氨酸、精氨酸、瓜氨酸、谷氨酰胺、尿素、氨甲酰磷酸水平降低。精氨酸為條件必需氨基酸,與機體免疫功能、蛋白質(zhì)代謝、創(chuàng)面愈合等密切相關。Klurfeld等[20]的動物實驗研究發(fā)現(xiàn),飼料中的賴氨酸/精氨酸比例是膽石癥發(fā)生的重要影響因素。另有研究顯示,精氨酸的攝入可顯著降低血膽固醇水平[21-22],而體內(nèi)膽固醇代謝異常與結石形成密切相關[8,23]。丙氨酸/天冬氨酸/谷氨酸代通路主要參與糖代謝;纈氨酸/亮氨酸/異亮氨酸生物合成通路主要參與血糖控制、脂肪代謝等;苯丙氨酸/酪氨酸/色氨酸生物合成通路主要參與機體代謝的調(diào)節(jié)。這些通路與其他代謝性疾病,如糖尿病、骨關節(jié)炎、丙酸血癥等有一定相關性[24-26]。
本研究的優(yōu)勢主要為:①UPLC-QTOFMS和GC-TOFMS兩種代謝組學技術具有良好的互補性,能對血漿代謝物進行較為全面的檢測;②本研究是首個較全面的人膽石癥血漿代謝組學研究。同時,本研究也存在一定的局限性,如病例組和對照組樣本量較小,研究結果還需在大樣本研究中進行驗證。
綜上所述,本研究基于非靶向代謝組學技術,以膽石癥患者和健康對照者為研究對象開展膽石癥血漿代謝譜預初實驗,發(fā)現(xiàn)膽石癥患者的血漿代謝譜與健康人相比發(fā)生顯著變化,并初步鑒定出與膽石癥相關的特異性代謝物和代謝通路,構建了一個簡單的膽石癥預測模型,能較好地區(qū)分膽石癥患者與健康對照者。本研究結果為后續(xù)膽石癥研究提供了新的思路,但尚需大樣本研究加以驗證,并在人群中進行重復。