孔祥怡+石鍇+叢樂樂+王靜+蔣立軍+洪曉愉+李水明+王勇+趙晴
摘 要 分析和比較疾病組及健康對照組的混合樣品是血清多肽組生物標記物研究的常用方法,但對健康個體多肽組的差異和共性關注較少。本研究利用納升液相色譜.高分辨四級桿飛行時間質(zhì)譜鑒定健康人混合血清樣品(20例)的多肽組,闡明血清多肽組的分子量分布等一般特征,進而選取6例個體樣品單獨分析并與混合樣品的分析結(jié)果進行比較,說明正常健康樣品之間的個體差異和共同成分。結(jié)果表明,可鑒定序列的血清多肽組的分子量范圍在7000 Da以下,纖維蛋白原α鏈等蛋白質(zhì)所屬肽段的檢出頻率最高,肽段在蛋白質(zhì)水平上分布具有不均一性,排在前10%的蛋白質(zhì)占據(jù)了約50%的總肽段,而后40%的蛋白質(zhì)只有1條檢出肽段。此外,在所有樣品中都檢測到了來自于8個蛋白質(zhì)的12個共同肽段,檢測到了N端乙?;?、氨基酸氧化、磷酸化、脫氨化和脫水等翻譯后修飾和明顯的階梯序列現(xiàn)象。本研究在肽段序列水平分析了血清多肽組的基本特征和個體差異,可為血清多肽組生物標志物研究提供參考。
關鍵詞 多肽組; 高分辨飛行時間質(zhì)譜; 血清; 個體差異
1 引 言
生物體內(nèi)的內(nèi)源性多肽為蛋白質(zhì)降解的產(chǎn)物,反映了蛋白質(zhì)的降解過程,有些多肽還具有抗菌抗炎和信號傳導等作用[1]。多肽組學的概念最早出現(xiàn)于2001年,是指生物樣品中的全部肽段,生物標記物和神經(jīng)活性肽研究是多肽組學的兩個最主要應用[2]。生物標記物的一個主要來源是血液,隨著蛋白質(zhì)組學技術的完善和拓展,血清多肽組已成為基于質(zhì)譜的血液生物標記物研究的重要方法。
基質(zhì)輔助激光解吸電離.飛行時間質(zhì)譜(MALDI.TOF)和納升液相色譜.電噴霧串聯(lián)質(zhì)譜是進行多肽組研究的兩種常用技術,但它們?nèi)〉玫亩嚯慕M數(shù)據(jù)及應用模式不同。MALDI.TOF方法檢測的是肽段分子量,在多肽組中也稱為譜圖輪廓(Spectra profile)[3~5]。利用MALDI.TOF方法篩選生物標記物首先需要在疾病組與對照組中找到相同分子量的質(zhì)譜峰,然后比較它們離子強度的差異 [6,7],本方法的優(yōu)勢在于簡單、直觀、質(zhì)量檢測范圍較寬,并且MALDI源與傅里葉變換離子回旋共振質(zhì)譜或串聯(lián)飛行時間質(zhì)譜(TOF/TOF)聯(lián)用也可以獲得序列信息[8,9]。但是,在MALDI.TOF/TOF儀器中非酶切肽段的斷裂效率通常不夠充分,此外,使用MALDI源質(zhì)譜獲得的多肽組的體量相對較小,這可能與MALDI.TOF儀器較少與液相色譜聯(lián)用和MALDI源中的電離抑制作用有關,例如,即使對于蛋白質(zhì)標準品的酶切產(chǎn)物也較難檢測到全部的酶切肽段[10]。利用納升液相色譜—串聯(lián)質(zhì)譜技術則不僅顯著增加了肽段鑒定能力和數(shù)目,也可以與標記或非標記技術聯(lián)用實現(xiàn)相對定量[11,12],但是,盡管該技術拓展了血清多肽組的范圍,在應用模式上同樣為比較疾病組和健康對照組的混合樣品,對個體差異重視不夠,目前,尚未有關健康個體樣品血清多肽組差異程度的報道。
本研究利用氧化石墨烯.磷酸鑭納米磁性復合材料(LaGM)分離和富集血液多肽[13],利用納升液相色譜.高分辨串聯(lián)質(zhì)譜(Nano LC.TripleTOFTM 5600)首先分析健康人的混合血清樣本,確定多肽組的分子量范圍、肽段分布和磷酸化等翻譯后修飾特征,然后對比分析另外6個健康個體的血清樣品,探討血清多肽組的個體差異和共性。
2 實驗部分
2.1 儀器與試劑
Eksigent nanoLC.UltraTM 2D 系統(tǒng)、TripleTOF 5600+高分辨質(zhì)譜儀、Protein Pilot 4.5軟件(AB SCIEX); 真空冷凍干燥機(Thermo Savant)。
氧化石墨烯.磷酸鑭納米磁性復合材料,納升液相色譜流動相 A為0.1% 甲酸.2% 乙腈,流動相 B為0.1% 甲酸.98% 乙腈,C 18反相色譜捕集柱、C 18反相色譜分析柱。
2.2 多肽的分離和富集
30 μL人血清樣品溶解于 500 μL去離子水,與20 μL 30 mg/mL LaGM 復合材料混合,在冰水浴中渦旋2 min,1000 r/min振蕩10 min。1000 r/min離心5 min,磁分離,在沉淀物中加入500 μL 水,渦旋1 min,振蕩5 min,磁分離,去掉上層清液,重復2次。在沉淀中加入20 μL 80%乙腈+1% 三氟乙酸的洗脫液,渦旋1 min,振蕩5 min,磁分離,收集上層清液并冷凍干燥。
2.3 反相色譜.TripleTOF質(zhì)譜分析
將分離凍干的多肽樣品溶解于Nano.RPLC Buffer A中,在線Nano.RPLC液相色譜在Eksigent nanoLC.UltraTM 2D系統(tǒng)(AB SCIEX)進行,溶解后的樣品以2 μL/min的流速上樣到C 18預柱上(100 μm×3 cm, 3 μm, 15 nm),然后保持流速沖洗脫鹽10 min。 分析柱是C 18反相色譜柱(75 μm×3 cm,3 μm, 12 nm, ChromXP Eksigent),梯度洗脫條件: 0~42 min,5%~25% B; 42~56 min,25%~40% B; 56~64 min,80% B; 64~70 min,5% B。質(zhì)譜采用TripleTOF 5600+ 系統(tǒng)(AB SCIEX)。納升噴霧III離子源(AB SCIEX, USA),噴霧電壓為2.4 kV,氣簾氣壓為207 kPa,霧化氣壓為34.5 kPa,加熱溫度為150℃,質(zhì)譜掃描方式為數(shù)據(jù)依賴的采集工作模式(IDA information dependent analysis),一級TOF.MS單張圖譜掃描時間為250 ms,每次IDA循環(huán)下最多采集35個電荷為2+~7+且單秒計數(shù)大于100的二級圖譜,每張二級圖譜的累積時間為80 ms。
2.4 數(shù)據(jù)分析條件
質(zhì)譜采集到的原始wiff圖譜文件,采用Protein pilot software v. 4.5軟件進行數(shù)據(jù)加工處理和檢索分析,數(shù)據(jù)庫為Uniprot庫中的Homo sapiens人種專一數(shù)據(jù)庫(包含20210條蛋白質(zhì)序列, 2015年1月2日下載), 檢索參數(shù)設置為非酶切、磷酸化強調(diào)和生物學修飾,數(shù)據(jù)庫: uniprot_Homo sapiens(20210條蛋白質(zhì)序列),假陽性率控制為1% FDR。
3 結(jié)果與討論
3.1 血清多肽組特征及其在蛋白質(zhì)水平上的分布
在本研究中將序列相同但翻譯后修飾不同的肽段視為不同肽段, 共檢測到歸屬于64個蛋白質(zhì)的361條特異性肽段, 95%置信度下這些蛋白質(zhì)覆蓋率為從1%變化至97%。它們的質(zhì)荷比m/z 402~1046, 肽段電荷數(shù)為2~7, 等電點3.37~12.01, 一級質(zhì)量誤差均小于5 ppm, 分子量分布為863~6500, 以1~2 kDa的肽段數(shù)目為最多, 但在7 kDa分子量以下均有肽段被鑒定(圖1)。與文獻[14]一致, 本研究也發(fā)現(xiàn)肽段在蛋白質(zhì)水平上并不是平均分布。例如, 搜庫得分第一位的纖維蛋白原α鏈有83條肽段, 是總檢出肽段數(shù)目的23%, 排位前20%的蛋白質(zhì)占有了68%以上的總肽段數(shù), 而排名在后40%的26種蛋白質(zhì)都只有1條肽段被檢測。在此混合樣品中, 鑒定排名在前15位的蛋白質(zhì)及其相應的肽段鑒定數(shù)目如表1所示。此外, 檢出到了磷酸化、側(cè)鏈氨基酸殘基氧化、N端焦谷氨酸化、脫水和脫氨等多種翻譯后修飾現(xiàn)象, 例如, 在此樣本集中共檢測到26個氧化肽段和11個磷酸化肽段, 例如, 肽段GPPGPPGPPGPPGPPS來自于膠原蛋白α.1鏈, 其氮端3, 6, 9和12位的脯氨酸殘基均被氧化, 由于在串聯(lián)質(zhì)譜中鑒定到了b2~b14和y2~y12的連續(xù)碎片離子(圖2), 所以脯氨酸氧化位點可準確給出。肽段ADSGEGDFLAEGGGVR來自于纖維蛋白原α鏈, 在其N端3位的絲氨酸殘基上發(fā)生了磷酸化, 同樣觀察到了近似連續(xù)的b和y系列離子(圖3), 說明鑒定結(jié)果可靠。
3.2 血清多肽組的個體差異
多肽組中發(fā)現(xiàn)生物標志物的常用方法是分別分析疾病組和對照組的混合樣品,以尋找差異進而進行個體驗證,但是,對健康個體樣品的分析則較少,本研究以6個樣本為例探討血清多肽組的個體差異和共性。首先比較它們的蛋白質(zhì)數(shù)目、肽段數(shù)目、信號強度和分子量范圍等指標(表2)。結(jié)果表明,這些指標在不同樣品之間結(jié)果差異很大,例如,鑒定的最少和最多的肽段數(shù)目分別為253和966個,而最少和最多的蛋白質(zhì)數(shù)目分別44和104個。值得注意的是,同一血清樣品的肽段數(shù)目和蛋白質(zhì)數(shù)目并沒有嚴格的對應關系,例如253個肽段對應56個蛋白質(zhì),而966個肽段則歸屬于86個蛋白質(zhì)。在6例個體樣本中,肽段數(shù)目與蛋白質(zhì)數(shù)目的比值為4.5~13,這也反映了血清多肽組的個體差異。此外,樣品6的信號強度與樣品3和4相差一個數(shù)量級,而該值相差3倍以上可認為肽段含量有顯著性差別[15],由于樣品用量、分離方法和儀器條件均為相同設置,本研究認為這些條件的波動不會對結(jié)果造成這么大的影響,而是由于血清樣品間的多肽組成差異和濃度不同所導致。
3.3血清多肽組的共性
盡管不同樣品血清多肽組的結(jié)果存在以上差異,但是,也具有一些共同特點。首先,分子量范圍接近。多肽組學的質(zhì)量范圍是一個相對寬泛的概念,Shen等[16]認為分子量<3 kDa,使用MALDI.TOF可很容易將分子量范圍拓展至10 kDa[17],而若將多肽組理解為蛋白質(zhì)的降解產(chǎn)物,則其分子量可能會更大。但就序列鑒定而言,盡管很早就有報道Q.TOF類儀器能鑒定分子量8.6 kDa以上的肽段[18],但是通常液質(zhì)聯(lián)用技術鑒定的肽段分子量在4000以下[11,12,19],本研究鑒定的所有個體和混合血清樣本多肽組的肽段分子量范圍都在800~7000之間。TPDVSSALDKLKEFGNTLEDKARELISRIKQSELSAKMREW.FSETFQKVKEKLKIDS為最長肽段,歸屬于載脂蛋白 C.I,質(zhì)荷比為1105.4,帶6個正電荷,分子量為6632.5; 進一步分析質(zhì)譜數(shù)據(jù),多肽組中還存在分子量更大的肽段,但因斷裂不夠而未能鑒定序列。其次,在蛋白質(zhì)水平上有一些蛋白質(zhì)出現(xiàn)頻率很高,在所有個體樣品和混合樣品中都可以檢測到,例如纖維蛋白原α鏈、胸腺素β.4、斑聯(lián)蛋白和血清白蛋白等9種蛋白質(zhì),歸屬于這些蛋白質(zhì)的肽段在序列上可能非常相近,例如,只相差一個氨基酸殘,提示血清多肽組的序列存在一定變動,此結(jié)果說明相比于分子量,序列信息能夠更好地反映多肽組結(jié)果之間的聯(lián)系,推測這是當使用不同分子量作為特征值時,各實驗室之間的測定結(jié)果重現(xiàn)性不佳的原因之一[2]。盡管如此,如
分子量分別為2758.309和2758.492,如此相近的質(zhì)量不能被MALDI.TOF分辨,這也說明納升液相色譜.高分辨串聯(lián)質(zhì)譜不僅在肽段的鑒定數(shù)目上多于MALDI.TOF方法,還可以根據(jù)液相色譜保留時間的不同和良好的串聯(lián)質(zhì)譜性能而區(qū)分分子量相近的肽段。
4 結(jié) 論
本研究基于納升液相色譜.高分辨串聯(lián)質(zhì)譜建立了快速、靈敏和高效的血清多肽組學分析方法,闡明了血清多肽組肽段分布的不均一性和分子量分布范圍等多肽組基本特征,發(fā)現(xiàn)不同個體樣本的血清多肽組即在肽段水平存在共同之處,在蛋白質(zhì)水平也存在明顯差異,提示在利用血清多肽組篩選疾病標志物時需適當考慮個體差異和標志物的穩(wěn)健性,即肽段序列的差異具有一定偶然性,正常樣品的血清多肽組結(jié)果同樣存在差異,提示并不是所有肽段水平上的差異都與疾病相關。
References
1 Tinoco A D, Saghatelian A. Biochemistry, 2011, 50: 7447-7461
2 Schrader M, Schulz.Knappe P, Fricker L D. Eupa. Open. Proteomcs, 2014, 3: 171-182
3 Zapico.Muiz E, Farré.Viladrich A, Rico.Santana N, González.Sastre F, Mora.Brugués J. Pancreas., 2010 , 39(8): 1293-1298
4 Preianò M, Falcone D, Maggisano G, Montalcini T, Navarra M, Paduano S, Savino R, Terracciano R. Clin. Chim. Acta, 2014, 437(1): 120-128
5 Rico Santana N, Zapico Muiz E, Cocho D, Bravo Y, Delgado Mederos R, Martí.Fbregas J. J. Stroke. Cerebrovasc. Dis., 2014 , 23(2): 235-240
6 Zhang J N, Zhou S N, Zheng H, Zhou Y H, Chen F, Lin J X. Biochem. Biophys. Res. Commun., 2012, 421(4): 844-849
7 Zheng H, Li R X, Zhang J N, Zhou S N, Ma Q W, Zhou Y H, Chen F, Lin J X. Sci. Rep., 2014, 4: 7046
8 Nicolardi S, Velstra B, Mertens B J, Bonsing B,Mesker W E. Translational Proteomics, 2014, 2(1): 39-51
9 Hayakawa E, Landuyt B, Baggerman G, Cuyvers R, Lavigne R, Luyten W, Schoofs L. Peptides, 2013, 42: 63-69
10 WANG Yong, LI Shui.Ming, HE Man.Wen. Chinese J. Anal. Chem., 2013, 41(4): 494-499
王 勇, 李水明, 何曼文. 分析化學, 2013, 41(4): 494-499
11 Caseiro A, Ferreira R, Padro A, Quintaneiro C, Pereira A, Marinheiro R, Vitorino R, Amado F. J. Proteome Res., 2013, 12(4): 1700-1709
12 Paolo N, Fredrik L, Giulia R, Alessandra C, Peter J, Roda A. J. Chromatogr. B, 2009, 877: 3127-3136
13 Cheng G, Wang Z G, Liu Y L, Zhang J L, Sun D H, Ni J Z. Chem. Commun., 2012, 48(82): 10240-10242
14 Zheng X, Baker H, Hancock W S. J. Chromatogr. A, 2006, 1120 (1.2): 173-184
15 HONG Xiao.Yu, WANG Hao, XU Jin.Ling, LI Shui.Ming, WANG Yong. Chinese. J. Anal. Chem., 2016, 44(3): 403-408
洪曉愉, 王 浩, 徐金玲, 李水明, 王 勇. 分析化學, 2016, 44(3): 403-408
16 Shen Y F, Liu T, Tolic' N, Petritis B O, Zhao R, Moore R J, Purvine S O, Camp D G, Smith R D. J. Proteome Res., 2010, 9(5): 2339-2346
17 Liu Y, Wei F, Wang F, Li C, Meng G, Duan H, Ma Q, Zhang W. Biochem. Biophys. Res. Commun, 2015, 465(3): 476-480
18 Mhring T, Kellmann M, Jürgens M, Schrader M. J. Mass Spectro., 2005, 40(2): 214-226
19 ZHU Jun, WANG Fang.Jun, DONG Xiao.Li, YE Ming.Liang, ZOU Han.Fa. Scientia Sinica Chimica, 2010, 40(5): 546-555
朱 俊, 王方軍, 董小莉, 葉明亮, 鄒漢法. 中國科學: 化學, 2010, 40(5): 546-555
Abstract Peptidomic has become a common method of screening biomarkers, but most researches focused on the mixture samples by analyzing and comparing the results of samples from patients and healthy controls. Unfortunately, there is little study about the individual differences among healthy person and the common features of them. Here, to obtain the general characteristics of serum peptidomics including molecular weight distribution, nanoliter liquid chromatography.high resolution tandem mass spectrometry was used to analyze the mixture samples of 20 healthy human serums. Next, six cases of individual samples were analyzed and compared, indicating that there were obvious individual difference and some common features among different samples. We found that the peptides within 7000 Da could be identified and the peptides from fibrinogen α.chain were detected with the highest frequency. Additionally, the distribution of serum peptidome at protein level was heterogeneous; namely, the top 10% protein accounted about 50% of the total peptides and only one peptide was detected for the last 40% proteins. In addition, 12 common peptides arising from 8 proteins were detected in all of the samples. Furthermore, the post.translational modification including N.terminal acetylation, oxidation, phosphorylation, deamination and dehydration, as well as the obvious sequence ladder phenomenon, were detected in all samples. In conclusion, the basic characteristics of peptidomics at the sequence level were explored and the individual difference of serum peptidome was proposed, which could provide a reference for the study of serum peptide biomarkers.
Keywords Peptidome; High resolution time.of.flight mass spectrometry; Serum; Individual differences