萬(wàn) 建, 胡 原, 秦麗瑋, 熊國(guó)梅, 李 兵, 萬(wàn)翠紅, 楊繼紅
(華中師范大學(xué) 生命科學(xué)學(xué)院,湖北省生物學(xué)實(shí)驗(yàn)教學(xué)示范中心;國(guó)家級(jí)生物學(xué)虛擬仿真實(shí)驗(yàn)教學(xué)示范中心,武漢 430079)
蛋白質(zhì)組學(xué)研究的對(duì)象是一個(gè)基因組所表達(dá)的全部蛋白[1],是溝通基因組到最終生物表型的重要環(huán)節(jié)[2],為科研工作者探究生命系統(tǒng)活動(dòng)和內(nèi)部復(fù)雜的分子調(diào)控機(jī)理提供了一個(gè)新的思路[3]。隨著質(zhì)譜技術(shù)的發(fā)展,蛋白組學(xué)的研究水平得到了飛速進(jìn)步[4]。
近年來(lái)質(zhì)譜質(zhì)量分析技術(shù)快速發(fā)展[5],從最初的三重四級(jí)桿到離子井、飛行時(shí)間再到現(xiàn)在的傅里葉變換[6]。質(zhì)譜分析的精確度和分辨率取得了質(zhì)的飛躍。Nano-LC-Q-Obitrap將納升級(jí)液相色譜的高分離性能與高分辨的準(zhǔn)確質(zhì)量數(shù)Orbitrap檢測(cè)技術(shù)相結(jié)合,具備優(yōu)異性能和出色多功能性。為生命科學(xué)特別是蛋白組學(xué)領(lǐng)域提供了高質(zhì)量的研究分析手段[7]。
為拓展學(xué)生專業(yè)視野,使學(xué)生了解目前生命科學(xué)的研究熱點(diǎn)[8]。實(shí)驗(yàn)中心將液相色譜與質(zhì)譜聯(lián)用系統(tǒng)應(yīng)用到研究生教學(xué)中。本文通過實(shí)驗(yàn)摸索建立了一套基于納升級(jí)液相色譜與高分辨質(zhì)譜(Obitrap)聯(lián)用的實(shí)驗(yàn)方法,以人類全蛋白標(biāo)樣為材料,完成蛋白質(zhì)的樣品制備、液相色譜分離、質(zhì)譜檢測(cè)、蛋白質(zhì)定量分析、生物信息分析的主要實(shí)驗(yàn)流程體系[9]。
人類全蛋白酶解標(biāo)準(zhǔn)樣品(Promega公司,美國(guó));色譜純乙腈(Fisher公司,美國(guó));色譜純水(Fisher公司,美國(guó));色譜純甲酸(Fluka公司,瑞士)。
納升級(jí)液相色譜Easy-nLC1200(ThermoFisher公司,美國(guó));Obitrap質(zhì)譜儀Q-Exactive Plus(ThermoFisher公司,美國(guó));小型渦旋儀MX-S(SCILOGEX公司,美國(guó));小型低速離心機(jī)D1008(SCILOGEX公司,美國(guó));蛋白分析鑒定軟件Proteome Discoverer 2.1 SP1(ThermoFisher公司,美國(guó));蛋白數(shù)據(jù)庫(kù)檢索網(wǎng)站(http://www.uniprot.org/)。
將購(gòu)置的人類全蛋白酶解多肽標(biāo)準(zhǔn)樣品用純水溶解,配成濃度為1 μg/μL的樣品,在配好的樣品中按照0.1%的體積比加入色譜純級(jí)別的甲酸。渦旋混勻后離心備用。
色譜柱:預(yù)柱為Acclaim PepMap,C18,100 μm×2 cm,5 μm,10 nm(100 ?);分析柱為Acclaim PepMap,C18,50 μm×15 cm,2 μm,10 nm(100 ?)。
流動(dòng)相:A相為含有0.1%甲酸的純水;B相為含有10%純水的乙腈,并加有0.1%的甲酸。流速為300 nL/min,洗脫梯度[10]見表1。色譜流出樣品直接通過HESI離子源進(jìn)入質(zhì)譜。液相色譜進(jìn)樣量1 μL。
表1 色譜洗脫梯度
納升級(jí)液相色譜分離后的多肽組分進(jìn)入質(zhì)譜進(jìn)行檢測(cè)分析。主要質(zhì)譜參數(shù):離子源電壓2 kV;質(zhì)譜采集模式為正離子模式;一級(jí)質(zhì)譜采集分子量范圍350~2 000 m/z;分辨率70 000;最大離子注入時(shí)間20 ms;二級(jí)質(zhì)譜采集分辨率17 500;最大離子注入時(shí)間50 ms;TopN設(shè)定為20;碎裂能量設(shè)定為27 eV。
在開放的蛋白數(shù)據(jù)庫(kù)網(wǎng)站Uniport(http://www.uniprot.org/)上查找人類全蛋白的氨基酸序列,并以FSATA格式進(jìn)行下載[11]。導(dǎo)入到Proteome Discoverer 2.1 SP1軟件中進(jìn)行蛋白數(shù)據(jù)庫(kù)檢索。檢索參數(shù)設(shè)定:比對(duì)多肽質(zhì)量范圍350 Da~5 000 Da;信噪比(S/N)>1.5;多肽片段中氨基酸個(gè)數(shù)范圍6~144;母離子誤差<10×10-6;多肽片段誤差<0.2 Da;正反數(shù)據(jù)庫(kù)比對(duì)檢驗(yàn)閾值,顯著0.05,極顯著0.01。
分析實(shí)驗(yàn)使用的人類全蛋白酶解多肽標(biāo)樣在質(zhì)譜的總離子流(TIC)分布情況,總離子流分布均勻,并且質(zhì)譜峰型分離明顯可反映出液相色譜設(shè)置的合理與否,同時(shí)峰強(qiáng)度也可反映質(zhì)譜檢測(cè)的效率。納升級(jí)液相色譜屬于微量色譜,最小可在0.5 μL的上樣條件下完成樣品的高效分離。本次實(shí)驗(yàn)選用色譜分析柱填料為2 μm,在超過50 MPa(500 bar)的柱壓下完成分析。實(shí)驗(yàn)采用數(shù)據(jù)依賴的質(zhì)譜采集模式,完成一級(jí)質(zhì)譜掃描后,依據(jù)一級(jí)質(zhì)譜的結(jié)果,對(duì)質(zhì)譜峰強(qiáng)度較高的母離子進(jìn)行二級(jí)碎裂檢測(cè),得到二級(jí)質(zhì)譜檢測(cè)結(jié)果。依據(jù)此策略可獲得樣品中含量較高的離子二級(jí)質(zhì)譜碎裂信息[12]。
實(shí)驗(yàn)過程中進(jìn)入質(zhì)譜的樣品為人類全蛋白酶解后的多肽片段,故質(zhì)譜比對(duì)時(shí)也是以多肽片段為標(biāo)準(zhǔn)進(jìn)行比對(duì)。例如,完成多肽序列比對(duì)后的結(jié)果(見圖1),比對(duì)上的多肽氨基酸序列為TAVCDIPPR。質(zhì)譜中的高能碰撞池主要是對(duì)肽段主鏈的氨基進(jìn)行裂解,一般而言,總是產(chǎn)生等量的b 和y 碎片離子。一個(gè)滿意的序列分析一般需要對(duì)母離子進(jìn)行主鏈裂解后的完全或接近完全的指認(rèn)和歸屬[13]。此肽段由8個(gè)氨基酸組成,共比對(duì)上b碎片離子4個(gè),y碎片離子8個(gè)(見圖2)。
圖1 多肽氨基酸序列碎片信息
依據(jù)此方法完成人類全蛋白的多肽序列比對(duì),根據(jù)多肽片段的交叉覆蓋度完成全蛋白序列的拼裝。
使用專業(yè)的蛋白質(zhì)組學(xué)分析軟件Proteome Discoverer 2.1 SP1完成蛋白質(zhì)的鑒定[14]。依據(jù)button-up的策略,首先將大蛋白酶解為多肽片段,通過對(duì)多肽片段的鑒定,根據(jù)多肽片段的覆蓋度完成蛋白氨基酸序列的組裝,從而完成蛋白質(zhì)的鑒定[15]。本次實(shí)驗(yàn),首先篩選得到質(zhì)量較好的質(zhì)譜圖42 625張,通過與Uniport數(shù)據(jù)庫(kù)網(wǎng)站中的人類全蛋白多肽片段碎裂譜圖比對(duì),匹配上的質(zhì)譜圖22 592張,鑒定到肽段序列15 368條,這些肽段與數(shù)據(jù)庫(kù)中的3 617個(gè)蛋白氨基酸序列匹配。對(duì)這些蛋白氨基酸序列去除重復(fù)最終鑒定到2 939個(gè)蛋白質(zhì)。分析蛋白匹配的細(xì)節(jié),可得到更多的信息。圖3展示的是人類全蛋白中鑒定到的α-微管蛋白,蛋白氨基酸序列中有72.36%匹配到數(shù)據(jù)庫(kù)中α-微管蛋白。實(shí)驗(yàn)采用button-up的策略的蛋白鑒定策略,酶解后的多肽拼裝蛋白序列,由于樣品肽段覆蓋度及檢索比對(duì)方法設(shè)置等原因比對(duì)結(jié)果很難達(dá)到100%。
圖2 多肽氨基酸序列質(zhì)譜圖比對(duì)
圖3 人類全蛋白氨基酸序列比對(duì)結(jié)果
具有相似序列的蛋白質(zhì)具有相似的功能。因此,最可靠的確定蛋白質(zhì)功能的方法是進(jìn)行數(shù)據(jù)庫(kù)的相似性搜索。并且許多功能可直接依據(jù)蛋白質(zhì)序列預(yù)測(cè)出來(lái)。例如,疏水性信息可用于跨膜螺旋的預(yù)測(cè)[16]。通過Proteome Discoverer 2.1 SP1軟件完成蛋白質(zhì)功能數(shù)據(jù)庫(kù)比對(duì),得到檢測(cè)蛋白在細(xì)胞中的定位以及蛋白功能預(yù)測(cè)。統(tǒng)計(jì)分析得到參與代謝過程的蛋白為鑒定到總蛋白數(shù)量的24.8%,參與細(xì)胞組成的蛋白14.7%、轉(zhuǎn)運(yùn)蛋白11.4%、生物調(diào)控蛋白19.78%、應(yīng)激反應(yīng)蛋白13.15%、其他未鑒定到功能的蛋白16.17%,見圖4。
圖4 蛋白質(zhì)功能預(yù)測(cè)統(tǒng)計(jì)結(jié)果
生物信息學(xué)是目前生物學(xué)領(lǐng)域發(fā)展的熱點(diǎn)之一,而蛋白組學(xué)后續(xù)的數(shù)據(jù)處理很大程度上依賴生物信息學(xué)的發(fā)展。通過將生物信息學(xué)分析融入到實(shí)驗(yàn)教學(xué)中,使學(xué)生們感受到生物信息學(xué)在數(shù)據(jù)分析中的強(qiáng)大功能。幫助他們?cè)诮窈蟮膶W(xué)習(xí)和科研工作中更好地認(rèn)識(shí)學(xué)科交叉的意義。
應(yīng)用于教學(xué)的實(shí)驗(yàn)需要做到實(shí)驗(yàn)原理明確,實(shí)驗(yàn)步驟簡(jiǎn)單,實(shí)驗(yàn)結(jié)果穩(wěn)定易得、再現(xiàn)性高[17]。本實(shí)驗(yàn)設(shè)計(jì)滿足以上要求,且全部實(shí)驗(yàn)步驟耗時(shí)在2~3 h,但由于受到大型儀器設(shè)備使用的限制,使得本實(shí)驗(yàn)設(shè)計(jì)僅適合小班教學(xué),故在研究生的實(shí)驗(yàn)教學(xué)中推行本實(shí)驗(yàn)教學(xué)設(shè)計(jì)。
實(shí)驗(yàn)過程中,學(xué)生可自主完成大型液相色譜與質(zhì)譜聯(lián)用儀器的樣品檢測(cè),同時(shí)了解色譜洗脫梯度以及質(zhì)譜檢測(cè)模式的設(shè)定對(duì)實(shí)驗(yàn)結(jié)果的影響。了解高分辨質(zhì)譜儀器的性能,擴(kuò)寬學(xué)生對(duì)現(xiàn)代生物學(xué)分析儀器的認(rèn)識(shí)。同時(shí)也讓大型儀器在教學(xué)方面發(fā)揮作用,更好地服務(wù)于教學(xué)與科研。實(shí)驗(yàn)基于目前生物學(xué)研究的熱點(diǎn)領(lǐng)域蛋白組學(xué),融合了生物化學(xué)、分子生物學(xué)、生物信息學(xué)以及分析化學(xué)等領(lǐng)域的知識(shí),使學(xué)生們體會(huì)到學(xué)科交叉對(duì)本學(xué)科的推動(dòng)作用,增加學(xué)生對(duì)科研的興趣。