趙瑞峰,李瑞芳,程永霞,宋鑫偉
(內(nèi)蒙古師范大學(xué) 物理與電子信息學(xué)院,內(nèi)蒙古 呼和浩特 010022)
蛋白質(zhì)在生命活動(dòng)中起到不可或缺的作用。蛋白質(zhì)只有折疊成特有的空間結(jié)構(gòu)才具有生物活性、行使其特定的生物學(xué)功能,而蛋白質(zhì)分子從非折疊態(tài)到折疊態(tài)是一個(gè)動(dòng)力學(xué)和熱力學(xué)過(guò)程,當(dāng)折疊過(guò)程中出現(xiàn)錯(cuò)誤折疊,就會(huì)導(dǎo)致生物體產(chǎn)生疾?。?-2],因此研究蛋白質(zhì)的折疊過(guò)程十分必要。目前,對(duì)于蛋白質(zhì)折疊速率的研究已經(jīng)有了一些較成熟的理論方法,早期研究基于蛋白質(zhì)的三級(jí)結(jié)構(gòu),緊接著提出了蛋白質(zhì)二級(jí)結(jié)構(gòu)對(duì)蛋白質(zhì)折疊速率的影響因素,然后出現(xiàn)了許多基于氨基酸序列對(duì)蛋白質(zhì)折疊速率影響的研究[3-6]。
目前關(guān)于RNA 一級(jí)結(jié)構(gòu)和二級(jí)結(jié)構(gòu)的研究相對(duì)成熟,而有關(guān)RNA 三級(jí)結(jié)構(gòu)的研究相對(duì)較少。RNA在折疊過(guò)程中,通過(guò)雙螺旋區(qū)的成核作用、二級(jí)結(jié)構(gòu)單元間的“縮合”,最后形成具有生物學(xué)功能的三維構(gòu)象。為方便探究RNA 的三級(jí)結(jié)構(gòu),研究者們?cè)O(shè)計(jì)出了3dRNA 和RNAcomposer 等RNA 三級(jí)結(jié)構(gòu)的預(yù)測(cè)軟件[7-11],并利用這些預(yù)測(cè)軟件預(yù)測(cè)了RNA 的三級(jí)結(jié)構(gòu),通過(guò)3DNA、Curves+等對(duì)所預(yù)測(cè)的三級(jí)結(jié)構(gòu)進(jìn)行分析研究[12-13],例如對(duì)大溝和小溝、同軸堆疊等特征的研究[14-16]??紤]到蛋白質(zhì)的共翻譯折疊過(guò)程,李瑞芳等[17-18]從mRNA 的二級(jí)結(jié)構(gòu)出發(fā)分析了mRNA 二級(jí)結(jié)構(gòu)對(duì)蛋白質(zhì)折疊速率的影響,發(fā)現(xiàn)mRNA 二級(jí)結(jié)構(gòu)對(duì)蛋白質(zhì)折疊速率有很重要的影響。而mRNA 的二級(jí)結(jié)構(gòu)通過(guò)氫鍵及其他相互作用折疊成mRNA的三級(jí)結(jié)構(gòu),mRNA 三級(jí)結(jié)構(gòu)會(huì)直接影響到蛋白質(zhì)的各級(jí)結(jié)構(gòu),因此認(rèn)為mRNA 三級(jí)結(jié)構(gòu)對(duì)蛋白質(zhì)折疊速率也會(huì)有更直接的影響。本文利用3dRNA 和3DNA 軟件對(duì)mRNA 三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè),提取其中的局部堿基對(duì)參量,研究其與蛋白質(zhì)折疊速率的相關(guān)性,探究mRNA 三級(jí)結(jié)構(gòu)中局部堿基對(duì)參量對(duì)蛋白質(zhì)折疊速率的影響。
本文從整理得到的蛋白質(zhì)折疊數(shù)據(jù)庫(kù)中通過(guò)去除冗余選取出100 個(gè)蛋白質(zhì)作為研究樣本,蛋白質(zhì)折疊速率的數(shù)據(jù)來(lái)源于蛋白質(zhì)折疊速率的相關(guān)文獻(xiàn)[4-6]。本文對(duì)選取的100 個(gè)蛋白質(zhì)進(jìn)行了不同類型的分類,按照蛋白質(zhì)折疊類型,可分為56 個(gè)二態(tài)蛋白質(zhì)和44 個(gè)多態(tài)蛋白質(zhì);按照蛋白質(zhì)的二級(jí)結(jié)構(gòu),可分為22 個(gè)全α 類蛋白質(zhì),39 個(gè)全β 類蛋白質(zhì)和39 個(gè)混合類(α/β)蛋白質(zhì)。
選用3dRNA 軟件對(duì)RNA 三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。3dRNA 是基于RNA 一級(jí)結(jié)構(gòu)和二級(jí)結(jié)構(gòu)并使用最小二級(jí)結(jié)構(gòu)元素構(gòu)建RNA 三級(jí)結(jié)構(gòu)的一種自動(dòng)化方法[7-9]。該軟件有四種不同類型的任務(wù),本文選用第三種類型的任務(wù)(帶優(yōu)化的3dRNA)去預(yù)測(cè)RNA 的三級(jí)結(jié)構(gòu),首先為每個(gè)最小二級(jí)結(jié)構(gòu)元素找到三級(jí)結(jié)構(gòu)的模板,將一組或多組模板組裝在一起,再對(duì)每個(gè)組裝的結(jié)構(gòu)進(jìn)行優(yōu)化。此類型任務(wù)與其他類型任務(wù)相比,預(yù)測(cè)結(jié)果較為精確。隨后將基于3dRNA 預(yù)測(cè)出的結(jié)果導(dǎo)入3DNA 中進(jìn)行分析,從分析結(jié)果中提取出局部堿基對(duì)參量,并對(duì)局部堿基對(duì)參量進(jìn)行研究。局部堿基對(duì)參量由六個(gè)量組成,即三個(gè)平移量:兩堿基原點(diǎn)x軸相對(duì)位移(Shear)、兩堿基原點(diǎn)y軸相對(duì)位移(Stretch)和兩堿基原點(diǎn)z軸相對(duì)位移(Stagger)以及三個(gè)旋轉(zhuǎn)量:兩堿基平面繞x軸旋轉(zhuǎn)夾角(Buckle)、兩堿基平面繞y軸旋轉(zhuǎn)夾角(Propeller)和兩堿基平面繞z軸旋轉(zhuǎn)夾角(Opening)。這六個(gè)參量定量的定義了一對(duì)堿基中一個(gè)堿基相對(duì)于另一個(gè)堿基的空間排列[19],其零值描述了規(guī)范的Watson-Crick 堿基對(duì),非零值分別描述堿基對(duì)在x軸、y軸和z軸方向的變形。這些參量是通過(guò)將一個(gè)基準(zhǔn)參考系映射到另一個(gè)基準(zhǔn)參考系的剛體變化來(lái)計(jì)算的[13],其中參量Shear 和Stretch 定義了平均堿基對(duì)平面中兩個(gè)堿基原點(diǎn)分別在x軸、y軸的相對(duì)偏移量[12];Stagger 定義了平均堿基對(duì)兩個(gè)堿基原點(diǎn)在z軸的相對(duì)偏移量;Buckle 和Propeller 指堿基對(duì)內(nèi)兩個(gè)堿基平面之間繞x軸和y軸旋轉(zhuǎn)的夾角[20-22];Opening 指兩個(gè)x軸之間相對(duì)于堿基對(duì)平面的平均法線夾角[12]。局部堿基對(duì)參量Shear、Stretch 和Opening與氫鍵、接近度相關(guān)聯(lián)[12]。以此為基礎(chǔ),本文首先對(duì)所選蛋白質(zhì)相應(yīng)mRNA 的局部堿基對(duì)參量進(jìn)行統(tǒng)計(jì)計(jì)算,再根據(jù)堿基對(duì)的不同,對(duì)每個(gè)蛋白質(zhì)相應(yīng)mRNA 的各個(gè)局部堿基對(duì)參量求平均值;在此基礎(chǔ)上,詳細(xì)分析mRNA 三級(jí)結(jié)構(gòu)中各個(gè)局部堿基對(duì)參量對(duì)蛋白質(zhì)折疊速率的影響。
對(duì)于mRNA 中的每一類堿基對(duì),計(jì)算了其中的上述6 個(gè)參量值,并計(jì)算出每個(gè)蛋白質(zhì)相應(yīng)的mRNA中每類堿基對(duì)所對(duì)應(yīng)的每個(gè)參量的平均值,計(jì)算方法為
其中表示某個(gè)蛋白質(zhì)第i個(gè)堿基對(duì)的第j個(gè)局部堿基對(duì)參量的平均值,i表示堿基對(duì)類型,它的取值范圍為[1-32],具體取值定義見表1。j分別取1、2、3、4、5、6,且Shear=1、Stretch=2、Stagger=3、Buckle=4、Propeller=5、Opening=6,Nijk表示該蛋白質(zhì)第i個(gè)堿基對(duì)的第j個(gè)局部堿基對(duì)參量的第k個(gè)值,n表示該蛋白質(zhì)第i個(gè)堿基對(duì)的第j個(gè)局部堿基對(duì)參量值的個(gè)數(shù)。
表1 局部堿基對(duì)類型取值表Tab.1 Value of local base-pair
依據(jù)公式(1)計(jì)算了所選蛋白質(zhì)相應(yīng)mRNA 三級(jí)結(jié)構(gòu)中各個(gè)參量的平均值后,考慮到二態(tài)蛋白質(zhì)與多態(tài)蛋白質(zhì)的折疊方式不同,二者相應(yīng)mRNA 三級(jí)結(jié)構(gòu)的局部堿基對(duì)參量對(duì)蛋白質(zhì)折疊速率可能有不同的影響,因此將所選蛋白質(zhì)按照蛋白質(zhì)的不同折疊方式進(jìn)行分類,并在兩類蛋白質(zhì)中分別計(jì)算出每個(gè)蛋白質(zhì)在每一個(gè)堿基對(duì)類型下的各個(gè)參量的平均值。考慮到蛋白質(zhì)二級(jí)結(jié)構(gòu)的不同,又將所選蛋白質(zhì)分為全α 類、全β 類和α/β 類蛋白質(zhì),并分別計(jì)算這三類中每個(gè)蛋白質(zhì)相應(yīng)mRNA 三級(jí)結(jié)構(gòu)的各個(gè)參量的平均值。
利用回歸分析得出各局部堿基對(duì)參量的平均值與蛋白質(zhì)折疊速率的關(guān)系,并記錄回歸結(jié)果中MultipleR和SignificanceF的值。MultipleR是復(fù)相關(guān)系數(shù),又稱相關(guān)系數(shù),用R表示,反映了各參量的平均值與蛋白質(zhì)折疊速率之間相關(guān)性的強(qiáng)弱;SignificanceF對(duì)應(yīng)的是顯著性統(tǒng)計(jì)量,一般情況下等于棄真概率P值,即樣本為假的概率,本文用P值來(lái)檢驗(yàn)計(jì)算結(jié)果的置信度。
RNA 的三級(jí)結(jié)構(gòu)是由RNA 一級(jí)結(jié)構(gòu)通過(guò)堿基配對(duì)將核苷酸鏈折疊成RNA 二級(jí)結(jié)構(gòu),再通過(guò)氫鍵和其他三級(jí)相互作用再折疊形成的。RNA 三級(jí)結(jié)構(gòu)的一些重要參量如局部堿基對(duì)參量是否會(huì)對(duì)蛋白質(zhì)折疊速率產(chǎn)生影響?為了探究這個(gè)問(wèn)題做了如下分析:當(dāng)100 個(gè)蛋白質(zhì)相應(yīng)mRNA 三級(jí)結(jié)構(gòu)的局部堿基對(duì)參量數(shù)據(jù)按照不同堿基配對(duì)方式分類后,分析得到每種堿基對(duì)的各種參量與蛋白質(zhì)折疊速率的相關(guān)性結(jié)果如表2 所示。由于計(jì)算結(jié)果較多,為了更好地體現(xiàn)結(jié)果的生物學(xué)意義,表2中只呈現(xiàn)具有相關(guān)性的結(jié)果。
表2 整體蛋白質(zhì)折疊速率與各個(gè)堿基對(duì)中各參量的關(guān)系Tab.2 Relationship between the folding rates and parameters in each base-pair for overall proteins
表2 結(jié)果顯示,堿基對(duì)A-A 的Shear 參量、堿基對(duì)A+G、A-G 的Propeller 參量以及堿基對(duì)A+U 的Stretch、Opening 參量均與蛋白質(zhì)折疊速率呈正相關(guān),而堿基對(duì)A+C 的Shear 參量、堿基對(duì)A-C、C-A 的Stretch 參量均與蛋白質(zhì)折疊速率呈負(fù)相關(guān)。
前面基于所有蛋白質(zhì)研究了mRNA 三級(jí)結(jié)構(gòu)的局部堿基對(duì)參量對(duì)蛋白質(zhì)折疊速率的影響。為了研究局部堿基對(duì)參量對(duì)不同折疊類蛋白質(zhì)折疊速率的影響差異,本節(jié)將蛋白質(zhì)分為二態(tài)蛋白質(zhì)和多態(tài)蛋白質(zhì),分析了每類蛋白質(zhì)相應(yīng)mRNA 三級(jí)結(jié)構(gòu)中局部堿基對(duì)參量與蛋白質(zhì)折疊速率的相關(guān)性,結(jié)果見表3 和表4。
表3 數(shù)據(jù)顯示,在二態(tài)蛋白質(zhì)中,蛋白質(zhì)折疊速率與堿基對(duì)A-G 的Shear 參量、堿基對(duì)A+G的Stagger 參量、堿基對(duì)C-C 的Buckle 參量和堿基對(duì)A+G、A-G 的Propeller 參量均呈正相關(guān),與堿基對(duì)G-A 的Shear 參量、堿基對(duì)C-A、A-C 的Stretch 參量和堿基對(duì)U+G 的Buckle參量均呈負(fù)相關(guān)。分析表4 數(shù)據(jù)發(fā)現(xiàn),在多態(tài)蛋白質(zhì)中,堿基對(duì)A+U、G+U 的Stretch 參量、堿基對(duì)U+C 的Propeller 參量和堿基對(duì)U+G 的Stagger 參量均與蛋白質(zhì)折疊速率呈正相關(guān)。
表3 二態(tài)蛋白質(zhì)折疊速率與各個(gè)堿基對(duì)中各參量的關(guān)系Tab.3 Relationship between the folding rates and parameters in each base-pair for two-state proteins
表4 多態(tài)蛋白質(zhì)折疊速率與各個(gè)堿基對(duì)中各參量的關(guān)系Tab.4 Relationship between the folding rates and parameters in each base-pair for multistate proteins
前期研究結(jié)果表明,同一個(gè)參量對(duì)不同二級(jí)結(jié)構(gòu)類蛋白質(zhì)的折疊速率有不同的影響。將所選蛋白質(zhì)分為全α 類蛋白質(zhì),全β 類蛋白質(zhì)和α/β 類蛋白質(zhì),在每一類蛋白質(zhì)中分析了mRNA 三級(jí)結(jié)構(gòu)的局部堿基對(duì)參量與蛋白質(zhì)折疊速率的相關(guān)性,結(jié)果見表5—7。
表5 數(shù)據(jù)顯示,蛋白質(zhì)折疊速率與堿基對(duì)C-U 的Shear 參量、堿基對(duì)G+A 的Opening參量以及堿基對(duì)C+A、U-A 的Buckle 參量均呈正相關(guān),與堿基對(duì)A+A 的Opening 參量以及堿基對(duì)A-C、C+G 的Stretch 參量均呈負(fù)相關(guān),其中堿基對(duì)C+A 的Buckle 參量和堿基對(duì)A-C 的Stretch 參量與蛋白質(zhì)折疊速率均呈顯著相關(guān)性。從表6 的數(shù)據(jù)中可以看出,蛋白質(zhì)折疊速率與堿基對(duì)A+U 的Stretch 參量以及堿基對(duì)U+C、U+U 的Buckle 參量均呈正相關(guān)。表7 數(shù)據(jù)顯示,蛋白質(zhì)折疊速率與堿基對(duì)A+U、C-U 的Stretch 參量、堿基對(duì)C+G、G+G 的Propeller 參量以及堿基對(duì)A+U、C+G 的Opening 參量均呈正相關(guān)。
表5 全α 類蛋白質(zhì)折疊速率與各個(gè)堿基對(duì)中各參量的關(guān)系Tab.5 Relationship between the folding rates and parameters in each base-pair for all-α proteins
表6 全β 類蛋白質(zhì)折疊速率與各個(gè)堿基對(duì)中各參量的關(guān)系Tab.6 Relationship between the folding rates and parameters in each base-pair for all-β proteins
表7 混合類蛋白質(zhì)折疊速率與各個(gè)堿基對(duì)中各參量的關(guān)系Tab.7 Relationship between the folding rates and parameters in each base-pair for α/β proteins
為了更直觀地描述mRNA 三級(jí)結(jié)構(gòu)中局部堿基對(duì)參量對(duì)蛋白質(zhì)折疊速率的影響趨勢(shì),作出了蛋白質(zhì)折疊速率隨局部堿基對(duì)參量的變化關(guān)系圖(圖1)。
通過(guò)圖1(a)可以看出,在二態(tài)蛋白質(zhì)中蛋白質(zhì)折疊速率隨堿基對(duì)U-G 的Stretch 參量的增大而減小,但在多態(tài)蛋白質(zhì)中其變化趨勢(shì)正好相反。在二態(tài)蛋白質(zhì)中,對(duì)比圖1(b)和圖1(c)發(fā)現(xiàn)蛋白質(zhì)折疊速率隨堿基對(duì)U-G、U-A 的Stretch 參量的增大而減小,即Stretch 參量抑制蛋白質(zhì)的折疊;蛋白質(zhì)折疊速率隨堿基對(duì)U-G 的Stagger 參量、堿基對(duì)U-A 的Propeller 參量的增大而增大,即Stagger、Propeller 參量均對(duì)蛋白質(zhì)的折疊起促進(jìn)作用。通過(guò)圖1(d)、圖1(e)、圖1(f)對(duì)比多態(tài)蛋白質(zhì)中蛋白質(zhì)折疊速率隨參量的變化關(guān)系,發(fā)現(xiàn)蛋白質(zhì)折疊速率隨堿基對(duì)C-C、G-U 的Propeller 參量、堿基對(duì)U-A 的Stretch 參量以及堿基對(duì)G-U 的Buckle 參量的增大而增大,而隨堿基對(duì)C-C、U-A的Buckle 參量的增大而減小。
圖1 各參量對(duì)蛋白質(zhì)折疊速率的影響趨勢(shì)圖Fig.1 Change of the protein folding rates with parameters
本文選取了mRNA 三級(jí)結(jié)構(gòu)的局部堿基對(duì)參量來(lái)研究其對(duì)蛋白質(zhì)折疊速率的影響,利用3dRNA 和3DNA 得到了不同蛋白質(zhì)相應(yīng)mRNA 三級(jí)結(jié)構(gòu)中各個(gè)參量的具體數(shù)據(jù)。再根據(jù)堿基配對(duì)方式的不同進(jìn)行分類,并利用回歸分析了每類堿基對(duì)中各種參量與蛋白質(zhì)折疊速率的相關(guān)性。
在表2 數(shù)據(jù)中發(fā)現(xiàn)堿基對(duì)A+U 的Stretch 參量與蛋白質(zhì)折疊速率具有極顯著相關(guān)性,意味著堿基對(duì)A+U 的Stretch 參量會(huì)更大程度地促進(jìn)蛋白質(zhì)的折疊。對(duì)比表3 和表4 數(shù)據(jù)可知,在二態(tài)蛋白質(zhì)中,一些堿基對(duì)的Shear 參量對(duì)蛋白質(zhì)折疊速率有影響,Opening 參量對(duì)蛋白質(zhì)折疊速率沒(méi)有明顯影響;但與二態(tài)蛋白質(zhì)相比,多態(tài)蛋白質(zhì)中一些堿基對(duì)的Shear 參量對(duì)蛋白質(zhì)折疊速率沒(méi)有明顯影響,Opening 參量對(duì)蛋白質(zhì)折疊速率有影響;在兩種不同折疊類蛋白質(zhì)中,蛋白質(zhì)折疊速率均受到其他四個(gè)參量(Stretch、Stagger、Buckle 和Propeller)的影響,其中相應(yīng)堿基對(duì)的Stagger 參量與Propeller 參量均促進(jìn)蛋白質(zhì)的折疊,且蛋白質(zhì)折疊速率與相應(yīng)堿基對(duì)的Stagger 參量具有顯著相關(guān)性,表明在二態(tài)蛋白質(zhì)和多態(tài)蛋白質(zhì)中局部堿基對(duì)參量Stagger 對(duì)蛋白質(zhì)的折疊速率有重要影響。對(duì)比表5—7 的數(shù)據(jù)發(fā)現(xiàn),在不同二級(jí)結(jié)構(gòu)類蛋白質(zhì)中,局部堿基對(duì)參量Stretch 對(duì)蛋白質(zhì)折疊速率均有影響,其中相應(yīng)堿基對(duì)的Stretch 參量在全α 類蛋白質(zhì)中抑制蛋白質(zhì)的折疊,在混合類蛋白質(zhì)中對(duì)蛋白質(zhì)的折疊起促進(jìn)作用,對(duì)于全β 類蛋白質(zhì)來(lái)說(shuō),局部堿基對(duì)參量Stretch 在堿基對(duì)A+U 中促進(jìn)蛋白質(zhì)的折疊,在堿基對(duì)U+C 中抑制蛋白質(zhì)的折疊,說(shuō)明局部堿基對(duì)參量Stretch 也是影響蛋白質(zhì)折疊速率快慢的一個(gè)重要因素;在全α 類蛋白質(zhì)中堿基對(duì)C+A 的Buckle 參量和全β 類蛋白質(zhì)中堿基對(duì)U+U 的Buckle 參量均與蛋白質(zhì)折疊速率具有顯著相關(guān)性,但在混合類蛋白質(zhì)中對(duì)蛋白質(zhì)折疊速率無(wú)明顯影響,說(shuō)明在不同二級(jí)結(jié)構(gòu)類中局部堿基對(duì)參量Buckle 對(duì)蛋白質(zhì)折疊速率會(huì)產(chǎn)生不一樣的影響。對(duì)比圖1(d)和圖1(f)發(fā)現(xiàn),在多態(tài)蛋白質(zhì)中,局部堿基對(duì)參量Buckle 在堿基對(duì)C-C 中抑制蛋白質(zhì)的折疊,而在堿基對(duì)G-U 中促進(jìn)蛋白質(zhì)的折疊,表明不同堿基對(duì)的同一參量對(duì)蛋白質(zhì)折疊速率有不同的影響。另外,相關(guān)研究表明Buckle、Propeller 和Opening 的平均值越高,堿基對(duì)偏離理想平面幾何構(gòu)型的程度越大,表現(xiàn)出的構(gòu)象柔性越大[23],而大的構(gòu)象柔性有利于蛋白質(zhì)的折疊,這個(gè)結(jié)論很好地支撐了本文中旋轉(zhuǎn)參量對(duì)蛋白質(zhì)折疊速率影響的研究結(jié)論,但在個(gè)別堿基對(duì)中上述三個(gè)參量與蛋白質(zhì)折疊速率呈負(fù)相關(guān),這是由于堿基對(duì)的不同影響了二者的相關(guān)性。