黃陽(yáng)玉 陽(yáng)秀鳳 李昊田 紀(jì)曉峰 程洪禮 趙蘊(yùn)杰郭大川 李 林 劉士勇
(華中科技大學(xué)物理學(xué)院生物分子物理與模建小組,武漢430074)
蛋白質(zhì)-RNA相互作用界面預(yù)測(cè)與設(shè)計(jì)
黃陽(yáng)玉 陽(yáng)秀鳳 李昊田 紀(jì)曉峰 程洪禮 趙蘊(yùn)杰郭大川 李 林 劉士勇*
(華中科技大學(xué)物理學(xué)院生物分子物理與模建小組,武漢430074)
蛋白質(zhì)-RNA之間的相互作用是蛋白質(zhì)在細(xì)胞里面行使功能的重要方式之一.結(jié)構(gòu)生物學(xué)家利用實(shí)驗(yàn)手段可以得到蛋白質(zhì)-RNA復(fù)合物的三維結(jié)構(gòu),通過(guò)原子水平的晶體結(jié)構(gòu)來(lái)解釋蛋白質(zhì)與RNA的識(shí)別過(guò)程.但實(shí)驗(yàn)取得蛋白質(zhì)-RNA的復(fù)合物結(jié)構(gòu)非常困難,耗錢(qián)、耗時(shí),同時(shí)受限于其相互作用強(qiáng)度.因而利用理論的方法對(duì)蛋白質(zhì)-RNA相互作用界面進(jìn)行預(yù)測(cè)與設(shè)計(jì)在生物醫(yī)學(xué)研究中十分重要.本文主要綜述了近期蛋白質(zhì)-RNA相互作用界面預(yù)測(cè)與設(shè)計(jì)方面的進(jìn)展,包括以下幾個(gè)方面:(1)蛋白質(zhì)-RNA分子對(duì)接算法以及對(duì)接前后存在的構(gòu)象變化的處理;(2)蛋白質(zhì)-RNA識(shí)別機(jī)制的研究;(3)基于蛋白質(zhì)-RNA相互作用界面的分子設(shè)計(jì).蛋白質(zhì)-RNA分子對(duì)接算法逐步完善將有助于我們對(duì)大量未知功能的蛋白質(zhì)與RNA進(jìn)行功能注釋,而基于生物大分子相互作用界面的分子設(shè)計(jì)將在藥物設(shè)計(jì)領(lǐng)域中有廣闊的應(yīng)用前景.
蛋白質(zhì)-RNA相互作用;分子對(duì)接;界面設(shè)計(jì);復(fù)合物結(jié)構(gòu)預(yù)測(cè)
蛋白質(zhì)是細(xì)胞中的主要功能分子之一.蛋白質(zhì)功能主要是通過(guò)特異性的以不同的親和力與其他各類分子(比如蛋白質(zhì)分子、RNA、DNA等)結(jié)合形成復(fù)合物來(lái)實(shí)現(xiàn).隨著RNA的催化功能被發(fā)現(xiàn),諾貝爾化學(xué)獎(jiǎng)得主沃特·吉爾伯特1提出地球上早期的生命系統(tǒng)中可能存在“RNA世界”,之后才出現(xiàn)DNA.RNA分子同時(shí)擁有存儲(chǔ)遺傳信息以及催化功能.與蛋白質(zhì)類似,RNA在溶液中可以折疊成特定的空間結(jié)構(gòu).RNA分子可以結(jié)合蛋白質(zhì)形成比較穩(wěn)定的復(fù)合物(比如核糖體)或者瞬時(shí)的復(fù)合物,這些復(fù)合物在基因表達(dá)、調(diào)控等過(guò)程發(fā)揮著重要的作用.高分辨率的復(fù)合物晶體結(jié)構(gòu)是在原子水平深入理解這些重要生物學(xué)過(guò)程的基礎(chǔ).美國(guó)科學(xué)家Venkatraman Ramakrishnan、Thomas A.Steitz和以色列女科學(xué)家Ada E.Yonath因?qū)颂求w的結(jié)構(gòu)和功能的研究分享了2009年諾貝爾化學(xué)獎(jiǎng).盡管取得了相當(dāng)大的進(jìn)展,但是目前可以得到的RNA-蛋白質(zhì)復(fù)合物結(jié)構(gòu)數(shù)目還是相當(dāng)有限的.因此,從理論方面進(jìn)行蛋白質(zhì)-RNA復(fù)合物結(jié)構(gòu)預(yù)測(cè)與界面分子設(shè)計(jì)是非常重要的基本科學(xué)問(wèn)題.本文將簡(jiǎn)明扼要介紹蛋白質(zhì)-RNA復(fù)合物結(jié)構(gòu)預(yù)測(cè)、基于蛋白質(zhì)-RNA相互作用界面的分子設(shè)計(jì)兩個(gè)方面的內(nèi)容.
人類基因組測(cè)序完成后人們發(fā)現(xiàn),人類基因組里編碼蛋白質(zhì)的基因大約不超過(guò)30000個(gè),比某些植物還少.最近大量實(shí)驗(yàn)結(jié)果表明基因組中的非編碼序列絕大部分可以表達(dá)成非編碼RNA.人們發(fā)現(xiàn)這些非編碼RNA(比如microRNA,piRNA,siRNA, g-RNA等)參與了許多重要的生物學(xué)過(guò)程.2-5除了通過(guò)RNA-RNA相互作用6來(lái)實(shí)現(xiàn)非編碼RNA的功能之外,RNA與蛋白質(zhì)特異性識(shí)別形成RNA-蛋白質(zhì)復(fù)合物在基因調(diào)控、mRNA降解和翻譯、RNA剪切、RNA代謝、RNA成熟與定位、RNA降解調(diào)控等生命過(guò)程中也起了關(guān)鍵性作用7,8(見(jiàn)表1).現(xiàn)在已經(jīng)發(fā)現(xiàn)了大量的非編碼RNA與蛋白質(zhì)的相互作用,并收集整理成數(shù)據(jù)庫(kù).9,10很多結(jié)合RNA的蛋白質(zhì)(RNA-binding proteins,簡(jiǎn)稱RBP)由少量的結(jié)合RNA的結(jié)構(gòu)域(RNA-binding domain)構(gòu)成.11常見(jiàn)的結(jié)合RNA的結(jié)構(gòu)域12-14有RRM(RNA recognition motif)、KH(K-homology)、dsRBM(double-stranded RNA-binding motif)、PAZ(取名于三個(gè)主要的Ago蛋白質(zhì):Piwi, Ago和Zwille)、PIWI、Pumilio、鋅指等.這些結(jié)構(gòu)域通過(guò)氫鍵、靜電、堆積相互作用等方式結(jié)合各種各樣的RNA.與這些蛋白質(zhì)結(jié)合的RNA有單鏈、雙鏈(詳細(xì)情況見(jiàn)表115-28).結(jié)合雙鏈的dsRBM蛋白質(zhì)一般有60-70個(gè)氨基酸長(zhǎng)度,采用αβββα折疊模式,而雙鏈RNA采用A-form的構(gòu)象,比較剛性,在與蛋白質(zhì)結(jié)合前后構(gòu)象變化不大.29蛋白質(zhì)結(jié)合RNA有時(shí)主要通過(guò)靜電相互作用進(jìn)行識(shí)別,這樣的結(jié)合沒(méi)有序列特異性(比如MRP1/MRP2與g-RNA形成復(fù)合物30).
然而要深入理解和進(jìn)一步認(rèn)識(shí)RNA-蛋白質(zhì)相互作用所發(fā)揮的生物學(xué)功能,需要知道它們的單體結(jié)構(gòu)和復(fù)合物的結(jié)構(gòu).對(duì)于RNA單體結(jié)構(gòu)預(yù)測(cè),目前主流的FARFAR,31iFoldRNA,32RNA2D3D33和MC-Fold/MC-Sym34等方法對(duì)于較小或者拓?fù)浣Y(jié)構(gòu)較為簡(jiǎn)單的RNA小分子(<50 nt(nucleotide,核苷酸)可以給出精度較高的結(jié)構(gòu)(均方根偏差(RMSD)為0.4 nm左右),然而對(duì)于分子較大或者拓?fù)浣Y(jié)構(gòu)較為復(fù)雜的RNA分子則很難給出較為精確的結(jié)果.2011年,Zhao等35開(kāi)發(fā)的方法對(duì)于小RNA雙螺旋和發(fā)卡精度可以達(dá)到0.28 nm,對(duì)于較為復(fù)雜的RNA分子精度為0.58 nm.這些RNA結(jié)構(gòu)預(yù)測(cè)工具為基于序列的RNA功能研究與分子設(shè)計(jì)打下良好的基礎(chǔ).由于RNA結(jié)構(gòu)復(fù)雜性,目前實(shí)驗(yàn)得到的RNA-蛋白復(fù)合物結(jié)構(gòu)的數(shù)目遠(yuǎn)遠(yuǎn)少于蛋白質(zhì)-蛋白質(zhì)復(fù)合物.因此,從理論上預(yù)測(cè)RNA與蛋白質(zhì)復(fù)合物結(jié)構(gòu)非常必要.
表1 RNA-蛋白質(zhì)相互作用結(jié)構(gòu)類型與功能Table 1 Structural type and function of RNA-protein interaction
2.1 蛋白質(zhì)-RNA相互作用的理論與實(shí)驗(yàn)研究
最近,文獻(xiàn)中涌現(xiàn)出大量使用計(jì)算方法研究RNA與蛋白質(zhì)相互作用的理論工作,包括構(gòu)建RNA-蛋白質(zhì)相互作用數(shù)據(jù)庫(kù),10,36,37模擬RNA與蛋白質(zhì)相互結(jié)合的機(jī)制,38分析RNA-蛋白質(zhì)相互作用界面性質(zhì),39-43從序列或者結(jié)構(gòu)來(lái)預(yù)測(cè)RNA結(jié)合蛋白質(zhì)(RNA-binding protein)、44RNA與蛋白質(zhì)共同進(jìn)化45以及結(jié)合位點(diǎn),46-52模建RNA與蛋白質(zhì)復(fù)合物結(jié)構(gòu).53-55然而,相對(duì)比較成熟的蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)方法,56-61目前還沒(méi)有一個(gè)完整的RNA-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)方法.文獻(xiàn)中報(bào)道的工作主要是利用蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)程序產(chǎn)生對(duì)接構(gòu)象,并用RNA-蛋白質(zhì)打分函數(shù)進(jìn)行挑選.62-64蛋白-蛋白復(fù)合物結(jié)構(gòu)預(yù)測(cè)分為兩個(gè)主要步驟:第一,產(chǎn)生候選構(gòu)象;第二,用打分函數(shù)對(duì)候選構(gòu)象進(jìn)行打分排序,挑選近天然的解.產(chǎn)生候選構(gòu)象的算法主要有基于剛體的對(duì)接算法(比如基于表面立方格子和表面法向量匹配算法,65基于快速傅里葉變換(FFT)剛體對(duì)接算法56,57,60,61,66,67和基于蒙特卡羅的剛體對(duì)接算法58,68)和考慮柔性的對(duì)接算法.59,69-73相對(duì)蛋白質(zhì)-蛋白質(zhì)分子對(duì)接而言,RNA-蛋白質(zhì)分子對(duì)接的研究還很少,目前仍然處于初始階段.RNA-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)研究的這種狀況,一方面是因?yàn)榻陙?lái)人們才重視非編碼RNA的作用,另一方面是RNA本身的復(fù)雜性,主要表現(xiàn)在如下幾個(gè)方面.
首先,對(duì)RNA-蛋白質(zhì)識(shí)別機(jī)制的認(rèn)識(shí)是建立RNA-蛋白質(zhì)分子對(duì)接算法的基礎(chǔ)上,但是這方面目前理論和實(shí)驗(yàn)上的研究都還非常少.相對(duì)而言,對(duì)蛋白質(zhì)-蛋白質(zhì)以及蛋白質(zhì)-DNA相互作用的機(jī)制理論74-76和實(shí)驗(yàn)77-81上都有比較多的研究,可以在RNA-蛋白質(zhì)識(shí)別機(jī)制研究中借鑒.例如Sanchez等79利用突變實(shí)驗(yàn)研究了E2C-DNA相互識(shí)別機(jī)制,他們給出了蛋白質(zhì)與DNA結(jié)合途徑:初始擴(kuò)散,然后形成一些有非天然接觸的過(guò)渡態(tài)系綜,接著形成了一個(gè)動(dòng)力學(xué)陷阱,最后非天然接觸緩慢重排并轉(zhuǎn)變成近天然的相互作用.Tang等77用順磁弛豫增強(qiáng)實(shí)驗(yàn)技術(shù)證實(shí)蛋白質(zhì)-蛋白質(zhì)在相互識(shí)別過(guò)程中達(dá)到平衡的條件下存在瞬時(shí)的、非特異性的構(gòu)象系綜,一旦由微弱的非特異性靜電相互作用形成非特異性的偶遇復(fù)合物(encounter complex),一個(gè)蛋白質(zhì)就可以在另一個(gè)蛋白質(zhì)的表面進(jìn)行二維搜索,最后掉入一個(gè)由互補(bǔ)的范德華相互作用和靜電相互作用決定的狹窄的能量漏斗中.Tang等77以及后來(lái)的Kim等76的研究都表明蛋白質(zhì)與蛋白質(zhì)在形成特異性與非特異性的相互作用中長(zhǎng)程靜電相互作用起到非常重要的作用.另一方面,Fawzi等81利用順磁弛豫增強(qiáng)實(shí)驗(yàn)技術(shù)與同位素標(biāo)記手段研究了酶I的N端結(jié)構(gòu)域(EIN)與含組氨酸的磷酸化載體蛋白質(zhì)(HPr)的結(jié)合機(jī)制,結(jié)果發(fā)現(xiàn)兩個(gè)蛋白質(zhì)在結(jié)合位點(diǎn)附近形成偶遇復(fù)合物,而這類復(fù)合物只需要少許轉(zhuǎn)動(dòng)與平動(dòng)就能變成天然復(fù)合物,此外,還觀察到HPr在結(jié)合位點(diǎn)背面與天然復(fù)合物形成三體偶遇復(fù)合物,這類復(fù)合物在EIN蛋白質(zhì)的活性位點(diǎn)被占據(jù)的情況下,提供了較高的HPr濃度.這些實(shí)驗(yàn)證據(jù)表明,蛋白質(zhì)的結(jié)合過(guò)程是先遠(yuǎn)距離靜電識(shí)別調(diào)整方向靠近,之后再由其它相互作用完成對(duì)接過(guò)程.我們最近提出了一套理論方法研究這個(gè)問(wèn)題.對(duì)benchmark 4.082中的170個(gè)蛋白質(zhì)-蛋白質(zhì)復(fù)合物進(jìn)行基于長(zhǎng)程靜電相互作用的結(jié)構(gòu)采樣,發(fā)現(xiàn)這種方向預(yù)調(diào)整過(guò)程發(fā)生的概率(14.1%)要高于隨機(jī)概率(2.8%),而且這種基于長(zhǎng)程靜電相互作用的采樣算法同樣可以預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用的位點(diǎn),準(zhǔn)確性與目前最好的界面預(yù)測(cè)算法之一PINUP83相當(dāng).
其次,對(duì)于RNA-蛋白質(zhì)相互作用體系,RNA分子主鏈上的每個(gè)磷酸基團(tuán)都帶有一個(gè)電子單位的負(fù)電荷,所以RNA分子主鏈帶有很強(qiáng)的負(fù)電荷.已經(jīng)有一些研究分析了RNA-蛋白質(zhì)相互作用界面的殘基出現(xiàn)的偏好性.39,41,43,46,47,49,51Pérez-Cano和Fernandez-Recio51提到統(tǒng)計(jì)分析的結(jié)果嚴(yán)重依賴數(shù)據(jù)集的大小,因此,我們僅對(duì)數(shù)據(jù)集中復(fù)合物數(shù)目大于100的研究46,51進(jìn)行了綜合分析.結(jié)果表明最偏好出現(xiàn)在界面的氨基酸是精氨酸(R),賴氨酸(K),組氨酸(H),其次是酪氨酸(Y),色氨酸(W),最不喜歡出現(xiàn)的是天冬氨酸(D),谷氨酸(E),半胱氨酸(C),纈氨酸(V),亮氨酸(L),異亮氨酸(I).從氨基酸的性質(zhì)來(lái)看,R、K是帶正電的,而H在pH值小于6時(shí)帶正電,D、E帶負(fù)電,C、V、L、I都是疏水氨基酸,H、Y、W具有芳香環(huán).這些結(jié)果表明靜電相互作用在RNA和蛋白質(zhì)識(shí)別中應(yīng)該發(fā)揮了重要作用,另外,H、Y、W的芳香環(huán)可能與堿基形成π-π堆積作用,40在近距離調(diào)整時(shí)發(fā)揮作用.因此,RNA和蛋白質(zhì)可能通過(guò)長(zhǎng)程靜電吸引相互作用預(yù)先調(diào)整好相互作用方向,進(jìn)而互相靠近,通過(guò)構(gòu)象調(diào)整表面擴(kuò)散完成結(jié)合過(guò)程.我們的初步研究表明,RNA和蛋白質(zhì)確實(shí)可以通過(guò)靜電相互作用在遠(yuǎn)距離識(shí)別.84但我們計(jì)算長(zhǎng)程靜電相互作用能量的方法還需要更加精確,需要考慮到溶液效應(yīng)等.
由上面分析看見(jiàn),蛋白質(zhì)與RNA之間的相互作用類型主要有四種:靜電相互作用(包含鹽橋)、堆積相互作用(stacking interaction)、范德華相互作用(包括立體組裝(steric packing)、氫鍵).這些相互作用除了可以用經(jīng)典的分子力場(chǎng)項(xiàng)來(lái)描述之外,還可以用統(tǒng)計(jì)熱力學(xué)(statistical thermodynamics)方法來(lái)進(jìn)行描述.統(tǒng)計(jì)熱力學(xué)是從物質(zhì)的原子結(jié)構(gòu)出發(fā),統(tǒng)計(jì)出在晶體結(jié)構(gòu)數(shù)據(jù)庫(kù)中殘基-殘基(或者原子-原子)相互作用對(duì)出現(xiàn)的概率,通過(guò)Boltzmann定律導(dǎo)出殘基-殘基(或者原子-原子)之間的相互作用能,其概率π(x)與能量E(x)存在如下關(guān)系:85
這里的k和T分別為波爾茲曼常數(shù)和絕對(duì)溫度,x為某一微觀狀態(tài),依據(jù)選取的統(tǒng)計(jì)對(duì)象不一樣,代表的對(duì)象不一樣,可以為某殘基-殘基對(duì),某原子-原子對(duì)等.配分函數(shù)Z(a)定義如下:
一般而言,Z(a)不太容易計(jì)算,可以通過(guò)選取某一參考態(tài)(E*(x))來(lái)計(jì)算有效的能量函數(shù):
這里π(x)是微觀狀態(tài)x在參考態(tài)出現(xiàn)的概率,E*(x)是微觀狀態(tài)x對(duì)應(yīng)的能量.對(duì)于給定的蛋白質(zhì)或者蛋白質(zhì)-RNA復(fù)合物體系而言,Z(a)和Z*(a)是一個(gè)常數(shù),與x無(wú)關(guān).如果我們假定就得到比較常用的形式:
如果考慮微觀狀態(tài)x與殘基類型(i,j),以及殘基類型i和殘基類型j之間的距離d之間的關(guān)系,上述方程可以寫(xiě)為:
可見(jiàn),相互作用能ΔE(i,j;d)主要由參考態(tài)的選取來(lái)決定,不同的參考態(tài)導(dǎo)致不同的相互作用能量函數(shù).純粹的基于距離的統(tǒng)計(jì)勢(shì)還沒(méi)有考慮到兩對(duì)相同類型的殘基對(duì)在距離相同時(shí)的取向問(wèn)題,在基于距離的統(tǒng)計(jì)勢(shì)中考慮殘基相互作用對(duì)的方向性86,87顯得比較重要.這實(shí)際上是微觀態(tài)(統(tǒng)計(jì)對(duì)象)選取的方法問(wèn)題,有時(shí)選取殘基尺度的微觀態(tài),有時(shí)選取原子尺度的,有時(shí)是粗粒化模型,88有時(shí)選取氫鍵給體受體,53,89-92這里不再贅述.從熱力學(xué)觀點(diǎn)來(lái)看,蛋白質(zhì)與RNA分子之間的識(shí)別和相互作用是一個(gè)熱力學(xué)平衡過(guò)程,其形成的穩(wěn)定蛋白質(zhì)-RNA復(fù)合物構(gòu)象是結(jié)合自由能最低的構(gòu)象.在溶液環(huán)境下面,蛋白質(zhì)與RNA的結(jié)合自由能ΔG可以估計(jì)為:
嚴(yán)格按照物理化學(xué)基本原理,計(jì)算蛋白質(zhì)與RNA結(jié)合的ΔG由于計(jì)算量太大在目前的計(jì)算條件下不太可行,因此常常用簡(jiǎn)化的方法來(lái)計(jì)算結(jié)合自由能,這些簡(jiǎn)化的自由能就稱之為打分函數(shù).93傳統(tǒng)的打分函數(shù)包括幾何互補(bǔ)項(xiàng),界面大小,范德華與靜電相互作用,堆積密度,94統(tǒng)計(jì)勢(shì)等等.本文討論的打分函數(shù)主要是以統(tǒng)計(jì)勢(shì)為主.
2.2 蛋白質(zhì)-RNA相互作用打分函數(shù)構(gòu)建
在蛋白質(zhì)-RNA復(fù)合物結(jié)構(gòu)預(yù)測(cè)中,打分函數(shù)構(gòu)建是關(guān)鍵.2011年,基于ATTRACT程序,95Setny等63開(kāi)發(fā)了一個(gè)粗?;牡鞍踪|(zhì)-RNA打分函數(shù),對(duì)于7個(gè)自由態(tài)對(duì)接(unbound docking)體系,僅有1個(gè)例子的近天然解通過(guò)打分排名后在前100之內(nèi).同年,Tuszynska等64發(fā)表了兩個(gè)基于知識(shí)的打分函數(shù),在用GRAMM程序生成的RNA-protein對(duì)接候選構(gòu)象中進(jìn)行挑選,結(jié)果發(fā)現(xiàn)8個(gè)體系中4個(gè)可以找到近天然的復(fù)合物結(jié)構(gòu).同年,Li等62開(kāi)發(fā)了一個(gè)基于殘基的豐度勢(shì),他們發(fā)現(xiàn)RNA的二級(jí)結(jié)構(gòu)狀態(tài)對(duì)打分函數(shù)性能影響較大.總的來(lái)說(shuō),目前的蛋白質(zhì)-RNA打分函數(shù)的性能還比較差,有較大的提升空間.為了構(gòu)建有效的蛋白質(zhì)-RNA相互作用打分函數(shù),可以借鑒在蛋白質(zhì)-蛋白質(zhì)分子對(duì)接中的構(gòu)建方法.在蛋白質(zhì)-蛋白質(zhì)分子對(duì)接中,打分函數(shù)主要有基于知識(shí)的打分函數(shù),96-98基于經(jīng)典分子力場(chǎng)優(yōu)化的打分函數(shù),58或者二者的組合.99單純基于物理的力場(chǎng)(physical-based forcefield)在現(xiàn)階段比基于知識(shí)(knowledge-based potential)的打分函數(shù)的性能要差,以后可能會(huì)更精確.86
對(duì)于基于知識(shí)的打分函數(shù)而言,如何定義參考態(tài)是關(guān)鍵,目前主要有三類方法定義參考態(tài).第一類就是基于較大距離進(jìn)行截?cái)?比如DFIRE100)和體積校正,第二類就是隨機(jī)混合殘基或者原子類型(比如KBP101),第三類就是基于錯(cuò)誤的構(gòu)象或者decoys (decoys就是用計(jì)算機(jī)生成的蛋白質(zhì)構(gòu)象,少部分構(gòu)象離天然構(gòu)象比較接近,稱為近天然構(gòu)象(nearnative decoys),大部分都不是近天然構(gòu)象)來(lái)定義(比如RAPDF,102PIPER67和DARS103).在基于知識(shí)的打分函數(shù)DECK104中,我們選擇了蛋白質(zhì)-蛋白質(zhì)對(duì)接的decoy來(lái)定義參考態(tài).考慮長(zhǎng)程的殘基-殘基相互作用在蛋白質(zhì)-蛋白質(zhì)識(shí)別中是相當(dāng)重要,我們通過(guò)考慮殘基類型所處的二級(jí)結(jié)構(gòu)狀態(tài)來(lái)定義殘基類型,從而間接考慮了殘基-殘基的長(zhǎng)程相互作用.為了測(cè)試這點(diǎn)是否有效,我們把DECK與當(dāng)時(shí)文獻(xiàn)中最好的打分函數(shù)DCOMPLEX,105RosettaDock58和 ZRANK99進(jìn)行了詳細(xì)測(cè)試比較.在RosettaDock的蛋白質(zhì)-蛋白質(zhì)對(duì)接decoys中測(cè)試結(jié)果表明DECK比其它幾個(gè)要好.104我們把原子溶劑化參數(shù)模型與FFT算法相結(jié)合,開(kāi)發(fā)了全新的蛋白質(zhì)-蛋白質(zhì)分子對(duì)接程序ASPDock,60獲得了比幾何打分更好的效果.ASPDock與打分函數(shù)DECK連用,參加CAPRI (Critical Assessment of Prediction of Interactions,蛋白相互作用預(yù)測(cè)技術(shù)評(píng)估大賽,每次給定兩個(gè)相互作用蛋白質(zhì)在結(jié)合前的結(jié)構(gòu),預(yù)測(cè)其復(fù)合物結(jié)構(gòu))的對(duì)接比賽,準(zhǔn)確預(yù)測(cè)了T40和T41(見(jiàn)圖1106,107).在CAPRI打分預(yù)測(cè)比賽中,DECK準(zhǔn)確地預(yù)測(cè)了T32, T40,T41,T50,T53.而王存新小組開(kāi)發(fā)的HPNC-score93,108,109也準(zhǔn)確地預(yù)測(cè)了T35,T37,T40,T41.93
比較好的打分函數(shù)主要由基于知識(shí)的勢(shì)和基于經(jīng)典分子力場(chǎng)項(xiàng)(范德華相互作用,靜電相互作用等)進(jìn)行線性擬合得到.58,110,111缺點(diǎn)是基于知識(shí)的勢(shì)與經(jīng)典分子力場(chǎng)項(xiàng)的混雜組合沒(méi)有明確的物理意義,很難進(jìn)一步改進(jìn).為了彌補(bǔ)這一缺陷,可以利用基于統(tǒng)計(jì)勢(shì)的方法對(duì)基于分子立場(chǎng)項(xiàng)的參數(shù)進(jìn)行確定(fluctuation matching),這樣得到的打分函數(shù)的每項(xiàng)具有物理意義,而參數(shù)具有統(tǒng)計(jì)意義,目前在蛋白質(zhì)結(jié)合前后構(gòu)象變化研究112,113與蛋白質(zhì)-RNA相互作用力場(chǎng)63中取得重要進(jìn)展.該方法可能對(duì)蛋白質(zhì)-蛋白質(zhì)、蛋白質(zhì)-RNA相互作用研究有幫助.另一個(gè)可能提高打分函數(shù)精度的方面是在傳統(tǒng)的基于距離的統(tǒng)計(jì)勢(shì)中考慮殘基相互作用對(duì)的方向性.86,87
2.3 蛋白質(zhì)-RNA分子對(duì)接中的構(gòu)象變化
RNA-蛋白質(zhì)分子對(duì)接構(gòu)象采樣遇到了很大的困難,主要原因是RNA分子存在很大的柔性.RNA與蛋白質(zhì)對(duì)接前后,蛋白質(zhì)構(gòu)象變化不大,114RNA在結(jié)合前后構(gòu)象變化較大(例如轉(zhuǎn)錄因子NF-κB二聚體體系.RNA在結(jié)合前后的RMSD為0.54 nm51). RNA-蛋白質(zhì)在識(shí)別過(guò)程中存在的構(gòu)象變化,并由此造成對(duì)接或者打分函數(shù)挑選近天然構(gòu)象失敗.蛋白質(zhì)在結(jié)合配體過(guò)程中的構(gòu)象變化可以分解為一些正則運(yùn)動(dòng)模式.70,112,115-119利用這些相關(guān)的正則運(yùn)動(dòng)模式的線性組合來(lái)生成新的受體構(gòu)象,也許可以實(shí)現(xiàn)蛋白質(zhì)-RNA的柔性分子對(duì)接.
2.4 蛋白質(zhì)-RNA分子對(duì)接與蛋白質(zhì)-蛋白質(zhì)分子對(duì)接的區(qū)別與聯(lián)系
RNA與蛋白質(zhì)相互作用界面特征和蛋白質(zhì)與蛋白質(zhì)相互作用界面有很大的不同,不能把蛋白質(zhì)-蛋白質(zhì)對(duì)接方法直接用于RNA-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè).Chen等53用Rosetta程序包從5個(gè)RNA-蛋白質(zhì)天然復(fù)合物出發(fā)進(jìn)行微擾對(duì)接產(chǎn)生候選構(gòu)象.基于距離的氫鍵相互作用勢(shì)53和基于原子的統(tǒng)計(jì)勢(shì)55都可以很好區(qū)分天然復(fù)合物與候選構(gòu)象,但不能有效地從候選構(gòu)象中挑選近天然的對(duì)接構(gòu)象,而這一點(diǎn)在實(shí)際預(yù)測(cè)問(wèn)題中更重要.此外,基于天然復(fù)合物的微擾對(duì)接與具有實(shí)際意義的分子對(duì)接還有很大距離.2010年,Perez-Cano和Fernandez-Recio51利用蛋白質(zhì)-蛋白質(zhì)對(duì)接FTDOCK程序66對(duì)RNA-蛋白質(zhì)進(jìn)行了分子對(duì)接的研究,利用基于統(tǒng)計(jì)的殘基-核苷酸豐度勢(shì)作為打分函數(shù)對(duì)分子對(duì)接結(jié)果進(jìn)行挑選,并用于蛋白質(zhì)相互作用預(yù)測(cè)技術(shù)評(píng)估大賽CAPRI的RNA-蛋白質(zhì)體系.51,120這個(gè)結(jié)合豐度勢(shì)與FTDOCK對(duì)接算法的方法在12個(gè)RNA-蛋白質(zhì)的體系上進(jìn)行了測(cè)試,結(jié)果表明FTDOCK能夠在7個(gè)系統(tǒng)中產(chǎn)生近天然的復(fù)合物結(jié)構(gòu)(RMSD<1 nm),而用基于豐度的勢(shì)進(jìn)行打分排序以后,僅有2個(gè)系統(tǒng)的近天然的解排名在10以內(nèi).這個(gè)結(jié)果說(shuō)明了目前RNA-蛋白質(zhì)對(duì)接方法還有很大局限性,直接把蛋白質(zhì)-蛋白質(zhì)對(duì)接方法FTDOCK應(yīng)用到RNA-蛋白質(zhì)體系存在一些問(wèn)題,另外,基于統(tǒng)計(jì)的殘基-核苷酸豐度勢(shì)具有一定的挑選能力,但其有效性還不令人滿意,需要進(jìn)一步提高.這些結(jié)果表明幾何互補(bǔ)性在蛋白質(zhì)與RNA或蛋白質(zhì)與蛋白質(zhì)相互識(shí)別中都起到很重要的作用,但是其具體參數(shù)具有顯著性差異.
基于以上分析,我們對(duì)蛋白質(zhì)-蛋白質(zhì)界面與RNA-蛋白質(zhì)界面進(jìn)行了比較,試圖找尋二者之間的異同點(diǎn)以及原因.這樣,我們可以對(duì)蛋白質(zhì)-蛋白質(zhì)對(duì)接方法進(jìn)行改進(jìn),使之適應(yīng)RNA-蛋白質(zhì)相互作用系統(tǒng).相比蛋白質(zhì)-蛋白質(zhì)復(fù)合物界面,RNA-蛋白質(zhì)復(fù)合物界面有著明顯的不同,即便在界面原子堆積上,也有著不同之處.我們選取我們自己挑選的80個(gè)復(fù)合物的數(shù)據(jù)集作為蛋白-RNA復(fù)合物的代表,而蛋白質(zhì)分子對(duì)接數(shù)據(jù)集82作為蛋白質(zhì)-蛋白質(zhì)復(fù)合物的代表,來(lái)分析這兩者之間的界面原子堆積的不同.分析結(jié)果表明RNA-蛋白質(zhì)界面的幾何互補(bǔ)特征與蛋白質(zhì)-蛋白質(zhì)界面的幾何互補(bǔ)特征有顯著不同.根據(jù)界面特性,我們初步建立了一個(gè)新的RNA-蛋白質(zhì)對(duì)接算法RPDock,包括了基于FFT的對(duì)接和基于殘基距離的粗?;蚍?在對(duì)接中,一方面,針對(duì)RNA-蛋白質(zhì)界面和蛋白質(zhì)-蛋白質(zhì)界面的不同,我們優(yōu)化了幾何參數(shù),使之更適于RNA-蛋白質(zhì)對(duì)接;另一方面,RNA-蛋白質(zhì)復(fù)合物形成過(guò)程中靜電的作用非常重要,我們?cè)趯?duì)接中考慮了靜電項(xiàng).在粗?;蚍种?根據(jù)氨基酸殘基的大小,側(cè)鏈偶極矩和不同的二級(jí)結(jié)構(gòu)類型,我們將氨基酸殘基分為21類;根據(jù)核苷酸的類型和二級(jí)結(jié)構(gòu),我們將核苷酸分為8類.我們?cè)赑erez-Cano等121提出的包含有81個(gè)RNA-蛋白質(zhì)復(fù)合物體系的測(cè)試集中進(jìn)行了測(cè)試.結(jié)果表明,RPDock預(yù)測(cè)1000個(gè)構(gòu)象的對(duì)接成功率是66%,而FTDock和GRAMM的成功率分別是56%和54%.通過(guò)基于殘基距離的粗?;蚍趾?RPDock預(yù)測(cè)1個(gè)構(gòu)象的成功率達(dá)到16%,預(yù)測(cè)10個(gè)構(gòu)象的成功率達(dá)到32%.可見(jiàn),雖然對(duì)接的成功率比較高,但是打分函數(shù)的性能還不夠好.
為了構(gòu)建有效的打分函數(shù),近期我們建立了一個(gè)蛋白質(zhì)與RNA反應(yīng)的結(jié)合常數(shù)的數(shù)據(jù)集(http:// biophy.hust.edu.cn/PRD/protein-RNA.html),收集了46個(gè)非冗余的蛋白-RNA復(fù)合物的平衡解離常數(shù).在這個(gè)數(shù)據(jù)集中,除了給出了結(jié)合常數(shù)外,我們還給出了各個(gè)結(jié)合常數(shù)的測(cè)定方法與條件,并且由結(jié)合常數(shù)推出了在反應(yīng)過(guò)程中的吉布斯自由能的變化值.這些數(shù)據(jù)可以用于蛋白質(zhì)-RNA對(duì)接打分函數(shù)的構(gòu)建.在我們的結(jié)合常數(shù)數(shù)據(jù)集文章投稿過(guò)程中,兩個(gè)小組發(fā)表了2個(gè)非冗余的蛋白質(zhì)-RNA分子對(duì)接測(cè)試數(shù)據(jù)集,121,122這兩個(gè)數(shù)據(jù)集為大家評(píng)估蛋白質(zhì)-RNA分子對(duì)接方法提供了方便.
2.5 蛋白質(zhì)-RNA分子對(duì)接的解決方案
綜上所述,RNA-蛋白分子結(jié)合機(jī)制與復(fù)合物結(jié)構(gòu)預(yù)測(cè)研究中存在的主要問(wèn)題以及解決方案有三點(diǎn):其一,RNA與蛋白質(zhì)在長(zhǎng)程靜電相互作用的約束下,RNA-蛋白質(zhì)對(duì)接方向和對(duì)接界面不清楚.而我們?cè)诘鞍踪|(zhì)-蛋白質(zhì)相互作用體系里面開(kāi)發(fā)了快速有效的研究長(zhǎng)程靜電相互作用的方法,可以用在這里給出RNA-蛋白質(zhì)對(duì)接方向和對(duì)接界面;
其二,如何考慮RNA-蛋白質(zhì)相互作用存在的構(gòu)象變化?在分子對(duì)接形成初步的復(fù)合物構(gòu)象時(shí),我們可以對(duì)其進(jìn)行分子動(dòng)力學(xué)模擬,觀察其構(gòu)象變化.
其三,如何利用機(jī)制研究的結(jié)果改進(jìn)RNA-蛋白質(zhì)分子對(duì)接算法?機(jī)制研究可以得到大致的對(duì)接方向和位點(diǎn)信息,可以把這些信息整合到我們已有的對(duì)接算法RPDock中.以上三點(diǎn)的具體細(xì)節(jié)我們將在以后的研究中逐步展開(kāi).
10多年前,Hermann123總結(jié)了一些基于RNA-蛋白質(zhì)復(fù)合物的藥物設(shè)計(jì)策略.受限于對(duì)RNA-蛋白質(zhì)相互作用的理解,這個(gè)領(lǐng)域發(fā)展緩慢.2011年, Mackay等124提出既然識(shí)別雙螺旋DNA的蛋白質(zhì)已經(jīng)商業(yè)化,那么顯然就可以考慮一個(gè)類似的問(wèn)題:能否設(shè)計(jì)一個(gè)蛋白質(zhì)可以特異性識(shí)別RNA尾端序列?最近,兩篇對(duì)蛋白質(zhì)-RNA相互作用進(jìn)行設(shè)計(jì)的文章125,126回答了這一重要問(wèn)題并引起廣泛的注意,Chen和Varani127專門(mén)為此寫(xiě)了評(píng)論.兩個(gè)小組使用類似的酵母三雜交系統(tǒng)的實(shí)驗(yàn)方案找到了PUF蛋白質(zhì)(Pumilio and FBF[fem-3 binding factor])的突變體(見(jiàn)圖2),該突變體可以特異性地識(shí)別胞嘧啶,而在此之前發(fā)現(xiàn)的PUF蛋白質(zhì)以及突變體都不能識(shí)別胞嘧啶.128這一發(fā)現(xiàn)使得研究人員可以人工設(shè)計(jì)出能夠結(jié)合任意給定的RNA序列的PUF突變體.該新技術(shù)為人們研究生物學(xué)問(wèn)題提供了一個(gè)很好的機(jī)會(huì),比如Cooke等129馬上利用該技術(shù)應(yīng)用于FBF-2/GLD-2融合蛋白的翻譯調(diào)控.PUF突變體與RNA之間的詳細(xì)研究表明,氫鍵相互作用、范德華相互作用與堆積相互作用128,130決定了二者之間特異性識(shí)別,而大量的相關(guān)實(shí)驗(yàn)數(shù)據(jù)(比如蛋白質(zhì)-RNA復(fù)合物晶體結(jié)構(gòu)與結(jié)合常數(shù))將快速推動(dòng)蛋白質(zhì)-RNA相互作用理論方法的發(fā)展.目前實(shí)現(xiàn)的例子是蛋白質(zhì)與單鏈短片段RNA(線性片段)之間的識(shí)別,而且是純粹的基于實(shí)驗(yàn)的方法.如果要實(shí)現(xiàn)蛋白質(zhì)與雙鏈RNA或者折疊后的RNA之間的特異性識(shí)別與設(shè)計(jì),純粹的基于實(shí)驗(yàn)的方法將面臨組合爆炸困難,必然要借助于蛋白質(zhì)-RNA分子對(duì)接工具或者蛋白質(zhì)-蛋白質(zhì)界面設(shè)計(jì)的策略來(lái)進(jìn)行.下面簡(jiǎn)單介紹一種蛋白質(zhì)-蛋白質(zhì)界面設(shè)計(jì)的策略.
圖2 設(shè)計(jì)出能夠結(jié)合任意給定的RNA序列的PUF突變體Fig.2 Designed PUF mutant which can bind any given RNAsequence(a)interaction of wild-type PUF(NYxxQ)with U3 RNA(PDB 3BSB);(b)interaction of PUF-R6(SYxxR)with C3 RNA(PDB 2YJY).RNAbase and side chain of the key residues are shown as stick models.Hydrogen bonds are shown as dashed lines.After double mutation,the author126got a mutant PUF-R6,which can bind cytosine,however,the native PUF can not bind cytosine.The picture was plotted by pymol(http://www.pymol.org/).
蛋白質(zhì)-蛋白質(zhì)相互作用是蛋白質(zhì)在細(xì)胞內(nèi)發(fā)揮生物學(xué)功能的重要形式,因而是一個(gè)重要的藥物設(shè)計(jì)全新靶標(biāo),131-135并受到越來(lái)越多的關(guān)注.促紅細(xì)胞生成素(EPO)通過(guò)和它的受體(EPOR)相互作用,促進(jìn)紅細(xì)胞的分化和成熟.EPO已廣泛應(yīng)用于臨床上各種貧血的治療.但是用于生產(chǎn)重組EPO的哺乳動(dòng)物細(xì)胞的培養(yǎng)成本很高,同時(shí)表達(dá)量不高,因而使用EPO治療是相當(dāng)昂貴的.利用已建立的一套“蛋白質(zhì)關(guān)鍵殘基嫁接”算法,Lai課題組136設(shè)計(jì)了具有EPO活性的功能蛋白質(zhì).生物測(cè)活實(shí)驗(yàn)表明設(shè)計(jì)的功能蛋白質(zhì)PLC-δ1 PH結(jié)構(gòu)域突變體具有拮抗EPO生物活性的功能,體外的平衡解離常數(shù)(Kd)為20 nmol·L-1,細(xì)胞實(shí)驗(yàn)得到的IC50為5.7 μmol·L-1.該P(yáng)H蛋白質(zhì)進(jìn)行突變后與EPO只有幾個(gè)功能殘基一樣,卻具有了和EPOR結(jié)合的功能,而這種功能在自然界中是不存在的.這個(gè)例子驗(yàn)證了蛋白的疏水核心只起骨架的作用,功能由其局部表面決定的觀點(diǎn).這是首個(gè)將序列上非連續(xù)的配體-受體相互作用區(qū)嫁接到非同源的骨架蛋白質(zhì)上的成功的例子.在2011年,華盛頓大學(xué)的計(jì)算生物學(xué)者Baker和他的同事在Science上發(fā)表文章,報(bào)道了他們通過(guò)蛋白質(zhì)-蛋白質(zhì)分子對(duì)接方法與熱點(diǎn)殘基庫(kù)(hotspot library)相結(jié)合設(shè)計(jì)出來(lái)的蛋白HB36和HB80,能夠結(jié)合到廣泛流行性病毒1918 H1N1蛋白血凝素(HA).137隨同發(fā)表在Science上的評(píng)論性的文章里, Der和Kuhlman138寫(xiě)道:“This strategy is reminiscent of a previous approach that involved grafting key residues from a known interaction onto a new protein scaffold to generate a new binding pair.”這說(shuō)明Baker小組采用了和來(lái)魯華課題組已發(fā)表的工作(嫁接關(guān)鍵殘基)136比較類似的策略.最近,Zhang和Lai139將這一嫁接策略用于酶的活性位點(diǎn)設(shè)計(jì).在不久的將來(lái),類似的蛋白質(zhì)嫁接策略可能會(huì)在其它生物功能體系中被成功實(shí)現(xiàn).更復(fù)雜精細(xì)的策略可能需要在設(shè)計(jì)中考慮對(duì)蛋白質(zhì)結(jié)合與解離的動(dòng)力學(xué)過(guò)程有影響的因素.140顯然,這一策略還可以用于蛋白質(zhì)-RNA相互作用界面的分子設(shè)計(jì).
本文總結(jié)了蛋白質(zhì)-RNA分子對(duì)接與設(shè)計(jì).利用基于知識(shí)的統(tǒng)計(jì)勢(shì)(打分函數(shù))與多尺度的粗?;P?構(gòu)象變化)對(duì)蛋白質(zhì)與RNA的相互作用機(jī)制進(jìn)行分析,有助于我們構(gòu)建比較好的蛋白質(zhì)-RNA相互作用計(jì)算方法.其次,把“蛋白質(zhì)關(guān)鍵殘基嫁接”算法應(yīng)用到蛋白質(zhì)-RNA相互作用體系,可能設(shè)計(jì)出特定功能的蛋白質(zhì)或者具有特定功能的RNA分子.這類策略將在以蛋白質(zhì)-RNA相互作用界面作為“藥物靶標(biāo)”的研究中具有應(yīng)用前景.
(1) Gilbert,W.Nature 1986,319,618.
(2) Zhang,W.;Ye,K.Q.Chinese Bulletin of Life Sciences 2010,22, 608. [張 煒,葉克窮.生命科學(xué),2010,22,608.]
(3) Zhao,S.;Liu,M.F.Chinese Bulletin of Life Sciences 2010,22, 623. [趙 爽,劉默芳.生命科學(xué),2010,22,623.]
(4) Shao,W.;Fan,Y.J.;Xu,Y.Z.Chinese Bulletin of Life Sciences 2010,22,711.[邵 偉,樊玉杰,徐永鎮(zhèn).生命科學(xué),2010,22, 711.]
(5) Chen,R.S.Sci.China Life Sci.2010,22,594. [陳潤(rùn)生.生命科學(xué),2010,22,594.]
(6) Zheng,L.L.;Qu,L.H.Chinese Bulletin of Life Sciences 2010, 40,294. [鄭凌伶,屈良鵠.中國(guó)科學(xué)生命科學(xué),2010,40, 294.]
(7) Liu,M.F.;Wang,E.D.Chinese Bulletin of Life Sciences 2008, 20,178. [劉默芳,王恩多.生命科學(xué),2008,20,178.]
(8) Licatalosi,D.D.;Mele,A.;Fak,J.J.;Ule,J.;Kayikci,M.;Chi, S.W.;Clark,T.A.;Schweitzer,A.C.;Blume,J.E.;Wang,X.; Darnell,J.C.;Darnell,R.B.Nature 2008,456,464.doi: 10.1038/nature07488
(9)Yang,J.H.;Li,J.H.;Shao,P.;Zhou,H.;Chen,Y.Q.;Qu,L.H. Nucleic Acids Research 2011,39,D202.
(10) Wu,T.;Wang,J.;Liu,C.;Zhang,Y.;Shi,B.;Zhu,X.;Zhang, Z.;Skogerbo,G.;Chen,L.;Lu,H.;Zhao,Y.;Chen,R.Nucleic Acids Research 2006,34,D150.
(11) Lunde,B.M.;Moore,C.;Varani,G.Nature Reviews.Molecular Cell Biology 2007,8,479.doi:10.1038/nrm2178
(12) Clery,A.;Blatter,M.;Allain,F.H.Current Opinion in Structural Biology 2008,18,290.doi:10.1016/j.sbi.2008.04.002
(13) Maris,C.;Dominguez,C.;Allain,F.H.The FEBS Journal 2005,272,2118.doi:10.1111/j.1742-4658.2005.04653.x
(14) Chen,Y.;Varani,G.The FEBS Journal 2005,272,2088.doi: 10.1111/ejb.2005.272.issue-9
(15)Antson,A.A.;Dodson,E.J.;Dodson,G.;Greaves,R.B.;Chen, X.;Gollnick,P.Nature 1999,401,235.doi:10.1038/45730
(16) Frazao,C.;McVey,C.E.;Amblar,M.;Barbas,A.;Vonrhein,C.; Arraiano,C.M.;Carrondo,M.A.Nature 2006,443,110.doi: 10.1038/nature05080
(17)Hudson,B.P.;Martinez-Yamout,M.A.;Dyson,H.J.;Wright,P. E.Nature Structural&Molecular Biology 2004,11,257.doi: 10.1038/nsmb738
(18) Lewis,H.A.;Musunuru,K.;Jensen,K.B.;Edo,C.;Chen,H.; Darnell,R.B.;Burley,S.K.Cell 2000,100,323.doi:10.1016/ S0092-8674(00)80668-6
(19) Lu,D.;Searles,M.A.;Klug,A.Nature 2003,426,96.doi: 10.1038/nature02088
(20) Ma,J.B.;Ye,K.;Patel,D.J.Nature 2004,429,318.doi: 10.1038/nature02519
(21) Ma,J.B.;Yuan,Y.R.;Meister,G.;Pei,Y.;Tuschl,T.;Patel,D. J.Nature 2005,434,666.doi:10.1038/nature03514
(22) Oberstrass,F.C.;Lee,A.;Stefl,R.;Janis,M.;Chanfreau,G.; Allain,F.H.Nature Structural&Molecular Biology 2006,13, 160.doi:10.1038/nsmb1038
(23) Oubridge,C.;Ito,N.;Evans,P.R.;Teo,C.H.;Nagai,K.Nature 1994,372,432.doi:10.1038/372432a0
(24)Ramos,A.;Grunert,S.;Adams,J.;Micklem,D.R.;Proctor,M. R.;Freund,S.;Bycroft,M.;St Johnston,D.;Varani,G.The EMBO Journal 2000,19,997.doi:10.1093/emboj/19.5.997
(25) Sachs,R.;Max,K.E.;Heinemann,U.;Balbach,J.RNA 2012, 18,65.doi:10.1261/rna.02809212
(26) Schumacher,M.A.;Pearson,R.F.;Moller,T.;Valentin-Hansen, P.;Brennan,R.G.The EMBO Journal 2002,21,3546.doi: 10.1093/emboj/cdf322
(27) Wang,X.;McLachlan,J.;Zamore,P.D.;Hall,T.M.Cell 2002, 110,501.doi:10.1016/S0092-8674(02)00873-5
(28) Cook,K.B.;Kazan,H.;Zuberi,K.;Morris,Q.;Hughes,T.R. Nucleic Acids Research 2011,39,D301.
(29) Tian,B.;Bevilacqua,P.C.;Diegelman-Parente,A.;Mathews, M.B.Nature Reviews.Molecular Cell Biology 2004,5,1013. doi:10.1038/nrm1528
(30) Schumacher,M.A.;Karamooz,E.;Zikova,A.;Trantirek,L.; Lukes,J.Cell 2006,126,701.doi:10.1016/j.cell.2006.06.047
(31) Das,R.;Karanicolas,J.;Baker,D.Nature Methods 2010,7, 291.doi:10.1038/nmeth.1433
(32) Sharma,S.;Ding,F.;Dokholyan,N.V.Bioinformatics 2008,24, 1951.doi:10.1093/bioinformatics/btn328
(33) Martinez,H.M.;Maizel,J.V.,Jr.;Shapiro,B.A.Journal of Biomolecular Structure&Dynamics 2008,25,669.doi: 10.1080/07391102.2008.10531240
(34) Parisien,M.;Major,F.Nature 2008,452,51.doi:10.1038/ nature06684
(35) Zhao,Y.;Gong,Z.;Xiao,Y.Journal of Biomolecular Structure &Dynamics 2011,28,815.doi:10.1080/07391102.2011. 10508609
(36) Shulman-Peleg,A.;Nussinov,R.;Wolfson,H.J.Nucleic Acids Research 2009,37,D369.
(37) Lewis,B.A.;Walia,R.R.;Terribilini,M.;Ferguson,J.;Zheng, C.;Honavar,V.;Dobbs,D.Nucleic Acids Research 2011,39, D277.
(38)Wang,Y.;Li,Y.;Ma,Z.;Yang,W.;Ai,C.PLoS Comput.Biol. 2010,6,e1000866.
(39)Jones,S.;Daley,D.T.;Luscombe,N.M.;Berman,H.M.; Thornton,J.M.Nucleic Acids Research 2001,29,943.doi: 10.1093/nar/29.4.943
(40)Allers,J.;Shamoo,Y.J.Mol.Biol.2001,311,75.doi:10.1006/ jmbi.2001.4857
(41) Ellis,J.J.;Broom,M.;Jones,S.Proteins 2007,66,903.
(42) Chen,Y.C.;Lim,C.Nucleic Acids Research 2008,36,7078. doi:10.1093/nar/gkn868
(43) Bahadur,R.P.;Zacharias,M.;Janin,J.Nucleic Acids Research 2008,36,2705.doi:10.1093/nar/gkn102
(44) Shazman,S.;Mandel-Gutfreund,Y.PLoS Comput.Biol.2008, 4,e1000146.
(45) Brandman,R.;Brandman,Y.;Pande,V.S.PLoS One 2012,7, e30022.
(46) Terribilini,M.;Lee,J.H.;Yan,C.;Jernigan,R.L.;Honavar,V.; Dobbs,D.RNA 2006,12,1450.doi:10.1261/rna.2197306
(47) Kim,O.T.;Yura,K.;Go,N.Nucleic Acids Research 2006,34, 6450.doi:10.1093/nar/gkl819
(48) Chen,Y.C.;Lim,C.Nucleic Acids Research 2008,36,e29.
(49)Kumar,M.;Gromiha,M.M.;Raghava,G.P.Proteins 2008,71, 189.doi:10.1002/prot.v71:1
(50) Zhao,H.;Yang,Y.;Zhou,Y.Nucleic Acids Research 2011,39, 3017.
(51) Perez-Cano,L.;Fernandez-Recio,J.Proteins 2010,78,25.doi: 10.1002/prot.22527
(52) Ma,X.;Guo,J.;Wu,J.;Liu,H.;Yu,J.;Xie,J.;Sun,X.Proteins 2011,79,1230.
(53)Chen,Y.;Kortemme,T.;Robertson,T.;Baker,D.;Varani,G. Nucleic Acids Research 2004,32,5147.doi:10.1093/nar/ gkh785
(54) Zheng,S.;Robertson,T.A.;Varani,G.The FEBS Journal 2007, 274,6378.doi:10.1111/j.1742-4658.2007.06155.x
(55) Perez-Cano,L.;Solernou,A.;Pons,C.;Fernandez-Recio,J. Pac.Symp.Biocomput.2010,293.
(56) Katchalski-Katzir,E.;Shariv,I.;Eisenstein,M.;Friesem,A.A.; Aflalo,C.;Vakser,I.A.Proceedings of the National Academy of Sciences of the United States of America 1992,89,2195.doi: 10.1073/pnas.89.6.2195
(57) Chen,R.;Weng,Z.Proteins 2002,47,281.doi:10.1002/(ISSN) 1097-0134
(58) Gray,J.J.;Moughon,S.;Wang,C.;Schueler-Furman,O.; Kuhlman,B.;Rohl,C.A.;Baker,D.J.Mol.Biol.2003,331, 281.doi:10.1016/S0022-2836(03)00670-3
(59)Dominguez,C.;Boelens,R.;Bonvin,A.M.J.Am.Chem.Soc. 2003,125,1731.doi:10.1021/ja026939x
(60)Li,L.;Guo,D.;Huang,Y.;Liu,S.;Xiao,Y.BMC Bioinformatics 2011,12,36.doi:10.1186/1471-2105-12-36
(61) Zhang,C.;Lai,L.Journal of Computational Chemistry 2011, 32,2598.doi:10.1002/jcc.v32.12
(62)Li,C.H.;Cao,L.B.;Su,J.G.;Yang,Y.X.;Wang,C.X. Proteins 2012,80,14.doi:10.1002/prot.v80.1
(63) Setny,P.;Zacharias,M.Nucleic Acids Research 2011,39,9118. doi:10.1093/nar/gkr636
(64) Tuszynska,I.;Bujnicki,J.M.BMC Bioinformatics 2011,12, 348.doi:10.1186/1471-2105-12-348
(65) Jiang,F.;Kim,S.H.J.Mol.Biol.1991,219,79.doi:10.1016/ 0022-2836(91)90859-5
(66) Gabb,H.A.;Jackson,R.M.;Sternberg,M.J.J.Mol.Biol. 1997,272,106.doi:10.1006/jmbi.1997.1203
(67)Kozakov,D.;Brenke,R.;Comeau,S.R.;Vajda,S.Proteins 2006,65,392.doi:10.1002/prot.21117
(68)Abagyan,R.;Totrov,M.J.Mol.Biol.1994,235,983.doi: 10.1006/jmbi.1994.1052
(69) Wang,C.;Bradley,P.;Baker,D.J.Mol.Biol.2007,373,503. doi:10.1016/j.jmb.2007.07.050
(70) May,A.;Zacharias,M.Proteins 2008,70,794.
(71) Chaudhury,S.;Gray,J.J.J.Mol.Biol.2008,381,1068.doi: 10.1016/j.jmb.2008.05.042
(72) Lesk,V.I.;Sternberg,M.J.Bioinformatics 2008,24,1137.doi: 10.1093/bioinformatics/btn093
(73) Smith,G.R.;Sternberg,M.J.;Bates,P.A.J.Mol.Biol.2005, 347,1077.doi:10.1016/j.jmb.2005.01.058
(74) Huang,Y.;Liu,Z.J.Mol.Biol.2009,393,1143.doi:10.1016/ j.jmb.2009.09.010
(75) Harel,M.;Spaar,A.;Schreiber,G.Biophys.J.2009,96,4237. doi:10.1016/j.bpj.2009.02.054
(76)Kim,Y.C.;Tang,C.;Clore,G.M.;Hummer,G.Proceedings of the National Academy of Sciences of the United States of America 2008,105,12855.doi:10.1073/pnas.0802460105
(77) Tang,C.;Iwahara,J.;Clore,G.M.Nature 2006,444,383.doi: 10.1038/nature05201
(78)Volkov,A.N.;Ubbink,M.;van Nuland,N.A.J.Biomol.NMR 2010,48,225.doi:10.1007/s10858-010-9452-6
(79) Sanchez,I.E.;Ferreiro,D.U.;Dellarole,M.;de Prat-Gay,G. Proceedings of the National Academy of Sciences of the United States of America 2010,107,7751.doi:10.1073/pnas. 0911734107
(80) Harel,M.;Cohen,M.;Schreiber,G.J.Mol.Biol.2007,371, 180.doi:10.1016/j.jmb.2007.05.032
(81) Fawzi,N.L.;Doucleff,M.;Suh,J.Y.;Clore,G.M. Proceedings of the National Academy of Sciences of the United States of America 2010,107,1379.doi:10.1073/ pnas.0909370107
(82) Hwang,H.;Vreven,T.;Janin,J.;Weng,Z.Proteins 2010,78, 3111.doi:10.1002/prot.v78:15
(83) Liang,S.;Zhang,C.;Liu,S.;Zhou,Y.Nucleic Acids Research 2006,34,3698.doi:10.1093/nar/gkl454
(84) Guo,D.;Liu,S.Y.;Huang,Y.Y.;Xiao,Y.Journal of Biomolecular Structure and Dynamics 2012,in press.
(85) Li,X.;Liang,J.Knowledge-Based Energy Functions for Computational Studies of Proteins.In Computational Methods for Protein Structure Prediction and Modeling;Xu,Y.,Xu,D., Liang,J.,Eds.;New York:Springer,2006;Vol.1;p 71.
(86) Zhou,Y.;Duan,Y.;Yang,Y.;Faraggi,E.;Lei,H.Theoretical Chemistry Accounts 2011,128,3.doi:10.1007/s00214-010-0799-2
(87) Zhou,H.;Skolnick,J.Biophys.J.2011,101,2043.doi: 10.1016/j.bpj.2011.09.012
(88) Czaplewski,C.;Liwo,A.;Makowski,M.;Oldziej,S.; Scheraga,H.A.Coarse-Grained Models of Proteins:Theory andApplications.In Multiscale Approaches to Protein Modeling;Kolinski,A.Ed.;Springer,2010;p 35.
(89) Kortemme,T.;Morozov,A.V.;Baker,D.J.Mol.Biol.2003, 326,1239.doi:10.1016/S0022-2836(03)00021-4
(90) Jiang,L.;Kuhlman,B.;Kortemme,T.;Baker,D.Proteins 2005,58,893.doi:10.1002/prot.20347
(91) Jiang,L.;Lai,L.The Journal of Biological Chemistry 2002, 277,37732.doi:10.1074/jbc.M204514200
(92) Jiang,L.;Gao,Y.;Mao,F.;Liu,Z.;Lai,L.Proteins 2002,46, 190.doi:10.1002/(ISSN)1097-0134
(93) Wang,C.X.;Chang,S.;Gong,X.Q.;Yang,F.;Li,C.H.; Chen,W.Z.Acta Phys.-Chim.Sin.2012,28,751. [王存新,常 珊,龔新奇,楊 峰,李春華,陳慰祖.物理化學(xué)學(xué)報(bào), 2012,28,751.]doi:10.3866/PKU.WHXB201202022
(94) Liu,S.;Li,Q.;Lai,L.Proteins 2006,64,68.doi:10.1002/ prot.20954
(95) Zacharias,M.Protein Science:a Publication of the Protein Society 2003,12,1271.
(96) Liang,S.;Liu,S.;Zhang,C.;Zhou,Y.Proteins 2007,69,244. doi:10.1002/prot.v69:2
(97) Huang,S.Y.;Zou,X.Proteins 2008,72,557.doi:10.1002/ prot.21949
(98) Sun,W.T.Advances in Mechanics 2011,41,60.[孫衛(wèi)濤.力學(xué)進(jìn)展,2011,41,60.]
(99) Pierce,B.;Weng,Z.Proteins 2007,67,1078.doi:10.1002/ prot.21373
(100) Zhou,H.;Zhou,Y.Protein Science:a Publication of the Protein Society 2002,11,2714.
(101) Lu,H.;Skolnick,J.Proteins 2001,44,223.doi:10.1002/ (ISSN)1097-0134
(102) Samudrala,R.;Moult,J.J.Mol.Biol.1998,275,895.doi: 10.1006/jmbi.1997.1479
(103) Chuang,G.Y.;Kozakov,D.;Brenke,R.;Comeau,S.R.;Vajda, S.Biophys.J.2008,95,4217.doi:10.1529/biophysj. 108.135814
(104) Liu,S.;Vakser,I.A.BMC Bioinformatics 2011,12,280.doi: 10.1186/1471-2105-12-280
(105) Liu,S.;Zhang,C.;Zhou,H.;Zhou,Y.Proteins 2004,56,93. doi:10.1002/prot.20019
(106) Lensink,M.F.;Mendez,R.;Wodak,S.J.Proteins 2007,69, 704.doi:10.1002/prot.21804
(107) Mendez,R.;Leplae,R.;Lensink,M.F.;Wodak,S.J.Proteins 2005,60,150.doi:10.1002/prot.20551
(108) Chang,S.;Jiao,X.;Li,C.H.;Gong,X.Q.;Chen,W.Z.; Wang,C.X.Biophysical Chemistry 2008,134,111.doi: 10.1016/j.bpc.2007.12.005
(109) Li,C.H.;Ma,X.H.;Shen,L.Z.;Chang,S.;Chen,W.Z.; Wang,C.X.Biophysical Chemistry 2007,129,1.doi:10.1016/ j.bpc.2007.04.014
(110) Guerois,R.;Nielsen,J.E.;Serrano,L.J.Mol.Biol.2002,320, 369.doi:10.1016/S0022-2836(02)00442-4
(111)Chen,N.Y.;Su,Z.Y.;Mou,C.Y.Physical Review Letters 2006,96,078103.doi:10.1103/PhysRevLett.96.078103
(112) Korkut,A.;Hendrickson,W.A.Proceedings of the National Academy of Sciences of the United States of America 2009, 106,15673.doi:10.1073/pnas.0907684106
(113) Li,W.;Wolynes,P.G.;Takada,S.Proceedings of the National Academy of Sciences of the United States of America 2011, 108,3504.doi:10.1073/pnas.1018983108
(114) Ellis,J.J.;Jones,S.Proteins 2008,70,1518.
(115) Lindahl,E.;Delarue,M.Nucleic Acids Research 2005,33, 4496.doi:10.1093/nar/gki730
(116) Cavasotto,C.N.;Kovacs,J.A.;Abagyan,R.A.J.Am.Chem. Soc.2005,127,9632.doi:10.1021/ja042260c
(117) Petrone,P.;Pande,V.S.Biophys.J.2006,90,1583.doi: 10.1529/biophysj.105.070045
(118) Korkut,A.;Hendrickson,W.A.Proceedings of the National Academy of Sciences of the United States of America 2009, 106,15667.doi:10.1073/pnas.0907674106
(119) Dobbins,S.E.;Lesk,V.I.;Sternberg,M.J.Proceedings of the National Academy of Sciences of the United States of America 2008,105,10390.doi:10.1073/pnas.0802496105
(120) Pons,C.;Solernou,A.;Perez-Cano,L.;Grosdidier,S.; Fernandez-Recio,J.Proteins 2010,78,3182.doi:10.1002/prot. v78:15
(121) Perez-Cano,L.;Jimenez-Garcia,B.;Fernandez-Recio,J. Proteins 2012,80,1872.
(122) Barik,A.;Nithin,C.;Manasa,P.;Bahadur,R.P.Proteins 2012, 80,1866.
(123) Hermann,T.Angew Chem.Int.Edit.2000,39,1890.doi: 10.1002/(ISSN)1521-3773
(124) Mackay,J.P.;Font,J.;Segal,D.J.Nature Structural& Molecular Biology 2011,18,256.doi:10.1038/nsmb.2005
(125) Filipovska,A.;Razif,M.F.;Nygard,K.K.;Rackham,O. Nature Chemical Biology 2011,7,425.doi:10.1038/ nchembio.577
(126) Dong,S.;Wang,Y.;Cassidy-Amstutz,C.;Lu,G.;Bigler,R.; Jezyk,M.R.;Li,C.;Hall,T.M.;Wang,Z.The Journal of Biological Chemistry 2011,286,26732.doi:10.1074/jbc. M111.244889
(127) Chen,Y.;Varani,G.Chemistry&Biology 2011,18,821.
(128) Lu,G.;Dolgner,S.J.;Hall,T.M.Current Opinion in Structural Biology 2009,19,110.doi:10.1016/ j.sbi.2008.12.009
(129) Cooke,A.;Prigge,A.;Opperman,L.;Wickens,M. Proceedings of the National Academy of Sciences of the United States of America 2011,108,15870.doi:10.1073/ pnas.1105151108
(130) Koh,Y.Y.;Wang,Y.;Qiu,C.;Opperman,L.;Gross,L.;Tanaka Hall,T.M.;Wickens,M.RNA 2011,17,718.doi:10.1261/ rna.2540311
(131) Wells,J.A.;McClendon,C.L.Nature 2007,450,1001.doi: 10.1038/nature06526
(132) Arkin,M.R.;Wells,J.A.Nat.Rev.Drug.Discov.2004,3,301. doi:10.1038/nrd1343
(133)Arkin,M.Curr.Opin.Chem.Biol.2005,9,317.doi:10.1016/ j.cbpa.2005.03.001
(134) Bourgeas,R.;Basse,M.J.;Morelli,X.;Roche,P.PloS One 2010,5,e9598.
(135) Zhang,C.;Lai,L.Biochemical Society Transactions 2011,39, 1382.doi:10.1042/BST0391382
(136) Liu,S.;Zhu,X.;Liang,H.;Cao,A.;Chang,Z.;Lai,L. Proceedings of the National Academy of Sciences of the United States of America 2007,104,5330.doi:10.1073/ pnas.0606198104
(137) Fleishman,S.J.;Whitehead,T.A.;Ekiert,D.C.;Dreyfus,C.; Corn,J.E.;Strauch,E.M.;Wilson,I.A.;Baker,D.Science 2011,332,816.doi:10.1126/science.1202617
(138) Der,B.S.;Kuhlman,B.Science 2011,332,801.doi:10.1126/ science.1207082
(139) Zhang,C.;Lai,L.Proteins 2012,80,1078.doi:10.1002/prot. v80.4
(140) Bai,H.J.;Lai,L.H.Acta Phys.-Chim.Sin.2010,26,1988. [白紅軍,來(lái)魯華.物理化學(xué)學(xué)報(bào),2010,26,1988.]doi: 10.3866/PKU.WHXB20100725
August 23,2012;Revised:September 11,2012;Published on Web:September 11,2012.
Protein-RNA Interaction Interface Prediction and Design
HUANG Yang-Yu YANG Xiu-Feng LI Hao-Tian JI Xiao-Feng CHENG Hong-Li ZHAO Yun-Jie GUO Da-Chuan LI Lin LIU Shi-Yong*
(Biomolecular Physics and Modeling Group,School of Physics,Huazhong University of Science and Technology, Wuhan 430074,P.R.China)
RNA-protein interactions play key roles in many biological processes.The three dimensional (3D)structure of protein-RNA complexes can be determined experimentally by structural biologists.The recognition between protein and RNA can be understood from the 3D atomic structure.However,the structure determination of protein-RNA complexes by experimental methods is often difficult and costly, and limited to the binding strength.Thus,the prediction and design of protein-RNA complex structures is important in biological medical research.In this review,we will discuss the recent progress in protein-RNA interface prediction and design,which includes the following aspects:(1)protein-RNA docking and the conformational change on binding;(2)the recognition mechanism of protein-RNA binding;(3)the molecular design based on the protein-RNA interface.Improvement of the protein-RNA docking algorithm will help us annotate a large number of proteins and RNA with unknown function,and molecular design based on macromolecular interactions will be useful in drug design.
Protein-RNA interaction;Molecular docking;Interface design;Complex structure prediction
10.3866/PKU.WHXB201209111
?Corresponding author.Email:liushiyong@gmail.com;Tel:+86-27-87558335-805.
The project was supported by the National Natural Science Foundation of China(31100522),National High Technology Research and Development Program of China(2012AA020402),Specialized Research Fund for the Doctoral Program of Higher Education,China(20110142120038).
國(guó)家自然科學(xué)基金(31100522),國(guó)家高技術(shù)研究發(fā)展計(jì)劃(2012AA020402),高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金(20110142120038)資助
O641