黃永棋 劉志榮
(北京大學(xué)化學(xué)與分子工程學(xué)院,北京大學(xué)理論生物學(xué)中心,北京分子科學(xué)國家實(shí)驗(yàn)室,北京 100871)
天然無序蛋白質(zhì):序列-結(jié)構(gòu)-功能的新關(guān)系
黃永棋 劉志榮*
(北京大學(xué)化學(xué)與分子工程學(xué)院,北京大學(xué)理論生物學(xué)中心,北京分子科學(xué)國家實(shí)驗(yàn)室,北京 100871)
天然無序蛋白質(zhì)是一類新發(fā)現(xiàn)的蛋白質(zhì),它們在天然條件下沒有確定的三維結(jié)構(gòu),卻具有正常的生物學(xué)功能,廣泛參與信號傳遞、DNA轉(zhuǎn)錄、細(xì)胞分裂和蛋白質(zhì)聚集等重要的生理與病理過程.無序蛋白質(zhì)的發(fā)現(xiàn)是對傳統(tǒng)的蛋白質(zhì)“序列-結(jié)構(gòu)-功能”范式的挑戰(zhàn).在這篇綜述里,我們首先回顧了蛋白質(zhì)的傳統(tǒng)范式以及無序蛋白質(zhì)的發(fā)現(xiàn)過程,然后介紹無序蛋白質(zhì)在結(jié)構(gòu)、序列、功能等方面的特征與相互作用,并以分子識別過程為例,進(jìn)一步闡述目前國際上對無序蛋白質(zhì)所具有優(yōu)勢的一些認(rèn)識與觀點(diǎn).我們還分析了無序蛋白質(zhì)研究在生命科學(xué)和醫(yī)學(xué)等領(lǐng)域的應(yīng)用前景,并介紹了國內(nèi)在無序蛋白質(zhì)領(lǐng)域的研究現(xiàn)狀.
天然無序蛋白質(zhì);蛋白質(zhì)折疊;蛋白質(zhì)相互作用;分子識別;蛋白質(zhì)結(jié)構(gòu)預(yù)測;藥物設(shè)計(jì)
長久以來,蛋白質(zhì)科學(xué)研究基本上遵循的是“序列-結(jié)構(gòu)-功能”的范式,即蛋白質(zhì)的氨基酸序列決定蛋白質(zhì)唯一的三維結(jié)構(gòu),而三維結(jié)構(gòu)則決定了蛋白質(zhì)的生物學(xué)功能.這個(gè)范式的思想可以一直追溯到1894年Fischer所提出的鎖-鑰(lock-and-key)模型[1].Wu[2]與Pauling等[3]也在30年代分別提出過相關(guān)的理論.這個(gè)范式的關(guān)鍵點(diǎn)是認(rèn)為蛋白質(zhì)的三維結(jié)構(gòu)是實(shí)現(xiàn)其功能的前提.因此一個(gè)蛋白質(zhì)要發(fā)揮其功能,就必須在多肽鏈被合成出來后快速地(通常處于μs到ms量級)折疊成一個(gè)能量較低的有序的三維結(jié)構(gòu).這樣,蛋白質(zhì)的天然狀態(tài)(native state)就等同于三維有序結(jié)構(gòu).在過去的幾十年里,蛋白質(zhì)晶體結(jié)構(gòu)的測定以及蛋白質(zhì)工程、藥物設(shè)計(jì)、酶學(xué)等方面的巨大進(jìn)展都證實(shí)了這個(gè)范式的有效性.可以說,結(jié)構(gòu)-功能范式是創(chuàng)造現(xiàn)代蛋白質(zhì)科學(xué)的“大爆炸”[4].
然而,到了上世紀(jì)90年代初,隨著實(shí)驗(yàn)技術(shù)的發(fā)展,人們開始發(fā)現(xiàn)有些蛋白質(zhì)在天然狀態(tài)下并不具有一個(gè)確定的三維結(jié)構(gòu),但依然具有正常的生物學(xué)活性.后來,實(shí)驗(yàn)上發(fā)現(xiàn)的具有這種性質(zhì)的蛋白質(zhì)越來越多,并逐漸形成了一類與傳統(tǒng)蛋白質(zhì)范式不同的新的蛋白質(zhì)類型,稱為天然無序蛋白質(zhì)(以下簡稱無序蛋白質(zhì)).英文文獻(xiàn)里對這種蛋白質(zhì)的稱呼有多種:intrinsically disordered proteins[5]、natively unfolded proteins[4]、intrinsically unstructured proteins[6],以及natively denatured proteins[7].目前,經(jīng)實(shí)驗(yàn)確認(rèn)的無序蛋白質(zhì)的數(shù)目已經(jīng)有不少.Uversky[4]在2002年的綜述文章中列出了近百種經(jīng)過實(shí)驗(yàn)驗(yàn)證的、整體上無序或包含有長度超過50個(gè)殘基的無序片段的無序蛋白質(zhì).無序蛋白質(zhì)數(shù)據(jù)庫DisProt[8]則收錄有523種無序蛋白質(zhì)的詳盡信息(2009年1月6日版本).而理論上所預(yù)言的無序蛋白質(zhì)數(shù)量則更為巨大.例如,真核生物擁有的無序蛋白質(zhì)的含量高達(dá)27%-41%[9].
無序蛋白質(zhì)的發(fā)現(xiàn),與蛋白質(zhì)研究在幾個(gè)方面的進(jìn)展有關(guān)[10].第一,基因工程方法的發(fā)展使得可以通過基因轉(zhuǎn)錄與翻譯來制備蛋白質(zhì),并通過基因突變、敲除等方法來確定其與功能的關(guān)系,這樣就避免了無序蛋白質(zhì)在制備過程中容易被蛋白酶所分解的問題.第二,近年來,很多實(shí)驗(yàn)技術(shù)(特別是核磁共振(NMR))得到了長足的發(fā)展,使得可以在溶液中對蛋白質(zhì)結(jié)構(gòu)信息進(jìn)行有效表征,因而對無序蛋白質(zhì)的檢測變得容易.最后,基因組計(jì)劃的開展產(chǎn)生了大量的序列信息,為通過序列分析來確定蛋白質(zhì)的有序-無序片段提供了條件.
在這篇綜述里,我們將介紹無序蛋白質(zhì)在結(jié)構(gòu)、序列、功能等方面的特征與相互作用,以及最近幾年國內(nèi)外在這個(gè)新興領(lǐng)域的研究進(jìn)展.
1.1 無序蛋白質(zhì)的檢測方法
天然無序蛋白質(zhì)的特征是整條鏈或鏈的一部分并不具有嚴(yán)格的三維結(jié)構(gòu),原子位置及主鏈二面角沒有特定的平衡值,而是隨著時(shí)間發(fā)生很大的變化.目前實(shí)驗(yàn)上有多種技術(shù)可以用來檢測無序蛋白質(zhì)[4,11].X射線晶體衍射圖上電子密度的缺失通常是蛋白質(zhì)晶體中無序片段的標(biāo)志[4];遠(yuǎn)紫外圓二色(far-UV circular dichroism,CD)譜可以用來定量估計(jì)蛋白質(zhì)在溶液狀態(tài)下各種二級結(jié)構(gòu)(如α-螺旋,β-折疊和無規(guī)卷曲)的含量,從而可以定性地判斷出蛋白質(zhì)是否處于無序態(tài)[4];流體力學(xué)方法可以直接測量蛋白質(zhì)分子的回轉(zhuǎn)半徑(radius of gyration,Rg)和擴(kuò)散速率,而相比于相同分子量的有序蛋白質(zhì),無序蛋白質(zhì)結(jié)構(gòu)相對伸展,回轉(zhuǎn)半徑大,擴(kuò)散較慢,因此可以通過凝膠過濾(gel-filtration)、粘度測定法(viscometry)、小角度X射線散射(small angle X-ray scattering,SAXS)、沉降法(sedimentation)以及動態(tài)及靜態(tài)光學(xué)散射的方法來檢測無序蛋白質(zhì)[12];通常無序蛋白質(zhì)結(jié)構(gòu)柔性大,疏水性氨基酸比較暴露,容易被蛋白酶水解,因此利用蛋白酶水解實(shí)驗(yàn)也可以粗略地區(qū)分有序蛋白質(zhì)和無序蛋白質(zhì)[13-14].最重要的研究無序蛋白質(zhì)的方法要算是NMR方法了.NMR可以給出氨基酸殘基水平上的結(jié)構(gòu)信息.例如,在NMR譜圖上,處于無序區(qū)域的氨基酸殘基所對應(yīng)的化學(xué)位移通常由于分散不好而重疊在一起[15];另外,1H-15N的nuclear overhauser effect(NOE)測量對有序的結(jié)構(gòu)給出正的信號,而對無序的結(jié)構(gòu)則給出負(fù)的信號[16].NMR方法本身在這些年來也一直保持著快速的發(fā)展,現(xiàn)在已經(jīng)可以實(shí)現(xiàn)對細(xì)胞內(nèi)蛋白質(zhì)的直接表征[17].綜合利用這些實(shí)驗(yàn)手段可以將無序蛋白質(zhì)和有序蛋白質(zhì)區(qū)分開,并可以判斷無序蛋白質(zhì)無序的程度有多大.
1.2 無序蛋白質(zhì)具有局部的二級結(jié)構(gòu)
從總體上看,無序蛋白質(zhì)沒有一個(gè)確定的三維結(jié)構(gòu),但這并不排除它們可以具有某些局部的二級結(jié)構(gòu)[18-19].Fuxreiter等[20]對24個(gè)無序蛋白質(zhì)復(fù)合物進(jìn)行的統(tǒng)計(jì)分析表明,無序蛋白質(zhì)的有些區(qū)域具有很強(qiáng)的形成α-螺旋的傾向,并且這些螺旋的結(jié)構(gòu)與復(fù)合物中的結(jié)構(gòu)類似;而有些區(qū)域則沒有這種強(qiáng)的有序傾向,通常這些區(qū)域處于連接(linker)區(qū)域.無序蛋白質(zhì)這些局部的二級結(jié)構(gòu)通常是蛋白質(zhì)-蛋白質(zhì)以及蛋白質(zhì)-DNA相互作用時(shí)的結(jié)合部位,并且很可能是結(jié)合過程的起始位點(diǎn)[21].因此,這些局部的二級結(jié)構(gòu)也被稱為molecular recognition motif[22],molecular recognition elements(MoREs)[23],或molecular recognition feature(MoRFs)[24].根據(jù)結(jié)合部位在無序蛋白質(zhì)序列上具有較高有序傾向的特點(diǎn),Oldfield[23]和Mészáros[25]等分別發(fā)展了一些方法來預(yù)測無序蛋白質(zhì)與受體結(jié)合時(shí)的可能結(jié)合位點(diǎn).
1.3 折疊與結(jié)合的耦合
盡管在溶液中單獨(dú)存在時(shí)是無序的,很多無序蛋白質(zhì)在與受體結(jié)合時(shí)會發(fā)生誘導(dǎo)折疊,形成一個(gè)更加有序的結(jié)構(gòu).通常這個(gè)過程稱為折疊與結(jié)合的耦合(coupled folding and binding)[10](圖1).其中研究的最多的一個(gè)體系是轉(zhuǎn)錄因子環(huán)腺苷酸應(yīng)答因子結(jié)合蛋白(transcription factor cAMP response-element binding protein,CREB)中的激酶誘導(dǎo)結(jié)構(gòu)域(kinaseinducible domain,KID).KID由60個(gè)氨基酸組成,單獨(dú)存在時(shí)只表現(xiàn)出少量的二級結(jié)構(gòu)[19].經(jīng)過磷酸化之后的KID(pKID)與受體KIX結(jié)合,pKID上的Thr119-Pro146區(qū)域發(fā)生折疊,形成兩個(gè)α-螺旋[26-27].盡管無序蛋白質(zhì)與受體結(jié)合后變得更加有序,但也并不意味著整個(gè)無序蛋白質(zhì)都發(fā)生了折疊,有時(shí)候肽鏈上仍然有一些局部的區(qū)域是無序的[28].例如pKID上的C端與N端的序列在結(jié)合后就仍然保持無序[26].通過對無序蛋白質(zhì)在形成復(fù)合物狀態(tài)下的分子內(nèi)和分子間相互作用進(jìn)行分析,可以知道無序蛋白質(zhì)與受體分子之間的相互作用要強(qiáng)于無序蛋白質(zhì)分子內(nèi)的相互作用,因此無序蛋白質(zhì)在結(jié)合狀態(tài)下的有序結(jié)構(gòu)主要是由分子間的相互作用來穩(wěn)定[29].
1.4 擁擠環(huán)境下的結(jié)構(gòu)
盡管體外實(shí)驗(yàn)表明無序蛋白質(zhì)是一個(gè)伸展的無序結(jié)構(gòu),但由于細(xì)胞內(nèi)存在大量的生物大分子,他們占據(jù)了細(xì)胞體積的5%-40%,導(dǎo)致細(xì)胞的內(nèi)部空間相當(dāng)擁擠(crowding)[30].因此,一個(gè)很自然的問題是:無序蛋白質(zhì)在細(xì)胞內(nèi)的擁擠環(huán)境下是否仍保持無序?除了直接進(jìn)行體內(nèi)實(shí)驗(yàn)以外,一個(gè)常用的實(shí)驗(yàn)策略是用一些可溶性的惰性大分子,如牛血清白蛋白(bovine serum albumin,BSA)、dextran和Ficoll 70等來模擬細(xì)胞中的分子環(huán)境.例如,無序蛋白質(zhì)α-突觸核蛋白(α-synuclein)在300 g·L-1的BSA存在下的構(gòu)象與其在稀溶液中的構(gòu)象基本一樣[31].類似地,dextran和Ficoll 70也不能從無序蛋白質(zhì)p27、c-Fos[32]和dehydrin[33]中誘導(dǎo)出有序結(jié)構(gòu).相反地,無序蛋白質(zhì)FlgM的C端在濃度大于400 g·L-1的BSA或卵清蛋白(ovalbumin)條件下變得有序[34].αsynuclein的N端也可以在SDS膠束的表面形成螺旋結(jié)構(gòu)[35].隨著NMR方法的發(fā)展,體內(nèi)實(shí)驗(yàn)也開始在這種研究中被采用.例如,在E.coli細(xì)胞內(nèi)表達(dá)的α-synuclein是無序的[31],而FlgM的C端在E.coli細(xì)胞里面會變得有序[34].
總的來說,已有的實(shí)驗(yàn)結(jié)果表明分子擁擠對無序蛋白質(zhì)構(gòu)象的影響是隨體系不同而不同的.分子擁擠可能使無序蛋白質(zhì)變得有序,也可能沒有什么影響,這與具體蛋白質(zhì)的氨基酸序列有關(guān).從原理上講,大分子的存在使得溶液中自由空間減小,蛋白質(zhì)更可能傾向于采取體積較小的構(gòu)象[36-37].但這種構(gòu)象可能是有序的折疊態(tài),也可能是一個(gè)塌縮的非折疊態(tài).目前對分子擁擠與無序蛋白質(zhì)構(gòu)象關(guān)系以及其生物學(xué)意義的研究還不夠深入,需要更多實(shí)驗(yàn)和理論分析.
1.5 結(jié)構(gòu)系綜
圖1 無序蛋白質(zhì)折疊與結(jié)合的耦合示意圖Fig.1 Schematic representation of coupled folding-binding process of IDPsThe phosphorylated kinase-inducible domain(pKID)is disordered when free,and forms two helices when binding to the ordered kinase-inducible domain interacting domain(KIX).
無序蛋白質(zhì)與有序蛋白質(zhì)的最大不同就是其結(jié)構(gòu)上的柔性.對于有序蛋白質(zhì),盡管在特殊情況下(比如和配體結(jié)合前后)也可能發(fā)生構(gòu)象變化,但這種變化的勢壘通常很高,因此在一般情況下很難發(fā)生,只有在配體的作用下,才會誘導(dǎo)出構(gòu)象的變化(induced-fit).對于無序蛋白質(zhì),其結(jié)構(gòu)上的柔性使得構(gòu)象轉(zhuǎn)變的勢壘很低,因此在通常的溶液狀態(tài)下,無序蛋白質(zhì)是眾多構(gòu)象共存的體系.描述無序蛋白質(zhì)的結(jié)構(gòu)需使用系綜的概念(圖2).目前廣泛應(yīng)用于無序蛋白質(zhì)結(jié)構(gòu)分析的一種實(shí)驗(yàn)方法是殘留偶極耦合(residual dipolar couplings,RDC)[38].Shortle等[39]第一次使用RDC方法研究了被尿素變性后的葡萄球菌核酸酶(staphylococcal nuclease)的結(jié)構(gòu).其后RDC方法在蛋白質(zhì)無序結(jié)構(gòu)的表征上獲得了廣泛的應(yīng)用[40-41].另外,SAXS[42-43]與熒光技術(shù)[44-45]也被應(yīng)用于無序蛋白質(zhì)結(jié)構(gòu)系綜的研究中.
盡管直接的分子動力學(xué)模擬可以給出很多關(guān)于蛋白質(zhì)變性態(tài)(denatured state)或者無序狀態(tài)的結(jié)構(gòu)信息[46-49],但由于無序狀態(tài)的構(gòu)象空間很大,很多時(shí)候普通的模擬方法難以獲得完整的結(jié)構(gòu)信息.因此,為了更準(zhǔn)確地描述和分析無序蛋白質(zhì)的結(jié)構(gòu),一種做法是將實(shí)驗(yàn)數(shù)據(jù)作為約束(restraint)施加到系統(tǒng)上,再進(jìn)行分子動力學(xué)模擬[49-52];另一種獲得無序蛋白質(zhì)結(jié)構(gòu)信息的方法是由Forman-Kay等[53-54]發(fā)展的ENSEMBLE程序.該方法可以在NOE,順磁弛豫增強(qiáng)(paramagnetic relaxation enhancement,PRE),二級化學(xué)位移 (secondary chemical shifts),3J耦合(3J-couplings),溶劑可及表面積(solvent-accessible surface areas),或Rg等實(shí)驗(yàn)數(shù)據(jù)的基礎(chǔ)上獲得無序蛋白質(zhì)的構(gòu)象[43,53,55].
2.1 序列的特點(diǎn)
無序蛋白質(zhì)在氨基酸序列上具有比較明顯的特征.其中最顯著的特征是它們的疏水殘基含量較低,同時(shí)擁有較高的未被中和的電荷,因此不能形成一個(gè)穩(wěn)定的疏水核心[4].在疏水性-電荷圖上,無序蛋白質(zhì)與有序蛋白質(zhì)明顯存在于不同的區(qū)域(圖3).另外,無序蛋白質(zhì)氨基酸序列的復(fù)雜性也較有序蛋白質(zhì)的低,序列上常常出現(xiàn)重復(fù)的區(qū)域[56].不同的氨基酸殘基也具有不同的促進(jìn)無序結(jié)構(gòu)形成的傾向,C, W,Y,I,F,V,L,H,T,N比較有利于有序結(jié)構(gòu)的形成,D,M,K,R,S,Q,P,E有利于無序的形成,而其它殘基的作用則比較中性[57].無序蛋白質(zhì)的出現(xiàn)還與氨基酸殘基的預(yù)期堆積密度(packing density,用一定距離內(nèi)的近鄰殘基數(shù)目來表征)有關(guān)聯(lián)[58]:預(yù)期堆積密度低的序列傾向于形成無序蛋白質(zhì);密度高的傾向于形成淀粉狀聚集結(jié)構(gòu);而預(yù)期堆積密度適中的序列則傾向于形成有序球狀蛋白.
2.2 無序蛋白質(zhì)的預(yù)測
利用無序蛋白質(zhì)在序列上所具有的鮮明特征,就可以發(fā)展出預(yù)測蛋白質(zhì)是否無序的方法.Romero等[59]在1997年首次對蛋白質(zhì)無序區(qū)域進(jìn)行預(yù)測,他們預(yù)測的準(zhǔn)確性達(dá)到70%.此后,無序蛋白質(zhì)的預(yù)測方法得到了迅速發(fā)展.目前應(yīng)用于無序蛋白質(zhì)序列預(yù)測的方法已經(jīng)超過50種[60-61],包括PONDR[59], FoldIndex[62],NORSnet[63],DISOPRED[64],GlobPlot[65], DisEMBL[66],IUPed[29],PreLink[67],RONN[68],DRIPPRED[69], SPRITZ[70],POODLE-w[71],Ucon[63],foldUnfold[72]等.這些預(yù)測方法的準(zhǔn)確性普遍達(dá)到85%以上.值得指出的是,目前對無序蛋白質(zhì)的預(yù)測已得到了蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的重視.在著名的蛋白質(zhì)結(jié)構(gòu)預(yù)測比賽Critical Assessment of Structure Prediction(CASP)上,從第五屆開始就把對無序蛋白質(zhì)的預(yù)測列為比賽內(nèi)容之一.在最近的CASP 8上,共有25支隊(duì)伍參加比賽,對122個(gè)目標(biāo)序列進(jìn)行預(yù)測[73].
圖2 無序蛋白質(zhì)CFTR R-結(jié)構(gòu)域的構(gòu)象[46]Fig.2 Conformations of the unstructured R-domain of CFTR[46]
圖3 有序及無序蛋白質(zhì)的疏水性-電荷分布[4] Fig.3 Distribution of ordered proteins anddisordered proteins in the mean net charge-mean hydrophobicity space[4]Ordered proteins are represented by filled circles and disordered proteins by open circles.〈H〉:mean hydrophobicity;〈R〉:mean net charge
無序蛋白質(zhì)在生物體內(nèi)是普遍存在的[57].例如,利用預(yù)測算法DISOPRED2對古細(xì)菌、細(xì)菌和真核生物的蛋白質(zhì)組序列進(jìn)行的分析表明,長度大于30個(gè)氨基酸的無序區(qū)域在這三個(gè)物種中的比例分別為2.0%、4.2%和33.0%[64].這些無序蛋白質(zhì)承擔(dān)著怎樣的生物學(xué)功能呢?
研究無序蛋白質(zhì)功能的一個(gè)常用策略是應(yīng)用生物信息學(xué)的方法,利用2.2節(jié)提到的預(yù)測算法對目前存在的大量基因庫數(shù)據(jù)進(jìn)行預(yù)測,分析蛋白質(zhì)的結(jié)構(gòu)無序與蛋白質(zhì)功能之間的關(guān)聯(lián).通過這種方法,人們發(fā)現(xiàn)無序蛋白質(zhì)在諸如轉(zhuǎn)錄和翻譯調(diào)控、細(xì)胞信號轉(zhuǎn)導(dǎo)、蛋白磷酸化及小分子存儲等過程中發(fā)揮著重要的作用;另一方面,無序蛋白質(zhì)又似乎給生物體系帶來一些不利的影響,經(jīng)常與多種疾病聯(lián)系在一起.Dunker課題組[56]發(fā)展了一套預(yù)測無序蛋白質(zhì)的方法PONDR,并研究了無序蛋白質(zhì)與很多功能的相關(guān)性.他們的預(yù)測表明在真核生物體內(nèi),長度大于30個(gè)氨基酸的無序蛋白質(zhì)片段在轉(zhuǎn)錄因子中的含量高達(dá)90%以上,在E.coli體內(nèi)也高達(dá)62.5%[74];與信號傳導(dǎo)相關(guān)的蛋白質(zhì)中,有66%±6%的蛋白質(zhì)含有無序片段[75];與人類癌癥相關(guān)的蛋白質(zhì)中,有79%±5%的蛋白質(zhì)無序片段[75];在心血管疾病有關(guān)的蛋白質(zhì)中,無序蛋白質(zhì)的含量也高達(dá)57%± 4%[76].另外,Xie等[77]對Swiss Protein Database中超過二十萬個(gè)蛋白質(zhì)進(jìn)行了系統(tǒng)的分析.他們利用Swiss-Prot里的功能關(guān)鍵字對蛋白質(zhì)進(jìn)行功能分類,并用PONDR預(yù)測每一類里無序的比例.結(jié)果發(fā)現(xiàn)在710個(gè)功能類別里,有238個(gè)類別與無序有較強(qiáng)的正相關(guān)(相關(guān)度最高的5個(gè)是核糖核蛋白、核糖體蛋白、發(fā)育蛋白、激素、生長因子),有302個(gè)與無序有較強(qiáng)的負(fù)相關(guān)(相關(guān)度最高的是氧化還原酶、轉(zhuǎn)移酶、裂合酶、水解酶、異構(gòu)酶),而剩下的170個(gè)類別與無序沒有太多關(guān)聯(lián).在與疾病有關(guān)的17個(gè)類別里,有11個(gè)與無序有正相關(guān),剩下的6個(gè)與有序/無序沒什么關(guān)聯(lián).
另外一個(gè)策略是綜合利用結(jié)構(gòu)表征手段與生化方法對具體蛋白的性質(zhì)進(jìn)行詳盡的研究.例如,在細(xì)胞分裂的調(diào)控方面,兩個(gè)研究較多的無序蛋白質(zhì)是p21和p27,它們通過抑制細(xì)胞周期蛋白依賴性激酶(cyclin-dependent kinases,Cdks)而起作用[78].又如,研究表明無序結(jié)構(gòu)導(dǎo)致的蛋白質(zhì)聚集是造成神經(jīng)退行性疾病(如帕金森氏癥和老年癡呆癥)的重要原因[79].中國科學(xué)院上海生命科學(xué)研究院胡紅雨課題組[80]在研究α-synuclein聚集過程中發(fā)現(xiàn)使蛋白質(zhì)聚集所必需的核心序列GAV motif(Val66-Val74)位于一個(gè)無序的序列區(qū)間,如果將包含GAV motif的無序片段嫁接到主體蛋白(host protein)上,就可以使主體蛋白發(fā)生聚集.另外,中國醫(yī)學(xué)科學(xué)院何維課題組[81]發(fā)現(xiàn)胸腺的一種老化相關(guān)蛋白質(zhì),Rwdd1,在電泳實(shí)驗(yàn)中表現(xiàn)出異常慢的遷移率,而且更容易被蛋白酶水解,因而推測Rwdd1很可能是一個(gè)無序蛋白質(zhì).無序蛋白質(zhì)還與蛋白質(zhì)的降解有關(guān).通常蛋白質(zhì)需要與泛素結(jié)合后再由蛋白酶體(proteasome)降解.最近的研究表明有一條降解途徑是由蛋白質(zhì)上C端[82]或者N端[83]的無序區(qū)域指導(dǎo)進(jìn)行的.還有,中國科學(xué)技術(shù)大學(xué)涂曉明課題組[84]利用無序蛋白質(zhì)預(yù)測算法、CD光譜和NMR對原核生物體內(nèi)的一個(gè)泛素類蛋白質(zhì)Rv2111c的結(jié)構(gòu)進(jìn)行了廣泛分析,證明了Rv2111c是一個(gè)新的無序蛋白質(zhì).
無序蛋白質(zhì)在真核生物中的含量遠(yuǎn)高于古細(xì)菌與細(xì)菌中的含量,表明無序蛋白質(zhì)在某些方面具有潛在的優(yōu)勢.下面我們以分子識別過程為例,介紹目前國際上對無序蛋白質(zhì)具有優(yōu)勢的一些認(rèn)識與觀點(diǎn).
4.1 一個(gè)無序蛋白質(zhì)可以和多個(gè)受體結(jié)合
無序蛋白質(zhì)結(jié)構(gòu)上的柔性和在復(fù)合物狀態(tài)下發(fā)生無序-有序轉(zhuǎn)變的特性使其能夠與其它蛋白質(zhì)和DNA發(fā)生廣泛的相互作用.目前,無序蛋白質(zhì)在分子識別過程中的一個(gè)被廣泛認(rèn)同的優(yōu)勢是能夠在不同的條件下和多個(gè)受體進(jìn)行專一性結(jié)合,即一對多的結(jié)合方式.細(xì)胞周期蛋白依賴性激酶抑制因子p2lWan/Cipl/sdil對細(xì)胞周期調(diào)控很重要,CD和NMR表明其N端60個(gè)氨基酸序列在游離狀態(tài)下是無序的,而一旦與受體Cdks結(jié)合后,該段序列就形成一個(gè)穩(wěn)定的有序結(jié)構(gòu)[85].p21柔性的無序結(jié)構(gòu)使得其能夠和多個(gè)激酶復(fù)合物cyclin-Cdks結(jié)合,如:cyclin A-Cdk2、cyclin E-Cdk2和cyclin D-Cdk4[85].同一段無序蛋白質(zhì)序列在與不同的受體結(jié)合后所形成的結(jié)構(gòu)是可以不同的.例如,轉(zhuǎn)錄因子缺氧誘導(dǎo)因子1α (transcription factor hypoxia-inducible factor-1α,HIF1α)的C端有一段無序的區(qū)域,當(dāng)該序列與環(huán)腺苷酸應(yīng)答因子結(jié)合蛋白的結(jié)合蛋白鋅離子結(jié)合域(TAZ1)結(jié)合后形成一個(gè)螺旋結(jié)構(gòu)[86];而與天冬氨酸羥化酶(asparagine hydroxylase)結(jié)合后卻形成一個(gè)高度伸展的結(jié)構(gòu)[87].
在生物系統(tǒng)里面,各種生理過程和大量的信息傳遞構(gòu)成了一個(gè)復(fù)雜的生物網(wǎng)絡(luò).生物網(wǎng)絡(luò)是一個(gè)典型的無尺度網(wǎng)絡(luò)(scale-free network),其中大多數(shù)節(jié)點(diǎn)(node)的連接數(shù)(連接在節(jié)點(diǎn)上的邊的個(gè)數(shù))都很低;但有少數(shù)節(jié)點(diǎn)卻具有大量的連接,這些節(jié)點(diǎn)被稱為中心節(jié)點(diǎn)(hub nodes)[88].中心節(jié)點(diǎn)的多連接特性要求處于這些節(jié)點(diǎn)上的蛋白質(zhì)必須具有某些特殊的性質(zhì),以使它們可以和大量的不同蛋白質(zhì)進(jìn)行結(jié)合.Haynes等[89]應(yīng)用無序蛋白質(zhì)的預(yù)測方法分別對生物網(wǎng)絡(luò)中的中心節(jié)點(diǎn)蛋白和網(wǎng)絡(luò)端點(diǎn)蛋白進(jìn)行了比較,發(fā)現(xiàn)在酵母(yeast)、蠕蟲(worm)、果蠅(fly)和人類(human)四種真核生物中,中心節(jié)點(diǎn)蛋白的無序序列含量均比非中心節(jié)點(diǎn)蛋白高.針對中心節(jié)點(diǎn)蛋白的深入分析還表明無序蛋白質(zhì)廣泛參與生物分子之間的瞬間結(jié)合過程,無序的性質(zhì)使得結(jié)合過程具有專一性和可逆性[90].因此,中心節(jié)點(diǎn)蛋白具有大量無序序列的性質(zhì)是生物網(wǎng)絡(luò)的一個(gè)普遍性質(zhì),是中心節(jié)點(diǎn)蛋白能夠?qū)崿F(xiàn)大量連接、執(zhí)行復(fù)雜生物功能的一個(gè)重要因素[91-92].
4.2 用較短的序列獲得更大的結(jié)合界面
由于存在結(jié)合與折疊的耦合,人們可以利用NMR和XRD獲得無序蛋白質(zhì)與受體結(jié)合后形成的復(fù)合物的三維結(jié)構(gòu),并考察無序蛋白質(zhì)結(jié)合界面的特征.Mészáros等[93]對39個(gè)無序蛋白質(zhì)復(fù)合物與72個(gè)有序蛋白質(zhì)復(fù)合物進(jìn)行了比較研究.他們發(fā)現(xiàn),兩類復(fù)合物在界面大小上沒有很顯著的區(qū)別,但是無序蛋白質(zhì)的界面占分子表面積的比例更大.另外,無序蛋白質(zhì)復(fù)合物界面間存在更多的疏水-疏水相互作用,因此界面上疏水性氨基酸的比例更高.無序蛋白質(zhì)平均一個(gè)氨基酸與受體蛋白形成更多的界面接觸,說明無序蛋白質(zhì)的柔性使得它們可以在結(jié)合的時(shí)候避開空間上的限制,更好地適應(yīng)受體蛋白的表面結(jié)構(gòu),從而實(shí)現(xiàn)最大程度的契合.他們的分析還指出,無序蛋白質(zhì)復(fù)合物的界面通常是由一個(gè)連續(xù)的氨基酸序列構(gòu)成的,而有序蛋白質(zhì)復(fù)合物的界面則通常由多個(gè)不連續(xù)的片段形成[93],這就決定了要形成同樣大小的結(jié)合界面,無序蛋白質(zhì)只需要較短的氨基酸序列(圖4),從而有利于減小蛋白質(zhì)分子的體積,減小細(xì)胞里的擁擠程度[94].
4.3 以更快的速率與受體結(jié)合
圖4 蛋白質(zhì)二聚體的示意圖[94]Fig.4 Schematic representation of protein dimers[94](a)dimers formed by disordered proteins,(b)dimers formed by ordered proteins;The interface areas are the same in(a)and(b).
蛋白質(zhì)的結(jié)合速度在分子識別過程中是至關(guān)重要的[95].無序蛋白質(zhì)的結(jié)構(gòu)柔性對結(jié)合速度會有什么樣的影響呢?在這方面,一個(gè)最被廣泛引用的模型是Shoemaker等[96]提出的fly-casting模型.基于無序蛋白質(zhì)的回轉(zhuǎn)半徑比較大的事實(shí),他們提出無序蛋白質(zhì)在結(jié)合過程中具有較大的捕獲半徑(capture radius),能夠從較遠(yuǎn)的距離與受體發(fā)生作用,并啟動結(jié)合過程,因而具有比有序蛋白質(zhì)更快的結(jié)合速率[96].其它一些理論與模擬研究的結(jié)果也支持這個(gè)結(jié)論.例如,Wang等[97-98]利用解析的方法研究了分子的有序和無序?qū)Y(jié)合過程的影響,表明無序的體系具有更快的結(jié)合速率;Levy等[99]在模擬無序蛋白質(zhì)與受體DNA結(jié)合時(shí)指出靜電作用使fly-casting效應(yīng)更加顯著;Turjanski等[100]模擬了pKID與 KIX的結(jié)合過程,發(fā)現(xiàn)增強(qiáng)pKID螺旋的穩(wěn)定性會使得pKID與KIX的結(jié)合速率減慢.但是,對無序蛋白是否真的具有動力學(xué)優(yōu)勢,實(shí)驗(yàn)上并沒有很令人信服的結(jié)論,對于fly-casting機(jī)制是否適用也存在爭議.例如,Crespin等[101]就認(rèn)為apo-myoglobin的結(jié)合動力學(xué)不符合fly-casting機(jī)制.而且,結(jié)合過程中的一些重要因素在fly-casting模型中也沒有得到很好的考慮.例如,雖然無序蛋白質(zhì)的捕獲半徑比較大,但其擴(kuò)散速度卻會變慢,這個(gè)重要因素在flycasting模型中基本是被忽略的.最近,我們對這些問題進(jìn)行了研究[102].我們比較了45個(gè)有序蛋白及35個(gè)無序蛋白的結(jié)合動力學(xué)數(shù)據(jù),發(fā)現(xiàn)平均而言無序蛋白的結(jié)合速度要快2-3倍.進(jìn)一步地,我們對pKID與KIX的結(jié)合過程進(jìn)行模擬,發(fā)現(xiàn)無序蛋白雖然具有較大的捕獲半徑,但卻具有較小的擴(kuò)散系數(shù),這兩個(gè)因素基本是互相抵消的,從而導(dǎo)致無序蛋白的捕獲速度并不比有序蛋白高;無序蛋白具有較快結(jié)合速度的真正原因是其被捕獲(形成松散結(jié)合狀態(tài))后比較容易演化成最終的(緊密)結(jié)合結(jié)構(gòu),而有序蛋白被捕獲后卻容易逃逸掉,從而需要較多次數(shù)的捕獲才能最終完成整個(gè)的結(jié)合過程(圖5).
4.4 進(jìn)行蛋白質(zhì)修飾和傳遞信號
轉(zhuǎn)錄調(diào)節(jié)和信號傳遞過程通常伴隨著蛋白質(zhì)的修飾,如磷酸化、羥基化等.由于結(jié)構(gòu)上的柔性,無序蛋白質(zhì)更容易把需要修飾的位點(diǎn)暴露到外面,因而有利于修飾的進(jìn)行[10].Iakoucheva等[103]在對蛋白質(zhì)磷酸化位點(diǎn)的預(yù)測與分析中觀察到磷酸化位點(diǎn)周圍的氨基酸的性質(zhì)與無序蛋白質(zhì)很相近,說明蛋白質(zhì)磷酸化主要發(fā)生在無序的區(qū)域內(nèi).蛋白質(zhì)磷酸化可以用來產(chǎn)生超靈敏的結(jié)合或者解離信號[104-105],其中研究較多的一個(gè)體系,細(xì)胞周期蛋白依賴性激酶抑制因子Sic1,就是一個(gè)無序蛋白質(zhì).KIX與無序蛋白質(zhì)KID的結(jié)合也是通過磷酸化來調(diào)節(jié)的.KID上的Ser133被磷酸化以后,解離常數(shù)Kd從120 μmol· L-1減小到3.1 μmol·L-1,使得KID有效地與KIX結(jié)合,從而啟動轉(zhuǎn)錄過程[106].又如,結(jié)構(gòu)無序性在蛋白質(zhì)p27調(diào)控細(xì)胞周期的過程中起著重要的作用.在p27與Cdk2-cyclin A形成的復(fù)合物里,p27仍然有部分序列是無序的,這使得被包埋的酪氨酸(Tyr74, Tyr88)能夠被激酶磷酸化,然后Cdk2磷酸化p27 C端的蘇氨酸(Thr187),從而引發(fā)p27的泛素化和降解[78].
4.5 同時(shí)具有高的特異性(specificity)和低的親和力(affinity)
圖5 蛋白質(zhì)結(jié)合過程的熱力學(xué)與動力學(xué)分析[102]Fig.5 Thermodynamic and kinetic analyses of the binding process of protein[102]The average fraction of intramolecular native contacts of pKID in its free form,〈Q(free)〉,was used to quantify the degree of disorder(flexibility)off the model.By scaling the intra-molecular interactions,the pKID domain was continuously tuned from the disordered(coil,small〈Q(free)〉)tof the ordered(two helices,great〈Q(free)〉).Interactions between the pKID and KIX were left unchanged.The disordered system showed lowerf binding free energy barrier and greater binding rate than the ordered counterpart.
無序蛋白質(zhì)將折疊過程與結(jié)合過程耦合起來,通過與受體結(jié)合來穩(wěn)定折疊結(jié)構(gòu),這種耦合作用使得無序蛋白質(zhì)的結(jié)合過程具有高度的特異性和較低的受體親和力[9].無序蛋白質(zhì)構(gòu)象上的柔性,使得其可以很好適應(yīng)受體的表面環(huán)境,根據(jù)受體表面的親疏水性質(zhì)、靜電性質(zhì)、幾何結(jié)構(gòu)性質(zhì),實(shí)現(xiàn)最大程度的契合從而達(dá)到高度的結(jié)合特異性.當(dāng)無序蛋白質(zhì)與受體結(jié)合并發(fā)生有序化轉(zhuǎn)變時(shí),體系的構(gòu)象熵發(fā)生損失,而這個(gè)損失將由有序化轉(zhuǎn)變以及結(jié)合過程中所發(fā)生焓降低來補(bǔ)償,即焓-熵補(bǔ)償原理,從而使得體系的親和力降低[107].在我們對pKID與KIX結(jié)合過程的模擬中,我們發(fā)現(xiàn)隨著pKID螺旋結(jié)構(gòu)的減少,復(fù)合物的穩(wěn)定性確實(shí)是降低的[102].
5.1 研究內(nèi)容與分類
經(jīng)過近20年時(shí)間的發(fā)展,無序蛋白質(zhì)研究已經(jīng)逐漸成為蛋白質(zhì)研究領(lǐng)域的一個(gè)重要組成部分.目前無序蛋白質(zhì)的研究可以粗略地分成如下幾類:
(1)發(fā)展無序蛋白質(zhì)的預(yù)測算法并對大量數(shù)據(jù)進(jìn)行分析.這基本采用的是生物信息學(xué)的思路.無序蛋白質(zhì)的預(yù)測在無序蛋白質(zhì)研究中占據(jù)相對大的比重.從1997年報(bào)道的第一個(gè)無序蛋白質(zhì)預(yù)測算法起,無序蛋白質(zhì)預(yù)測的進(jìn)展迅速,目前已經(jīng)有50多種方法可以從不同的角度去預(yù)測一條蛋白質(zhì)序列的無序程度[60-61].除了方法本身的發(fā)展外,無序蛋白質(zhì)預(yù)測算法的研究也有助于深入認(rèn)識無序蛋白質(zhì)的動態(tài)結(jié)構(gòu)及其內(nèi)在原因.目前預(yù)測方法的研究呈現(xiàn)出功能化和專門化的趨勢,例如對結(jié)合位點(diǎn)[23,25]和氨基酸修飾位點(diǎn)[103]的預(yù)測,這將有助于進(jìn)一步深入分析無序蛋白質(zhì)的結(jié)構(gòu)與功能的關(guān)系.有了預(yù)測算法,人們就可以對目前存在的大量基因庫數(shù)據(jù)進(jìn)行分析,研究蛋白質(zhì)的結(jié)構(gòu)無序與物種、蛋白功能、蛋白大小、蛋白在細(xì)胞內(nèi)的分布等性質(zhì)之間的關(guān)聯(lián).例如對轉(zhuǎn)錄因子的分析[74,108]、對蛋白相互作用的分析[109]、對某一類疾病進(jìn)行分析[76]等.需要指出的是,目前這些研究雖然可以獲得無序與功能的關(guān)聯(lián),但對無序是如何實(shí)現(xiàn)這些功能還缺乏深入的認(rèn)識.當(dāng)實(shí)驗(yàn)上能夠獲得無序蛋白質(zhì)與受體結(jié)合的復(fù)合物結(jié)構(gòu)時(shí),對這些結(jié)構(gòu)的分析也可以獲得無序蛋白質(zhì)與受體之間相互作用的大量信息:形成界面的氨基酸類型、界面大小、親疏水性、氨基酸之間接觸的情況等[93].同一段無序蛋白質(zhì)序列還可以和多個(gè)受體進(jìn)行結(jié)合[85],通過對這些復(fù)合物結(jié)構(gòu)的分析比較可以研究無序蛋白質(zhì)結(jié)合多樣性的內(nèi)在原因.由于NMR和XRD方法測定復(fù)合物結(jié)構(gòu)的過程需要很長的時(shí)間,因此發(fā)展復(fù)合物結(jié)構(gòu)的預(yù)測方法也是一個(gè)很重要的研究方向[110-111].
(2)從實(shí)驗(yàn)上對具體體系的結(jié)構(gòu)、功能、機(jī)制等進(jìn)行細(xì)致的研究.這基本采用的是物理化學(xué)與生物化學(xué)的方法與思路.雖然實(shí)驗(yàn)上確認(rèn)的無序蛋白質(zhì)已經(jīng)有不少,但相對于無序蛋白質(zhì)在基因組中所占的比重來說,這些工作還有很大的空間可以發(fā)展.實(shí)驗(yàn)上主要是發(fā)現(xiàn)新的無序蛋白質(zhì)并研究其功能,例如,對Calmodulin調(diào)控因子PEP-19[112]、原核生物的類泛素蛋白Pup[113]、腫瘤抑制因子p53[114]的無序結(jié)構(gòu)都有詳細(xì)的研究.另外也可以對無序結(jié)構(gòu)的構(gòu)象性質(zhì)進(jìn)行表征,確定這些無序構(gòu)象的二級結(jié)構(gòu)的含量和類型,以及其多樣性是如何影響蛋白質(zhì)功能的[41-42,44-45,50-52,55].值得一提的是,目前對無序蛋白質(zhì)構(gòu)象的研究主要集中在無序蛋白質(zhì)處于游離態(tài)的構(gòu)象,或者是發(fā)生了折疊的結(jié)合態(tài)的構(gòu)象.其實(shí),即使在結(jié)合態(tài)中,仍然有相當(dāng)?shù)臒o序蛋白質(zhì)區(qū)域是沒有發(fā)生折疊的[26,28],目前還沒有對這部分區(qū)域的構(gòu)象進(jìn)行專門研究的報(bào)道.
(3)理論與模擬研究.與前面兩類研究相比,對無序蛋白質(zhì)的物理、化學(xué)性質(zhì)的計(jì)算機(jī)模擬及理論研究則相對要少一些.在這方面一個(gè)較早的工作是DeLisi等[115]在1994年作出的.他們提出了一個(gè)理論框架用于計(jì)算配體與蛋白質(zhì)結(jié)合時(shí)的自由能變化,并考慮了無序結(jié)構(gòu)帶來的柔性與位形熵的問題.另一個(gè)比較有影響的工作是前面介紹的fly-casting模型[96].Wang等[97-98]則通過一系列的理論工作詳細(xì)地分析了無序蛋白質(zhì)的折疊與結(jié)合的耦合過程.最近一項(xiàng)基于基本熱力學(xué)關(guān)系的理論工作在定量上分析了無序蛋白質(zhì)與功能的關(guān)聯(lián),并指出無序蛋白質(zhì)在酶催化以及相互作用很弱的蛋白-蛋白相互作用過程中廣泛出現(xiàn)的可能性較小[107].通過簡單的格點(diǎn)模型也可以對結(jié)合過程進(jìn)行分析[116],而連續(xù)的粗?;疓ō-model更是被廣泛用來分析無序蛋白質(zhì)與受體的熱力學(xué)與動力學(xué)過程,對折疊與結(jié)合的耦合過程提供了更深刻的認(rèn)識[99,100,102,117-118].我們小組對pKID-KIX體系的模擬[102]就屬于這類研究.全原子模擬也是非常有用的研究手段,不過受計(jì)算能力的限制,對蛋白質(zhì)結(jié)合的研究經(jīng)常是通過分析復(fù)合物的解離過程而進(jìn)行的[119-120].例如,Chen等[120]對無序蛋白質(zhì)p53與有序蛋白質(zhì)MDM2,無序蛋白質(zhì)PAZ與siRNA[121]和無序蛋白質(zhì)TISlldTZF與mRNA[122]結(jié)合過程中折疊結(jié)合的耦合機(jī)理進(jìn)行了大量的研究,模擬的結(jié)果與實(shí)驗(yàn)結(jié)果一致.
5.2 國內(nèi)無序蛋白質(zhì)領(lǐng)域的研究現(xiàn)狀
無序蛋白質(zhì)概念在國際上的提出已經(jīng)引起了國內(nèi)同行的關(guān)注.中國科學(xué)院上海生命科學(xué)研究院的王克夷[123]在國內(nèi)期刊《生命的化學(xué)》上發(fā)表文章介紹了無序蛋白質(zhì)的概念.中國科學(xué)技術(shù)大學(xué)涂曉明課題組[84]發(fā)現(xiàn)原核生物體內(nèi)的泛素類蛋白質(zhì)Rv2111c是一個(gè)新的無序蛋白質(zhì).中國醫(yī)學(xué)科學(xué)院何維課題組[81]發(fā)現(xiàn)胸腺的一種老化相關(guān)蛋白質(zhì)Rwdd1很可能是一個(gè)無序蛋白質(zhì).中國科學(xué)院上海生命科學(xué)研究院胡紅雨課題組[80]則發(fā)現(xiàn)核心序列GAV motif只有處于無序的序列區(qū)間才能使蛋白質(zhì)發(fā)生聚集.哈爾濱工程大學(xué)的王科俊課題組與Dunker等人合作,開展了無序蛋白質(zhì)預(yù)測算法的研究并發(fā)表了綜述文章[61].上海交通大學(xué)陳海峰課題組[124]采用全原子分子動力學(xué)模擬的方法對KID蛋白的磷酸化、無序蛋白質(zhì)與RNA的結(jié)合過程[121-122]等進(jìn)行研究,取得了良好效果.德州學(xué)院王吉華課題組[125]發(fā)展針對無序蛋白的模擬方法,研究無序蛋白質(zhì)的結(jié)構(gòu)特征、構(gòu)象變化、熱力學(xué)和動力學(xué)性質(zhì),探索其結(jié)構(gòu)與功能,尤其是與疾病的關(guān)系[126].香港科技大學(xué)的Lee等[127]研究EWS癌蛋白,發(fā)現(xiàn)其無序結(jié)構(gòu)的芳香族殘基側(cè)鏈對轉(zhuǎn)移活性起著關(guān)鍵作用.我們課題組[102]主要關(guān)注無序蛋白質(zhì)的構(gòu)象以及無序蛋白質(zhì)在結(jié)合過程中的熱力學(xué)和動力學(xué)性質(zhì),發(fā)現(xiàn)無序蛋白質(zhì)在結(jié)合過程中的自由能勢壘比有序蛋白質(zhì)低,結(jié)合速率快.
對無序蛋白質(zhì)的研究具有很多潛在的應(yīng)用:
第一,有助于理解蛋白質(zhì)的折疊過程.蛋白質(zhì)的折疊過程是從一個(gè)解折疊態(tài)出發(fā)向折疊態(tài)演化的過程,但通常蛋白質(zhì)的解折疊態(tài)是通過化學(xué)變性劑或者高溫使得蛋白質(zhì)變性得到的,而處于變性條件下的解折疊構(gòu)象可能與處于非變性條件下的解折疊構(gòu)象是不同的.無序蛋白質(zhì)在天然狀態(tài)下就是非折疊的,對其構(gòu)象的研究可以為探索蛋白質(zhì)的解折疊構(gòu)象提供重要的信息,從而有助于理解蛋白質(zhì)的折疊機(jī)理,尤其是折疊過程的初始階段[128].
第二,幫助確定蛋白質(zhì)的結(jié)構(gòu).目前我們擁有的蛋白質(zhì)序列信息已經(jīng)超過四百萬條,而PDB數(shù)據(jù)庫里記錄的蛋白質(zhì)結(jié)構(gòu)只有約四萬個(gè),也就是說大約只有1%的蛋白質(zhì)的結(jié)構(gòu)被測定了.根據(jù)估計(jì),多達(dá)70%的蛋白質(zhì)利用目前的實(shí)驗(yàn)方法是無法確定其結(jié)構(gòu)的[129].因此,無序結(jié)構(gòu)預(yù)測可以幫助人們更好地排除那些不適合結(jié)構(gòu)測定的蛋白質(zhì).另外,無序預(yù)測還可以幫助解決結(jié)構(gòu)測定過程中遇到的問題.例如,全長的NEIL1蛋白質(zhì)在各種條件下都不能結(jié)晶.對其進(jìn)行無序結(jié)構(gòu)預(yù)測時(shí)發(fā)現(xiàn)在C端有一段106個(gè)氨基酸的無序片段,在將C端的100個(gè)氨基酸去掉后便順利獲得了NEIL1的結(jié)晶[130].
第三,有助于蛋白質(zhì)設(shè)計(jì).蛋白質(zhì)設(shè)計(jì)的主要目標(biāo)是產(chǎn)生新的蛋白質(zhì)結(jié)構(gòu)類型與功能,而目前的設(shè)計(jì)工作主要是基于經(jīng)驗(yàn)和已有的蛋白質(zhì)結(jié)構(gòu)[131-132].蛋白質(zhì)結(jié)構(gòu)預(yù)測是蛋白質(zhì)設(shè)計(jì)的一個(gè)重要方面,但預(yù)測過程的計(jì)算量通常較大[133],并且在缺乏同源結(jié)構(gòu)和相關(guān)的實(shí)驗(yàn)數(shù)據(jù)的情況下,預(yù)測的準(zhǔn)確度往往較低.相反,蛋白質(zhì)無序結(jié)構(gòu)的預(yù)測方法多,計(jì)算量小,預(yù)測的準(zhǔn)確度高.因此可以在蛋白質(zhì)設(shè)計(jì)的初始階段對設(shè)計(jì)的蛋白質(zhì)序列進(jìn)行無序結(jié)構(gòu)的預(yù)測,篩選出具有高有序傾向的序列,再進(jìn)行后繼的設(shè)計(jì)過程.另外,通過嫁接活性位點(diǎn)的方式可以使蛋白質(zhì)產(chǎn)生新功能[134],這種方案也許可以進(jìn)一步推廣,在現(xiàn)有的有序蛋白質(zhì)中引進(jìn)無序的功能序列,從而在保持拓?fù)浣Y(jié)構(gòu)的同時(shí)產(chǎn)生新的功能.
第四,無序蛋白質(zhì)可能成為新的藥物靶標(biāo).目前藥物設(shè)計(jì)的靶標(biāo)主要是有序的蛋白質(zhì)[135].無序蛋白質(zhì)在生物體廣泛存在,其與受體結(jié)合的親和力較低,因此這種相互作用更容易被小分子阻斷,從而有可能成為藥物設(shè)計(jì)的靶標(biāo).目前研究比較多的體系有p53-MDM2[136-139]和KID-KIX[140].盡管以無序蛋白質(zhì)為基礎(chǔ)的藥物設(shè)計(jì)只是剛剛開始,但這一領(lǐng)域的開拓可能會給藥物開發(fā)帶來重要影響[141].
與傳統(tǒng)的蛋白質(zhì)具有確定三維結(jié)構(gòu)的觀點(diǎn)不同,無序蛋白質(zhì)并沒有確定的三維結(jié)構(gòu),但可以具有局部的二級結(jié)構(gòu).無序蛋白質(zhì)具有獨(dú)特的氨基酸組成特點(diǎn),這些獨(dú)特的氨基酸序列決定了其無序的結(jié)構(gòu).結(jié)構(gòu)上的柔性使得無序蛋白質(zhì)能夠更好地進(jìn)行分子識別,因此無序蛋白質(zhì)廣泛參與了細(xì)胞中很多的生理和病理過程,比如信號傳遞、DNA的轉(zhuǎn)錄的調(diào)控、細(xì)胞分裂的調(diào)控和蛋白質(zhì)聚集引起的疾病過程.無序蛋白質(zhì)的研究將促進(jìn)人們重新認(rèn)識蛋白質(zhì)的結(jié)構(gòu)和功能關(guān)系,也為蛋白質(zhì)的全新設(shè)計(jì)和疾病治療提供新的思路.
無序蛋白質(zhì)在各種生物體內(nèi)廣泛存在,并且生命形式越高級無序蛋白質(zhì)的含量越多,這無疑是生物進(jìn)化的結(jié)果,是蛋白質(zhì)平行進(jìn)化的產(chǎn)物.有序蛋白質(zhì)為生物體提供了結(jié)構(gòu)上的支架(scaffold),使得各種酶促反應(yīng)和生物過程具有高度的選擇性;而無序蛋白質(zhì)或者無序的區(qū)域則大大豐富了有序蛋白質(zhì)的結(jié)構(gòu)和功能,使得有序蛋白質(zhì)在結(jié)構(gòu)上具有可調(diào)節(jié)性和功能的多樣性[142].兩者的緊密結(jié)合使得各種錯(cuò)綜復(fù)雜的生命過程得以有序進(jìn)行.
經(jīng)過十幾年的發(fā)展,人們對無序蛋白質(zhì)的認(rèn)識已經(jīng)有了很大的進(jìn)步.除了基礎(chǔ)研究的深入外,對無序蛋白質(zhì)的研究還深化了對蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性[143]、酶活性[144]等的認(rèn)識,也為藥物靶點(diǎn)的設(shè)計(jì)提供了新的選擇[141].但要真正清楚認(rèn)識無序蛋白質(zhì)的序列-結(jié)構(gòu)-功能關(guān)系,還有大量的工作要開展.
1 Fischer,E.Ber.Dt.Chem.Ges.,1894,27:2985
2 Wu,H.Chin.J.Physiol.,1931,1:219
3 Mirsky,A.E.;Pauling,L.Proc.Natl.Acad.Sci.U.S.A.,1936, 22:439
4 Uversky,V.N.Protein Sci.,2002,11:739
5 Dunker,A.K.;Brown,C.J.;Lawson,J.D.;Iakoucheva,L.M.; Obradovic′,Z.Biochemistry,2002,41:6573
6 Wright,P.E.;Dyson,H.J.J.Mol.Biol.,1999,293:321
7 Schweers,O.;Sch?nbrunn-Hanebeck,E.;Marx,A.;Mandelkow, E.J.Biol.Chem.,1994,269:24290
8 Sickmeier,M.;Hamilton,J.A.;LeGall,T.;Vacic,V.;Cortese,M. S.;Tantos,A.;Szabo,B.;Tompa,P.;Chen,J.;Uversky,V.N.; Obradovic,Z.;Dunker,A.K.Nucleic Acids Res.,2007,35:D786
9 Dunker,A.K.;Lawson,J.D.;Brown,C.J.;Williams,R.M.; Romero,P.;Oh,J.S.;Oldfield,C.J.;Campen,A.M.;Ratliff,C. M.;Hipps,K.W.;Ausio,J.;Nissen,M.S.;Reeves,R.;Kang,C.; Kissinger,C.R.;Bailey,R.W.;Griswold,M.D.;Chiu,W.; Garner,E.C.;Obradovic,Z.J.Mol.Graph.Model.,2001,19:26
10 Dyson,H.J.;Wright,P.E.Nat.Rev.Mol.Cell Biol.,2005,6:197
11 Eliezer,D.Curr.Opin.Struct.Biol.,2009,19:23
12 Receveur-Bréchot,V.;Bourhis,J.M.;Uversky,V.N.;Canard,B.; Longhi,S.Proteins,2006,62:24
13 Fontana,A.;Zambonin,M.;de Laureto,P.P.;DeFilippis,V.; Clementi,A.;Scaramella,E.J.Mol.Biol.,1997,266:223
14 Iakoucheva,L.M.;Kimzey,A.L.;Masselon,C.D.;Bruce,J.E.; Garner,E.C.;Brown,C.J.;Dunker,A.K.;Smith,R.D.; Ackerman,E.J.Protein Sci.,2001,10:560
15 Dyson,H.J.;Wright,P.E.Chem.Rev.,2004,104:3607
16 Muchmore,S.W.;Sattler,M.;Liang,H.;Meadows,R.P.;Harlan, J.E.;Yoon,H.S.;Nettesheim,D.;Chang,B.S.;Thompson,C. B.;Wong,S.L.;Ng,S.C.;Fesik,S.W.Nature,1996,381:335
17 Li,C.G.;Charlton,L.M.;Lakkavaram,A.;Seagle,C.;Wang,G. F.;Young,G.B.;Macdonald,J.M.;Pielak,G.J.J.Am.Chem. Soc.,2008,130:6310
18 Yoon,M.K.;Venkatachalam,V.;Huang,A.;Choi,B.S.;Stultz, C.M.;Chou,J.J.Protein Sci.,2009,18:337
19 Radhakrishnan,I.;Pérez-Alvarado,G.C.;Dyson,H.J.;Wright,P. E.FEBS Lett.,1998,430:317
20 Fuxreiter,M.;Simon,I.;Friedrich,P.;Tompa,P.J.Mol.Biol., 2004,338:1015
21 Csizmók,V.;Bokor,M.;Bánki,P.;Klement,T.;Medzihradszky, K.F.;Friedrich,P.;Tompa,K.A.;Tompa,P.Biochemistry,2005, 44:3955
22 Fuxreiter,M.;Tompa,P.;Simon,I.Bioinformatics,2007,23: 950
23 Oldfield,C.J.;Cheng,Y.G.;Cortese,M.S.;Romero,P.; Uversky,V.N.;Dunker,A.K.Biochemistry,2005,44:12454
24 Mohan,A.;Oldfield,C.J.;Radivojac,P.;Vacic,V.;Cortese,M. S.;Dunker,A.K.;Uversky,V.N.J.Mol.Biol.,2006,362:1043
25 Mészáros,B.;Simon,I.;Dosztányi,Z.PLoS Comput.Biol.,2009, 5:e1000376
26 Radhakrishnan,I.;Pérez-Alvarado,G.C.;Parker,D.;Dyson,H. J.;Montminy,M.R.;Wright,P.E.Cell,1997,91:741
27 Sugase,K.;Dyson,H.J.;Wright,P.E.Nature,2007,447:1021
28 Tompa,P.;Fuxreiter,M.Trends Biochem.Sci.,2008,33:2
29 Dosztányi,Z.;Csizómk,V.;Tompa,P.;Simon,I.J.Mol.Biol., 2005,347:827
30 Ellis,R.J.;Minton,A.P.Nature,2003,425:27
31 McNulty,B.C.;Young,G.B.;Pielak,G.J.J.Mol.Biol.,2006, 355:893
32 Flaugh,S.L.;Lumb,K.J.Biomacromolecules,2001,2:538
33 Mouillon,J.M.;Eriksson,S.K.;Harryson,P.Plant Physiol., 2008,148:1925
34 Dedmon,M.M.;Patel,C.N.;Young,G.B.;Pielak,G.J.Proc. Natl.Acad.Sci.U.S.A.,2002,99:12681
35 Croke,R.L.;Sallum,C.O.;Watson,E.;Watt,E.D.; Alexandrescu,A.T.Protein Sci.,2008,17:1434
36 Wang,W.;Xu,W.X.;Levy,Y.;Trizac,E.;Wolynes,P.G.Proc. Natl.Acad.Sci.U.S.A.,2009,106:5517
37 Zhou,H.X.Arch.Biochem.Biophys.,2008,469:76
38 Meier,S.;Blackledge,M.;Grzesiek,S.J.Chem.Phys.,2008, 128:052204
39 Shortle,D.;Ackerman,M.S.Science,2001,293:487
40 Blackledge,M.Prog.Nucl.Magn.Reson.Spectrosc.,2005,46: 23
41 Jensen,M.R.;Markwick,P.R.L.;Meier,S.;Griesinger,C.; Zweckstetter,M.;Grzesiek,S.;Bernadó,P.;Blackledge,M. Structure,2009,17:1169
42 Bernadó,P.;Mylonas,E.;Petoukhov,M.V.;Blackledge,M.; Svergun,D.I.J.Am.Chem.Soc.,2007,129:5656
43 Mittag,T.;Forman-Kay,J.D.Curr.Opin.Struct.Biol.,2007, 17:3
44 Chen,H.M.;Rhoades,E.Curr.Opin.Struct.Biol.,2008,18:516
45 Huang,F.;Rajagopalan,S.;Settanni,G.;Marsh,R.J.; Armoogum,D.A.;Nicolaou,N.;Bain,A.J.;Lerner,E.;Haas,E.; Ying,L.;Fersht,A.R.Proc.Natl.Acad.Sci.U.S.A.,2009,106: 20758
46 Hegedüs,T.;Serohijos,A.W.R.;Dokholyan,N.V.;He,L.H.; Riordan,J.R.J.Mol.Biol.,2008,378:1052
47 Solt,I.;Magyar,C.;Simon,I.;Tompa,P.;Fuxreiter,M.Proteins, 2006,64:749
48 Ganguly,D.;Chen,J.H.J.Am.Chem.Soc.,2009,131:5214
49 Smith,L.J.Methods,2004,34:144
50 Huang,J.R.;Grzesiek,S.J.Am.Chem.Soc.,2010,132:694
51 Lindorff-Larsen,K.;Kristjansdottir,S.;Teilum,K.;Fieber,W.; Dobson,C.M.;Poulsen,F.M.;Vendruscolo,M.J.Am.Chem. Soc.,2004,126:3291
52 Mylonas,E.;Hascher,A.;Bernadó,P.;Blackledge,M.; Mandelkow,E.;Svergun,D.I.Biochemistry,2008,47:10345
53 Choy,W.Y.;Forman-Kay,J.D.J.Mol.Biol.,2001,308:1011
54 Marsh,J.A.;Neale,C.;Jack,F.E.;Choy,W.Y.;Lee,A.Y.; Crowhurst,K.A.;Forman-Kay,J.D.J.Mol.Biol.,2007,367: 1494
55 Marsh,J.A.;Forman-Kay,J.D.J.Mol.Biol.,2009,391:359
56 Romero,P.;Obradovic,Z.;Li,X.H.;Garner,E.C.;Brown,C.J.; Dunker,A.K.Proteins,2001,42:38
57 Radivojac,P.;Iakoucheva,L.M.;Oldfield,C.J.;Obradovic,Z.; Uversky,V.N.;Dunker,A.K.Biophys.J.,2007,92:1439
58 Galzitskaya,O.V.;Garbuzynskiy,S.O.;Lobanov,M.Y.J.Phys.-Condes.Matter,2007,19:285225
59 Romero,P.;Obradovic,Z.;Kissinger,C.;Villafranca,J.E.; Dunker,A.K.Proc.IEEE Int.Conf.Neural Networks,1997,1: 90
60 Ferron,F.;Longhi,S.;Canard,B.;Karlin,D.Proteins,2006,65:1
61 He,B.;Wang,K.J.;Liu,Y.L.;Xue,B.;Uversky,V.N.;Dunker, A.K.Cell Res.,2009,19:929
62 Prilusky,J.;Felder,C.E.;Zeev-Ben-Mordehai,T.;Rydberg,E. H.;Man,O.;Beckmann,J.S.;Silman,I.;Sussman,J.L. Bioinformatics,2005,21:3435
63 Schlessinger,A.;Punta,M.;Rost,B.Bioinformatics,2007,23: 2376
64 Ward,J.J.;Sodhi,J.S.;McGuffin,L.J.;Buxton,B.F.;Jones,D. T.J.Mol.Biol.,2004,337:635
65 Linding,R.;Russell,R.B.;Neduva,V.;Gibson,T.J.Nucleic Acids Res.,2003,31:3701
66 Linding,R.;Jensen,L.J.;Diella,F.;Bork,P.;Gibson,T.J.; Russell,R.B.Structure,2003,11:1453
67 Coeytaux,K.;Poupon,A.Bioinformatics,2005,21:1891
68 Yang,Z.R.;Thomson,R.;McNeil,P.;Esnouf,R.M. Bioinformatics,2005,21:3369
69 Bryson,K.;McGuffin,L.J.;Marsden,R.L.;Ward,J.J.;Sodhi,J. S.;Jones,D.T.Nucleic Acids Res.,2005,33:W36
70 Vullo,A.;Bortolami,O.;Pollastri,G.;Tosatto,S.C.E.Nucleic Acids Res.,2006,34:W164
71 Shimizu,K.;Muraoka,Y.;Hirose,S.;Tomii,K.;Noguchi,T. BMC Bioinformatics,2007,8:78
72 Galzitskaya,O.V.;Garbuzynskiy,S.O.;Lobanov,M.Y. Bioinformatics,2006,22:2948
73 Noivirt-Brik,O.;Prilusky,J.;Sussman,J.L.Proteins,2009,77: 210
74 Liu,J.G.;Perumal,N.B.;Oldfield,C.J.;Su,E.W.;Uversky,V. N.;Dunker,A.K.Biochemistry,2006,45:6873
75 Iakoucheva,L.M.;Brown,C.J.;Lawson,J.D.;Obradovic′,Z.; Dunker,A.K.J.Mol.Biol.,2002,323:573
76 Cheng,Y.G.;LeGall,T.;Oldfield,C.J.;Dunker,A.K.;Uversky, V.N.Biochemistry,2006,45:10448
77 Xie,H.B.;Vucetic,S.;Iakoucheva,L.M.;Oldfield,C.J.; Dunker,A.K.;Uversky,V.N.;Obradovic,Z.J.Proteome Res., 2007,6:1882
78 Galea,C.A.;Wang,Y.;Sivakolundu,S.G.;Kriwacki,R.W. Biochemistry,2008,47:7598a
79 Uversky,V.N.Frontiers Biosci.,2009,14:5188
80 Ji,L.N.;Du,H.N.;Zhang,F.;Li,H.T.;Luo,X.Y.;Hu,J.;Hu, H.Y.Protein J.,2005,24:209
81 Kang,N.;Chen,D.;Wang,L.;Duan,L.;Liu,S.R.;Tang,L.;Liu, Q.F.;Cui,L.X.;He,W.Cell.Mol.Immunol.,2008,5:333
82 Zhang,M.S.;Pickart,C.M.;Coffino,P.EMBO J.,2003,22: 1488
83 Pe?a,M.M.O.;Melo,S.P.;Xing,Y.Y.;White,K.;Barbour,K. W.;Berger,F.G.J.Biol.Chem.,2009,284:31597
84 Liao,S.H.;Shang,Q.;Zhang,X.C.;Zhang,J.H.;Xu,C.;Tu,X. M.Biochem.J.,2009,422:207
85 Kriwacki,R.W.;Hengst,L.;Tennant,L.;Reed,S.I.;Wright,P. E.Proc.Natl.Acad.Sci.U.S.A.,1996,93:11504
86 Dames,S.A.;Martinez-Yamout,M.;De Guzman,R.N.;Dyson, H.J.;Wright,P.E.Proc.Natl.Acad.Sci.U.S.A.,2002,99: 5271
87 Elkins,J.M.;Hewitson,K.S.;McNeill,L.A.;Seibel,J.F.; Schlemminger,I.;Pugh,C.W.;Ratcliffe,P.J.;Schofield,C.J. J.Biol.Chem.,2003,278:1802
88 Dunker,A.K.;Cortese,M.S.;Romero,P.;Iakoucheva,L.M.; Uversky,V.N.FEBS J.,2005,272:5129
89 Haynes,C.;Oldfield,C.J.;Ji,F.;Klitgord,N.;Cusick,M.E.; Radivojac,P.;Uversky,V.N.;Vidal,M.;Iakoucheva,L.M.PLoS Comput.Biol.,2006,2:e100
90 Singh,G.P.;Ganapathi,M.;Dash,D.Proteins,2007,66:761
91 Patil,A.;Nakamura,H.FEBS Lett.,2006,580:2041
92 Tompa,P.;Szász,C.;Buday,L.Trends Biochem.Sci.,2005,30: 484
93 Mészáros,B.;Tompa,P.;Simon,I.;Dosztányi,Z.J.Mol.Biol., 2007,372:549
94 Gunasekaran,K.;Tsai,C.J.;Kumar,S.;Zanuy,D.;Nussinov,R. Trends Biochem.Sci.,2003,28:81
95 Schreiber,G.;Haran,G.;Zhou,H.X.Chem.Rev.,2009,109: 839
96 Shoemaker,B.A.;Portman,J.J.;Wolynes,P.G.Proc.Natl. Acad.Sci.U.S.A.,2000,97:8868
97 Wang,J.;Zhang,K.;Lu,H.Y.;Wang,E.K.Phys.Rev.Lett., 2006,96:168101
98 Wang,J.;Zhang,K.;Lu,H.Y.;Wang,E.K.Biophys.J.,2006, 91:866
99 Levy,Y.;Onuchic,J.N.;Wolynes,P.G.J.Am.Chem.Soc., 2007,129:738
100 Turjanski,A.G.;Gutkind,J.S.;Best,R.B.;Hummer,G.PLoS Comput.Biol.,2008,4:e1000060
101 Crespin,M.O.;Boys,B.L.;Konermann,L.FEBS Lett.,2005, 579:271
102 Huang,Y.Q.;Liu,Z.R.J.Mol.Biol.,2009,393:1143
103 Iakoucheva,L.M.;Radivojac,P.;Brown,C.J.;O′Connor,T.R.; Sikes,J.G.;Obradovic,Z.;Dunker,A.K.Nucleic Acids Res., 2004,32:1037
104 Ferrell Jr.,J.E.Trends Biochem.Sci.,1996,21:460
105 Borg,M.;Mittag,T.;Pawson,T.;Tyers,M.;Forman-Kay,J.D.; Chan,H.S.Proc.Natl.Acad.Sci.U.S.A.,2007,104:9650
106 Zor,T.;Mayr,B.M.;Dyson,H.J.;Montminy,M.R.;Wright,P. E.J.Biol.Chem.,2002,277:42241
107 Liu,J.T.;Faeder,J.R.;Camacho,C.J.Proc.Natl.Acad.Sci.U. S.A.,2009,106:19819
108 Singh,G.P.;Dash,D.Proteins,2007,68:602
109 Shimizu,K.;Toh,H.J.Mol.Biol.,2009,392:1253
110 Staneva,I.;Wallin,S.J.Mol.Biol.,2009,393:1118
111 Hu,X.;Lee,M.S.;Wallqvist,A.Biochemistry,2009,48:11158
112 Kleerekoper,Q.K.;Putkey,J.A.J.Biol.Chem.,2009,284:7455
113 Chen,X.;Solomon,W.C.;Kang,Y.;Cerda-Maira,F.;Darwin,K. H.;Walters,K.J.J.Mol.Biol.,2009,392:208
114 Wells,M.;Tidow,H.;Rutherford,T.J.;Markwick,P.;Jensen,M. R.;Mylonas,E.;Svergun,D.I.;Blackledge,M.;Fersht,A.R. Proc.Natl.Acad.Sci.U.S.A.,2008,105:5762
115 Vajda,S.;Weng,Z.P.;Rosenfeld,R.;DeLisi,C.Biochemistry, 1994,33:13977
116 Gupta,N.;Irb?ck,A.J.Chem.Phys.,2004,120:3983
117 Wang,J.;Lu,Q.;Lu,H.P.PLoS Comput.Biol.,2006,2:e78
118 Levy,Y.;Wolynes,P.G.;Onuchic,J.N.Proc.Natl.Acad.Sci.U. S.A.,2004,101:511
119 Verkhivker,G.M.;Bouzida,D.;Gehlhaar,D.K.;Rejto,P.A.; Freer,S.T.;Rose,P.W.Proc.Natl.Acad.Sci.U.S.A.,2003, 100:5148
120 Chen,H.F.;Luo,R.J.Am.Chem.Soc.,2007,129:2930
121 Chen,H.F.J.Chem.Theory Comput.,2008,4:1360
122 Qin,F.;Chen,Y.;Li,Y.X.;Chen,H.F.J.Chem.Phys.,2009, 131:115103
123 Wang,K.Y.Chem.Life,2006,26:199 [王克夷.生命的化學(xué), 2006,26:199]
124 Chen,H.F.PLoS ONE,2009,4:e6516
125 Cao,Z.X.;Wang,J.H.J.Biomol.Struct.Dyn.,2010,5:651
126 Wang,J.H.;Cao,Z.X.;Li,S.Q.Curr.Comput.Aided Drug Des., 2009,5:280
127 Ng,K.P.;Potikyan,G.;Savene,R.O.V.;Denny,C.T.;Uversky, V.N.;Lee,K.A.W.Proc.Natl.Acad.Sci.U.S.A.,2007,104: 479
128 Smith,L.J.;Fiebig,K.M.;Schwalbe,H.;Dobson,C.M.Folding Des.,1996,1:R95
129 Adams,M.;Joachimiak,A.;Kim,R.;Montelione,G.T.;Norvell, J.J.Struct.Funct.Genomics,2004,5:1
130 Bandaru,V.;Cooper,W.;Wallace,S.S.;Doublie,S.Acta Crystallogr.Sect.D-Biol.Crystallogr.,2004,60:1142
131 Lippow,S.M.;Tidor,B.Curr.Opin.Biotech.,2007,18:305
132 Floudas,C.A.;Fung,H.K.;McAllister,S.R.;M?nigmann,M.; Rajgaria,R.Chem.Eng.Sci.,2006,61:966
133 Kim,D.E.;Blum,B.;Bradley,P.;Baker,D.J.Mol.Biol.,2009, 393:249
134 Liu,S.;Liu,S.Y.;Zhu,X.L.;Liang,H.H.;Cao,A.N.;Chang,Z. J.;Lai,L.H.Proc.Natl.Acad.Sci.U.S.A.,2007,104:5330
135 Zheng,C.J.;Han,L.Y.;Yap,C.W.;Ji,Z.L.;Cao,Z.W.;Chen, Y.Z.Pharmacol.Rev.,2006,58:259
136 Chène,P.Mol.Cancer Res.,2004,2:20
137 Wasylyk,C.;Salvi,R.;Argentini,M.;Dureuil,C.;Delumeau,I.; Abecassis,J.;Debussche,L.;Wasylyk,B.Oncogene,1999,18: 1921
138 Chène,P.;Fuchs,J.;Bohn,J.;García-Echeverría,C.;Furet,P.; Fabbro,D.J.Mol.Biol.,2000,299:245
139 Vassilev,L.T.Cell Cycle,2004,3:419
140 Best,J.L.;Amezcua,C.A.;Mayr,B.;Flechner,L.;Murawsky,C. M.;Emerson,B.;Zor,T.;Gardner,K.H.;Montminy,M.Proc. Natl.Acad.Sci.U.S.A.,2004,101:17622
141 Cheng,Y.;LeGall,T.;Oldfield,C.J.;Mueller,J.P.;Van,Y.Y. J.;Romero,P.;Cortese,M.S.;Uversky,V.N.;Dunker,A.K. Trends Biotech.,2006,24:435
142 Cortese,M.S.;Uversky,V.N.;Dunker,A.K.Prog.Biophys. Mol.Biol.,2008,98:85
143 Horn,J.R.;Kraybill,B.;Petro,E.J.;Coales,S.J.;Morrow,J.A.; Hamuro,Y.;Kossiakoff,A.A.Biochemistry,2006,45:8488
144 Vamvaca,K.;Jelesarov,I.;Hilvert,D.J.Mol.Biol.,2008,382: 971
February 3,2010;Revised:April 1,2010;Published on Web:May 13,2010.
Intrinsically Disordered Proteins:the New Sequence-Structure-Function Relations
HUANG Yong-Qi LIU Zhi-Rong*
(Beijing National Laboratory for Molecular Sciences,Center for Theoretical Biology,College of Chemistry and Molecular Engineering,Peking University,Beijing 100871,P.R.China)
Intrinsically disordered proteins(IDPs)are a new class of proteins which lack a unique tertiary structure under native conditions while possessing essential biological functions.They take part in various physiological processes such as signal transduction,transcription and translation regulation,and protein modification.The discovery of IDPs challenges the conventional protein“sequence-structure-function”paradigm.In this review,we first overview the history of the conventional protein paradigm and the discovery of IDPs.Then we discuss the characteristics of IDPs in terms of sequence,structure,and biological function.Taking molecular recognition processes as an example,we further introduce current opinions on the advantages of IDPs in binding.Finally,we analyze possible applications of the study of IDPs such as further understanding the protein folding mechanism,improving protein structure determination,providing new clues for protein design and new targets for drug design.The current status of IDPs study in China is also briefly presented.
Intrinsically disordered protein; Protein folding; Protein interaction; Molecular recognition; Protein structure prediction; Drug design
[Review] www.whxb.pku.edu.cn
*Corresponding author.Email:LiuZhiRong@pku.edu.cn;Tel:+86-10-62752541;Fax:+86-10-62759595.
The project was supported by the National Natural Science Foundation of China(20973016,10721403),National Key Basis Research Program of China(973)(2009CB918500),and Scientific Research Foundation for the Returned Overseas Chinese Scholars,Ministry of Education,China.
國家自然科學(xué)基金(20973016、10721403)、國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目(973)(2009CB918500)和教育部留學(xué)回國人員科研啟動基金資助
O641;Q51