張鵬程 方文玉 鮑磊 康文斌 ?
1) (湖北醫(yī)藥學(xué)院,公共衛(wèi)生與管理學(xué)院,十堰 442000)
2) (湖北省南水北調(diào)水源區(qū)生物醫(yī)藥研發(fā)檢測(cè)共享平臺(tái),十堰 442000)
蛋白質(zhì)分子的“液-液相分離”是近幾年生物物理學(xué)領(lǐng)域迅速發(fā)展起來的研究熱點(diǎn).蛋白質(zhì)相分離在一系列生物學(xué)過程中發(fā)揮著重要的作用.蛋白質(zhì)分子序列和構(gòu)象的多樣性和復(fù)雜性,給蛋白質(zhì)分子的理論研究、計(jì)算機(jī)模擬和實(shí)驗(yàn)研究都帶來了巨大的挑戰(zhàn).當(dāng)前,多尺度理論模型和多分辨率計(jì)算方法被廣泛地用于蛋白質(zhì)分子的“液-液相分離”的研究中.本文將對(duì)蛋白質(zhì)分子“液-液相分離”的理論基礎(chǔ)和計(jì)算機(jī)模擬方法進(jìn)行簡要的綜述,并對(duì)這些理論和方法未來的發(fā)展趨勢(shì)進(jìn)行了初步的探討和展望.期望為進(jìn)一步研究蛋白質(zhì)“液-液相分離”的物理化學(xué)機(jī)制和過程提供理論基礎(chǔ)和方法借鑒.
近些年,由多價(jià)相互作用驅(qū)使的“液-液相分離”(liquid-liquid phase separation,LLPS)而形成的無膜區(qū)室在很多生物過程中發(fā)揮著重要的作用[1?7].雖然“液-液相分離”的概念已被用于許多物理化學(xué)過程[8],但是在生物系統(tǒng)中“液-液相分離”仍是一個(gè)新興領(lǐng)域[9].細(xì)胞利用相分離來完成許多不同的功能,這些功能不一定是由脂質(zhì)分子組成的細(xì)胞膜完成[10],也可能由特定的生物大分子通過相互作用形成的無膜區(qū)室完成[11].這種相分離產(chǎn)生了高度濃縮的組裝體,通常稱其為生物分子凝聚體或無膜細(xì)胞器[12].它們發(fā)揮著如下許多重要的功能,如加速反應(yīng)速率、環(huán)境壓力應(yīng)激、基因轉(zhuǎn)錄調(diào)控、信號(hào)轉(zhuǎn)導(dǎo)、DNA修復(fù)、RNA剪接與轉(zhuǎn)運(yùn)等[13?15].
無膜細(xì)胞器中通常含有大量的內(nèi)稟無序蛋白質(zhì)或者固有無序區(qū)域 (intrinsically disordered proteins or regions,IDPs/IDRs)[4,12,16?25],因此目前對(duì)蛋白質(zhì)相分離的研究大多數(shù)主要集中在內(nèi)稟無序蛋白及其相分離的過程[26,27].通過簡單地突變/修飾內(nèi)稟無序蛋白質(zhì)或者無序多肽中的氨基酸序列,就可以完全打亂蛋白質(zhì)的熱響應(yīng)特性[28].然而,蛋白質(zhì)序列的復(fù)雜性和構(gòu)象的多樣性,給內(nèi)稟無序蛋白質(zhì)的計(jì)算和實(shí)驗(yàn)研究帶來了重大挑戰(zhàn).雖然內(nèi)稟無序蛋白質(zhì)有很多種類,但是仍可以將其歸類為低復(fù)雜度序列 (low complexity sequences,LCS)[29].這種序列僅由二十種天然氨基酸中的小部分構(gòu)成.對(duì)這樣的序列構(gòu)成的蛋白質(zhì)而言,其能量面形貌通常有很多個(gè)極小點(diǎn)并且各點(diǎn)的勢(shì)壘很低[30,31].此外,這一類分子內(nèi)部相互作用的簡并表現(xiàn)為分子間相互作用的多價(jià)性而導(dǎo)致自組裝.由于序列的低復(fù)雜度、單分子水平上狀態(tài)的簡并性以及聚集和/或相分離的傾向性,使得揭示這些序列對(duì)應(yīng)的分子的詳細(xì)結(jié)構(gòu)和機(jī)理的實(shí)驗(yàn)研究變得十分困難[32?35].理論研究和計(jì)算機(jī)模擬方法能夠提供理論預(yù)測(cè)和顯示分子細(xì)節(jié),這不但有助于解釋實(shí)驗(yàn)現(xiàn)象[13,36],同時(shí)可以用來補(bǔ)充和指導(dǎo)蛋白質(zhì)的實(shí)驗(yàn)研究而展現(xiàn)出其特有的優(yōu)勢(shì).
關(guān)于蛋白質(zhì)分子的“液-液相分離”的多尺度理論模型和多分辨率計(jì)算方法很多[32,37,38](圖1).由于蛋白質(zhì)分子序列和構(gòu)象的多樣性和復(fù)雜性,給蛋白質(zhì)分子的理論研究、計(jì)算機(jī)模擬和實(shí)驗(yàn)研究帶來了巨大的挑戰(zhàn)[39,40].本文將對(duì)蛋白質(zhì)分子“液-液相分離”的理論基礎(chǔ)和計(jì)算機(jī)模擬方法進(jìn)行簡要的綜述,目的是為進(jìn)一步研究蛋白質(zhì)等生物大分子的“液-液相分離”的物理化學(xué)機(jī)制和過程提供理論和方法借鑒.
2.1.1 Flory-Huggins理論
從熱力學(xué)角度看,相分離的發(fā)生降低了體系整體的自由能[11].體系的自由能包括焓與熵變化的貢獻(xiàn),其中焓變包含蛋白質(zhì)分子與溶劑之間、蛋白質(zhì)分子之間以及溶劑分子之間勢(shì)能的變化,而熵變衡量了體系自由度的變化.Flory[41]和Huggins[42]在20世紀(jì)40年代提出了高分子溶液的似晶格模型,用高分子的體積分?jǐn)?shù)?作為參數(shù),推導(dǎo)出了理想高分子溶液混合熵變的計(jì)算公式,以及用平均作用場假設(shè)[43],引入?yún)?shù)χ描述相互作用能的變化,得到了混合焓變的理論計(jì)算公式,混合自由能變F的計(jì)算公式即為
式中kB為玻爾茲曼常數(shù),T為溫度,N為高分子鏈的長度,z為晶格的配位數(shù),ups,upp和uss分別為高分子的一個(gè)鏈段與一單位溶劑之間、一對(duì)鏈段之間、一對(duì)溶劑之間的結(jié)合能.Flory和Huggins的理論以十分簡潔、粗略的形式解釋了包含蛋白質(zhì)分子在內(nèi)的高分子相分離過程的熱力學(xué)機(jī)制.Flory和Huggins的理論中體系由于混合熵變總為負(fù),當(dāng)c取較大的正值時(shí),混合自由能會(huì)取到正值,也就是體系趨向于兩相,而不是混合,這時(shí)混合自由能對(duì)濃度(體積分?jǐn)?shù))的函數(shù)存在兩個(gè)極小值點(diǎn),即為相分離的臨界濃度值[44].盡管這種方法粗略而十分簡潔,但是它給高分子聚合物以及細(xì)胞內(nèi)相分離等的研究提供了基本的理論框架.
圖1 研究蛋白質(zhì)“液-液相分離”的計(jì)算方法: 從左至右分別是解析模型、粗?;P?包括多個(gè)殘基單個(gè)粒子、單個(gè)殘基單個(gè)粒子、單個(gè)殘基多個(gè)粒子的模型)和全原子模型,分辨率的提升對(duì)計(jì)算資源的耗費(fèi)程度急劇增高,而模型假設(shè)數(shù)的減少會(huì)減弱研究涌現(xiàn)行為的能力[35]Fig.1.Computational approaches utilized to study protein liquid-liquid phase separation (LLPS).From left to right are the analytical model,the coarse-grained model (multiple-residues per bead,single-bead per residue and multiple-beads per residue coarsegrained models),and all-atom model.High-resolution descriptions increase the computational cost of the simulations.All-atom model is often impractical for the study of emergent behavior of LLPS[35].
2.1.2 其他統(tǒng)計(jì)熱力學(xué)理論
在Flory和Huggins的焓變公式推導(dǎo)過程中只考慮了近程的相互作用,Overbeek和Voorn 在他們的工作基礎(chǔ)上考慮了長程靜電相互作用,應(yīng)用于帶Z個(gè)正電和Z個(gè)負(fù)電而整體不帶電的聚電解質(zhì)高分子溶液.他們假設(shè)這些電荷隨機(jī)的分布于溶液中,與鹽溶液類似可以用Debye-Hückel理論假設(shè)計(jì)算體系中的電荷間相互作用的能量.雖然他們的平均場理論模型在高分子聚合物及其相分離領(lǐng)域提供了十分簡潔的形式,但是該種模型對(duì)內(nèi)稟無序蛋白內(nèi)部電荷排列及關(guān)聯(lián)性沒有成功的解決.隨后,隨機(jī)相近似 (random phase approximation,RPA)方法被應(yīng)用于的聚電解質(zhì)高分子溶液靜電作用的計(jì)算[45],該方法可用于任意電荷分布樣式的聚電解質(zhì)高分子溶液體系.雖然RPA理論模型可以給任何形式電荷排列的無序多肽的相分離研究提供了基本的理論框架,但是在漲落很大的情況下,RPA模型在IDPs構(gòu)象特性和相分離行為的預(yù)測(cè)可能會(huì)失敗.Lin等[21,45]將該方法應(yīng)用于蛋白質(zhì)分子相分離體系的計(jì)算,解釋了同種電荷在序列上集中分布對(duì)于相分離的驅(qū)動(dòng)作用,以及離子強(qiáng)度對(duì)于靜電作用為主的相分離體系的影響.場理論模擬 (field theory simulation,FTS)方法是一種更細(xì)致處理聚電解質(zhì)高分子溶液體系的方法[46,47],通過對(duì)場理論中的共軛變量進(jìn)行模擬采樣,來獲得體系的相圖.McCarty等[1]用離散的鏈模型研究了不同谷氨酸(E)和賴氨酸(K)二組分構(gòu)成的多肽鏈,用場理論模擬方法獲得了它們的鹽濃度-蛋白濃度相圖,并得到跟RPA理論相近的結(jié)果.
蛋白質(zhì)分子“液-液相分離”的研究中用到最多的是粗?;M方法,全原子模型的計(jì)算機(jī)模擬方法偶爾也會(huì)用到.這里的粗粒化模擬方法是指將多個(gè)原子簡化為單個(gè)粒子來降低分辨率提高計(jì)算效率的計(jì)算機(jī)模擬方法[35].該方法是通過顯著地減少粒子的數(shù)量的模型,并為理論研究和全原子模擬之間的溝通提供了一個(gè)橋梁.下面將重點(diǎn)綜述近幾年發(fā)展起來的粗?;P?
2.2.1 非格點(diǎn)模型的粗?;M方法
1) 多個(gè)殘基簡化為單個(gè)球的粗?;P?/p>
根據(jù)蛋白質(zhì)中氨基酸序列的特征,可將一條多肽簡化為一個(gè)粗?;牧W踊?qū)⒁粋€(gè)重復(fù)的短肽片段處理成一個(gè)粗?;牧W?對(duì)于低復(fù)雜度序列組成的無序蛋白質(zhì),其序列的性質(zhì)有利于粗粒化建模,對(duì)同聚蛋白質(zhì)尤為方便[13,48,49].該種類型的蛋白質(zhì)指的是由單種氨基酸組成的短肽或是短肽重復(fù)片段組成的蛋白質(zhì).為了研究重復(fù)序列長度和序列關(guān)聯(lián)性對(duì)相分離的影響,可以將重復(fù)序列構(gòu)成的一條多肽簡化為一個(gè)粒子或?qū)⒍鄠€(gè)重復(fù)的片段簡化為一個(gè)粒子.例如,將huntingtin蛋白可視為二嵌段聚合物而得到了廣泛的粗?;芯縖50].huntingtin蛋白的外顯子包含一個(gè)多聚谷氨酰胺束,可以看作是一個(gè)僅由多聚谷氨酰胺和脯氨酸構(gòu)成的二嵌段共聚物[50].Burke等[48]利用多個(gè)氨基酸殘基簡化為一個(gè)粒子的粗?;P吞剿髁硕嗑酃劝滨0肥L度和構(gòu)象傾向性對(duì)其自組裝過程的影響.研究表明,其自組裝的驅(qū)動(dòng)力主要取決于多聚谷氨酰胺束的長度、蛋白質(zhì)濃度和兩個(gè)區(qū)塊的相對(duì)疏水性,而不是多聚谷氨酰胺束的構(gòu)象偏好[48].Condon等[51]研 究 了 (elastin-like polypeptide,ELP)彈性蛋白,通過用一個(gè)粒子表示1~2個(gè)重復(fù)單元,這些模擬能夠達(dá)到與實(shí)驗(yàn)研究相當(dāng)?shù)拈L度和時(shí)間尺度,并可重現(xiàn)與實(shí)驗(yàn)測(cè)量的涌現(xiàn)行為一致的特征.
2) 單個(gè)殘基簡化為單個(gè)球的粗?;P?/p>
根據(jù)蛋白質(zhì)中氨基酸序列的特征,可以將單個(gè)氨基酸簡化為包含疏水性和電荷性質(zhì)特征的球,也就是通常所說的殘基化水平的粗粒化模型.殘基化水平的粗?;P涂梢杂脕砝斫怛?qū)動(dòng)分子間相互作用和相分離行為序列的重要特征[36,52,53].單個(gè)氨基酸被簡化為單個(gè)粒子,通常用疏水性指數(shù)來參數(shù)化成對(duì)氨基酸之間的相互作用,并且重復(fù)出了實(shí)驗(yàn)上觀察到的構(gòu)象.例如,Dignon 等[17,52]基于Kapcha和Rossky[54]氨基酸的疏水性指數(shù)和Ashbaugh-Hatch[55]勢(shì)函數(shù)的形式 開發(fā)出一種將單個(gè)殘基簡化為單個(gè)球的粗?;P蛠硌芯康鞍踪|(zhì)的相分離的計(jì)算方法.在這種相互作用勢(shì)函數(shù)形式中,通過比較粗粒化模擬與實(shí)驗(yàn)測(cè)定得到的回轉(zhuǎn)半徑,確定了成對(duì)氨基酸之間短程相互作用的最佳數(shù)值.Ghavami等[56]利用類似的方法研究了酵母核孔 (nuclear pore complex,NPC)中苯丙氨酸-甘氨酸序列組成多肽的自組裝結(jié)構(gòu).通過實(shí)驗(yàn)測(cè)定的斯托克斯半徑和疏水性指數(shù)來確定粗?;M參數(shù),粗?;M表明,在NPC的中心區(qū)域重復(fù)序列形成圓餅狀的結(jié)構(gòu).序列突變研究發(fā)現(xiàn),這種組織結(jié)構(gòu)依賴于帶電殘基的組分和排列.Borgia等[57]使用同樣的方法研究了相同數(shù)目的谷氨酸和天冬氨酸以及賴氨酸和精氨酸的短肽.模擬結(jié)果與核磁共振光譜數(shù)據(jù)吻合得很好,表明相互作用純粹是靜電驅(qū)動(dòng)的,不同類型帶電氨基酸之間的結(jié)構(gòu)差異對(duì)于這個(gè)系統(tǒng)來說并不顯著[58].
單個(gè)殘基水平的粗粒化模型不僅可以提供相分離過程中蛋白質(zhì)分子間何種相互作用驅(qū)動(dòng)相分離和序列特征,而且彌補(bǔ)了理論模型的局限性.例如,基于RPA理論[45]和粗?;M研究表明,(EK)50序列中不同電荷排列模式導(dǎo)致相分離結(jié)果定性相似,但定量不同的現(xiàn)象.同樣地,通過使用一個(gè)氨基酸一個(gè)粒子的顯式粗粒化模型,Song等[59]的研究表明,(EK)50序列的回轉(zhuǎn)半徑和鏈末端距離由于構(gòu)象異質(zhì)性而不相關(guān),這是均聚物模型通常缺少的特征.綜合起來,單個(gè)殘基水平的粗?;P吞峁┝艘粋€(gè)可以與解析理論進(jìn)行比較的途徑,有助于識(shí)別系統(tǒng)的局限性,同時(shí)也為模擬低復(fù)雜度序列提供了一個(gè)簡單而強(qiáng)大的模擬框架.
3) 單個(gè)殘基簡化為多個(gè)球的粗?;P?/p>
單個(gè)殘基簡化為多個(gè)球的粗?;P褪歉?xì)的粗?;P?這里每個(gè)殘基可視為由多個(gè)粒子組成的.該模型有兩種類型: 可移植的模型和系統(tǒng)特定模型(在所有被研究的系統(tǒng)中永久化是固定的)[60].常見的可移植多個(gè)粒子組成單個(gè)殘基的粗?;P陀?PRIME[61?65],PLUM[66?68],AWSEM[69]和 MARTINI[70?73]模型.這些模型被用于模擬同源蛋白的原纖化形成和重復(fù)序列短肽的聚集過程[62?64],且可用來研究NPC蛋白的門控和運(yùn)輸機(jī)制和類蠶絲彈性蛋白熱應(yīng)答行為的分子機(jī)制[71].其中PLUM模型被用來研究類蠶絲彈性蛋白單體的轉(zhuǎn)變溫度,與實(shí)驗(yàn)研究結(jié)果是一致的[66].
盡管上述的多粒子的粗?;P途哂忻黠@的普遍性,可移植模型并不總是適合于研究低復(fù)雜度的蛋白質(zhì)序列.一個(gè)給定模型的相關(guān)性通常取決于模型最初參數(shù)化.例如,原始的PLUM模型可能導(dǎo)致一些IDPs的二級(jí)結(jié)構(gòu)過度穩(wěn)定,而MARTINI模型,可能不會(huì)重現(xiàn)出蛋白質(zhì)的結(jié)構(gòu)特征并且禁止了結(jié)構(gòu)轉(zhuǎn)變[70].由于可移植模型的局限性,系統(tǒng)特定的粗粒化模型僅僅被頻繁地用于研究低復(fù)雜度序列.這些模型經(jīng)常使用從全原子模擬收集的信息來參數(shù)化特定的研究對(duì)象.從全原子模擬到粗?;P偷慕⒂袃煞N主要方法: 基于結(jié)構(gòu)的方法和力匹配方法[74].在基于結(jié)構(gòu)的方法中,目標(biāo)是從全原子模擬中再現(xiàn)特定的構(gòu)象分布.而在力匹配方法從全原子模擬映射到粗?;P椭懈唵蔚慕?jīng)驗(yàn)力場(已經(jīng)被用來研究與疾病相關(guān)的同源蛋白的聚集).由 Hills 和 Voth[75]開創(chuàng)的力匹配方法,該方法被用來研究了酵母菌核孔復(fù)合體中的由苯丙氨酸和甘氨酸組成的低復(fù)雜度序列(phenylalanineglycine LCS within the yeast nuclear pore complex,FG-nups)的構(gòu)象特性.這種方法捕捉到了幾個(gè)較長的FG-nups的兩相無序態(tài),并且表明序列組分以及序列特異性對(duì)纖維蛋白核糖核酸酶的構(gòu)象偏差有強(qiáng)烈的影響[76].
4) 長條形盒子動(dòng)力學(xué)模擬(slab simulation)的粗?;椒?/p>
該模擬方法將所有分子放在長條形的周期性盒子 (三個(gè)方向邊長:x=y?z)中,在 NPT 系綜的隱式溶劑分子動(dòng)力學(xué)模擬中,做只沿z軸方向平衡的各向異性壓力耦合 (pressure coupling).這樣分子模擬中相分離完成后蛋白分子聚集于凝聚相,在z軸的很窄的區(qū)域分布.Mittal實(shí)驗(yàn)室[4,5,17,52]開發(fā)了用于這一模擬的蛋白質(zhì)粗?;椒?蛋白質(zhì)鏈的每個(gè)殘基看作單個(gè)粒子,相鄰粒子間用彈簧相連.不相鄰粒子間包含兩種作用勢(shì)函數(shù): Debye-Hückel靜電屏蔽的靜電作用和短程的成對(duì)勢(shì).短程的成對(duì)勢(shì)從Lenard-Jones(LJ)勢(shì)改造而來,Mittal實(shí) 驗(yàn) 室 發(fā) 展 了 (hydrophobicity scale,HPS)[55]和 Kim-Hummer(KH)[77]兩種模型.其中HPS模型是基于殘基對(duì)疏水性調(diào)整LJ勢(shì)的模型,KH模型是用于研究蛋白-蛋白相互作用的修正LJ勢(shì)的勢(shì)阱深度參數(shù)的模型.這兩個(gè)模型的未定參數(shù)都通過擬合天然無序蛋白質(zhì)的回轉(zhuǎn)半徑(來自小角X射線散射實(shí)驗(yàn))得到.隨后他們用這個(gè)粗?;瘎?dòng)力學(xué)模擬方法計(jì)算了 (fused in sarcoma,FUS) FUS中的DNA結(jié)合蛋白和LAF中的解螺旋蛋白LAF-1片段這兩個(gè)相分離體系的溫度-濃度相圖,其計(jì)算表明FUS的模擬磷酸化突變使最高臨界共溶溫度降低(即不利于相分離),將FUS序列拷貝延長將增加最高臨界共溶溫度,LAF全長的最高臨界共溶溫度比只有IDRs時(shí)的值高.這些結(jié)果都與實(shí)驗(yàn)結(jié)果相吻合.該研究組還用這個(gè)模型計(jì)算了臨界溫度值,以及天然無序蛋白質(zhì)單分子的性質(zhì),即天然無序線團(tuán)到蜷縮球轉(zhuǎn)變溫度(Tq)高度相關(guān),因此他們認(rèn)為天然無序蛋白自身的性質(zhì)可以用于預(yù)估其相分離發(fā)生的條件[17].他們也與Fawzi研究組合作,用此模擬方法研究了hnRNPA2低復(fù)雜度結(jié)構(gòu)域的單點(diǎn)突變對(duì)其相分離條件的影響.他們發(fā)現(xiàn)天冬氨酸(D)到纈氨酸(V)的突變體(D290 V)比野生型具有更低的臨界共溶溫度,相同溫度下,此突變體的臨界濃度比野生型高[78].
粗?;P蛯?duì)多肽早期聚集事件和聚集形態(tài)可以提供有價(jià)值的信息.這些模型可以明確地捕獲序列特異性,這是解析模型中通常缺乏的特征.然而粗?;P陀衅渥陨淼木窒扌?粗?;P偷膮⒘炕谌幽M的模型,因此高度依賴于全原子模擬的準(zhǔn)確性,并且多體相互作用項(xiàng)可以通過對(duì)較小數(shù)量分子的模擬得到.此外,粗?;P偷南嚓P(guān)性依賴于這樣的假設(shè): 模型能夠恰當(dāng)?shù)夭东@到感興趣的區(qū)域的特性.對(duì)于能夠在高階自組裝過程中經(jīng)歷涌現(xiàn)構(gòu)象轉(zhuǎn)變的低復(fù)雜度序列,粗粒化模型在其捕獲自聯(lián)結(jié)的熱力學(xué)和動(dòng)力學(xué)的能力方面可能會(huì)從根本上受到限制.綜上所述,雖然粗?;P吞峁┝艘粭l重要的途徑來評(píng)估個(gè)別分子的序列依賴性偏差,但在可以得出的結(jié)論的確定性方面,應(yīng)始終考慮到它們的局限性.
2.2.2 格點(diǎn)模型的粗?;M
格點(diǎn)模型也可以被用來研究生物大分子的“ 液-液 相 分 離 ” 過 程.例 如,Pappu 課 題 組 和Chan課題組分別開發(fā)了不同的格點(diǎn)模型用來研究無序多肽或者生物大分子的“液-液相分離”.其中美國華盛頓大學(xué)的Pappu實(shí)驗(yàn)組專注于該方法的研究,他們開發(fā)了 LASSI (Lattice simulation of Sticker and Spacer Interactions,LASSI)具體實(shí)現(xiàn)了格點(diǎn)模型的聚集模擬[79].在格點(diǎn)模型模擬過程中,一般將生物大分子的結(jié)構(gòu)域或者功能模塊整體作為單個(gè)粗?;牧W?粒子只能處于離散立方網(wǎng)格的格點(diǎn)中,不同粒子所在格點(diǎn)不能重合,一般假設(shè)只有相鄰格點(diǎn)粒子有相互作用并且粒子對(duì)的相互作用能參數(shù)化為一個(gè)確定值,體系用蒙特卡洛方法演化采樣.Pappu實(shí)驗(yàn)室用此模擬方法研究了核仁FIB1-NPM1-RNA三元體系中結(jié)構(gòu)域相互作用模式影響形成分層液滴的機(jī)制,其中用一個(gè)分枝的結(jié)構(gòu)模擬NPM1分子五聚體的結(jié)構(gòu)[13].他們也用此模擬方法做了(SH3)m+ (PRM)n體系中無序連接鏈對(duì)相分離的影響的研究[18].模擬結(jié)果顯示連接鏈的有效溶劑體積影響該體系聚集態(tài)的性質(zhì),連接鏈有效溶劑體積大、主要為較剛性的伸展構(gòu)象時(shí)體系傾向于聚集成凝膠,相反的,連接鏈以壓縮狀態(tài)為主時(shí)體系傾向于聚集成液滴.
Das等[53]應(yīng)用格點(diǎn)模型上的粗?;M方法研究了(EK)25序列的不同電荷排布情況下的多肽序列的相分離特點(diǎn).在他們的研究中,重點(diǎn)考察了正負(fù)電荷混合均勻和完全分離的兩種典型的序列.他們認(rèn)為每一條多肽鏈以自回避的形式占據(jù)三維空間點(diǎn).將每一個(gè)氨基酸殘基簡化為單個(gè)粒子并只占有一個(gè)格點(diǎn),兩個(gè)相鄰的粒子之間通過共價(jià)鍵來鏈接,此外所有的粒子靜電作用為屏蔽的庫倫靜電相互作用.通過大量的蒙特卡洛模擬研究發(fā)現(xiàn),可以發(fā)現(xiàn)兩種不同的序列相分離的臨界溫度有明顯的差異,對(duì)于正負(fù)電荷分離形成大的電荷模塊的序列來說,這一類序列顯示出明顯的相分離特性.他們?cè)诟顸c(diǎn)模型上的大規(guī)模蒙特卡洛模擬研究與RPA理論研究的結(jié)果是一致的.
2.2.3 全原子模型
雖然粗?;M已被用于研究低復(fù)雜度序列的聚集和組裝,全原子模擬對(duì)于在單個(gè)多肽水平上提取詳細(xì)的構(gòu)象特征具有更高的價(jià)值.鑒于其普遍的序列重復(fù)性和高聚集傾向性,這些蛋白質(zhì)的研究往往給實(shí)驗(yàn)帶來了巨大的挑戰(zhàn)性.全原子模擬提供了一個(gè)方便的解決方案,提供了無限稀釋下的“無限分辨率”[80?87].對(duì)于易于聚集的同源蛋白質(zhì)(例如,聚谷氨酰胺、聚甘氨酸、聚丙烯酸)的全原子模擬已經(jīng)對(duì)單體的構(gòu)象偏差有了相當(dāng)深入的了解.單分子熒光共振實(shí)驗(yàn)補(bǔ)充了全原子模擬的研究.例如,Warner等他們能夠提取 huntingtin外顯子1單體的構(gòu)象系綜.全原子模擬也可以與其它實(shí)驗(yàn)相結(jié)合技術(shù),如核磁共振波譜法和小角度X射線散射產(chǎn)生互補(bǔ)信息.例如TDP-43的LCS結(jié)構(gòu)域、hnRNPA2的LCS結(jié)構(gòu)域和RNA聚合酶Ⅱ的碳末端等系統(tǒng)得到了全原子模擬和上述實(shí)驗(yàn)技術(shù)的研究.
盡管全原子模擬提供了高分辨率的解析精度,但它們并非沒有局限性.考慮到它們的計(jì)算成本,研究大量分子的分子間結(jié)合和聚集仍然令人望而卻步,得出的結(jié)論的準(zhǔn)確性依賴于力場的可靠性.在低復(fù)雜度序列的研究中力場的局限性往往被放大.特別是在全原子分子動(dòng)力學(xué)的框架下,構(gòu)型狀態(tài)的高度簡并性使得構(gòu)型抽樣成為一個(gè)主要的挑戰(zhàn).因此,盡管全原子模擬已經(jīng)為理解LCS序列提供了較高的精度,但是依然要像粗?;椒ㄒ粯右?jǐn)慎地考慮全原子模擬方法的局限性.
2.2.4 各種模型的優(yōu)缺點(diǎn)概述
上述不同的理論方法和計(jì)算模型有著各自的優(yōu)勢(shì)和用處,也有著不足和缺陷,在使用的時(shí)候不能全盤否定.例如,平均場理論十分簡潔地給出了高分子聚合物及其相分離的理論表達(dá)式,但是在針對(duì)具體體系和涉及電荷關(guān)聯(lián)性較強(qiáng)的情況下,理論預(yù)測(cè)可能顯得不是太準(zhǔn)確.RPA理論模型的優(yōu)點(diǎn)在于能夠給出電荷相互作用如何調(diào)控IDPs相分離過程的清晰的物理圖像,缺點(diǎn)在于針對(duì)具體體系常常預(yù)測(cè)能力顯得不是十分充足.格點(diǎn)模型的優(yōu)勢(shì)就是抓住了整個(gè)問題中的最核心要素,簡化了構(gòu)象空間,使得計(jì)算簡單并且快速.而非格點(diǎn)模型描述構(gòu)象相對(duì)比較準(zhǔn)確,各種相互作用也可以考慮得更精細(xì),粗?;P偷膮⒘炕腔谌幽M的模型,因此高度依賴于全原子模擬的準(zhǔn)確性.全原子模型的優(yōu)點(diǎn)在于計(jì)算精確,能夠給出具體的相互作用細(xì)節(jié),能夠更為精細(xì)地描述結(jié)構(gòu)及其特征,但是由于原子數(shù)目的顯著增加,導(dǎo)致計(jì)算太耗費(fèi)時(shí)間,目前只能研究小體系或者相分離的早期聚集等行為特征.總之,在實(shí)際的研究過程中,要根據(jù)所研究對(duì)象的需求和具體的特征,來選擇合適的方法恰當(dāng)?shù)拿枋鱿到y(tǒng)的相互作用及其集體運(yùn)動(dòng)行為.
當(dāng)前,蛋白質(zhì)分子的構(gòu)象特點(diǎn)、相分離過程及其序列特征等引起了眾多科學(xué)家的廣泛興趣.而多尺度和多分辨率的理論和模型在生物分子的相分離的研究中得到了迅速的發(fā)展和改進(jìn).本文綜述了關(guān)于蛋白質(zhì)分子“液-液相分離”的多種先進(jìn)的理論和計(jì)算機(jī)模擬方法.
生物大分子相分離過程的研究當(dāng)前處于起步和發(fā)展階段.研究者可以將上述的各種方法巧妙地應(yīng)用于生物系統(tǒng)的相分離中來.也可以發(fā)展新的理論方法以及模擬手段研究生物體系的相分離.最終為深入地理解蛋白質(zhì)等生物大分子的序列、結(jié)構(gòu)以及相分離產(chǎn)生的臨界條件之間的基本關(guān)系提供恰當(dāng)而快速的理論方法和模擬手段.此外,也可以對(duì)上述的研究方法進(jìn)行混合來解決生物大分子的相分離問題.相信在未來,生物大分子涉及的相分離將會(huì)吸引越來越多的科學(xué)研究人員的關(guān)注,并且應(yīng)用上述的研究手段或者發(fā)展新的方法來解決相分離相關(guān)的問題.