• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      隱馬爾可夫模型在生物信息學(xué)中的應(yīng)用

      2015-12-18 13:17:58
      電子科技 2015年8期
      關(guān)鍵詞:馬爾可夫信息學(xué)位點

      黃 影

      (西安文理學(xué)院數(shù)學(xué)與計算機工程學(xué)院,陜西西安 710068)

      馬爾可夫過程(Markov Process)是一種隨機過程,其中每個時刻的狀態(tài)形成了一個有限集合,且在已知目前狀態(tài)(現(xiàn)在)的條件下,其未來的演變(將來)不依賴于自身以往的演變(過去)。馬爾可夫鏈(Markov Chain)是一階的馬爾可夫過程,其中下一狀態(tài)的概率分布只能由當(dāng)前狀態(tài)決定,在時間序列中其前面的事件均與之無關(guān)。在事件發(fā)展變化的過程中,從某種狀態(tài)出發(fā),下一時刻轉(zhuǎn)移到其他狀態(tài)的可能性,稱為狀態(tài)轉(zhuǎn)移概率。在馬爾可夫鏈中,所有狀態(tài)都是直接可見的觀察者,因此狀態(tài)轉(zhuǎn)移概率是唯一的參數(shù)。

      隱馬爾可夫模型(Hidden Markov Models,HMMs)是含有隱含未知參數(shù)的馬爾可夫鏈[1-2]。HMMs由有限個狀態(tài)組成,每一個狀態(tài)都以一定的概率出現(xiàn),狀態(tài)之間的轉(zhuǎn)換由轉(zhuǎn)換概率表決定,每一個狀態(tài)均可產(chǎn)生一個觀察到的狀態(tài),在隱馬爾科夫模型中,只有觀察到的狀態(tài)可見,真實的馬爾科夫狀態(tài)鏈不可見,因此被稱為隱馬爾科夫模型。

      HMMs早期在自然語言處理領(lǐng)域獲得了良好的應(yīng)用[3],比如開始時用于語音識別[4],后來又用于音樂旋律分類[5]。隨著HMMs的發(fā)展,現(xiàn)今在計算生物學(xué)和生物信息學(xué)中,也成為了經(jīng)常被使用的模式識別(或機器學(xué)習(xí))方法[6-7]。很多情況下,生物序列分析就是為每個殘基(或核苷酸)賦予合適的標(biāo)簽,從而發(fā)現(xiàn)生物序列所具有的生物意義[8]。

      1HMMs概念

      1.1 一個例子

      如圖1所示,5-分位點識別問題是從基因發(fā)現(xiàn)問題中提煉出來的一個簡單舉例[1],用以引出對HMMs的介紹。假設(shè)給定一個DNA序列,其的起始部分是若干個外顯子(Exon),然后是一個5-分位點,最后的部分是若干個內(nèi)含子(Intron)。5-分位點相當(dāng)于外顯子與內(nèi)含子的分界限,或者是從外顯子轉(zhuǎn)化為內(nèi)含子的開關(guān)。這樣,當(dāng)前的問題就是識別出5-分位點的位置。

      圖1 5-分位點識別問題

      以上邊的信息為基礎(chǔ),可設(shè)計一個馬爾可夫模型,如圖1的上半部分所示。這個馬爾可夫模型包含3個狀態(tài),分別對應(yīng)賦予給堿基的3個標(biāo)簽:狀態(tài)E(Exon),狀態(tài)5(5-分位點)和狀態(tài)I(Intron)。每個狀態(tài)都有轉(zhuǎn)移概率,相應(yīng)的轉(zhuǎn)移概率從當(dāng)前狀態(tài)移動到下一狀態(tài)。轉(zhuǎn)移概率的大小表示轉(zhuǎn)移到下一狀態(tài)的可能性的大小,因序列的前半部分都是E狀態(tài),中間是5狀態(tài),后半部分都是I狀態(tài),所以狀態(tài)E和狀態(tài)I到達自身的轉(zhuǎn)移概率要大一些(0.9)。

      然而,只依靠馬爾可夫模型還不能推測出序列各個堿基對應(yīng)的標(biāo)簽。想要較好地推測出5-分位點的位置,則不同的DNA序列一定具有不同的統(tǒng)計屬性。這里做一些簡單的假設(shè):外顯子對應(yīng)的堿基呈均勻分布(即A,G,C,T出現(xiàn)的概率均為25%),內(nèi)含子對應(yīng)的堿基中有較多的A和T(A和T各占40%,C和G各占10%),令5-分位點對應(yīng)一個固定的堿基G。

      接下來引出HMMs。用上述馬爾可夫模型產(chǎn)生一個狀態(tài)序列。每生成一個狀態(tài),用其發(fā)射一個堿基。每種狀態(tài)發(fā)射堿基的概率分布已在上邊做了假設(shè),稱之為發(fā)射概率。然后,用馬爾可夫模型的狀態(tài)轉(zhuǎn)移概率產(chǎn)生下一個狀態(tài)。由此生成了兩個序列信息,一個是狀態(tài)路徑,一個是觀測序列(DNA序列)。在求解的問題中,觀測序列是已知的,狀態(tài)路徑(標(biāo)簽序列)是未知的(隱藏起來的)。這樣,在馬爾可夫模型的基礎(chǔ)上,包含發(fā)射概率分布的模型就是一個HMMs。

      這樣,要設(shè)計一個HMMs,就是要確定4方面的信息:(1)符號表(例如,在DNA序列中符號表中有4個元素AGCT。(2)狀態(tài)集合,M。(3)每個狀態(tài)i的發(fā)射概率ei(x),滿足概率率∑xei(x)=1。(4)每個狀態(tài)i到達狀態(tài)j的轉(zhuǎn)移概率ti(j),滿足概率率∑jti(j)=1。任何具有這些屬性的模型就是HMMs。

      1.2 HMMs的3個計算問題

      (1)解碼問題。在序列分析問題中,給定的DNA序列是觀測序列,我們要求解隱藏的狀態(tài)路徑。諸多潛在的狀態(tài)路徑都能產(chǎn)生出相同的觀測序列,這樣就需要找出具有最高概率的狀態(tài)路徑,這就是HMMs的解碼問題。概率P(S,π HMM,θ)表示了具有參數(shù)θ的HMM的狀態(tài)路徑S能產(chǎn)生出觀測序列π的概率,在求解時要用到θ中所有的轉(zhuǎn)移概率和發(fā)射概率。例如,在圖1中,觀測序列有26個堿基,圖的中間部分是6個潛在的狀態(tài)路徑,每個狀態(tài)路徑對應(yīng)27個轉(zhuǎn)移概率和26個發(fā)射概率。把這53個概率乘在一起,就得到了P(S,π HMM,θ)的值。為了便于比較,對每個計算結(jié)果進行取對數(shù)操作,可發(fā)現(xiàn)結(jié)果為-41.22的狀態(tài)路徑是最高概率的狀態(tài)路徑,也即5-分位點最有可能出現(xiàn)在第5個G的位置。

      然而,對于大多數(shù)問題,存在諸多潛在的狀態(tài)路徑,文中無法將其一一進行枚舉?;趧討B(tài)規(guī)劃思想的Viterbi算法[2]可高效地找出概率最高的狀態(tài)路徑。

      此外,解碼問題還有另外的一個形式—后驗解碼問題,即找到某個位置處具有最高出現(xiàn)概率的狀態(tài),最常用的算法是后驗解碼算法[2],原理是利用前向(Forward)和后向(Backward)兩個動態(tài)規(guī)劃算法對所有可能的路徑進行累加。例如,在圖1中,6個潛在的狀態(tài)路徑對應(yīng)的P(S,π HMM,θ)值相差較小,若要確定其中哪個最有可能是真實的狀態(tài)路徑??煞謩e計算6個位置處被標(biāo)識為狀態(tài)5的概率,這就是后驗解碼問題。圖1的下側(cè)分別給出了這6個位置被標(biāo)識為狀態(tài)5的概率,其中概率值最大的為46%(對應(yīng)于P(S,π HMM,θ)值等于-41.22的狀態(tài)路徑),其明顯高于其他位置的概率,因此可以肯定P(S,π HMM,θ)值等于-41.22的狀態(tài)路徑是最接近于真實情況的狀態(tài)路徑。

      (2)估值問題。估值問題是計算某個HMMs能生成給定觀測序列的可能性。比如圖1中的HMMs,用其的轉(zhuǎn)移概率和發(fā)射概率分布,來求解生成給定的DNA序列的概率就是估值問題。從另一個角度來看,給定一個HMMs模型與一個觀測序列,估值問題就是衡量這個HMMs對觀測序列適用性的好壞。

      估值問題常用的算法是前向(Forward)算法[2]和后向(Backward)算法[2],其均是精確的算法,一個是從序列的前邊開始計算,一個是從序列的后邊開始計算。在估值問題中,選取一個算法即可,因為前向和后向算法得到的結(jié)果相同。但在后驗解碼問題中需要同時使用這兩個算法,即要計算位置的左邊使用前向算法,右邊使用后向算法。

      (3)學(xué)習(xí)問題。在圖1的例子中,所采用的是假設(shè)的參數(shù),用估值問題可衡量這些參數(shù)對給定序列的適用性,若果適用性較差,需對假設(shè)的參數(shù)進行更新,使新的HMMs對給定序列的適用性變強,這個參數(shù)更新的過程就是HMMs的學(xué)習(xí)問題。

      解決學(xué)習(xí)問題,常用的算法是BW算法[2],也稱為前向-后向算法,是一個廣義期望最大化問題。BW算法是EM算法的一個特例,即每次迭代包括一個E步與一個M步。假設(shè)有N條觀測序列,每條序列的長度為L,且HMM模型有K個狀態(tài),則可分析出每次迭代的時間復(fù)雜度是O(3NK2L)。

      2 HMMs在生物信息學(xué)中的應(yīng)用

      2.1 序列比對

      序列比對(Alignment)是為了確定兩個或多個序列之間的相似性,而將其按照一定的規(guī)律進行排列。為了能將多個序列排列在一起,序列中可插入間隔,一個或多個連續(xù)的‘-’稱為gap。對兩個序列進行比對,稱為雙序列比對,對多個序列進行比對稱為多序列比對。本節(jié)重點討論雙序列比對,且無特別說明,后文中的序列比對均指雙序列比對。

      在序列比對問題中引入HMMs的方法如下。首先,序列比對最經(jīng)典的精確算法是基于動態(tài)規(guī)劃的算法。這個動態(tài)規(guī)劃算法可轉(zhuǎn)化為一個有限自動機。在動態(tài)規(guī)劃算法的每步?jīng)Q策中,實際上是從3種選擇中計算出當(dāng)前的最優(yōu)解。則整個動態(tài)規(guī)劃算法的多步?jīng)Q策過程,就相當(dāng)于狀態(tài)間的不斷轉(zhuǎn)移,從而形成了一個擁有3個狀態(tài)的有限自動機的狀態(tài)轉(zhuǎn)移鏈。動態(tài)規(guī)劃算法求解的是狀態(tài)轉(zhuǎn)移的路徑,由此,可將其轉(zhuǎn)化為HMMs的解碼問題。有了狀態(tài)轉(zhuǎn)移路徑,通過適當(dāng)?shù)奶砑右恍╅g隔,便可完成兩個序列的比對。

      這樣,HMMs的狀態(tài)集中有3個元素,字符表中有A,G,C,T這4個元素,并初始化一組參數(shù),即狀態(tài)轉(zhuǎn)移概率和發(fā)射概率。區(qū)別于基因發(fā)現(xiàn)問題,現(xiàn)在狀態(tài)序列發(fā)射的不是一條DNA序列,而是兩條DNA序列,求解序列比對的HMMs如圖2所示。

      圖2 序列比對的HMMs模型

      圖2中定義了HMMs的3個狀態(tài)M,X,Y和狀態(tài)轉(zhuǎn)移概率。M表示比較操作,用于發(fā)射兩個字符,第一條序列 x 中的 x[i],第二條序列y 中的y[j],且發(fā)射概率為 p(x[i]y[j]);X 表示插入操作,用于發(fā)射一個字符,即第一條序列x中的x[i],第二條序列中添加一個間隔‘-’,且發(fā)射概率為q(x[i]);Y表示刪除操作,用于發(fā)射一個字符,即第二條序列x中的x[i],第一條序列中添加一個間隔‘-’,且發(fā)射概率為q(y[j])。此外,在實際比對結(jié)果中,不應(yīng)出現(xiàn)如下情況:第一條序列的位點i處是‘-’,緊接著在第二條序列的位點i+1處也是‘-’。因此,模型中不允許狀態(tài)X與狀態(tài)Y之間進行相互轉(zhuǎn)化。

      有了HMM模型后,進行兩條序列的比對就是HMM的解碼問題,即用Viterbit算法求解出最有可能發(fā)射出兩條輸入序列的狀態(tài)序列。求解出狀態(tài)序列后,根據(jù)3種狀態(tài)的發(fā)射功能,得出經(jīng)過序列比對之后的兩條序列。假設(shè)允許模型中的3個狀態(tài)間能相互轉(zhuǎn)化,則可對文獻[7]中的模型進行修改。圖3給出了經(jīng)修改后的模型,設(shè)計思路是要盡量消除序列比對中可能出現(xiàn)的如下情況:第一條序列的位點i處是‘-’,緊接著在第二條序列的位點i+1處也是‘-’。

      圖3 修改后的序列比對HMMs模型

      圖3中參數(shù)設(shè)定如下:從其余狀態(tài)到只發(fā)射一個字符的狀態(tài)的轉(zhuǎn)移概率記為a,即被標(biāo)記成綠色的箭頭;只發(fā)射一個字符的狀態(tài)到其自身的轉(zhuǎn)移概率記為c,即被標(biāo)記成藍色的箭頭;所有狀態(tài)到結(jié)束狀態(tài)的轉(zhuǎn)移概率記為e,即被標(biāo)記成橙色的箭頭。然后,在圖3的模型中添加狀態(tài)X與Y之間的轉(zhuǎn)移概率,記為b,即被標(biāo)記成紅色的箭頭。在實際中,將b值設(shè)置為較小的數(shù),以表示出現(xiàn)一對‘-’的概率很小,也即兩個序列中出現(xiàn)一對‘-’的罰分將很重。最后,計算其余的狀態(tài)轉(zhuǎn)移概率。計算原則是:從某個狀態(tài)出發(fā),到達其余狀態(tài)的概率之和為1。例如從X到M的概率為1-b-c-e。

      2.2 基因發(fā)現(xiàn)

      基因發(fā)現(xiàn)是在一個DNA序列中查找基因,但更通用的一個說法是為DNA進行標(biāo)簽,比如將其標(biāo)識為coding、intergenic、introns等區(qū)域。因此,基因發(fā)現(xiàn)常被認為是生物信息學(xué)中序列標(biāo)簽問題的一個特例。上文中的例子就是DNA標(biāo)簽的一個簡單的抽象,所以不再展開講解基因發(fā)現(xiàn)的HMMs。Krogh等人在基因發(fā)現(xiàn)問題中引入了 HMMs[9],用以區(qū)分 E.coli基因中的coding區(qū)域和intergenic區(qū)域。

      隨后的用于基因發(fā)現(xiàn)的HMMs都是對Krogh等人工作的擴展。例如,Henderson等[10]設(shè)計了獨立的HMM模塊,使得每個模塊適用于一個特定的DNA區(qū)域。Kulp 和 Burge等[11-12]使用一個特殊的 HMM(GHMM 或“hidden semi-Markov model”),使得每個內(nèi)部狀態(tài)點可發(fā)射多次。近年來,研究者更關(guān)注于在基因組范圍內(nèi)進行基因預(yù)測,并設(shè)計相應(yīng)的HMMs[13]。

      2.3 其他的一些應(yīng)用

      多序列比對(Multiple Alignment)經(jīng)常用于評估一個新的序列是否屬于一個已知的同源序列家庭。多條序列可構(gòu)成一個譜(Profile),即一個位置權(quán)重矩陣。多序列比對往往采用”Profile HMM”技術(shù),HMM的構(gòu)造原理(狀態(tài)轉(zhuǎn)移)類似于雙序列比對的模型。對于多序列比對問題,HMMs是公認的強有力的工具。但HMMs的訓(xùn)練非常耗時,所以通常采用啟發(fā)式方式進行訓(xùn)練。近年來,模擬退火、粒子群算法等進化算法被用于求解多序列比對的HMMs的訓(xùn)練中[14-15]。

      系統(tǒng)發(fā)生分析(Phylogenetic Analysis)。系統(tǒng)發(fā)生分析的目標(biāo)是尋找系統(tǒng)發(fā)生的概率模型并得到不同物種的進行樹。為解釋序列各個位置間進化速度的變化,F(xiàn)elsenstein等將3個可能的速度值做為HMM的狀態(tài)[16]。Thorne等提出了一個使用HMMs的進化系統(tǒng)發(fā)生模型,將主要結(jié)構(gòu)與一個已知或待評測的二級結(jié)構(gòu)合并[17]。最近,Bykova等對 HMMs進行了改進,用以解釋當(dāng)顯著的特種不確定時的特例[18]。

      基因映射(Genetic Mapping)。使用一個非平穩(wěn)的HMM進行基因映射,是生物信息學(xué)中最早的HMMs應(yīng)用,即在染色體中已知次序的軌跡間對一些距離進行評估。初始的時候,Lander等基于譜系得到基因間的鏈接映射[19]。后來,為了得到輻射譜,Slonim等運用了一個基于實驗輻射數(shù)據(jù)的非平穩(wěn)HMM[20]。隨著高通量測序的發(fā)展,已有不少的學(xué)者關(guān)注于基于下一代測序數(shù)據(jù)的用于基因映射的非平穩(wěn)HMM[21]。

      蛋白質(zhì)二級結(jié)構(gòu)預(yù)測(Secondary Structure Protein Prediction)。HMMs也應(yīng)用到了預(yù)測一個蛋白質(zhì)的二級結(jié)構(gòu),即預(yù)測局部三維結(jié)構(gòu)的類型,這是預(yù)測全局三維結(jié)構(gòu)非常重要的一步[22]。一個標(biāo)準(zhǔn)的HMM可被看作一個隨機的“正則語法”。基于此,Eddy等引入了結(jié)合協(xié)方差方法的 HMMs[23-24]。

      信號肽預(yù)測(Signal Peptide Prediction)。信號肽預(yù)測就是確定蛋白質(zhì)在縮氨酸第一區(qū)域中的目標(biāo)地址,通常對于疾病分析和藥物研制有重要意義。非常成功的一個方法就是使用一個標(biāo)準(zhǔn)的HMMs在革蘭氏陰性的真細菌中預(yù)測脂蛋白信號縮氨酸[25]。Schneider等綜述了基于HMMs的信號肽預(yù)測的3個其他方法[26]。

      橫跨膜蛋白質(zhì)預(yù)測(Transmembrane Protein Prediction)。當(dāng)前直接測量一個橫跨膜蛋白質(zhì)的3D結(jié)構(gòu)幾乎是不可行的。一些研究者專門研究預(yù)測螺旋形橫跨膜蛋白質(zhì)拓撲結(jié)構(gòu)的 HMMs[27-28]。另外一些研究者則專門研究預(yù)測β-胡蘿卜素橫跨膜蛋白質(zhì)的拓撲結(jié)構(gòu)的 HMMs[29-30]。

      抗原決定基預(yù)測(Epitope Prediction)。免疫反映中的一個前提步驟是將一個抗原決定基綁定到一個I類或II類MHC微粒。然而,大多數(shù)抗原決定基并不能綁定到MHC微粒,所以能預(yù)測出哪個抗原決定基能夠進行綁定是重要的。Mamitsuka等使用無監(jiān)督學(xué)習(xí)來提升HMMs的性能[31],既適用于I類也適用于II類MHC微粒。

      3 結(jié)束語

      本文討論了隱馬爾可夫模型(Hidden Markov Models,HMMs)在生物信息學(xué)中的應(yīng)用情況。介紹了HMMs,并分析了如何在生物信息學(xué)中設(shè)計和應(yīng)用HMMs。隨著生物實驗技術(shù)的不斷發(fā)展,生物學(xué)家收集的實驗數(shù)據(jù)的種類越來越多、數(shù)據(jù)量越來越大,而實驗分析技術(shù)和計算方法明顯發(fā)生了滯后。因此,雖然當(dāng)前HMMs已在一些生物信息學(xué)領(lǐng)域中得到了良好的應(yīng)用,但其不乏有更廣泛的應(yīng)用空間,本文旨在為HMMs的初學(xué)者提供一個快速的學(xué)習(xí)途徑。

      隨著生物信息學(xué)的快速發(fā)展,會不斷涌現(xiàn)新的應(yīng)用。必然需要新的模型結(jié)構(gòu)以適應(yīng)新的生物信息學(xué)問題。鑒于隱馬爾科夫強大的適應(yīng)能力,其可與其他模型相應(yīng)結(jié)合,這些模型如貝葉斯、神經(jīng)網(wǎng)絡(luò)、支持向量機、喬姆斯基文法等,在未來的生物信息學(xué)應(yīng)用中繼續(xù)發(fā)揮更大的作用。

      [1] Eddy S.What is a hidden Markov model[J].Nature Biotechnology,2004,22(10):1315 -1316.

      [2] Duta R O.Pattern classification[M].Beijing:China Machine Press,2004.

      [3] Charniak E.Statistical techniques for natural language parsing[J].AI Magazine,1997(18):33 -43.

      [4] Singh B,Kapur N,Kaur P.Speech recognition with hidden Markov model:a review [J].International Journal of Advanced Reasearch in Computer Science and Software Engineering,2012,2(3):401 -403.

      [5] Pollastri E,Simoncelli G.Classification of melodies by composer with hidden Markov models[C].Florence,Italy:the First International Conference on Web Delivering of Music WEDELMUSIC’01,2001.

      [6] Valeria D F,F(xiàn)ilippo A P,Valerio P.Hidden Markov models in bioinformatics [J].Current Bioinformatics,2007(2):49-61.

      [7] Yoon B.Hidden Markov models and their applications in biological sequence analysis [J].Current Genomics,2009(10):402-415.

      [8] Durbin R,Eddy S.Biological sequence analysis:probabilistic models of proteins and nucleic acids[M].Cambridge,UK:Cambridge University Press,1998.

      [9] Krogh A.Computational methods in molecular biology[M].Amsterdam,Holland:Elsevier Press,1998.

      [10] Henderson J,Salzberg S,F(xiàn)asman K H.Finding genes in DNA with a hidden Markov model[J].Journal of Comput Biology,1997(4):127 -141.

      [11] Kulp D,Haussler D,Reese M G,et al.A generalized hidden Markov model for the recognition of human genes in DNA[C].Menlo Park,California:International Conference on Intelligent Systems in Molecular Biology,1996.

      [12] Burge C B,Karlin S.Finding the genes in genomic DNA[J].Current Opin Structer Biology,1998(8):346 -354.

      [13] Testa A C,Hane J K,Ellwood S R,et al.Coding Quarry:highly accurate hidden Markov model gene prediction in fungal genomes using RNA - seq transcripts[J].BMC Genomics,2015(16):170 -175.

      [14] Sun J,Wu X,F(xiàn)ang W,et al.Multiple sequence alignment using the hidden markov model trained by an improved quantum - behaved particle swarm optimization[J].Information Sciences,2012,182(1):93 -114.

      [15] Sun J,Palade V,Wu X,et al.Multiple sequence alignment with hidden Markov models learned by random drift particle swarm optimization [J].IEEE/ACM Transactions on Computational Biology and Bioinformatics,2014,11(1):243-257.

      [16] Felsenstein J,Churchill G.A hidden Markov model approach to variation among sites in rate of evolution[J].Molto Biology Evolution,1996(13):93 -104.

      [17] Thorne J,Goldman N,Jones D.Combining protein evolution and secondary structure[J].Molto Biology Evolution,1996(13):666-673.

      [18] Bykova N A,F(xiàn)avorov A V,Mironov A A.Hidden Markov models for evolution and comparative genomics analysis[J].PLoS One,2013,8(6):e65012 - e65017.

      [19] Lander E,Green P.Construction of multilocus genetic linkage maps in humans[J].Proceeding of Natl Acad Science,1987(84):2363-2367.

      [20] Slonim D,Kruglyak L,Stein L,et al.Building human genome maps with radiation hybrids[J].Journal of Computational Biology,1997(4):487 -504.

      [21] Zamanzad G F,Jürgen C,Tomasz B.A nonhomogeneous hidden Markov model for gene mapping based on next-generation sequencing data[J].Journal of Computational Biology,2015,22(2):178 -188.

      [22] Yoon B,Vaidyanathan P.HMM with auxiliary memory:a new tool for modeling RNA secondary structures[C].Monterey,CA:the Thirty - Eighth Asilomar Conference on Signals,Systems and Computers,2004.

      [23] Eddy S,Durbin R.RNA sequence analysis using covariance models[J].Nucleic Acids Research,1994(22):2079 -2088.

      [24] Eddy S.A memory- efficient dynamic programming algorithm for optimal alignment of a sequence to an RNA secondary structure[J].BMC Bioinformatics,2002(2):3 -18.

      [25] Juncker A,Willenbrock H,Von Heijne G,et al.Prediction of lipoprotein signal peptides in Gramnegative bacteria [J].Protein Science,2003(12):1652 -1662.

      [26] Schneider G,F(xiàn)echner U.Advances in the prediction of protein targeting signals[J].Proteomics,2004(4):1571 -1580.

      [27] Sonnhammer E,von Heijne G,Krogh A.A hidden Markov model for predicting transmembrane helices in protein sequences[C].Montreal,Canada:International Conference on Intelligent Systems in Molecular Biology,1998.

      [28] Tusnady G E,Simon I.Principles governing amino acid composition of integral membrane proteins:application to topology prediction [J].Journal Molto Biology,1998(283):489-506.

      [29] Martelli P L,F(xiàn)ariselli P,Krogh A,et al.A sequence - profilebased HMM for predicting and discriminating beta barrel membrane proteins [J].Bioinformatics,2002(18):S46-53.

      [30] Liu Q,Zhu Y,Wang B,et al.A HMM - based method to predict the transmembrane regions of beta-barrel membrane proteins[J].Computer Biology Chemistry,2003(27):69-76.

      [31] Mamitsuka H.Predicting peptides that bind to MHC molecules using supervised learning of hidden Markov models[J].Proteins,1998(33):460 -474.

      猜你喜歡
      馬爾可夫信息學(xué)位點
      鎳基單晶高溫合金多組元置換的第一性原理研究
      上海金屬(2021年6期)2021-12-02 10:47:20
      CLOCK基因rs4580704多態(tài)性位點與2型糖尿病和睡眠質(zhì)量的相關(guān)性
      雞NRF1基因啟動子區(qū)生物信息學(xué)分析
      二項式通項公式在遺傳學(xué)計算中的運用*
      初論博物館信息學(xué)的形成
      中國博物館(2018年2期)2018-12-05 05:28:50
      保費隨機且?guī)в屑t利支付的復(fù)合馬爾可夫二項模型
      基于SOP的核電廠操縱員監(jiān)視過程馬爾可夫模型
      應(yīng)用馬爾可夫鏈對品牌手機市場占有率進行預(yù)測
      miRNA-148a在膀胱癌組織中的表達及生物信息學(xué)分析
      認知無線網(wǎng)絡(luò)中基于隱馬爾可夫預(yù)測的P-CSMA協(xié)議
      无极县| 固原市| 玛纳斯县| 汉源县| 阳原县| 连城县| 乡宁县| 郑州市| 邮箱| 凤台县| 阿拉尔市| 临沂市| 乐东| 邹城市| 太原市| 莱阳市| 库尔勒市| 富阳市| 乐山市| 卓尼县| 四川省| 香港 | 台中市| 鸡东县| 湘乡市| 兴山县| 达日县| 烟台市| 甘洛县| 锦屏县| 丰城市| 响水县| 长白| 泸州市| 鹿泉市| 郑州市| 罗田县| 大荔县| 抚远县| 黄骅市| 康平县|