車(chē)凱 郭茂祖 劉曉燕 滕志霞
摘要: 植物抗性基因識(shí)別中的從頭預(yù)測(cè)方法可以看作機(jī)器學(xué)習(xí)中的分類(lèi)問(wèn)題。通常情況下,一個(gè)分類(lèi)器的訓(xùn)練需要正確標(biāo)記的正例和反例。然而,抗性基因識(shí)別中可用的信息僅有少數(shù)人工標(biāo)記的抗性基因,且不具有抗性功能的基因也不明確。為了消除由于正例太少和錯(cuò)誤的反例帶來(lái)的抗性基因識(shí)別的影響,基于抗性基因和其他基因在蛋白質(zhì)相互作用網(wǎng)中的距離,提出了一種新的樣本選擇方法,并對(duì)提出的樣本選擇方法和通常樣本選擇方法分別在四種分類(lèi)器上進(jìn)行了10倍交叉驗(yàn)證。結(jié)果表明,文中方法的SN值平均提高了6.9%,SP值平均提高了13.1%。因此,就敏感性和特異性而言,提出的方法獲得了更高效、更可靠的結(jié)果。
關(guān)鍵詞:
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2012)04-0031-04