劉吳林
基因和生物體的生、老、病、死等生命現(xiàn)象相關(guān),生物體內(nèi)的基因?qū)τ谏锉旧淼挠绊懸恢笔强茖W(xué)家們致力研究的方向。尤其在大數(shù)據(jù)時(shí)代的影響下,將計(jì)算機(jī)科學(xué)與生物學(xué)研究緊密結(jié)合,無(wú)疑將會(huì)使生物研究,尤其是基因組這一熱點(diǎn)研究變得更加便捷、高速、精準(zhǔn)。
“多學(xué)科交叉在現(xiàn)在看來(lái)其實(shí)是一件再正常不過(guò)的事情,因?yàn)閱蝹€(gè)學(xué)科的研究方法發(fā)展到一定程度會(huì)有一個(gè)瓶頸,需要和別的學(xué)科或方法進(jìn)行結(jié)合、產(chǎn)生碰撞,才能進(jìn)一步促進(jìn)自己學(xué)科的發(fā)展,產(chǎn)生新的知識(shí)。而我所從事的生物信息研究工作其實(shí)就是將生命科學(xué)和計(jì)算機(jī)科學(xué)這兩個(gè)交叉學(xué)科相融,兩者碰撞中產(chǎn)生‘火花,從而激發(fā)出令人意想不到的創(chuàng)新成果?!闭?yàn)橛写苏J(rèn)識(shí),昆明理工大學(xué)的鄭云博士才在交叉創(chuàng)新研究的路上,收獲了讓人刮目相看的原創(chuàng)性科研成果。
夯實(shí)基礎(chǔ)不斷前行——上下求索的漫漫長(zhǎng)路
清朝劉開(kāi)《問(wèn)說(shuō)》中說(shuō)“理無(wú)專在,而學(xué)無(wú)止境也”,意為學(xué)習(xí)應(yīng)該是無(wú)止境的。科學(xué)研究亦是如此,科學(xué)家要想有好的科研成果,必須有執(zhí)著探索的信念和心理準(zhǔn)備。對(duì)此,鄭云深有領(lǐng)悟,不管之前學(xué)習(xí)深造還是之后從事科學(xué)研究,對(duì)他來(lái)說(shuō)兩者是一條相連的漫漫長(zhǎng)路,偶有曲折在所難免。路漫漫其修遠(yuǎn)兮,他將上下求索。
鄭云1994年就讀于北京航空航天大學(xué)制造工程專業(yè)工程學(xué),從那時(shí)起,他開(kāi)始接觸計(jì)算機(jī),并產(chǎn)生了濃厚興趣。后來(lái)考研失敗,但因?yàn)橐恍南胍^續(xù)深造,所以他一邊工作一邊堅(jiān)持學(xué)習(xí),還自主考了GRE、托福等。因?yàn)榧彝ピ?,只有申?qǐng)到全額獎(jiǎng)學(xué)金才能出國(guó)深造,所以一直堅(jiān)持,終在2002年得償所愿考到新加坡南洋理工大學(xué)攻讀計(jì)算機(jī)博士學(xué)位,本來(lái)想學(xué)習(xí)機(jī)器學(xué)習(xí)和人工智能專業(yè),無(wú)奈招生已滿,于是選擇進(jìn)入該校的生物信息研究中心。那一年,距人類基因組工程測(cè)序完成,生物信息學(xué)走向高潮僅過(guò)了1年時(shí)間。在新科技的浪潮下,同時(shí)學(xué)習(xí)計(jì)算機(jī)知識(shí)和研究生物信息無(wú)疑是緊跟時(shí)代的步伐,對(duì)此,鄭云投以極大的熱情。新加坡南洋理工大學(xué)畢業(yè)后,鄭云先后到新加坡國(guó)立大學(xué)和美國(guó)圣路易斯華盛頓大學(xué)從事科學(xué)研究。國(guó)外鼓勵(lì)多思考、創(chuàng)新、開(kāi)放、自由的環(huán)境使他的知識(shí)和技能得到了進(jìn)一步的鞏固和提高。
在美國(guó)華盛頓大學(xué)完成博士后研究以后,鄭云加盟復(fù)旦大學(xué)的發(fā)育生物學(xué)研究所開(kāi)展獨(dú)立研究。在此期間,他開(kāi)始把更多的注意力集中到一種稱為microRNA(miRNA)的基因上。miRNA是一類由內(nèi)源基因產(chǎn)生的長(zhǎng)度約為22個(gè)核昔酸的非編碼RNA分子,這種分子參與了各種生物學(xué)過(guò)程并和人類疾病有重要關(guān)系。鄭云注意到植物的miRNA功能預(yù)測(cè)有很多不足,一些有功能的靶基因不能通過(guò)當(dāng)前普遍承認(rèn)并廣泛使用算法正確識(shí)別。于是,鄭云提出了一種全新的算法,稱為Seq Tar算法,推翻了之前的植物靶基因預(yù)測(cè)方法。SeqTar算法不僅發(fā)現(xiàn)了所有的已報(bào)道過(guò)的miRNA靶基因,還發(fā)現(xiàn)了大量未報(bào)道過(guò)的miRNA靶基因。這項(xiàng)研究為更全面、更準(zhǔn)確的研究植物miRNA的功能奠定了堅(jiān)實(shí)的基礎(chǔ),并在國(guó)際著名期刊《核酸研究》(Nucleic Acids Research)上發(fā)表。
2013年加入云南省久負(fù)盛名的昆明理工大學(xué)后,鄭云更是兢兢業(yè)業(yè)做學(xué)術(shù)研究,已發(fā)表接近20篇文章。在談及自己在此期間所做的最滿意的工作時(shí),鄭云提到“用嚴(yán)格理論方法研究學(xué)習(xí)布爾函數(shù)的復(fù)雜度”。鄭云提出了一種新穎的基于信息論的稱為離散函數(shù)學(xué)習(xí)(DFL)的機(jī)器學(xué)習(xí)算法。較之之前的算法,鄭云巧妙地運(yùn)用信息論的理論結(jié)合高效的計(jì)算過(guò)程解決了以前布爾函數(shù)步驟多的難題。鄭云用一系列數(shù)學(xué)定理證明了這一方法對(duì)待特殊函數(shù),只需要nxk個(gè)步驟就能算出,這是解決學(xué)習(xí)布爾函數(shù)這一問(wèn)題的理論上的最優(yōu)方法。這種用數(shù)學(xué)方法解決計(jì)算機(jī)難題的方式為相關(guān)理論研究的進(jìn)一步發(fā)展做出了很大的貢獻(xiàn)。
天道酬勤。漫長(zhǎng)又艱辛的研究,邁過(guò)荊棘叢生處,定是山花爛漫的地方。雖然研究取得一定成績(jī),但鄭云關(guān)于基因序列突變這一問(wèn)題的思考并沒(méi)有結(jié)束。因?yàn)樗钪茖W(xué)探索永無(wú)止境,舊的謎題解開(kāi)了,新的謎題又會(huì)產(chǎn)生。而他所能做的,就是不斷探索,不斷前行。
研究有時(shí)創(chuàng)新無(wú)時(shí)——機(jī)遇偏愛(ài)一直努力的人
九層之臺(tái),起于累土;千里之行,始于足下。鄭云的經(jīng)歷證明了這一點(diǎn)。之前在基礎(chǔ)理論研究方面積累的豐富經(jīng)驗(yàn),為他進(jìn)一步在動(dòng)植物基因研究領(lǐng)域創(chuàng)新收獲,埋下了堅(jiān)實(shí)的伏筆,機(jī)遇偏愛(ài)一直努力的人。
生物體內(nèi)有大量基因,每個(gè)基因都扮演著自己應(yīng)有的角色。而植物中的基因不僅能調(diào)控葉、花等器官的發(fā)育,而且能在獲得基因進(jìn)化規(guī)律的同時(shí)對(duì)農(nóng)作物的產(chǎn)量質(zhì)量產(chǎn)生作用。鄭云現(xiàn)工作的云南省有著豐富的植物資源,其中有兩個(gè)重要的經(jīng)濟(jì)植物是玫瑰和西瓜,但科學(xué)家對(duì)這兩個(gè)重要植物的HNA的相關(guān)研究基本處于空白階段。所以鄭云和團(tuán)隊(duì)在2015年主要就一種最近發(fā)現(xiàn)的、廣泛存在于各種植物中的一種新基因——PHAS分段生成的phasiRNA基因進(jìn)行研究,通過(guò)分析RNA高通量測(cè)序文庫(kù)識(shí)別西瓜和玫瑰中的phasiRNA,分析降解組高通量測(cè)序文庫(kù)研究這些phasiRNA的靶基因和功能,并在不同物種中探尋這種基因的進(jìn)化規(guī)律。
隨著研究的深入開(kāi)展,鄭云明白生物數(shù)據(jù)的準(zhǔn)確挖掘?qū)τ趯ふ一虻倪M(jìn)化規(guī)律有重大意義;同時(shí)也明白了光有腳踏實(shí)地是不夠的,還要有推陳出新,合作共贏的意識(shí)。所以對(duì)自己今后的努力方向有了清晰的定位:一是開(kāi)發(fā)新的生物信息方法,找到一些能夠以新思路挖掘數(shù)據(jù)獲得新知識(shí)的新方法;二是在開(kāi)發(fā)新方法后通過(guò)合作的方式解決實(shí)際問(wèn)題。
在這一定位的指引之下,鄭云課題組堅(jiān)持致力于新方法的研究。業(yè)道酬精,終有所獲。由于miRNA在各種生理過(guò)程中都有重要作用,一些miRNA中的編輯和突變會(huì)引起嚴(yán)重的后果,并引發(fā)疾病,如癌癥等。但要從大量的測(cè)序數(shù)據(jù)中找到miRNA的編輯和突變非常困難,國(guó)內(nèi)對(duì)此的研究甚少。盡管研究有一定難度,但鄭云團(tuán)隊(duì)選擇迎難而上。他們通過(guò)集成分析小RNA和基因組高通量測(cè)序數(shù)據(jù)識(shí)別人類和靈長(zhǎng)類疾病模型miRNA的編輯和突變的這一最新研究取得了實(shí)質(zhì)性進(jìn)展。在這項(xiàng)研究中,鄭云又一次提出了一種新的算法(MiRME),這項(xiàng)成果2016年5月26日也發(fā)表在國(guó)際著名期刊《核酸研究》(Nucleic Acids Research)上。這項(xiàng)新的研究旨在利用自主開(kāi)發(fā)的生物信息學(xué)方法即MiRME計(jì)算流程高效和準(zhǔn)確地識(shí)別并區(qū)分miRNA的SNP和編輯。它主要采用了一種新穎的三輪序列比對(duì)的策略解決了這一難題。這種新的算法避免了其他算法的缺點(diǎn),采用了一系列高效的計(jì)算步驟,同時(shí)保持了高靈敏性和低假陽(yáng)性率。
一項(xiàng)科研成果的創(chuàng)新離不開(kāi)合作團(tuán)隊(duì)中的每個(gè)人。說(shuō)到合作,鄭云表示“一個(gè)人的力量是很弱小的,合作很重要”。就像鄭云喜歡的足球運(yùn)動(dòng)一樣,他形象地描述“一支球隊(duì)離不開(kāi)每一個(gè)人,一個(gè)人是無(wú)法完成整場(chǎng)比賽的,就是C羅、梅西來(lái)了也沒(méi)用。”團(tuán)隊(duì)內(nèi)部的合作奠定了他們與外部團(tuán)隊(duì)進(jìn)一步合作的基礎(chǔ)。對(duì)他們來(lái)說(shuō),和不同領(lǐng)域的科學(xué)家合作,其實(shí)是一個(gè)學(xué)習(xí)的過(guò)程,不僅能使效率提高,還能學(xué)到更多新的知識(shí)。最近,鄭云和復(fù)旦大學(xué)的合作者發(fā)現(xiàn)目前普遍認(rèn)為沒(méi)有功能的基因內(nèi)含子區(qū)域其實(shí)具有重要的功能,而且內(nèi)含子失調(diào)會(huì)影響生物體的正常發(fā)育。這一研究成果將被世界著名期刊《公共科學(xué)圖書館,遺傳學(xué)》(PLOS Genetics)發(fā)表。這樣的合作才是鄭云今后努力的另一個(gè)方向:取大家所長(zhǎng),解決實(shí)際問(wèn)題。
從2002年博士研究生開(kāi)始,10多年過(guò)去,鄭云在生物信息這條道路上越走越從容。他選擇用創(chuàng)新來(lái)為自己的科研增光添彩,而事實(shí)證明了他選擇的正確性。值得一提的是,他不止將創(chuàng)新用在科研中,還落實(shí)到教學(xué)中。除了將創(chuàng)新的理念引導(dǎo)給學(xué)生,鼓勵(lì)他們?cè)诤粚?shí)基礎(chǔ)的同時(shí)勇于創(chuàng)新,還提倡“個(gè)性化培養(yǎng)”,根據(jù)不同學(xué)生的不同特點(diǎn)進(jìn)行引導(dǎo),尤其注意關(guān)注學(xué)生的興趣點(diǎn)。他說(shuō):“任何科研成果的得來(lái)都是一步一個(gè)腳印走來(lái)的,唯有腳踏實(shí)地,才有超越創(chuàng)新的可能性?!?