黃茉莉
[摘 要]隨著大數(shù)據(jù)時(shí)代的到來(lái),面向生物類專業(yè)的生物信息學(xué)教學(xué)也隨之發(fā)生變化。授課范圍由傳統(tǒng)“面面俱到”的灌輸式教學(xué)向緊跟科研發(fā)展的數(shù)據(jù)挖掘和大數(shù)據(jù)處理傾斜;授課方式由單一的理論學(xué)習(xí)轉(zhuǎn)為與上機(jī)操作相結(jié)合,并采用案例分析將教學(xué)內(nèi)容系統(tǒng)、完整地銜接和串聯(lián)。本文根據(jù)筆者的教學(xué)實(shí)踐,以兩個(gè)案例教學(xué)為中心,從教學(xué)手段、考核方式等方面展開闡述和討論。
[關(guān)鍵詞]生物信息學(xué);案例教學(xué);生物類專業(yè)
[中圖分類號(hào)]G64 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1005-6432(2014)48-0179-03
生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、處理、存儲(chǔ)、發(fā)布、分析和解釋等在內(nèi)的所有方面,綜合運(yùn)用生物學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)等方法,闡述和理解數(shù)據(jù)所包含的生物學(xué)意義。作為21世紀(jì)生命科學(xué)領(lǐng)域發(fā)展最為迅速的學(xué)科之一,生物信息學(xué)已成為介于生物學(xué)和計(jì)算機(jī)科學(xué)前沿的重要學(xué)科。實(shí)驗(yàn)室的每一項(xiàng)技術(shù),從簡(jiǎn)單的克隆、PCR到基因數(shù)據(jù)分析都需要在計(jì)算機(jī)上進(jìn)行處理。因此對(duì)生物學(xué)專業(yè)的學(xué)生而言,具有一定程度的理解和應(yīng)用生物信息學(xué)技術(shù)的能力是十分必要的。而課程是為培養(yǎng)目標(biāo)服務(wù)的。這就要求教師在有限的授課時(shí)間內(nèi),使學(xué)生不僅掌握基本的理論知識(shí),緊跟科研的最新進(jìn)展,而且在今后的科研工作中能學(xué)以致用。
1 理論與實(shí)踐相結(jié)合的教學(xué)手段
根據(jù)當(dāng)今生物信息學(xué)的發(fā)展方向,教師結(jié)合理論教學(xué)內(nèi)容增加綜合性、開放性實(shí)驗(yàn),使學(xué)生循序漸進(jìn)地理解和掌握生物信息學(xué)的原理和方法,進(jìn)而運(yùn)用合適的生物信息學(xué)工具解決問(wèn)題。本文以兩個(gè)案例解析這一教學(xué)過(guò)程。一是信息的簡(jiǎn)單檢索。在獲取生物信息的同時(shí),理解數(shù)據(jù)庫(kù)概念、動(dòng)態(tài)規(guī)劃和bootstrap等算法;二是高通量測(cè)序的數(shù)據(jù)分析。在實(shí)現(xiàn)大規(guī)模數(shù)據(jù)處理和分析的同時(shí),掌握統(tǒng)計(jì)分析基礎(chǔ)知識(shí)。
1.1 生物信息的簡(jiǎn)單檢索
近一二十年,生物學(xué)數(shù)據(jù),尤其是序列數(shù)據(jù),以指數(shù)級(jí)的方式增長(zhǎng)。以GenBank的核酸數(shù)據(jù)庫(kù)為例,每12~20個(gè)月數(shù)據(jù)就翻一番,略高于Moore定律提供的參考數(shù)值。如何從這些海量數(shù)據(jù)中獲取想要的信息,已成為生物學(xué)專業(yè)學(xué)生必須掌握的技能之一。而如何正確獲取和應(yīng)用信息,則需要了解數(shù)據(jù)是如何被存儲(chǔ)、解析,以及背后隱藏的算法。因此圍繞正確挖掘數(shù)據(jù)信息這一主題,設(shè)計(jì)以下案例,通過(guò)4步展開教和學(xué)。
1.1.1 講解
基于大數(shù)據(jù)教師引申出數(shù)據(jù)庫(kù)存儲(chǔ)信息的概念。而后分類介紹常用的基因組數(shù)據(jù)庫(kù)、核酸序列數(shù)據(jù)庫(kù)、蛋白質(zhì)序列數(shù)據(jù)庫(kù)、蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)以及各種常用復(fù)合數(shù)據(jù)庫(kù)。
1.1.2 演示
了解上述常用的數(shù)據(jù)庫(kù)之后,教師實(shí)例演示數(shù)據(jù)庫(kù)檢索。通過(guò)逐層提出問(wèn)題,誘導(dǎo)學(xué)生思考如何利用上述不同的數(shù)據(jù)庫(kù)資源,一步一步挖掘所需的信息。例如,被測(cè)序的片段是哪個(gè)基因?該基因編碼的蛋白質(zhì)序列是什么?是否有保守的功能結(jié)構(gòu)域?在亞細(xì)胞的什么位置發(fā)揮什么功能?可能的三級(jí)結(jié)構(gòu)?和哪些蛋白或RNA存在可能的相互作用?它在進(jìn)化中又是如何演變的?
1.1.3 實(shí)踐
讓學(xué)生上機(jī)操作上述實(shí)例,體驗(yàn)各個(gè)數(shù)據(jù)庫(kù)的側(cè)重點(diǎn),并理解不同軟件不同參數(shù)的意義或差別。比如GenBank和Swissprot的側(cè)重點(diǎn),PAM-n和BLOSUM-n的選取。
1.1.4 成文
引導(dǎo)學(xué)生形成可重復(fù)計(jì)算的科學(xué)文檔。對(duì)每一個(gè)案例,教師展示常規(guī)性的文件組織形式:/data,/analysis,/scripts,/reference等。寫說(shuō)明文檔的時(shí)候,要求學(xué)生記錄每一個(gè)分析步驟的所有細(xì)節(jié):數(shù)據(jù)庫(kù)的網(wǎng)址、軟件的名稱、版本、輸入的文件、精確的運(yùn)行參數(shù)、結(jié)果的提取等。
通過(guò)這樣的案例教學(xué)模式,一是較好地將知識(shí)點(diǎn)融合串聯(lián)到教師講授和學(xué)生上機(jī)操作中。二是使學(xué)生不僅熟悉各種常見(jiàn)的數(shù)據(jù)庫(kù),而且理解數(shù)據(jù)庫(kù)中各個(gè)軟件及其參數(shù)的意義,遇到實(shí)際問(wèn)題也不再束手無(wú)策。而教師也可以充分參與到學(xué)生的學(xué)習(xí)中,對(duì)學(xué)生上機(jī)操作過(guò)程中出現(xiàn)的一些主要理論與技能問(wèn)題了如指掌。通過(guò)教—學(xué)—練—教—練,達(dá)到學(xué)以致用的教學(xué)目的。三是培養(yǎng)學(xué)生創(chuàng)建較好的文檔及其組織形式,形成科學(xué)研究的可重復(fù)性(replication)和可復(fù)現(xiàn)性(reproducibility)。不僅有利于追溯前因,而且對(duì)代碼的復(fù)用,以及對(duì)結(jié)果應(yīng)用于新項(xiàng)目都非常必要。
1.2 高通量測(cè)序數(shù)據(jù)的分析
隨著高通量測(cè)序技術(shù)的興起,大量物種的全基因組數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)和其他類型數(shù)據(jù)被測(cè)定完成或正在進(jìn)行中,每天都有成千上萬(wàn)的數(shù)據(jù)被源源不斷地輸入相應(yīng)的生物信息庫(kù)中。這些大規(guī)模數(shù)據(jù)的不斷產(chǎn)出,使得生物學(xué)專業(yè)學(xué)生掌握高通量數(shù)據(jù)分析技術(shù)已成為一種趨勢(shì)。因此,教師有必要將這部分內(nèi)容由理論講授過(guò)渡到上機(jī)操作。
1.2.1 介紹
教師以DNA測(cè)序技術(shù)發(fā)展為主線,理論介紹De Novo測(cè)序、ChIP-seq測(cè)序、RNA-seq測(cè)序、Methyl-seq測(cè)序等。并通過(guò)拍攝的錄像,向?qū)W生直觀地展示不同的測(cè)序儀及其特點(diǎn)。
1.2.2 演示
教師對(duì)整個(gè)分析過(guò)程進(jìn)行詳細(xì)的闡述并實(shí)時(shí)上機(jī)演示(下圖)。以轉(zhuǎn)錄組RNA-seq為例,包括測(cè)序質(zhì)量的評(píng)估(堿基組成和堿基質(zhì)量分析)、clean reads的篩選、利用TopHat/Bowtie將篩選出來(lái)的reads比對(duì)到參考轉(zhuǎn)錄本、統(tǒng)計(jì)reads在參考基因上的分布情況及覆蓋度,判斷比對(duì)結(jié)果是否通過(guò)第二次質(zhì)控、通過(guò)cuffmerge將重復(fù)測(cè)序得到的reads形成一致性轉(zhuǎn)錄本、基因結(jié)構(gòu)優(yōu)化、基因覆蓋度統(tǒng)計(jì)、使用cuffdiff篩選差異表達(dá)基因和鑒別可變剪切體、對(duì)結(jié)果基因進(jìn)行聚類分析、GO和pathway富集性分析。
1.2.3 實(shí)踐
讓學(xué)生分組討論并上機(jī)實(shí)現(xiàn)上述數(shù)據(jù)分析流程。掌握基本的Linux命令、統(tǒng)計(jì)計(jì)算和可視化分析。
1.2.4 成文
引導(dǎo)學(xué)生形成規(guī)范化文檔和腳本,以便回溯和可重復(fù)性使用。
高通量數(shù)據(jù)分析不僅涉及的知識(shí)點(diǎn)多,而且需要在Linux下進(jìn)行簡(jiǎn)單的操作和軟件的使用。對(duì)生物學(xué)專業(yè)的學(xué)生來(lái)說(shuō),容易造成心理上的抗拒。教師可以采用“分而食之”的策略:將教學(xué)內(nèi)容分成相對(duì)獨(dú)立完整又有一定聯(lián)系的幾個(gè)部分(下圖)。對(duì)于每部分內(nèi)容,教師利用已講解的相關(guān)知識(shí)給學(xué)生實(shí)時(shí)演示,并給出教師自己的理解和結(jié)果。然后把學(xué)生分組,讓他們根據(jù)自己的理解,帶著興趣和疑問(wèn)上機(jī)實(shí)踐。并在上機(jī)操作過(guò)程中,鼓勵(lì)學(xué)生之間、學(xué)生與教師之間及時(shí)討論交流。最后讓學(xué)生將所有內(nèi)容串聯(lián)起來(lái),介紹本組的實(shí)驗(yàn)內(nèi)容及解決辦法。通過(guò)這種方式能較明顯地消除心理顧慮,有助于學(xué)生獨(dú)立思考,獨(dú)立解決問(wèn)題。
“RNA-seq數(shù)據(jù)分析”案例教學(xué)流程圖
2 以能力測(cè)試為中心的考核方式
對(duì)于生物學(xué)專業(yè)的學(xué)生而言,生物信息學(xué)是一門實(shí)踐性很強(qiáng)的學(xué)科。因此,教師采用以“能力測(cè)試”為中心,知識(shí)與技能考核并重的考核方式。以上述兩個(gè)案例為例,在期末考試中,教師將NCBI GEO中“(RNA-seq[Title])AND “Mus musculus”[porgn:__txid10090]”722個(gè)實(shí)驗(yàn)數(shù)據(jù),隨機(jī)分配給每個(gè)學(xué)生。要求每個(gè)學(xué)生對(duì)分配到的RNA-seq數(shù)據(jù)進(jìn)行差異表達(dá)分析,聚類分析和富集性分析。并選擇合適的基因,分析其保守的功能結(jié)構(gòu)域、亞細(xì)胞定位以及可能的蛋白質(zhì)結(jié)構(gòu)和功能、可能結(jié)合的轉(zhuǎn)錄因子、相互作用的蛋白質(zhì)網(wǎng)絡(luò)和信號(hào)通路、構(gòu)建相應(yīng)的系統(tǒng)進(jìn)化樹。
學(xué)生對(duì)上述每一個(gè)小題從“知識(shí)點(diǎn)”、“參考資料”、“使用軟件或工具”、“參數(shù)”、“腳本”、“結(jié)果”分別答題,不僅非常有效地明確所學(xué)的內(nèi)容,而且很好地杜絕了作弊行為。
3 教學(xué)效果
為了解案例教學(xué)的效果,本課程案例教改活動(dòng)向2011級(jí)生物科學(xué)和免疫學(xué)專業(yè)學(xué)生QQ群發(fā)放電子問(wèn)卷,共收回82份答卷,統(tǒng)計(jì)結(jié)果如下表所示。從表中可以看出,案例教學(xué)模式使學(xué)生有較強(qiáng)的參與感,能較好地提高學(xué)生的學(xué)習(xí)興趣,學(xué)生對(duì)理論問(wèn)題的認(rèn)識(shí)更為深刻。
4 結(jié) 論
案例教學(xué)基于具體的事例,將一系列的知識(shí)點(diǎn)有機(jī)地串聯(lián)起來(lái),并通過(guò)實(shí)例操作達(dá)到學(xué)以致用的目的。從學(xué)生反饋意見(jiàn)可以看出,這種理論與實(shí)踐結(jié)合的教學(xué)模式,很好地提高了學(xué)生的學(xué)習(xí)興趣??紤]到有限的授課時(shí)間和不同學(xué)生的學(xué)習(xí)背景,作為教師需要設(shè)計(jì)合適的案例,從而達(dá)到較好的教學(xué)效果。一般可以遵循以下原則。
4.1 具有代表性
所選的案例既要經(jīng)典又要緊跟科學(xué)前沿。比如第一個(gè)案例所蘊(yùn)含的數(shù)據(jù)庫(kù)檢索、序列比對(duì)和系統(tǒng)進(jìn)化樹的構(gòu)建,在生物信息學(xué)中,屬于較經(jīng)典且核心的知識(shí)點(diǎn)。而第二個(gè)案例選擇的對(duì)象則與當(dāng)前的科研熱點(diǎn)緊密聯(lián)系。
4.2 具有偏向性
生物信息學(xué)本身是個(gè)交叉學(xué)科,涉及的知識(shí)點(diǎn)相對(duì)較多。面對(duì)生物類專業(yè)背景的學(xué)生,我們側(cè)重生物信息學(xué)方法或者工具(軟件)的應(yīng)用,而不是強(qiáng)調(diào)算法。比如第一個(gè)案例中系統(tǒng)進(jìn)化樹的構(gòu)建,我們只是以5條8bp長(zhǎng)的序列為例講解最小進(jìn)化法和鄰接法、最大簡(jiǎn)約法、最大似然法以及貝葉斯推斷,重點(diǎn)在于強(qiáng)調(diào)不同的數(shù)據(jù)適合采用上述哪些方法以及如何用Mega等軟件實(shí)現(xiàn)系統(tǒng)進(jìn)化樹的構(gòu)建。
4.3 先后案例有層次性
比如第一個(gè)案例中,學(xué)生掌握了Windows下的序列比對(duì)。對(duì)于第二個(gè)案例中Linux下的Bowtie就容易理解并操作。
4.4 具有拓展性
比如第一個(gè)案例中,在Windows的DOS下進(jìn)行批量序列比對(duì)時(shí),不同的參數(shù)設(shè)置,輸出不同的數(shù)據(jù)格式。第二個(gè)案例中,Bowtie最多允許3個(gè)錯(cuò)配,如果允許更多的錯(cuò)配數(shù),則可以采用SOAPaligner/ SOAP2實(shí)現(xiàn)。學(xué)生可以根據(jù)自己的興趣和能力,選擇拓展性內(nèi)容進(jìn)行繼續(xù)學(xué)習(xí)。
4.5 良好的成文習(xí)慣
引導(dǎo)學(xué)生養(yǎng)成良好的文檔組織和書寫習(xí)慣。每一個(gè)案例,都要求學(xué)生形成可重復(fù)性和可復(fù)現(xiàn)性的文檔,對(duì)于整理分析思路、核實(shí)結(jié)果、重復(fù)使用代碼都起到事半功倍的效果。
生物信息學(xué)是現(xiàn)代生物科學(xué)研究的重要工具和載體。如何有效正確地應(yīng)用生物信息學(xué),是每一個(gè)生物實(shí)驗(yàn)者需要具備的能力。教師應(yīng)緊跟學(xué)科發(fā)展的速度,圍繞學(xué)以致用的原則,將案例教學(xué)科學(xué)地、和諧地應(yīng)用到教學(xué)實(shí)踐中,不僅使學(xué)生掌握一定的理論知識(shí),從而正確地應(yīng)用軟件工具,而且逐漸培養(yǎng)學(xué)生自我分析和解決問(wèn)題的能力。
參考文獻(xiàn):
[1]LuscombeNM,Greenbaum D,Gerstein M.Whatis bioinformatics? A proposed definition and overview of the field[J].Methods Inf Med,2001,40(4).
[2]ENCODE Project Consortium.An integrated encyclopedia of DNA elements in the human genome[J].Nature,2012,489(7414).
[3]1000 Genomes Project Consortium,Abecasis GR,Auton A,Brooks LD,DePristo MA,Durbin RM,Handsaker RE,Kang HM,Marth GT,McVean GA.An integrated map of genetic variation from 1,092 human genomes[J].Nature,2012,491(7422).
[4]Sandve GK,Nekrutenko A,Taylor J,Hovig E.Ten simple rules for reproducible computational research[J].PLoS Comput Biol,2013,9(10).
[5]McCormick M,Liu X,Jomier J,Marion C,Ibanez L.ITK:enabling reproducible research and open science[J].Front Neuroinform,2014(8).
[6]李偉蘭.論大學(xué)生學(xué)習(xí)心理障礙的成因及基本對(duì)策[J].湖北函授大學(xué)學(xué)報(bào),2012,5(25).
[7]李運(yùn)慶.淺析案例教學(xué)存在的問(wèn)題及對(duì)策研究[J].長(zhǎng)春理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011,9(24).
[8]白新艷.案例教學(xué)法的探索[J].成功(教育),2012,6.