梅增霞,李建慶
(1 濱州學(xué)院生物與環(huán)境工程學(xué)院,山東濱州 256603;2 濱州學(xué)院教務(wù)處)
DNA 分析技術(shù)廣泛用于種群分化、系統(tǒng)發(fā)育等生物學(xué)研究,也是生物類專業(yè)學(xué)生需要掌握和熟練應(yīng)用的一門技術(shù)。利用DNA 進行生物系統(tǒng)學(xué)分析,通常要求學(xué)生在掌握DNA 提取、PCR 擴增技術(shù)之后,就對目的DNA 拼接和分析,因此,拼接出準(zhǔn)確的DNA 序列是開展其他DNA 分析關(guān)鍵和基礎(chǔ)。
云斑白條天牛是黃河三角洲地區(qū)為害白蠟樹的重要害蟲,危害嚴(yán)重,發(fā)生量大,成蟲個體較大,基因組DNA 的提取比較容易。線粒體細胞色素氧化酶亞基I(COI)是一個較為保守的基因序列,經(jīng)常用于昆蟲種內(nèi)系統(tǒng)發(fā)育和分化的研究[1],目前已有部分對云斑白條天牛COI 的相關(guān)研究[2-4],可為該實驗前期的DNA 提取和PCR 擴增提供借鑒。本實驗內(nèi)容是筆者從事云斑白天牛種群分化研究工作的部分內(nèi)容,項目組從當(dāng)?shù)刂匾οx云斑白條天牛中成功提取并擴增了COI 基因,為該實驗的開展做好了前期準(zhǔn)備。
本實驗設(shè)計結(jié)合黃河三角洲地域特色,以當(dāng)?shù)刂匾οx云斑白條天牛為實驗對象,提取擴增其COI 基因,以COI 基因為例,利用DNAStar 基因分析軟件進行基因序列拼接,并比較拼接方法和拼接結(jié)果,對提升學(xué)生綜合實踐能力和創(chuàng)新能力均有重要作用。
在濱州城區(qū)的白蠟樹上采集云斑白條天牛成蟲,然后進行DNA 提取。
設(shè)計云斑白條天牛雌成蟲COI 基因引物,PCR 擴增,將擴增后DNA 提交上海生工公司雙向測序,測序完成后,公司提供的abl 文格式件分別為DNA 雙鏈的3' 端序列和5' 端序列,文件較大分別為310KB 和259KB,含不同堿基的圖譜。seq 格式文件較小,僅為1KB,含堿基序列。
利用DNAStar 軟件的SeqMan 程序拼接基因序列,利用MegAlign 程序比對序列。
打開DNAStar 的SeqMan 程序,輸入2 個seq 序列文件,將2 個序列進行拼接,拼接后序列長度716 bp。
點擊菜單欄Contig 的Strategy View,打開Strategy窗口(圖1),勾取Conflicts 選項后,通過彩色區(qū)塊,快速查找沖突堿基,由圖4 可見,選取的前80 個堿基中,在堿基序列30~40 和40~50 之間有沖突堿基。
圖1 seq 序列文件裝配序列的Strategy 窗口
點擊Contig 的Alignment View,打開Alignment 窗口,通過圖2 可見,拼接裝配前2 個序列的長度分別是685 bp 和681 bp,根據(jù)圖1 查看的結(jié)果,在拼接后總長度的716 bp 中選取前80 個堿基進行比較,在序列30~40 和40~50 之間查找沖突堿基,在圖2 上有5 處拼接沖突的地方,1 處堿基不一致,4 處堿基缺失。
拼接裝配時,需要對沖突堿基和缺失堿基進行修補,缺失堿基可根據(jù)另一條鏈對應(yīng)的堿基進行填補,但沖突堿基軟件不能確定哪個是正確的,如圖2 的序列35 位點處的2 條鏈的堿基分別A 和C,軟件裝配時以M 作為該位點堿基輸出序列結(jié)果。
圖2 seq 序列文件裝配序列的Alignment 窗口
在SeqMan 程序中輸入2 個abl 圖譜文件,將2 個序列進行拼接裝配,裝配拼接后序列長度705 bp。
由圖3 的Strategy 窗口可見,在拼接后的705 bp中選取前80 個堿基進行比較,在30~40 和40~50 序列位置之間有沖突堿基。根據(jù)圖4 的Alignment 窗口,拼接裝配前2 個序列的長度分別是680 bp 和675 bp,根據(jù)圖3 確定堿基沖突位置,在圖4 上有4 處堿基拼接沖突位置,2 處為堿基不一致,2 處是堿基缺失。修補沖突堿基時參考圖譜波峰,如圖5 局部放大,可確定缺失的39 和44 位點的2 個堿基分別為T 和A;32 位點處沖突堿基A 和C 不匹配,根據(jù)圖譜的波峰可以確定為A,因為堿基A 波峰清晰明顯,而堿基C 處無波峰;50位點處堿基A 的綠色波峰和黑色波峰幾乎重疊,很難確定是堿基A 還是G,因此軟件將以R 作為堿基裝配序列結(jié)果輸出,這是需要重新測序才能確定該位置的堿基名稱。
圖3 abl 圖譜文件裝配序列的Strategy 窗口
圖4 abl 圖譜文件裝配序列的Alignment 窗口
前文2.1 提及的序列文件拼接序列35 位點處的沖突堿基A 和C 與圖譜文件拼接序列的32 位點處為同一堿基位點,因此根據(jù)圖譜文件可以確定圖2 序列文件35 位點處堿基為A。
圖5 abl 圖譜文件裝配序列30~50 位點的放大圖
通過2 種方法得到云斑白條天牛成蟲COI 的2 條拼接序列,abl 圖譜文件拼接后,輸出序列命名為BC-COI-abl,seq 序列文件拼接后,輸出序列命名為BC-COI-seq。通過DNAStar 的MegAlign 程序比較2 條序列的差異,結(jié)果顯示,BC-COI-abl 序列長度705bp,比較的堿基位點為1-705,BC-COI-seq 序列長度716 bp,比較的堿基位點為7~711,比較的堿基序列長度為705 bp,無堿基缺口,2 個序列的相似度為99%。2 條序列的堿基比對結(jié)果,由圖6 可見,2 種拼接方法得到序列有7 處位點堿基不一致,原因均為BC-COI-seq 序列拼接時含有沖突基因不能確定準(zhǔn)確堿基。
圖6 拼接序列BC-COI-abl 和BC-COI-seq 的堿基比較
通過以上實驗過程的比較和分析,可以得出2 個實驗結(jié)論:①2 個文件拼接序列不一致,abl 文件拼接的基因序列較seq 文件拼接的序列堿基準(zhǔn)確性更高。Seq 文件拼接序列存在一些不準(zhǔn)確堿基,這些不準(zhǔn)確堿基可通過觀察abl 文件不同堿基位的波峰圖譜來確定,較好波峰對應(yīng)的堿基為正確堿基。②利用seq 文件拼接的序列長度大于利用abl 文件拼接的序列。seq 文件拼接后COI 基因的序列長度716 bp,abl 文件拼接的COI 基因序列長度為705 bp。
通常認為DNA 序列在1000 bp 以內(nèi)的基因,測序公司提供的seq 格式文件的堿基序列是較為準(zhǔn)確的,可以直接用于DNA 分析。seq 文件小占用內(nèi)存少,進行序列拼接時拼接過程相對簡單,缺失堿基可以利用另一條鏈的堿基自行填補,可快速輸出拼接序列,但拼接時遇到?jīng)_突堿基,無法確定哪一個堿基是正確的,導(dǎo)致輸出序列中含有非堿基字母。abl 文件較大占用內(nèi)存多,拼接過程相對復(fù)雜,但拼接結(jié)果準(zhǔn)確可靠,通過觀察不同堿基位的圖譜波峰,確定正確堿基,個別情況下軟件拼接錯誤的堿基也可通過觀察波峰來確定。
作者在指導(dǎo)學(xué)生過程中發(fā)現(xiàn)基因拼接是一個很基本的DNA 技術(shù),但學(xué)生實際掌握情況并不好,這一實驗把DNA 技術(shù)的實驗理論結(jié)合地方實際問題,以當(dāng)?shù)睾οx云斑白條天牛的COI 基因為實驗對象,結(jié)合自身科研過程和開發(fā)適合學(xué)生實驗項目對鍛煉學(xué)生解決實際問題能力,提高大學(xué)生的學(xué)習(xí)興趣有很大幫助。該實驗也可與其他實驗如DNA 提取、PCR 擴增、基因比對等內(nèi)容結(jié)合而組成一個研究性實驗,若適當(dāng)增加研究內(nèi)容或改變實驗對象,也可用作學(xué)生畢業(yè)論文題目。因此,該實驗設(shè)計以DNA 拼接方法這一實驗技術(shù)為出發(fā)點,以點帶面,提升學(xué)生綜合運用知識能力、邏輯思維能力和創(chuàng)新能力均有重要作用。