金巧 劉霞 甘志凱
(南昌理工學(xué)院新能源與環(huán)境工程學(xué)院,南昌 310000)
木通紅喀木虱的寄主植物是木通、白木通等木通科植物,它廣泛分布于我國及、日韓等鄰國[1-5]。木通紅喀木虱不僅危害植物,其攜帶傳播的植物病毒等更是危害嚴(yán)重[6-10]。為保護(hù)木通等藥用植物資源,了解木通紅喀木虱生物學(xué)性質(zhì),尋找其生理生化特性,對其線粒體基因組的研究尤為重要。然而,我國對木虱的研究起步較晚,且進(jìn)展緩慢,遠(yuǎn)落后于許多國家。
本研究基于PCR擴(kuò)增、基因克隆等技術(shù)通過拼接得到木通紅喀木虱線粒體全長,并獲得其結(jié)構(gòu)及堿基含量,蛋白質(zhì)基因及密碼子,核糖體RNA和轉(zhuǎn)運(yùn) RNA基因等情況。利用DNAStar 6.0、Mega 6.0軟件獲得序列的總長、堿基含量、密碼子使用、氨基酸組成等統(tǒng)計分析。通過木虱線粒體基因組序列的研究,能夠了解其在木虱科及同翅目系統(tǒng)發(fā)育中的地位,及其與同翅目其他昆蟲的系統(tǒng)發(fā)育關(guān)系[11-13]。線粒體基因的諸多優(yōu)勢,如保守性高、變異較快、有較快的進(jìn)化速率、母系遺傳及遺傳過程中不發(fā)生重組等[14-18],使得在研究木虱系統(tǒng)發(fā)育與進(jìn)化關(guān)系、親緣關(guān)系、系統(tǒng)地理學(xué)研究和物種鑒定等問題上有重大意義。此外,由于該線粒體基因組序列的測定為物種的鑒定提供重要分子支持,所以在害蟲預(yù)警,預(yù)防生物入侵上均有重大意義。
本研究所用的木通紅喀木虱樣品2017年7-8月采集于江西省九江,現(xiàn)保存在南昌大學(xué)螨類實驗室,-20℃冰箱保藏。
1.2.1 DNA提取、PCR擴(kuò)增與產(chǎn)物純化 挑取3-4齡木通紅喀木虱幼蟲進(jìn)行總DNA提取。方法參照Qiagen DNeasy Tissue Kit說明書提取總DNA。
根據(jù)引物設(shè)計原則,參考mtDNA的通用引物[19-20]和白粉虱Trialeurodes vaporariorum的長片段引物以及其他相關(guān)種類的全線粒體基因組測序的PCR引物[21-22],盡量在保守區(qū)域進(jìn)行引物的設(shè)計,同時考慮引入簡并位點增加引物通用性和引物步移的方法來設(shè)計引物,同時還要考慮各設(shè)計PCR引物要覆蓋線粒體基因組全序列。
首先采用昆蟲線粒體基因(cox1[19]、cox3[23]、cob[19]、rrnS[19]、rrnL[19]和 nad5[23])的 5 對通用引物進(jìn)行PCR擴(kuò)增,得到了木通紅喀木虱線粒體cox1、cox3、nad5、cob、12S rRNA和16S rRNA 6個基因的部分序列。然后再根據(jù)所上述基因測序結(jié)果,設(shè)計出相應(yīng)的特異性引物(表1)。然后根據(jù)上述擴(kuò)增長片段引物用LaTaq DNA聚合酶酶(TaKaLa)擴(kuò)增,得到4個長片段。
Long-PCR反應(yīng)體系及擴(kuò)增程序見表1。對于小于1 kb的擴(kuò)增片段,采用2×Mix Taq DNA聚合酶;而對于擴(kuò)增1 kb以上的大片段,則利用LA Taq DNA聚合酶。PCR產(chǎn)物純化參照上海生工SanProp柱式DNA膠回收試劑盒說明進(jìn)行。
1.2.2 克隆、測序與測序結(jié)果拼接 PCR擴(kuò)增出單一條帶的PCR產(chǎn)物直接測序或進(jìn)行克隆。對于擴(kuò)增出非特異條帶的PCR產(chǎn)物經(jīng)割膠回收試劑盒(上海生工)回收后,首先在Nanovue超微量紫外分光光度計上測定濃度及純度。然后將PCR產(chǎn)物純化,純化后的目的基因連接至pGEM-T Easy載體上,將重組子轉(zhuǎn)化到E.coliDH5α。最后通過藍(lán)白斑篩選法挑取1-2個陽性克隆菌,送至上海生工進(jìn)行雙向測序。
利用DANStar中的SeqMan軟件對已測的木通紅喀木虱mtDNA中的短片段和長片段進(jìn)行拼接和校正。在原始測序峰圖的基礎(chǔ)上對拼接結(jié)果進(jìn)行人工校正,去除空間隔區(qū)和校正錯誤堿基。
1.2.3 線粒體基因組基因注釋與基因組成情況的分析 利用NCBI網(wǎng)站上的ORF軟件(http://www.ncbi.nlm.nih.gov/projects/gorf/)注釋蛋白質(zhì)編碼基因,并通過木虱科的昆蟲全線粒體基因組序列比對方式及MITOS WebServer程序鑒定木通紅喀木虱線粒體基因組tRNA和rRNA。
線粒體基因組注釋完后利用DNAStar 6.0軟件包中的Editseq及Mega 6.0進(jìn)行序列的總長、堿基含量、密碼子使用、氨基酸組成等統(tǒng)計分析。
2.1.1 基因組的結(jié)構(gòu)分析 木通紅喀木虱全線粒體基因組長度為14 832 bp(圖1)(NCBI登錄號為NC_027087.1)。此線粒體基因組總共編碼37個基因,包括13個蛋白質(zhì)編碼基因、22個轉(zhuǎn)運(yùn)RNA基因,2個核糖體RNA基因,其中L鏈編碼14個基因,包括4個蛋白質(zhì)基因:nad1、nad4、nad4L、nad5;8個轉(zhuǎn)運(yùn)RNA基因:trnF、trnH、trnP、trnL1、trnV、trnQ、trnC、trnY;2個核糖體RNA基因:rrnL(16S核糖體RNA基因)和rrnS(12S核糖體RNA基因)。剩余的23個基因則由H鏈編碼,這些蛋白質(zhì)編碼基因、轉(zhuǎn)運(yùn)RNA基因和核糖體RNA基因的位置以及結(jié)構(gòu)都很保守。
2.1.2 堿基組成特點 如表2所示,木通紅喀木虱全線粒體基因組的A+T含量為72.04%。蛋白質(zhì)編碼基因的A+T含量略有降低為70.50%,tRNA基因A+T含量為74.69%,rRNA基因的A+T含量最高為77.06%。同時,還可得到G、C堿基含量偏斜度遠(yuǎn)高于A、T堿基的結(jié)果,AT-skew值為0.059且GC-skew值為-0.284,其中T堿基含量高于A堿基含量,C堿基含量高于G堿基含量。
2.1.3 蛋白質(zhì)編碼基因及密碼子使用情況 由表3看出蛋白質(zhì)編碼基因密碼子3個位置的堿基組成情況。3個位置的A+T含量均遠(yuǎn)高于G+C含量,且密碼子第3位的A+T含量最高,AT-skew絕對值為0.155,而GC-skew絕對值僅為0.083。
圖1 木通紅喀木虱線粒體基因組結(jié)構(gòu)圖示
使用Mega 6.0軟件分析木通紅喀木虱13個蛋白質(zhì)編碼基因的相對同義密碼子使用頻率(Relative synonymous codon usage,RSCU)。對于有兩個同義密碼子的氨基酸,第3位點為A和U的密碼子使用頻率較高;對于有4個同義密碼子的氨基酸來說,H鏈編碼基因偏向于使用第3位點為A的密碼子,而L鏈偏向于使用第3位點為U的密碼子(表3)。
表2 木通紅喀木虱線粒體基因組堿基組成
分析密碼子使用情況可知,木通紅喀木虱線粒體中有6種密碼子的使用率很高,由高到低依次為UUU(F)、UUA(L)、AUU(I)、UCU(S2)、UAU(Y)和AAU(N)。分析氨基酸組成發(fā)現(xiàn),Leu氨基酸編碼量最高為15.63%;其次Ser、Ile和Phe分別為10.83%、10.08%和9.89%。而Cys最低僅為1.03%(表4)。
2.1.4 核糖體RNA(rRNA)基因 木通紅喀木虱線粒體基因組上的兩個核糖體RNA基因(rrnL和rrnS)長度分別為1 153 bp和806 bp,兩者分別位于trnL和trnV,trnV和CR之間,即trnV將兩個rRNA間隔開(圖2)。分析堿基組成可得rRNA基因A+T含量為77.06%,A+T含量偏向性明顯,且AT-skew值為0.075,GC-skew值為-0.339。
2.1.5 轉(zhuǎn)運(yùn) RNA(tRNA)基因 木通紅喀木虱線粒體基因組上的22個tRNA基因總長為1 393 bp,其中最長72 bp,而最短54 bp,僅有一個trnS1不能形成三葉草結(jié)構(gòu)。多數(shù)tRNA形成典型的三葉草結(jié)構(gòu),非典型三葉草結(jié)構(gòu)的tRNA情況各異(圖3)。
其 中 trnA、trnD、trnQ、trnS2、trnT、trnV的TΨC臂上存在嚴(yán)重錯配堿基;trnA、trnE、trnF、trnE1氨基酸接受臂上各有一處嚴(yán)重錯配;trnD、trnG、trnT的TΨC臂缺失;trnL1、trnS2、trnW的TΨC環(huán)缺失。D環(huán)和TΨC環(huán)為3-11 bp,除trnD、trnE反密碼子環(huán)為11 bp外,其他反密碼子環(huán)均為9 bp。反義密碼子臂含4-5對堿基,而TΨC臂、D臂含2-4對堿基。木通紅喀木虱線粒體基因組的22個tRNA上共有37處堿基錯配。其中氨基酸接受臂上有14處錯配,D臂上有9處錯配,TΨC臂上有8處錯配,反密碼子臂上有6處。
將木通紅喀木虱線粒體基因組的基因間隔區(qū)和重疊區(qū)與木虱科的其他兩種木虱進(jìn)行比較(表5)。木通紅喀木虱線粒體基因組的間隔區(qū)最短為106 bp;脈斑銀木虱線粒體基因組的間隔區(qū)最長為164 bp。而脈斑銀木虱線粒體基因組的重疊區(qū)最短為45 bp;枸杞木虱線粒體基因組的重疊區(qū)最長為143 bp。
3種木虱線粒體基因組的堿基組成基本一致,木通紅喀木虱與枸杞木虱線粒體全基因的AT含量極接近均為70%左右,而脈斑銀木虱線粒體全基因的AT含量較多為73.78(表6)。3種木虱均有顯著的AT偏向。就線粒體基因而言,木通紅喀木虱的AT-Skew值為-0.31,GC-Skew值為0.18;枸杞木虱的AT-Skew值為-0.28,GC-Skew值為0.12;脈斑銀木虱的AT-Skew值為-0.30,GC-Skew值為0.10。
表3 木通紅喀木虱線粒體基因組蛋白質(zhì)編碼基因的密碼子及密碼子使用情況
表4 木通紅喀木虱線粒體基因組13個蛋白質(zhì)編碼基因編碼的氨基酸組成分析
由表6可知3種木虱線粒體基因組中非編碼區(qū)均位于rrnS和trnI之間,木通紅喀木虱、枸杞木虱和脈斑銀木虱非編碼區(qū)的長度分別為671 bp、744 bp和596 bp。
圖2 通紅喀木虱線粒體基因組rRNA基因
2.5.1 蛋白編碼基因的堿基組成 木通紅喀木虱、枸杞木虱和脈斑銀木虱3種木虱線粒體基因組中,蛋白質(zhì)編碼基因密碼子第1、2和3位點在J-鏈和N-鏈上所使用堿基的情況如圖4。
2.5.2 蛋白質(zhì)編碼基因推導(dǎo)的氨基酸組成分析 如表7,三種木虱線粒體基因組中蛋白質(zhì)氨基酸含量較高的前6位由高到低大致為亮氨酸(Leu)、絲氨酸(Ser)、異亮氨酸(Ile)、苯丙氨酸(Phe)、甲硫氨酸(Met)和纈氨酸(Val)此6種疏水性氨基酸。通過計算得出,在木通紅喀木虱食木虱、枸杞木虱和脈斑銀木虱中6種疏水氨基酸的含量之和分別達(dá)到59.14%、59.03%和58.95%。
2.5.3 蛋白質(zhì)編碼基因置換 由圖5可知,13個蛋白編碼基因之間的ω值差異顯著。
圖3 通紅喀木虱線粒體基因組rRNA基因
木通紅喀木虱線粒體基因組共有14處重疊,總長度為100 bp,最大的重疊區(qū)域位于nad4和nad4L之間,長度為49 bp,最小的重疊區(qū)域有4處,均為1 bp。而基因間隔區(qū)數(shù)量為11處,總長度為106 bp,最大的間隔僅為28 bp,最小的間隔為1 bp。木通紅喀木虱全線粒體基因組的堿基偏向性十分明顯,其中堿基A的含量最高為38.16%,堿基T、C、G的含量分別為33.88%、17.95%和10.01%。蛋白質(zhì)編碼基因整體的A+T含量高于G+C含量。這一結(jié)果符合昆蟲線粒體基因組的堿基組成上的A-T偏向性。蛋白編碼基因的G、C堿基含量偏斜度低于A、T堿基,這與線粒體基因組整體的分析結(jié)果相反,蛋白質(zhì)編碼基因中堿基A與堿基T的含量上差值大于堿基G和堿基C含量差值。
表5 三種木虱線粒體基因組的基因重疊區(qū)和間隔區(qū)比較
表6 三種木虱線粒體基因組的堿基組成分析
表7 三種木虱線粒體基因組蛋白質(zhì)編碼基因編碼的氨基酸組成
木通紅喀木虱的蛋白質(zhì)編碼基因以典型的ATN作為起始密碼子。ATA是最為常用的起始密碼子,cox2、ATP8、cox3、nad3、nad4L、nad6、cob 和nad1這8種蛋白編碼基因使用ATA作為起始密碼子。而以ATT作為起始密碼子的有2個nad5和nad2,其余3個CoxI、ATP6和nad4使用ATA為起始密碼子。13個蛋白質(zhì)基因中僅有2個基因未在基因3'端找到完全的終止密碼子。cox1、ATP8、ATP6、cox3、nad6、nad2此6個基因的終止密碼子為TAA。其余 5個基因 nad3、nad4、nad4L、Cob和 nad1以TAG為終止密碼子。2個基因CoxII和nad5沒有找到完整的終止密碼子,以T作為終止密碼子。而造成這種原因可能是該位置與其后的tRNA基因重疊,公用了幾個堿基。除這2個不完整地終止密碼子外,木通紅喀木虱的蛋白質(zhì)編碼基因共使用了3 530個密碼子。
圖5 三種木虱線粒體基因組中蛋白質(zhì)編碼基因的序列分化比較
三種木虱線粒體基因組的堿基組成基本一致,三者的AT偏斜均大于CG偏斜,且偏斜明顯。三種木虱的蛋白編碼基因密碼子第3位點的AT含量均明顯高于其他2個位點。
木通紅喀木虱、枸杞木虱和脈斑銀木虱三種木虱線粒體基因組中,分析可知三種木虱線粒體基因組上堿基組成基本相似,其中J-鏈上各堿基含量與N-鏈的各堿基含量大致相同。且除枸杞木虱N-鏈上第2位密碼子和脈斑銀木虱N-鏈上第3位密碼子外,其余所有密碼子位點的T含量均高于其它3種堿基的含量。三種木虱N鏈和J鏈上所有的密碼子位點的AT含量均高于GC含量。
根據(jù)3種木虱線粒體基因組中蛋白質(zhì)編碼基因的序列所推導(dǎo)得出的氨基酸組成情況可知其含量大致相同,且疏水氨基酸的大量出現(xiàn),符合線粒體基因編碼的蛋白質(zhì)多為跨膜蛋白這一特性。由蛋白編碼基因之間的ω值差異顯著表明不同的基因所承受的選擇性壓力不同(若非同義/同義置換率的比率(ω=Ka/Ks)大于1,則說明蛋白質(zhì)編碼基因受到正選擇,若小于1,則說明其受到負(fù)選擇)。三種木虱mtDNA中J鏈上除nd6和cob基因外所有蛋白質(zhì)編碼基因的ω值大于1,表明這些基因在進(jìn)化過程中受到正選擇。N鏈上除nad4L外所有基因的ω值均小于1(nad4L基因的置換速率是其它值的3倍左右),說明N鏈大多基因受到負(fù)選擇作用。
(1)木通紅喀木虱全線粒體基因組長度14 832 bp(NCBI登錄號為 NC_027087.1),A+T含量為72.04%。此線粒體基因組共編碼37個基因,包括13 個蛋白質(zhì)編碼基因、22個轉(zhuǎn)運(yùn)RNA基因,2個核糖體 RNA基因,這些基因的位置以及結(jié)構(gòu)都很保守。
(2)木通紅喀木虱的蛋白質(zhì)編碼基因以典型的ATN作為起始密碼子。ATA是最為常用的起始密碼子,此外還有ATT和ATA作為起始密碼子。6個基因的終止密碼子為TAA。5個基因以TAG為終止密碼子。2個基因沒有找到完整的終止密碼子,以T作為終止密碼子。木通紅喀木虱線粒體中使用率最高的6種密碼子依次為UUU(F)、UUA(L)、AUU(I)、UCU(S2)、UAU(Y) 和 AAU(N)。分析氨基酸組成發(fā)現(xiàn),Leu氨基酸編碼量遠(yuǎn)高于其他,為15.63%。其次Ser、Ile和Phe也很高,分別為10.83%、10.08%和9.89%。而Cys最低,僅為1.03%。
(3)木通紅喀木虱線粒體基因組上的兩個核糖體RNA基因(rrnL和rrnS)長度分別為1 153 bp和806 bp。木通紅喀木虱線粒體基因組上的22個tRNA基因僅有一個trnS1不能形成三葉草結(jié)構(gòu)。
(4)木虱科3種木虱枸杞木虱、木通紅喀木虱、脈斑銀木虱,37個基因以及非編碼區(qū)的排列順序完全相同,且三種木虱線粒體基因組的堿基組成基本一致,同時氨基酸的組成情況及含量也大致相同。