李敏敏,趙 岑,趙翠敏,張?zhí)m迎
(聊城市農(nóng)業(yè)科學(xué)院,山東 聊城 252000)
靈芝(Ganoderma spp.) 在中國不僅被寓為吉祥物,更極具藥用價(jià)值,其中赤芝(Ganoderma lucidum) 和紫芝(Ganoderma sinense) 已經(jīng)被納入《中華人民共和國藥典》[1]。靈芝基因組由13 條染色體組成,編碼約一萬多個與次生代謝產(chǎn)物合成、運(yùn)輸、調(diào)控等生物途徑相關(guān)的基因[2]。與酵母等低等真菌相比,靈芝具有更復(fù)雜的有性生殖世代和更明顯的形態(tài)建成與分化;與高等藥用植物相比,其基因組更小、世代周期更短[3]。因此,靈芝是研究真菌次生代謝的理想模式物種[3]。
不同同義密碼子的使用頻率在蛋白質(zhì)翻譯過程中有所不同,這是因?yàn)檎婢鷮γ艽a子具有使用偏好性,導(dǎo)致在不同物種以及同一物種中通常傾向于使用一種或幾種特定的同義密碼子,而密碼子的使用偏好往往在物種之間有所不同,甚至在同一物種的不同基因之間也有所不同[4]。通過分析尋找和發(fā)現(xiàn)不同物種的密碼子使用偏好特征,對于研究物種分子進(jìn)化規(guī)律和異源基因序列優(yōu)化具有重要意義。密碼子偏好性分析主要基于全基因組數(shù)據(jù)。隨著高通量測序技術(shù)的不斷進(jìn)步[5-6],目前NCBI 等數(shù)據(jù)庫中已積累了靈芝科(Ganodermataceae) 不同種的全基因組測序數(shù)據(jù),這為基因組結(jié)構(gòu)及密碼子偏好性分析提供了極大的方便。
赤芝(GCA_019426095.1)、紫芝(GCA_002760 635.1)、松杉靈芝(Ganoderma tsugae GCA_003057 275.1)、重傘靈芝(Ganoderma multipileum GCA_000 338015.1)、狹長孢靈芝(Ganoderma boninense GCA_002900995.2)、Ganoderma sp. BRIUMSc(GCA_00869 4245.1)、白肉靈芝(Ganoderma leucocontextum GCA_020736865.1)、南方靈芝(Ganoderma australe GCA_003697905.1) 等8 個靈芝科真菌的全基因組數(shù)據(jù)來源于NCBI 數(shù)據(jù)庫。
1.2.1 靈芝科真菌全基因組簡單重復(fù)序列(Simple sequence repeat,SSR) 分析
采用MISA 軟件分析8 個靈芝科真菌基因組中,二至六堿基核苷酸重復(fù)SSR 位點(diǎn)的分布頻率和重復(fù)基元的基本類型。本試驗(yàn)分別將10 個單堿基重復(fù)、6 個二堿基重復(fù)、5 個三堿基重復(fù)、5 個四堿基重復(fù)、5 個五堿基重復(fù)、5 個六堿基重復(fù)定義為微衛(wèi)星序列。用Primer 3.0 軟件對篩選出的SSR 位點(diǎn)批量設(shè)計(jì)引物。引物設(shè)計(jì)時參數(shù)設(shè)置為:GC 含量40%~60%,且最后3 個堿基不是連續(xù)的G 或C;退火溫度(55±5) ℃;目標(biāo)片段長80~150 bp,引物長18~22 bp。隨機(jī)選擇不同真菌基因組中二堿基重復(fù)10次及以上,或三堿基重復(fù)6 次及以上的SSR motif,利用Primer-BLAST 比對檢測引物特異性。
1.2.2 靈芝科真菌同義密碼子使用偏好性分析
通過ORFs 腳本篩選密碼子數(shù)大于等于100(即編碼序列長度大于等于300 bp) 的蛋白質(zhì)編碼序列CDS(coding sequence,CDS)[7]。使用CodonW 1.4.2 軟件對8 個靈芝科真菌全基因組序列中的CDS蛋白質(zhì)編碼基因序列進(jìn)行分析。分析參數(shù)包括有效密碼子數(shù)Nc(effective number of codons,Nc)、GC 含量(鳥嘌呤和胞嘧啶含量)、A3s(第3 位同義密碼子上腺嘌呤的出現(xiàn)頻率)、T3s(第3 位同義密碼子上胸腺嘧啶的出現(xiàn)頻率)、G3s(第3 位同義密碼子上鳥嘌呤的出現(xiàn)頻率)、C3s(第3 位同義密碼子上胞嘧啶的出現(xiàn)頻率)、GC3s(第3 位同義密碼子上鳥嘌呤和胞嘧啶的出現(xiàn)頻率) 和相對同義密碼子使用性RSCU(relative synonymous codon usage,RSCU)。
使用CUSP 程序計(jì)算靈芝科真菌全基因組中密碼子的使用頻率,并從密碼子使用數(shù)據(jù)庫Codon Usage Database[8]下載釀酒酵母(Saccharomyces cerevisiae)、大腸桿菌(Escherichia coli) 和畢赤酵母(Pichia pastoris) 密碼子的使用偏好性數(shù)據(jù),用于選擇8 個靈芝科真菌的最優(yōu)異源表達(dá)載體。
2.1.1 靈芝科真菌全基因組SSR 的分布特點(diǎn)
SSR 簡單重復(fù)序列是較常用的遺傳標(biāo)記之一,在基因功能和基因組組織中發(fā)揮重要作用,試驗(yàn)中8個靈芝科真菌全基因組SSR 的分布特點(diǎn)詳見表1。
表1 靈芝科真菌全基因組SSR 的分布特點(diǎn)Tab.1 Distribution characteristics of genome-wide SSR in Ganodermataceae fungi
由表1 可知,在8 個靈芝科全基因組序列中搜索到的SSR 數(shù)量為1 459~4 629 個,即每隔15.3~31.9 kb 就存在1 個SSR。SSR motif 以單核苷酸(20.0%~45.1%)、二核苷酸(15.2%~24.2%)、三核苷酸(27.9%~47.8%) 重復(fù)為主,其次是四核苷酸、六核苷酸,數(shù)量最少的是五核苷酸SSR。8 個靈芝科真菌基因組的大小從松杉靈芝的45.6 Mb 到南方靈芝的83.4 Mb 不等,同時基因組中所含SSR 的總數(shù)從重傘靈芝的1 459 個到狹長孢靈芝的4 629 個,總體看來基因組中SSR 的數(shù)量與基因組大小無關(guān)。
8 個靈芝科真菌全基因組SSR motif 類型中,出現(xiàn)頻率>5%的SSR 重復(fù)類型詳見圖1。
圖1 靈芝科真菌基因組中高頻率出現(xiàn)的SSR 重復(fù)類型Fig.1 The most frequent SSR types in fungi genome of Ganodermataceae
如圖1 所示,出現(xiàn)頻率較高的SSR 重復(fù)類型以單核苷酸為主,其中C/G 單核苷酸重復(fù)的比例最高,占單核苷酸重復(fù)總數(shù)的63.7%~87.3%,占全部SSR總數(shù)的17.5%~34.0%。在二核苷酸重復(fù)單元中以AG/CT 的數(shù)量最多,占總數(shù)的46.7%~62.6%。三核苷酸SSR 的類型在各靈芝科真菌基因組中的出現(xiàn)頻率有一致性也有特殊性,其中在赤芝中出現(xiàn)頻率最高的是ACG/CGT、CCG/CGG;在紫芝、松杉靈芝、重傘靈芝、狹長孢靈芝、白肉靈芝、南方靈芝中出現(xiàn)頻率最高的是AGG/CCT、ACG/CGT;在Ganoderma sp. BRIUMSc 中出現(xiàn)頻率最高的是ACG/CGT、AGG/CCT。
2.1.2 靈芝科真菌全基因組SSR 引物設(shè)計(jì)
利用軟件進(jìn)行全基因組SSR 引物設(shè)計(jì),結(jié)果詳見表2。
表2 靈芝科真菌全基因組SSR 引物Tab.2 SSR primers corresponding to fungi genome-wide of Ganodermataceae
多核苷酸重復(fù)單元SSR 多態(tài)性高,但同時突變率也較高[9-10]。因此,我們在8 個靈芝科真菌全基因組中,隨機(jī)選擇二堿基重復(fù)次數(shù)10 次以上,或三堿基重復(fù)次數(shù)6 次以上的SSR motif,通過Primer-BLAST 驗(yàn)證引物特異性,結(jié)果表明所有引物都可以成功擴(kuò)增出片段,并具有較好的特異性。
從NCBI 數(shù)據(jù)庫下載8 個靈芝科真菌全基因組數(shù)據(jù),篩選以起始密碼子ATG 開始,以終止密碼子結(jié)束,且CDS 編碼序列長度大于300 bp 的序列。8 個靈芝科真菌基因組CDS 編碼序列的GC 含量為57%~59%,密碼子第3 位堿基的GC 含量為55%~63%。
同義密碼子相對使用度RSCU,是同義密碼子的實(shí)際觀測值與同義密碼子平均使用期望值的比值,可以用于評估同義密碼子的使用偏好性。如果RSCU值為1,表明無密碼子使用偏好性;若RSCU 值大于1,表明該密碼子使用更頻繁,具有使用偏好性[11]。試驗(yàn)運(yùn)用CodonW 軟件分析了8 個靈芝科真菌CDS編碼序列的RSCU 值,結(jié)果詳見圖2。
圖2 靈芝科真菌相對密碼子使用堆積圖Fig.2 Stacked plot of RSCU in fungi of Ganodermataceae
如圖2 所示,除了Ganoderma sp. BRIUMSc 中有偏好性(RSCU>1) 的密碼子為27 個(無GGG),其他7 個靈芝科真菌有偏好性的密碼子均為28 個(TTC、TCC、TCG、TAC、TGC、CTT、CTC、CTG、CCC、CCG、CAC、CAG、CGC、CGG、ATC、ACC、ACG、AAC、AAG、AGC、GTC、GTG、GCC、GCG、GAC、GAG、GGC、GGG)。在Ganoderma sp.BRIUMSc 有偏好性(RSCU>1) 的密碼子中,以G/C 結(jié)尾的有26 個,以A/T 結(jié)尾的有1 個(CTT);在其余7 個靈芝科真菌有偏好性的密碼子中,以G/C 結(jié)尾的有27 個,以A/T 結(jié)尾的有1 個(CTT)。由此表明,靈芝科真菌蛋白編碼基因偏愛以G 或C 結(jié)尾的密碼子。在Ganoderma sp. BRIUMSc 的64 個同義密碼子(32 個GC3s 密碼子和32 個UA3s 密碼子) 中,有26 個GC3s 密碼子的RSCU 值大于1,1 個UA3s 密碼子的RSCU 值大于1;在其他7 個靈芝科真菌中,有27 個GC3s 密碼子的RSCU 值大于1,1 個UA3s密碼子的RSCU 值大于1。由此推斷,核苷酸組成及其在第3 位同義密碼子上的出現(xiàn)頻率可能是影響密碼子偏好程度的因素之一。
2 個物種的密碼子使用頻率比值如果為0.5~2.0,說明密碼子的偏好性較類似,反之則說明密碼子的偏好性相差較大[12]。通過計(jì)算8 個靈芝科真菌與釀酒酵母、大腸桿菌、畢赤酵母表達(dá)宿主的密碼子使用頻率比值,發(fā)現(xiàn)8 個靈芝科真菌中分別有41、41 和35 個密碼子與3 個表達(dá)宿主的密碼使用頻率比值介于0.5~2.0,表明8 個靈芝科真菌基因密碼子使用模式更接近于釀酒酵母和大腸桿菌。
SSR 分子標(biāo)記可以解釋基因組擴(kuò)張現(xiàn)象,影響數(shù)量遺傳性狀的表達(dá),在食用菌育種實(shí)踐等領(lǐng)域具有重要的研究意義[13-16]。對于不同的真菌基因組,MURAT[17]和LI[18]等人在各自的研究中將SSR 定義為10 個重復(fù)的單核苷酸,6 個重復(fù)的二核苷酸和5 個重復(fù)的3~6 個核苷酸。因此,本試驗(yàn)也同樣采用上述標(biāo)準(zhǔn)進(jìn)行SSR 位點(diǎn)的搜索。結(jié)果顯示,赤芝、紫芝、松杉靈芝、重傘靈芝、狹長孢靈芝、Ganoderma sp. BRIUMSc、白肉靈芝、南方靈芝基因組中,分別含有3 075、1 652、2 478、1 459、4 629、2 220、2 148、3 502 個SSR 位點(diǎn),SSR 位點(diǎn)數(shù)量與基因組大小無線性關(guān)系,說明SSR 在不同靈芝真菌基因組中的進(jìn)化存在差異。
從SSR 總數(shù)量和密度來看,靈芝科真菌基因組的SSR 位點(diǎn)具有數(shù)量不一、密度不同的特點(diǎn)。紫芝和重傘靈芝的SSR 位點(diǎn)密度分別為34 個/Mb、31個/Mb,與金針菇(Flammulina velutipes)(36 個/Mb)和裂褶菌(Schizophyllum commune)(31 個/Mb) 的SSR 位點(diǎn)密度相當(dāng);Ganoderma sp. BRIUMSc、白肉靈芝、南方靈芝的SSR 位點(diǎn)密度分別為42 個/Mb、44 個/Mb、42 個/Mb,與糙皮側(cè)耳(Pleurotus ostreatus)(38 個/Mb) 密度相當(dāng);松杉靈芝和狹長孢靈芝的SSR 位點(diǎn)密度分別為54 個/Mb、59 個/Mb,與美味牛肝菌(Boletus edulis)(59 個/Mb) 和灰蓋鬼傘(Coprinopsis cinerea)(56 個/Mb) 的SSR 位點(diǎn)密度相當(dāng);赤芝的SSR 位點(diǎn)密度在靈芝科中最高,為65個/Mb,但均低于雙孢蘑菇(Agaricus bisporus)(104 個/Mb)[19-20]。
赤芝、紫芝、松杉靈芝、重傘靈芝、狹長孢靈芝、Ganoderma sp.BRIUMSc、白肉靈芝、南方靈芝等8 個靈芝科真菌全基因組的SSR motif 類型,以單堿基重復(fù)和二、三堿基重復(fù)為主,與美味牛肝菌類似[20]。短重復(fù)單元(單核苷酸至三核苷酸) 的數(shù)量多于長重復(fù)單元,支持了長重復(fù)單元的SSR 具有更高變異性的觀點(diǎn)。
8 個靈芝科真菌全基因組中,C/G 單核苷酸重復(fù)的比例均最高,與黃孢原毛平革菌(Phanerochaete chrysosporium) 和裂褶菌(Schizophyllum commune)分布特性一致[21]。而灰蓋鬼傘、雙色蠟?zāi)ⅲ↙accaria bicolor)、草菇(Volvariella volvacea)[22]、美味牛肝菌[20]則以A/T 單核苷酸重復(fù)類型為主。8 個靈芝科真菌全基因組二堿基重復(fù)類型中AG/CT 重復(fù)所占比例較大,與美味牛肝菌結(jié)果一致[20],不同于草菇二堿基重復(fù)類型以AT/AT 為主[22]。各靈芝科真菌基因組中的三核苷酸SSR 類型具有一致性和特異性,豐度最高的重復(fù)基元為AGG/CCT、ACG/CGT、CCG/CGG 和AGG/CCT。在8 個靈芝科真菌全基因組中分布最少的SSR motif 類型是五核苷酸SSR,與美味牛肝菌全基因組SSR motif 分布特點(diǎn)類似[20]。
前人研究結(jié)果表明,長SSR 的多態(tài)性要好于短SSR,因此,試驗(yàn)從8 個靈芝科真菌全基因組的所有SSR 位點(diǎn)中隨機(jī)選出二堿基重復(fù)次數(shù)10 次以上,或三堿基重復(fù)次數(shù)6 次以上的SSR 位點(diǎn),設(shè)計(jì)了相應(yīng)的引物,利用Primer-BLAST 進(jìn)行了驗(yàn)證,表明其具有較好的特異性。PCR 產(chǎn)物設(shè)計(jì)為80~150 bp,即能保證擴(kuò)增的豐度,保證擴(kuò)增后有較強(qiáng)的信號,又能避免非特異擴(kuò)增并節(jié)省跑膠時間。
密碼子使用偏好性是物種在遺傳信息傳遞過程中的一個重要特征。不同的生物為了適應(yīng)不同的環(huán)境,不斷完善自身的遺傳編碼特征,使密碼子偏好性存在差異。8 個靈芝科真菌細(xì)胞核編碼基因的平均GC 含量高于香菇(48.66%)、雙孢蘑菇(49.08%)、羊肚菌(Morchella esculenta)(52.2%)、金針菇(52.34%) 等大型真菌,表明與其他食用菌相比靈芝科真菌傾向于使用GC 豐富的密碼子[23-26]。當(dāng)外源基因轉(zhuǎn)移到受體生物體內(nèi)時,由于轉(zhuǎn)移基因的密碼子和宿主基因組的密碼子的使用偏好不同,容易發(fā)生甲基化,導(dǎo)致轉(zhuǎn)基因沉默或轉(zhuǎn)基因表達(dá)降低[27]。因此,在外源基因轉(zhuǎn)移前應(yīng)根據(jù)宿主的密碼子偏好進(jìn)行優(yōu)化和修改。本試驗(yàn)中8 個靈芝科真菌蛋白編碼基因均偏愛使用G/C 結(jié)尾的密碼子,這種偏好可能是由于以G/C 結(jié)尾的密碼子具有較高的結(jié)合能,能確?;驕?zhǔn)確翻譯[28]。其密碼子使用模式與草菇[12]、蛹蟲草(Cordyceps militaris)[29]、藥用真菌豬苓(Polyporus umbellatus)[30]類似。研究表明,在排除自然選擇壓力的影響下,堿基突變壓力主要影響同義密碼子第3 位堿基的組成,當(dāng)G/C 突變成A/T 的壓力更高時,密碼子第3 位堿基G/C含量會大于A/T,反之亦然[31]。由此推測8 個靈芝科真菌在受堿基突變壓力的時候,可能G/C 突變?yōu)锳/T 的壓力更大,導(dǎo)致密碼子以G/C 結(jié)尾的比例更高。
密碼子頻率分析對于研究基因組進(jìn)化、大規(guī)模基因表達(dá)譜、提高外源基因在宿主中的表達(dá)、選擇更合適的宿主系統(tǒng)具有重要意義。試驗(yàn)結(jié)果顯示8個靈芝科真菌的密碼子使用頻率均與釀酒酵母、大腸桿菌差異較小,只需優(yōu)化個別密碼子就可以提高基因異源表達(dá)效率。這為靈芝科真菌同釀酒酵母、大腸桿菌真核表達(dá)系統(tǒng)互為受體,進(jìn)一步開展重要基因異源表達(dá),改良品種特性研究提供依據(jù)。與畢赤酵母的密碼子使用頻率差異相對較大,如果將畢赤酵母的基因在靈芝科真菌中表達(dá),需要對密碼子進(jìn)行充分的優(yōu)化。