• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      小黑楊基因組的初步組裝及SSR信息分析

      2019-02-14 09:11:18周玉敏李開隆由香玲
      植物研究 2019年1期
      關鍵詞:基序堿基核苷酸

      周玉敏 王 遂 劉 軼 李開隆 由香玲*

      (1.湖北生態(tài)工程職業(yè)技術學院,武漢 430200; 2.東北林業(yè)大學林木遺傳育種國家重點實驗室,哈爾濱 150040)

      小黑楊(Populussimonii×P.nigra)是中國林業(yè)科學院林業(yè)研究所黃東森等人于1960年以取自北京地區(qū)的小葉楊(PopulussimoniiCarr)為母本,取自前蘇聯(lián)巴什基爾共和國首都烏法的花枝的歐洲黑楊(P.nigraL.)為父本,人工雜交培育的新品種。小黑楊喜光,喜冷濕氣候,常生長于土壤肥沃、排水良好的沙質土壤上,在我國黃河以北各省區(qū)均有分布;其生長速度快,樹干通直圓滿,樹高可達20 m;同時,其適應能力較強,對低溫、干旱、鹽堿,營養(yǎng)虧缺等逆境均有一定程度的抗性。小黑楊木材材質優(yōu)良,均勻細致、色白、心材不明顯,適做造紙、纖維等工業(yè)原料,又可供建筑、家具及農(nóng)業(yè)使用,是我國北方地區(qū)重要的經(jīng)濟綠化樹種[1~2]。

      由于小黑楊的最初來源為集團選擇的兩個集團雜交種子,在雜交的過程中,基因的自由組合與染色體的連鎖交換,使其子代間產(chǎn)生了豐富的基因型與表型。經(jīng)過半個多世紀的引種與推廣,我國不同省份區(qū)域的科研工作者篩選出了多個適合當?shù)亓⒌貤l件的小黑楊品種[3~4]。然而,隨著種植區(qū)域的擴大,許多地區(qū)對引進的小黑楊品種信息缺失;有的地區(qū)并未進行引種試驗而將其他區(qū)域的所謂優(yōu)樹直接引入;同時,已有的小黑楊良種經(jīng)過半個多世紀種植,品質與抗性均有所下降。近年來,小黑楊的新增種植面積逐年減少,市場占有率持續(xù)下降。因此,重新對已有小黑楊品種進行劃分,將品種與表型等性狀相關聯(lián),建立小黑楊品種數(shù)據(jù)庫,具有重要的現(xiàn)實意義。

      簡單重復序列(Simple Sequence Repeats,SSR)標記是近年來被廣泛使用的一種以微衛(wèi)星序列多態(tài)性為基礎的分子標記技術,人們利用SSR兩端序列的高度保守性,設計特異引物,通過PCR將其擴增出來進而利用電泳區(qū)分不同個體序列長度的差異,具有高度重復性、豐富的多態(tài)性、共顯性、高度可靠性等優(yōu)點。在林木的生產(chǎn)實踐中,良種的選育是育種工作者主要追求的目標,常規(guī)的良種選育方法主要針對表型進行選育,其結果周期長,穩(wěn)定性差,易受環(huán)境影響;而利用分子標記將表型選擇轉換為基因型選擇,做到有的放矢,可以極大地縮短育種周期[5]。但由于林木基因組信息相對匱乏,準確可靠標記的獲得并不容易。目前,SSR分子標記技術已廣泛用于楊樹品種鑒定及遺傳多樣性分析[6~8]。黃烈健等人在132對SSR引物中篩選出了多對與楊樹木材密度,纖維長、寬,纖維絲角等相關聯(lián)的SSR標記,為標記輔助育種奠定了基礎[9];梁海永等人利用10對SSR引物,將10個楊樹品種分為3大類[8];張新葉等人基于EST序列,設計了48對全新的SSR引物以區(qū)分楊樹品種[10];宋躍朋等人利用16個楊樹無性系比較了10對Genomic-SSR引物和10對EST-SSR引物的遺傳差異[11]。從技術的角度講,早期楊樹的SSR鑒定分析多使用通用引物,特異性較差,而隨著二代測序技術的普及和三代測序價格的下降,生物體基因組測序拼接的成本顯著降低,通過全基因組測序,人們可以較為精準地了解物種的基因組序列信息,這在很大程度上推動了SSR的快速發(fā)展[12]。

      為了對小黑楊進行SSR序列識別和信息分析,本研究將首先利用二代測序技術對小黑楊基因組進行denovo測序,獲得小黑楊基因組組裝的初步結果,進而分析SSR序列信息,為今后利用SSR標記進行小黑楊品種劃分、表型性狀關聯(lián)等奠定基礎。由于小黑楊是由青楊派的小葉楊和黑楊派的小黑楊雜交而來,其基因組含有兩種楊樹派系的遺傳信息,因而得到的SSR序列信息也可以用來進行青楊派和黑楊派楊樹的遺傳分析。同時,拼接得到的小黑楊基因組信息,也為今后小黑楊的研究提供了參考。

      1 材料與方法

      1.1 樣品取材與基因組DNA提取

      于2017年6月25日在黑龍江省哈爾濱市東北林業(yè)大學校園內選擇一株長勢良好、無病蟲害的小黑楊,取其成熟葉片若干,存于液氮中備用。參考BioTeke新型快速植物基因組DNA提取試劑盒(BioTeke,DP3111)說明書進行小黑楊基因組DNA提取操作。將得到的gDNA送華大基因科技服務有限公司(武漢,中國),構建insert size約為250 bp的小片段文庫,基于Illumina HiSeq X Ten平臺,進行PE151測序。

      1.2 數(shù)據(jù)質控

      利用FastQC(v0.11.5)軟件,對公司返回的去除了接頭和引物序列的raw data進行測序質量統(tǒng)計。根據(jù)得到的結果,通過NGSQCtoolkit(v2.3.3)套件對原始數(shù)據(jù)進行過濾,同時使用FastUniq(v1.1)去除PCR重復[13],最終得到符合拼接要求的clean data。

      1.3 基因組序列拼接

      使用Edena(v3.131028)對小黑楊基因組進行初步組裝,設定組裝得到的contig長度不小于500 bp,同時對得到的contig序列進行統(tǒng)計[14]。選取長度不小于2 000 bp的contig與NCBI的Nt庫(更新于2017年9月17日)進行Blastn比對,其中max_target_seqs設定為20,evalue為1e-5,相似性閾值設定為不小于60%,對比對到的物種進行統(tǒng)計分析。

      1.4 SSR序列識別與分析

      將Edena組裝得到的小黑楊基因組進行過濾,保留長度大于等于2 000 bp的contig,用cd-hit去除冗余,再利用MIcroSAtellite identification tool(MISA)軟件進行SSR序列的識別和統(tǒng)計。對SSR的限制條件設定為1個堿基重復不小于10次;2個堿基重復不小于6次;3個堿基重復不小于5次;4個堿基重復不小于5次;5個堿基重復不小于5次;6個堿基重復不小于5次。同時,兩個微衛(wèi)星之間距離小于100 bp時,2個微衛(wèi)星組成1個復合微衛(wèi)星。

      1.5 計算資源

      本研究計算平臺為東北林業(yè)大學高性能計算機集群。

      2 結果與分析

      2.1 數(shù)據(jù)質控

      FastQC對raw data的統(tǒng)計結果顯示,華大基因實際交付的去除接頭和引物的raw data信息采集大小為42.49 Gbp,reads長度150 bp,GC含量為40%,堿基整體質量較好,達到了合同要求。reads單堿基質量分布盒形圖結果顯示,reads前幾個堿基質量較差,這可能是測序引物剛剛與reads結合,測序不穩(wěn)定的結果;而reads后幾個堿基質量也下降較快,這主要是隨著reads的延伸,酶效率的下降,造成復制錯誤累積而造成的。而每個位點的堿基含量統(tǒng)計結果也顯示,前幾個堿基A與T,G與C含量并不相等,說明reads前幾個堿基準確性較低。因此,在數(shù)據(jù)過濾時,我們截去了reads 5′端10個堿基和3′端5個堿基,進而以4個堿基為窗口,從5′端向3′端滑動,當平均質量小于15時,將其切除。由于在小黑楊DNA文庫構建的過程中經(jīng)過了PCR來提升DNA濃度,測序結果中會含有PCR重復,這對基因組的拼接并沒有幫助,因此使用FastUniq將重復去掉。最終,我們得到了29.64 Gbp的clean data,reads長度135 bp,GC含量依然為40%。

      2.2 基因組組裝

      前期的流式細胞儀檢測和k-mer分析均顯示,小黑楊基因組與毛果楊(Populustrichocarpa)相近,約為418 Mbp。即使是過濾后的clean data其測序深度也達到了70x,遠高于一般的簡化基因組和重測序,使其拼接結果可信度更高。根據(jù)小黑楊基因組小于500 Mbp,用于拼接的reads質量較好,且拼接結果主要用于SSR等分析的特點,因此選用Edena進行組裝。Edena是一款基于overlaps-graph-based的denovo組裝軟件,其使用簡便,運行速度快,無需輸入插入片段長度和k-mer等參數(shù),避免了對不同k-mer值的循環(huán)嘗試,特別適合小基因組的初步組裝。由于本研究主要是為SSR分析,且僅構建了一個小片段文庫,因此在組裝基因組時,直接將小于500 bp的contig忽略。經(jīng)過拼接,最終得到了366 876條contig,總計大小為368.96 Mbp,其中最長的contig為49.87 Kbp,平均contig為1.01 Kbp,N50為1.05 Kbp,GC含量為37.09%。

      為了檢測gDNA提取時是否混有細菌等污染,同時對拼接結果進行初步分析,我們將contig長度不小于2 000 bp的22 634條序列與最新的Nt數(shù)據(jù)庫進行比對。對所有的query物種注釋信息進行統(tǒng)計。結果顯示,比對注釋到的物種共有240個,總計17 804次。其中注釋得到最多的是毛果楊,共有12 010次成功比對,其次是胡楊(Populuseuphratica),有3 038次成功比對,而比對數(shù)最多的前10個物種的總注釋數(shù)占全部注釋物種次數(shù)的92.08%(表1)。從注釋的結果看,小黑楊基因組與毛果楊高度相似,其次是胡楊,與其為黑楊派與青楊派的雜交種起源相符。

      表1小黑楊基因組比對注釋統(tǒng)計

      Table1GenomealignmentsandannotationsstatisticsofPopulussimonii×P.nigra

      物種名稱Species name注釋次數(shù)Number of annotations毛果楊Populus trichocarpa12010胡楊Populus euphratica3038葡萄Vitis vinifera387毛白楊Populus tomentosa202美洲黑楊Populus deltoides168核桃Juglans regia156巴西橡膠樹Hevea brasiliensis136大葉鉆天楊Populus balsamifera111蓖麻Ricinus communis96桃Prunus persica90

      2.3 SSR序列的識別分析

      由于小黑楊為青楊派與黑楊派的雜交種,因此具有較高的雜合度。這有可能導致在基因組組裝的過程中,有的姐妹染色單體不能合并,造成組裝結果偏大,序列可能存在冗余。同時,長度較短的contig可能是重復區(qū)域,且在引物設計上存在困難。因此,在進行SSR識別之前,最好先進行序列過濾,對非冗余的序列進行分析。利用cd-hit對長度不小于2 000 bp的contigs合并,得到21 788條非冗余contig,再利用MISA進行識別分析。結果顯示,在10 969條含有SSR的contig中,共識別得到18 111條SSR。其中SSR數(shù)量較多的基序類型是一、二、三核苷酸重復,數(shù)量分別是13 207,2 960,1 644,依次占總SSR數(shù)目的72.92%,16.34%,9.08%。而五、六核苷酸重復類型所占比例較少,僅有53條和44條,分別占SSR總數(shù)的0.29%和0.24%(表2)。

      表2小黑楊SSR序列信息

      Table2InformationofSSRsequencesinPopulussimonii×P.nigra

      SSR類型SSR type數(shù)量Number百分比Percentage(%)重復基序種類數(shù)Motif type number單核苷酸Mononucleotide1320772.924二核苷酸Dinucleotide296016.3412三核苷酸Trinucleotide16449.0857四核苷酸Tetranucleotide2031.1267五核苷酸Pentanucleotide530.2940六核苷酸Hexanucleotide440.2444

      從得到的結果看,不同核苷酸基序種類及重復次數(shù)差異較大。在考慮到堿基互補配對原則的情況下,單核苷酸基序主要為A/T重復,且重復次數(shù)多為10~13次,而C/G基序出現(xiàn)頻率較低;二核苷酸基序重復次數(shù)最多的是AG/CT,重復次數(shù)多在6與10之間;三核苷酸基序重復次數(shù)最多的為AAT/ATT,多數(shù)重復5~7次;四核苷酸重復次數(shù)最多的為AAAT/ATTT,其重復5次的共有68條;五、六核苷酸基序重復次數(shù)最多的分別是AAAAG/CTTTT與AAAAAT/ATTTTT。同時,根據(jù)SSR位點信息,利用Primer3批量設計了12 838對引物,供實驗使用。由于篇幅原因,拼接組裝得到的基因組文件,過濾后的去冗余contig序列文件及SSR位點詳細信息與其統(tǒng)計文件及引物相關文件,均保存在http://www.wangsui.net.cn/resource/database/public/plant/Populus/xiaohei/survey/SSR/目錄下,供下載。

      3 討論

      以SSR為分子標記進行品種鑒定和多樣性分析已經(jīng)有二十余年的歷史了,早期人們多使用通用引物在不同品種甚至不同物種中進行鑒定,引物特異性較差,常常合成的大多數(shù)引物不能很好地擴增目的序列;隨著技術的進步,人們可以對一些片段的兩端序列進行測定,EST-SSR開始興起,但其序列信息也僅局限于cDNA兩端的短片段;近年來,測序技術的突飛猛進,使得通過全基因組測序而獲得大片段的物種基因組序列,進而根據(jù)序列信息篩選SSR成為可能。從本研究的結果來看,構建價格極低的小片段文庫進行全基因組測序,拼接得到準確度較高的contig,再分析SSR信息,不僅可以得到更多的信息,準確性也大大提高。本研究提供的序列過濾,拼接,SSR識別及引物設計構成了一個較為完整的pipeline,使用方便,對計算資源的要求也不高,適合有條件的實驗室依據(jù)自身平臺在更多的物種上展開分析。

      楊樹是在全球廣泛分布的重要經(jīng)濟樹種,更作為木本模式植物,于2006年率先完成了全基因組測序[15]。楊樹相關的研究因此得到了快速發(fā)展。然而,由于楊樹派系眾多,不同派系,不同品種的楊樹之間基因組差異巨大,僅依據(jù)毛果楊(Populustrichocarpa)基因組序列進行分析,可能會存在一定偏差。本研究通過二代測序技術,對小黑楊基因組進行了初步組裝,利用去冗余的contig序列進行SSR分析,設計引物并將全部信息公布在實驗室網(wǎng)站。為今后小黑楊的品種劃分、表型性狀關聯(lián)及基因組相關研究奠定基礎,同時也為青楊或黑楊派楊樹的遺傳分析提供了一定的參考。

      猜你喜歡
      基序堿基核苷酸
      EPIYA 基序與幽門螺桿菌感染相關胃病關系的研究進展
      新醫(yī)學(2023年10期)2023-12-09 15:04:51
      單核苷酸多態(tài)性與中醫(yī)證候相關性研究進展
      徐長風:核苷酸類似物的副作用
      肝博士(2022年3期)2022-06-30 02:48:28
      帶TRS基序突變的新型冠狀病毒威脅更大
      芥藍Aux/IAA家族基因生物信息學與表達分析
      應用思維進階構建模型 例談培養(yǎng)學生創(chuàng)造性思維
      中國科學家創(chuàng)建出新型糖基化酶堿基編輯器
      Acknowledgment to reviewers—November 2018 to September 2019
      生命“字母表”迎來4名新成員
      科學24小時(2019年5期)2019-06-11 08:39:38
      生命“字母表”迎來4名新成員
      兴城市| 西青区| 利川市| 新巴尔虎右旗| 米易县| 阿克陶县| 怀来县| 宽甸| 内江市| 阳新县| 康马县| 乌拉特中旗| 佳木斯市| 西乌珠穆沁旗| 常宁市| 霍邱县| 台中县| 曲水县| 江西省| 开封市| 宁明县| 汝南县| 裕民县| 台南市| 舟曲县| 铜梁县| 台南县| 定南县| 定襄县| 建水县| 白水县| 潞城市| 贺州市| 咸宁市| 怀安县| 西贡区| 吴堡县| 中宁县| 苍梧县| 昭苏县| 永顺县|