吳昊天,李亞琳,王 軍,陳曉雯,陸 穎*,王成輝*
(1水產(chǎn)種質(zhì)資源發(fā)掘與利用教育部重點(diǎn)實(shí)驗(yàn)室(上海海洋大學(xué)),上海 201306;2農(nóng)業(yè)農(nóng)村部淡水水產(chǎn)種質(zhì)資源重點(diǎn)實(shí)驗(yàn)室(上海海洋大學(xué)),上海 201306)
【研究意義】棕鱒(Salmo trutta)屬于鮭形目(Salmoniformes)鮭科(Salmonidae)鮭亞科(Salmononae),原產(chǎn)于歐洲、非洲北部和中亞一些地區(qū)(胡江偉和阿地力,2018)。棕鱒是適應(yīng)高海拔的冷水魚類,其肉質(zhì)鮮美,具有重要的經(jīng)濟(jì)價(jià)值。新疆烏魯木齊達(dá)阪城東溝冷水魚實(shí)驗(yàn)場和西藏亞東縣亞東鮭魚繁育基地是我國目前僅有的2個(gè)棕鱒人工養(yǎng)殖基地(分別簡稱為“新疆棕鱒”和“西藏棕鱒”),棕鱒人工養(yǎng)殖業(yè)的發(fā)展對當(dāng)?shù)鼐用駥?shí)現(xiàn)脫貧致富具有重要作用。然而,新疆棕鱒與西藏棕鱒的養(yǎng)殖方式不同,氣候環(huán)境也存在較大差異,因此,對兩地棕鱒進(jìn)行群體遺傳學(xué)研究,有助于從基因組水平深入了解這些群體的遺傳結(jié)構(gòu),進(jìn)而指導(dǎo)物種保護(hù)和育種研究?!厩叭搜芯窟M(jìn)展】新疆棕鱒和西藏棕鱒的來源可追溯到19世紀(jì)末20世紀(jì)初。1866年,英國人將棕鱒引入青藏高原的亞東河流域養(yǎng)殖,在我國被稱為亞東鮭魚(胡江偉和阿地力,2018;高擘為等,2020)。與青藏高原的其他魚類相比(陳毅峰,2002),亞東鮭魚的生長速度和性成熟更快,使得亞東鮭魚在當(dāng)?shù)匮杆俳⒘朔N群(豪富華等,2007)。1900年左右,來自英國的棕鱒被引入克什米爾(Sahoo et al.,2016),隨后從克什米爾傳播到巴基斯坦。自2011年起,新疆地區(qū)開始從巴基斯坦引入棕鱒養(yǎng)殖,后逐步推廣到新疆多地(胡江偉和阿地力,2018)。棕鱒在國內(nèi)的發(fā)源歷史及其養(yǎng)殖群體的遺傳多樣性現(xiàn)狀目前還極少有人關(guān)注。豪富華(2006)、豪富華等(2006)曾對亞東鮭魚及引種自丹麥的棕鱒進(jìn)行生物學(xué)和遺傳多樣性分析,發(fā)現(xiàn)亞東鮭魚相較于引種自丹麥的棕鱒有著包括生長速度、胚胎發(fā)育和繁殖特點(diǎn)上的差異,但其對線粒體基因組分子標(biāo)記的研究中發(fā)現(xiàn)亞東鮭魚與丹麥棕鱒的序列無任何差異,但通過11個(gè)多態(tài)性微衛(wèi)星標(biāo)記的研究卻發(fā)現(xiàn)亞東鮭魚的遺傳多樣性高于丹麥棕鱒。孟瑋等(2017)基于ITS1基因序列對西藏棕鱒和引自巴基斯坦的新疆棕鱒進(jìn)行群體遺傳分析,認(rèn)為新疆棕鱒的遺傳多樣性高于西藏棕鱒。目前,國際上主要使用微衛(wèi)星分子標(biāo)記(Eszterbauer et al.,2015;Prod?hl et al.,2019)和利用限制性酶切位點(diǎn)相關(guān)DNA測序(Restriction-site associated DNA,RAD-seq)得到的單核苷酸多態(tài)性(SNP)標(biāo)記(Leit‐wein et al.,2016)來研究棕鱒群體的遺傳多樣性。Lemopoulos等(2019)比較使用RADseq得到的SNP標(biāo)記與使用微衛(wèi)星標(biāo)記估計(jì)棕鱒遺傳多樣性和雜合水平的效果,發(fā)現(xiàn)使用SNP標(biāo)記在對多位點(diǎn)的估計(jì)上更具優(yōu)勢。盡管棕鱒染色體水平的基因組序列已發(fā)表(Hansen et al.,2021),但通過基因組重測序?qū)ψ伧V群體進(jìn)行遺傳多樣性研究的報(bào)道還較少。截至2022年1月,僅Saha等(2022)參考棕鱒染色體水平基因組,基于重測序數(shù)據(jù),在瑞典Bunnersj?arna湖區(qū)的2個(gè)共存棕鱒群體中找到2個(gè)群體間存在生殖隔離的證據(jù)?!颈狙芯壳腥朦c(diǎn)】棕鱒具有40條染色體,曾發(fā)生過染色體加倍,高度的遺傳變異性以致使用少數(shù)的基因或分子標(biāo)記難以正確反映棕鱒遺傳多樣性的實(shí)際水平。2019年,英國Sanger研究所完成了25個(gè)物種的基因組計(jì)劃,其中包括棕鱒的高質(zhì)量基因組序列(Hansen et al.,2021),這使得在基因組水平解析棕鱒的遺傳多態(tài)性成為可能?!緮M解決的關(guān)鍵問題】采用第二代高通量測序技術(shù)對來自新疆達(dá)坂城和西藏亞東的2個(gè)棕鱒群體進(jìn)行基因組重測序,從基因組水平研究2個(gè)棕鱒群體的遺傳多樣性和群體結(jié)構(gòu),并通過群體間選擇消除分析探究2個(gè)群體基因組中選擇信號的差異,為棕鱒的分子輔助育種打下數(shù)據(jù)和方法基礎(chǔ)。
于西藏亞東縣亞東鮭魚繁育基地和新疆烏魯木齊市達(dá)坂城東溝冷水魚實(shí)驗(yàn)場的2個(gè)棕鱒養(yǎng)殖群體中各采集12條棕鱒,共24個(gè)樣本。剪取樣本尾鰭1 cm,液氮速凍后提取基因組DNA,構(gòu)建雙端測序文庫,使用Illumina Hiseq-x-ten測序平臺進(jìn)行全基因組隨機(jī)測序,平均測序深度10X。
依據(jù)已公布的棕鱒基因組序列作為參考序列(Hansen et al.,2021),使用Burrows-Wheeler Aligner將測序讀段比對至參考基因組上(Li and Durbin,2009)。使用Genome Analysis Toolkit(McKenna etal.,2010)和SAMtools軟件(Li et al.,2009)進(jìn)行SNP鑒定,在默認(rèn)參數(shù)下鑒定出SNP。使用VCFtools(Danecek et al.,2011),在-max-missing=0.2和mac=2的條件下進(jìn)行過濾。
計(jì)算4種與遺傳多態(tài)性相關(guān)的統(tǒng)計(jì)量,包括核苷酸多態(tài)性(Pi)(Ness et al.,2010)、觀測雜合度(Ho)、期望雜合度(He)和多態(tài)信息含量(PIC)(Chesnokov and Artemyeva,2015),計(jì)算Pi、Ho、He和PIC在基因組上的平均值,以衡量新疆棕鱒與西藏棕鱒的遺傳多態(tài)性差異。
使用Plink將vcf文件轉(zhuǎn)換為等位基因信息文件,并進(jìn)行主成分分析(Principal components analysis,PCA)。使用IQ-Tree繪制系統(tǒng)發(fā)育進(jìn)化樹(Nguyen et al.,2015)。計(jì)算過程中選擇使用經(jīng)驗(yàn)堿基替換率的TVM模型(Transversion model),Bootstrap次數(shù)為1000。使用Admixture對2個(gè)棕鱒的群體結(jié)構(gòu)進(jìn)行分析(Alexander et al.,2009),并通過計(jì)算CV error進(jìn)行驗(yàn)證。
使用PopLDdecay分析2個(gè)棕鱒群體的連鎖不平衡衰減(Linkage disequilibrium decay)速度(Zhang et al.,2019),以確定群體中可能存在的選擇信號。使用Vcftools在長度為50 kb、步長為10 kb的基因組長度滑窗中計(jì)算群體分化指數(shù)(FST)和Pi值,并進(jìn)行基于FST和Pi的選擇消除分析,篩選同時(shí)滿足Pi值相差最大和FST值最大(top1%)的區(qū)域作為具體明顯選擇印跡的染色體候選區(qū)域,位于這些區(qū)域的基因則為可能受到選擇的候選基因。
將在選擇印跡分析中得到的染色體區(qū)段進(jìn)行SNPeff注釋(Cingolani et al.,2012),將其中發(fā)生錯(cuò)義突變、選擇性剪接突變和基因調(diào)控原件突變的基因序列在KEGG代謝途徑數(shù)據(jù)庫中運(yùn)行Blast‐KOALA進(jìn)行通路分析,注釋基因功能及參與的代謝途徑。
本研究中所涉及的測序數(shù)據(jù)共得到4694474928條Illumina序列(reads),與參考基因組的mapping率超過97%。經(jīng)SNP Calling,共鑒定出8559684個(gè)SNP位點(diǎn)(表1)。在鑒定出的SNP中,堿基轉(zhuǎn)換率略高于堿基顛換率,說明在棕鱒基因組中同樣存在堿基轉(zhuǎn)換偏差(趙輝等,2006)。
表1 樣本及測序信息Table 1 Information of the samples and sequencing
對4種表征遺傳多態(tài)性的統(tǒng)計(jì)量Pi、He、Ho、PIC進(jìn)行計(jì)算和分析,發(fā)現(xiàn)2個(gè)群體的群體遺傳多樣性非常相近(表2),其中,西藏群體的Pi值約為0.348,僅略高于新疆的0.336;其他3個(gè)統(tǒng)計(jì)量也有類似結(jié)果。此外,無論是新疆群體還是西藏群體,群體內(nèi)部的He和Ho值均較相近,符合哈迪—溫伯格平衡,說明2 個(gè)群體內(nèi)部的交配方式可能以隨機(jī)交配為主(Chesnokov and Artemyeva,2015)。對比全基因組中2個(gè)群體所鑒定到的SNP密度,發(fā)現(xiàn)2個(gè)群體的SNP密度分布高度相似(圖1),但在1號染色體的11~39 Mb處、4號染色體的2和18 Mb處、13號染色體的60 Mb處、18號染色體的10、27和29.7 Mb等處、20號染色體的6 Mb處、21號染色體的16~42.5 Mb處、25號染色體的25.1 Mb處、28號染色體的8、14和17 Mb處,以及31號染色體的7 Mb處的SNP密度差異明顯。
圖1 新疆群體(上)和西藏群體(下)的SNP密度圖Fig.1 SNP density diagram of Xinjiang(upper)and Tibetan(lower)populations
表2 群體遺傳多樣性比較Table 2 Genetic diversity comparison between the two popu‐lations
在構(gòu)建的系統(tǒng)發(fā)育進(jìn)化樹中,有新疆棕鱒個(gè)體與西藏棕鱒聚為一簇,說明這2個(gè)群體的親緣關(guān)系較近(圖2)。但在用列前3位的主成分?jǐn)?shù)據(jù)繪制的三維PCA分析圖中,發(fā)現(xiàn)主成分分析可將2個(gè)群體較好地分開,說明新疆棕鱒群體與西藏棕鱒群體在整體上存在一定的遺傳距離(圖3)。此外,在2個(gè)群體內(nèi)部,各個(gè)體間的點(diǎn)分布不緊密,說明群體的遺傳單一性不高,個(gè)體間存在一定的遺傳差異。
圖2 新疆和西藏棕鱒個(gè)體系統(tǒng)發(fā)育進(jìn)化樹Fig.2 Phylogenetic tree of Xinjiang and Tibetan brown trout individuals
使用Admixture進(jìn)行群體結(jié)構(gòu)分析,當(dāng)預(yù)測出的祖先群體數(shù)為2時(shí)(K=2)已不能將這2個(gè)群體完全分開(圖4)。類似的,在CV error驗(yàn)證中,K=1時(shí)的CV error最低,說明新疆群體和西藏群體可能來自同一種源(圖5)。2種分析方法均驗(yàn)證2個(gè)群體具有共同的祖先,結(jié)合其他學(xué)者對亞東鮭魚種質(zhì)來源的研究,基本上可確定新疆群體和西藏群體均來自于大西洋棕鱒居群(戶國等,2016)。
圖5 新疆和西藏棕鱒群體CV error驗(yàn)證Fig.5 CV error verification in Xinjiang and Tibetan brown trout populations
考慮到群體內(nèi)連鎖不平衡(LD)的發(fā)生,存在自然選擇、遺傳漂變、個(gè)體的遷入或遷出、近親繁殖等因素影響,比較2個(gè)群體的連鎖不平衡衰減速度(LDdecay)時(shí),以LD降低到最大值一半時(shí)的平均LD長度來衡量連鎖不平衡衰減速度,結(jié)果(圖6)發(fā)現(xiàn),2個(gè)群體連鎖不平衡衰減速度幾乎相等,新疆群體略高。在2個(gè)棕鱒群體中未觀察到Liu等(2019)在7個(gè)黃瓜群體間發(fā)現(xiàn)的LD衰減曲線形狀和數(shù)值顯著差異,說明新疆群體和西藏群體經(jīng)歷的上述群體事件可能相似。
圖6 新疆棕鱒和西藏棕鱒的連鎖不平衡衰減Fig.6 Linkage disequilibrium decay of Xinjiang and Tibetan brown trout populations
為尋找受到較強(qiáng)選擇的染色體區(qū)域,通過鑒定得到的每個(gè)個(gè)體SNP位點(diǎn),在2個(gè)群體間進(jìn)行群體選擇消除分析。結(jié)果(圖7)顯示,在群體Pi比值[log2(Pi疆/Pi藏)]最低的1%區(qū)域與FST最大的1%區(qū)域交集(圖7左上角)所對應(yīng)的染色體區(qū)域中,新疆群體的Pi低于西藏群體,且群體分化指數(shù)較高。推測在新疆群體的第5和第19號染色體上有大片段區(qū)域可能受到強(qiáng)烈的選擇;與之相似,Pi比值最高的1%區(qū)域與FST最大的1%區(qū)域的交集(圖7右上角)所對應(yīng)的染色體區(qū)域中,西藏群體的Pi低于新疆群體,且群體分化指數(shù)較高,推測在西藏群體的第17和第18號染色體上有大片段區(qū)域可能受到強(qiáng)烈的選擇。根據(jù)棕鱒的基因組注釋信息(Hansen et al.,2021),在這些染色體區(qū)域上,共分布有94個(gè)編碼蛋白基因,其中33來自新疆群體,61個(gè)來自西藏群體。
圖7 新疆棕鱒和西藏棕鱒群體間基于FST和Pi的選擇消除分析Fig.7 FST-and Pi-based selective sweep analysis between Xinjiang and Tibetan brown trout populations
使用KEGG代謝通路數(shù)據(jù)庫對受到選擇的基因可能參與的代謝途徑進(jìn)行分析,結(jié)果(表3)顯示,這些基因分別參與多個(gè)不同的信號通路,且這些信號通路主要與信號分子傳導(dǎo)、免疫和疾病等生理過程相關(guān)。群體選擇消除分析中鑒定出位于受到強(qiáng)烈選擇區(qū)域的94個(gè)基因中有21個(gè)基因與免疫或疾病相關(guān),其中4個(gè)來自于新疆群體,17個(gè)來自于西藏群體(圖8)。西藏群體中受到選擇的基因所參與的通路主要包括PI3K-Akt信號傳導(dǎo)途徑、中性粒細(xì)胞胞外捕集器的形成、JAK-STAT信號傳導(dǎo)途徑、Hippo信號傳導(dǎo)途徑、表皮生長因子受體酪氨酸激酶抑制劑抗性、cAMP信號傳導(dǎo)途徑、細(xì)胞因子—細(xì)胞因子受體相互作用、FoxO信號傳導(dǎo)途徑、磷脂酰肌醇信號系統(tǒng)、神經(jīng)活性配體—受體相互作用、mTOR信號傳導(dǎo)途徑、軸突引導(dǎo)、ECM-受體相互作用、細(xì)胞粘附分子和NOD樣受體信號傳導(dǎo)途徑,主要位于第1、4、14、17、18、19、21、23、26、30和31號染色體上;而新疆群體的這些基因參與的代謝途徑主要集中于MAPK信號傳導(dǎo)途徑、Ras信號傳導(dǎo)途徑、鈣信號傳導(dǎo)途徑、TNF信號傳導(dǎo)途徑、PI3K-Akt信號傳導(dǎo)途徑和Hippo信號傳導(dǎo)途徑,主要位于第5、29和39號染色體上。
表3 在不同KEGG通路上受到選擇的基因數(shù)量Table 3 Number of the involved genes under selection in different KEGG pathways
圖8 新疆和西藏群體FST曼哈頓圖Fig.8 Manhattan graph of FST between Xinjiang and Tibetan populations
基因組重測序在許多物種中能獲取百萬以上的SNP分子標(biāo)記,是魚類功能基因關(guān)聯(lián)定位及群體遺傳研究的有力工具。以大西洋鮭魚性成熟年齡相關(guān)基因的研究為例,前人基于6.5K SNP陣列數(shù)據(jù)進(jìn)行過全基因組關(guān)聯(lián)分析,雖然得到了與性狀關(guān)聯(lián)的基因座,但未能獲得具體的基因或基因位置(Gutier‐rez et al.,2015);Ayllon等(2015)基于野生和馴化的大西洋鮭魚群體的基因組重測序數(shù)據(jù),獲得4326591個(gè)SNP標(biāo)記,遠(yuǎn)高于Gutierrez 等(2015)采用SNP陣列獲得的標(biāo)記數(shù)量,同樣通過全基因組關(guān)聯(lián)分析,鑒定出vgll3基因是與大西洋鮭魚性成熟年齡相關(guān)的基因。在基因組龐大,特別是經(jīng)歷過額外的全基因組加倍事件的鮭科和鱘科魚類中(Berthelot et al.,2014;Lien et al.,2016;Du et al.,2020),以基因組測序數(shù)據(jù)鑒定SNP分子標(biāo)記進(jìn)行分析較其他分子標(biāo)記更準(zhǔn)確(豪富華,2006)。新疆達(dá)坂城和西藏亞東縣的養(yǎng)殖棕鱒群體在SNP密度分布、連鎖不平衡衰減速度和核苷酸多態(tài)性等方面存在高度的相似性,暗示這2個(gè)群體可能引自同一種源。盡管新疆棕鱒引入我國僅比西藏棕鱒晚150多年,但強(qiáng)烈的自然或人工選擇壓力能對棕鱒的進(jìn)化產(chǎn)生影響,導(dǎo)致生物學(xué)特性在短期內(nèi)即發(fā)生改變(Pigeon et al.,2016),對虹鱒魚的多性狀人工選育可達(dá)每代7%的遺傳增益(Kause et al.,2005)。因此,在西藏和新疆的棕鱒養(yǎng)殖群體中可能存在適應(yīng)性進(jìn)化差異。與引自巴基斯坦的養(yǎng)殖棕鱒不同,西藏棕鱒有著更為悠久的野生歷史,從1866年棕鱒被引入到1998年棕鱒的人工養(yǎng)殖研究取得成功,西藏棕鱒維持了130多年的野生狀態(tài)。棕鱒相比西藏高原水體中的土著魚類,其性成熟較早且生長速度快,與亞東河當(dāng)?shù)佤~類相比具有明顯優(yōu)勢(豪富華,2006),使得棕鱒養(yǎng)殖在西藏獲得成功,也可能是導(dǎo)致西藏棕鱒遺傳多樣性更高的原因。
選擇消除是指在強(qiáng)烈選擇壓力的作用下,有利變異的等位基因頻率會在較短時(shí)間內(nèi)快速增加,其增加速度遠(yuǎn)高于正常水平,以至于有利變異鄰近的稀有變異與之連鎖地被保留下來,并導(dǎo)致有利變異鄰近區(qū)域核苷酸多態(tài)性的減少。這是一種特殊的遺傳搭車現(xiàn)象(Stephan,2019)。對來自不同群體的基因組重測序數(shù)據(jù)進(jìn)行選擇消除分析,能發(fā)現(xiàn)不同群體中受到強(qiáng)烈選擇的候選基因。該方法已應(yīng)用于羅非魚和大西洋鮭魚的馴化相關(guān)候選基因篩選(Na‐val-Sanchez et al.,2020;Nayfa et al.,2020),并在3個(gè)不同羅非魚養(yǎng)殖群體間定位到多個(gè)與生長、早期發(fā)育和免疫特性相關(guān)的基因(Cádiz et al.,2020)。本研究中,選擇消除分析得到的候選基因主要與免疫相關(guān),或許由于新疆棕鱒和西藏棕鱒在引種前已適應(yīng)高海拔水體,均經(jīng)歷過人為馴化,導(dǎo)致2個(gè)群體的適應(yīng)差異主要集中在不同水體的病原體抗性上。
西藏棕鱒相比新疆棕鱒有著更高的群體遺傳多樣性,但西藏棕鱒受到選擇的功能基因更多,功能分布更廣,暗示著兩地棕鱒經(jīng)受的選擇壓力存在差異。單一的選擇壓力會導(dǎo)致群體的遺傳多態(tài)性降低,并產(chǎn)生集中在少數(shù)染色體上的選擇印跡,與新疆棕鱒群體中發(fā)現(xiàn)的選擇印跡分布相似;而在西藏棕鱒中,發(fā)現(xiàn)的選擇印跡分散在多條染色體的多個(gè)區(qū)段上,說明更可能是多種選擇因素共同導(dǎo)致的結(jié)果。與引入我國前后均養(yǎng)殖在中低海拔地區(qū)(2300 m以下)的新疆棕鱒不同,生活在海拔2700~3700 m亞東河流域的西藏棕鱒在人工養(yǎng)殖成功前長期處于野生狀態(tài),且在1992年被列為西藏二級重點(diǎn)水生野生保護(hù)動(dòng)物前經(jīng)歷了嚴(yán)重的過度捕撈,這些因素可能共同影響了西藏棕鱒中選擇印跡的分布。
新疆棕鱒和西藏棕鱒相近的親緣關(guān)系和較小的遺傳差異揭示兩個(gè)棕鱒群體可能來自同一種源,2個(gè)群體受到選擇壓力較大的基因集中在免疫相關(guān)通路中,未發(fā)現(xiàn)存在明顯選擇信號的生長相關(guān)基因,說明新疆棕鱒和西藏棕鱒在引種后的人工選育程度不足,受到的選擇壓力仍以自然選擇為主。