劉盼靜, 魏洪義, 郭 坤, 馬廣源, 張 濤,*
(1. 河北省農(nóng)林科學(xué)院植物保護(hù)研究所, 河北保定 071000; 2. 江西農(nóng)業(yè)大學(xué)昆蟲研究所, 南昌 330045)
昆蟲的嗅覺識(shí)別過程非常復(fù)雜,涉及多種嗅覺相關(guān)蛋白的參與,主要包括氣味結(jié)合蛋白(odorant-binding proteins, OBPs)、化學(xué)感受蛋白(chemosensory proteins, CSPs)、嗅覺受體(odorant receptors, ORs)、味覺受體(gustatory receptors, GRs)、離子型受體(ionotropic receptors, IRs)和嗅覺神經(jīng)元膜蛋白(sensory neuronmembrane proteins, SNMPs)等(Leal, 2013; Guetal., 2015)。當(dāng)化學(xué)信號(hào)分子進(jìn)入感受器淋巴時(shí),OBPs和CSPs等與信號(hào)分子結(jié)合,并將其運(yùn)輸?shù)缴窠?jīng)元膜上的ORs,進(jìn)而將化學(xué)信號(hào)刺激轉(zhuǎn)化為電信號(hào)。隨后,這些信號(hào)分子被淋巴腔或傳感器細(xì)胞中的氣味降解酶(odorant degrading enzymes, ODEs)降解(Vogt and Riddiford, 1981; Leal, 2005)。OBPs和CSPs大量存在于觸角和口器中,參與多種化學(xué)信號(hào)的結(jié)合和傳遞(Xuetal., 2019)。OBPs是一類可溶性蛋白質(zhì),一般來說,根據(jù)保守半胱氨酸(Cys)殘基的數(shù)量,OBP大概分為至少5種類型:典型的OBPs(classic OBPs)(含有6個(gè)保守的Cys殘基)、minus-C OBPs(缺少第2位Cys “C2”和第5位Cys “C5”)、plus-C OBPs(多了2個(gè)額外的Cys,且第6位Cys“C6”后緊接著1個(gè)脯氨酸“P”)、二聚體OBPs(dimer OBPs)(含有兩組“典型OBPs Cys殘基”)和非典型OBPs(atypical OBPs)(含有9~10個(gè)Cys殘基并有很長(zhǎng)的羧基端)(Zhouetal., 2004; Zhou, 2010; Leal, 2013; Tsitsanouetal., 2013; Ozaki, 2019)。CSPs也是一種小分子的可溶性蛋白質(zhì),它有4個(gè)高度保守的半胱氨酸殘基,形成2個(gè)二硫鍵,在化學(xué)感覺器官和非嗅覺組織中均有表達(dá)(Maleszkaetal., 2007; Picimbon, 2019)。
綠芫菁Lyttacaraganae屬鞘翅目(Coleoptera)芫菁科(Meloidae),廣泛分布于我國(guó)華北、東北等地區(qū)(王海玲, 2013)。綠芫菁食性雜,成蟲取食國(guó)槐、紫穗槐、苜蓿、黃檗、水曲柳、復(fù)葉槭、白蠟、楊樹、柳樹等植物葉片,為害嚴(yán)重時(shí)還可誘發(fā)腐爛病等病害;而幼蟲則可以取食蝗蟲及土蜂的幼蟲或卵,是蝗蟲等直翅目害蟲的天敵(巴合提古麗·也山, 2017; 高鵬飛, 2019)。而目前對(duì)于綠芫菁的研究多局限于生物學(xué)特性及發(fā)生規(guī)律,在嗅覺識(shí)別方面的研究尚無報(bào)道。本研究主要借助轉(zhuǎn)錄組測(cè)序技術(shù)對(duì)綠芫菁成蟲觸角進(jìn)行生物信息學(xué)分析,并篩選參與嗅覺感受的一些重要OBPs和CSPs,為今后綠芫菁嗅覺感受蛋白的作用機(jī)制研究奠定基礎(chǔ)。
2018年5月初于河北省保定市滿城區(qū)苜蓿田采集綠芫菁成蟲后帶回實(shí)驗(yàn)室于25℃下飼養(yǎng)。選取活動(dòng)能力較強(qiáng)的雌雄成蟲各100頭,用滅菌水沖洗蟲體,70%酒精表面消毒30 s,再用滅菌水沖洗兩遍,在冰上迅速切下觸角,雌雄分開收集,液氮速凍后保存于-80℃?zhèn)溆谩?/p>
使用TRIzol up試劑(全式金,北京)提取綠芫菁雌雄成蟲觸角總RNA,用1.0%的瓊脂糖凝膠電泳檢測(cè)總RNA是否有降解,NanoDrop 2000檢測(cè)RNA的純度,Agilent 2100精確檢測(cè)RNA的完整性。使用雌雄成蟲各50頭的觸角RNA進(jìn)行轉(zhuǎn)錄組測(cè)序。
1.5 μg高質(zhì)量的RNA用于構(gòu)建cDNA文庫,用帶有Oligo(dT)的磁珠富集真核生物mRNA,以mRNA為模板合成雙鏈cDNA,并用AMPure XP系統(tǒng)(Beckman-Coulter,Beverly,美國(guó))純化。在末端修復(fù)和接頭連接后,優(yōu)先選擇長(zhǎng)度為250~300 bp的cDNA片段。在進(jìn)行PCR前,使用3 μL的USER Enzyme(美國(guó)NEB)和大小選定的適配器連接的cDNA預(yù)處理(37℃ 15 min;95℃ 5 min)。用Phusion High-Fidelity DNA聚合酶、通用PCR引物和Index(X)引物進(jìn)行PCR擴(kuò)增。最后,采用Ampre XP系統(tǒng)純化PCR產(chǎn)物,并在Agilent Bioanalyzer 2100系統(tǒng)上評(píng)估文庫質(zhì)量。cDNA文庫構(gòu)建及測(cè)序由北京諾禾致源生物公司完成。
對(duì)測(cè)序得到的綠芫菁成蟲觸角原始測(cè)序序列或者raw reads進(jìn)行過濾,去掉含有帶接頭和低質(zhì)量的reads,得到clean reads,同時(shí)計(jì)算Q30(clean data質(zhì)量值大于或等于30的堿基比例)、GC含量及重復(fù)序列水平,并采用Trinity系統(tǒng)(Grabherretal., 2011)對(duì)clean reads進(jìn)行拼接,從而獲得高質(zhì)量的unigenes。利用BLASTn和BLASTx對(duì)綠芫菁成蟲觸角轉(zhuǎn)錄組的unigenes在NCBI數(shù)據(jù)庫進(jìn)行比對(duì),BLAST比對(duì)閾值為E-value<10-5,獲得基因的功能注釋信息。將BLAST結(jié)果進(jìn)一步導(dǎo)入Blast2GO進(jìn)行GO注釋,比對(duì)NR, NT, KO, Pfam, Swiss-Prot, GO和KOG七大數(shù)據(jù)庫進(jìn)行功能注釋。
根據(jù)1.4節(jié)基因功能注釋信息篩選綠芫菁成蟲觸角轉(zhuǎn)錄組中OBP和CSP基因,并獲得氨基酸序列,在NCBI數(shù)據(jù)庫進(jìn)行BLAST比對(duì),確定最終的候選OBP和CSP。 OBP和CSP信號(hào)肽預(yù)測(cè)使用SignalP 5.0在線網(wǎng)站(http:∥www.cbs.dtu.dk/services/SignalP/)。OBP和CSP的序列比對(duì)使用ClustalX 1.83軟件,比對(duì)結(jié)果用GeneDoc軟件呈現(xiàn)。 從NCBI數(shù)據(jù)庫中下載鞘翅目其他物種(眼斑溝芫菁Hycleuscichorii、大斑溝芫菁Hycleusphaleratus、中歐山松大小蠹Dendroctonusponderosae和赤擬谷盜Triboliumcastaneum的OBP和CSP序列,并使用MEGA 7.0的鄰接法(neighbour-joining, NJ)以bootstrap=1 000的參數(shù)構(gòu)建OBP和CSP的進(jìn)化樹,用FigTree v.1.4.3軟件對(duì)進(jìn)化樹進(jìn)行美化編輯(Kumaretal., 2016)。
以拼接得到的轉(zhuǎn)錄組作為參考序列,將每個(gè)樣品的clean reads映射(mapping)到參考序列上,并采用RSEM軟件(Li and Dewey, 2011)進(jìn)行統(tǒng)計(jì),進(jìn)一步得到了每個(gè)樣品比對(duì)到每個(gè)基因上的read count,通過每百萬reads中來自某一基因每千堿基長(zhǎng)度的reads數(shù)目(fragments per kilobase of exon model per million mapped reads, FPKM)方法計(jì)算(Trapnelletal., 2010)。
使用1.2節(jié)合成的綠芫菁成蟲觸角RNA,按照All-in-One First-Strand cDNA Synthesis SuperMix 試劑盒(全式金,北京)說明書合成cDNA。雌雄各設(shè)置3個(gè)生物學(xué)重復(fù),每個(gè)生物學(xué)重復(fù)包含15頭綠芫菁的觸角。用Primer Premier 6.0軟件設(shè)計(jì)具有完整ORF的OBP和CSP基因的特異性引物,以GAPDH(GenBank登錄號(hào): MZ703177)為內(nèi)參基因(表1)。qRT-PCR在ABI7500實(shí)時(shí)熒光定量PCR儀上進(jìn)行,反應(yīng)體系: Tip Green qPCR SuperMix 10 μL, 正反向引物(10 μmo/L)各1 μL, cDNA模板1 μL, ddH2O 7 μL。反應(yīng)程序: 94℃ 30 s; 94℃ 5 s, 60℃ 15 s, 72℃, 10 s, 40個(gè)循環(huán)。每樣品重復(fù)測(cè)定3次。
表1 引物信息
采用2-ΔΔCt法分析基因表達(dá)量數(shù)據(jù),并用SPSS22.0軟件進(jìn)行單因素方差分析(one-way ANOVA)的最小顯著性差異法(LSD)進(jìn)行差異顯著性檢驗(yàn),最后用GraphPad Prism 8軟件繪圖。
使用Illumina HiSeqTM平臺(tái)構(gòu)建了綠芫菁雌雄成蟲觸角的cDNA文庫,用Trinity系統(tǒng)進(jìn)行組裝,將轉(zhuǎn)錄組測(cè)序原始數(shù)據(jù)上傳至SRA數(shù)據(jù)庫,雌雄觸角的cDNA文庫登錄號(hào)分別為:SRR15462538和SRR15462539(https:∥www.ncbi.nlm.nih.gov/sra)。數(shù)據(jù)過濾后從雌雄成蟲觸角轉(zhuǎn)錄組中分別獲得57 997 546和48 430 908條clean reads。經(jīng)拼接和聚類后共獲得51 028條transcripts和41 998條unigenes,長(zhǎng)度超過2 000 bp的unigenes有16 958條(圖1: A)。
41 998條unigenes中,有30 550條(72.74%), 26 344條(62.72%), 25 841條(61.52%)和24 841條(59.14%)unigenes分別注釋到NR, GO, Pfam和Swiss-Prot數(shù)據(jù)庫中(表2)。在7個(gè)數(shù)據(jù)庫中都注釋到的有5 953條(14.17%)unigenes,至少在1個(gè)數(shù)據(jù)庫中注釋到的unigenes高達(dá)32 391條(77.12%)。將unigenes在NR數(shù)據(jù)庫中進(jìn)行同源比對(duì),取E-value<1 e-5, 赤擬谷盜中的unigenes匹配度最高(87.3%),其次是中歐山松大小蠹的(3.7%),濕木白蟻Zootermopsisnevadensis的(0.7%),黃粉蟲Tenebriomolitor的(0.4%),豌豆蚜Acyrthosiphonpisum的(0.4%),其他物種中的占7.5%(圖1: B)。
圖1 綠芫菁成蟲觸角轉(zhuǎn)錄組中unigenes和transcripts長(zhǎng)度分布(A)及unigenes在NR數(shù)據(jù)庫中的同源物種分布(B)
表2 綠芫菁成蟲觸角轉(zhuǎn)錄組unigenes功能注釋統(tǒng)計(jì)
通過比對(duì)NR, GO, Pfam和Swiss-Prot等數(shù)據(jù)庫的注釋信息,共篩選到22個(gè)LcarOBP基因和7個(gè)LcarCSP基因,并上傳至NCBI,登錄號(hào)為MZ703148-MZ703176(https:∥www.ncbi.nlm.nih.gov/genbank/)。22個(gè)LcarOBP基因中有19個(gè)具有完整的ORF,其蛋白長(zhǎng)度為68~213 aa,18個(gè)LcarOBPs具有信號(hào)肽(除LcarOBP4, LcarOBP7和LcarOBP21-22)(表3)。氨基酸序列比對(duì)結(jié)果表明,LcarOBP2-10, LcarOBP15, LcarOBP18-20共13個(gè)OBPs具有6個(gè)保守的半胱氨酸殘基,符合Cys-X25-32-Cys-X3-Cys-X37-48-Cys-X8-11-Cys-X8-Cys的結(jié)構(gòu),為classic OBPs(圖2)。
圖2 綠芫菁成蟲觸角轉(zhuǎn)錄組中classic OBPs氨基酸序列比對(duì)
綠芫菁的7個(gè)LcarCSP基因均具有完整的ORF,蛋白長(zhǎng)度在115~276 aa范圍內(nèi),5個(gè)LcarCSPs具有信號(hào)肽(LcarCSP3-7)(表3),與眼斑溝芫菁和大斑溝芫菁CSPs的氨基酸序列一致性較高,在60.48%~85.05%范圍內(nèi)。
表3 綠芫菁成蟲觸角轉(zhuǎn)錄組中OBP和CSP基因
進(jìn)化樹表明,22個(gè)OBPs在整個(gè)進(jìn)化樹的各個(gè)分支都有分布,與同為芫菁科的眼斑溝芫菁和大斑溝芫菁親緣關(guān)系最近,且均聚類在一個(gè)分支上。其中,LcarOBP9, LcarOBP10, LcarOBP21和LcarOBP22聚在一個(gè)分支上,與大斑溝芫菁的HphaOBP6和HphaOBP8關(guān)系較近,其次是與中歐山松大小蠹的DponOBP14和DponOBP32(圖3)。
圖3 鄰接法構(gòu)建的基于氨基酸序列的綠芫菁成蟲觸角轉(zhuǎn)錄組中LcarOBPs與其他鞘翅目昆蟲OBPs的系統(tǒng)發(fā)育樹(1 000次重復(fù))
80個(gè)來自不同物種的CSPs被分成3個(gè)大分支,綠芫菁的7個(gè)CSPs分散到各個(gè)分支上,其中LcarCSP7單獨(dú)位于一個(gè)小分支。LcarCSP1和LcarCSP2聚集到一個(gè)分支上,它們與眼斑溝芫菁CSPs的氨基酸序列一致性分別為65.36%和60.48%,并且都與眼斑溝芫菁和大斑溝芫菁親緣關(guān)系最近(圖4)。
圖4 鄰接法構(gòu)建的基于氨基酸序列的綠芫菁成蟲觸角轉(zhuǎn)錄組中LcarCSPs與其他鞘翅目昆蟲CSPs的系統(tǒng)發(fā)育樹(1 000次重復(fù))
根據(jù)FPKM值顯示,LcarOBP15和LcarOBP16在綠芫菁觸角中的高豐度表達(dá),其次是LcarOBP10,而LcarOBP7則在觸角中微量表達(dá)(表3)。對(duì)19個(gè)具有完整ORF的LcarOBP基因進(jìn)行表達(dá)量測(cè)定,qRT-PCR結(jié)果顯示,LcarOBP9和LcarOBP10在雄成蟲觸角中顯著高表達(dá),其中LcarOBP9在雄成蟲觸角中的表達(dá)量比在雌成蟲觸角中的高8倍,而LcarOBP1,LcarOBP3,LcarOBP5,LcarOBP11-LcarOBP13,LcarOBP15-LcarOBP17和LcarOBP20在雌成蟲觸角中有較高的表達(dá)量,其他幾個(gè)基因在雌雄成蟲觸角中的表達(dá)量無顯著差異(P>0.05)(圖5)。
LcarCSP4在綠芫菁雌雄成蟲觸角中有高豐度表達(dá),其FPKM>1 000(表3)。綠芫菁7個(gè)LcarCSP基因的表達(dá)量測(cè)定結(jié)果顯示,LcarCSP1和LcarCSP2在雄成蟲觸角中有較高的表達(dá)量,而LcarCSP3-4在雌成蟲觸角中的表達(dá)量較高,其他幾個(gè)基因的表達(dá)量在雌雄成蟲觸角中無顯著差異(P>0.05)(圖5)。
圖5 綠芫菁雌雄成蟲觸角中LcarOBP和LcarCSP基因的相對(duì)表達(dá)量
本研究從綠芫菁成蟲觸角轉(zhuǎn)錄組中共獲得8.7 Gb的原始數(shù)據(jù),拼接成41 998條unigenes,并將32 391條(77.12%)unigenes注釋到NR, NT,KO,Pfam, Swiss-Prot, GO和KOG七大數(shù)據(jù)庫(表2)。部分unigenes未被注釋到,其原因可能是在組裝拼接過程中有不可避免的錯(cuò)誤序列信息,或者是組裝過程中一些新基因在所用的數(shù)據(jù)庫中匹配不到(Wangetal., 2010)。
本研究根據(jù)注釋信息及結(jié)構(gòu)特點(diǎn),從綠芫菁中鑒定出22個(gè)LcarOBPs和7個(gè)LcarCSPs,與鞘翅目其他昆蟲相比,綠芫菁化學(xué)感受蛋白的數(shù)量少于赤擬谷盜中鑒定到的50個(gè)OBPs和20個(gè)CSPs(TriboliumGenome Sequencing Consortium, 2008; Dippeletal., 2014)、中歐山松大小蠹的31個(gè)OBPs和11個(gè)CSPs(Anderssonetal., 2013),而多于紫榆葉甲Ambrostomaquadriimpressum(16個(gè)OBPs,10個(gè)CSPs)、黃粉蟲(19個(gè)OBPs,12個(gè)CSPs)和云杉八齒小蠹Ipstypographus(15個(gè)OBPs,6個(gè)CSPs)(Anderssonetal., 2013; Liuetal., 2015; Wangetal., 2016)。這種數(shù)目上的差異可能是復(fù)雜的環(huán)境變化或基因功能的多樣性造成的,或者是因?yàn)榛瘜W(xué)感受相關(guān)的基因不僅僅存在于觸角中,其他組織器官中也存在,例如有些基因只在幼蟲中表達(dá)(Engsontiaetal., 2008),因此更多的嗅覺基因的挖掘需要進(jìn)一步補(bǔ)充其他組織轉(zhuǎn)錄組或者從基因組水平上鑒定基因。
不同種類的昆蟲OBPs在序列上相似性較低,但大多數(shù)的OBPs含有6個(gè)高度保守的Cys殘基,形成3個(gè)穩(wěn)定的二硫鍵結(jié)構(gòu),次級(jí)結(jié)構(gòu)一般折疊形成6個(gè)α-螺旋,從而形成圓錐形的空腔來結(jié)合氣味分子(Zhou, 2010; Leal, 2013; 楊海博等, 2018)。而重要的氨基酸突變會(huì)影響蛋白結(jié)構(gòu),從而影響與配基結(jié)合能力,有研究表明,在西方蜜蜂Apismellifera中,保守的Cys和能形成氫鍵的特定位置氨基酸改變對(duì)蛋白結(jié)合能力有重要的影響作用(Spinellietal., 2012; 吳帆等, 2021)。本研究從綠芫菁成蟲觸角轉(zhuǎn)錄組中鑒定到的22個(gè)LcarOBPs中,其中有13個(gè)LcarOBPs具有6個(gè)保守的Cys位點(diǎn),屬于classic OBPs,這些保守的Cys殘基將有助于形成穩(wěn)定的二硫鍵,從而有利于蛋白與氣味分子的特異性識(shí)別(Vieira and Rozas, 2011),其具體的嗅覺識(shí)別功能還有待進(jìn)一步的研究與驗(yàn)證。此外,本研究中尚未鑒定到plus-C OBPs,而與綠芫菁同源關(guān)系較近的赤擬谷盜中鑒定到1個(gè)(TcasOBP5E),中歐山松大小蠹中鑒定到1個(gè)(DponOBP2),云杉八齒小蠹鑒定到3個(gè)(ItypOBP2FIX和ItypOBP10),綠芫菁中plus-C OBPs的缺失可能是鞘翅目化學(xué)感受器的一個(gè)特殊進(jìn)化事件,或者是轉(zhuǎn)錄組中不可避免的錯(cuò)誤序列信息造成的(Anderssonetal., 2013; Liuetal., 2015)。
綠芫菁OBPs與其他鞘翅目昆蟲的OBPs構(gòu)建的系統(tǒng)進(jìn)化樹(圖3)表明,多數(shù)LcarOBPs的分布較為集中,如LcarOBP9/LcarOBP10/LcarOBP21/LcarOBP22, LcarOBP16/LcarOBP17, LcarOBP18/LcarOBP19聚集在一支,說明綠芫菁OBPs在種內(nèi)的分化較小。LcarOBP9/LcarOBP10/LcarOBP21/LcarOBP22與赤擬谷盜的TcasOBP5F/5G/5H在同一個(gè)大分支,表明這些基因起著同源化學(xué)感受作用,而有研究表明這一類基因?qū)儆贏BPII基因,它們主要在觸角中表達(dá),在嗅覺識(shí)別中起著重要作用(Dippeletal., 2014)。此外,昆蟲OBPs在雌雄成蟲中普遍存在偏向表達(dá),這可能與雌雄成蟲在生命活動(dòng)中各自承擔(dān)的角色不同有關(guān),比如在甘薯蟻象Cylasformicarius中,CforOBP1-3在雄蟲觸角中高表達(dá),并通過RNA干擾實(shí)驗(yàn)證明了沉默上述基因的甘薯蟻象喪失了部分定位性信息素和寄主植物揮發(fā)物的能力(Huaetal., 2021)。本研究發(fā)現(xiàn),綠芫菁LcarOBP9和LcarOBP10在雄成蟲觸角中的表達(dá)量高于雌成蟲觸角中的(圖5),這些基因可能在交配或與寄主互作時(shí)可能會(huì)發(fā)揮重要作用,還需要后期的熒光競(jìng)爭(zhēng)結(jié)合實(shí)驗(yàn)和RNA干擾實(shí)驗(yàn)進(jìn)一步驗(yàn)證。
本研究首次構(gòu)建了綠芫菁的雌雄成蟲觸角轉(zhuǎn)錄組數(shù)據(jù)庫,成功注釋了綠芫菁成蟲觸角轉(zhuǎn)錄組相關(guān)基因的功能信息,豐富了鞘翅目昆蟲基因數(shù)據(jù)庫;成功篩選得到了部分嗅覺相關(guān)基因,并初步探討了氣味結(jié)合蛋白OBPs和化學(xué)感受蛋白CSPs在鞘翅目昆蟲中的分子系統(tǒng)發(fā)育關(guān)系以及在雌雄成蟲觸角中的表達(dá)情況,為綠芫菁嗅覺機(jī)制的進(jìn)一步研究提供了理論基礎(chǔ)。