白秀娟,姜恩澤,蘇 杭,朱宇航,許 愿,徐逸男,李 雪,韓志強(qiáng),徐 超
(1.東北農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,哈爾濱,150030;2.中國(guó)農(nóng)業(yè)科學(xué)院特產(chǎn)研究所,長(zhǎng)春 130112)
KIT基因,又名c-KIT基因,編碼的肥大/干細(xì)胞生長(zhǎng)因子受體(Mast/stem cell growth factor receptors)最初于貓肉瘤病毒中被發(fā)現(xiàn)[1]。在色素沉著方面,KIT基因主要調(diào)控黑色素細(xì)胞前體沿特定路徑遷移到真皮、表皮、內(nèi)耳和眼脈絡(luò)膜的過(guò)程[2]。KIT基因非正常編碼或表達(dá)量較少時(shí),黑色素細(xì)胞不會(huì)正常增殖和遷移,機(jī)體產(chǎn)生不同程度白化[3]。白癜風(fēng)患者KIT基因表達(dá)量極顯著低于正常人[4]。目前,KIT基因在動(dòng)物中已發(fā)現(xiàn)多種突變體。狐貍白色被毛與KIT基因外顯子12缺失有關(guān)[5]。KIT基因易位使牛表現(xiàn)不同程度白斑[6]。阿拉伯駱駝白色斑點(diǎn)與KIT基因突變有關(guān)[7]。研究表明KIT基因在毛色調(diào)控中發(fā)揮重要作用。
烏蘇里貉(Nyctereutes procyonoides)屬于犬科(Canidae),經(jīng)濟(jì)價(jià)值較高的毛皮動(dòng)物。研究表明野豬KIT基因與毛色表型不相關(guān)[8],烏蘇里貉KIT基因編碼區(qū)未發(fā)現(xiàn)與毛色相關(guān)單核苷酸位點(diǎn)[9-10],烏蘇里貉KIT基因與毛色關(guān)系未見(jiàn)報(bào)道,為了解烏蘇里貉KIT基因及編碼蛋白結(jié)構(gòu)特性,基于機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等在線軟件對(duì)其編碼蛋白一級(jí)、二級(jí)、三級(jí)結(jié)構(gòu)作全面生物信息學(xué)分析。研究結(jié)果旨在比較烏蘇里貉與其他動(dòng)物KIT基因提供參考,為了解KIT基因潛在功能提供新思路。
根據(jù)中國(guó)農(nóng)業(yè)科學(xué)院特產(chǎn)研究所上傳到SRA數(shù)據(jù)庫(kù)的烏蘇里貉皮膚轉(zhuǎn)錄組數(shù)據(jù):野生貉(SRS1620675,SRS1620679,SRS1620678),白貉(SRR4158185,SRR4158184,SRR4158183),紅棕貉(SRR4034955, SRR4034954,SRR4034953)各3只,原始數(shù)據(jù)均由Illumina HiSeqTM 2000雙端測(cè)序獲得,按文獻(xiàn)[11]方法分析轉(zhuǎn)錄本數(shù)據(jù)。為獲得clean reads便于后續(xù)分析,將接頭、低質(zhì)量序列和未知核苷酸序列過(guò)濾,使用Trinity軟件序列組裝,獲得盡可能長(zhǎng)非冗余unigenes。通過(guò)Bowtie軟件比對(duì)unigenes。使用RSEM工具精確量化每個(gè)樣本轉(zhuǎn)錄豐度。使用FPKM方法計(jì)算每個(gè)轉(zhuǎn)錄產(chǎn)物基因表達(dá)水平。最后,分別提取不同毛色烏蘇里貉KIT基因表達(dá)量方差分析。
從GenBank數(shù)據(jù)庫(kù)檢索已公布的烏蘇里貉KIT基因mRNA序列,登錄號(hào):KM083121,保存完整CDS序列,以便進(jìn)一步生物信息學(xué)分析。
使用DNAMAN軟件中display sequence程序分析CDS序列總長(zhǎng)度及4種堿基含量。通過(guò)在線軟件ORF finder(https://www.ncbi.nlm.nih.gov/orffinder/)分析CDS區(qū)開放閱讀框。
為了解烏蘇里貉KIT基因編碼蛋白一級(jí)結(jié)構(gòu)特征,運(yùn)用Protparam(https://web.expasy.org/protparam/)在線軟件預(yù)測(cè)KIT基因編碼蛋白理化性質(zhì)。運(yùn)用基于Hphob./Kyte&Doolittle模型在線軟件Protscale(https://web.expasy.org/protscale/)預(yù)測(cè)KIT蛋白親水性和疏水性。運(yùn)用在線軟件NetOGly 4.0 Server(http://www.cbs.dtu.dk/services/NetOGlyc/)和 NetNG-ly 1.0 Server(http://www.cbs.dtu.dk/services/NetNG-lyc/)分別預(yù)測(cè)KIT蛋白O-糖基位點(diǎn)和N-糖基位點(diǎn)。最后,使用在線軟件NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)預(yù)測(cè)烏蘇里貉KIT蛋白磷酸化位點(diǎn)[12]。
使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)在線軟件預(yù)測(cè)烏蘇里貉KIT蛋白二級(jí)結(jié)構(gòu)[12]。運(yùn)用在線軟件SingalP(http://www.cbs.dtu.dk/services/SignalP/)定 位分析KIT蛋白信號(hào)肽[13]。通過(guò)TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)在線工具預(yù)測(cè)分析KIT蛋白質(zhì)跨膜區(qū)位置[14]。通過(guò)在線軟件PSORT(https://www.genscript.com/psort.html)和 Softberry(http://linux1.softberry.com/)網(wǎng)站預(yù)測(cè)KIT蛋白亞細(xì)胞定位。通過(guò)NCBI Conserved Domain(https://www.ncbi.nlm.nih.gov/cdd/)尋找KIT蛋白保守結(jié)構(gòu)域[13]。
通過(guò)SWISS-MODEL(https://swissmodel.expasy.org/interactive)網(wǎng)站構(gòu)建KIT蛋白三級(jí)結(jié)構(gòu)模型。運(yùn)用 STRING(https://string-db.org/cgi/input.pl)交互數(shù)據(jù)庫(kù)分析與KIT蛋白密切作用的蛋白質(zhì)。
根據(jù)烏蘇里貉KIT蛋白序列,運(yùn)行BLAST,獲得家犬(AAD28369.1,Canis lupus familiaris)、家貓(NP_001009837.3,F(xiàn)elis catus)、野豬(AFK92989.1,Sus scrofa)、牦牛(XP_005905988.1,Bos mutus)、藏羚羊(XP_005961702.1,Pantholops hodgsonii)、家 馬(NP_001157338.2,Equus caballus)、 家 牛(XP_005207994.2,Bos taurus)7個(gè)物種KIT蛋白序列,運(yùn)用在線軟件Clustal Omeaga(https://www.ebi.ac.uk/Tools/msa/clustalo/)對(duì)8個(gè)物種KIT蛋白序列比對(duì)分析,通過(guò)MEGA5.1軟件中鄰近法構(gòu)建系統(tǒng)發(fā)育樹。
在3種毛色烏蘇里貉轉(zhuǎn)錄本定量表達(dá)中,白貉KIT基因表達(dá)量最高,為1.4746,其次為紅棕貉(0.0748),野生貉KIT基因表達(dá)量最低(0.0246),且白貉KIT基因表達(dá)量顯著高于紅棕貉和野生貉(P<0.05)。
DNAMAN序列分析結(jié)果顯示,烏蘇里貉KIT基因CDS區(qū)長(zhǎng)度為2 919 bp,4種堿基含量依次為A(27.4%,800)>T(25.6%,748)>G(24.6%,719)>C(22.4%,652),其中A+T含量(53%)略高于G+C含量(47%),說(shuō)明該基因穩(wěn)定性較差,ssDNA分子質(zhì)量為902.77,dsDNA分子質(zhì)量為1 799.47。ORF finder開放閱讀框預(yù)測(cè)結(jié)果顯示,起始密碼子ATG編碼Met,終止密碼子TGA不編碼氨基酸,該序列共編碼972個(gè)氨基酸。
2.3.1 理化特性
在線工具Protparam分析理化性質(zhì)結(jié)果表明,烏蘇里貉KIT基因編碼蛋白分子式為C4863H7546N1294O1451S52,由15 206個(gè)原子組成,分子質(zhì)量為109 022.33,消光系數(shù)在280 nm處測(cè)量值為135 120,推測(cè)烏蘇里貉體內(nèi)半衰期為30 h,不穩(wěn)定指數(shù)為37.79(<40),為穩(wěn)定氨基酸,脂肪族氨基酸指數(shù)為81.39,該蛋白質(zhì)序列等電點(diǎn)為6.15,屬于酸性蛋白質(zhì)。
2.3.2 親水性和疏水性
在線工具Proscal分析親水性和疏水性結(jié)果表明,烏蘇里貉KIT基因編碼蛋白中疏水性氨基酸(Ala、Val、Leu、Ile、Phe、Trp、Met、Pro)399個(gè),親水性氨基酸(Gly、Thr、Ser、Cys、Asn、Gln、Tyr、Lys、Arg、His、Asp、Glu)573個(gè),其中,第14位氨基酸為最大疏水性氨基酸(3.589),第364位氨基酸為最大親水性氨基酸(-2.789),且親水性氨基酸(<0)多于疏水性氨基酸(>0),平均親水系數(shù)為負(fù)值(-0.224),因此該蛋白質(zhì)是親水性蛋白質(zhì),結(jié)果見(jiàn)圖1。
2.3.3 烏蘇里貉KIT蛋白的糖基位點(diǎn)和磷酸化位點(diǎn)預(yù)測(cè)
在線軟件NetOGly 4.0 Server分析結(jié)果顯示,烏蘇里貉KIT蛋白共存在12個(gè)O-糖基位點(diǎn),分別在第 28、 30、 38、 709、 939、 950、 955、 958、959、961、962、963位氨基酸。NetNGly 1.0 Server分析結(jié)果表明,烏蘇里貉KIT蛋白共存在9個(gè)N-糖基位點(diǎn),位置分別在第94、130、145、283、300、352、367、400、486位氨基酸。通過(guò)Net-Phos分析磷酸化位點(diǎn)結(jié)果發(fā)現(xiàn),烏蘇里貉KIT蛋白共60個(gè)磷酸化位點(diǎn)分值高于0.5,其中包括35個(gè)絲氨酸(Ser)、10個(gè)蘇氨酸(Thr)、15個(gè)酪氨酸(Tyr),具體位置如表1所示。
通過(guò)SOPMA在線軟件預(yù)測(cè)烏蘇里貉KIT蛋白二級(jí)結(jié)構(gòu)。預(yù)測(cè)結(jié)果顯示,該蛋白有247個(gè)(25.41%)氨基酸形成α螺旋;220個(gè)(22.63%)氨基酸形成延伸直鏈;50個(gè)(5.14%)氨基酸形成β-轉(zhuǎn)角;455個(gè)(46.81%)氨基酸形成無(wú)規(guī)卷曲,因此無(wú)規(guī)卷曲為烏蘇里貉KIT蛋白主要二級(jí)結(jié)構(gòu)。
2.5.1 信號(hào)肽和跨膜區(qū)
在線分析軟件TMHMM預(yù)測(cè)該蛋白存在兩個(gè)跨膜區(qū)結(jié)構(gòu),分別在第517~539、649~671位氨基酸,其余第1~516、672~972位氨基酸位于細(xì)胞膜外側(cè),第540~648位氨基酸位于細(xì)胞膜內(nèi)側(cè)(見(jiàn)圖2)。
在線SignalP軟件預(yù)測(cè)該蛋白質(zhì)信號(hào)肽結(jié)果顯示,該蛋白在第1~25位氨基酸為信號(hào)肽序列,因此推測(cè)該蛋白為分泌型蛋白(見(jiàn)圖3)。
2.5.2 保守結(jié)構(gòu)域
NCBI Conserved Domain預(yù)測(cè)結(jié)果表明,烏蘇里貉KIT蛋白共有4個(gè)保守結(jié)構(gòu)域,包括2個(gè)免疫球蛋白結(jié)構(gòu)域(Ig),分別位于第216~305、426~505位氨基酸殘基,1個(gè)干細(xì)胞因子受體第四免疫球蛋白樣域(Ig4_SCFR),位于第311~411位氨基酸殘基,1個(gè)蛋白激酶C(PKc-like),位于第549~924位氨基酸殘基(見(jiàn)圖4)。
2.5.3 亞細(xì)胞定位
在線軟件PSORT預(yù)測(cè)烏蘇里貉KIT基因編碼蛋白亞細(xì)胞定位結(jié)果顯示,該蛋白存在于內(nèi)質(zhì)網(wǎng)(21.7%)、高爾基體(13.0%)、細(xì)胞膜(34.8%)、細(xì)胞外(30.4%),Softberry網(wǎng)站分析該蛋白定位在細(xì)胞膜上評(píng)分為10.0(滿分)。
通過(guò)SWISS-MODEL對(duì)烏蘇里貉KIT蛋白同源建模,系統(tǒng)根據(jù)蛋白質(zhì)結(jié)構(gòu)域?qū)跆K里貉KIT蛋白分為兩大板塊。根據(jù)烏蘇里貉KIT蛋白第33~507位氨基酸同源建模獲得三級(jí)結(jié)構(gòu),如圖5a所示,包含KIT蛋白2個(gè)Ig和1個(gè)Ig4_SCFR。根據(jù)烏蘇里貉KIT蛋白第547~927位氨基酸同源建模獲得三級(jí)結(jié)構(gòu),如圖5b所示,包含1個(gè)PKc-like。
運(yùn)用STRING預(yù)測(cè)與KIT蛋白相互作用蛋白質(zhì),如圖6所示,其中共有5個(gè)蛋白相關(guān)系數(shù)在0.950以上,包括KIT配體(KITLG),相關(guān)系數(shù)0.998;磷酸肌苷-3激酶(PIK3R1),相關(guān)系數(shù)0.962;磷脂酰肌醇4,5-二磷酸3激酶(PIK3CA),相關(guān)系數(shù)0.961;還有兩個(gè)RAS家族原癌基因NRAS、HRAS,相關(guān)系數(shù)分別為0.960、0.957。
通過(guò)鄰近法構(gòu)建系統(tǒng)發(fā)育樹,其中重復(fù)參數(shù)為1 000,采用鄰近法計(jì)算距離,從系統(tǒng)發(fā)育樹中可見(jiàn),如圖7所示,烏蘇里貉和家犬進(jìn)化距離較近,與家貓聚合為1支,家牛、牦牛、藏羚羊、野豬、家馬聚合為另1支。
黑色素細(xì)胞起源于胚胎發(fā)育時(shí)神經(jīng)嵴細(xì)胞,KIT基因可調(diào)控神經(jīng)嵴細(xì)胞分化、存活和遷移[15-16],是黑色素細(xì)胞成熟關(guān)鍵。理論上,KIT基因表達(dá)量較多利于黑色素細(xì)胞成熟,可產(chǎn)生較多黑色素,機(jī)體顏色加深。斑嘴野鴨KIT基因在褐羽和黃白羽中表達(dá)量均顯著高于白羽(P<0.05)[17],騮色蒙古馬KIT基因表達(dá)量極顯著高于白色蒙古馬(P<0.01)[3],Du等研究結(jié)果表明,白貉被毛中黑色素含量顯著低于野生貉[11]。3種毛色烏蘇里貉轉(zhuǎn)錄本定量結(jié)果表示,KIT基因在白貉中表達(dá)量最高,其次是紅棕貉,而野生貉KIT基因表達(dá)量最低,與烏蘇里貉KIT基因表達(dá)量和毛色表型關(guān)系不符,可能是烏蘇里貉KIT基因及其編碼蛋白結(jié)構(gòu)與其他動(dòng)物不同所致。
文章從全球最大基因數(shù)據(jù)庫(kù)GenBank中檢索到烏蘇里貉KIT基因CDS序列作生物信息學(xué)分析,結(jié)果表明,KIT基因CDS序列全長(zhǎng)2 919 bp,共編碼972個(gè)氨基酸。使用TMHMM和SignalP在線網(wǎng)站,基于神經(jīng)網(wǎng)絡(luò)算法分別精準(zhǔn)預(yù)測(cè)蛋白質(zhì)跨膜區(qū)和信號(hào)肽,根據(jù)分析結(jié)果推測(cè)該信號(hào)肽位于氨基酸序列N端且分布在細(xì)胞膜外側(cè),信號(hào)肽可調(diào)控大多數(shù)蛋白質(zhì)分泌[18-19]。根據(jù)跨膜區(qū)和結(jié)構(gòu)域分析結(jié)果,2個(gè)Ig和1個(gè)Ig4_SCFR位于氨基酸序列N端且分布在細(xì)胞膜外側(cè),1個(gè)PKc-like位于氨基酸序列C端且分布在細(xì)胞膜外側(cè)。根據(jù)跨膜區(qū)和糖基化分析結(jié)果預(yù)測(cè),O-糖基和N-糖基全部在細(xì)胞膜外側(cè),且O-糖基主要分布在氨基酸序列C端,少數(shù)分布在N端。N-糖基分布在氨基酸序列N端。烏蘇里貉KIT蛋白首先在內(nèi)質(zhì)網(wǎng)中作N端糖基化修飾,再轉(zhuǎn)運(yùn)到高爾基體中作復(fù)雜的糖基化修飾,最后到細(xì)胞膜表面表現(xiàn)生物學(xué)功能[20-21]。Softberry和PSORT為預(yù)測(cè)蛋白質(zhì)亞細(xì)胞定位常用在線網(wǎng)站,Softberry網(wǎng)站功能全面,預(yù)測(cè)結(jié)果以評(píng)分表示,內(nèi)容較詳細(xì)。PSORT網(wǎng)站功能較單一,預(yù)測(cè)結(jié)果百分比表示。通過(guò)PSORT網(wǎng)站對(duì)烏蘇里貉KIT蛋白亞細(xì)胞定位預(yù)測(cè)分析結(jié)果顯示,該蛋白質(zhì)主要在細(xì)胞膜上發(fā)揮功能,與Softberry預(yù)測(cè)結(jié)果一致。根據(jù)跨膜區(qū)和磷酸化分析結(jié)果,KIT蛋白磷酸化位點(diǎn)有7個(gè)在細(xì)胞膜內(nèi)側(cè),53個(gè)在細(xì)胞膜外側(cè),其中氨基酸序列N端存在30個(gè),氨基酸序列C端存在23個(gè),兩個(gè)跨膜區(qū)均不存在磷酸化位點(diǎn)。因此,研究結(jié)果闡明烏蘇里貉KIT基因編碼蛋白的性質(zhì),可為進(jìn)一步研究提供參考數(shù)據(jù)。
根據(jù)BLAST分析結(jié)果構(gòu)建系統(tǒng)發(fā)育樹,發(fā)現(xiàn)烏蘇里貉、家犬和家貓聚合為一大支,表明烏蘇里貉KIT蛋白結(jié)構(gòu)與家犬、家貓相似。紅褐貉第二外顯子長(zhǎng)為276 bp,與家犬、家貓同源性分別為97%、92%,且對(duì)野生貉、白貉、紅褐貉第二外顯子分析未發(fā)現(xiàn)突變位點(diǎn)[9],張巧靈等分析羊駝KIT基因exon10-19表明,其酪氨酸激酶活性位點(diǎn)僅橫跨12個(gè)氨基酸,而烏蘇里貉酪氨酸激酶549~924位于氨基酸殘基之間[22],約占KIT蛋白總長(zhǎng)度一半。不同動(dòng)物KIT蛋白結(jié)構(gòu)不同,酪氨酸激酶結(jié)構(gòu)域活性可影響KIT蛋白磷酸化,磷酸化轉(zhuǎn)化調(diào)控對(duì)干細(xì)胞遷移和下游信號(hào)轉(zhuǎn)導(dǎo)具有關(guān)鍵作用[23]。在具有白色斑點(diǎn)的冰島馬皮膚中發(fā)現(xiàn),KIT基因17號(hào)外顯子中缺失一個(gè)堿基,證實(shí)該缺失可阻礙黑色素細(xì)胞內(nèi)酪氨酸激酶結(jié)構(gòu)域功能。狐貍KIT基因17號(hào)外顯子缺失導(dǎo)致酪氨酸激酶域結(jié)構(gòu)和功能發(fā)生改變,赤狐被毛表現(xiàn)為鉑金色[24]。藍(lán)狐KIT基因12號(hào)外顯子缺失導(dǎo)致酪氨酸激酶活性發(fā)生改變,被毛表現(xiàn)為白色[5]。而在烏蘇里貉KIT基因中并未發(fā)現(xiàn)與毛色相關(guān)的單核苷酸位點(diǎn)[10],F(xiàn)rischknecht報(bào)道全長(zhǎng)7 125 bp的FERV1插入KIT基因內(nèi)含子1中,導(dǎo)致貓產(chǎn)生白色斑點(diǎn)[25]。目前,對(duì)于各物種KIT基因結(jié)構(gòu)研究較少,烏蘇里貉KIT蛋白研究結(jié)果可為進(jìn)一步比較分析提供參考。烏蘇里貉KIT基因轉(zhuǎn)錄及翻譯調(diào)控研究仍較少,是否存在miRNA調(diào)控仍未知,由于抗體有限,測(cè)定不同毛色烏蘇里貉KIT蛋白表達(dá)量仍有難度。推測(cè)烏蘇里貉毛色也可能受KIT基因非編碼區(qū)調(diào)控,或是通過(guò)一種負(fù)反饋調(diào)節(jié)黑色素形成。