劉亞銘, 陳 高, 秦 松, 崔玉琳, 崔紅利
(1. 中國(guó)科學(xué)院 煙臺(tái)海岸帶研究所 海岸帶生物學(xué)與生物資源利用重點(diǎn)實(shí)驗(yàn)室, 煙臺(tái) 264003;2. 中國(guó)科學(xué)院大學(xué), 北京 101418; 3. 山東省農(nóng)業(yè)科學(xué)院 生物技術(shù)研究中心, 濟(jì)南 250100;4. 山東省作物遺傳改良與生態(tài)生理重點(diǎn)實(shí)驗(yàn)室, 濟(jì)南 250100;5. 山西農(nóng)業(yè)大學(xué) 分子農(nóng)業(yè)與生物能源研究所, 太谷 030801)
糖類物質(zhì)是地球上生物最重要、最基本的能量來源,細(xì)胞攝取糖類物質(zhì)是生物體生長(zhǎng)、代謝和穩(wěn)態(tài)至關(guān)重要的一個(gè)過程。而糖類物質(zhì)自身無法進(jìn)入細(xì)胞內(nèi)發(fā)揮作用,必須依靠轉(zhuǎn)運(yùn)蛋白這種“運(yùn)輸機(jī)器”,因此研究糖轉(zhuǎn)運(yùn)蛋白對(duì)了解糖的吸收、代謝方面具有重要的意義。糖轉(zhuǎn)運(yùn)蛋白是一類位于細(xì)胞膜上的重要載體蛋白,可以將胞外的糖類物質(zhì)轉(zhuǎn)運(yùn)至胞內(nèi)供細(xì)胞代謝利用,其廣泛分布于真核微藻及高等動(dòng)植物中,其中真核微藻中的糖轉(zhuǎn)運(yùn)蛋白屬于MFS (major facilitator superfamily)轉(zhuǎn)運(yùn)蛋白家族[1]。依據(jù)轉(zhuǎn)運(yùn)糖的類型劃分,真核微藻中的糖轉(zhuǎn)運(yùn)蛋白屬于單糖轉(zhuǎn)運(yùn)蛋白;依據(jù)轉(zhuǎn)運(yùn)蛋白轉(zhuǎn)運(yùn)方式的劃分,而真核微藻中的糖轉(zhuǎn)運(yùn)蛋白屬于次級(jí)主動(dòng)轉(zhuǎn)運(yùn)蛋白中的同向轉(zhuǎn)運(yùn)蛋白[2]。糖轉(zhuǎn)運(yùn)蛋白大多由400~600個(gè)氨基酸殘基組成, 二級(jí)結(jié)構(gòu)預(yù)測(cè)糖轉(zhuǎn)運(yùn)蛋白大多具有12次跨膜α-螺旋結(jié)構(gòu)域,這種結(jié)構(gòu)被命名為“MFS fold”, 12次α螺旋又分為2個(gè)結(jié)構(gòu)域: N端結(jié)構(gòu)域和C端結(jié)構(gòu)域,每個(gè)結(jié)構(gòu)域都由6個(gè)α-螺旋組成, 雖然2個(gè)結(jié)構(gòu)域中氨基酸序列同源性很低, 但從結(jié)構(gòu)上觀察2個(gè)結(jié)構(gòu)域呈現(xiàn)二次對(duì)稱[2]。
糖類被植物利用的研究始于真核微藻,Tanner等證明綠藻有利用葡萄糖的能力; Sauer和Tanner(1989)發(fā)現(xiàn)了植物的第一個(gè)糖轉(zhuǎn)運(yùn)蛋白基因——源于小球藻的HUP1(H+/hexose cotransporter 1),并證明HUP1編碼的蛋白為單糖-H+同向轉(zhuǎn)運(yùn)蛋白(monosaccharide-H+symptor)[3];對(duì)HUP1的氨基酸序列分析后發(fā)現(xiàn)與哺乳動(dòng)物[4]、酵母[5]和細(xì)菌[6]中的單糖-H+同向轉(zhuǎn)運(yùn)蛋白具有很高的同源性。之后在此基礎(chǔ)上以HUP1序列為探針,對(duì)一些高等植物的基因組文庫(kù)進(jìn)行了篩選, 在擬南芥和煙草中找到與HUP1高度同源的單糖轉(zhuǎn)運(yùn)蛋白基因[7-8]。
小球藻中的單糖轉(zhuǎn)運(yùn)蛋白家族分為HUP1、HUP2和HUP3。其中HUP1蛋白主要轉(zhuǎn)運(yùn)葡萄糖,為葡萄糖-H+同向共轉(zhuǎn)運(yùn)蛋白[9];HUP2蛋白主要轉(zhuǎn)運(yùn)半乳糖,是半乳糖-H+同向共轉(zhuǎn)運(yùn)蛋白[7, 10];而HUP3蛋白雖然轉(zhuǎn)運(yùn)葡萄糖,但轉(zhuǎn)運(yùn)量極少,也是葡萄糖-H+同向共轉(zhuǎn)運(yùn)蛋白[9]。
真核微藻屬于一類古老的植物,具有復(fù)雜的進(jìn)化歷史和廣泛的分布,是逆境生理研究理想的實(shí)驗(yàn)材料,目前,已經(jīng)完成和正在完成基因組測(cè)序的真核微藻有28株,大量真核微藻基因組數(shù)據(jù)的釋放為比較基因組學(xué)研究提供了強(qiáng)有力的支持。作者選取已經(jīng)被功能鑒定的糖轉(zhuǎn)運(yùn)蛋白序列作為源序列, 利用同源比對(duì)的方法對(duì)真核微藻基因組序列進(jìn)行搜索, 發(fā)現(xiàn)編碼糖轉(zhuǎn)運(yùn)蛋白的基因序列廣泛存在。本實(shí)驗(yàn)建立了微藻糖轉(zhuǎn)運(yùn)蛋白基因-結(jié)構(gòu)-功能的框架結(jié)構(gòu),為之后探討利用外源葡萄糖機(jī)制提供參考,同時(shí)為后期利用代謝工程手段構(gòu)建優(yōu)良藻株奠定基礎(chǔ)。
從NCBI的數(shù)據(jù)庫(kù)和JGI Genome Portal的數(shù)據(jù)庫(kù)中下載28株真核微藻的Fasta格式的全基因組氨基酸數(shù)據(jù)庫(kù),包括Chlamydomonasreinhardtii,Chlorellasp. NC64A,Chlorellavulgaris,Coccomyxasp. C-169,Volvoxcarteri,Micromonaspusilla,Micromonassp. RCC299,Ostreococcussp. RCC809,Ostreococcustauri,Ostreococcuslucimarinus,Phaeodactylumtricornutum,Thalassiosirapseudonana,Fragilariopsiscylindrus,Aureococcusanophagefferens,Auxenochlorellaprotothecoides,Emillianiahuxleyi,Guillardiatheta,BigelowiellanatansCCMP2755,Monoraphidiumneglectum,Pseudo-nitzschiamultiseriesCLN-47,Thalassiosiraoceanic,Galdieriasulphuraria,PorphyridiumcruentumCCMP1328,Nannochloropsisgaditana,AurantiochytriumlimacinumATCC MYA-1381,Symbiodiniumminutum,Chrysochromulinasp. CCMP291,Klebsormidiumflaccidum。原始紅藻(Cyanidioschyzonmerolae)的全基因組氨基酸數(shù)據(jù)從原始紅藻基因組計(jì)劃網(wǎng)頁(yè)(http:merolae.biol.s.u-tokyo.ac.jp/)下載。用于本地blast搜索的糖轉(zhuǎn)運(yùn)蛋白基因是根據(jù)文獻(xiàn)報(bào)道的已經(jīng)進(jìn)行功能驗(yàn)證的小球藻(chlorellakessleri)的HUP1、HUP2和HUP3(表1)。
表1 作為源序列的功能已知的糖轉(zhuǎn)運(yùn)蛋白基因
將29株真核微藻基因組數(shù)據(jù)分別建立一個(gè)本地?cái)?shù)據(jù)庫(kù),以HUP1、HUP2和HUP3基因作為源序列,利用BLASTP程序搜索29株真核微藻的基因組數(shù)據(jù)庫(kù)。為了排除假陰性,采用HMMER程序進(jìn)行目的基因的重新搜索。對(duì)兩種方法獲得目的基因序列合并和分析,刪除重復(fù)序列。為了排除目的序列中的假陽(yáng)性,采用SMART,Pfam和CDD軟件進(jìn)行蛋白結(jié)構(gòu)域分析。
采用Clustal X2將搜索出來的目的蛋白序列進(jìn)行了對(duì)比和人工調(diào)整。建樹模型的選擇采用Protest軟件,LG模型被選擇進(jìn)行系統(tǒng)進(jìn)化樹的構(gòu)建,采用MEGA6軟件最大似然法構(gòu)建系統(tǒng)進(jìn)化樹。采用Pfam, SMART及CDD等軟件進(jìn)行結(jié)構(gòu)域分析,采用TMHMM進(jìn)行跨膜區(qū)預(yù)測(cè),亞細(xì)胞定位預(yù)測(cè)和分析采用TargetP。
從29株真核微藻基因組中我們發(fā)現(xiàn)了9個(gè)HUP1,39個(gè)HUP2和22個(gè)HUP3類型的糖轉(zhuǎn)運(yùn)蛋白基因。HUP的種類數(shù)量在不同真核微藻基因組中的分布是不一樣的。
在糖轉(zhuǎn)運(yùn)蛋白基因家族中,HUP1的同源基因分布于9種藻株中,包括綠藻門(C.reinhardtii,M.pusilla,C.sp. C-169,C.variabilis,C. sp. NC64A,O. sp. RCC809)、不定鞭藻門(A.anophagefferens,A.limacinumATCC MYA-1381)和絲足蟲門(B.natansCCMP2755)。HUP2的同源基因廣泛分布于所有的硅藻門, 不定鞭藻門及定鞭藻門中,但是在其他藻株中缺失了,包括綠藻門(C.reinhardtii,O.tauri,O. sp. RCC809)、紅藻門(P.cruentumCCMP1328)、定甲藻門(S.minutum)和隱藻門(G.theta)。HUP3的同源基因僅分布于8種藻株中,包括綠藻門(C.variabilis,C. sp. NC64A,M.sp.RCC299,O.tauri,O.sp. RCC809)、紅藻門(P.cruentumCCMP1328,G.sulphuraria), 硅藻門(P.multiseriesCLN-47,F(xiàn).cylindrus) 、不定鞭藻門(A.limacinumATCC MYA-1381)
圖1真核微藻中糖轉(zhuǎn)運(yùn)蛋白的HUP1結(jié)構(gòu)域分析
Figure 1 HUP1 Domain structure of sugar transporter from algae
有些微藻基因組中發(fā)現(xiàn)了基因復(fù)制現(xiàn)象,如HUP2基因在淡水綠藻(C.subellipsoideaC-169 NIES2166,C.variabilis,C.sp.NC64A)和海洋綠藻(A.protothecoides)的基因組中有多個(gè)拷貝,說明在這個(gè)基因的進(jìn)化過程中發(fā)生了物種特異性的基因復(fù)制現(xiàn)象。與之相類似,HUP3基因在一些藻株的基因組中具有兩個(gè)或者更多拷貝,尤其是雜色藻株中,說明也存在基因復(fù)制現(xiàn)象。
為了進(jìn)一步研究真核微藻來源的糖轉(zhuǎn)運(yùn)蛋白,將糖轉(zhuǎn)運(yùn)蛋白基因進(jìn)行比對(duì)分析,發(fā)現(xiàn)共有12個(gè)非常保守的結(jié)構(gòu)域存在于所有的真核微藻來源的糖轉(zhuǎn)運(yùn)蛋白中(圖1)。來源于不同類型藻株的HUP1具有高度相似的結(jié)構(gòu)域,說明這個(gè)基因的出現(xiàn)早于不同類型的藻株的形成之前。HUP家族起轉(zhuǎn)運(yùn)作用的保守結(jié)構(gòu)域存在于所有的HUP序列中,如CD1、CD3、CD6、CD8、CD9、CD10、CD11、CD12為跨膜螺旋結(jié)構(gòu)TMS(transmembrane-spanner), CD2、CD4、CD9為結(jié)合糖類物質(zhì)的結(jié)構(gòu)SP (sugar porter) ,CD5和CD7為糖轉(zhuǎn)運(yùn)結(jié)構(gòu)Sugar_tr(Sugar transporter),這些結(jié)構(gòu)域在糖轉(zhuǎn)運(yùn)蛋白序列中高度相似,暗示具有共同的起源。
為了研究糖轉(zhuǎn)運(yùn)蛋白基因的起源和系統(tǒng)進(jìn)化歷史,來源真核微藻的 HUP1類型、HUP2類型和HUP3類型的氨基酸序列進(jìn)行系統(tǒng)進(jìn)化分析(圖2)。本研究采用的真核微藻以外的糖轉(zhuǎn)運(yùn)蛋白基因總結(jié)見表2。
圖2真核微藻糖轉(zhuǎn)運(yùn)蛋白的系統(tǒng)進(jìn)化樹
Figure 2 A maximum likelihood tree of our sugar transporter database and some other sugar transporter from bacteria
表2 系統(tǒng)進(jìn)化樹中采用的真核微藻以外生物來源的糖運(yùn)蛋白基因
真核微藻的糖轉(zhuǎn)運(yùn)蛋白基因分成3個(gè)單系群,即為HUP1、HUP2和HUP3。來源于所有藻株編碼的HUP2基因形成了單系群,這種進(jìn)化方式說明HUP2基因出現(xiàn)是在藻株多樣性形成之前。從系統(tǒng)進(jìn)化樹可以看出,與編碼HUP1和HUP3的基因相比較,編碼HUP2的基因是一個(gè)更為古老的基因。編碼HUP2和HUP3的基因在進(jìn)化上比較相近,可能是由HUP2的基因復(fù)制而來,在之后的進(jìn)化過程中分化形成不同的功能。來源細(xì)菌、真核微藻的糖轉(zhuǎn)運(yùn)蛋白形成一個(gè)單系群(BS:91%),這種進(jìn)化關(guān)系說明真核微藻的糖轉(zhuǎn)運(yùn)蛋白基因起源于細(xì)菌。
3種不同類型的糖轉(zhuǎn)運(yùn)蛋白(HUP1、HUP2和HUP3)在真核微藻基因組中都有發(fā)現(xiàn),但是不同的藻株含有的種類和數(shù)量不一致,揭示糖轉(zhuǎn)運(yùn)蛋白基因在這些藻株的后續(xù)進(jìn)化歷史中經(jīng)歷了不同的過程。在真核微藻的進(jìn)化過程中基因復(fù)制,丟失及基因轉(zhuǎn)移是常見的方式。
預(yù)測(cè)的HUP1的同源基因僅分布于8種藻株中,包括綠藻門(C.reinhardtii,M.pusilla,O.lucimarinus,O. sp. RCC809)、不定鞭藻門(A.anophagefferens,A.limacinumATCC MYA-1381)、絲足蟲門(B.natansCCMP2755)和甲藻門(S.minutum)。在真核微藻和高等植物中,HUP1類型的糖轉(zhuǎn)運(yùn)蛋白長(zhǎng)久以來被認(rèn)為是唯一的參與糖轉(zhuǎn)運(yùn)的蛋白[10]。編碼 HUP1的基因已經(jīng)從很多生物中進(jìn)行了基因克隆和功能驗(yàn)證,包括萊茵衣藻[11]及大腸桿菌[12],不僅如此小球藻HUP1表達(dá)的蛋白純化以及其體外重建已經(jīng)完成[13-14]。
我們的實(shí)驗(yàn)發(fā)現(xiàn)真核微藻的糖轉(zhuǎn)運(yùn)蛋白基因起源于細(xì)菌起源,糖轉(zhuǎn)運(yùn)蛋白幫助底物完成跨膜運(yùn)輸?shù)倪^程需要線粒體供能,這與真核微藻中的線粒體起源于細(xì)菌的理論相符合[15]。
HUP2的基因是比較古老的基因,它的出現(xiàn)早于現(xiàn)有的不同類型的真核微藻多樣性形成之前。編碼HUP1和HUP3的基因是通過基因復(fù)制獲得,在進(jìn)化過程中受到特殊自然選擇壓力而進(jìn)行了功能分化。在進(jìn)化過程中,基因復(fù)制及水平轉(zhuǎn)移現(xiàn)象在糖轉(zhuǎn)運(yùn)蛋白基因進(jìn)化過程中發(fā)揮重要作用。盡管預(yù)測(cè)出來的糖轉(zhuǎn)運(yùn)蛋白基因大多數(shù)沒有進(jìn)行基因克隆和功能驗(yàn)證,但本研究初步建立了真核微藻糖轉(zhuǎn)運(yùn)蛋白的序列-種類-分布-結(jié)構(gòu)-起源-進(jìn)化的框架結(jié)構(gòu),為進(jìn)一步研究糖轉(zhuǎn)運(yùn)蛋白的功能奠定了基礎(chǔ)。