高立芳,曾新安,金可沆,范土貴,彭名軍,曾巧輝*
(1.佛山科學技術學院食品科學與工程學院,廣東省食品智能制造重點實驗室,廣東佛山 528225)(2.廣州市食品檢驗所,廣東廣州 511400)
蛋白質是人體所必須的重要的營養(yǎng)物質之一。通常,蛋白質進入人體后,經過胃腸道消化酶的降解才能被機體吸收,其在人體不是僅以氨基酸形式被吸收,更多是以肽的形式被吸收[1]。小分子生物肽的分子量小、結構簡單,且可快速透過小腸黏膜被吸收,相較于游離氨基酸,吸收耗能低、轉運速度快、載體不易飽和[2]。因此,食品蛋白質源的小分子活性肽的吸收、轉化和利用具有高效性[3]。海洋生物中存在豐富的生物活性天然產物可以用于開發(fā)治療多種人類疾病[4]。近年來,人們越發(fā)關注從魚類、藻類、甲殼類動物和海綿中分離和鑒定具有廣泛生物活性的蛋白質和多肽。
藻類蛋白是人類重要的海洋蛋白質來源,且其經酶解后能釋放出具有生物活性的小分子肽。研究表明,大豆、牛奶、帶魚等食物的酶解產物具有降血脂、抗炎癥、降血糖、抗抑郁等多種生物活性[5-7]。蛋白酶激活受體(PARs)是G 蛋白偶聯受體家族的一員,與人體內許多的生理反應相關[8],且參與誘發(fā)多種疾病的發(fā)生,如各種炎癥、癌癥、冠心病和糖尿病等[9-11]。通常情況下,PARs 的N 末端序列被絲氨酸蛋白酶水解切割而發(fā)生不可逆的激活,暴露含有系鎖配體的新的N 末端,新的N 末端作為系鎖配體可與PARs 進行分子內結合,從而實現自發(fā)激活,進而引發(fā)細胞級偶聯反應以響應炎癥信號和其它刺激反應[12]。PARs 包含有四種亞型,分別為PAR1、PAR2、PAR3、PAR4,其中蛋白酶激活受體2(PAR2)比較特殊,且不能被凝血酶激活[13],而PAR2 主要激活劑包括胰蛋白酶、類胰蛋白酶和彈性蛋白酶,其中胰蛋白酶是最有效的PAR-2 激活劑[14]。
我國是藻類生產消費大國,常見的藻類品種有海帶(Laminariajaponica)、紫菜(Porphyra)、裙帶菜(UndariapinnatifidaSuringar)、江蘺(Gracilaria)、螺旋藻(Spirulina)以及微藻杜氏藻(Microalgae Dunaliella)等[15],其富含優(yōu)質蛋白。目前,基于計算機的分子模擬技術高速發(fā)展,能一定程度上減少傳統科研實驗存在的耗時、費力、缺乏靶向性等問題。傳統的生物活性肽主要是從蛋白質酶解產物的分離純化和活性鑒定開展研究,其不僅存在上述局限性,還有可能導致微量但活性高的生物活性肽的損失。
本研究利用生物數據庫和基于計算機模擬的多肽-蛋白分子對接技術,理論上從食用藻類蛋白質中篩選具有蛋白酶激活受體2(PAR2)抑制作用的小分子多肽;以對接分數和配體與受體相互作用力作為評估藻類蛋白質源多肽對PAR2 的抑制潛力的依據,為藻類蛋白的開發(fā)利用以及PAR2 抑制劑發(fā)掘研究提供參考。
在NCBI 數據庫(https://www.ncbi.nlm.nih.gov/)[16]中輸入“Edible algae”,結合蛋白質晶體數據庫(PDB),檢索出所有種類食用藻類蛋白,并下載各種蛋白質的氨基酸序列。從PDB 數據庫獲取蛋白酶激活受體2(PAR2)的晶體結構(PDB:5NDD,5NDZ),利用PyMol 軟件分別將受體和配體8TZ(C13H15FN2O,結構見圖1a),8UN(C30H27BrN4O3,結構見圖1b)分離,并保存為PDB 文件。8TZ 作為蛋白酶激活受體2的拮抗劑,結合在受體外表面附近一個完全閉塞的口袋中,其主要與PAR2 氨基酸序列上的Asp228、Tyr82和His135 形成氫鍵,從而穩(wěn)定受體的無活性狀態(tài)以防止激動劑的活化變構。抑制劑8UN 具有高度的親脂性,主要通過疏水作用與受體結合在蛋白螺旋表面偏遠的變構位點上,從而限制激動劑結合后受體激活所需的螺旋間構象重排。
圖1 抑制劑8TZ、8UN 的分子結構和蛋白酶激活受體2 與兩個抑制劑配體對接的2D 結構Fig.1 Molecular structure of the inhibitors 8TZ and 8UN and 2D structure of the protease-activated receptor 2 docked to two inhibitor ligands
根據Yao 等[5]采用的方法,將從NCBI 數據庫獲得食用藻中常見的11 種蛋白質序列導入BIOPEP-UWM數據庫中,預測被胃蛋白酶、胰蛋白酶和胰凝乳蛋白酶這三種腸胃酶的作用情況,模擬人體胃腸道消化的過程。將模擬人體胃腸消化所得的理論肽進一步分析獲得潛在生物活性肽,并且對其進行更深一層的分析。
人體對螺旋藻蛋白的消化能力可以通過理論水解度TDH 來進行表示。
式中:
TDH——蛋白質水解過程中被裂解的肽鍵數與給定蛋白質的總肽鍵數之比,%;
D——蛋白質中肽鍵總數;
d——氫的數目[17]。
使用Peptide Ranker 服務器評估螺旋藻蛋白質酶解產物的生物學活性,并對小分子肽進行綜合評分篩選。在相應數據庫中輸入寡肽的氨基縮寫序列可得到介于0~1 的評分,評分越高說明該寡肽的生物活性越高。在本研究中,當預測的肽段分數超過0.50 時,則可以認為該肽段具有潛在生物活性。
目前,ToxinPred 程序已廣泛運用于多肽研究的分子對接虛擬篩選中[18],其預測功能可以有效避免有毒小分子肽進入人體內從而對身體健康造成危害。水溶性是影響生物活性肽吸收、發(fā)揮活性作用的主要因素,本研究采用Innovagen(http://www.innovagen.com/)和ToxinPred 網站對高活性肽進行預測,挑選潛在生物活性高、無毒且水溶性好的寡肽片段進行下一步對接研究。
HPEPDOCK 是一種開展蛋白-多肽對接模擬研究的在線工具[16]。在HPEPDOCK 數據庫中可將受體與篩選出的多肽進行對接,選擇分離出來的配體作為對接參照;將分子對接評分≤-100 的寡肽視為高親和、分子對接評分≤-150 的寡肽為超高親和。
同時,用F 值來評價蛋白質抑制蛋白酶激活受體2(PAR2)的能力。
式中:
F——出現頻率;
N——蛋白鏈內高親和寡肽的數量;
L——蛋白鏈的長度。
利用PyMol 軟件對受體和寡肽進行處理,構建對接復合物的三維空間結構以及分子間作用力。通過LigPlus(版本號:V.2.2)分析高親和力寡肽與PAR2受體結合的疏水殘基和氫鍵作用[17]。
所有數據均采用Excel 軟件進行分析。
根據蛋白質在食用藻中含量高、活性強、研究廣泛的原則,從NCBI 數據庫中篩選食用藻來源的代表性蛋白質,利用BIOPEP-UWM 數據庫模擬胃腸道消化酶(胰凝乳蛋白酶、胰蛋白酶和胃蛋白酶)水解上述篩選的蛋白質。結果如表1 所示。
表1 食用藻類蛋白質情況Table 1 Introduction of edible algae protein
表2 藻類蛋白結合蛋白酶激活受體2 的寡肽序列和頻率Table 2 Oligopeptide sequence and frequency of algal protein binding PAR 2
挑選螺旋藻、小球藻、紫菜、江蘺以及裙帶菜等五種市場上常見的高營養(yǎng)價值的食用藻類,根據每種酶均有其固定的切割位點這一特性,采用NCBI 和BIOPEP-UWM 數據庫處理、模擬酶水解可得到,水解度TDH 基本上大于30%,最高不超過50%;水解后的產物主要是氨基酸和寡肽,其中,NADH 脫氫酶和4-α-葡聚糖轉移酶的水解度較高,分別達到了49.13%和43.63%,另外,水解度最低的則是裙帶菜的核酮糖1,5-二磷酸羧化酶只有28.24%;水解后發(fā)現產生多肽數量最多的是4-α-葡聚糖轉移酶可達到121,其次是熱休克蛋白70 為118;serpin 家族蛋白產生高活性肽數量最多為46,4-α-葡聚糖轉移酶和別藻藍蛋白均為41。
生物信息學(Bioinformatics)是綜合運用生物學、信息科學的各種知識和工具,對復雜的生物數據進行獲取、處理、存儲、分發(fā)、分析和解釋,從而得到我們能夠理解和接受的各種知識的一種技術。生物信息學工具在近年來發(fā)展飛速,在活性肽發(fā)掘研究中有著廣泛應用[19]。步營等在研究抗SARS-CoV-2 海洋活性肽時運用了PeptideRanker 和ToxinPred 等生物信息學工具[18]。當前,各種數據庫與多肽理化性質預測工具如在線工具Innovagen 軟件以及預測活性肽的吸收(Adsorptin)、分布(Distribution)、代謝(Metabolism)、排泄(Excretion)和毒性(Toxicity)的AdmetSAR 軟件等都在活性肽的模擬篩選發(fā)揮著重要作用[18-20]。對比傳統的生物活性肽研究方法,利用生物信息學技術可以節(jié)省獲得活性肽構效關系的成本,實現了天然活性肽的快速高通量篩選。同時,生物質譜中的液相色譜-飛行時間串聯質譜以及四級桿線性離子阱質譜被逐漸應用于生物活性肽的結構分析,并輔以質譜數據解析軟件ProteinPilot,縮短了活性肽結構表征的周期[21]。
使用Peptide Ranker 工具來分析通過水解得到的寡肽,并篩選出具有潛在活性的寡肽,從而開展后續(xù)更深入的研究。篩選出的活性潛力較高、水溶性好的寡肽如表3 所示。由表3 可知,蛋白質serpin 家族蛋白(46)來源的且具有理論活性的寡肽數量是最多,其次是4-α-葡聚糖轉移酶(41)?;钚灶A測得分位于前三的寡肽分別是DF、DW 和GIDGPF 分子量分別為280.29、319.33 和604.74,肽段的生物活性并沒有隨分子量的增大而增大,其它肽段沒有展現出肽段的生物活性隨分子量的增大而降低,所以肽段的分子量與生物活性沒有直接的相關性??梢钥吹筋A測得分較高的寡肽多集中在含有2~3 個氨基酸序列小分子肽之間。水溶性好的多肽都含有極性氨基酸。
表3 模擬水解獲得的高活性寡肽及有效抑制蛋白酶激活受體2 活性的小分子寡肽Table 3 Highly active oligopeptides obtained by simulated hydrolysis and small molecule oligopeptides that effectively inhibit protease-activated receptor 2 activity
蛋白質和多肽是食用藻類中重要的生物營養(yǎng)物質,具有多種保健功效和生物活性,如促進外源營養(yǎng)成分的消化和吸收、抗光老化、抗腫瘤、抗氧化等[22]。大部分寡肽被肽酶再次水解為二肽和三肽,由PepT1轉運至細胞內,而后被細胞內肽酶水解為游離氨基酸,進而通過細胞途徑和載體轉運系統完整吸收進入體循環(huán)。多數被吸收的小分子肽都被血管內皮組織肽酶和可溶性血漿肽酶分解為氨基酸[1]。
目前,影響口服肽生物利用度的兩個重要因素是肽對胃腸道酶降解的抵抗及其通過腸細胞定向運輸的效率。腸道中二肽和三肽的主要轉運途徑是PepT1 介導的轉運系統,四肽和五肽則主要通過細胞旁緊密連接途徑轉運[23]。一些報道發(fā)現,某些具有2~8 個氨基酸殘基的肽可抑抑制DPP-IV,其活性受序列長短、疏水性、氨基酸組成等各種因素影響[24]。因此,現有研究往往選用肽鏈長度在2~8 之間的寡肽開展蛋白酶激活受體2(PAR2)分子對接研究。
使用在線工具Innovagen和ToxinPred程序來分別對篩選出來的具有生物化學潛力的寡肽進行水溶性預測以及預測所選肽段的毒性、測定分子量等其他理化數據,具體結果如表3 所展示。結果發(fā)現所選用的寡肽均無毒無害,這很有可能和構成肽段的氨基酸的種類以及其結構相關。采用ToxinPred 對所選寡肽進行毒性預測,發(fā)現所挑選的肽段均無毒,可進一步用作食品藥品方面的研究。另外,肽段的親水性的負值越大代表其親水能力越強;正值越大則代表其疏水能力越強[26]。
近年來,分子對接(MolecularDocking)技術作為探究關蛋白-配體的結合狀態(tài)、食品功能性成分作用位點、農獸藥作用機理的一種新興技術,因能克服科學實驗存在的局限性,在食品領域的應用日益廣泛。Auwal等使用Schr?dinger軟件對石頭魚蛋白的水解產物抑制肽與血管緊張素轉化酶(Angiotensin Converting Enzyme,ACE)進行分子對接,從分子水平上解釋了這些抑制肽的ACE 抑制作用。步營借助Discovery Studio 軟件篩選抗SARS-CoV-2 海洋活性肽,并分析了分子間的相互作用[18]。該技術利用計算機模擬程序把配體小分子放在受體活性位點處,按照幾何互補和能量互補的原則,通過打分函數篩選出配體與受體間的最佳結合模式[27]。
HPEPDOCK(http://huanglab.phys.hust.edu.cn/hpepdock/)是一款模擬蛋白-多肽對接的在線工具。Weng 等[28]測試了14 種常見對接軟件,包括:三個蛋白-蛋白對接軟件(ZDOCK、FRODOCK and HawkDock),三個蛋白-小分子對接軟件(GOLD、Surflex-Dock and AutoDock Vina),以及八個蛋白-多肽對接軟件(GalaxyPepDock、MDockPeP、HPEPDOCK、CABS-dock、pepATTRACT、DINC、AutoDock CrankPep (ADCP)、HADDOCK peptide docking)。發(fā)現在全局對接中,HPEPDOCK 的表現優(yōu)于其他的對接軟件,因此,本研究選擇HPEPDOCK 軟件進行分子對接?;谠撥浖狙芯孔罱K篩選出四個分子對接評分≤-150 的寡肽(PAGR、PAR、IDQW、DISAW),且將這四個寡肽認為是的具有較高蛋白酶激活受體2抑制潛力超高親和肽。
將經過胃腸道消化模擬水解酶切后且通過生物信息學工具篩選的寡肽與蛋白酶激活受體2(PAR2)進行分子對接。對接得分<-100 被認為是具有親和能力的寡肽,用F值來評價食源性藻類蛋白質對蛋白酶激活受體2(PAR2)的潛在抑制能力。結果表2 所示,發(fā)現小球藻的精氨酸脫羧酶蛋白的F值最高為1.60%,其次是超氧化物歧化酶和藻紅蛋白,均為1.50%。F值越高,說明這三種食用藻蛋白的蛋白酶激活受體2(PAR2)的潛在抑制能力優(yōu)于本文研究的其他食用藻蛋白,酶解后更容易獲得高親和力的寡肽,這三種蛋白廣泛存在于常見食用藻類中,相對含量較高,它們是篩選蛋白酶激活受體2 抑制肽的主要優(yōu)勢。
2.3.1 分別以抑制劑8TZ 和8UN 為參照的對接結果
在HPEPDOCK 軟件中分別以抑制劑8TZ 和8UN為參照,經過胃腸道消化模擬和水解酶切后且通過生物信息學工具篩選的寡肽與蛋白酶激活受體2(PAR2)進行分子對接,分子對接結果如表5 所示。
表5 分子對接結果Table 5 Results of molecular docking
本研究通過LigPlus 軟件分析研究螺旋藻蛋白源寡肽與PAR2 的結合能力,以及參與相互作用的疏水殘基和氫鍵和以抑制劑8TZ 為參照的對接結果發(fā)現,分子對接分數最高的寡肽是來自精氨酸脫羧酶的PAGR(-165.80),且多肽主要與其PAR2 氨基酸序列上的His227、Leu151 形成氫鍵相互作用,以及與Ile327、Tyr82、HIS135、Leu78、Tyr134、Cys226、Ile152、Lys131、Thr334、Trp127、Phe155、Ser124、Phe155、Asn158、Asn336、Phe128、Asp228 形成疏水作用。另外,PAGR 與抑制劑8TZ 有8 個相同結合位點(Ile327、His227、Asp228、His135、Leu78、Tyr82、Phe155、Cys226),其中有5 個是相同的疏水殘基位點(Ile327、His135、Leu78、Phe155、Cys226);PAR與抑制劑8TZ 形成8 個相同的疏水作用位點(Tyr82、His227、Leu78、Phe155、Phe327、Cys226、Lys131、Tyr134)和一個相同的氫鍵(Asp228),綜合認為PAR成為PAR2 抑制肽的潛力較高。
以抑制劑8UN 為參照的對接結果發(fā)現,對接分數最高的寡肽是來自蛋白質光敏色素C 氧化酶的DISAW(-154.48),且多肽主要與其與PAR2 氨基酸序列上的Ala157、Cys161、Leu123、Phe154、Tyr210、Trp199、Leu203、Ile202、Leu196、Leu200 形成疏水相互作用,沒有形成氫鍵作用。而IDQW 與抑制劑8UN 形成由8 個疏水氨基酸殘基(Cys161、Asn158、Ala157、Leu123、Leu203、Trp199、Phe154、Ala120)參與的疏水相互作用。因此,綜合認為寡肽DISAW相較IDQW 對PAR2 的抑制潛力無明顯差異。
根據以上的分子對接結果,將分子對接評分≤-150 的寡肽視為超高親和,使用PyMol 軟件對受體和寡肽進行處理,構建對接復合物的三維空間結構以及分子間作用力。LigPlus 軟件分析超高親和力寡肽與PAR2 受體結合的疏水殘基和氫鍵作用,分析結果如表6、圖2~5 所示。
表6 超高親和寡肽與蛋白酶激活受體的相互作用力Table 6 Interactions between ultrahigh affinity oligopeptides and protease activated receptors
圖2 蛋白酶激活受體2(PAR2)與超高親和肽PAGR 結合的圖像Fig.2 Image of PAR2 binding to the ultra-high affinity peptide with sequence of PAGR
圖3 蛋白酶激活受體2(PAR2)與超高親和肽PAR 結合的圖像Fig.3 Image of PAR2 binding to the ultra-high affinity peptide with sequence of PAR
圖4 蛋白酶激活受體2(PAR2)與超高親和肽IDQW 結合的圖像Fig.4 Image of PAR2 binding to the ultra-high affinity peptide with sequence of IDQW
圖5 蛋白酶激活受體2(PAR2)與超高親和肽DISAW 結合的圖像Fig.5 Image of PAR2 binding to the ultra-high affinity peptide with sequence of DISAW
分子對接是依據配體和受體之間的“鑰匙與鎖”的識別關系來模擬小分子配體和大分子受體之間的相互作用力,其從分子層面來解釋PAR2 與PAGR、PAR、IDQW 以及DISAW 的作用機制。計算機分子模擬技術作為強大的科學研究工具,可研究分子間相互作用,指導新產品的研發(fā)。利用分子對接技術可以清晰地了解活性肽和受體蛋白的對接位點及二者之間存在的相互作用力,從而分辨出肽段的生物活性和有效性[29]。PAR2 具有規(guī)范的跨膜螺旋結構,目前已有研究表明PAR2 拮抗劑可以有效通過抑制受體激活和信號傳導所需的結構重排、阻斷激活配體進入結合位點兩種方式發(fā)揮作用[8]。
食用藻類被認為是綠色健康的食品,其蛋白質含量高于10%,其中螺旋藻蛋白更是符合人體氨基酸比例需求的優(yōu)質蛋白,且蛋白質含量超過藻干粉質量的65%以上。但我國當下藻類產業(yè)鏈的附加價值不高,綜合經濟效益逐年下降?;谀壳盎钚远嚯牡难芯柯肪€基本上遵循蛋白質提取→酶解條件優(yōu)化→活性多肽分離純化→活性測定→結構鑒定研究途徑,不僅耗時費力,而且在反復分離純化過程中活性肽含量損失嚴重。因此,生物信息學協同實際實驗手段開發(fā)活性生物肽的方法正成為當前的研究熱點。
本研究主要利用生物數據庫以及基于計算機模擬的多肽-蛋白分子對接技術,模擬酶解食用藻類來源的蛋白質制備小分子活性肽,預測分析寡肽片段的生物活性,并開展其水溶性和毒性等理化性質評估,最后開展小分子寡肽與蛋白酶激活受體2(PAR2)晶體結構的分子對接研究,從而篩選與蛋白酶激活受體2 結合能力較高的食用藻蛋白質源寡肽,理論上分析小分子寡肽抑制蛋白酶激活受體2 的潛在活性和作用機制。結果顯示,食用藻蛋白源寡肽PAGR、PAR、IDQW、DISAW 與蛋白酶激活受體2 具有較高的結合潛力。研究成果為藻類蛋白的開發(fā)利用以及蛋白酶激活受體2(PAR2)抑制劑的發(fā)掘提供參考依據,也為未來的體內和體外實驗研究提供了理論指導。