龔一耘,董 玲,羅 靜,趙 馳,李 露,郭云建,李治華,朱永清*
(1. 四川省農業(yè)科學院, 四川 成都 610066; 2. 四川省農業(yè)科學院農產品加工研究所, 四川 成都 610066; 3. 郫都區(qū)農業(yè)農村和林業(yè)局, 四川 成都 611730)
【研究意義】醬油中的代謝產物是影響其品質的重要因素。對中日4種知名品牌醬油的成分結構進行解析,對醬油原料的選擇(原材料品質育種)、代謝通路研究、發(fā)酵工藝改良以及促進我國自主品牌醬油的提檔升級,進一步增強民族醬油產業(yè)的核心競爭力,滿足廣大民眾對健康和美好“滋味”的追求都具有重要意義。同時,本研究采用非靶向代謝組學研究方法,以UPLC-ESI-QTOF-MS的先進技術來揭示醬油代謝產物,為進一步解析醬油中的未知代謝產物提供理論依據(jù)和方法參考,也為今后靶向精準測定醬油中的代謝產物奠定了基礎?!厩叭搜芯窟M展】目前,對醬油的研究主要集中在發(fā)酵菌種微生物[1-2]、釀造制作工藝[3-5]、風味[6-8]、品質成分[9-10]以及潛在安全性[11]等方面。其中,對醬油代謝物質進行分析有利于闡釋微生物菌群功能[12],揭示風味形成機理和實現(xiàn)發(fā)酵過程控制[13]。例如,韓國學者對泡菜中葡萄糖、果糖、乳酸、乙酸、甘露醇和氨基酸等代謝產物的研究,對提升韓國泡菜的風味和口感起到了舉足輕重的作用[14]。對于醬油中的代謝產物分析大多使用高效液相色譜,主要以紫外吸收波譜以及保留時間與標準品的比對來確定代謝產物,且靈敏度較低,分析時間長,無法對未知成分進行鑒定?!颈狙芯壳腥朦c】對醬油中的代謝產物,目前還缺乏系統(tǒng)全面的分析,還存在大量未知物質有待鑒定。本研究以UPLC-ESI-QTOF-MS技術非靶向解析醬油中的代謝產物,并采用MS-DIAL和XCMS生物信息學軟件對實驗數(shù)據(jù)進行多元變量統(tǒng)計分析,揭示樣品中存在顯著差異的代謝產物。非靶向代謝組學是一門無偏向性地對所有小分子代謝物同時進行檢測分析的代謝組學。相對于靶向代謝組學,非靶向代謝組學具有無偏向性、高通量和樣本無需特殊處理且一次進樣分析的優(yōu)點。目前,GC-MS、LC-MS和NMR是國內外公認應用較廣泛的代謝物分析技術。相比GC-MS,LC-MS技術更適用于難揮發(fā)性、熱不穩(wěn)定性物質的分析;MS較NMR檢測動態(tài)范圍更寬,靈敏度和分辨率更高。UPLC-QTOF-MS是一種既具有高通量分析檢測技術又能夠快速獲取數(shù)據(jù)、處理數(shù)據(jù)的新型聯(lián)用技術,具備數(shù)據(jù)信息豐富、高靈敏度、專屬性強、效率高、檢測模式多樣、分析速度快等優(yōu)點,尤其擅長于復雜化合物的分離及鑒定。它能精確提供化合物的質量數(shù)、同位素分布等信息,可實現(xiàn)痕量化合物的檢測和定量分析。與HPLC-MS相比,分離度更高、靈敏度更高、分析速度更快、對復雜樣品的處理要求更低。。XCMS是由世界著名質譜數(shù)據(jù)研究機構美國斯克里普斯研究院(Scripps Research Institute)中心開發(fā),具有網絡版和命令模式,其中網絡版整合了METLIN數(shù)據(jù)庫[15]。MS-DIAL分析軟件 是日本理化研究所教授Masanori Arita教授團隊開發(fā)的世界上第一個可以跨平臺處理數(shù)據(jù)非依賴性采集模式(Data-independent acquisition, DIA)的開源軟件,已被同行廣泛采用和引用[16]?!緮M解決的關鍵問題】明確4種中日知名品牌醬油中存在顯著差異的成分物質,為解析醬油中的未知代謝產物及靶向精準測定醬油中的代謝產物提供理論依據(jù)和方法參考。
每個實驗樣品的采集均重復3次。因本研究樣品購買于超市,未經產品生產企業(yè)知曉,為避免相關知識產權糾紛,因此品牌名僅用字母標識。樣品信息見表1。
超高效液相(1290 UPLC) Agilent公司;高分辨質譜(Triple TOF 6600) AB Sciex公司;高分辨質譜(QTOF 6550)Agilent公司;超聲儀(PS-60AL) 深圳市雷德邦電子有限公司;色譜柱(ACQUITY UPLC BEH Amide 1.7 μm 2.1*100 mm) Waters公司;色譜純甲醇、乙腈、乙酸銨和氨水 CNW Technologies公司;L-2-氯苯丙氨酸 上海恒柏生物科技有限公司。
1.3.1 樣品制備 300 μl醬油樣本,與 300 μl提取液(甲醇乙腈水體積比=2∶2∶1)渦旋混勻30 s;冰水浴超聲10 min;在4 ℃條件下,13 000 rpm/min離心15 min;取500 μl上清于1.5 mL EP 管中真空濃縮干燥;向干燥后的代謝物加入1000 μl 提取液(乙腈水體積比=1∶1)復溶;再次渦旋30 s,冰水浴超聲10 min;將樣本在4 ℃條件下,12 000 r/min離心15 min;取60 μl上清置于2 mL進樣瓶,用作色譜分析。每個樣本各取10 μl混合成QC(Quality Control)樣本。
1.3.2 超高效液相色譜條件 樣品在安捷倫1290超高效液相儀控制下,所使用的色譜柱為UPLC BEH Amide 色譜柱(1.7 μm*2.1*100 mm)。進樣體積為2 μl。QC樣本上機檢測,重復3次,用QC1、QC2和QC3表示。流動相A為25 mM乙酸銨和25 mM氨水混合溶液,流動相B為乙腈,流速為500 μl/min,洗脫程序:0~0.5 min,95 % B;0.5~7 min,95 %~65 % B;7~8 min,65 %~40 % B;8~9 min,40 % B;9~9.1 min,40 %~95 %B;9.1~12 min,95 % B。
表1 實驗材料
1.3.3 飛行時間質譜條件 使用數(shù)據(jù)依賴型采集(DDA)模式進行, 一級質譜正模式(Positive)數(shù)據(jù)采集條件:在每個數(shù)據(jù)采集循環(huán)中,篩選出強度最強且大于100的分子離子,并采集其對應的質譜數(shù)據(jù)。質譜參數(shù)如下:干燥氣溫度250 ℃;干燥氣體積流量:16 L/min;噴霧器:20 psig;鞘氣溫度:400 ℃;鞘氣流速:12 L/min ;毛細管電壓:3000 V;節(jié)點電壓:0 V;碎裂電壓:175 V;一級質譜掃描范圍:50~1200;質譜圖的采集速率:4 HZ;循環(huán)時間:250 ms。二級質譜數(shù)據(jù)采集條件:將上述一級質譜篩選出的分子離子,進一步碎化并采集其質譜數(shù)據(jù)。數(shù)據(jù)采集時按質譜范圍進行分段:50~300,290~600,590~900,890~1200,擴大二級譜圖的采集率。每個方法每段采集4個重復。每50 ms獲得15張二級譜圖。參數(shù)如下:霧化氣壓:40 psi(1 psi = 6. 895 kPa);加熱氣:80 psi;簾氣:25 psi;源溫度: 650 ℃;源噴射電壓:5000 V;錐孔電壓:60 V;碰撞能量:35±15。
1.3.4 數(shù)據(jù)處理 基于XCMS軟件的數(shù)據(jù)處理:使用Agilent Qualitative Analysis B.06.00商業(yè)軟件將一級質譜原始數(shù)據(jù)轉成mzData格式。再使用XCMS做保留時間矯正、峰識別、峰提取、峰積分、峰對齊等工作,XCMS(version 3.2.0)在R語言(version 3.5.1)中執(zhí)行,參數(shù)為XCMS 默認參數(shù)[15]。
基于MS-DIAL2.0軟件的數(shù)據(jù)處理:使用AbfConverter(https://www.reifycs.com/ AbfConverter/index.html)開源軟件將質譜原始數(shù)據(jù)轉換成ABF格式,再使用MS-DIAL2.0軟件做保留時間矯正、峰識別、峰提取、峰積分、峰對齊及物質鑒定[16]。
采用軟件SIMCA14.1對XCMS數(shù)據(jù)和MS-DIAL2.0數(shù)據(jù)進行統(tǒng)計分析,找出不同分組之間的顯著性差異,并進一步依據(jù)顯著性差異物質進行二級質譜鑒定,以最終確定物質。
代謝物質主要出峰時間集中在1~9 min(圖1),不同實驗樣品之間峰圖存在差異,表明中日醬油代謝成分結構存在較大差異。
采用XCMS默認參數(shù)處理共得到1319個特征峰(Features), 采用軟件SIMCA14.1 (Umetrics, Sweden)對上述特征峰進行統(tǒng)計分析,主成分分析(PCA)將所有的代謝產物變量降維為PC1和PC2 2個主成分,PC1和PC2可解釋度為79.3 %(51 %+28.3 %)。圖2中綠色代表JS1(S1~S3)和JS2(S4~S6),藍色代表CS1(S7~S9)和CS2(S10~S12)。其中,日產醬油JS1和JS2 2個品牌差異不大,而國產醬油2個品牌CS1和CS2存在較大差異。
采用正交偏最小二乘判別分析(OPLS-DA,圖3),進一步解釋和驗證PCA結果。評價OPLS-DA 模型擬合效果使用的3個指標R2X、R2Y和Q2,可解釋度越接近1,表示OPLS-DA 模型建立的越好。
圖1 全樣品UPLC-QTOF-MS檢測正離子模式總離子流(不同顏色代表不同樣本)Fig.1 Total ion flow of positive ion modes detected by UHPLC-QTOF-MS in all samples (different colors represent different samples)
圖2 4種中日醬油主成分分析Fig.2 Principal component analysis of Chinese and Japanese soy sauce
其中,R2X表示該模型能夠解釋自變量的百分比,在本研究中即指代謝產物;R2Y表示能夠解釋因變量的百分比,在本研究中即能否辨別中日醬油兩種分類;Q2表示OPLS-DA模型的預測能力。OPLS-DA兩個主成分OPLS1和OPLS2,即R2X可解釋度為0.793(0.463+0.33)、R2Y為0.998、Q2為0.995,表明所構建的OPLS-DA模型有置信度較高的預測能力。證實了4種品牌的中日醬油的代謝產物存在顯著差異。
OPLS-DA的S-plot作圖進一步分析了產生上述差異的主要原因。圖4表明,日產2種醬油JS1(S1-3)、JS2(S4-6)和國產2種醬油CS1(S7-9)、CS2(S10-12)中的某一代謝產物175.1/497(mz/RT,暫以此數(shù)據(jù)代表該物質)存在顯著差異。該物質的質荷比mz為175.1,保留時間RT為497 s。
綠色代表JS1(S1~S3)和JS2(S4~S6);藍色代表CS1(S7~S9);CS2(S10~S12)圖3 4種中日醬油OPLS-DA分析Fig.3 OPLS-DA analysis of four different Chinese and Japanese soy sauces
圖4 中日4種醬油S-plot分析(a)Fig.4 S-plot analysis of four different Chinese and Japanese soy sauces(a)
S-plot統(tǒng)計分析還表明,日產2種醬油中代謝物質175.1/497(mz/RT)均顯著高于國產2種醬油(表2)。
表2 4種中日醬油種精氨酸和哈爾滿相對含量比較
物質175.1/497(mz/RT)在主成分(PC1)載荷圖中的峰值最大(圖5),代表它對主成分(PC1)的貢獻值越大。
圖5 主成分分析載荷圖Fig.5 Loading plot for PC1
在二級質譜圖(圖6~7)中找到時間497 s(8.23 min)的二級質譜圖,將此二級質譜數(shù)據(jù)與MS-DIAL的數(shù)據(jù)庫比對。鑒定得到物質為:精氨酸(Arginine),即:采用精氨酸作為標記(Marker)能夠準確辨別上述4種中日醬油(辨別度99.8 %),且2種日產醬油中精氨酸的含量顯著高于2種國產醬油。
圖6 二級質譜圖(a)Fig.6 Secondary mass spectrometry (a)
圖7 二級質譜對比圖(a)Fig.7 Second-order Mass Spectrometric Contrast Diagram(a)
圖8 四種中日醬油S-plot分析(b)Fig.8 S-plot analysis of four different Chinese and Japanese soy sauces(b)
由于有文獻報道不同質譜處理軟件對質譜Feature即峰提取(peak picking)存在差異,不同處理軟件會導致差異顯著的結果[17]。因此,在采用XCMS處理和分析數(shù)據(jù)的同時,另外采用了MS-DIAL軟件,以提升實驗結果的精準性和全面性。采用MS-DIAL默認參數(shù)處理共得到7054個特征峰(Features), 采用軟件SIMCA14.1 (Umetrics, Sweden)對上述特征峰進行統(tǒng)計分析。
圖9 二級質譜圖(b)Fig.9 Secondary mass spectrometry (b)
由圖8~10可知,相比XCMS的結果,MS-DIAL多鑒定出了一個183.1/50(mz/RT), 其相應的二級質譜如下,鑒定出物質為生物堿哈爾滿(Harmane)。
日產2種醬油中精氨酸和哈爾滿顯著高于國產2種醬油,但精氨酸、哈爾滿與醬油品質、功能的關聯(lián)性還有待進一步研究和驗證,目前也沒有相關文獻報道。因此,尚不能據(jù)此判定中日4種醬油的品質優(yōu)劣,但可以為今后國產醬油的多元化產品開發(fā)提供參考。
目前,對成分物質作靶向定量檢測采用的主要方法是液相色譜法、氣相色譜法以及紫外分光光度法等。由于醬油成分物質龐雜,采用這些方法難以開展非靶向結構解析,且耗時長、靈敏性低、重復性差。因此,在靶向定量檢測前先確定檢測靶標物質是有必要的。
采用色譜-質譜聯(lián)用技術等先進方法,通過非靶向成分結構解析,“定位”到靶標檢測物質,有針對地對醬油成分物質定量檢測,是提高檢測效率和結果準確度的有效途徑。需要注意的是,由于質譜數(shù)據(jù)庫尚不完善,還存在大量未知物質有待鑒定。
有研究表明,通過酵母菌等微生物作用將原材料大豆中的蛋白質降解轉化為醬油中的游離態(tài)氨基酸等代謝產物[18];而游離氨基酸是構成醬油鮮味整體特性的主要來源,直接影響醬油品質[19-20]。因此,提高大豆的蛋白質含量和提升大豆蛋白質的代謝轉化率,是今后開展多領域聯(lián)合研究提高醬油品質的2種途徑。
目前,美國、日本等發(fā)達國家不斷加強對豆蛋白的開發(fā),我國大豆品質育種也已選育出冀豆15、豫豆22號、齊黃27、鄭9525、中黃22等一批以高蛋白(蛋白質含量在45 %以上)為育種目標的功能性材料和品種[21]。這為提升國產醬油的品質奠定了基礎;也為我國大豆品質育種以產業(yè)需求和發(fā)展為核心,為產業(yè)提出前瞻性的育種目標,以育種引導大豆后續(xù)加工提供了思路。
本研究基于超高效液相色譜串聯(lián)飛行時間質譜(UPLC-ESI-QTOF-MS)和氫譜核磁共振(H-NMR)兩種國際公認的先進技術,非靶向解析了中日4種知名品牌醬油(JS1、JS2、CS1、CS2)的成分結構,確定了其中存在顯著差異的精氨酸、哈爾滿和糖類物質,探索建立了一種解析醬油未知成分的方法。獲得的如下研究結果為解析醬油中的未知代謝產物提供了方法參考,為進一步通過標準品絕對定量檢測精氨酸、哈爾滿等靶標代謝產物提供了理論依據(jù),也為今后結合醬油原料的選擇(大豆高蛋白品質育種)、代謝通路研究、發(fā)酵工藝改良開展多領域聯(lián)合研究奠定了基礎。這對國產醬油的提檔升級具有重要意義。
(1)基于UPLC-ESI-QTOF-MS的一級質譜數(shù)據(jù)進行主成分降維多元分析(PCA)、正交偏最小二乘判別分析(OPLS-DA),發(fā)現(xiàn)JS1、JS2和CS1、CS2中質荷比/保留時間分別為175.1/497(mz/RT)、183.1/50(mz/RT)的2種物質存在顯著差異。再將這2種物質的二級質譜數(shù)據(jù)與MS-DIAL數(shù)據(jù)庫比對,鑒定得到這2種物質分別為精氨酸和生物堿哈爾滿。
(2)基于OPLS-DA的S-plot分析表明,日產2種醬油中代謝產物精氨酸、生物堿哈爾滿的相對含量顯著高于國產2種醬油。其中,日產醬油JS1、JS2中的精氨酸質譜豐度分別為3.42×107、3.32×107,顯著高于國產醬油CS1(0.98×107)、CS2(1.72×107);日產醬油JS1中的生物堿哈爾滿質譜豐度為2.02×107,高于日產醬油JS2(1.58×107),顯著高于國產醬油CS1(1.16×107)和CS2(0.84×107)。
(3)基于OPLS-DA的數(shù)據(jù)分析模型顯示精氨酸能準確將4種醬油(JS1、JS2、CS1、CS2)區(qū)分為日產和國產兩類,準確度達99.8 %。表明可以將精氨酸用作辨別日產醬油和國產醬油差異的候選標記(Marker)。
(4)相比開源軟件XCMS鑒定的QTOF-MS數(shù)據(jù)結果,MS-DIAL軟件多鑒定出了質荷比/保留時間為183.1/50(mz/RT)的物質,即:生物堿哈爾滿(Harmane)。