張慧潔,蔡 沖,崔旭紅,張雷蕾
中國計量大學生命科學學院,浙江 杭州 310018
花色素苷是一種天然的水溶性黃酮類色素,具有保護人體心血管、降血糖、護肝臟、抗癌和刺激視紫紅質再生等功能[1]。桑椹因含有豐富的花色素苷而成為食品、保健品和藥品的良好加工原料?;ㄉ剀詹环€(wěn)定,在加工和儲藏中易受光照、熱、酸等影響致使顏色變淡、生物活性降低[2],給食品加工產品的品質保持造成困難,而某些產品宣稱含有豐富的花色素苷以此欺騙消費者。因此建立一種快速、準確的桑椹中花色素苷含量的檢測方法對于桑椹產品的品質檢測、分級及開發(fā)利用具有重要意義。
目前測定花色素苷常用的方法如高效液相色譜法、分光光度法等,檢測步驟復雜,耗時長且具有破壞性,難以滿足樣本中花色素苷快速檢測的需求[3]。拉曼光譜技術以拉曼散射效應為基礎,光波被散射后頻率發(fā)生變化,頻率位移與發(fā)生散射的分子結構有關,從而完成對不同結構分子的檢測。拉曼光譜不需要樣品前處理過程,樣品可通過光線直接測量,方法快速、簡單、可重復性強[4]。已經廣泛的應用在食品中糖類、維生素、蛋白質、DNA和色素等成分的定性和定量分析中[5-6]。但目前國內外采用拉曼光譜技術對花色素苷的應用研究較少,未見有拉曼光譜技術對花色素苷含量檢測的文獻報道。本文以桑椹為實驗材料,分析花色素苷的拉曼光譜特性,研究桑椹中的花色素苷與其拉曼光譜特性之間的相關性,并建立桑椹花色素苷的定量模型,實現(xiàn)花色素苷的定量檢測。
實驗選用“大10”品種桑椹,購買于杭州下沙超市,并用冰盒運輸至實驗室。挑選大小均勻的無機械損傷桑椹510個,去除果柄,用去離子水清洗干凈,每取10個桑椹作為一個樣本采集完光譜之后立即榨汁并過濾,共計51個樣本,將制得的樣本溶液暫存于4 ℃冰箱中用于花色素苷的理化檢測。
標準品矢車菊素-3-O-葡萄糖苷(Cyanidin-3-O-glucoside,C3G),矢車菊素-3-O-蕓香糖苷(Cyanidin-3-O-Rutinoside,C3R),天竺葵素-3-O-葡萄糖苷(Pelargonidin 3-O-glucoside,P3G)購買于Macklin試劑公司,純度均大于95%,分別配制成2 mg·mL-1的水溶液,并模擬桑椹中的花色素苷含量按矢車菊素-3-O-葡萄糖苷,矢車菊素-3-O-蕓香糖苷,天竺葵素-3-O-葡萄糖苷為45%,45%和10%的比例配制成2 mg·mL-1混合標準溶液,用于花色素苷的拉曼光譜分析及桑椹中花色素苷拉曼光譜特征峰的提取。
拉曼光譜儀為實驗室自行搭建,主要包括QE-Pro光譜儀(Ocean Opticis公司)、Laser-785 nm激光器、傳輸光纖、拉曼檢測探頭和置物臺五個部分; 紫外分光光度計(UV-1800,島津)。
拉曼光譜的激發(fā)波長為系統(tǒng)默認785 nm,波長檢測范圍為200~2 870 cm-1,光譜采集時選用優(yōu)化后的參數(shù)即激光功率350 mW、平均次數(shù)2次、積分時間3000 ms,采樣距離3~5 mm。為減少熒光產生的干擾,在暗室環(huán)境下進行光譜采集; 每個桑椹取不同部位采集兩次,每采集10個桑椹作為一個樣本進行花色素苷理化測定,最后取均值作為一個樣本的原始光譜。
桑椹中總花色素苷含量測定采用pH示差法[7],重復測定3次。
測定C3G,C3R及P3G三種花色素苷的拉曼光譜,如圖1,C3G,C3R和P3G的拉曼光譜這與Merlin等[10]的研究結果一致。由于花青素在結構上存在相同的苯并吡啶部分,僅因苯環(huán)上的取代方式不同而有所區(qū)別; 花色素苷的可見生色團主要位于苯并吡啶部分,而不是苯環(huán)上,因此不同的花色素苷具有很大的相似性[11]?;ㄉ剀赵? 400~1 650 cm-1之間的拉曼信號可歸因于苯并吡啶部分和苯環(huán)的環(huán)狀拉伸振動,1 335 cm-1附近主要是由苯環(huán)取代引起的環(huán)間鍵拉伸,低光譜范圍500~900 cm-1主要與糖基化模式有關[10]。
圖1 三種花色素苷標準溶液的拉曼光譜Fig.1 Raman spectra of three anthocyanin standard solutions
桑椹中的花色素苷主要為矢車菊素-3-O-葡萄糖苷(C3G)、矢車菊素-3-O-蕓香糖苷(C3R)、天竺葵素-3-O-葡萄糖苷(P3G)和天竺葵素-3-O-蕓香糖苷(P3R),且矢車菊類花色素苷占總花色素苷的90%及以上[12]。本文模擬桑椹中各種花色素苷的含量,將C3G,C3R及P3G三種花色素苷按照45%,45%和10%的比例均勻混合,并測定混合標準液的拉曼光譜,如圖2所示。
圖2 混合標準液和桑椹原始拉曼光譜Fig.2 Original Raman spectra of mixed standard solution and mulberr
矢車菊素-3-O-葡萄糖苷、矢車菊素-3-O-蕓香糖苷、天竺葵素-3-O-葡萄糖苷及混合花色素苷標準溶液在波數(shù)545,634,737,1 335和1 612 cm-1附近均存在較強的拉曼峰,分別歸結于545和634 cm-1處的C—C面內彎曲[10],737 cm-1處的C—C—O面內彎曲[11],1 335和1 612 cm-1處的內環(huán)C—C拉伸[10-11]。對比桑椹的原始拉曼光譜,如圖2所示,由于桑椹所含成分較多,桑椹的拉曼光譜譜峰較多,各種成分之間相互影響,某些特征峰的波數(shù)與混合花色素苷相比發(fā)生了偏移,偏移均在10 cm-1之內,其在545,634和737 cm-1處有較強的拉曼特征峰,1 341和1 612 cm-1處的峰強較弱,因此選擇波數(shù)545,634和737 cm-1處的峰作為桑椹花色素苷的拉曼特征峰,通過桑椹拉曼光譜中這3處特征峰強度的高低即可定性判斷桑椹中總花色素苷含量的多少。
2.2.1 數(shù)據集樣本劃分
由于桑椹全光譜中存在較多的熒光背景以及噪聲干擾,且花色素苷的光譜信息主要在400~1 800 cm-1波段之間,所以選擇該波段光譜進行分析。采用KS算法將51個樣本以約4: 1的比例劃分為建模集和預測集。樣本集的統(tǒng)計信息如表1所示。
表1 桑椹樣本集的統(tǒng)計信息Table 1 Statistics of the mulberry sample set
2.2.2 光譜預處理方法篩選
為了消除無關信息和噪聲的影響,采用多元散射校正(MSC)、基線校正(airPLS)、歸一化(Normalized)及其組合方法對桑椹樣品原始拉曼光譜進行預處理。多元散射矯正能夠有效地消除光譜散射的影響,增強與成分含量相關的光譜信息[13]; 基線校正能夠消除背景噪聲以及基線漂移[14]; 歸一化的作用是消除數(shù)據量綱的影響,提高模型的運行速度。
結合PLSR對光譜預處理效果進行評價,各種預處理方法的預測結果如表2所示。
表2 不同預處理方法的PLSR建模效果Table 2 PLSR modeling effects of different preprocessing methods
2.2.3 基于CARS特征波長提取的定量模型
由于拉曼光譜中變量信息較多,變量之間存在較多冗余及無用信息,降低了模型的精度及速度,為了進一步提高預測集的預測精度,基于airPLS+MSC+Normalized處理后的桑椹拉曼光譜,研究了CARS特征波長提取方法的PLSR和SVR兩種不同模型的建模效果。
采用CARS提取特征波長時,設定采樣次數(shù)為50次,利用5折交叉驗證法計算均方根誤差(RMSECV),結果如圖3(a)所示。從圖3(a)可以看出RMSECV值隨著采樣次數(shù)的增加呈現(xiàn)出先減小后增加的趨勢,當采樣次數(shù)為22時,RMSECV值最小,此時得到的最優(yōu)波長集包含84個特征波長,提取的特征波長在桑椹原始拉曼光譜中的分布如圖3(b)所示。圖中CARS提取出的特征波長主要集中在波峰及波谷附近[15],且在545,634,737,1 341和1 612 cm-1處均有分布,這與對比標準品確定的特征峰一致,由此說明CARS算法提取出的特征波長與花色素苷的含量具有高度的相關性,不僅降低了光譜的波長數(shù)量,提高模型的預測速度,而且保留了較多的有用信息。
圖3 (a) RMSECV與采樣次數(shù)的關系;(b) 提取的特征波長分布Fig.3 (a) Relationship between RMSECV and sampling times;(b) Extracted characteristic wavelength distribution
將CARS提取出的特征波長作為輸入變量,桑椹的花色素苷含量為輸出變量分別建立了PLSR 模型和SVR模型。支持向量機回歸(SVR)選用RBF核函數(shù),反復篩選模型參數(shù),最終選擇的最佳參數(shù)懲罰因子C為32.0,核系數(shù)g為0.001。兩種模型的結果如表3所示。
表3 CARS篩選后PLSR及SVR模型預測結果Table 3 Predicted results of PLSR and SVR model after CARS selection
圖4 (a)PLSR模型; (b)SVR模型Fig.4 (a)PLSR model; (b)SVR model