趙 倩,繆培琪,李小莉,于 洋,劉長(zhǎng)青?,李 正,5?
1. 天津中醫(yī)藥大學(xué)中藥制藥工程學(xué)院,天津 301617
2. 組分中藥國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津 301617
3. 天津現(xiàn)代創(chuàng)新中藥科技有限公司,天津 300380
4. 國(guó)家地方共建現(xiàn)代中藥創(chuàng)新中心,天津 300392
5. 天津現(xiàn)代中醫(yī)藥海河實(shí)驗(yàn)室,天津 301617
中藥成分復(fù)雜、基體元素多樣的特點(diǎn)導(dǎo)致了中藥產(chǎn)品質(zhì)量可控性較差的問題[1]。依照《藥品生產(chǎn)質(zhì)量管理規(guī)范》中對(duì)藥品質(zhì)量提出的要求,需要對(duì)中藥生產(chǎn)過程中的每個(gè)環(huán)節(jié)進(jìn)行嚴(yán)格的質(zhì)量檢測(cè)與控制以保證最終中藥產(chǎn)品的質(zhì)量均一性。因此,加強(qiáng)從原料采集、中藥生產(chǎn)加工過程及終產(chǎn)品生成這3 個(gè)大環(huán)節(jié)的質(zhì)量檢測(cè)和控制是保障中藥產(chǎn)品質(zhì)量的關(guān)鍵手段。
目前大多數(shù)的中藥質(zhì)量檢測(cè)方法多針對(duì)分析需求,選擇單一數(shù)據(jù)源的檢測(cè)結(jié)果進(jìn)行分析。但由于檢測(cè)過程中存在其他因素的干擾,導(dǎo)致依據(jù)片面的中藥信息進(jìn)行分析檢測(cè)的精度較低[2-3]。因此需要從宏觀整體的檢測(cè)角度上進(jìn)行中藥質(zhì)量的檢測(cè)與評(píng)價(jià)以實(shí)現(xiàn)中藥產(chǎn)品質(zhì)量的精準(zhǔn)控制[4-6]。為此,研究學(xué)者們提出一種可以結(jié)合多種信息用作整體分析的技術(shù)——數(shù)據(jù)融合。數(shù)據(jù)融合是近些年分析化學(xué)領(lǐng)域內(nèi)逐漸發(fā)展起來的一種分析技術(shù),通過將多種傳感器檢測(cè)信息進(jìn)行互補(bǔ)來滿足精準(zhǔn)全面檢測(cè)的要求[7-8]。無論是通過多數(shù)據(jù)源檢測(cè)彌補(bǔ)單一數(shù)據(jù)源的檢測(cè)精度,還是將不同原理分析儀器的檢測(cè)信息進(jìn)行融合達(dá)到整體質(zhì)量評(píng)價(jià)的目的,數(shù)據(jù)融合技術(shù)相比傳統(tǒng)的單一檢測(cè)分析技術(shù)都具有應(yīng)用優(yōu)勢(shì)。目前,數(shù)據(jù)融合已經(jīng)廣泛應(yīng)用于礦業(yè)[9-11]、航空[12-13]、食品[14-15]、農(nóng)業(yè)[16]等領(lǐng)域的檢測(cè)分析領(lǐng)域,面對(duì)高精度的目標(biāo)檢測(cè)需求,數(shù)據(jù)融合技術(shù)的應(yīng)用取得了良好的效果。在現(xiàn)代中藥各個(gè)生產(chǎn)環(huán)節(jié)中運(yùn)用數(shù)據(jù)融合,同樣對(duì)于實(shí)現(xiàn)中藥全面精確的檢測(cè)效果具有重要的意義。
隨著數(shù)據(jù)融合技術(shù)的不斷發(fā)展,越來越多的研究者開始嘗試將不同檢測(cè)儀器獲取的數(shù)據(jù)信息進(jìn)行融合,其中以指紋圖譜信息融合在中藥分析領(lǐng)域中的應(yīng)用最為廣泛[17-20]。通過融合不同檢測(cè)原理的光譜儀器獲取相應(yīng)的指紋圖譜數(shù)據(jù)信息,結(jié)合化學(xué)計(jì)量學(xué)進(jìn)行分析,實(shí)現(xiàn)多源信息的融合,達(dá)到中藥質(zhì)量整體檢測(cè)與評(píng)價(jià)的目的。目前,研究者主要就中藥原料檢測(cè)、中藥生產(chǎn)過程的實(shí)時(shí)檢測(cè)分析及中藥產(chǎn)品的質(zhì)量評(píng)價(jià),對(duì)數(shù)據(jù)融合在中藥檢測(cè)分析領(lǐng)域中的應(yīng)用進(jìn)行研究。相關(guān)研究成果表明數(shù)據(jù)融合在產(chǎn)地鑒別、偽劣品鑒定、藥材品質(zhì)評(píng)價(jià)、中藥生產(chǎn)過程質(zhì)量評(píng)價(jià)、中藥制藥過程在線質(zhì)量控制、中藥制劑和產(chǎn)品包裝質(zhì)量檢測(cè)等方面具有應(yīng)用優(yōu)勢(shì)和潛力。因此,本文擬對(duì)目前數(shù)據(jù)融合技術(shù)在中藥檢測(cè)領(lǐng)域中的研究現(xiàn)狀進(jìn)行綜述,并就如何在中藥生產(chǎn)加工全過程中充分應(yīng)用展開討論,為數(shù)據(jù)融合技術(shù)在中藥分析領(lǐng)域中的深入應(yīng)用提供指導(dǎo)和參考。
數(shù)據(jù)融合技術(shù)主要是通過將多個(gè)數(shù)據(jù)源獲取的數(shù)據(jù)與來自相關(guān)數(shù)據(jù)庫(kù)的信息進(jìn)行結(jié)合,以獲得對(duì)于檢測(cè)目標(biāo)而言質(zhì)量更高或更相關(guān)的數(shù)據(jù)信息。它的獨(dú)特之處在于其數(shù)據(jù)可從不同分析技術(shù)中獨(dú)立生成,然后組合用于模型的建立及結(jié)果的計(jì)算和預(yù)測(cè)。與單個(gè)數(shù)據(jù)源相比,它可以實(shí)現(xiàn)更高的精度和更具體的分析判斷[21]。因此,數(shù)據(jù)融合往往被用于建立高精度和高穩(wěn)定性的預(yù)測(cè)模型以滿足研究人員的檢測(cè)需求,完成更準(zhǔn)確的數(shù)據(jù)信息分析[22]。如圖1 所示,數(shù)據(jù)融合可根據(jù)不同信息源的融合級(jí)別分為低級(jí)、中級(jí)和高級(jí)數(shù)據(jù)融合3 類[23]。
圖1 不同層次數(shù)據(jù)融合的實(shí)現(xiàn)結(jié)構(gòu)Fig. 1 Implementation structure for different levels of data fusion
其中,低級(jí)數(shù)據(jù)融合是簡(jiǎn)單的數(shù)據(jù)層融合,通過將來自不同數(shù)據(jù)源的全部信息通過首尾相連的方式直接串聯(lián)。然而研究學(xué)者發(fā)現(xiàn)這種融合方式常常會(huì)把一些冗雜的數(shù)據(jù)也應(yīng)用到后續(xù)建模過程中,使數(shù)據(jù)處理的工作量變大[24],故而常補(bǔ)充采用中級(jí)融合以達(dá)到精簡(jiǎn)模型的目的。
中級(jí)數(shù)據(jù)融合是分別從每個(gè)數(shù)據(jù)源中通過特定的分析方法提取相關(guān)特征,然后將它們組合成新的特征數(shù)據(jù)矩陣,因此又稱為特征層融合。這一融合方式成功實(shí)現(xiàn)了數(shù)據(jù)的降維,突出了有效信息,有利于快速建模,在多數(shù)情況下相比低級(jí)數(shù)據(jù)融合效果較好。但是由于數(shù)據(jù)量的減少,它所構(gòu)建的模型在精度上往往會(huì)受到一定的影響,因此高級(jí)數(shù)據(jù)融合往往被應(yīng)用于建立更高精度的模型[25]。
高級(jí)數(shù)據(jù)融合又稱決策層融合,基于不同分析儀器數(shù)據(jù)所構(gòu)建的分析模型,此融合以一定的方法對(duì)其分別賦予不同的權(quán)重,從而構(gòu)建出一種新的決策方式來實(shí)現(xiàn)建模分析。因此高級(jí)數(shù)據(jù)融合往往具有高靈活性和強(qiáng)包容性,在簡(jiǎn)化模型的同時(shí)能夠取得高精度的檢測(cè)結(jié)果。然而合適的決策方法探索相對(duì)比較困難,所以高級(jí)數(shù)據(jù)融合的應(yīng)用相比于低級(jí)和中級(jí)數(shù)據(jù)融合較為復(fù)雜[26]。
近年來,數(shù)據(jù)融合技術(shù)憑借其可以組合多個(gè)傳感器信息進(jìn)行更加準(zhǔn)確全面的檢測(cè)優(yōu)勢(shì)得到了不同領(lǐng)域研究人員的青睞。多個(gè)檢測(cè)領(lǐng)域的研究結(jié)果表明相比較單個(gè)數(shù)據(jù)源建立的檢測(cè)模型而言,經(jīng)過數(shù)據(jù)融合技術(shù)建立的模型體現(xiàn)出更強(qiáng)的檢測(cè)精度和實(shí)用性[27-32]。
中藥的成分復(fù)雜,其化合物種類和含量變化都會(huì)影響產(chǎn)品質(zhì)量。但是中藥質(zhì)量檢測(cè)中多以單一儀器的檢測(cè)結(jié)果進(jìn)行質(zhì)量評(píng)價(jià),導(dǎo)致存在分析精度較低的檢測(cè)缺陷,需要應(yīng)用數(shù)據(jù)融合技術(shù)對(duì)中藥樣本的信息進(jìn)行深度挖掘。通過將生產(chǎn)過程中工藝參數(shù)、物料屬性、多傳感器中檢測(cè)出的中藥化學(xué)信息等進(jìn)行數(shù)據(jù)融合,實(shí)現(xiàn)生產(chǎn)過程重要環(huán)節(jié)的準(zhǔn)確檢測(cè)。
中藥原料的優(yōu)劣直接影響中成藥產(chǎn)品質(zhì)量。中國(guó)食品藥品監(jiān)督管理局2018 年發(fā)布的最新傳統(tǒng)藥物開發(fā)指南鼓勵(lì)藥材同質(zhì)化,以確保最終制劑質(zhì)量的穩(wěn)定性。原料藥材的品質(zhì)通常受原藥材品種、采收、產(chǎn)地、部位等多種因素的影響[33]。其中,藥材品種和產(chǎn)地通常是影響中藥原料質(zhì)量的2 個(gè)重要因素。近年來,已有研究人員就中藥原料的產(chǎn)地鑒別、偽劣品鑒定、品質(zhì)評(píng)價(jià)3 方面進(jìn)行了數(shù)據(jù)融合檢測(cè)的相關(guān)研究,為數(shù)據(jù)融合與中藥后續(xù)生產(chǎn)結(jié)合奠定了基礎(chǔ)。
產(chǎn)地鑒別有助于篩選出符合國(guó)家相關(guān)標(biāo)準(zhǔn)要求的道地藥材。這類藥材由于特定舒適的生長(zhǎng)環(huán)境通常具有比其他產(chǎn)地同種藥材更好的品質(zhì)和藥效,為中藥原料的質(zhì)量控制提供了更便捷的選擇方案。研究者可以通過數(shù)據(jù)融合技術(shù)彌補(bǔ)單一檢測(cè)技術(shù)信息不足的缺陷實(shí)現(xiàn)精準(zhǔn)產(chǎn)地判別。
吳雪梅[34]利用紫外可見光譜、衰減全反射傅里葉變換紅外光譜和超高效液相色譜,采用低級(jí)、中級(jí)和高級(jí)數(shù)據(jù)融合結(jié)合化學(xué)計(jì)量學(xué)建模實(shí)現(xiàn)了177份不同產(chǎn)地的野生滇重樓的來源鑒別,主要涉及的數(shù)據(jù)處理分析軟件為OMNIC 8.2、UVProbe 2.34 及SIMAC-P+13.0。其中低級(jí)數(shù)據(jù)融合的數(shù)據(jù)矩陣為紫外可見光譜、衰減全反射傅里葉變換紅外光譜數(shù)據(jù)預(yù)處理后直接串聯(lián);中級(jí)數(shù)據(jù)融合的數(shù)據(jù)矩陣為采用主成分分析分別提取兩光譜特征變量后組合的新矩陣;高級(jí)數(shù)據(jù)融合先分別建立紫外可見光譜和衰減全反射傅里葉變換紅外光譜的隨機(jī)森林分類模型,再根據(jù)模糊集合理論的決策方法對(duì)分類結(jié)果進(jìn)行融合得到?jīng)Q策層融合結(jié)果。通過比較單光譜、數(shù)據(jù)融合建立的產(chǎn)地識(shí)別模型結(jié)果可知高級(jí)數(shù)據(jù)融合模型的效果最佳,預(yù)測(cè)正確率高達(dá)98%。同樣,Pei等[35]采用傅里葉變換中紅外光譜和近紅外光譜結(jié)合低級(jí)、中級(jí)、高級(jí)數(shù)據(jù)融合,基于OMNIC 9.7.7、SIMAC-P+13.0、MATLAB R2017a 和RStudio 3.5.2軟件進(jìn)行數(shù)據(jù)處理和建模分析,通過建立偏最小二乘判別分析和隨機(jī)森林分類模型成功實(shí)現(xiàn)了196 種野生重樓的地理溯源,其中由主成分特征變量提取的高級(jí)數(shù)據(jù)融合建立的模型產(chǎn)地識(shí)別準(zhǔn)確率為100%,證明這2 種光譜融合用于野生云南重樓精準(zhǔn)產(chǎn)地溯源的可行性。
此外,還有一些其他學(xué)者在茯苓[36]、三七[37]、杜仲葉[38]、牛肝菌[39]等中藥材上成功應(yīng)用數(shù)據(jù)融合實(shí)現(xiàn)了產(chǎn)地鑒別。除了應(yīng)用各種光譜、色譜信息,圖像特征信息亦被用于產(chǎn)地鑒別的信息補(bǔ)充。殷文俊等[40]基于高光譜成像技術(shù)在可見-近紅外波段和短波紅外波段中提取光譜和圖像特征,從可見近紅外-短波紅外、光譜-圖像和全數(shù)據(jù)3 個(gè)維度上進(jìn)行數(shù)據(jù)融合,通過采用HIS Analyzer、ENVI 5.3、MATLAB 2017a 和Spyder(Python 3.7)4 個(gè)軟件進(jìn)行數(shù)據(jù)校正與分析處理,建立了不同產(chǎn)地甘草藥材的分類預(yù)測(cè)模型,結(jié)果表明不同維度的數(shù)據(jù)融合模型增強(qiáng)了單數(shù)據(jù)源模型的分類性能。以上研究證明了數(shù)據(jù)融合相對(duì)單個(gè)檢測(cè)源數(shù)據(jù)分析可以取得更好的中藥產(chǎn)地鑒別結(jié)果,但是大量的分析軟件的應(yīng)用往往會(huì)造成數(shù)據(jù)融合分析流程繁瑣,在某一數(shù)據(jù)處理軟件中實(shí)現(xiàn)完整數(shù)據(jù)融合分析流程,通過精簡(jiǎn)分析過程將會(huì)進(jìn)一步促進(jìn)數(shù)據(jù)融合技術(shù)在中藥分析領(lǐng)域中的實(shí)際應(yīng)用。
偽劣品鑒定也是數(shù)據(jù)融合技術(shù)應(yīng)用在中藥原料檢測(cè)上的重要組成部分,常見為重量摻偽、形似摻偽、染色摻偽、純加工品摻偽、非藥用部位摻偽等。通過數(shù)據(jù)融合進(jìn)行中藥材的偽劣品鑒定,可為原料藥材提供質(zhì)量保障。Yang 等[41]利用不同等級(jí)三七摻雜樣本的近紅外和中紅外光譜進(jìn)行低級(jí)、中級(jí)、高級(jí)數(shù)據(jù)融合構(gòu)建了不同混合比例的三七分類模型。主要分析軟件Unscrambler 10.4、OriginPro 9.0 和MATLAB 2018a 的數(shù)據(jù)分析結(jié)果顯示,與單光譜分析結(jié)果相比,數(shù)據(jù)融合技術(shù)的應(yīng)用成功提高了三七粉中摻假物的識(shí)別能力。其中低級(jí)數(shù)據(jù)融合效果不理想,考慮到可能是原始信息中包含大量的干擾和無用信息,利用高級(jí)數(shù)據(jù)融合建立的隨機(jī)森林特征變量選擇模型在精簡(jiǎn)模型的同時(shí)取得了最好的分類結(jié)果。此外,在加工品摻偽中最常見的為直接偽造真品。這種偽品與真品相似,通常需要專業(yè)的技術(shù)人員才能夠進(jìn)行辨別。如用新疆蟲草代替冬蟲夏草、用紅花代替西紅花、用桔梗根代替人參及用羊角藤代替巴戟天等。孫飛等[19]通過近紅外和中紅外光譜技術(shù),基于SIMCA-P11.5 和Unscrambler 7.0 軟件進(jìn)行數(shù)據(jù)處理,采用單一光譜數(shù)據(jù)和中級(jí)數(shù)據(jù)融合分別建立起姜半夏和偽品姜虎掌南星的偏最小二乘判別分析模型,結(jié)果顯示采用單一近紅外或中紅外建立的檢測(cè)模型分類準(zhǔn)確率分別為84.62%、92.41%,而采用數(shù)據(jù)融合進(jìn)行建模的準(zhǔn)確率為100%,且樣品在模型的空間分布呈現(xiàn)明顯的分類聚集狀態(tài)。這一結(jié)果表明數(shù)據(jù)融合后模型性能均優(yōu)于單一光譜,證明近紅外和中紅外的信息互補(bǔ)可以提高姜半夏的真?zhèn)舞b定結(jié)果。綜上,數(shù)據(jù)融合可以顯著提高中藥材偽劣品的鑒別準(zhǔn)確率,但目前采用近紅外儀器進(jìn)行數(shù)據(jù)融合技術(shù)鑒定中藥真?zhèn)蔚膽?yīng)用較多,缺乏其他不同原理檢測(cè)信息源的數(shù)據(jù)融合分析,從擴(kuò)充數(shù)據(jù)源的角度入手可以進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)融合對(duì)中藥真?zhèn)稳婢珳?zhǔn)的鑒別分析。
藥材品質(zhì)評(píng)價(jià)也可以通過數(shù)據(jù)融合技術(shù)得以實(shí)現(xiàn)。當(dāng)選用原料藥材進(jìn)行中藥產(chǎn)品的制備時(shí),通常需要根據(jù)《中國(guó)藥典》2020 年版[42]進(jìn)行相關(guān)有效成分的含量檢測(cè)以控制原料藥材的質(zhì)量。這一環(huán)節(jié)中通常會(huì)涉及多種儀器進(jìn)行檢測(cè),依據(jù)數(shù)據(jù)融合技術(shù)實(shí)現(xiàn)全面檢測(cè)通??梢匀〉昧己玫钠焚|(zhì)判斷效果。楊海玲[43]以不同等級(jí)的川芎作為研究對(duì)象,基于感官評(píng)價(jià)、頂空氣相色譜-質(zhì)譜聯(lián)用與近紅外的檢測(cè)數(shù)據(jù),從氣味、顏色、化學(xué)成分上進(jìn)行綜合分析,結(jié)合化學(xué)計(jì)量學(xué)建立不同質(zhì)量等級(jí)的川芎識(shí)別模型。經(jīng)過SPSS 21.0、OMNIC 9.7.7、SIMCA-P 14.1.0、MATLAB 2016a 和Python 3.7.3 軟件處理的數(shù)據(jù)分析結(jié)果表明基于極限學(xué)習(xí)機(jī)算法建立的分類模型可以很好地區(qū)分不同等級(jí)的川芎。毛勝楠[44]通過將高效液相色譜法測(cè)定的余甘子中沒食子酸等多種有效成分的信息與傅里葉變換近紅外光譜采集的余甘子整體的化學(xué)指紋圖譜進(jìn)行融合,基于OMNIC 和SMICA-P 13.0 數(shù)據(jù)分析軟件,通過結(jié)合多部分變量特征建立偏最小二乘判別分析算法模型和t-分布鄰域嵌入算法模型,成功鑒別了不同儲(chǔ)藏年份不同品質(zhì)的余甘子,相比單一的傅里葉變換近紅外鑒別模型,融合模型的分類準(zhǔn)確率由89.8%提升至100%。證明數(shù)據(jù)融合用于增強(qiáng)不同儲(chǔ)藏年限余甘子分類的有效性。Qi 等[45]基于高效液相色譜獲得的定量和定性代謝譜結(jié)合傅里葉變換近紅外和傅里葉變換中紅外評(píng)估不同產(chǎn)地黃連的質(zhì)量。研究中,基于高效液相色譜測(cè)定的8 種生物堿,篩選出可作為黃連品質(zhì)鑒定的指標(biāo)化合物,參考指標(biāo)化合物含量數(shù)據(jù)建立單一技術(shù)模型和光譜融合模型。結(jié)果表明將光譜技術(shù)數(shù)據(jù)融合后結(jié)合偏最小二乘回歸算法可以有效確定指標(biāo)化合物含量,取得更好的預(yù)測(cè)結(jié)果,融合技術(shù)可以為黃連提供更全面有效的質(zhì)量評(píng)估。由此可見,數(shù)據(jù)融合技術(shù)可以通過融合不同檢測(cè)儀器的檢測(cè)信息,多角度全方面了解中藥樣本信息,精準(zhǔn)評(píng)價(jià)中藥品質(zhì)。此外,以上研究中多采用傳統(tǒng)的偏最小二乘算法建立融合分析模型,多種檢測(cè)分析模型的應(yīng)用可從整體上進(jìn)行比較分析,選出最優(yōu)的質(zhì)量檢測(cè)模型,將數(shù)據(jù)融合更好地應(yīng)用于中藥實(shí)際質(zhì)量評(píng)估。
如何有效控制生產(chǎn)過程中中藥質(zhì)量保證產(chǎn)品的質(zhì)量均一性一直是中藥質(zhì)量檢測(cè)和分析領(lǐng)域中的難點(diǎn)。目前中藥生產(chǎn)過程往往通過提前設(shè)定的工藝參數(shù)進(jìn)行控制,實(shí)時(shí)的過程信息卻沒能被很好地加以應(yīng)用,使得建立的分析模型不太理想。充分利用生產(chǎn)過程信息,彌補(bǔ)工藝檢測(cè)模型的信息缺口,采用數(shù)據(jù)融合從實(shí)時(shí)過程分析控制的角度充分實(shí)現(xiàn)應(yīng)用是未來中藥生產(chǎn)過程質(zhì)量控制的方向之一。數(shù)據(jù)融合技術(shù)在中藥生產(chǎn)加工中主要被用于中藥生產(chǎn)過程質(zhì)量評(píng)價(jià)及中藥制藥過程在線質(zhì)量控制2 方面。
中藥生產(chǎn)過程涉及多方面的影響因素,為保證中藥生產(chǎn)產(chǎn)品的批間一致性,提取、濃縮、色譜等重要工藝環(huán)節(jié)在中藥生產(chǎn)過程質(zhì)量控制中具有重要作用。通過數(shù)據(jù)融合技術(shù)對(duì)中藥生產(chǎn)重要過程的質(zhì)量標(biāo)志物(quality marker,Q-Marker)進(jìn)行實(shí)時(shí)分析,可以有效實(shí)現(xiàn)中藥生產(chǎn)過程質(zhì)量評(píng)價(jià)。張娜等[46]以中藥丹參飲片乙醇提取過程為研究對(duì)象,采用近紅外和高效液相色譜實(shí)時(shí)分析丹參提取液中有效成分的含量變化,建立基于提取過程中提取液的偏最小二乘質(zhì)量預(yù)測(cè)模型(包括以丹參的指標(biāo)性成分建立工藝參數(shù)過程模型、工藝參數(shù)-物料屬性融合模型以及工藝參數(shù)-物料屬性-過程質(zhì)量參數(shù)融合模型)。其中PLS Toolbox 2.1結(jié)合MATLAB 7.0軟件的數(shù)據(jù)分析結(jié)果表明多源信息融合模型比常規(guī)模型具有更好的校正和預(yù)測(cè)能力,數(shù)據(jù)融合技術(shù)可以有效提高提取液質(zhì)量的可控性??梢娊t外光譜可以有效反映提取過程中的工藝狀態(tài)變化信息,填補(bǔ)丹參醇提過程中的工藝質(zhì)量控制的空白。Zhang 等[47]以小兒消積止咳口服液的提取過程為研究對(duì)象,通過測(cè)定提取過程中7 種關(guān)鍵質(zhì)量屬性濃度,基于近紅外和中紅外這2 種光譜的低級(jí)和中級(jí)數(shù)據(jù)融合建立偏最小二乘模型,其中低級(jí)數(shù)據(jù)融合數(shù)據(jù)塊為簡(jiǎn)單的原始光譜串聯(lián),中級(jí)數(shù)據(jù)融合為基于波段選擇的特征變量相連。MATLAB 2019a 軟件的數(shù)據(jù)分析結(jié)果表明數(shù)據(jù)融合模型對(duì)7 種關(guān)鍵質(zhì)量屬性的預(yù)測(cè)優(yōu)于單光譜模型,可以克服提取中信息檢測(cè)不全面的檢測(cè)缺陷,快速準(zhǔn)確的監(jiān)測(cè)小兒消積止咳口服液的提取過程。同時(shí),面對(duì)中藥柱層析吸附過程中存在著吸附時(shí)間過長(zhǎng)導(dǎo)致柱層析產(chǎn)品中存在有效成分比例異常的問題,蔣程[48]通過近紅外和紫外的光譜低級(jí)和中級(jí)數(shù)據(jù)融合分別建立對(duì)三七柱層析吸附流出液5 種皂苷質(zhì)量濃度的實(shí)時(shí)定量分析模型,MATLAB 7.5.0軟件的數(shù)據(jù)分析結(jié)果表明,相比單一光譜建立的模型,數(shù)據(jù)融合模型預(yù)測(cè)誤差大幅降低,可顯著增強(qiáng)信噪比,提升模型準(zhǔn)確度和穩(wěn)健性,這一方法實(shí)現(xiàn)了三七吸附過程的質(zhì)量實(shí)時(shí)監(jiān)控。李建宇[49]采集純化過程不同階段洗脫液的近紅外數(shù)據(jù),將光譜與過程工藝參數(shù)融合,采用SIMCA P+11.5 和MATLAB 7.0 軟件進(jìn)行光譜預(yù)處理和建模分析,基于融合數(shù)據(jù)建立起大孔吸附樹脂純化梔子提取物的過程監(jiān)測(cè)模型。結(jié)果顯示將經(jīng)過化學(xué)計(jì)量學(xué)處理后的光譜數(shù)據(jù)與工藝參數(shù)數(shù)據(jù)融合建模后發(fā)現(xiàn)與單純的工藝參數(shù)模型對(duì)比,采用數(shù)據(jù)融合建??梢栽谝欢ǔ潭壬咸岣哌^程監(jiān)測(cè)模型的性能。綜上,將關(guān)鍵質(zhì)量屬性或工藝參數(shù)和儀器檢測(cè)信息通過數(shù)據(jù)融合的方式進(jìn)行融合建模,可以充分填補(bǔ)目前中藥生產(chǎn)重要過程產(chǎn)品質(zhì)量無法實(shí)時(shí)監(jiān)控分析的檢測(cè)缺口。因此,數(shù)據(jù)融合技術(shù)在中藥重點(diǎn)工藝環(huán)節(jié)過程質(zhì)量評(píng)價(jià)分析上具有明顯的應(yīng)用優(yōu)勢(shì)。
在線質(zhì)量控制是中藥生產(chǎn)加工中的重要環(huán)節(jié),而提高數(shù)據(jù)采集處理的實(shí)時(shí)性則是滿足在線質(zhì)量檢測(cè)的要求的一個(gè)重要方法。相關(guān)研究者采用數(shù)據(jù)融合技術(shù)在這方面進(jìn)行了研究。以干燥過程為例:干燥是中藥生產(chǎn)中常見的重點(diǎn)操作環(huán)節(jié)之一,目前普遍采用取樣監(jiān)測(cè)物料含水率的方法進(jìn)行中藥生產(chǎn)干燥過程終點(diǎn)的判斷,這樣無法保證對(duì)水分的實(shí)時(shí)控制。現(xiàn)在已經(jīng)發(fā)展的水分在線檢測(cè)技術(shù)可以最大限度實(shí)現(xiàn)中藥的增效保質(zhì)。然而依靠單一信息建立的在線分析模型往往不能夠全面反映物料含水率的真實(shí)狀態(tài)。數(shù)據(jù)融合技術(shù)可以用來對(duì)影響檢測(cè)目標(biāo)的因素進(jìn)行整體分析,最大限度消除檢測(cè)過程的不確定因素,提供準(zhǔn)確的數(shù)據(jù)處理分析結(jié)果。彭彥昆等[50]基于多點(diǎn)同時(shí)采集的近紅外光譜融合數(shù)據(jù),采用MATLAB 7.0 軟件進(jìn)行數(shù)據(jù)分析,在優(yōu)化在線檢測(cè)裝備設(shè)計(jì)和參數(shù)的基礎(chǔ)上構(gòu)建了水分在線分級(jí)模型,相比靜態(tài)離線檢測(cè)模型,多點(diǎn)數(shù)據(jù)融合模型提升了含水率的預(yù)測(cè)精度??紤]到水分在線檢測(cè)在實(shí)施過程中亦可受干燥環(huán)境的溫度、濕度等信息影響,王學(xué)成等[51]指出可以在多點(diǎn)同步檢測(cè)的同時(shí),采集溫度、濕度、密度等易獲取環(huán)境參數(shù),得到綜合多維數(shù)據(jù)融合分析和環(huán)境因素的物料含水率預(yù)測(cè)模型進(jìn)一步提高檢測(cè)精度。由此可見,數(shù)據(jù)融合技術(shù)在中藥生產(chǎn)中的在線質(zhì)量控制上應(yīng)用前景廣闊,有待進(jìn)一步深入探索。
中藥產(chǎn)品的質(zhì)量檢測(cè)與評(píng)價(jià)是對(duì)中成藥整個(gè)生產(chǎn)過程最后把關(guān)。目前,數(shù)據(jù)融合技術(shù)質(zhì)量檢測(cè)和包裝質(zhì)量檢測(cè)中同樣具有一定的應(yīng)用研究。
中藥制劑質(zhì)量檢測(cè)是保障其安全可控的基礎(chǔ),檢測(cè)方法目前逐漸由單組分檢測(cè)轉(zhuǎn)變成多組分和整體特征指紋圖譜檢測(cè)并取得了良好的結(jié)果[52]。Yan等[53]采用紫外光譜指紋、多波長(zhǎng)融合高效液相指紋圖譜及抗氧化活性測(cè)定結(jié)合,基于內(nèi)部開發(fā)的指紋超信息特征數(shù)字化評(píng)估系統(tǒng)4.0和SIMCA 13.0分析軟件的數(shù)據(jù)分析結(jié)果,從定性和定量的角度成功對(duì)26 批次的六味地黃丸的質(zhì)量一致性進(jìn)行評(píng)價(jià)。2 種指紋圖譜從不同角度反映該藥的真實(shí)質(zhì)量,為中藥制劑的質(zhì)量評(píng)估提供了一種快速有效的方法。Wang等[54]首次采用物理化學(xué)中常用的燃燒熱代表三黃片整體化學(xué)信息結(jié)合紫外和傅里葉變換紅外的光譜定量指紋圖譜對(duì)30 批次不同來源的三黃片的質(zhì)量一致性進(jìn)行了評(píng)價(jià),數(shù)字化評(píng)估系統(tǒng)軟件的分析結(jié)果顯示基于單種分析技術(shù)評(píng)價(jià)的黃連質(zhì)量等級(jí)具有較大的差異,從側(cè)面反映采用多信息融合來進(jìn)行中藥質(zhì)量信息評(píng)價(jià)的必要性。綜上,數(shù)據(jù)融合通過對(duì)多源檢測(cè)信息的優(yōu)化組合,成功實(shí)現(xiàn)了更準(zhǔn)確的中藥制劑質(zhì)量檢測(cè)結(jié)果,為中藥制劑質(zhì)量提供了新的高效檢測(cè)方案。
為了更加有效的評(píng)價(jià)質(zhì)量一致性,需要采用合適方法進(jìn)行生物學(xué)評(píng)估。目前,體外溶出度實(shí)驗(yàn)已經(jīng)廣泛應(yīng)用于固體制劑的質(zhì)量評(píng)價(jià)中,但在中藥制劑中的應(yīng)用較少。張嬙[55]通過近紅外光譜和拉曼光譜對(duì)不同來源的鹽酸青藤堿緩釋片進(jìn)行溶出行為的模型化研究,研究中采用 MATLAB R2018a 和SIMCA 14.1 數(shù)據(jù)分析軟件,首先通過2 種光譜儀器采集鹽酸青藤堿緩釋片壓片前粉末數(shù)據(jù),再基于預(yù)處理和變量選擇確定光譜最優(yōu)主成分?jǐn)?shù),最后結(jié)合制片處方配比和工藝參數(shù)進(jìn)行多源數(shù)據(jù)融合建立偏最小二乘和反向傳播神經(jīng)網(wǎng)絡(luò)模型溶出行為模型。結(jié)果顯示基于單光譜建立的溶出模型預(yù)測(cè)能力一般,融合模型可以較好的預(yù)測(cè)溶出曲線。此研究提出了一種快速有效的中藥固體制劑生物學(xué)一致的質(zhì)量一致性評(píng)價(jià)方法,為中藥固體制劑的質(zhì)量評(píng)價(jià)提供了新思路。
中藥產(chǎn)品包裝質(zhì)量檢測(cè)是中藥產(chǎn)品不可忽略的重要環(huán)節(jié)。目前,往往采用人工或某些底層的檢測(cè)裝置對(duì)產(chǎn)品包裝的完成度實(shí)現(xiàn)檢測(cè),往往缺乏統(tǒng)一固定標(biāo)準(zhǔn)并且存在很強(qiáng)的主觀能動(dòng)性。因此,通過采用一些特定傳感器進(jìn)行包裝數(shù)據(jù)信息獲取實(shí)現(xiàn)對(duì)中藥產(chǎn)品的包裝檢測(cè)具有應(yīng)用前景,不僅可以嚴(yán)格把控流入市場(chǎng)中藥產(chǎn)品的合格率,還可以最大限度地提升工廠的生產(chǎn)效率和智造水平。沈正福[56]基于多傳感器的信息融合實(shí)現(xiàn)了對(duì)產(chǎn)品包裝的缺陷檢測(cè),降低了基于單一數(shù)據(jù)源決策的導(dǎo)致的錯(cuò)誤率,并基于Python 語(yǔ)言采用決策層的融合方法,使用登姆普斯特-謝弗證據(jù)理論搭建工位系統(tǒng)數(shù)據(jù)融合模型,為缺陷檢測(cè)判別行為的優(yōu)化提供了方案。
綜上所述,在面臨高精度檢測(cè)需求時(shí),雖然數(shù)據(jù)融合技術(shù)具有明顯的應(yīng)用優(yōu)勢(shì),但其本身也存在一定的局限性。目前,采用數(shù)據(jù)融合進(jìn)行信息數(shù)據(jù)的處理上缺乏一定的標(biāo)準(zhǔn)化規(guī)范,往往依據(jù)分析人員的思路或軟件設(shè)定程序進(jìn)行操作分析?,F(xiàn)在數(shù)據(jù)融合普遍采用低級(jí)、中級(jí)、高級(jí)數(shù)據(jù)融合策略進(jìn)行分析,然而融合層級(jí)高的數(shù)據(jù)融合策略在某些特定的數(shù)據(jù)和應(yīng)用場(chǎng)景上可能不能取得比低層級(jí)的數(shù)據(jù)融合更好的結(jié)果[57]。因此在研究中需要依據(jù)具體的分析數(shù)據(jù)和場(chǎng)景選擇適宜的融合策略進(jìn)行分析,避免盲目的“擇高效應(yīng)”。
當(dāng)采集信息數(shù)據(jù)量龐大時(shí),應(yīng)用低級(jí)數(shù)據(jù)融合技術(shù)進(jìn)行檢測(cè)分析會(huì)耗費(fèi)大量的時(shí)間,并且難以滿足實(shí)時(shí)性分析的檢測(cè)需求。然而,當(dāng)信息數(shù)據(jù)量較小、信息維度較低及實(shí)時(shí)性檢測(cè)需求不高時(shí),由于低級(jí)數(shù)據(jù)融合處理框架簡(jiǎn)單、檢測(cè)精度高,它的應(yīng)用往往比中級(jí)和高級(jí)數(shù)據(jù)融合技術(shù)更加快速便捷。處理計(jì)算強(qiáng)度大或復(fù)雜程度高的數(shù)據(jù)信息,應(yīng)首先考慮采用中級(jí)數(shù)據(jù)融合尋找數(shù)據(jù)中的特征信息,依據(jù)部分特征變量分析檢測(cè)對(duì)象可以極大的縮減變量數(shù),減少計(jì)算時(shí)間,同時(shí)滿足實(shí)時(shí)性分析的檢測(cè)需求。由于決策方法的探索通常會(huì)耗費(fèi)大量的時(shí)間,高級(jí)數(shù)據(jù)融合的構(gòu)建較為復(fù)雜,但它的應(yīng)用可以解決中級(jí)數(shù)據(jù)融合由于縮減變量導(dǎo)致的精度下降問題,適合具有高精度實(shí)時(shí)分析要求的應(yīng)用場(chǎng)景。
當(dāng)然,對(duì)于低級(jí)數(shù)據(jù)融合本身存在的檢測(cè)缺陷,可嘗試采用先進(jìn)的統(tǒng)計(jì)學(xué)理論知識(shí)優(yōu)化建模,解決由于高數(shù)據(jù)量導(dǎo)致的計(jì)算復(fù)雜耗時(shí)問題。面對(duì)中級(jí)數(shù)據(jù)融合精度下降問題,可以用神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí)算法替代傳統(tǒng)的機(jī)器學(xué)習(xí)實(shí)現(xiàn)建模,通過智能學(xué)習(xí)實(shí)現(xiàn)模型精度優(yōu)化。高級(jí)數(shù)據(jù)融合由于其本身決策方法探索的困難程度較高、針對(duì)性較強(qiáng),通過遷移學(xué)習(xí)的方式擴(kuò)大決策方法的實(shí)用性可能是增加其應(yīng)用場(chǎng)景和檢測(cè)對(duì)象的一個(gè)突破點(diǎn)。
數(shù)據(jù)融合技術(shù)憑借對(duì)傳感器信息互補(bǔ),擴(kuò)大檢測(cè)樣本信息透明度以實(shí)現(xiàn)更充分的目標(biāo)樣本檢測(cè)的技術(shù)特點(diǎn)取得了廣泛的應(yīng)用。在中藥原料藥材方面,已經(jīng)成功用于產(chǎn)地鑒別、真?zhèn)纹疯b定、品質(zhì)評(píng)價(jià)3方面的檢測(cè)研究;在中藥生產(chǎn)過程方面,成功應(yīng)用于生產(chǎn)中重要工藝環(huán)節(jié)的質(zhì)量檢測(cè)評(píng)價(jià)和制藥過程在線控制;在中藥終產(chǎn)品質(zhì)量檢測(cè)方面,可用于制劑評(píng)價(jià)和包裝檢測(cè)等方面。未來,在改進(jìn)數(shù)據(jù)融合技術(shù)的同時(shí)需要加強(qiáng)數(shù)據(jù)融合技術(shù)在中藥制藥工業(yè)全流程多環(huán)節(jié)的應(yīng)用研究。在中藥材種植方面,可利用多傳感器結(jié)合,在實(shí)現(xiàn)溫度、濕度控制的同時(shí),利用數(shù)據(jù)融合分析技術(shù)模擬控制該藥材道地產(chǎn)區(qū)的生長(zhǎng)環(huán)境,在農(nóng)殘、重金屬限量等方面采用數(shù)據(jù)融合技術(shù)進(jìn)行全面檢測(cè),加強(qiáng)中藥材品質(zhì)控制;在中藥生產(chǎn)過程中,繼續(xù)對(duì)各個(gè)重點(diǎn)生產(chǎn)環(huán)節(jié)(包括精制、濃縮、成型等)采用多傳感器進(jìn)行多位點(diǎn)數(shù)據(jù)采集,通過融合數(shù)據(jù)分析找到最佳工藝參數(shù),實(shí)現(xiàn)過程精準(zhǔn)控制;在終產(chǎn)品檢測(cè)環(huán)節(jié),除了利用現(xiàn)代化裝備結(jié)合數(shù)據(jù)融合對(duì)產(chǎn)品進(jìn)行化學(xué)指標(biāo)定性定量檢測(cè)和生物指標(biāo)評(píng)價(jià)(如體外溶出度檢測(cè)),還可以加強(qiáng)對(duì)后續(xù)的包裝中異物檢測(cè)等方面的應(yīng)用。綜上所述,需要進(jìn)一步針對(duì)中藥領(lǐng)域特殊需求展開研究,重點(diǎn)使用數(shù)據(jù)融合技術(shù)突破中藥生產(chǎn)過程中檢測(cè)難點(diǎn),同時(shí)與實(shí)際應(yīng)用相結(jié)合,完成實(shí)驗(yàn)室研究向工廠實(shí)際應(yīng)用研究的轉(zhuǎn)化,提升中藥產(chǎn)品質(zhì)量。
利益沖突所有作者均聲明不存在利益沖突