羅思恒 周志明 黃劍英 潘城 李玲玲 鄭淑鳳 張志敏 劉國(guó)坤
摘?要?有效成分的定性和定量分析是藥物分析的核心。實(shí)際樣品測(cè)定中,通常需要進(jìn)行樣品前處理,以消除復(fù)雜輔料成分的干擾,此過(guò)程耗時(shí)長(zhǎng),且難度較大。因此,發(fā)展快速定性篩查技術(shù),提高藥物分析的工作效率非常必要。本研究以聯(lián)苯芐唑藥品作為模型藥物,將拉曼光譜技術(shù)和主成分分析(Principal components analysis,PCA)和支持向量機(jī)(Support vector machine,SVM)等機(jī)器學(xué)習(xí)算法聯(lián)用,探討了其用于藥物有效成分快速定性分析的可行性。針對(duì)不同藥品中輔料成分復(fù)雜、組成不一,并且其拉曼光譜譜圖與低含量(1%)的聯(lián)苯芐唑分子的譜圖存在明顯交疊的問(wèn)題,以原料藥的拉曼光譜為基準(zhǔn),利用PCA方法精準(zhǔn)定位和提取成品藥拉曼譜圖中聯(lián)苯芐唑分子的特征拉曼光譜信息,實(shí)現(xiàn)了準(zhǔn)確定性分析。本研究無(wú)需獲得每一種輔料的特征拉曼光譜譜圖,根據(jù)拉曼譜圖中1600和1650 cm1等處譜峰的細(xì)微差異,采用PCA方法結(jié)合SVM分類(lèi)器策略,實(shí)現(xiàn)了藥物生產(chǎn)溯源的準(zhǔn)確區(qū)分和鑒定。本研究為藥物分析研究提供了一種無(wú)損快速溯源的分析方法。
關(guān)鍵詞?拉曼光譜;主成分分析;有效成分鑒定;生產(chǎn)溯源
1?引 言
藥物分析的核心是對(duì)其有效成分和輔料進(jìn)行定性鑒定和定量分析,以判斷藥物是否符合相關(guān)標(biāo)準(zhǔn),為藥物生產(chǎn)和新藥研制提供可靠的質(zhì)量控制技術(shù)。此外,利用不同廠(chǎng)商輔料的細(xì)微差異,可進(jìn)行藥物生產(chǎn)溯源[1,2]。
傳統(tǒng)藥物檢測(cè)技術(shù)主要包括薄層色譜、氣相色譜、高效液相色譜、超高效液相色譜和高效液相色譜-質(zhì)譜聯(lián)用等[3]。薄層色譜法不需要復(fù)雜的儀器設(shè)備,但操作復(fù)雜且每次只能對(duì)單個(gè)組分進(jìn)行分析,效率較低。色譜及色譜-質(zhì)譜聯(lián)用等技術(shù)測(cè)試精度高,通常作為實(shí)驗(yàn)室標(biāo)準(zhǔn)方法鑒定和區(qū)分目標(biāo)物質(zhì),但對(duì)技術(shù)人員要求較高,操作難度較大且耗時(shí)長(zhǎng)[4~6]。近年來(lái),X射線(xiàn)衍射法、紫外-可見(jiàn)吸收光譜法、熒光光譜法、紅外光譜法等被廣泛用于藥物檢測(cè)。Al-Kindy等[7]利用時(shí)間分辨熒光技術(shù)分析了溶液與尿樣中布洛芬的含量,方法重現(xiàn)性好,可用于布洛芬藥物的檢測(cè)。Zhu等[8]利用液相色譜-質(zhì)譜聯(lián)用技術(shù)分析人血液中奧普力農(nóng)的含量,并進(jìn)行了人體內(nèi)的藥物代謝動(dòng)力學(xué)研究與評(píng)價(jià)。
拉曼光譜是一種能夠提供分子指紋圖譜的振動(dòng)光譜技術(shù),因?qū)y(cè)試樣品要求低(固、液、氣三相的樣品均可直接檢測(cè))且測(cè)試簡(jiǎn)單而受到廣泛關(guān)注,已逐漸成為重要的藥物分析方法。 Dies等[9]將表面增強(qiáng)拉曼光譜與PCA方法結(jié)合,實(shí)現(xiàn)了水溶液和復(fù)雜的唾液樣品中微量可卡因、海洛因等違禁藥物的高靈敏檢測(cè)。Roggo等[10]在無(wú)先驗(yàn)信息的前提下,利用拉曼光譜和非線(xiàn)性支持向量機(jī)(SVM)準(zhǔn)確識(shí)別藥物中的活性成分,實(shí)現(xiàn)了高精確度的藥物真?zhèn)螜z測(cè)。Le等[11]結(jié)合拉曼光譜和偏最小二乘判別分析和偏最小二乘回歸,無(wú)需破壞包裝,實(shí)現(xiàn)了封裝在玻璃小瓶中的5-氟尿嘧啶、吉西他濱等5種抗腫瘤藥物的定性分析。鑒于在藥物分析方面的顯著優(yōu)勢(shì),拉曼光譜技術(shù)被收錄于2015年版《中國(guó)藥典》中。然而,在進(jìn)行多種物質(zhì)的歸類(lèi)及鑒定時(shí),常需要結(jié)合理論計(jì)算對(duì)拉曼特征峰進(jìn)行指認(rèn)。此外,在實(shí)際藥品中存在大量干擾物,拉曼譜峰重疊嚴(yán)重,增大了解析的難度,尤其是當(dāng)光譜特征較為相似時(shí),高效快速地提取有效信息十分困難。
主成分分析(PCA)是化學(xué)計(jì)量學(xué)中的常用方法,通常用于數(shù)據(jù)降維、潛變量提取與數(shù)據(jù)壓縮,結(jié)合投影判別法可用于確認(rèn)化學(xué)組分?jǐn)?shù)、分類(lèi)和聚類(lèi)[12~15]?;瘜W(xué)計(jì)量學(xué)結(jié)合拉曼光譜已有很多文獻(xiàn)報(bào)道。張遜等[16]利用拉曼光譜、自適應(yīng)迭代懲罰最小二乘法和主成分分析去除芒草細(xì)胞壁譜圖數(shù)據(jù)的噪聲信號(hào),再利用聚類(lèi)分析,成功區(qū)分了非植物與植物光譜,分類(lèi)結(jié)果優(yōu)于未去噪數(shù)據(jù)。黃庶識(shí)等[17]利用拉曼光譜技術(shù)對(duì)陰道毛滴蟲(chóng)和口腔毛滴蟲(chóng)進(jìn)行測(cè)定,利用PCA和辨別函數(shù)分析預(yù)處理后的數(shù)據(jù),擴(kuò)大兩組數(shù)據(jù)之間的差異性,實(shí)現(xiàn)對(duì)兩種不同環(huán)境的毛滴蟲(chóng)區(qū)分。在藥物分析中,PCA通常僅作為數(shù)據(jù)預(yù)處理的方法使用,較少對(duì)其提取的特征進(jìn)行追蹤與分析。
聯(lián)苯芐唑藥物對(duì)皮膚真菌、酵母菌、霉菌及其它真菌(如秕糠狀鱗斑霉菌、微小棒狀桿菌)有效,其作用迅速、持續(xù)時(shí)間長(zhǎng)且價(jià)格較低,因此應(yīng)用廣泛。本研究以具有廣譜抗真菌作用的聯(lián)苯芐唑藥物為模型,建立藥品鑒定分析體系,利用PCA算法,通過(guò)將不同主成分與特征峰一一對(duì)應(yīng),進(jìn)行目標(biāo)物的定性和定量分析。在此基礎(chǔ)上,對(duì)于主成分的提取過(guò)程進(jìn)行追蹤與分析,探討聚類(lèi)過(guò)程的實(shí)驗(yàn)依據(jù)。在無(wú)需獲得輔料的特征拉曼光譜譜圖的前提下,對(duì)不同廠(chǎng)家聯(lián)苯芐唑藥品進(jìn)行有效準(zhǔn)確區(qū)分和鑒定,實(shí)現(xiàn)了藥物的生產(chǎn)溯源。
2?實(shí)驗(yàn)部分
2.1?儀器與試劑
拉曼光譜譜圖由i-Raman Plus BWS465-785S 拉曼光譜儀(中國(guó)必達(dá)泰克光電科技(上海)有限公司)采集,激光波長(zhǎng)785 nm,光譜范圍150~3350 cm1,分辨率為3.5 cm1,激光功率320 mW,檢測(cè)器類(lèi)型為致冷薄型背照式CCD陣列。
實(shí)驗(yàn)所用聯(lián)苯芐唑成品藥和原料藥均來(lái)自市場(chǎng)抽樣。9種成品藥和2種原料藥分別來(lái)自不同制藥廠(chǎng)家,成品藥樣本的總數(shù)為179,原料藥樣本總數(shù)為2。為方便后續(xù)討論,將9種成品藥樣本進(jìn)行編號(hào),并將標(biāo)注各類(lèi)樣品數(shù)量,如表1所示。將分別來(lái)自廣州和重慶制藥公司的2種原料藥編號(hào)為1號(hào)原料藥和2號(hào)原料藥。
2.2?光譜采集
成品藥與原料藥均為乳膏劑,呈白色膠狀。取聯(lián)苯芐唑藥品鋪展于錫箔紙表面,樣品厚度約為2 mm,面積約為25 mm2,進(jìn)行拉曼光譜測(cè)試。激光功率為100%,積分時(shí)間為30 s,積分次數(shù)為3次。每個(gè)樣品至少進(jìn)行3次重復(fù)測(cè)定,取其平均譜圖,以確保數(shù)據(jù)的可靠性。原料藥譜圖數(shù)量為9,為保證譜圖數(shù)量而多次測(cè)量結(jié)果;成品藥譜圖數(shù)量為179,數(shù)量充足且與實(shí)際樣本一致。
2.3?數(shù)據(jù)分析
將所得9種成品藥的拉曼譜圖(總數(shù)為179)和兩種原料藥的拉曼譜圖(總數(shù)為9)數(shù)據(jù)進(jìn)行如下預(yù)處理:一階微分求導(dǎo)、多元散射校正、中心化處理。然后,采用SPSS 21.0軟件進(jìn)行PCA運(yùn)算:在不損失主要信息的前提下,將譜圖數(shù)據(jù)進(jìn)行降維處理,得到正交的得分矩陣與載荷矩陣。以得分矩陣前2列或前3列進(jìn)行投影,即可得到降維或聚類(lèi)結(jié)果;從載荷矩陣可得到不同譜段對(duì)得分矩陣的貢獻(xiàn)度,得出不同譜段與不同主成分的關(guān)系,并以此解釋分類(lèi)依據(jù)。
3?結(jié)果與討論
3.1?有效成分的信息提取與鑒定
相比于高純度的原料藥,成品藥成分較復(fù)雜,主要是因?yàn)槌善匪幹杏行С煞值暮客ǔHQ于治療所需要的功效水平,如聯(lián)苯芐唑在成品藥中的含量?jī)H為1%,此外,成品藥中通常添加多種輔料成分。由圖1A中聯(lián)苯芐唑成品藥(1號(hào)樣品譜圖中隨機(jī)選?。┡c原料藥(1號(hào)原料藥譜圖中隨機(jī)選取)的拉曼光譜圖可知,原料藥位于998、1179、1280和1604 cm1處的特征譜峰在成品藥的譜圖中雖清晰可見(jiàn),但譜峰的相對(duì)強(qiáng)度并不一致,說(shuō)明成品藥中與原料藥相關(guān)的特征峰可能存在原料藥與輔料特征峰交疊情況,即存在復(fù)雜輔料成分的貢獻(xiàn)。上述結(jié)果也說(shuō)明,僅依賴(lài)特征譜峰位置對(duì)有效成分進(jìn)行定性分析可能存在誤判(尤其是所選特征譜峰的數(shù)量較少時(shí))。因此,首先將實(shí)驗(yàn)數(shù)據(jù)中所有的原料藥(數(shù)量為9)和成品藥(數(shù)量為179)的拉曼光譜譜圖進(jìn)行預(yù)處理,采用PCA濃縮提取譜圖中的藥物有效成分信息。然后,結(jié)合投影判別法,以3個(gè)最主要的主成分PC1、PC2和PC3作三維圖,所得結(jié)果如圖1B所示。其中,編號(hào)1聚類(lèi)為原料藥,其余為成品藥。結(jié)果表明,不僅原料藥與其它藥物可顯著區(qū)分,不同來(lái)源的藥物間也存在有效聚類(lèi),如2、3號(hào)聚類(lèi)實(shí)現(xiàn)了兩種藥品的產(chǎn)地區(qū)分,說(shuō)明PCA對(duì)于藥物的判別具有一定作用。
根據(jù)PCA原理,可根據(jù)譜圖變化的趨勢(shì)將不同的譜段劃分為多個(gè)主成分,在投影分類(lèi)清晰的前提下,不同譜段對(duì)其主成分具有不同的貢獻(xiàn)度,該貢獻(xiàn)度大小可通過(guò)載荷矩陣顯示。因此,本研究根據(jù)載荷矩陣,將拉曼譜圖中區(qū)分貢獻(xiàn)度占優(yōu)的譜段以紅色標(biāo)出,結(jié)果如圖1A所示。由圖1A可知,顯著的組分差異導(dǎo)致成品藥與原料藥的拉曼譜圖間也存在明顯的差異性。然而,經(jīng)過(guò)PCA分類(lèi),與有效成分相關(guān)的主要特征譜峰(如998、1179、1280和1604 cm1等)被劃分為同一主成分PC1,說(shuō)明這些特征峰的主要貢獻(xiàn)一致,皆來(lái)源于與原料藥成分一致的有效成分。上述結(jié)果表明,采用PCA算法實(shí)現(xiàn)了拉曼譜圖由高維向低維數(shù)據(jù)的轉(zhuǎn)變,降低了冗余信息的干擾,有效提取和濃縮了藥物有效成分信息,有利于更加快速準(zhǔn)確地進(jìn)行定性分析。
3.2?分類(lèi)與鑒定
PCA基于投影判別法觀(guān)察其空間分布及聚類(lèi)情況,可用于物質(zhì)的鑒定。將實(shí)驗(yàn)中涉及的9個(gè)不同廠(chǎng)家179個(gè)成品藥的拉曼光譜圖進(jìn)行PCA處理,并對(duì)多次投影結(jié)果進(jìn)行比對(duì)。以獲取的最優(yōu)主成分為軸,利用變量三維空間投影,系統(tǒng)考察各種預(yù)處理后的結(jié)果。圖2為無(wú)預(yù)處理、求導(dǎo)預(yù)處理、求導(dǎo)和中心化預(yù)處理,以及進(jìn)行求導(dǎo)、多元散射校正和中心化預(yù)處理后的PCA分布圖。黑圈代表僅含有單種藥品樣本,紅圈代表含有多種藥品樣本。由圖2A~2C可知,預(yù)處理不充分時(shí),僅能有效聚類(lèi)2~3類(lèi),聚類(lèi)效果不理想。經(jīng)過(guò)系統(tǒng)預(yù)處理后,絕大部分樣品都形成良好的聚類(lèi)(圖2D),其中6個(gè)聚類(lèi)按照樣品來(lái)源進(jìn)行分類(lèi)(樣品編號(hào)已在圖2D中標(biāo)出),其余3種樣品仍無(wú)法有效區(qū)分(如紅圈所示)。
光譜信息中存在的噪聲等冗余信息影響聚類(lèi)的效果。對(duì)比4種不同的預(yù)處理方案并推測(cè),預(yù)處理步驟中一階求導(dǎo)可以增強(qiáng)光譜分辨率并降低背景干擾;多元散射校正有效解決了由于樣本某些物理性質(zhì)(如顆粒大小及形狀)導(dǎo)致的乘子效應(yīng);中心化處理可提高模型的穩(wěn)健性和預(yù)測(cè)能力。因此,3個(gè)預(yù)處理步驟協(xié)同提高了聚類(lèi)的準(zhǔn)確度。
由圖2D可知,預(yù)處理步驟尚無(wú)法有效聚類(lèi)分離包含在紅圈內(nèi)的藥物。這主要是由于這些樣品在這3個(gè)主成分所構(gòu)成的三維空間中的差異較小,說(shuō)明樣品的差異在于其它主成分。因此,對(duì)于紅圈內(nèi)的樣品,以PC1、PC4作為坐標(biāo)軸進(jìn)行二次投影分類(lèi),結(jié)果如圖3所示。由于圖3中9號(hào)樣品的分布較散亂,為減少人為因素的干擾,需進(jìn)一步利用機(jī)器學(xué)習(xí)的分類(lèi)算法確保分類(lèi)的正確性。支持向量機(jī)(Support vector machine,SVM)是一類(lèi)按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類(lèi)的廣義線(xiàn)性分類(lèi)器,在包括拉曼光譜定性分析等許多領(lǐng)域都得到了廣泛應(yīng)用[18~20]。利用SVM進(jìn)行分類(lèi)的結(jié)果如圖3B所示,結(jié)果與圖3A一致,即紅圈樣品的分類(lèi)已明確。
經(jīng)過(guò)兩次PCA投影后,按照生產(chǎn)廠(chǎng)家將樣品準(zhǔn)確分為9類(lèi),正確率為100%,已基本達(dá)到分類(lèi)要求,但尚不清楚有效分類(lèi)及圖3中9號(hào)樣品聚類(lèi)效果不理想的原因,需進(jìn)一步探索。
PCA運(yùn)算過(guò)程中所得的載荷矩陣的評(píng)定是基于拉曼譜圖中不同譜段貢獻(xiàn)度的差異。因此,在圖4中,將對(duì)分類(lèi)有貢獻(xiàn)的PC1、PC2、PC4和PC6所對(duì)應(yīng)的拉曼譜段用不同顏色在實(shí)驗(yàn)所得9個(gè)不同廠(chǎng)家樣品的拉曼譜圖中標(biāo)出,并將樣品的編號(hào)在圖4中進(jìn)行標(biāo)記。從圖4中可以直觀(guān)地看出,PC1包含大量相似的譜圖信息,特別是其包含了除了1604 cm1以外所有的原料藥特征峰。在PC2中同樣存在著包含大量相似譜段的情況,如僅用PC1及PC2進(jìn)行分類(lèi),是難以實(shí)現(xiàn)的。
實(shí)驗(yàn)中發(fā)現(xiàn),1600 cm1(PC4)和1650 cm1(PC6)處兩個(gè)譜峰的峰形和相對(duì)強(qiáng)度在多個(gè)樣品之間存在差異,因此在進(jìn)行投影時(shí),選擇包含1600 cm1(PC4)或1650 cm1(PC6)等存在較大差異的峰的主成分加以輔助,通過(guò)將圖像投影至更高維的空間,以增加空間容量,基于其協(xié)同作用,最終對(duì)這些樣品進(jìn)行有效區(qū)分。
將9種成品藥的輔料通過(guò)藥品說(shuō)明書(shū)進(jìn)行統(tǒng)計(jì),所得結(jié)果如電子版文后支持信息表S1所示。根據(jù)表S1,對(duì)分類(lèi)結(jié)果做進(jìn)一步分析發(fā)現(xiàn),各種樣品中輔料成分復(fù)雜,并且有一定相似性,如均含有硬脂酸、單硬脂酸甘油酯和甘油等物質(zhì);各成品藥中的輔料含量或某些特殊輔料存在差異,從而使得PCA算法可以對(duì)這些樣品進(jìn)行有效區(qū)分。因此,相同原料藥和相似的輔料導(dǎo)致在區(qū)分過(guò)程中必須提取樣品間微小的差異信息。
結(jié)合表S1,對(duì)樣品需要兩次區(qū)分的原因進(jìn)行探究。根據(jù)表1中編號(hào),第一次PCA中,7、8、9樣品雖然互相難以區(qū)分,但與其它樣品卻清晰分開(kāi),這是由于7、8、9號(hào)樣品相對(duì)于其它樣品具有大量的特殊輔料成分,如7號(hào)樣品含有特殊輔料鯨蠟醇十六酸酯、苯甲醇等;8號(hào)樣品含有特殊輔料白凡士林、甲醇等;9號(hào)樣品含有特殊輔料硬脂山梨坦、二甲硅油等。但是8、9樣品在許多輔料成分上具有明顯的相似性,相互區(qū)分較困難。同時(shí),取PC6為輔軸時(shí),所包含的峰并未顯示其差異性,無(wú)法體現(xiàn)出其輔料中不同成分的差異;而第二次區(qū)分能成功分類(lèi),是因?yàn)闃悠吩赑C4包含的位于1600 cm1處寬峰的相對(duì)強(qiáng)度存在差異。
針對(duì)此批樣品輔料表的細(xì)節(jié),結(jié)合分類(lèi)結(jié)果進(jìn)一步分析,將不同樣品在不同主成分上的距離可視化,按照?qǐng)D5A計(jì)算流程圖作圖得到圖5B,以直觀(guān)顯示同一主成分中不同樣品之間的分布情況??梢杂^(guān)察到,在PC1分量上,大多數(shù)樣品差距不明顯,說(shuō)明PCA分類(lèi)需要多個(gè)輔助軸的必要性?;趫D5B并結(jié)合表S1中樣品的差異,可詳細(xì)分析不同輔料對(duì)某一主成分的貢獻(xiàn)度。
首先對(duì)分類(lèi)過(guò)程起主要貢獻(xiàn)的輔料種類(lèi)進(jìn)行分析。圖5B中的1、2和3號(hào)樣品,其在各個(gè)主成分的距離差都較?。≒C4和PC6中尤為明顯),具有一定相似性,這兩類(lèi)樣品在表S1中也在聚山梨酯為分界的上半部分表中僅有十八醇一種輔料存在差異。8和9號(hào)樣品在PC1上的距離很近,PC1同時(shí)也是信息量最大的主成分,在表S1中兩類(lèi)樣品雖然在白凡士林、清涼香精等輔料成分上存在較大差異,但是差異并沒(méi)有在PC1中有所體現(xiàn),而其相同的成分(如硬脂酸、輕質(zhì)液滴狀石蠟等)主要存在于聚山梨酯為分界的上半部分表中,這與PC1上兩類(lèi)樣品距離近相符。7、8和9號(hào)樣品在PC1的距離相差較大,PC1是包含信息量最大的主成分,7號(hào)樣品與8、9號(hào)樣品的輔料差異也基本只存在于上半部分表。同時(shí)表S1中輔料排序?yàn)檎f(shuō)明書(shū)上的書(shū)寫(xiě)順序,輔料表中的輔料的排序與輔料的含量相關(guān)。綜上,可以推斷,在分類(lèi)中發(fā)揮主要作用的輔料是以聚山梨酯為分界的上半部分表中包含的輔料。
結(jié)合圖表,以個(gè)別輔料對(duì)于PCA的貢獻(xiàn)度進(jìn)行分析,同樣可以得出有效結(jié)果。由圖5B可知,在PC4上2、3號(hào)樣品間差距小,說(shuō)明二者共有成分包括輕質(zhì)液滴狀石蠟、硬脂酸、單硬脂酸甘油酯等,對(duì)PC4具有較大貢獻(xiàn),從而導(dǎo)致第一次PCA中兩類(lèi)區(qū)分距離較近;而7、9號(hào)樣品在PC2上的差距小,結(jié)合表S1可知,共有成分為十八醇,可以推斷其對(duì)PC2存在較大的貢獻(xiàn)而導(dǎo)致這兩類(lèi)樣品在第一次PCA中無(wú)法區(qū)分;在PC6上9號(hào)樣品與其它樣品相距很遠(yuǎn),說(shuō)明其獨(dú)有的輔料成分硬脂山梨坦和二甲硅油對(duì)PC6的貢獻(xiàn)較大。
總之,可借助類(lèi)似方法通過(guò)反追蹤主成分對(duì)于原始譜圖的貢獻(xiàn),推斷輔料和主成分之間的關(guān)系,以及檢驗(yàn)PCA投影判別法的有效性。
3.3?誤差分析
基于PCA的投影判別法不僅只是簡(jiǎn)單的聚類(lèi),其聚類(lèi)的效果同樣可以反映其它重要信息。如圖2和圖3中,部分點(diǎn)的聚類(lèi)效果不理想,存在部分點(diǎn)偏離的情況,如圖2D中1號(hào)樣品存在多個(gè)離群值。將這些樣品點(diǎn)的拉曼譜圖與聚類(lèi)較好的典型譜圖比較,在圖6中可以觀(guān)察到離群點(diǎn)的拉曼譜圖在譜峰的相對(duì)強(qiáng)度差異顯著。為探究離群值產(chǎn)生的原因,對(duì)離群樣本進(jìn)行重復(fù)多次實(shí)驗(yàn),但未能重復(fù)該現(xiàn)象,因此判斷此離群值為測(cè)量誤差所致?;赑CA的投影判別法可對(duì)在質(zhì)量控制過(guò)程中產(chǎn)生的大量數(shù)據(jù)進(jìn)行快速篩查和分析,迅速識(shí)別離群樣本,并可結(jié)合重復(fù)實(shí)驗(yàn)驗(yàn)證離群現(xiàn)象的真實(shí)性,有力提升了相關(guān)分析檢測(cè)的時(shí)效性。
實(shí)驗(yàn)表明,在多次PCA運(yùn)算過(guò)程中,9號(hào)樣品無(wú)論是第一次主成分投影圖,還是第二次投影圖,其樣品分布都較為分散。針對(duì)此現(xiàn)象,本研究提取出具有代表性的原始譜圖并進(jìn)行對(duì)比,結(jié)果如圖7A所示。其中,998和1280 cm1處兩個(gè)特征譜峰的相對(duì)峰強(qiáng)存在明顯差異。為確認(rèn)此差異性是否為測(cè)量誤差所致,選取一個(gè)樣品抹勻后進(jìn)行了多次測(cè)量,結(jié)果如圖7B中黑色圖譜所示。對(duì)同一樣品的不同點(diǎn)進(jìn)行多次測(cè)量,這兩個(gè)譜峰的相對(duì)強(qiáng)度也存在顯著差異。與原料藥的特征拉曼譜圖(圖7B紅色譜圖)進(jìn)行比對(duì),通過(guò)結(jié)合譜峰位置和相對(duì)譜峰強(qiáng)度這兩個(gè)重要信息,可以發(fā)現(xiàn)這兩個(gè)峰來(lái)自于原料藥(有效成分)。聯(lián)苯芐唑均為白色外用乳膏劑,其它廠(chǎng)家藥品樣本在分類(lèi)過(guò)程中并無(wú)此類(lèi)情況發(fā)生,且拉曼譜圖中特征峰的峰形、峰強(qiáng)均相對(duì)穩(wěn)定。故推測(cè)該廠(chǎng)家此批次藥品樣本在生產(chǎn)過(guò)程中,由于此類(lèi)成品藥中原料藥通常僅約占1%,因此在混勻過(guò)程中無(wú)法達(dá)到100 μm(激光光斑尺寸)級(jí)別的混勻,這種微米級(jí)的不均是否會(huì)對(duì)藥效產(chǎn)生影響還有待于進(jìn)一步分析。
4?結(jié) 論
采用拉曼光譜結(jié)合PCA投影判別法對(duì)聯(lián)苯芐唑的9種成品藥和2種原料藥進(jìn)行了成分分析和快速分類(lèi)。結(jié)果表明,通過(guò)PCA方法可實(shí)現(xiàn)藥物有效成分的信息快速提取,利用載荷矩陣對(duì)于不同譜段對(duì)不同主成分的貢獻(xiàn)度進(jìn)行判定,確保PCA方法提取信息的準(zhǔn)確性。利用PCA方法對(duì)經(jīng)過(guò)多種預(yù)處理的藥物拉曼光譜進(jìn)行降維,并結(jié)合投影判別法,選擇最優(yōu)的坐標(biāo)軸,實(shí)現(xiàn)對(duì)藥物的分類(lèi)。根據(jù)不同樣品在各個(gè)主成分的距離圖,結(jié)合藥物輔料成分表,對(duì)輔料與主成分的貢獻(xiàn)度進(jìn)行分析,可對(duì)主成分和輔料之間的關(guān)系進(jìn)行判斷。本研究結(jié)果表明,準(zhǔn)確反映譜圖信息的PCA投影結(jié)果可有效協(xié)助產(chǎn)品質(zhì)控,排除實(shí)驗(yàn)誤差,對(duì)實(shí)驗(yàn)和生產(chǎn)都具有重要作用。拉曼光譜和主成分分析的結(jié)合于對(duì)目標(biāo)藥物的有效成分提取和生產(chǎn)溯源具有一定的優(yōu)勢(shì),鑒定快速且可以進(jìn)行生產(chǎn)溯源,為新藥研制及藥物分析提供了一種可靠的思路和方法。
References
1?Fitzgerald R L,Rivera J D,Herold D A. Clin. Chem.,1999,45(8): 1224-1234
2?Chan J W,Taylor D S,Zwerdling T,Lane S M,Ihara K,Huser T. Biophys. J.,2006,90(2): 648-656
3?QUAN Chun-Mei,CHENG Lei,CAO Shuai. Shandong Chemical Industry,2019,332(10): 35-37
權(quán)春梅,程 磊,曹 帥. 山東化工,2019,332(10): 35-37
4?Das G,La Rocca R,Lakshmikanth T,Gentile F,Tallerico R,Zambetti L P,Devitt J,Candeloro P,De Angelis F,Carbone E,Di Fabrizio E. J. Biomed. Opt.,2010,15(2): 027007
5?D′Atri V,F(xiàn)ekete S,Clarke A,Veuthey J L,Guillarme D. Anal. Chem.,2019,91(1): 210-239
6?CAO Lu,ZHU Jia-Sen,GUAN Yan-Yan,ZHANG Wei-Hong,GONG Li,XIE Fang-Yan,ZHOU Hai-Bo,LAI Zhi-Hui,CHEN Jian. Journal of Light Scattering,2019,31(2): 102-109
曹 露,朱嘉森,管艷艷,張衛(wèi)紅,龔 力,謝方艷,周海波,賴(lài)志輝,陳 建. 光散射學(xué)報(bào),2019,31(2): 102-109
7?Al-Kindy S M,Suliman F E. Luminescence,2007,22(4): 294-301
8?Zhu P,Wen Y G,Chen J M,Zhuang J,Zhou Z L,Zheng S Y,Wu R B,Xiao X J,Lu C,F(xiàn)an R X,Guo H M,F(xiàn)an X P. J. Pharm. Biomed. Anal.,2011,54(1): 198-202
9?Dies H,Raveendran J,Escobedo C,Docoslis A. Sens. Actuators B,2018,257: 382-388
10?Roggo Y,Degardin K,Margot P. Talanta,2010,81(3): 988-995
11?Le L M M,Berge M,Tfayli A,Zhou J,Prognon P,Baillet-Guffroy A,Caudron E. Eur. J. Pharmaceut. Sci.,2018,111: 158-166
12?FENG Shang-Yuan,PAN Jian-Ji,WU Yan-An,LIN Duo,CHEN Yan-Ping,XI Gang-Qin,LIN Ju-Qiang,CHEN Rong. Scientia Sinica Vitae,2011,41(7): 550-557
馮尚源,潘建基,伍嚴(yán)安,林 多,陳燕坪,席剛琴,林居強(qiáng),陳 榮. 中國(guó)科學(xué):生命科學(xué),2011,41(7): 550-557
13?GAO Qun,ZHANG Zhong-Hu,LU Feng. Spectroscopy and Spectral Analysis,2012,32(12): 3258-3261
高 群,張中湖,陸 峰. 光譜學(xué)與光譜分析,2012,32(12): 3258-3261
14?LIU Yan,ZHANG Zhong-Hu,LU Feng. Computer and Applied Chemistry,2011,28(11): 1433-1435
柳 艷,張中湖,陸 峰. 計(jì)算機(jī)與應(yīng)用化學(xué),2011,28(11): 1433-1435
15?ZHANG Hai-Peng,F(xiàn)U Tong,ZHANG Zhi-Ru,F(xiàn)AN Zhi-Min,ZHENG Chao,HAN Bing. Journal of Jilin University(Medicine Edition),2013,39(5): 938-943
張海鵬,付 彤,張志茹,范志民,鄭 超,韓 冰. 吉林大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2013,39(5): 938-943
16?ZHANG Xun,CHEN Sheng,WU Bo-Shi,YANG Gui-hua,XU Feng. Chinese J. Anal.Chem.,2016,44(12): 1846-1851
張 遜,陳 勝,吳博士,楊桂花,許 鳳. 分析化學(xué),2016,44(12): 1846-1851
17?HUANG Shu-Shi,LAI Jun-Zhuo,LIANG Yu-Fen,WEI Jun-Bin. Chinese J.Anal.Chem.,2011,39(4): 521-527
黃庶識(shí),賴(lài)鈞灼,梁裕芬,韋俊彬. 分析化學(xué),2011,39(4): 521-527
18?Widjaja E,Zheng W,Huang Z W. Int. J. Oncol.,2008,32(3): 653-662
19?Li S X,Zeng Q Y,Li L F,Zhang Y J,Wan M M,Liu Z M,Xiong H L,Guo Z Y,Liu S H. J. Biomed. Optics,2013,18(2): 027008
20?WANG Xian-Shuang,GUO Shuai,XU Xiang-Jun,LI Ang-Ze,HE Ya-Ge,GUO Wei,LIU Rui-Bin,ZHANG Wei-Jing,ZHANG Tong-Lai. Chinese Optics,2019,12(4): 888-895
王憲雙,郭 帥,徐向君,李昂澤,何雅格,郭 偉,劉瑞斌,張緯經(jīng),張同來(lái). 中國(guó)光學(xué),2019,12(4): 888-895