汪義程,郭志永,閆 宇,薛洪寶,*,陳 鵬,宮文武
(1.蚌埠醫(yī)學(xué)院 公共基礎(chǔ)學(xué)院,安徽 蚌埠 233030;2.安徽宏業(yè)藥業(yè)有限公司 生產(chǎn)技術(shù)部,安徽 蚌埠 233045;3.安徽省藥品監(jiān)督管理局第五分局,安徽 蚌埠 233000)
近紅外光的發(fā)現(xiàn)已有兩百余年的歷史,隨著科技的發(fā)展和時(shí)代的進(jìn)步,近紅外光譜(Near infrared spectrum,NIRS)分析技術(shù)在許多行業(yè)中均發(fā)揮著重要作用,特別是在藥物分析領(lǐng)域中的應(yīng)用較為廣泛[1-2]。NIRS在制藥行業(yè)中可用于不同狀態(tài)和不同類型的藥物分析,包括原料藥純度檢測、包裝材料質(zhì)量的監(jiān)測以及對藥品加工全過程和生產(chǎn)工藝進(jìn)行在線連續(xù)分析、監(jiān)控,還可對藥物流通中的劣藥、假藥進(jìn)行鑒別和成分分析。特別是對于一些成分含量較為復(fù)雜的藥品,使用傳統(tǒng)的化學(xué)方法進(jìn)行藥品分析時(shí)程序繁多且耗時(shí)長,而近紅外分析技術(shù)可根據(jù)藥物特性進(jìn)行定性或定量分析,大大提高分析效率。
藥品生產(chǎn)時(shí)的工序一般較為復(fù)雜,要?dú)v經(jīng)混合、加工、成型和包裝等步驟才能完成生產(chǎn),而要對藥品生產(chǎn)過程中的質(zhì)量進(jìn)行有效的控制,需在藥品加工全過程對所有組分進(jìn)行全面、系統(tǒng)地檢測和分析[3],這種檢測方法速度慢,效率低,不利于提高企業(yè)的經(jīng)濟(jì)效益。近紅外光主要是C—H、O—H、N—H、S—H等含氫基團(tuán)振動(dòng)光譜倍頻及合頻等的吸收光譜,譜帶上不同基團(tuán)的近紅外吸收不同,有機(jī)化合物的結(jié)構(gòu)、組成信息可在譜圖中進(jìn)行顯示[4-5]。近紅外光譜分析技術(shù)是對標(biāo)準(zhǔn)樣品的光譜進(jìn)行采集后,運(yùn)用合適的算法計(jì)算,并建立檢驗(yàn)分析模型,同時(shí)進(jìn)行相關(guān)性驗(yàn)證。當(dāng)檢測樣品時(shí),用被檢測樣品的圖譜與標(biāo)準(zhǔn)模型進(jìn)行比對和分析,可得到檢測結(jié)果。近紅外光譜具有便捷、無損檢測、測量及結(jié)果傳遞快等特點(diǎn)[6],避免了液相色譜法和氣相色譜法樣品預(yù)處理復(fù)雜、檢測時(shí)間長、成本高等問題,適合在大規(guī)模生產(chǎn)的情況下對藥品的質(zhì)量進(jìn)行全面監(jiān)控,其在制藥領(lǐng)域的應(yīng)用前景光明,發(fā)展?jié)摿薮螅?]。
本研究通過采集某公司注射用復(fù)方甘草酸苷產(chǎn)品70批次的近紅外光譜圖,基于其中甘氨酸、甘草酸苷、鹽酸半胱氨酸3種組分的含量數(shù)據(jù),建立了可快速、準(zhǔn)確預(yù)測這3種組分含量的近紅外定量分析模型,優(yōu)化了模型[8]并進(jìn)行了可靠性驗(yàn)證。該方法為復(fù)方甘草酸苷的質(zhì)量控制提供了一種參考方法,有望作為生產(chǎn)過程中產(chǎn)品質(zhì)量控制的輔助手段,實(shí)現(xiàn)產(chǎn)品質(zhì)量監(jiān)測的全覆蓋,最大限度降低產(chǎn)品質(zhì)量風(fēng)險(xiǎn),為醫(yī)藥生產(chǎn)企業(yè)創(chuàng)造較高的間接經(jīng)濟(jì)效益。
Thermo Antaris Ⅱ近紅外光譜儀(鹵鎢燈光源);Agilent Technologies分析型高效液相色譜儀(HPLC,1260 Infinity Ⅲ Prime);Origin8.0專業(yè)函數(shù)繪圖軟件、TQ Analyst光譜分析軟件、SPSS數(shù)據(jù)統(tǒng)計(jì)分析軟件。
樣品為注射用復(fù)方甘草酸苷(標(biāo)示含量規(guī)格(參考值):每瓶含甘草酸苷40 mg,甘氨酸400 mg,鹽酸半胱氨酸20 mg)凍干粉針劑,由10 mL中性硼硅玻璃管制西林瓶包裝。
將采集的70批次注射用復(fù)方甘草酸苷樣品的近紅外光譜圖及其中甘氨酸、甘草酸苷、鹽酸半胱氨酸3種組分的含量數(shù)據(jù)作為樣品集,按照校正集與驗(yàn)證集樣品比例4∶1建立分析模型;同時(shí)在保證驗(yàn)證集樣品含量在校正集樣品含量范圍內(nèi)的前提下,選擇校正集樣品和驗(yàn)證集樣品。最終從70批次樣品集中選取13批次作為驗(yàn)證集。校正集樣品中甘氨酸、甘草酸苷、鹽酸半胱氨酸的含量分布范圍分別為:0.23% ~ 4.0%、0.40% ~ 5.1%、0.10% ~ 3.9%;驗(yàn)證集中相應(yīng)為:0.25% ~ 7.2%、0.05% ~ 0.65%、0.05% ~ 1.8%。實(shí)驗(yàn)數(shù)據(jù)處理流程見圖1。
圖1 實(shí)驗(yàn)數(shù)據(jù)處理流程圖Fig.1 The processing chart of experimental data
采用積分球漫反射采樣模塊直接掃描測定樣品的NIRS圖譜。光譜采集條件:以儀器內(nèi)置空白背景為參比,用近紅外光譜儀采集所有NIRS及CSV格式的數(shù)據(jù)矩陣;波長范圍10 000 ~ 4 000 cm-1,掃描累加次數(shù)32次,分辨率8 cm-1;分別測定各批樣品,得到3種組分的原始光譜圖(圖2A),其一階和二階導(dǎo)數(shù)光譜圖見圖2B、C。由圖2可見,復(fù)方甘草酸苷中3種組分的譜圖在9 000 ~ 8 200 cm-1和6 700 ~5 000 cm-1范圍內(nèi)存在較大差異。最終選擇8 928.80 ~ 8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~ 8 411.80 cm-1譜段建立3種組分的定量分析模型。
分別從每個(gè)批次的樣品中隨機(jī)選取2組數(shù)據(jù),共得到140個(gè)紅外光譜圖作為建模分析用樣本,建立注射用復(fù)方甘草酸苷的偏最小二乘回歸(PLS)[8]定量分析模型。
2.2.1 模型評價(jià)以70批次樣品為標(biāo)準(zhǔn)樣品,隨機(jī)選取兩組樣品作為驗(yàn)證樣品進(jìn)行分析,將分析結(jié)果與標(biāo)準(zhǔn)值進(jìn)行比較,根據(jù)窗口中模型參數(shù)選擇,計(jì)算其指標(biāo)特征。其中相關(guān)系數(shù)(R)反映預(yù)測值與參考值的相關(guān)性,該值越高則相關(guān)性越高;校正均方根誤差(RMSEC)、預(yù)測均方根誤差(RMSEP)作為評價(jià)所建定量模型性能的指標(biāo),其結(jié)果越接近0,說明模型適用性越強(qiáng),預(yù)測結(jié)果越準(zhǔn)確。根據(jù)以上數(shù)值對模型的預(yù)測效果進(jìn)行綜合評價(jià)。
2.2.2 預(yù)處理方法的選擇光譜預(yù)處理方法有平滑、位移校正、導(dǎo)數(shù)校正、小波變換等,合適的光譜預(yù)處理方法可以有效消除物理因素的干擾,提高NIRS與待測化學(xué)成分的相關(guān)性。不同預(yù)處理方法結(jié)合使用有望得到更好的模型效果[9],本研究發(fā)現(xiàn),樣品光譜經(jīng)過一階導(dǎo)數(shù)+S-G(3,3)點(diǎn)平滑處理后,不僅能有效消除光譜漂移和噪音,且8 928.80 ~8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~8 411.80 cm-1譜段內(nèi)的曲線波動(dòng)明顯,數(shù)據(jù)變異性增強(qiáng),能夠最大限度地體現(xiàn)不同品種光譜的差別。以該譜段作為特征區(qū)間,考察了全譜段與特征區(qū)間譜段的建模效果。由表1可知,一階導(dǎo)數(shù)分別結(jié)合S-G(3,5)、S-G(3,4)、S-G(3,3)、S-G(3,2)、S-G(3,1)點(diǎn)平滑處理時(shí)的結(jié)果一致,為減小實(shí)驗(yàn)誤差,確保模型的準(zhǔn)確性和可靠性,取中間的S-G(3,3)點(diǎn)平滑結(jié)合一階導(dǎo)數(shù)作為預(yù)處理方法。
2.3.1 建模結(jié)果通過優(yōu)化譜段和選擇不同預(yù)處理方法,并結(jié)合軟件自帶的光譜離群值剔除功能,剔除影響模型建立的樣本[8],確定最終的建模參數(shù)為:譜圖預(yù)處理選擇一階導(dǎo)數(shù)+S-G(3,3)平滑,譜段分別選擇8 928.80 ~ 8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~ 8 411.80 cm-1,通過RMSEC對主因子作圖優(yōu)化模型參數(shù),分別得到甘氨酸、甘草酸苷,鹽酸半胱氨酸3種組分模型的最佳主因子數(shù)為10、3、10,模型相關(guān)系數(shù)(R)分別為0.999 54、0.947 01、0.999 95,RMSEC依次為0.289、0.098 0、0.001 07(表1)。相關(guān)系數(shù)值均接近1,表明預(yù)測值與參考值之間存在良好的相關(guān)性;均方根誤差較小,表明預(yù)測值與參考值之間產(chǎn)生的誤差較小。而模型相關(guān)系數(shù)0.947 01數(shù)值偏離1,可能原因如下:其一,受近紅外檢測限的影響。國際公認(rèn)檢測限為0.1%,若樣品濃度低于該閾值,將導(dǎo)致近紅外模型預(yù)測誤差較大;其二,受建模樣本代表性及數(shù)量的影響。理論上,建模樣本數(shù)量越多,統(tǒng)計(jì)模型可靠性越高,若建模樣本缺乏代表性,將導(dǎo)致化學(xué)性質(zhì)僅分布在一個(gè)很小的區(qū)間內(nèi),使得該模型不具備廣泛代表性。
2.3.2 模型驗(yàn)證為確認(rèn)所建立的定量模型能適應(yīng)所測樣品,并能對實(shí)際樣品進(jìn)行準(zhǔn)確預(yù)測,使用驗(yàn)證集中的13批樣品對所建立的模型進(jìn)行驗(yàn)證。使用驗(yàn)證集的相關(guān)系數(shù)(R)和均方根誤差對模型性能進(jìn)行評估[9]。3種組分驗(yàn)證集的R分別為0.999 34、0.949 00、0.989 23,RMSEP分別為1.86、0.302、0.191,預(yù)測值分別為397.396 2、19.810 0、40.210 8。將模型預(yù)測值與參考值進(jìn)行比較,結(jié)果顯示,甘氨酸、甘草酸苷、鹽酸半胱氨酸的預(yù)測值與參考值之間的平均相對誤差分別為0.41%、0.72%、0.86%,且預(yù)測值與參考值在95%置信區(qū)間內(nèi)無顯著性差異(P> 0.05)。
以未用于建模的16批注射用復(fù)方甘草酸苷樣品及1份不合格樣品作為對照,分別掃描其近紅外光譜圖,利用所建模型預(yù)測其中3種成分的含量,表2為NIRS預(yù)測值與測定值的比較。測定值為各成分的實(shí)際含量[10],其中,鹽酸半胱氨酸的檢測方法為高效液相色譜法,甘草酸苷為硫代硫酸鈉滴定法,甘氨酸為氫氧化鈉滴定法。由表2可知,測定值間的全譜段匹配度平均值為:鹽酸半胱氨酸99.19%、甘草酸苷99.73%、甘氨酸為98.64%;區(qū)段譜圖匹配度平均值為:鹽酸半胱氨酸為95.28%、甘草酸苷為99.81%、甘氨酸為99.63%;平均誤差率:鹽酸半胱氨酸為-0.37%、甘草酸苷為2.14%、甘氨酸為0.37%。結(jié)果表明,NIRS預(yù)測值與測定值間無顯著性差異,說明所建立的模型可用于注射用復(fù)方甘草酸苷的快速測定[11-13]。
表2 模型預(yù)測值與測定值的比較Table 2 Comparison of predicted values and measurement values
由3種成分的全譜圖匹配度和區(qū)段譜圖匹配度可知,所建模型具有一定的精密度和準(zhǔn)確度,16批樣品的個(gè)體誤差率值較小,均在± 5%以內(nèi),平均誤差率在± 2.5%以內(nèi),說明預(yù)測結(jié)果的可靠性和穩(wěn)定性均較高。不合格對照組中鹽酸半胱氨酸和甘草酸苷誤差率為3.13%和3.76%,相對較高,但符合要求;而甘氨酸的誤差率為6.13%,超出5%范圍,定量分析結(jié)果不符合要求。由此可見本定量分析方法模型穩(wěn)定、可靠、精密、準(zhǔn)確,可作為醫(yī)藥生產(chǎn)企業(yè)對注射用復(fù)方甘草酸苷質(zhì)量控制的有效輔助質(zhì)量控制手段。
以某公司注射用復(fù)方甘草酸苷產(chǎn)品70批次的質(zhì)量檢驗(yàn)數(shù)據(jù)為基礎(chǔ)建立數(shù)學(xué)模型,由于數(shù)據(jù)采集的時(shí)間跨度較大,儀器穩(wěn)定性、溫度、濕度、樣品含水量、pH值等外部因素存在差異,可能會(huì)導(dǎo)致實(shí)驗(yàn)數(shù)據(jù)存在差異,使得后期建模過程存在一些問題。因此,應(yīng)盡量在短時(shí)間內(nèi)采集數(shù)據(jù),保證數(shù)據(jù)的準(zhǔn)確性和精度。原始光譜是模型建立的基礎(chǔ),標(biāo)準(zhǔn)樣品組分含量測定的準(zhǔn)確性和精度是影響NIRS定量分析準(zhǔn)確度的最主要因素。光譜采集和數(shù)據(jù)記錄的準(zhǔn)確性也決定了模型的真實(shí)性[14]。其次,建立定量分析鑒別模型是利用樣品的圖譜庫,因此樣本的代表性受圖譜庫大小的影響,并決定了模型的準(zhǔn)確性。一般要求建模的樣品量不少于50批,以降低樣品預(yù)測誤差。
通過選擇光程類型、導(dǎo)數(shù)處理、濾噪、平滑和基線校正等對光譜進(jìn)行預(yù)處理,可以提高模型的穩(wěn)健性。建模過程中,光譜范圍的選擇對模型的建立至關(guān)重要,可避免其它信息對有效光譜信息的干擾,不同建模波段下模型的性能結(jié)果(圖2)顯示,選擇8 928.80 ~ 8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~ 8 411.80 cm-1譜段得到的3種組分的定量分析模型整體性能較好。因此要根據(jù)長期積累的經(jīng)驗(yàn)和對所分析樣品化學(xué)性質(zhì)的了解選擇合適的譜段建立模型,確保模型的準(zhǔn)確性和專屬性[15]。
NIRS定量分析模型的建立是一個(gè)反復(fù)循環(huán)優(yōu)化的復(fù)雜過程,需要不斷地檢查造成模型精度不合格的原因,并反復(fù)進(jìn)行分析和排除,直至驗(yàn)證結(jié)果滿意。在模型的反復(fù)優(yōu)化過程中,可選擇相關(guān)系數(shù)(R)和均方根誤差(RMSE)作為評價(jià)指標(biāo)對模型的效果進(jìn)行驗(yàn)證和評估[16]。
本研究建立了注射用復(fù)方甘草酸苷中3種組分的定量分析模型,結(jié)果顯示,該3種組分的預(yù)測值與測定值之間存在良好的相關(guān)性,所建模型穩(wěn)定、可靠,能有效地對未知樣品成分進(jìn)行含量預(yù)測。通過近紅外光譜技術(shù)不僅可實(shí)現(xiàn)注射用復(fù)方甘草酸苷凍干粉針劑生產(chǎn)過程的實(shí)時(shí)監(jiān)控,還可簡化其檢驗(yàn)工序,進(jìn)一步提升檢驗(yàn)精確度,保障注射用復(fù)方甘草酸苷凍干粉針劑的質(zhì)量。