王炫凱(山東省棗莊市實驗中學,山東 棗莊 277000)
頂空氣相色譜中藥分類
王炫凱(山東省棗莊市實驗中學,山東 棗莊 277000)
對中藥的頂空氣相色譜進行了奇異值分解與主成分分析。以前兩個主成分為新的坐標,對青皮,藿香,當歸進行分類,效果明顯從而以頂空氣相色譜為基礎(chǔ)建立了中藥的指紋圖譜。
主成分分析;奇異值分解;青皮;藿香;當歸;中藥;指紋圖譜;頂空氣相
1.1 頂空分析技術(shù)原理
1.1.1 頂空分析技術(shù)
頂空分析技術(shù)經(jīng)常用于氣相色譜分析,是氣相色譜分析中的一種處理手段,也就是氣體萃取技術(shù)。如果樣品中存在痕量的高揮發(fā)性的物質(zhì),也可以進行定性定量地分析測定。又因為高揮發(fā)性的物質(zhì)的氣相組分含量較大,因此氣體是最適合的溶劑,常用氣體萃取的方法來提高被測物的濃度。
1.1.2 頂空分析技術(shù)的分類
頂空分析法通??煞譃槿悾红o態(tài)頂空分析,動態(tài)頂空分析和頂空-固相微萃取。[1]他們分別有這這樣的有點:靜態(tài)頂空分析操作簡單,便于進樣與測量。動態(tài)頂空分析由于自動化發(fā)展較多,便于大批量地測量。頂空-固相微萃取的萃取回收率高,測量的靈敏度也高。
1.1.3 靜態(tài)頂空分析
由于在封閉的容器中,由于樣品的蒸汽壓,使得樣品的固相和氣相在容器中達到平衡。抽取容器上方中的氣體,便可以直接對樣品氣體進行分析與測試。這就是靜態(tài)頂空分析。
靜態(tài)頂空分析可分為三類模式:頂空直接注入模式,平衡壓力提取采樣模式和壓力恒定體積采樣模式。我們專注于頂空直接注入模式,因為成本較低使用較多的是頂空直接注入模式。頂空直接注射系統(tǒng)通常在氣體取樣針的外側(cè)具有溫度控制裝置,而且還配備有氣密的取樣針。
靜態(tài)頂空分析氣體直接注射可以分為兩個步驟:首先,將液體樣品或固體樣品置于封閉的玻璃小瓶中,并且超過一半的氣體空間留在小瓶中的樣品上方。相平衡在恒溫下實現(xiàn)。然后使用氣密注射器將樣品瓶中的頂部空間氣體直接注入色譜儀的入口,用于色譜分離和測定。這種靜態(tài)頂空分析方法具有廣泛的適用性,易于清潔。它適用于具有高揮發(fā)物含量的樣品,如香料,苯,香料,煙草和樟腦。靜態(tài)頂空分析的主要缺點是必須注入大體積的氣體,不然會使得揮發(fā)性物質(zhì)的色譜峰的初始擴展將影響色譜分離,造成干擾。
1.2 頂空色譜分析的樣品要求
如果要進行頂空氣相色譜分析,那么樣品必須具有這些要求。樣品是有揮發(fā)性的固體或者液體,如果蒸汽壓較低,無法達到萃取要求的話,可以選擇別的萃取方式。樣品有一定的熱穩(wěn)定性,否則加熱萃取時,會造成干擾,影響實驗,甚至損壞儀器。
1.3 頂空氣相萃取的過程
在頂空分析技術(shù)中,分析物首先從液相或者固相擴散到氣相中。然后將分析的組分從氣相轉(zhuǎn)移到固定相。這種改進避免了在某些樣品基質(zhì)中具有高分子量和非揮發(fā)性物質(zhì)的萃取固定相的污染。萃取時,分析物的擴散過程是萃取的決速步驟。因為固定相的萃取的速率一般遠遠地超過了分析物的擴散的速率。使得揮發(fā)性組分具有比半揮發(fā)性組分快得多的提取速率。事實上,對于揮發(fā)性組分,頂空萃取的平衡時間遠小于在相同混合條件下的直接萃取平衡的平衡時間。
化學模式識別技術(shù)分為非監(jiān)督方法和監(jiān)督方法2類。利用計算機的分類算法,根據(jù)信息中包含的化學成分的材料,從而能很好地對指紋進行分類。以下介紹兩種常用的監(jiān)督模式識別方法。
2.1 主成分分析
PCA算法的原理是將原來的變量進行線性組合,綜合各個變量,得到幾個新變量,用新變量來表示數(shù)據(jù)。如果取前兩個新變量,那么就可以用一個二維圖圖像表示出原來的數(shù)據(jù),起到了降維的作用,也易于數(shù)據(jù)的可視化表示。常見的降維算法有特征值分解和奇異值分解,特征值分解要求原數(shù)據(jù)是方陣,而奇異值分解則無要求。
2.2 聚類分析
聚類分析的原理很簡單。首先定義樣本數(shù)據(jù)之間的距離。常見的距離定義有馬氏距離,曼哈頓距離,歐式距離等。根據(jù)各個樣本之間的距離遠近來進行聚類。如距離大于1則分為A類,距離小于1則分為B類。因此可以調(diào)整聚類的距離值,來控制具體聚類的類別數(shù)目,距離越短,同類樣本之間的距離就越接近,類別數(shù)目就越多。距離越大,同類樣本之間的距離越大,類別數(shù)目就越少。
2000年后,中藥指紋圖譜的研究得到了空前的發(fā)展。聚類分析、主成分分析、人工神經(jīng)網(wǎng)絡(luò)技術(shù)等現(xiàn)代數(shù)據(jù)處理的算法快速發(fā)展。很多指紋信息可以完全整合,正確的表達,真實,生動地反映了中醫(yī)藥質(zhì)量的差異。各種色譜圖,光譜,光譜手段應用于建立中醫(yī)指紋,中藥成分分析技術(shù)成為有用的信息提取手段。
指紋是指可標記的化學特性的對象適當?shù)奶幚砗?,提前共有信息的色譜或光譜圖,采用一定的分析方法。生動地說,中藥指紋是中藥的身份證,中藥的主要化學信息可以反映在指紋,指紋作出的中藥圖譜可以用來對中藥分類。
以青皮、藿香、當歸為例,對中藥建立指紋圖譜分類。
4.1 中藥的色譜流出時間圖
為了更好表示每個樣本的氣相色譜圖,在基線依次加了1000000,色譜圖如圖1。
圖1 中藥色譜圖
4.2 數(shù)據(jù)自標準化
數(shù)據(jù)自標準化有很多方式,第一種方法是先求出每組數(shù)據(jù)的標準偏差和平均值,每個數(shù)據(jù)值依次除以標準偏差,使得每組數(shù)據(jù)的離散程度相同,標準偏差都為1。每個數(shù)據(jù)再減去平均值,使得每組數(shù)據(jù)中性化,都以0為中心分布。第二種方式是取每列數(shù)據(jù)的區(qū)間長度與數(shù)據(jù)最小值,每個數(shù)據(jù)減去數(shù)據(jù)最小值后除以區(qū)間長度,使得數(shù)據(jù)在[0,1]之間分布。
第一種方法無法處理對于離散程度較大數(shù)據(jù)。第二種方法沒有中心化,參考點不同,但是可以處理離散程度較大的數(shù)據(jù)。
4.3 相關(guān)系數(shù)矩陣
相關(guān)系數(shù)是兩組數(shù)據(jù)的協(xié)方差除以兩組數(shù)據(jù)各自標準差的乘積。可以反映兩組數(shù)據(jù)之間的線性相關(guān)性,以此為判據(jù),可做粗略的分類。計算數(shù)據(jù)的相關(guān)系數(shù)矩陣得表1:
表1 相關(guān)系數(shù)矩陣
可以看出同類的相關(guān)系數(shù)很高都大于0.65。
4.4 主成分分析與奇異值分解
4.4.1 奇異值分解
為了進行合理的分類算法,可以選取特征的流出時間作為依據(jù)來對中藥進行分類。但是如此做存在缺陷,目前只有三種中藥,即最少只要三個特征向量就可以進行分類。對于樣本較少的情況下可以這么做,但是沒有普遍性,因為也許有了第四種中藥,僅憑這三個特征向量是不能分類的。而且即使多選擇至11個特征向量,也無法合理分類,因為可知N種中藥至少需要N個特征向量。因此可以對所有流出時間進行分析找出所有的特征向量,而不是有限的N個向量,這樣可以保證分類的準確性,不會輕易地把從未測量過的未知樣錯誤地分如已知類別中。
4.4.2 主成分分析
常見的主成分分解對樣本的數(shù)據(jù)矩陣要求是非奇異方陣,而本實驗八個樣本,5706個數(shù)據(jù)點,為8×5706的矩陣,且秩為三。因此只能進行奇異值分解。分解樣本矩陣,選取奇異值從小到大排序,選取前兩個奇異值所對應的特征向量作為主成分在舊空間中的坐標變化的新基。
4.4.3 分類圖
標準化后的原數(shù)據(jù)在用新基表示的線性空間內(nèi),可變?yōu)槿缦聰?shù)據(jù),見表2:
表2
第一步數(shù)據(jù)中心化標準化,使得數(shù)據(jù)離散程度相同,并且都以0為中心分布,便于公平的分類。
第二步主成分分解或奇異值分解,找到這個矩陣最大的幾個特征值或奇異值所對于的特征向量,好表示這個矩陣。
第三步,以這些特征向量為新的坐標軸,畫出原數(shù)據(jù)在新坐標下的坐標。
第四步,根據(jù)坐標的鄰近程度分類。
[1]王昊陽,郭寅龍,張正行,安登魁.頂空-氣相色譜法進展[J].分析測試技術(shù)與儀器,2003,(03):129-135.