魯書山++沈小林++樊凱強
摘 要:闡述里主成分分析法的定義,及應(yīng)用于實際的意義,通過matlab編程實現(xiàn)主成分分析法在圖像壓縮方面的應(yīng)用,在編程過程中設(shè)置不同主成分個數(shù)來顯示不同的處理結(jié)果。在對處理結(jié)果進行分析,同時也對主成分分析法的性質(zhì)有了更直觀的認識,方便日后在其他領(lǐng)域的應(yīng)用。
關(guān)鍵詞:主成分分析法;圖像壓縮;特征提取;matlab編程
中圖分類號:TP309.7 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2016.23.098
主成分分析法是用降維的思想,用幾個互不相關(guān)的主成分反映原始變量的大部分信息的統(tǒng)計方法。能有效降低數(shù)據(jù)維度,減少計算量,在涉及到數(shù)理統(tǒng)計的各個領(lǐng)域均有廣泛的應(yīng)用。本文先介紹主成分分析的原理,再通過matlab用主成分分析法對圖像進行壓縮,實現(xiàn)主成分在圖像處理中的應(yīng)用。
1 主成分分析法概念及性質(zhì)
1.1 概念
假定有n個樣本,每個樣本由p個變量構(gòu)成,則可以組成一個n×p階的數(shù)據(jù)矩陣:
設(shè)x1,x2,…,xP為原變量,z1,z2,…,zm(m≤p)為新變量,則:
系數(shù)lij為新變量對原變量的反應(yīng)情況。
1.2 性質(zhì)
zi與zk(i≠k;i,k=1,2,…,m;j=1,2,…,p)相互無關(guān);z1是x1,x2,…,xP的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,…,xP的所有線性組合中方差最大者;zm是與z1,z2,……,zm-1都不相關(guān)的x1,x2,…xP的所有線性組合中方差最大者。則新變量指標z1,z2,…,zm分別稱為原變量指標x1,x2,…,xP的第1,第2,…,第m主成分。
通過以上表述可知,主成分分析的實質(zhì)是計算主成分zi(i=1,2,…,m)所反映的原變量xj(j=1,2,…,p)上的荷載 lij(i=1,2,…,m;j=1,2,…,p)。它們分別是相關(guān)矩陣(也就是x1,x2,…,xP 的相關(guān)系數(shù)矩陣)m個較大的特征值所對應(yīng)的特征向量。
2 計算步驟
2.1 計算相關(guān)系數(shù)矩陣
相關(guān)系數(shù)矩陣為:
rij(i,j=1,2,…,p)為原變量xi與xj標準化后的相關(guān)系數(shù),rij=rji,其計算公式為:
2.2 計算特征值與特征向量
解特征方程|λI-R|=0,求出特征值,并使其按大小順序排列λ1≥λ2≥…≥λp≥0;分別求出對應(yīng)于特征值λi的特征向量ei
(i=1,2,…,p),要求‖ei‖=1,即 =1,其中,eij表示向
量ei的第j個分量,也就是說ei為單位向量。
2.3 計算主成分貢獻率及累計貢獻率
主成分貢獻率為:
主成分累計貢獻率為:
一般取累計貢獻率達85%~95%的特征值λ1,λ2,…,λm所對應(yīng)的第1、第2、…、第m(m≤p)個主成分。
2.4 計算主成分載荷
,主成分載荷就是zi與xj之間的相關(guān)系數(shù)(主成分不相關(guān))。
2.5 各主成分的得分
各主成分的得分為:
3 圖像處理及結(jié)論
眾所周知,圖像信息所含的數(shù)據(jù)量巨大。為了便于圖像的存儲,提高存儲效率,研究圖像壓縮具有重要的意義。
主成分分析法在數(shù)字圖像壓縮中的的應(yīng)用
魯書山,沈小林,樊凱強
(中北大學(xué),山西 太原 030051)
摘 要:闡述里主成分分析法的定義,及應(yīng)用于實際的意義,通過matlab編程實現(xiàn)主成分分析法在圖像壓縮方面的應(yīng)用,在編程過程中設(shè)置不同主成分個數(shù)來顯示不同的處理結(jié)果。在對處理結(jié)果進行分析,同時也對主成分分析法的性質(zhì)有了更直觀的認識,方便日后在其他領(lǐng)域的應(yīng)用。
關(guān)鍵詞:主成分分析法;圖像壓縮;特征提?。籱atlab編程
中圖分類號:TP309.7 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2016.23.098
主成分分析法是用降維的思想,用幾個互不相關(guān)的主成分反映原始變量的大部分信息的統(tǒng)計方法。能有效降低數(shù)據(jù)維度,減少計算量,在涉及到數(shù)理統(tǒng)計的各個領(lǐng)域均有廣泛的應(yīng)用。本文先介紹主成分分析的原理,再通過matlab用主成分分析法對圖像進行壓縮,實現(xiàn)主成分在圖像處理中的應(yīng)用。
1 主成分分析法概念及性質(zhì)
1.1 概念
假定有n個樣本,每個樣本由p個變量構(gòu)成,則可以組成一個n×p階的數(shù)據(jù)矩陣:
. (1)
設(shè)x1,x2,…,xP為原變量,z1,z2,…,zm(m≤p)為新變量,則:
. (2)
系數(shù)lij為新變量對原變量的反應(yīng)情況。
1.2 性質(zhì)
zi與zk(i≠k;i,k=1,2,…,m;j=1,2,…,p)相互無關(guān);z1是x1,x2,…,xP的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,…,xP的所有線性組合中方差最大者;zm是與z1,z2,……,zm-1都不相關(guān)的x1,x2,…xP的所有線性組合中方差最大者。則新變量指標z1,z2,…,zm分別稱為原變量指標x1,x2,…,xP的第1,第2,…,第m主成分。
通過以上表述可知,主成分分析的實質(zhì)是計算主成分zi(i=1,2,…,m)所反映的原變量xj(j=1,2,…,p)上的荷載 lij(i=1,2,…,m;j=1,2,…,p)。它們分別是相關(guān)矩陣(也就是x1,x2,…,xP 的相關(guān)系數(shù)矩陣)m個較大的特征值所對應(yīng)的特征向量。
2 計算步驟
2.1 計算相關(guān)系數(shù)矩陣
相關(guān)系數(shù)矩陣為:
. (3)
rij(i,j=1,2,…,p)為原變量xi與xj標準化后的相關(guān)系數(shù),rij=rji,其計算公式為:
. (4)
2.2 計算特征值與特征向量
解特征方程|λI-R|=0,求出特征值,并使其按大小順序排列λ1≥λ2≥…≥λp≥0;分別求出對應(yīng)于特征值λi的特征向量ei
(i=1,2,…,p),要求‖ei‖=1,即 =1,其中,eij表示向
量ei的第j個分量,也就是說ei為單位向量。
2.3 計算主成分貢獻率及累計貢獻率
主成分貢獻率為:
. (5)
主成分累計貢獻率為:
. (6)
一般取累計貢獻率達85%~95%的特征值λ1,λ2,…,λm所對應(yīng)的第1、第2、…、第m(m≤p)個主成分。
2.4 計算主成分載荷
,主成分載荷就是zi與xj之間的相關(guān)系數(shù)(主成分不相關(guān))。
2.5 各主成分的得分
各主成分的得分為:
. (7)
. (8)
3 圖像處理及結(jié)論
眾所周知,圖像信息所含的數(shù)據(jù)量巨大。為了便于圖像的存儲,提高存儲效率,研究圖像壓縮具有重要的意義。