梁海玲, 白森, 李堅
( 廣西中煙工業(yè)有限責任公司技術中心, 廣西 530001)
數(shù)據(jù)驅動的工業(yè)異常檢測方法目前已被廣泛應用于實際生產過程,其核心思想是基于歷史數(shù)據(jù)構建離線監(jiān)測模型并設計監(jiān)控策略開展在線異常檢測。在歷史數(shù)據(jù)不包含異常數(shù)據(jù)的條件下,只能利用正常生產數(shù)據(jù)開展研究,即無監(jiān)督學習模式。主元分析(principal component analysis, PCA)法是一種非常經(jīng)典且流行的無監(jiān)督特征提取方法,通過特征分解的方式,將含有冗余特征的高維原始數(shù)據(jù)投影到新的低維空間實現(xiàn)對冗余特征的篩選保留。在此基礎上,通過設計監(jiān)控統(tǒng)計量預測誤差平方和(squared prediction error, SPE)和Hotelling-T2(簡稱“T2”),在線對數(shù)據(jù)進行實時異常檢測?;赑CA的異常檢測方法原理簡單、操作方便且功能豐富,被普遍應用于工業(yè)無監(jiān)督異常檢測場景[1]。
PCA方法的一個前提假設是高維原始數(shù)據(jù)的各特征變量應滿足高斯分布。因此,當原始數(shù)據(jù)集中存在異常數(shù)據(jù)偏離正常分布時,顯然就不能滿足這個要求。現(xiàn)代工業(yè)的整個生產工藝是由眾多離散間歇的工序組成,生產數(shù)據(jù)由傳感器采集,并經(jīng)過數(shù)據(jù)總線傳送給數(shù)據(jù)中心或者其他服務器予以處理,中間環(huán)節(jié)眾多,生產數(shù)據(jù)難免會受到內部或外部環(huán)境的噪聲影響而異常擾動,產生一些異常數(shù)據(jù)。如非封閉生產條件下的溫濕度,傳感器本身的隨機擾動,以及數(shù)據(jù)存儲、管理系統(tǒng)的突發(fā)性問題等。這些不確定性因素均會造成偏離正常高斯分布的強噪聲以及離散的離群點等異常值。實驗證明,PCA方法對異常值十分敏感,極易受到制約,導致工作性能嚴重退步。另外,PCA最終提取的主元本質上是原始數(shù)據(jù)各維度的線性組合,因此所有主元都是非稀疏的,即主元的各低維元素大部分非零。這就導致了每個主元很難與相應的數(shù)據(jù)特征相對應,具有較差的解釋性,即很難將一個故障歸結于某類數(shù)據(jù)特征。
魯棒PCA技術可用于解決PCA的異常值敏感問題,其中研究最廣泛的是L1-PCA方法。L1-PCA假設模型參數(shù)服從拉普拉斯分布,且將PCA技術中的L2范數(shù)改為L1范數(shù)求解,以便得到較好的魯棒性[2]。這主要有兩方面的考慮:一是服從拉普拉斯分布的隨機變量,出現(xiàn)極端值即異常值的概率遠大于正態(tài)分布;另一方面,L2范數(shù)本身對異常值敏感,會通過傾向于減少異常值誤差的計算實現(xiàn)目標函數(shù)的最小化,造成訓練結果的偏差,而L1范數(shù)則不存在這個問題。但是,由于L1范數(shù)中有絕對值,大大增加了計算復雜度,使得L1范數(shù)優(yōu)化比傳統(tǒng)L2范數(shù)優(yōu)化在計算上要求更高[3]。文獻[4-5]對優(yōu)化算法進行了改進,以減小計算復雜度。針對主元解釋性差問題,直接有效的方法是利用稀疏技術計算得到稀疏主元,使得主元在保存必要信息的同時獲取最大解釋方差。稀疏PCA(sparse PCA, SPCA)基本思路是在原有PCA基礎上增加帶有稀疏度的懲罰項或者稀疏約束條件,獲取多個元素為零的負載向量,最終得到稀疏主元[6]。文獻[7-9]對SPCA在計算復雜度、自適應以及罰函數(shù)等多個方面進行了改進。
為了同時增強PCA方法的魯棒性和稀疏性,文獻[10]提出了一種魯棒稀疏PCA(robust sparse PCA, RSPCA)方法。與傳統(tǒng)SPCA不同,RSPCA試圖最大化數(shù)據(jù)的L1范數(shù)方差,并通過添加L0范數(shù)約束條件控制稀疏性。文獻[11]設計了基于Lp-模的SPCA (LpSPCA),通過極大化帶有稀疏正則項的Lp-模樣本方差, 使得其在降維的同時保證了稀疏性和魯棒性,并應用于人臉重構。實驗證明,這些方法能夠在一定程度上提升魯棒性和稀疏性,但是并沒有從根本上解決PCA的異常值敏感問題。另外,RSPCA并沒有給定稀疏度的確定方式。稀疏度的增加意味著解釋方差的減小。因此,為每個稀疏主元指定非零負載元素的數(shù)目是非常重要的?,F(xiàn)對RSPCA方法進行改進,提出應用于工業(yè)異常檢測的IRSPCA(improved robust sparse PCA)方法,在RSPCA基礎上開發(fā)基于稀疏性準則的兩階段稀疏度選擇技術,以及基于SPE統(tǒng)計量的異常值剔除策略;最后,通過一個數(shù)值案例和一個煙草煙支成品質量檢測案例驗證所提出IRSPCA方法的有效性。
PCA本質是通過對原坐標軸進行平移和旋轉變換,得到一個新的坐標軸。新坐標軸的第一主軸是原始數(shù)據(jù)能夠投影得到最大方差的方向,也就是數(shù)據(jù)特征差異最大的方向。新坐標軸的其他主軸在與前一主軸標準正交的條件下,選取數(shù)據(jù)特征差異相對最大的方向。數(shù)據(jù)特征差異最大方向可以通過優(yōu)化問題計算得到[12]。
輸入數(shù)據(jù)矩陣為X=[x1,x2,…,xN]T∈RN×V,其中,N為樣本個數(shù),V為過程變量個數(shù)。首先需要標準化處理原始數(shù)據(jù)矩陣,避免因為各特征變量量綱的區(qū)別而淹沒重要信息。設xi∈R1×V(i=1,2,…,N)為數(shù)據(jù)矩陣X的行向量,即一個樣本向量。
原始數(shù)據(jù)特征差異的大小是通過投影數(shù)據(jù)的方差來表征的。將原始數(shù)據(jù)沿不同的向量進行投影,將得到不同的投影數(shù)據(jù),那么投影數(shù)據(jù)的方差也是不同的,即所表征的信息大小也將發(fā)生改變。可以得到,數(shù)據(jù)投影的方差是與數(shù)據(jù)分散程度成正比的,方差越大,則意味著該方向所含差異信息量越大,反之則越小。這樣,為了盡可能大地反映原始數(shù)據(jù)的信息,需要確定某個單位向量w,使得原始數(shù)據(jù)在其上的投影數(shù)據(jù)具有最大方差。首先考慮樣本X與其在單位向量w上投影的最大化方差問題。
樣本X在單位向量w上投影向量t的數(shù)學表達式為
(1)
式(1)中:‖·‖2為向量或矩陣的L2范數(shù)。t的方差為
(2)
優(yōu)化問題的數(shù)學表達式為
(3)
引入拉格朗日乘子求解,令λ為拉格朗日系數(shù),得到拉格朗日方程為
L(w,λ)=wTYw-λ(wTw-1)
(4)
分別求L對w和λ的微分,并令其為0,即
(5)
這樣w的解滿足以下特征方程,即
(6)
可以得到,w是Y的一個標準化特征向量,其所對應的特征值為λ。根據(jù)式(2)和式(6),得到Var(t)=λ。所以,若要使Var(t)最大,則向量w對應的特征值λ應該是所有特征值中的最大值。令λ1是矩陣Y的最大特征根,向量w1是λ1對應的特征向量,且w1模為1。w1作為第一主軸,其投影向量t1則為第一主元。
(7)
各主元存在以下關系:Var(t1)≥Var(t2)≥…≥Var(tV),即第一主元t1攜帶最大信息量,后續(xù)依次減小。
原始數(shù)據(jù)空間經(jīng)過PCA方法處理后,可以分解為兩個正交子空間。取前p個主元的主元子空間W0=[w1,w2,…,wp],剩下主元構成殘差子空間W1=[wp+1,wp+2,…,wV]。在線檢測時,新的測量數(shù)據(jù)xnew=[x1,x2,…,xV]T投影到主元子空間W0,得
(8)
對工業(yè)過程運行狀態(tài)的監(jiān)控是通過T2和SPE兩個多元統(tǒng)計量來實現(xiàn)的。T2統(tǒng)計量用于監(jiān)測主元的波動情況,定義為
(9)
式(9)中:tnew=[t1,t2,…,tp]T為式(8)計算得到的主元得分向量,協(xié)方差矩陣Y的前p個特征值對應對角陣S的對角元素。
SPE統(tǒng)計量又稱為Q統(tǒng)計量,用于度量當前測量數(shù)據(jù)與主元空間的偏離程度,定義為
(10)
當監(jiān)測數(shù)據(jù)服從正態(tài)分布時,T2和SPE統(tǒng)計量的統(tǒng)計控制限分別定義為
(11)
式(11)中:T2統(tǒng)計量服從F分布;α為顯著性水平,F(xiàn)α(p,N-p)為自由度為p、N-p條件下的F分布臨界值,可直接從統(tǒng)計表查到。SPE統(tǒng)計量的Cα為標準正態(tài)分布在顯著性水平α下的臨界值。
基于PCA的異常檢測過程,離線階段通過原始數(shù)據(jù)計算得到PCA模型,并估計出T2和SPE兩個多元統(tǒng)計量的控制限。在線階段面對新的測量數(shù)據(jù),計算T2和SPE的統(tǒng)計值,并且與控制限比較,若任一指標超出控制限,則表示異常發(fā)生。
PCA方法的目標是要找到使得輸入數(shù)據(jù)X方差最大化的p( (12) 式(12)中:k為稀疏度。 式(12)存在兩個問題,一是計算得到的主元wi是隨著p的預設值不同而改變的。二是當p> 1時,很難找到式子的全局最優(yōu)解。為了便于求解,貪心搜索策略被用于將式(12)簡化為一系列p= 1的優(yōu)化問題。盡管通過連續(xù)貪心搜索得到的解可能并不是最優(yōu)解,但能很好地近似最優(yōu)解。當p= 1時,式(12)修改為 (13) 由于w的L0約束,式(13)是一個非確定性多項式難(nondeterministic polynominal-hard, NP-hard)問題[13]。為了便于計算,通常將非凸L0懲罰函數(shù)修改為凸L1懲罰函數(shù),即‖w‖1 (14) 算法1 用于一個稀疏主元的求解算法RSPCA輸入:原始數(shù)據(jù)矩陣X, 稀疏度k輸出:稀疏度為k的主元向量w^1 初始化:w0=w0‖w0‖2,t=02 設置qi(t)=1,wT(t)xi≥0-1,wT(t)xi<0 3 u=[u1,u2,…,uV]T=∑Ni=1qi(t)xi4 σ=‖u‖中第k+1大的元素值5 令(a)+=a, a>00, a≤0 6 sgn(a)=1, a>00, a=0-1, a<0 7 β=[β1,β2,…,βV]T,其中,βi=sgn(ui)(ui-σ)+, i=1,2,…,V8 w(t+1)=β‖β‖2且t=t+19 判斷是否收斂:如果w(t)≠w(t+1)轉到步驟2,否則,繼續(xù)執(zhí)行下一行10 如果存在i滿足wT(t)xi=0且sgn[wT(t)]sgn(xi)≠0,則令wT(t)=wT(t)+Δw‖wT(t)+Δw‖2 且返回步驟2,否則,繼續(xù)執(zhí)行下一行。Δw是一個各元素值都較小的非零隨機向量11 設置w^=w(t),停止迭代 算法2 用于p個稀疏主元的求解算法RSPCA輸入:原始數(shù)據(jù)矩陣X, 稀疏度k, 主元個數(shù)p>1輸出:p個稀疏主元向量{wi}pi=11 設置w0=0∈RV,0是全0向量,定義X0={x0i=xi}Ni=12 forj=1,2,…,pdo3Xj={xji=xj-1i-wj-1(wTj-1xj-1i)}Ni=14使用算法1計算投影向量Xj對應的稀疏 主元向量wj5 end 通過算法2計算得到p個稀疏主元向量wj(j=1,2,…,p),則第j個主元的方差被定義[14]為 (15) 在PCA中,相應特征向量的特征值等于方差。類似地,λj可以看作是wj的偽特征值。 通過算法2可以得到RSPCA最優(yōu)解的較好近似值,但是每個主元會隨著稀疏度k的不同而改變,所以如何確定稀疏度的值應重點考慮。目前普遍采用一種序列化的方式來選擇稀疏度k。例如,文獻[13]提出了一種最小信息損失的方法選擇稀疏度k。k以1為增量取值從1到變量個數(shù)V,從完全稀疏到非稀疏。k的取值被確定為一個數(shù)值,那么在該數(shù)值之后,任何進一步的增大k值均不會顯著提高偽特征向量所捕獲的方差總量。顯然,這類方法以貪心的方式依次搜索k序列,得到的解往往是局部最優(yōu)的。當監(jiān)測變量較大時,得到的局部最優(yōu)解將嚴重影響故障檢測的效果?,F(xiàn)從全局角度出發(fā),提出一種新的稀疏度選擇策略。 通過上節(jié)介紹可以得到,RSPCA[式(12)]本質上是在PCA-L1的基礎上增加了L0范數(shù)的約束條件。RSPCA的解一方面應盡量與PCA-L1的解擬合,另一方面應具有盡量好的稀疏性。因此,設計稀疏度選擇的目標函數(shù)即稀疏性準則(sparsity criterion, SC)函數(shù)為 (16) 式(16)中:Vα為RSPCA的調節(jié)方差;V0為PCA-L1的原始方差;Vα/V0表示擬合度;#0為RSPCA負載矩陣中零負載的總個數(shù);#0/p2則表示稀疏性。λ用于控制擬合度和稀疏性之間的權衡。 在SC函數(shù)的基礎上,采用兩階段求解方法計算稀疏度。第一階段使用累積百分比方差(cumulative percent variance, CPV)方法[15]選擇p個主元。在第二階段,采用遺傳算法(genetic algorithm, GA)求解最大化的稀疏性準則函數(shù),為第一階段計算得到的每一個主元分別指定一個k。 GA算法是一種功能強大的進化算法,已經(jīng)在多個領域具有成功的應用[16]。GA本質是在解空間中不斷隨機搜索,在搜索過程中不斷地產生新的解,并保留更優(yōu)的解,最終得到最優(yōu)解。其基本步驟見圖1。 圖1 GA算法基本步驟Fig.1 The basic steps of GA algorithm 當負載矩陣W=[w1,w2,…,wp]∈RV×p包括p個計算得到的主元,樣本矩陣X可以分解為 (17) 式(17)中:T∈RN×p定義為得分矩陣,即 T=XW (18) 對一個新的測量數(shù)據(jù)x∈R1×N,x映射到監(jiān)測模型,即 (19) T2和SPE統(tǒng)計量用于異常檢測,令I為單位矩陣,重新定義為 SPE=xT(I-WWT)x (20) T2統(tǒng)計量重新定義為 (21) 式(21)中:D為l大偽特征值的對角矩陣。T2和SPE統(tǒng)計量的上限可以通過核密度估計(kernel density estimation, KDE)[17]得到。KDE可以用來估計兩個統(tǒng)計量的概率函數(shù),然后可以分別使用95%和99%分位數(shù)作為控制限制。 魯棒稀疏異常檢測方法的核心目標就是對異常點具有魯棒性,最直接的方式是能夠發(fā)現(xiàn)異常點并進行剔除??紤]到異常數(shù)據(jù)必然比正常數(shù)據(jù)有更大的殘差,這就意味著具有高SPE統(tǒng)計量的樣本更可能是異常值。目前關于異常值檢測的方法很多。通過對這些算法的有效性和復雜性進行綜合考量,提出了如下方案:若異常數(shù)據(jù)的數(shù)量較少,可直接使用基于核密度估計的非參數(shù)方法[18];否則,若異常數(shù)據(jù)的數(shù)量較大,建議采用基于高斯混合模型(gaussian mixture model, GMM)的參數(shù)化方法[19]。 基于RSPCA的故障檢測方法詳細示意圖如圖2所示。整個方法包括兩個階段: 第I階段:離線建模。 步驟I-1:原始歷史數(shù)據(jù)集標準化。 步驟I-2:使用CPV選擇p個主元,應用GA選擇一組k值,基于計算得到的p個魯棒稀疏主元構建RSPCA模型。 步驟I-3:計算每個樣本對應的SPE統(tǒng)計值,用于異常檢測。 步驟I-4:使用異常檢測方法剔除異常值。當異常值所占比例較大時,建議采用GMM方法剔除。否則,建議使用KDE方法剔除。 步驟I-5:基于新的數(shù)據(jù)重新構建RSPCA模型。 步驟I-6:將異常值剔除后的歷史數(shù)據(jù)投射到特征空間。 步驟I-7:確定T2和SPE統(tǒng)計量的控制限。 其中,步驟I-3至I-5主要用于基于當前構建模型剔除異常值,這些步驟可以執(zhí)行多次,用于精確的異常值剔除。一般執(zhí)行一次即可達到效果。 第II階段:在線建模。 步驟II-1:使用剔除異常值后的原始數(shù)據(jù)的均值和方差對在線過程數(shù)據(jù)進行標準化。 步驟II-2:將標準化后的樣本投射到特征空間。 圖2 IRSPCA方法框架示意圖Fig.2 The framework of IRSPCA 步驟II-3:計算相應的T2和SPE統(tǒng)計信息。 步驟II-4:檢查計算的T2和SPE統(tǒng)計值是否超出其控制限。如果是,則檢測為異常;否則,轉至步驟II-2監(jiān)測下一個樣本。 該節(jié)通過兩個案例即一個數(shù)值仿真數(shù)值和一個工業(yè)案例來驗證IRSPCA方法的有效性和實用性。對于比較方法的檢測統(tǒng)計,均采用99%的置信限作為異常檢測閾值。 選用兩個指標評估系統(tǒng)的異常檢測性能,一個是錯誤報警率(false alarm rate, FAR),用于度量報警的數(shù)據(jù)中誤報的概率,另一個是故障檢測率(fault detection rate, FDR),用于度量異常數(shù)據(jù)被報警的概率。設Jth為檢驗統(tǒng)計量J的上限。FAR及FDR分別定義[20]為 (22) 式(22)中:f表示為異常樣本數(shù)量。 本案例利用文獻[9]中提出的模擬稀疏多元過程,驗證IRSPCA方法的魯棒性和稀疏性,并展示異常檢測效果。模擬稀疏多元過程的數(shù)學模型為 (23) (24) 該案例訓練數(shù)據(jù)集包含360個正常觀測值以及40個異常觀測值。異常觀測值通過xi=0(i=1,2,…,8)和xi=ζi(i=9,10)得到,其中ζi~N(0,3 000)。另外,通過仿真得到兩個包含400個樣本的異常驗證數(shù)據(jù)集。異常數(shù)據(jù)集設計如下: (1)系統(tǒng)在正常模式下運行,從第161個樣本對V1施加一個階躍偏差-400。 (2)系統(tǒng)在正常模式下運行,從第161個樣本對V2施加斜率為20的斜坡變化。 首先,利用CPV選擇PCA-L1的前p個主元,將魯棒主元的累積貢獻率閾值設為75%。然后在建立RSPCA模型時,利用遺傳算法確定所選主元的非零負載個數(shù)。本文中采用實數(shù)編碼遺傳算法[21]求解整數(shù)優(yōu)化問題。實驗中使用了MATLAB的遺傳算法工具箱。基于數(shù)據(jù)規(guī)模和實驗實際效果,采用SC作為適應度函數(shù),考慮到數(shù)據(jù)規(guī)模,將λ指定為1.4,種群規(guī)模設置為50,代數(shù)設置為10。經(jīng)過10次迭代,得到的結果是(4,4),這意味著盡管存在異常值,IRSPCA仍然能夠正確識別了重要變量。 如圖3和圖4所示,對于IRSPCA異常檢測模型,所提出的基于GMM的SPE統(tǒng)計量異常點剔除策略可以發(fā)現(xiàn)這些異常值。剔除異常值后,可以基于新的數(shù)據(jù)集構建新模型,以用于異常檢測。 PCA和IRSPCA的主元負載和方差如表1所示。顯然,當訓練集由10%的異常值組成時,IRSPCA能正確地識別相應變量。但是,第一主元和第二主元順序相反。剔除異常值后,調整后的第一主元和第二主元完全正確。 關于兩類方法的FDR和FAR信息記錄在表2。很顯然,對于異常1和異常2,IRSPCA的T2和SPE統(tǒng)計量FDR均顯著高于PCA的T2和SPE統(tǒng)計量誤檢率。IRSPCA明顯優(yōu)于PCA的檢測效果。而PCA計算得到的主元受異常值的影響嚴重。由于PCA試圖減少所有輸入數(shù)據(jù)的重構誤差,其SPE統(tǒng)計量監(jiān)測性能較差。 圖3 IRSPCA方法的SPE監(jiān)測圖Fig.3 The SPE monitoring chart of IRSPCA 圖4 GMM的異常值檢測結果圖Fig.4 The abnormal detection results of GMM 表1 PCA和RSPCA方法的負載和方差列表Table 1 The load and variance list of PCA and RSPCA 表2 IRSPCA和PCA的檢測性能列表Table 2 The detection performance of IRSPCA and PCA 本案例通過對來自廣西南寧卷煙廠煙支成品實際檢測數(shù)據(jù)開展分析,驗證IRSPCA的實際應用效果。廣西南寧卷煙廠煙支成品重要物理指標的檢測數(shù)據(jù)是由煙支/濾棒綜合測試臺采集得到的。本案例所使用的數(shù)據(jù)集由6 000個煙支檢測實例組成,每個實例包含4個參數(shù),分別為重量、圓周、吸入阻力和長度。這些實例的質量異常情況均是結合專家根據(jù)自己的經(jīng)驗和知識進行綜合感官驗證后得到的標注,樣本中共包含268個異常樣本。 實驗采取交叉驗證方法實施,選取50%的正常樣本用于訓練,選取80%的異常樣本以及相等數(shù)量的正常樣本用于測試,剩下的正常樣本以及20%的異常樣本用于驗證。所有的數(shù)據(jù)集包括訓練集、驗證集及測試集均需統(tǒng)一的標準化預處理?;跀?shù)據(jù)規(guī)模和實驗實際效果,用于確定稀疏度的GA算法超參數(shù)設置如下:λ為1.4,種群大小為100,遺傳代數(shù)為50,魯棒主元的累積貢獻率為95%。 實驗分兩個階段,第一階段訓練集中不存在易混淆的異常值,第二階段在訓練集中添加10%的易混淆異常值。實驗結果見表3,表中FDR最大值標記為粗體。可以看出,在第一階段,三種方法的T2統(tǒng)計量的性能差距不大,但是經(jīng)過魯棒處理的SPE統(tǒng)計量的性能明顯高于未經(jīng)過魯棒處理的PCA方法,這說明原始正常數(shù)據(jù)中也存在少量的異常值。第二階段刻意加入異常值后,PCA的整體性能下降明顯,T2統(tǒng)計量的FDR減少了6.5個點,RSPCA和IRSPCA均保持了穩(wěn)定,且SPE統(tǒng)計量的FDR也得到了顯著的提升。總體來說,IRSPCA的T2與SPE統(tǒng)計量的FDR和FAR均明顯優(yōu)于PCA和RSPCA,這驗證了IRSPCA受異常值影響較小,在魯棒性方面具有優(yōu)勢,也決定了其檢測性能的優(yōu)越性。 提出了一種工業(yè)異常檢測方法IRSPCA主要用于解決PCA的異常值敏感和主元非稀疏問題。針對稀疏度問題,設計了稀疏度選擇的目標函數(shù)即稀疏性準則函數(shù),用于權衡擬合度與稀疏性,并開發(fā)了一種兩階段稀疏度選擇策略,并利用遺傳算法求得了主元稀疏度的最優(yōu)解。針對異常值敏感問題,考慮到異常樣本必然比正常樣本有更大的殘差,則相應SPE統(tǒng)計值大的樣本更可能是異常樣本,設計了基于SPE統(tǒng)計量的異常值剔除策略。本章通過一個數(shù)值仿真案例和一個工業(yè)案例開展了方法有效性的驗證,結果表明,IRSPCA方法較RSPCA、PCA能有效提升魯棒性和稀疏性。下一步將繼續(xù)對不同的實際工業(yè)應用場景進行應用研究。 表3 實驗比較結果列表Table 3 The experimental comparison results2 魯棒稀疏異常檢測
2.1 稀疏度選擇
2.2 異常值剔除
2.3 整體流程
3 案例研究
3.1 數(shù)值仿真案例
3.2 煙支成品檢測
4 結論