基于數(shù)據(jù)分析與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的研究與應(yīng)用

2024-06-24 02:48:35王尉旭

科技資訊 2024年7期

關(guān)鍵詞：信號處理

王尉旭

摘??要：正則化彈性網(wǎng)絡(luò)是一種強大的深度學(xué)習(xí)模型，結(jié)合線性回歸和邏輯回歸的特點，可以同時進行特征選擇和參數(shù)控制，避免了傳統(tǒng)正則化的部分局限性。離散傅里葉變換特征提取是一種常用的信號處理方法，可以提取信號中的特定頻率的特征，在眾多領(lǐng)域都有著廣泛的應(yīng)用。通過彈性網(wǎng)絡(luò)正則化和加窗離散傅里葉變換的信號分析技術(shù)結(jié)合，進行了相應(yīng)的研究和應(yīng)用。以凱斯西儲大學(xué)故障軸承振動數(shù)據(jù)為例，進行信號分析處理，再經(jīng)過神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)和預(yù)測，從而得到了一個準確率較高的彈性網(wǎng)絡(luò)模型。其方法對于眾多復(fù)雜的問題都有著重要的研究價值。

關(guān)鍵詞：深度神經(jīng)網(wǎng)模型???正則化彈性網(wǎng)絡(luò)???數(shù)據(jù)分析工具???信號處理

中圖分類號：TP183

Research?and?Application?Based?on?the?Combination?of?Data?Analysis?and?the?Deep?Neural?Network

WANG?Weixu

Chongqing?Jiaotong?University，?Chongqing，?400074?China

Abstract：?A?regularized?elastic?net?is?a?powerful?deep?learning?model，?which?can?combine?the?characteristics?of?linear?regression?and?logistic?regression?to?perform?both?feature?selection?and?parameter?control，?avoiding?some?of?the?limitations?of?traditional?regularization.?Discrete?Fourier?transform?feature?extraction?is?a?commonly-used?signal?processing?method?that?can?extract?specific?frequency?features?from?signals，?and?it?has?a?wide?range?of?applications?in?many?fields.?This?article?combines?the?signal?analysis?technology?of?elastic?net?regularization?and?windowed?discrete?Fourier?transform?to?conduct?corresponding?research?and?applications.?This?article?takes?the?vibration?data?of?faulty?bearings?from?Case?Western?Reserve?University?as?an?example，?performs?signal?analysis?and?processing，?and?then?obtains?an?elastic?net?model?with?high?accuracy?through?the?learning?and?predicting?of?the?neural?network?model.?This?method?is?of?great?research?value?for?many?complex?problems.???Key?Words：?Deep?neural?network?model?;??Regularized?elastic?net;??Data?analysis?tool?;??Signal?processing

隨著科技的飛速發(fā)展，人工智能技術(shù)逐漸滲透到各個領(lǐng)域，為人類社會帶來了前所未有的變革。而神經(jīng)網(wǎng)絡(luò)的研究和應(yīng)用備受關(guān)注。正則化彈性網(wǎng)絡(luò)是一種重要的神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模型，有著線性回歸和邏輯回歸的優(yōu)點，廣泛應(yīng)用于圖像識別、自然語言處理等領(lǐng)域，其能夠更好地處理非線性化問題。傅里葉變換峰值特征提取是利用傅里葉變換來識別和提取信號中的重要特征方法，這種強大的數(shù)據(jù)分析工具，可以幫助我們更好地去了解信號和數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和特征。

本文旨在探討傅里葉變換數(shù)據(jù)分析工具與正則化彈性網(wǎng)絡(luò)結(jié)合的技術(shù)原理和應(yīng)用，通過深入剖析其中的正則化彈性網(wǎng)絡(luò)和傅里葉變換峰值提取結(jié)合的基本原理和算法，揭示其內(nèi)在的規(guī)律和特點，為進一步的研究和應(yīng)用奠定基礎(chǔ)。

在應(yīng)用方面，本文將詳細介紹正則化彈性網(wǎng)絡(luò)和傅里葉變換特征提取的應(yīng)用。通過滾動軸承故障診斷為例，本文將證明正則化彈性網(wǎng)絡(luò)和傅里葉變換特征提取的數(shù)據(jù)分析方法在信號數(shù)據(jù)處理的應(yīng)用效果和優(yōu)勢，為相關(guān)領(lǐng)域的研究和實踐提供有力支持。

最后，本文將對正則化彈性網(wǎng)絡(luò)和傅里葉變換特征提取的應(yīng)用前景進行展望。希望通過本文的研究，能夠進一步推動神經(jīng)網(wǎng)絡(luò)人工智能領(lǐng)域的發(fā)展，為人類社會的進步和發(fā)展做出更大的貢獻。

1?正則化彈性網(wǎng)絡(luò)

1.1??正則化彈性網(wǎng)絡(luò)概述

正則化彈性網(wǎng)絡(luò)是強大的深度學(xué)習(xí)模型，結(jié)合了線性回歸和邏輯回歸的優(yōu)點，將神經(jīng)網(wǎng)絡(luò)的參數(shù)進行稀疏化約束，對于稀疏化特征篩選，引入L1正則項，在模型中完成特征篩選[1]，通過L1范數(shù)和L2范數(shù)作為正則項來優(yōu)化模型的損失函數(shù)。通過不斷地調(diào)整參數(shù)，控制權(quán)重限制的程度，進一步優(yōu)化模型的復(fù)雜度和泛化能力之間的平衡，使得模型的預(yù)測誤差最小化，能夠處理高維數(shù)據(jù)和復(fù)雜的非線性問題。

正則化彈性網(wǎng)絡(luò)的優(yōu)點這就是能夠同時實現(xiàn)特征選擇和模型復(fù)雜度控制。所以，彈性網(wǎng)絡(luò)在高緯數(shù)據(jù)集和特征相關(guān)性較高的情況下表現(xiàn)出色。更是可以在復(fù)雜的問題中，實現(xiàn)有效解，不會產(chǎn)生交叉的路徑。在特征選擇、回歸分析、圖像處理、自然語言處理、推薦系統(tǒng)和生物信息學(xué)等領(lǐng)域有著廣泛的應(yīng)用。

1.2?正則化彈性網(wǎng)絡(luò)原理

正則化彈性網(wǎng)絡(luò)的原理主要基于線性模型的優(yōu)化，通過添加L1范數(shù)和L2范數(shù)的懲罰項，對線性模型進行正則化，對這兩個正則化項的權(quán)重調(diào)節(jié)來控制模型的特征選擇和模型復(fù)雜度。

彈性網(wǎng)絡(luò)中的L1范數(shù)的懲罰項促使部分特征權(quán)重變?yōu)?來實現(xiàn)特征選擇，而L2范數(shù)的懲罰項來控制模型的復(fù)雜度，所以通過調(diào)整這兩個正則化項的權(quán)重，來找到一個較為良好的平衡點，提高模型泛化能力。

2?傅里葉變換特征提取

頻域特征的基礎(chǔ)是傅里葉變換[2]，傅里葉特征抽取是一種常見的信號處理技術(shù)，它通過傅里葉變換來提取信號的特征。這種方法將信號從時間域轉(zhuǎn)換為頻率領(lǐng)域，然后通過對信號進行頻域分析，將信分解成為一系列不同頻率和振幅的正弦波的疊加。通過頻譜分析，我們能夠了解信號在各個頻率上的能量分布，從而提取出信號的特征信息。

傅里葉特征提取應(yīng)用于眾多領(lǐng)域，例如音頻處理、圖像處理、信號處理等。在音頻處理中，可以利用傅里葉特征提取來提取音頻信號的頻譜特征，用于音頻分類、聲音識別等任務(wù)。在圖像處理中，可以將圖像轉(zhuǎn)換為頻率域表示后，提取圖像的頻譜特征用于圖像分類、圖像識別等任務(wù)。

3??正則化彈性網(wǎng)絡(luò)和離散傅里葉變換特征提取結(jié)合在軸承故障診斷中的應(yīng)用

3.1??凱斯西儲振動數(shù)據(jù)分析處理

本文選取了凱斯西儲大學(xué)的軸承振動數(shù)據(jù)作為數(shù)據(jù)集進行數(shù)據(jù)分析和神經(jīng)網(wǎng)絡(luò)訓(xùn)練[3]，常見的故障特征提取方法包括時域特征、頻域特征和時頻域特征[4]，所以研究人員選用傅里葉特征提取來解決軸承故障類型故障診斷的多分類問題。

3.1.1??Blackman窗口函數(shù)加窗

將振動數(shù)據(jù)進行歸一化處理后進行Blackman窗口函數(shù)加窗處理。Blackman窗口函數(shù)是一種常用的窗函數(shù)，具有較窄的主瓣寬度和較低的旁瓣高度，能夠提供較好的頻率分辨率和較小的頻譜泄漏。在故障診斷領(lǐng)域，Blackman窗口函數(shù)可以對振動信號進行增強處理，突出信號中的特定頻率成分，提取特征，以用于模式識別算法，如向量機和本文使用的人工神經(jīng)網(wǎng)絡(luò)。

3.1.2?離散傅里葉變換

傅里葉變換可以將信號從時域轉(zhuǎn)換到頻域，其基本思路是將信號轉(zhuǎn)換為一組正弦波的線性組合，將信號分解成不同頻率的分量，用于信號的頻率分析。

離散傅里葉變換是傅里葉變換的一種離散形式，在離散傅里葉變換中，信號只在特定的時間點上有值，用于處理離散信號，如數(shù)字信號、離散傳感器信號。離散傅里葉變換將離散信號轉(zhuǎn)換為復(fù)數(shù)序列，每個復(fù)數(shù)對應(yīng)一個頻率分量，從而將離散信號轉(zhuǎn)換到頻率，對于一個有限長度的離散信號，x其離散傅里葉變換可以用以下公式表示：

X[k]?=?∑_{n=0}^{N-1}?x[n]?*?e^{-i2πk*n/N}

這個公式表示，離散傅立葉變換將每個樣本x乘以e^{-i2πk*n/N}，然后將所有的乘積進行求和，其中表示第k個頻率分量的振幅。

3.1.3??峰值提取

加窗離散傅里葉變換后的頻率信號，有利于分析信號的頻率成分，在故障診斷領(lǐng)域中可以反映出不同故障的特有頻率，對于本文的軸承故障診斷數(shù)據(jù)應(yīng)提取其高幅峰值頻率。本文對歸一化后幅值大小前20的頻率數(shù)據(jù)進行記錄并排序，用于神經(jīng)網(wǎng)絡(luò)輸入。

3.2??正則化彈性網(wǎng)絡(luò)的Matlab構(gòu)建

3.2.1???Matlab神經(jīng)網(wǎng)絡(luò)工具箱fitnet函數(shù)

fitnet函數(shù)用于創(chuàng)建一個具有一層隱藏層的神經(jīng)網(wǎng)絡(luò)函數(shù)，通過使用基于誤差的反向傳播算法進行網(wǎng)絡(luò)訓(xùn)練。該函數(shù)在網(wǎng)絡(luò)輸入時會自動將數(shù)據(jù)進行適當?shù)念A(yù)處理，如歸一化、標準化。在使用fitnet訓(xùn)練神經(jīng)網(wǎng)絡(luò)時，Matlab會自動使用trainlm函數(shù)進行正則化，包括L1和L2正則化。

3.2.2???Trainlm訓(xùn)練函數(shù)

Trainlm函數(shù)使用Levenberg-Marquardt算法來訓(xùn)練多層感知器LMP，該算法是一種迭代優(yōu)化算法，用于解決最小二乘優(yōu)化問題。該函數(shù)與fitnet函數(shù)結(jié)合時，Trainlm函數(shù)會自動計算L1和L2正則化項的權(quán)重，并最小化帶正則化的損失函數(shù)，有助于在訓(xùn)練過程中自動調(diào)整正則化強度，從而得到一個具有良好泛化能力的彈性網(wǎng)神經(jīng)網(wǎng)絡(luò)模型。

L1正則化式：

將其加入損失函數(shù)（表示為loss），變成：

是超參數(shù)。除了能夠約束參數(shù)量級之外，L1正則化還能起到稀疏化參數(shù)的作用。

L2正則化式：

L2代表求權(quán)重的歐幾里得范數(shù)，也叫作L2范數(shù)：

假設(shè)待正則的網(wǎng)絡(luò)層參數(shù)為，L2正則式為：

將其加入損失函數(shù)（表示為loss），變成：

上述式中，是一個模型中的超參數(shù)，一般被稱作為正則化參數(shù)。

在Matlab中fitnet?函數(shù)中，L1實現(xiàn)的公式：

，其中，W是模型矩陣，取其絕對值然后求和。

L2則是用Matlab中的vecnorm函數(shù)可以實現(xiàn)。通過計算矩陣的范數(shù)來實現(xiàn)。公式如下：

L2=norm（A，2）A?是模型矩陣，對于矩陣中每一個元素平方后求和，然后取平方根。

彈性網(wǎng)絡(luò)正則化則是結(jié)合L1和L2正則化，正則化式：

3.2.3??配置網(wǎng)絡(luò)參數(shù)

（1）傳遞函數(shù)。

本文選取Tansig函數(shù)作為隱藏層激活函數(shù)。

Tansig函數(shù)是神經(jīng)網(wǎng)絡(luò)模型中的一種常用的激活函數(shù)，其非線性映射能力強，可以將輸入值非線性映射到輸出值，從而有效地解決線性不可分的問題。Tansig函數(shù)還有計算效率高的優(yōu)點，其采用簡單的數(shù)學(xué)公式和計算方法，速度快。

（2）隱藏層節(jié)點個數(shù)。

根據(jù)樣本數(shù)據(jù)和問題的復(fù)雜程度，本文設(shè)置了一層隱藏層以避免網(wǎng)絡(luò)復(fù)雜化、網(wǎng)絡(luò)訓(xùn)練時間過長和出現(xiàn)過擬合的傾向。

隱藏層節(jié)點數(shù)應(yīng)小于訓(xùn)練樣本數(shù)減一，否則網(wǎng)絡(luò)模型的系統(tǒng)誤差與訓(xùn)練樣本的特性無關(guān)而趨于零，即建立的網(wǎng)絡(luò)模型沒有泛化能力，也沒有任何使用價值[5]。

訓(xùn)練樣本數(shù)必須多于網(wǎng)絡(luò)模型的連接權(quán)數(shù)，一般為其的2～10倍，否則樣本必須分成幾部分且必須采用“輪流訓(xùn)練”的方法才能得到可靠的神經(jīng)網(wǎng)絡(luò)[5]。

本次網(wǎng)絡(luò)訓(xùn)練樣本量為2?717，輸入特征序列長度為20，輸出層節(jié)點數(shù)即分類類別為32，得到隱藏層節(jié)點數(shù)范圍應(yīng)在6～25之間，因此研究人員選取中間數(shù)15作為隱藏層節(jié)點個數(shù)。

（3）性能指標。

本文選取了MSE作為彈性網(wǎng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的訓(xùn)練指標，MSE易于計算和理解，值越小，模型的性能越好。并且，MSE適用于各種不同類型的模型和數(shù)據(jù)集，對于分類問題，MSE能夠作為評估性能的有效指標。

（4）設(shè)置目標誤差1。

3.3??模型訓(xùn)練及驗證

將樣本集隨機打亂后劃分為訓(xùn)練集和測試集，測試集用于評估驗證該模型的分類正確率。通過Matlab神經(jīng)網(wǎng)絡(luò)工具箱對該網(wǎng)絡(luò)進行代碼實現(xiàn)，在訓(xùn)練集樣進行訓(xùn)練后，得到彈性網(wǎng)神經(jīng)網(wǎng)絡(luò)模型，各參數(shù)如圖?1所示。

圖?1展示了模型預(yù)測輸出和目標輸出之間的誤差分布情況，將訓(xùn)練數(shù)據(jù)集的每個樣本的誤差進行統(tǒng)計，并進行分組，可以直觀地看出模型在不同誤差范圍內(nèi)的表現(xiàn)，以及是否存在異常點。

圖?2是訓(xùn)練過程變化圖，圖二中第一個曲線表示了訓(xùn)練過程，顯示了訓(xùn)練過程中每一次誤差迭代的變化，用于了解網(wǎng)絡(luò)的改進過程；第二個是訓(xùn)練誤差的曲線，用于評估模型在未見過的數(shù)據(jù)上的性能；第三個曲線表示了權(quán)重和偏置的變化，顯示了權(quán)重和偏置參數(shù)隨迭代次數(shù)的變化；

用測試集對模型驗證評估。

準確率驗證：對于分類問題，準確率能直觀地體現(xiàn)神經(jīng)網(wǎng)絡(luò)的性能，表明模型的泛化能力，能夠在新數(shù)據(jù)上進行有效的推斷。

準確率計算過程：將測試集預(yù)測輸出矩陣進行二值化處理，即每列（一份樣本輸出）中最大概率化為1，其余概率化為0，與測試集的預(yù)期輸出矩陣進行比較，得到該測試集經(jīng)過本神經(jīng)網(wǎng)絡(luò)預(yù)測的準確率。

本模型經(jīng)過多次初始化并訓(xùn)練，求得模型的準確率范圍在0.965～0.980，準確率高，說明模型對于軸承故障類型診斷問題的解決能力強。

4??結(jié)論

本文以凱斯西儲大學(xué)的正常及各故障類型的振動數(shù)據(jù)為例，對信號分析和神經(jīng)網(wǎng)絡(luò)結(jié)合方法進行研究應(yīng)用。將振動信號進行歸一化處理后進行Blackman窗口函數(shù)進行加窗處理。從而對振動信號進行增強并提取特征。然后經(jīng)過離散傅里葉變換將信號從時域轉(zhuǎn)換為頻域，根據(jù)不同軸承故障類型具有獨有的高幅度高頻特征頻率，對幅頻譜進行峰值提取，以最高的20個幅值對應(yīng)的頻率歸一化處理后作為正則化彈性網(wǎng)絡(luò)的訓(xùn)練樣本，選擇神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù)并調(diào)整各參數(shù)，經(jīng)驗證后，得到準確率較高的神經(jīng)網(wǎng)絡(luò)模型。本文方法得到的神經(jīng)網(wǎng)絡(luò)模型高效準確，足以證明該結(jié)合方法有效且具有良好的前景。

正則化彈性網(wǎng)絡(luò)在回歸和分類問題上表現(xiàn)出色。在醫(yī)療、金融等眾多領(lǐng)域都取得了顯著的成果。隨著計算能力的提升和算法的優(yōu)化，正則化彈性網(wǎng)絡(luò)的性能也將會不斷優(yōu)化。

而離散傅里葉變換提供了對信號頻率特性的深入理解，在許多應(yīng)用中具有重要的價值。隨著計算能力的提升，未來可以利用更高效的方法實現(xiàn)離散傅里葉變換特征提取，可以將其探索于其他更廣泛的領(lǐng)域。

總之，隨著技術(shù)的不斷進步和應(yīng)用需求的不斷提升，信號分析技術(shù)與神經(jīng)網(wǎng)絡(luò)技術(shù)的結(jié)合方法將會是一種高效準確的信號處理技術(shù)，將會為各種實際應(yīng)用提供更好的支持。

參考文獻