劉堅強
(湖北省咸寧職業(yè)技術學院,437100)
神經(jīng)網(wǎng)絡能用于徑流序列的描述,主要是基于神經(jīng)網(wǎng)絡的函數(shù)1F線性逼近功能,從這個角度來看,神經(jīng)網(wǎng)絡可分為全局逼近神經(jīng)網(wǎng)絡和局部逼近神經(jīng)網(wǎng)絡。全局逼近神經(jīng)網(wǎng)絡的權值和可調(diào)參數(shù)在輸入空間的每一點對任何一個輸出都有影響,對于每個輸人輸出數(shù)據(jù)對,網(wǎng)絡的每一個權值均需要調(diào)整,從而導致學習速度很慢;局部逼近神經(jīng)網(wǎng)絡對于每個輸人輸出數(shù)據(jù)對,只有少量的權值需要調(diào)整,從而學習速度很快。徑向基函數(shù)(RadialBasisFunction,簡稱RBF)是一種典型的局部逼近人工神經(jīng)網(wǎng)絡,是最近幾年提出和開始研究并得到一定應用的新型前向神經(jīng)網(wǎng)絡,其結構和一般前向網(wǎng)絡相同,只是網(wǎng)絡隱層神經(jīng)元的作用過程和一般的網(wǎng)絡不同。徑向基網(wǎng)絡由一個輸人層、一個徑向基神經(jīng)元的隱層及一個線性神經(jīng)元的輸出層組成,徑向基網(wǎng)絡能較好地擬合任意有限值函數(shù)[1]。
Rumelhart等(1986)提 出 了 多 層 前 饋 網(wǎng) 絡(multilayer feedforward neural networks,MFNN)的反向傳播(back propagation,BP)學習算法。由于使用BP算法,所以稱為BP神經(jīng)網(wǎng)絡。BP神經(jīng)網(wǎng)絡是一種具有一層或多層隱層的前向網(wǎng)絡,通常由輸入層、隱層、輸出層組成,三層前向型BP網(wǎng)絡的拓撲結構。
Powell(1985)提出了多變量差值的徑向基函數(shù)(radial—based function,RBF)方法。Broomhead等(1988)對徑向基函數(shù)和多層神經(jīng)網(wǎng)絡進行了對比,并將RBF應用于神經(jīng)網(wǎng)絡的設計;Jackson(1988)證明了徑向基神經(jīng)網(wǎng)絡對非線性連續(xù)函數(shù)的一致逼近性;Moody等(1989)正式提出了徑向基神經(jīng)網(wǎng)絡,即RBF神經(jīng)網(wǎng)絡。從結構上看,RBF神經(jīng)網(wǎng)絡屬于前向型網(wǎng)絡,由一個隱層(徑向基層)和一個線性輸出層兩個神經(jīng)元層組成。與BP神經(jīng)網(wǎng)絡相比,RBF神經(jīng)網(wǎng)絡往往需要更多神經(jīng)元,但RBF神經(jīng)網(wǎng)絡的訓練所需時間要少。
單變量人工神經(jīng)網(wǎng)絡非線性時序模型定義為[2]:
yp為徑流序列經(jīng)過小波分解后不同尺度的高頻成分和低頻成分的重構序列,p為模型的輸入節(jié)點數(shù);iv為輸出層神經(jīng)元與隱層神經(jīng)元i的連接權;py為網(wǎng)絡輸出值;θ為人工神經(jīng)網(wǎng)絡非線性映射,在徑向基網(wǎng)絡中為徑向基函數(shù)。
神經(jīng)網(wǎng)絡是通過大量的神經(jīng)元相互聯(lián)系構成的。神經(jīng)網(wǎng)絡的結構按照拓撲結構屬于以神經(jīng)元為節(jié)點,以節(jié)點間有向連接為邊的圖,可以分為層狀和網(wǎng)狀兩個大類。
1)前向網(wǎng)絡(前饋)
前向網(wǎng)絡可以包含很多層,這種網(wǎng)絡的特點是相鄰兩層神經(jīng)元之間相互連接,不存在跨層連接,神經(jīng)元之間沒有反饋。任一神經(jīng)元只能從前一層接收多個輸入,并統(tǒng)一輸出給后一層的多個神經(jīng)元。前向網(wǎng)絡中具有計算功能的節(jié)點稱為計算單元,輸入節(jié)點不存在計算單元。前向網(wǎng)絡具體形式如圖1所示。
2)反饋網(wǎng)絡
反饋網(wǎng)絡指從輸出層到輸入層有反饋,也包括神經(jīng)元引出又回到自身的自反饋。網(wǎng)絡中的每一個節(jié)點都可接收外界輸入和其他節(jié)點的反饋輸入,每一個節(jié)點成為一個計算單元。
3)相互結合型網(wǎng)絡
相互結合型網(wǎng)絡是一個網(wǎng)狀結構。每一個神經(jīng)元既可以作為輸入,也可以作為輸出,神經(jīng)元之間都可以進行相互的雙向聯(lián)接。網(wǎng)絡中不存在固定的層次結構,也不存在固定的信號流動方向。當施加輸入信號后,網(wǎng)絡中的所有神經(jīng)元必然相互作用,共同進行信息處理。當網(wǎng)絡中所有神經(jīng)元的輸出值收斂到一定程度之后才結束信息處理過程。
4)混合型網(wǎng)絡
混合型網(wǎng)絡是介于層次結構和網(wǎng)狀結構之間的一種聯(lián)接方式。既存在層次結構也存在同層神經(jīng)元之間的互聯(lián)。這樣做的目的是減少神經(jīng)元數(shù)量或者避免同層神經(jīng)元的同時興奮[3]。
根據(jù)神經(jīng)網(wǎng)絡在控制器中的作用不同,神經(jīng)網(wǎng)絡控制器可分為兩類:
(1)神經(jīng)控制:以神經(jīng)網(wǎng)絡為基礎而形成的獨立智能控制系統(tǒng);
(2)混合神經(jīng)網(wǎng)絡控制:利用神經(jīng)網(wǎng)絡學習和優(yōu)化能力來改善傳統(tǒng)控制的智能控制方法,如自適應神經(jīng)網(wǎng)絡控制等。
在最優(yōu)決策控制系統(tǒng)中,狀態(tài)空間根據(jù)不同控制條件被分成特征空間區(qū)域,控制曲面的實現(xiàn)是通過訓練過程完成的。由于時間最優(yōu)曲面通常是非線性的,因此又必須使用一個能夠逼近非線性的結構。一種可能的方法是將狀態(tài)空間量化成基本的超立方體,在這個立方體中控制作用是一個假設的常數(shù)。這個過程可由一個LVQ結構實現(xiàn),需要讓另一個網(wǎng)絡充當分類器,如果需要連續(xù)信號,則可以使用表針的方向傳播結構。
圖1 RBF神經(jīng)網(wǎng)絡的結構
在頻率學派中,概率P(A)定義為:在一個重復性的隨機試驗中。當試驗的次數(shù)趨于無窮時,事件A發(fā)生的相對頻率,而在貝葉斯分析中,概率P(A)被定義為人們對命題A的相信程度。假設A與B相關,即B中包含關于A的信息,在觀測到B之前對A的相信程度是P(A),在觀測到B之后,根據(jù)貝葉斯理論。我們應修正對A的相信程度
如果A表示參數(shù)(或向量)θ。B表示樣本y,用概率密度函數(shù)代替概率;則貝葉斯公式為:示觀測到數(shù)據(jù)之前對θ的相信程度;p(θ |y)是θ的后驗分布,表示觀測到數(shù)據(jù)后對θ更新的相信程度;p(y)是樣本數(shù)據(jù)的邊緣分布;p(y|θ)是θ給定條件下的樣本分布或樣本似然,即[2]:
(1)檢驗at是否與at?1,at?2,…無關 ;
(2)檢驗at是否與xt?2,xt?3,…無關。
對于AR(n)模型進行參數(shù)估計和適用性檢驗后,就可以所建立的AR(n)模型對時間序列 進行預測。
在RBF神經(jīng)網(wǎng)絡中,輸入樣本經(jīng)過隱層處理后,在輸出層實現(xiàn)了線性組合。實際應用中RBF神經(jīng)網(wǎng)絡的訓練步驟如下:(1)確定訓練樣本向量、目標向量和訓練參數(shù);(2)無教師學習,通過輸入層和隱層之間的訓練,確定權值;(3)有教師學習,通過隱層與輸出層的訓練,確定權值。實證部分采用MATLAB神經(jīng)網(wǎng)絡工具箱提供的 newrb(P,t,goal,spread,mn,df)函數(shù),其中,spread是激勵函數(shù)(徑向基函數(shù))的分布密度,其取值的不同會給網(wǎng)絡的預測能力帶來很大影響,spread取值越大,則預測性能的平滑程度越好;反之,spread取值越小,預測性能的平滑程度越差,但網(wǎng)絡的逼近程度較高。故在預測過程中通過多次調(diào)整spread的取值,觀察真實值與預測值之間的誤差,從而可確定誤差較小、較為合理的spread值作為預測使用。
時間序列預測就是通過收集和分析某一預測變量的歷史數(shù)據(jù),建立出可以反映其規(guī)律和關系的模型,再進行趨勢外推的預測方法。這種建模方法適用于從數(shù)據(jù)中只能獲得少量模型的信息,或者無法將預測變量和解釋變量之問的關系用函數(shù)關系來刻畫的情況。過去幾十年中,關于時間序列預測模型的研究和改進已經(jīng)取得了很多的成果。其中應用最廣的時間序列模型是ARIMA模型,主要是由于其在建模過程中利用了Box—Jenkins建模方法的統(tǒng)計特性。雖然ARIMA模型可以表示多種不同類型的時間序列,但是它主要的限制條件是需要預先假設模型的形式是線性的,而且無法處理數(shù)據(jù)中存在的異常值的干擾。
人工神經(jīng)網(wǎng)絡由于其靈活的非線性建模能力和容錯能力,在時間序列預測中的研究和應用已經(jīng)越來越多。利用它就不再需要指定某一特殊的模型形式,而且能夠基于數(shù)據(jù)的特點自適應學習和訓練。因此,利用這種數(shù)據(jù)驅(qū)動的方法可以對那些無法預知建模機理的問題給出更精確的解決方法。一些實證研究也表明了使用神經(jīng)網(wǎng)絡進行時間序列預測的精度要高于傳統(tǒng)的時間序列預測方法。神經(jīng)網(wǎng)絡模型和ARIMA模型有很多相似之處。它們按照模型自身的結構都可以劃分出很多不同的類型,所以模型識別對它們來說都是非常重要的問題;為了得到更好的預測結果,在建模之前有必要對數(shù)據(jù)進行預處理的轉換;都需要較多的樣本數(shù)據(jù);而且要確定模型的形式都需要反復試驗而且有時還需要進行主觀判斷;它們建模總的原則是模型的結構越簡單越好,一定要避免出現(xiàn)過擬合現(xiàn)象。
[1] 劉喜梅,魏婉韻,于飛.基于人工神經(jīng)網(wǎng)絡的變壓器勵磁涌流的鑒別 [J].低壓電器,2007,20(19):102-103.
[2] 汪洋,宇仁德,閆建華.基于徑向基函數(shù)神經(jīng)網(wǎng)絡的交通事故預測 [J].交通標準化,2009,15(21):67-68.
[3] 許楊文.基于RBF神經(jīng)網(wǎng)絡的水輪機故障診斷研究[J]. 光盤技術,2009,18(02):156-157.