胥林
(中國石油化工股份有限公司勝利油田分公司, 信息化管理中心, 山東, 東營 257000)
隨著信息技術(shù)、軟件技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,政府、企業(yè)等的信息化程度越來越高,信息管理系統(tǒng)應(yīng)用日益廣泛[1-3]。但是由于信息管理系統(tǒng)的開放性和網(wǎng)絡(luò)的不設(shè)防性,同時(shí)出現(xiàn)了信息安全問題,幾乎所有的信息管理系統(tǒng)都存在不同程度的風(fēng)險(xiǎn),而信息系統(tǒng)風(fēng)險(xiǎn)評估可以幫助政府、企業(yè)的信息管理人員了解風(fēng)險(xiǎn)的變化規(guī)律,制定相應(yīng)的信息系統(tǒng)風(fēng)險(xiǎn)控制措施,因此如何設(shè)計(jì)性能優(yōu)異的信息系統(tǒng)風(fēng)險(xiǎn)評估模型是人們關(guān)注的焦點(diǎn)[4-6]。
信息系統(tǒng)風(fēng)險(xiǎn)的評價(jià)指標(biāo)多,指標(biāo)互相影響,又互相關(guān)聯(lián),使得信息系統(tǒng)風(fēng)險(xiǎn)變化比較復(fù)雜[7],當(dāng)前有學(xué)者提出基于多種類型的信息系統(tǒng)風(fēng)險(xiǎn)評估模型,得到了有效的評估結(jié)果,為降低信息系統(tǒng)風(fēng)險(xiǎn)做出了很大貢獻(xiàn)[8-10]。然在實(shí)際應(yīng)用中,這些方法均存在不足,如評估誤差大、耗費(fèi)時(shí)間長、工作效極率低,同時(shí)它們沒有區(qū)分指標(biāo)之間差異性,假設(shè)所有指標(biāo)作用相同,使得信息系統(tǒng)風(fēng)險(xiǎn)評估正確不高,信息系統(tǒng)風(fēng)險(xiǎn)評估的效率低下[11-12]。
針對當(dāng)前信息系統(tǒng)風(fēng)險(xiǎn)評估過程中的指標(biāo)選擇問題和建模方法選擇問題,為了改善信息系統(tǒng)風(fēng)險(xiǎn)評估效果,提出了因子分析法和RBF神經(jīng)網(wǎng)絡(luò)相融合的信息系統(tǒng)風(fēng)險(xiǎn)評估模型,并進(jìn)行了指標(biāo)篩選,減少了指標(biāo)維量,簡化RBF神經(jīng)網(wǎng)絡(luò)的復(fù)雜度,并采用蟻群算法對RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,提升RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率,大幅度提升信息系統(tǒng)風(fēng)險(xiǎn)評估正確率,為信息系統(tǒng)風(fēng)險(xiǎn)分析和評估提供了新的研究思路。
信息系統(tǒng)風(fēng)險(xiǎn)與多種因素密切相關(guān),同時(shí)多種因素會共同產(chǎn)生風(fēng)險(xiǎn)作用,因此信息系統(tǒng)風(fēng)險(xiǎn)形式十分復(fù)雜,很難有一定的規(guī)律,同時(shí)具有一定的隨機(jī)性。在進(jìn)行信息系統(tǒng)風(fēng)險(xiǎn)變化規(guī)律建模與評估時(shí),首先要設(shè)計(jì)科學(xué)、客觀的信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)體系。本文基于科學(xué)性、可操作性、區(qū)分性、全面性的原則,設(shè)計(jì)了指標(biāo)體系如表1所示。
表1 信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)體系
從表1可以看出,信息系統(tǒng)風(fēng)險(xiǎn)評估的指標(biāo)數(shù)量比較多,這些指標(biāo)之間有直接相關(guān)性或者間接相關(guān)性,這些相關(guān)性以重復(fù)信息顯示,這些重復(fù)信息不僅會對信息系統(tǒng)風(fēng)險(xiǎn)評估產(chǎn)生一定的干擾,指標(biāo)多,全部用于風(fēng)險(xiǎn)評估,耗長長、效率低,所以采用因子分析法對指標(biāo)進(jìn)行篩選,減少指標(biāo)數(shù)量。設(shè)共有k個(gè)指標(biāo),指標(biāo)量綱不同,使得它們的值差異比較大,影響RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)時(shí)的收斂效率,為此對其進(jìn)行預(yù)處理,具體如式(1):
(1)
式中,xxi表示信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)的原始值,xi表示處理后的信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)值。
因子分析法用m(m (2) 式中,ei表示特殊因子,fi表示公共因子,aij表示公共因子的負(fù)載。 用矩陣形式表示式(2),得到式(3), X=AF+ε (3) 其中 (4) 為了對式(3)進(jìn)行求解可以將式(3)轉(zhuǎn)化為式(5): (5) (6) 根據(jù)式(6)得到指標(biāo)公共因子值,從而得到風(fēng)險(xiǎn)評估指標(biāo)數(shù)量[13]。 X=[x1,x2,…,xn]T為輸入向量,徑向基向量為H=[h1,h1,…,h6]T,則有式(7), (7) 式中,Cj=[cj1,cj2,…,cjn]為節(jié)點(diǎn)j的中心矢量,且有式(8)[14]: cji(k)=cji(k-1)+ηΔcji+α(cji(k-1)-…-cji(k-p)) (8) 式中,η為學(xué)習(xí)速率,α為動量因子,且有式(9), (9) 式中,bj為基寬參數(shù)。 網(wǎng)絡(luò)的權(quán)向量為W=[w1,w1,…]T,那么有式(10): (10) RBF神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)的輸出為式(11), ym(k)=w1h1+w2h2+…+wphp (11) 將因子分析法、RBF神經(jīng)網(wǎng)絡(luò)、蟻群算法[15]進(jìn)行結(jié)合,利用它們的優(yōu)勢,克服當(dāng)前信息系統(tǒng)風(fēng)險(xiǎn)評估模型存在的不足,本文設(shè)計(jì)了一種新型的信息系統(tǒng)風(fēng)險(xiǎn)評估模型,具體工作過程如下。 Step1:分析信息系統(tǒng)的工作流程,以及變化特點(diǎn),建立風(fēng)險(xiǎn)指標(biāo)體系。 Step2:采集相應(yīng)指標(biāo)數(shù)據(jù),并對一些錯誤的數(shù)據(jù)點(diǎn)進(jìn)行去除,保證信息系統(tǒng)風(fēng)險(xiǎn)評估性能。 Step3:采用因子分析法對信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)進(jìn)行處理,去除一些不重要的數(shù)據(jù),選擇最優(yōu)指標(biāo),消除無用信息。 Step4:專家根據(jù)每一組信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)值對每一個(gè)樣本進(jìn)行打分,得到信息系統(tǒng)風(fēng)險(xiǎn)值。 Step5:風(fēng)險(xiǎn)值和對應(yīng)的信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)數(shù)據(jù)組合成樣本集合,并將它們劃分為訓(xùn)練樣本和測試樣本。 Step6:采用信息系統(tǒng)風(fēng)險(xiǎn)評估的訓(xùn)練樣本訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),通過蟻群算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)。 Step7:根據(jù)相關(guān)參數(shù)建立信息系統(tǒng)風(fēng)險(xiǎn)評估模型,流程如圖1所示。 為了分析本文設(shè)計(jì)的信息系統(tǒng)風(fēng)險(xiǎn)評估的有效性和優(yōu)越性,收集一個(gè)信息系統(tǒng)風(fēng)險(xiǎn)變化的歷史值,同時(shí)采集表1中的信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)的數(shù)據(jù),信息系統(tǒng)風(fēng)險(xiǎn)的歷史數(shù)據(jù)如圖2所示。對圖2的信息系統(tǒng)風(fēng)險(xiǎn)的歷史數(shù)據(jù)進(jìn)行分析可以發(fā)現(xiàn),不同時(shí)間點(diǎn),該信息系統(tǒng)風(fēng)險(xiǎn)值之間有一定的相似性,但是有的信息系統(tǒng)風(fēng)險(xiǎn)值差別比較大,具有很強(qiáng)的非平穩(wěn)性,采用MATLAB工具箱編程實(shí)現(xiàn)信息系統(tǒng)風(fēng)險(xiǎn)的仿真實(shí)驗(yàn)。 圖1 因子分析和神經(jīng)網(wǎng)絡(luò)的信息系統(tǒng)風(fēng)險(xiǎn)評估流程 圖2 信息系統(tǒng)風(fēng)險(xiǎn)的歷史數(shù)據(jù)變化趨勢 采用因子分析法對指標(biāo)進(jìn)行分析,得到指標(biāo)累積貢獻(xiàn)率如圖3所示。從圖3的信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)的累積貢獻(xiàn)率可以發(fā)現(xiàn),前8個(gè)因子的累積貢獻(xiàn)率就超過了95%,這表明前8個(gè)因子就可以代表原始信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo),可以去掉其它對信息系統(tǒng)風(fēng)險(xiǎn)評估結(jié)果影響不明顯的因子。 圖3 信息系統(tǒng)風(fēng)險(xiǎn)評估指標(biāo)的累積貢獻(xiàn)率 為驗(yàn)證使因子分析法和神經(jīng)網(wǎng)絡(luò)的信息系統(tǒng)風(fēng)險(xiǎn)評估結(jié)果具有可比性,采用神經(jīng)網(wǎng)絡(luò)、層次分析法作為對比方法,為避免信息系統(tǒng)風(fēng)險(xiǎn)評估結(jié)果的隨機(jī)性,選擇不同數(shù)量的訓(xùn)練樣本進(jìn)行信息系統(tǒng)風(fēng)險(xiǎn)評估測試,評估正確率如圖4所示。從圖4可知,隨著訓(xùn)練樣本數(shù)量的增加,信息系統(tǒng)風(fēng)險(xiǎn)評估正確率不斷的提升,這是因?yàn)橛?xùn)練樣本數(shù)量越多,信息系統(tǒng)風(fēng)險(xiǎn)評估建模更加充分,在相同訓(xùn)練樣本數(shù)量條件下,本文模型的信息系統(tǒng)風(fēng)險(xiǎn)評估正確率要高于對比方法,可以更好地描述信息系統(tǒng)風(fēng)險(xiǎn)變化規(guī)律。 圖4 3種模型的信息系統(tǒng)風(fēng)險(xiǎn)評估正確率對比 為了更好地描述信息系統(tǒng)風(fēng)險(xiǎn)評估的實(shí)時(shí)性,選取訓(xùn)練樣本和測試樣本數(shù)量為1∶1的條件下,3種模型的信息系統(tǒng)風(fēng)險(xiǎn)評估訓(xùn)練和測試時(shí)間如圖5所示。從圖5可以發(fā)現(xiàn),本文模型的信息系統(tǒng)風(fēng)險(xiǎn)評估訓(xùn)練和測試時(shí)間要少于對比模型,提高了信息系統(tǒng)風(fēng)險(xiǎn)評估速度。 圖5 3種模型的訓(xùn)練和測試時(shí)間對比 當(dāng)信息系統(tǒng)風(fēng)險(xiǎn)評估的指標(biāo)比較多時(shí),指標(biāo)間信息重復(fù)度大,重復(fù)信息干擾了評估結(jié)果,為了更加準(zhǔn)確描述信息系統(tǒng)風(fēng)險(xiǎn)的變化特點(diǎn),提出了因子分析和神經(jīng)網(wǎng)絡(luò)的信息系統(tǒng)風(fēng)險(xiǎn)評估模型,并通過具體仿真測試得到了如下結(jié)論。 (1) 采用因子分析方法選擇對信息系統(tǒng)風(fēng)險(xiǎn)評估作用大的評估指標(biāo),可以降低RBF神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點(diǎn)數(shù)量,簡化RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),能夠提高信息系統(tǒng)風(fēng)險(xiǎn)評估效率。 (2) RBF神經(jīng)網(wǎng)絡(luò)擬合信息系統(tǒng)風(fēng)險(xiǎn)變化趨勢,可以建立正確率高的信息系統(tǒng)風(fēng)險(xiǎn)評估模型。 (3) 通過與其它信息系統(tǒng)風(fēng)險(xiǎn)評估模型進(jìn)行比較測試可以知道,本文模型的信息系統(tǒng)風(fēng)險(xiǎn)評估正確率更高,降低了信息系統(tǒng)風(fēng)險(xiǎn)評估誤差而且信息系統(tǒng)風(fēng)險(xiǎn)評估速度更快,具有十分明顯的優(yōu)越性。1.3 RBF神經(jīng)網(wǎng)絡(luò)
1.4 信息系統(tǒng)風(fēng)險(xiǎn)評估模型具體設(shè)計(jì)
2 因子分析和神經(jīng)網(wǎng)絡(luò)的信息系統(tǒng)風(fēng)險(xiǎn)評估模型的性能驗(yàn)證實(shí)驗(yàn)
2.1 實(shí)驗(yàn)數(shù)據(jù)
2.2 因子分析法對信息系統(tǒng)風(fēng)險(xiǎn)評估處理的結(jié)果
2.3 不同模型的信息系統(tǒng)風(fēng)險(xiǎn)評估正確率和建模效率對比
3 總結(jié)