李平舟,趙朗程
(北京郵電大學 國際學院,北京 100876)
如何評判國家的穩(wěn)定性一直以來都是各類政治、經(jīng)濟機構(gòu)研究的重點?,F(xiàn)有評價體系中脆弱國家指數(shù)(Fragile State Index,F(xiàn)SI)是最廣為認可的指標。脆弱國家指數(shù)是世界上178個國家面對不同壓力時所表現(xiàn)出的脆弱程度排名[1]。該指數(shù)由和平基金會專有的沖突評估系統(tǒng)(CAST)分析得出,CAST采用綜合社會學方法論,主要使用定量評估,定性評估和專家驗證三種方法來得出國家穩(wěn)定性的指數(shù)。根據(jù)專業(yè)社會科學研究,每個被評估的國家具有12個政治,經(jīng)濟和社會三個方面的主指標以及超過100個子指標。CAST方法和FSI被廣泛用于政治決策,社會分析以及發(fā)展研究[2]。
2009年 10月,聯(lián)合國政府間氣候變化專門委員會(IPCC)發(fā)表的《第五次評估報告》[3]與以往報告相比,強調(diào)了氣候變化對國家社會經(jīng)濟和可持續(xù)發(fā)展方面的影響。而CAST方法中涉及氣候變化的指標較少,難以分析氣候變化對于國家的影響。
針對以上問題,本文采用BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)的方法,根據(jù)CAST方法得出的脆弱國家指數(shù),結(jié)合178個國家近幾年以來的12項指標,其中2項為氣候指標,訓練得到氣候變化和FSI之間的關(guān)系網(wǎng)絡(luò)。
主成分分析法(PCA),旨在利用降維的思想,將多個指標再劃分為少數(shù)幾個綜合指標(即主成分),其中每個主成分都可以反映原始變量的大部分信息,且所含信息不重復[4]。
主成分分析法可消除指標間的相關(guān)影響,減少選取指標的工作量,并取累計貢獻率高的主成分來代表原變量,減少計算工作量[5]。然而對于國家脆弱指數(shù)的評估而言,變量降維的過程會使得提取出的主成分帶有一定的模糊性,從而失去實際意義和實際背景,使得抽象出的主成分難以有合理的解釋。
層次分析法(AHP)是將復雜的多目標決策問題作為一個系統(tǒng),將目標分解為多個目標或準則,進而分解為多指標的若干層次。通過定性指標模糊量化方法算出層次單排序和總排序作為多目標決策的系統(tǒng)方法[6]。
然而層次分析法缺少嚴格的數(shù)學論證和完整的定量方法,是一種帶有模擬人腦的決策方法,包含較多定性色彩。而對于國家脆弱指數(shù)的評估需要大量的指標,數(shù)據(jù)統(tǒng)計量大且權(quán)重難以確定,層次分析法中的特征值和特征向量的維度較高,計算上相對困難。
模糊綜合評價法(FCE)是一種基于模糊數(shù)學的綜合評價方法,通過指標分類及每個指標的等級評定建立評價標準集。在將每個指標分為多個等級后進行單因素模糊評價,構(gòu)建評價矩陣 R。接下來將權(quán)重與評價矩陣進行合成,可得到評價事物的綜合模糊評價隸屬度,通過最大隸屬度定級,得到最終的評價結(jié)果[7]。
模糊綜合評價的評價結(jié)果為一個矢量而非點值,可以較為準確的刻畫評價對象,然而評價國家脆弱性所需的大量指標,導致相對隸屬度權(quán)系數(shù)偏小,權(quán)矢量與模糊矩陣R不匹配,結(jié)果會出現(xiàn)超模糊現(xiàn)象,無法分辨隸屬度關(guān)系,甚至可能造成評判失敗。
在實際建模中,還可將AHP與FCE建模方法相結(jié)合,即為AHP-模糊綜合評價法。使用AHP建立遞階層次結(jié)構(gòu),確定指標體系,F(xiàn)CE用以對指標進行等級評價,確定目標等級。但過多人為因素干擾的根本問題并沒有解決,模型主觀性強,這將影響對國家脆弱性的客觀評判。
為了客觀評價國家的穩(wěn)定與否,本文提出使用基于大量數(shù)據(jù)確定權(quán)值的 BP神經(jīng)網(wǎng)絡(luò)模型,計算輸入指標與國家脆弱指數(shù)之間關(guān)系。
國家穩(wěn)定性評判的量化需要一個國家各方向的指標數(shù)據(jù)以體現(xiàn)其各項狀態(tài),從而結(jié)合各項指標,得到最終的評判結(jié)果。脆弱國家指數(shù)是現(xiàn)有的,基于專家智庫各項定性、定量分析所得出的國家穩(wěn)定性評價。其參考價值是巨大的,但由于缺乏與數(shù)據(jù)的直接聯(lián)系,我們不能根據(jù)其結(jié)果分析一個國家某個特定方向上的發(fā)展狀態(tài)。
為此我們引入BP神經(jīng)網(wǎng)絡(luò)的,BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播(簡稱誤差反傳)訓練的多層前饋網(wǎng)絡(luò)[8],它的基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實際輸出值和期望輸出值的誤差均方差為最小。通過訓練網(wǎng)絡(luò)得出某一指標與國家穩(wěn)定性的直接關(guān)系,從而制定相應政策,指導國家發(fā)展。
BP神經(jīng)網(wǎng)絡(luò)的類型為有監(jiān)督的學習,其樣本包含以下兩個部分:樣本特征值和樣本標簽。樣本特征值構(gòu)成的樣本特征集即為描述樣本特征的描述子,在本文中,參考和平基金會評估國家脆弱指數(shù)的三個主要方面:政治,經(jīng)濟和社會,設(shè)定了10個指標。同時,為了表現(xiàn)氣候變化對國家脆弱性的影響。本文參照柯本氣候分類法,以氣候和降水兩個主要氣候要素作為評估氣候變化的指標。以上共計12個指標,作為描述某個國家特點的描述子。
樣本標簽表達一個樣本的類別或取值。在本文中,國家脆弱指數(shù)即為樣本標簽。由于獲取樣本標簽絕對真值非常困難,故本文參考和平基金會給出的FSI數(shù)據(jù)。FSI的值越大則表明國家脆弱性越高。
BP算法的輸入為12個指標,輸出即為表示國家穩(wěn)定性的FSI。BP網(wǎng)絡(luò)內(nèi)兩個重要的參數(shù)為權(quán)值和閾值,權(quán)值描述層與層神經(jīng)元之間的關(guān)系,閾值描述神經(jīng)元內(nèi)聯(lián)系。算法包括信號的前向傳播和誤差的反向傳播兩個過程,即計算誤差輸出時按輸入到輸出的方向進行,而調(diào)整閾值則從輸出到輸入的方向進行。正向傳播時,輸入信號通過隱含層作用于輸出節(jié)點,經(jīng)過非線性變換,產(chǎn)生輸出信號。若實際輸出的脆弱國家指數(shù)與期望輸出不相符,則轉(zhuǎn)入誤差的反向傳播過程。誤差反傳是將輸出誤差通過隱含層向輸入層逐層反傳,并將誤差分攤給各層所有單元,以從各層獲得的誤差信號作為調(diào)整各單元權(quán)值的依據(jù)。用過調(diào)整輸入節(jié)點與隱層節(jié)點的聯(lián)結(jié)強度和隱層節(jié)點與輸出節(jié)點的聯(lián)結(jié)強度以及閾值,使誤差沿梯度方向下降,經(jīng)過反復學習訓練,確定與最小誤差相對應的網(wǎng)絡(luò)參數(shù)(權(quán)值和閾值),訓練即告停止。此時經(jīng)過訓練的神經(jīng)網(wǎng)即能對類似樣本的輸入信息,自行處理輸出誤差最小的經(jīng)過非線性轉(zhuǎn)換的FSI。
本算法的基本原理是利用輸出后的誤差來估計輸出層的直接前導層的誤差,再利用這個誤差來估計下一層的誤差,如此循環(huán),即可獲得對所有層的誤差估計[9]。
基本的BP神經(jīng)網(wǎng)絡(luò)包含三層網(wǎng)絡(luò)結(jié)構(gòu):輸入層,隱含層和輸出層,各層節(jié)點之間無連接。這樣,經(jīng)過層層處理之后,可以得到輸入向量與輸出向量之間的非線性關(guān)系網(wǎng)絡(luò)[8]。該網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖1所示.
圖1 BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)Fig.1 Topology structure of BP neural network
樣本輸入數(shù)目為 k,輸入向量為X,實際輸出向量為Z,期望輸出向量為T,輸入層與隱含層連接權(quán)值為Wih,隱含層與輸出層連接權(quán)值為Whi。網(wǎng)絡(luò)具體學習步驟如下:
(1)初始化網(wǎng)絡(luò):為各個連接權(quán)值賦(-1,1)之間的隨機數(shù),設(shè)定誤差函數(shù)e。
誤差函數(shù)e為:
并設(shè)置計算精度和最大學習次數(shù)。
(2)隨機選取第k個輸入樣本和期望輸出,利用網(wǎng)絡(luò)期望輸入和實際輸出,計算誤差函數(shù)對輸出層各節(jié)點的偏導數(shù)[9]。
(3)同理,可以根據(jù)隱含層到輸出層連接權(quán)值,輸出層和隱含層的輸出計算誤差函數(shù)來計算誤差函數(shù)對隱含層各個節(jié)點的偏導數(shù)。
(4)利用輸出層偏導和隱含層各個節(jié)點的輸出來修正連接權(quán)值Wih,利用隱含層的偏導和輸入層各個節(jié)點的輸入修正連接權(quán)值Whi。
(5)計算全局誤差,本文使用的全局誤差函數(shù)為:
(6)檢查網(wǎng)絡(luò)誤差,如果網(wǎng)絡(luò)誤差滿足計算精度或?qū)W習次數(shù)大于最大學習次數(shù),則結(jié)束算法。否則隨機選取另一個不同學習樣本再次進行訓練[10]。
(1)樣本輸入設(shè)計:通過數(shù)據(jù)收集,共得到2000組樣本數(shù)據(jù),其中隨機80%樣本數(shù)據(jù)作為訓練數(shù)據(jù),余下20%樣本數(shù)據(jù)作為檢驗數(shù)據(jù)以確保模型效果。
(2)網(wǎng)絡(luò)設(shè)計:本文采用的學習優(yōu)化算法為 Ada Grad[11]優(yōu)化算法,網(wǎng)絡(luò)輸入為不同國家的12種指標值,設(shè)置隱含層節(jié)點150個,輸出層節(jié)點1個,最大訓練次數(shù)為 104次,學習率為 10–4,訓練要求精度為 10–10,最小梯度要求為 10–10。
數(shù)據(jù)來源為[12]。我們使用80%的數(shù)據(jù)作為訓練集,剩余20%用作測試集。
表1 網(wǎng)絡(luò)的輸入/輸出Tab.1 Input/output of network
實驗平臺:MacOS Sierra 10.12.6
Matlab R2015b;
CPU:Intel Core i5 4258U 2.4 GHz;
RAM:雙通道8 GB
(1)訓練過程
本次試驗中,數(shù)據(jù)被隨機分為訓練數(shù)據(jù),驗證數(shù)據(jù)和測試數(shù)據(jù),訓練使用萊文貝格-馬夸特算法,使用均方誤差評估網(wǎng)絡(luò)表現(xiàn)[13]。如圖2所示,該模型在第13次迭代處達到最小均方誤差,此時估計量與被估計量差值最小,擬合效果達到最優(yōu)。確認檢查值默認為6,在第11次迭代之后,樣本誤差呈上升趨勢,故在第17次迭代時停止訓練以保證不出現(xiàn)過擬合[14]。
此時均方誤差為:5.31,梯度值為:40.3,Mu值為:0.1。此時生成誤差-樣本圖。
(2)測試模型
測試結(jié)果如圖3所示,該圖為測試樣本的驗證結(jié)果,由圖可知,絕大部分誤差在0軸附近,少部分誤差較大的點為樣本本身特征的缺失導致信息不完全而判斷失誤,模型整體效果良好。該結(jié)果展示了國家脆弱性與輸入指標之間的準確關(guān)系。
(3)對比分析
為驗證將氣候變化因素列入指標后對結(jié)果預測的準確性,本文使用除氣候之外的10個指標采用相同網(wǎng)絡(luò)進行試驗??梢钥闯鍪夂蜃兓蛩刂蟮念A測,隨樣本數(shù)的增加,誤差逐漸增高。加入氣候因素的測試樣本誤差率為0.411%,而未加入氣候因素的誤差率則為1.982%誤差率提高了約4.6倍。由此可見,加入氣候因素,會對國家脆弱性的評估更為真實可信。
圖2 網(wǎng)絡(luò)訓練Fig.2 Network training
圖3 MSE誤差曲線Fig.3 MSE error curve
圖4 訓練過程Fig.4 Training process
圖5 訓練結(jié)果Fig.5 Training results
圖6 測試誤差Fig.6 Test error
圖7 不考慮氣候因素的測試誤差Fig.7 Test error without considering climate factors
氣候變化要素是由聯(lián)合國政府間氣候變化專門委員會提出的一項影響國家穩(wěn)定性的新指標。本文擬在美國和平基金會提出的評估國家脆弱指數(shù)的指標中加入氣候變化因素,并使用 BP神經(jīng)網(wǎng)絡(luò)研究氣候變化和原有指標對國家穩(wěn)定性的共同影響。輸入187個國家近十年的數(shù)據(jù)對網(wǎng)絡(luò)進行訓練,得出含氣候變化在內(nèi)的 12個指標與國家脆弱指數(shù)之間的非線性關(guān)系網(wǎng)絡(luò)。相比于原有的不含氣候指標的評估方法,有更好的預測效果,誤差率降至0.411%。證明了氣候變化會對國家脆弱性產(chǎn)生顯著的影響。而事實上,氣候變化也會對人口,教育等其他評估指標造成影響。后續(xù)工作將著重于研究氣候變化如何其他評估指標造成影響,從而間接影響國家脆弱性。