• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于非期望SBM-SVM改進(jìn)模型的投資有效性預(yù)測
      ——以重慶市工業(yè)行業(yè)為例

      2023-02-21 11:07:42陳義安
      關(guān)鍵詞:決策分類工業(yè)

      徐 杰,陳義安

      重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067

      1 引 言

      在國民經(jīng)濟(jì)中,工業(yè)行業(yè)是最重要的經(jīng)濟(jì)和生產(chǎn)技術(shù)綜合體,工業(yè)行業(yè)分為采礦業(yè),制造業(yè),電力、熱力、燃?xì)饧八a(chǎn)和供應(yīng)業(yè)3個門類,總共劃分為41個行業(yè)大類,工業(yè)內(nèi)部各行業(yè)間的投資結(jié)構(gòu)對工業(yè)發(fā)展有一定的影響,行業(yè)間的有效投資有利于工業(yè)的健康發(fā)展。同時(shí),工業(yè)也是能源消耗、環(huán)境污染的主要源頭,近年來,工業(yè)對能源的消耗和產(chǎn)生的環(huán)境污染情況也引起了重視,提出的新發(fā)展理念包括綠色發(fā)展,即在經(jīng)濟(jì)發(fā)展過程中,要做到對保護(hù)環(huán)境、節(jié)約資源的落實(shí),要做到對節(jié)能減排目標(biāo)的完成,以此來促進(jìn)經(jīng)濟(jì)轉(zhuǎn)型的發(fā)展。因此,在研究工業(yè)行業(yè)的投資有效性時(shí),加入環(huán)境污染這一非期望產(chǎn)出指標(biāo),將工業(yè)行業(yè)細(xì)分為39個行業(yè),分析研究工業(yè)行業(yè)間的經(jīng)濟(jì)投資相對有效性情況,并構(gòu)建出分類模型。

      近年來將DEA方法與機(jī)器算法結(jié)合構(gòu)建新的預(yù)測方法引起了眾多學(xué)者的研究,Song[1]、冉茂盛[2]、李寧等[3]學(xué)者將DEA方法中的輸入、輸出數(shù)據(jù)以及結(jié)果作為訓(xùn)練集訓(xùn)練SVM模型,剩余的決策單元作為測試集進(jìn)行測試,分別對企業(yè)績效、上市公司的經(jīng)營效率以及企業(yè)的平行部門績效進(jìn)行評價(jià)與分類預(yù)測,最終依據(jù)預(yù)測分類準(zhǔn)確率驗(yàn)證了該方法具有可用性、有效性和實(shí)用性。Zhang[4]則是通過構(gòu)建IG-SVM模型對DEA模型輸入和輸出數(shù)據(jù)的最小值、平均值、最大值進(jìn)行預(yù)測,并利用DEA模型計(jì)算出決策單元的未來效率值,通過實(shí)例表明方法的可行性和適用性。同樣,李玉龍[5]和Zhu等[6]學(xué)者建立了DEA與神經(jīng)網(wǎng)絡(luò)集成模型及機(jī)器學(xué)習(xí)(ML)算法之間的聯(lián)系,分別對基礎(chǔ)設(shè)施的投資有效性和中國制造業(yè)上市公司的績效進(jìn)行預(yù)測,證明了方法的適用性。通過上述眾多學(xué)者的研究及實(shí)證證明:將DEA與機(jī)器學(xué)習(xí)算法以及SVM模型相結(jié)合構(gòu)建的新模型對投資有效性研究具有可行性。但是在學(xué)者們的研究中,并沒有考慮在投入產(chǎn)出過程中,會存在非期望產(chǎn)出的情況,因此本文引入非期望產(chǎn)出指標(biāo),利用非期望產(chǎn)出SBM方法與SVM方法相結(jié)合生成一個新的模型,以此研究非期望產(chǎn)出時(shí)的投資有效性。同樣,對SVM模型參數(shù)優(yōu)化,也是眾多學(xué)者研究討論的話題,通過對SVM模型的懲罰因子(C)和核函數(shù)參數(shù)(g)尋優(yōu),找到SVM模型的最優(yōu)參數(shù),提高預(yù)測準(zhǔn)確率和模型的可用性。徐曉明[7]、顏薇等[8]分別利用智能優(yōu)化算法、AGA模型對支持向量機(jī)的參數(shù)C和g進(jìn)行優(yōu)化,通過數(shù)值實(shí)驗(yàn)結(jié)果得出優(yōu)化后的效果,使得預(yù)測效果更好。對于SVM模型,可以對其參數(shù)尋優(yōu),使得預(yù)測效果更佳,因此本文同樣考慮運(yùn)用智能優(yōu)化算法對支持向量機(jī)的懲罰參數(shù)C和核函數(shù)g進(jìn)行尋優(yōu),找到非期望產(chǎn)出SBM-SVM模型的最優(yōu)C和g。本文將非期望產(chǎn)出SBM與SVM結(jié)合建立一個新的有效性分類方法,并對此進(jìn)行改進(jìn)優(yōu)化,得到更佳的分類效果,此方法可以加入非期望產(chǎn)出指標(biāo),有利于對綠色發(fā)展、綠色投資的有效性等方向的研究。因此,本文探討非期望SBM模型和SVM模型結(jié)合構(gòu)建新的有效性分類方法及其對其優(yōu)化是否具有可行性,并利用實(shí)證進(jìn)行研究。

      重慶市的經(jīng)濟(jì)正處于增長階段,2020年重慶市全年GDP為25 002.79億元,其中工業(yè)生產(chǎn)總值占國內(nèi)比重28%,且近10 a來,一直維持在27.8%~37%的占比,為全行業(yè)最高。全年工業(yè)增加值為6 990.77億元,比上年增長5.3%,規(guī)模以上工業(yè)增加值比上年增長5.8%,工業(yè)固定資產(chǎn)投資也呈現(xiàn)逐年上升的趨勢,2020年比上年增長5.8%、研究重慶市工業(yè)各行業(yè)的投資有效性可以更好地分析優(yōu)化產(chǎn)業(yè)結(jié)構(gòu),并促進(jìn)工業(yè)長期穩(wěn)定發(fā)展。本文選擇非期望產(chǎn)出SBM模型對重慶市工業(yè)各行業(yè)投資效率的研究,并基于SVM模型構(gòu)建出非期望SBM-SVM模型對投資有效性進(jìn)行分類,運(yùn)用優(yōu)化模型對SVM方法參數(shù)尋優(yōu),根據(jù)結(jié)果情況得出結(jié)論。

      2 非期望SBM-SVM有效性方法

      Tone[9]在2001年提出了非徑向非角度的SBM模型,此方法作為DEA的衍生模型,很好地解決了DEA方法由于徑向距離函數(shù)以及角度模型所出現(xiàn)的在效率評估中的缺陷。

      在投入產(chǎn)出過程中會產(chǎn)生負(fù)面效應(yīng),可以分為期望和非期望產(chǎn)出。于本文而言,節(jié)能減排是近年來備受關(guān)注的話題,我們期望在投入的過程中能排放出更少的環(huán)境污染物,因此加入非期望產(chǎn)出指標(biāo),能夠更加科學(xué)、綠色健康地評價(jià)。

      其中,s-為投入指標(biāo)松弛變量,s+為期望產(chǎn)出松弛變量,su-為非期望產(chǎn)出松弛變量,投入要素權(quán)重為λ,最終求解的ρ*為決策單元的效率值,其取值在[0,1]。如果ρ*=1,則稱決策單元為DEA相對有效;若ρ*<1,則稱決策單元為非DEA相對有效。

      當(dāng)訓(xùn)練集D線性可分時(shí),將分類問題轉(zhuǎn)化成了帶約束條件的二次規(guī)劃問題:

      s.t.yk(ωTxk+b)≥1,k=1,2,…,p

      將二次規(guī)劃問題轉(zhuǎn)化為對偶函數(shù),引入每個樣本對應(yīng)的拉格朗日乘子αk,αk≥0,k=1,2,…,p,可以得到:

      (1)

      對ω和b求導(dǎo)數(shù),并令其為零,可以求得ω和b的最小值:

      (2)

      (3)

      求解式(2)(3),得:

      將結(jié)果代入式(1)有:

      (4)

      設(shè)定核函數(shù)K(xk,xj)代入式(4)中:

      通過求解,可得到二次規(guī)劃:

      根據(jù)求解二次規(guī)劃問題原理,該二次規(guī)劃具有唯一解,最優(yōu)分類函數(shù)為

      根據(jù)KKT條件,分類面為最優(yōu)分類超平面的充要條件是

      (5)

      訓(xùn)練集D為線性不可分時(shí),引入了松弛變量ζi≥0,懲罰系數(shù)為C,構(gòu)建出最大化分類間隔,使得原始帶約束的二次規(guī)劃問題變成以下表述:

      s.t.yk(ωΤxk+b)≥1-ζk,ζ≥0,k=1,2,…,p

      同樣將二次規(guī)劃問題轉(zhuǎn)化為對偶問題,引入αk為每個樣本的拉格朗日乘子,并引入新的拉格朗日乘子μk,得到式(6):

      (6)

      對ω,b,ζk求導(dǎo)數(shù),并令其為零,可以求得ω和b的最小值:

      設(shè)可以將線性不可分的兩類點(diǎn)變成線性可分的核函數(shù)K(xk,xj),則對偶函數(shù)為

      求解上述函數(shù),分下列情況討論:

      0<αk0,同時(shí)因?yàn)棣蘫·ζk=0,則ζk=0,yk(ωΤxk+b)=1。

      αk=C時(shí),有α[yk(ωΤxk+b)-1+ζk]=0。因?yàn)镃=αk+μk且αk=C,所以μk=0,ζk≥0,則yk(ωΤxk+b)≤1。

      αk=0時(shí),有α[yk(ωΤxk+b)-1+ζk]=0。因?yàn)棣羕=0且αk+μk=C,所以μk=C,同時(shí)因?yàn)棣蘫·ζk=0,則ζk=0,yk(ωΤxk+b)≥1。

      綜上所述,所有樣本必須滿足:

      3 參數(shù)優(yōu)化及模型評估方法

      3.1 優(yōu)化模型

      支持向量機(jī)的性能和預(yù)測精確度受到懲罰因子C和核函數(shù)參數(shù)g取值大小的影響,本文選用智能優(yōu)化算法調(diào)整SVM模型中的懲罰因子和核函數(shù)參數(shù)值,運(yùn)用“試錯法”、粒子群算法(PSO)、遺傳算法(GA)對非期望SBM-SVM模型進(jìn)行優(yōu)化改進(jìn)。粒子群算法(PSO)源于模擬鳥群捕食行為,通過群體中個體間的協(xié)作和信息共享來尋找最優(yōu)解,粒子通過跟蹤個體極值(pbest)和全局極值(gbest)兩個極值來更新自己,找到兩個最優(yōu)值后,通過下列公式來更新自己的速度和位置[7]:

      速度更新公式:

      Vi=ω×Vi+c1×rand()×(pbesti-Xi)+

      c2×rand()×(gbest-Xi)

      其中,ω為慣性因子,Vi為第i個粒子的速度,Xi為第i個粒子的位置,c1和c2為學(xué)習(xí)因子,pbesti為第i個粒子的歷史最優(yōu)位置,gbest為粒子群的歷史最優(yōu)位置。

      位置更新公式:Xi=Xi+Vi。

      其更新步驟如下:首先對粒子群進(jìn)行初始化處理;計(jì)算每個粒子的適應(yīng)度值;比較每個粒子的適應(yīng)度值和個體極值,若適應(yīng)度值大于個體極值,則用適應(yīng)度值替換;再對每個粒子的適應(yīng)度值和全局極值進(jìn)行比較,若適應(yīng)度值大于全局極值,則用適應(yīng)度值替代;根據(jù)速度更新公式和位置更新公式更新粒子的速度和位置;經(jīng)過上述操作,直到到達(dá)設(shè)定的迭代次數(shù)T,終止運(yùn)算,最終輸出最優(yōu)解C和g。

      粒子群算法與非期望SBM方法和SVM模型結(jié)合的流程圖如圖1所示。

      圖1 PSO優(yōu)化非期望SBM-SVM模型的流程圖Fig.1 Flow chart of PSO optimizing undesirable SBM-SVM model

      3.2 模型評估方法

      在做分類時(shí),需要對模型效果好壞進(jìn)行評估,本文選擇預(yù)測準(zhǔn)確率、ROC曲線圖、準(zhǔn)確率和召回率來反映SVM模型分類結(jié)果的情況,首先需要構(gòu)建混淆矩陣,如表1。

      表1 混淆矩陣Table 1 Confusion matrix

      (1) 預(yù)測準(zhǔn)確率。預(yù)測準(zhǔn)確率指準(zhǔn)確判定出決策單元屬于預(yù)期某一類結(jié)果的概率,其值越高,則表示準(zhǔn)確預(yù)測的概率就越好,分類效果就越好。在表1的混淆矩陣中,其正確預(yù)測和錯誤預(yù)測的決策單元個數(shù)為矩陣交叉項(xiàng),正確預(yù)測個數(shù)為TN+TP,預(yù)測準(zhǔn)確率值為

      (2) ROC曲線圖及AUC值。對于分類器的優(yōu)劣評價(jià),通常會采用ROC曲線及AUC值,其中AUC值是ROC曲線下的面積,表示分類器對判斷預(yù)期結(jié)果的預(yù)測能力,ROC曲線下的面積越大,則值越大,說明預(yù)期結(jié)果的判斷能力越好,分類器的效果也就越好。

      (3) 精確率和召回率。在評估分類模型時(shí),僅使用預(yù)測準(zhǔn)確率不能完全判定模型的優(yōu)劣。依據(jù)分類數(shù)據(jù)集的結(jié)構(gòu)情況,判斷分類的精確率和召回率,分別對投資有效性和投資無效性預(yù)測進(jìn)行驗(yàn)證。

      4 實(shí)證研究

      4.1 指標(biāo)的建立與決策單元的選取

      首先構(gòu)建非期望SBM模型,建立SBM模型的輸入、輸出指標(biāo)和決策單元的輸入、輸出指標(biāo)。從對工業(yè)的投入和產(chǎn)出兩個方面出發(fā),選取2011—2020年重慶市相關(guān)指標(biāo),投入包括資本投入、勞動投入和能源投入,由固定資產(chǎn)代表資本的投入,應(yīng)付職工薪酬代表勞動資金的投入,綜合能源消費(fèi)量作為能源的投入。由工業(yè)各行業(yè)的總產(chǎn)值、利潤總額反映期望產(chǎn)出的情況。在進(jìn)行勞務(wù)活動和產(chǎn)品產(chǎn)出的過程中,會產(chǎn)生對環(huán)境污染的排放。其中包括廢水、廢氣、廢棄物的排放,選擇用重慶市工業(yè)各行業(yè)產(chǎn)生的廢水排放量表示廢水排放情況,二氧化硫和粉塵排放量表示廢氣排放情況,工業(yè)固體廢物產(chǎn)生量表示廢棄物排放情況,并用熵值法將以上指標(biāo)綜合為一個環(huán)境污染綜合指數(shù)來代表工業(yè)環(huán)境污染排放物產(chǎn)出情況,此環(huán)境污染綜合指數(shù)為非期望產(chǎn)出指標(biāo)。

      依據(jù)《國民經(jīng)濟(jì)行業(yè)分類標(biāo)準(zhǔn)》,將工業(yè)行業(yè)分為41個大類,其中采礦業(yè)中的開采輔助活動和其他采礦業(yè)近十年來未有相關(guān)數(shù)據(jù)發(fā)布,剔除這兩個行業(yè),本文將工業(yè)分為39個行業(yè)作為決策單元。要求決策單元的數(shù)量大于或等于投入和產(chǎn)出指標(biāo)的數(shù)量之和的兩倍,此決策單元的選取符合模型的要求。

      由于工業(yè)小企業(yè)缺乏清晰完整的財(cái)務(wù)報(bào)表,開展相關(guān)的統(tǒng)計(jì)工作較為困難,一年的主營業(yè)務(wù)收入為2 000萬元及其以上的工業(yè)單位稱為規(guī)模以上工業(yè)企業(yè),此類企業(yè)的投資、成本、收入、耗能、排放量等相關(guān)數(shù)據(jù)具有準(zhǔn)確性和完整性,并且統(tǒng)計(jì)局發(fā)布的工業(yè)行業(yè)數(shù)據(jù)都為規(guī)模以上工業(yè)企業(yè)的數(shù)據(jù),因此,以上輸入輸出指標(biāo)都選取為重慶市規(guī)模以上工業(yè)企業(yè)的相關(guān)數(shù)據(jù)。

      投入指標(biāo):按行業(yè)分固定資產(chǎn)X1(萬元)、按行業(yè)分應(yīng)付職工薪酬X2(萬元)、按行業(yè)分綜合能源消費(fèi)量X3(噸標(biāo)準(zhǔn)煤)。

      產(chǎn)出指標(biāo)(期望):按行業(yè)分總產(chǎn)值Y1(萬元)、按行業(yè)分利潤總額Y2(萬元)。

      產(chǎn)出指標(biāo)(非期望):按行業(yè)分工業(yè)環(huán)境污染綜合指數(shù)Y3。

      決策單元:重慶市工業(yè)各行業(yè)分類依據(jù)《國民經(jīng)濟(jì)行業(yè)分類》分為39類。

      為了剔除價(jià)格變動的影響,將以上價(jià)格相關(guān)指標(biāo)以2011年為基期進(jìn)行平減處理,對固定資產(chǎn)指標(biāo)進(jìn)行平減的指數(shù)為固定資產(chǎn)價(jià)格指數(shù);對應(yīng)付職工薪酬進(jìn)行平減處理的指數(shù)采用居民消費(fèi)價(jià)格指數(shù);采用工業(yè)生產(chǎn)者出廠價(jià)格指數(shù)分別對總產(chǎn)值和利潤總額進(jìn)行平減處理。

      4.2 非期望SBM模型

      本文選擇非期望產(chǎn)出的非徑向非角度SBM模型來評價(jià)工業(yè)各行業(yè)的DEA有效性,基于上文的SBM模型介紹,運(yùn)用Stata16.0軟件,測算出2011—2020年重慶市工業(yè)各行業(yè)的投資效率,表2列出2020年重慶市工業(yè)各行業(yè)的投資效率情況。

      表2 重慶市2020年工業(yè)行業(yè)投資效率評價(jià)結(jié)果Table 2 Evaluation results of industrial investment efficiency in Chongqing in 2020

      表2所列是對決策單元的資源配置能力、資源使用效率等多方面能力的綜合衡量與評價(jià)。將工業(yè)劃分為39個行業(yè),有11個行業(yè)投資效率達(dá)到1,其中包括采礦業(yè)中2個行業(yè),制造業(yè)中9個行業(yè)。電力、燃?xì)饧八纳a(chǎn)和供應(yīng)業(yè)中沒有達(dá)到1的行業(yè)。Wu[10]和鄭建鋒[11]等將DEA得出的效率分為4類,效率在0.98~1之間的決策單元為強(qiáng)相對有效,即此類決策單元稍作修改,便可以達(dá)到最佳組合配置;效率在0.8~0.98之間的決策單元為相對有效,此類決策單元比上一類決策單元需要多做修改,才能達(dá)到最佳組合配置;效率在0.5~0.8之間的決策單元為相對低效,這類決策單元需要重新調(diào)整資源配置或者投入產(chǎn)出結(jié)構(gòu),并需要一定時(shí)間來適應(yīng)新配置;效率在0~0.5之間的決策單元為低效率單元,這一類決策單元需要花費(fèi)大量的精力和時(shí)間來重新修改和調(diào)整投入產(chǎn)出。重慶市2020年的工業(yè)內(nèi)部各行業(yè)投資效率,強(qiáng)相對有效決策單元有11個,相對低效決策單元有6個,低效率決策單元有22個,煤炭開采和洗選業(yè)為整個工業(yè)行業(yè)中效率最低的決策單元,效率值僅為0.058 665。說明重慶市2020年工業(yè)各行業(yè)間的差距較大,需要對低效率、相對低效率行業(yè)資源投入規(guī)模和配置進(jìn)行調(diào)整修改。

      從表2可以看出:投資效率最終呈現(xiàn)的評價(jià)結(jié)果取值范圍在0~1之間。軟件運(yùn)算結(jié)果顯示:有幾項(xiàng)決策單元的效率值為0.999 99,近似等于1,因此本文將效率評價(jià)結(jié)果在0.98~1之間的決策單元設(shè)定為投資有效,運(yùn)用名義數(shù)值1代表;將效率評價(jià)結(jié)果在0~0.98之間的決策單元設(shè)定為投資無效,運(yùn)用名義數(shù)值0代表。

      4.3 SVM模型

      根據(jù)上文非期望產(chǎn)出SBM模型的指標(biāo)選取及效率評價(jià)結(jié)果,此處選取SBM模型的輸入與輸出指標(biāo)為SVM的特征變量指標(biāo),即重慶市2011—2020年規(guī)模以上工業(yè)按行業(yè)分的固定資產(chǎn)、應(yīng)付職工薪酬、總產(chǎn)值、利潤總額、工業(yè)環(huán)境污染綜合指數(shù),以上文得出的含有非期望產(chǎn)出的投資效率結(jié)果為SVM模型的結(jié)果變量,其中將投資效率大于0.98的決策單元標(biāo)為DEA相對有效,投資效率小于0.98的決策單元標(biāo)為非DEA相對有效。采用歸一化對上列6個因變量指標(biāo)進(jìn)行標(biāo)準(zhǔn)化預(yù)處理以消除變量間的影響[12],公式如下:

      本文運(yùn)用R語言軟件工具,利用重慶市2011—2020年工業(yè)各行業(yè)指標(biāo)構(gòu)建SVM模型,對重慶市工業(yè)各行業(yè)投資有效性進(jìn)行分類,采用分層隨機(jī)抽樣進(jìn)行數(shù)據(jù)劃分,從結(jié)果變量的各層面隨機(jī)抽取75%的數(shù)據(jù),從而組合成訓(xùn)練集,則剩余25%的數(shù)據(jù)為測試集。高斯核函數(shù)在SVM模型中應(yīng)用最為廣泛,因此本文選用高斯核函數(shù),將懲罰參數(shù)C設(shè)定為1,核函數(shù)參數(shù)g設(shè)定為默認(rèn)值,為特征變量維數(shù)的倒數(shù),預(yù)測結(jié)果如表3和圖2所示。

      表3 重慶市投資有效性分類預(yù)測結(jié)果表Table 3 Classification prediction results of investment effectiveness in Chongqing

      圖2 ROC曲線圖Fig.2 ROC curve

      最終,基于非期望SBM-SVM模型的重慶市工業(yè)投資有效性分類預(yù)測準(zhǔn)確率結(jié)果為71.88%,ROC曲線中AUC值為0.76,投資有效性精確率為66.7%,召回率為20%,其調(diào)和平均數(shù)為30.77%;投資無效性的精確率為72.4%,召回率為91.3%,其調(diào)和平均數(shù)為80.75%。其中分類準(zhǔn)確率和AUC值還有增大的空間,投資有效性的精確率和召回率都過低,特別是投資有效性的召回率僅為20%,因此需要對模型進(jìn)行優(yōu)化。

      投資有效性的召回率僅為20%,發(fā)現(xiàn)樣本數(shù)據(jù)經(jīng)過有效和無效分類后,存在不平衡情況,因此對樣本數(shù)據(jù)進(jìn)行人工數(shù)據(jù)合成處理,將樣本分類達(dá)到平衡狀態(tài)。隨后加入優(yōu)化模型對SVM模型的懲罰因子C和核函數(shù)參數(shù)g進(jìn)行尋優(yōu)。本文選用“試錯法”、粒子群算法(PSO)、遺傳算法(GA)分別對C和g優(yōu)化選取最優(yōu)值,根據(jù)眾多學(xué)者的研究及經(jīng)驗(yàn),在“試錯法”對支持向量機(jī)參數(shù)尋優(yōu)時(shí),懲罰參數(shù)C和高斯核函數(shù)參數(shù)g取值范圍為2-10≤C≤210,2-10≤g≤210,構(gòu)建出不同的參數(shù)組合,采用交叉驗(yàn)證的方法來獲得每次組合的錯誤偏差,最終選取誤差最優(yōu)的參數(shù)組合;粒子群算法優(yōu)化時(shí),參數(shù)取值范圍為 0.1≤C≤10,0.1≤g≤10 ;遺傳算法優(yōu)化時(shí),取值范圍為0.1≤C≤100,0.01≤g≤10,染色體數(shù)目為200,交配概率為0.4,突變概率為0.01,繁殖次數(shù)即循環(huán)次數(shù)為100。表4和圖3分別為3種方法尋找的參數(shù)C和g的最優(yōu)值和準(zhǔn)確率以及優(yōu)化后的ROC圖。

      表4 不同優(yōu)化模型的預(yù)測效果Table 4 Prediction effects of different optimization models

      圖3 優(yōu)化后ROC曲線圖Fig.3 ROC curve after optimization

      從表4和圖3的ROC圖及3種優(yōu)化方法的結(jié)果對比可以看出:3種優(yōu)化方法尋找SVM模型的懲罰參數(shù)C和核函數(shù)g對于預(yù)測效果具有有效性,3種方法都提高了預(yù)測準(zhǔn)確率。試錯法尋優(yōu)后,尋優(yōu)到的最佳懲罰因子C=1 024,核函數(shù)參數(shù)g=0.5,優(yōu)化后準(zhǔn)確率為86.6%, ROC曲線圖中的AUC值為0.92;投資有效性的精確率為100%,召回率為71.1%,其調(diào)和平均數(shù)為83.1%;投資無效性的精確率為80%,召回率為100%,其調(diào)和平均數(shù)為88.9%。PSO方法優(yōu)化后,尋優(yōu)到的最佳C=3.575 255 8,g=0.832 143 1,優(yōu)化后準(zhǔn)確率為88.66%,ROC曲線圖中的AUC值為0.935;投資有效性的精確率為90.5%,召回率為84.4%,其調(diào)和平均數(shù)為87.3%;投資無效性的精確率為87.3%,召回率為92.3%,其調(diào)和平均數(shù)為89.7%。GA方法優(yōu)化后, 尋優(yōu)到的最佳懲罰因子C=14.488 004,核函數(shù)參數(shù)g=1.144 978,準(zhǔn)確率為86.6%,ROC曲線圖中的AUC值為0.92;投資有效性的精確率為88.1%,召回率為82.2%,其調(diào)和平均數(shù)為85%;投資無效性的精確率為85.5%,召回率為90.4%,其調(diào)和平均數(shù)為87.9%。其中,PSO方法尋優(yōu)效果最佳,分類準(zhǔn)確率提高了16.78%,AUC值提高了17.5%,投資有效性精確率與召回率的調(diào)和平均數(shù)提高了56.53%,投資無效性精確率與召回率的調(diào)和平均數(shù)提高了8.95%,且最優(yōu)效果準(zhǔn)確率為88.66%,得到了比較理想的效果。說明新構(gòu)建的非期望SBM-SVM模型通過智能優(yōu)化算法改進(jìn)后對與重慶市工業(yè)投資有效性的分類研究是具有有效性和實(shí)用性的。

      5 結(jié) 論

      本文通過智能優(yōu)化算法對非期望SBM-SVM模型改進(jìn),對懲罰因子C和核函數(shù)參數(shù)g進(jìn)行尋優(yōu)處理,從而提高了模型的分類準(zhǔn)確率,提升了模型的性能;隨后基于非期望SBM-SVM模型及對其的改進(jìn),建立對工業(yè)行業(yè)投資有效性分類研究的新模型,選取重慶市2011—2020年規(guī)模以上工業(yè)企業(yè)的投資相關(guān)指標(biāo)和工業(yè)產(chǎn)出以及環(huán)境污染物排放相關(guān)指標(biāo)作為樣本數(shù)據(jù),將重慶市工業(yè)行業(yè)劃分為39個行業(yè)作為決策單元,通過非期望SBM模型得到工業(yè)內(nèi)部各行業(yè)的評價(jià)效率,將投資效率在0.98到1之間為名義數(shù)值1,作為投資有效代表,0到0.98之間為名義數(shù)值0,作為投資無效代表,把效率分為DEA相對有效和非DEA相對有效兩類,由非期望SBM模型的投入和產(chǎn)出指標(biāo)作為特征變量,兩類評價(jià)效率作為結(jié)果變量,構(gòu)建SVM模型,對重慶市工業(yè)投資有效性進(jìn)行分類研究,SVM模型高斯核函數(shù)的預(yù)測結(jié)果為71.88%;本文選擇“試錯法”、粒子群算法(PSO)、遺傳算法(GA)優(yōu)化模型選取SVM模型的懲罰因子C和核函數(shù)參數(shù)g的最優(yōu)值,最終結(jié)果表示PSO算法尋優(yōu)的效果最佳,預(yù)測準(zhǔn)確度優(yōu)化到了88.66%。對非期望SBM-SVM模型改進(jìn)后,模型的準(zhǔn)確率、AUC值、精確率和召回率及調(diào)和平均值都得到了提升,并達(dá)到了平衡,說明通過智能優(yōu)化算法對模型的改進(jìn)提升了模型的性能。投資有效性預(yù)測結(jié)果表明:采用構(gòu)建的新的非期望SBM-SVM模型對其改進(jìn)優(yōu)化后,進(jìn)行工業(yè)行業(yè)間投資有效性分類,具有一定的可行性和適用性。

      猜你喜歡
      決策分類工業(yè)
      為可持續(xù)決策提供依據(jù)
      分類算一算
      決策為什么失誤了
      分類討論求坐標(biāo)
      數(shù)據(jù)分析中的分類討論
      工業(yè)人
      黃河之聲(2018年5期)2018-05-17 11:30:01
      教你一招:數(shù)的分類
      掌握4大工業(yè)元素,一秒變工業(yè)風(fēng)!
      Coco薇(2015年10期)2015-10-19 12:51:50
      “工業(yè)4.0”之思考
      2003:工業(yè)經(jīng)濟(jì)高速穩(wěn)步增長
      分宜县| 托里县| 拜泉县| 高碑店市| 安乡县| 舞阳县| 宝鸡市| 光山县| 阿拉善盟| 张北县| 广汉市| 顺平县| 乐都县| 遵义市| 准格尔旗| 栾城县| 石楼县| 娱乐| 香港 | 元朗区| 新昌县| 右玉县| 甘肃省| 河西区| 宁波市| 涞源县| 平邑县| 浮山县| 鄂托克前旗| 即墨市| 河西区| 萝北县| 南漳县| 新闻| 汉沽区| 文水县| 揭东县| 扶绥县| 通江县| 静安区| 通道|