蔡玲嘉
摘要:機器學習是人工智能的核心,將其應用于企業(yè)審計中,提升企業(yè)審計智能化水平。研究從用戶、內(nèi)部業(yè)務流程、學習和成長、財務4個角度構(gòu)建了審計智能化評價指標,并采用經(jīng)典機器學習算法支持向量機建立企業(yè)智能化審計評價模型。為提升支持向量機模型性能,采用回溯搜索優(yōu)化算法對支持向量機核函數(shù)進行優(yōu)化,將構(gòu)建的模型與GA-SVM、PSO-SVM 進行對比。結(jié)果表明:BSA-SVM 模型的分類識別準確率最高為94.5%,同時迭代時間最短為36.28 s。
關(guān)鍵詞:支持向量機;回溯搜索優(yōu)化算法;智能化審計;技術(shù);建模
中圖分類號:TP391.9文獻標志碼:A文章編號:1001-5922(2023)05-0139-04
Optimizationof enterprisesintelligentauditmodeling basedonSVMmachinelearningtechnology
CAI Lingjia
(Audit Center of Guangdong Power Grid Co.,LTD.,Guangzhou 510060,China)
Abstract:Machine learning is the core of artificial intelligence,and it can be applied to the audit of enterprises to improve the level of enterprise audit intelligence. In this paper,intelligent audit evaluation indicators were con? structed from four perspectives:users,internal business processes,learning and growth,and finance,perspec? tives of users,internal business processes,learning and growth,and finance,then classical machine learning algo? rithm was used to support vector machines to establish an intelligent audit evaluation model for power enterprises. In order to improve the performance of the support vector machine model,a backtracking search optimization algo? rithm was used to optimize the kernel function of the support vector machine,and the constructed model was com? pared with GA-SVM and PSO-SVM.Results showed that the classification recognition accuracy of the BSA-SVM model is the highest 94.5%, and the shortest iteration time is 36.28.
Keywords:support vector machine;backtracking search optimization algorithm;intelligent audit
通過加強審計來嚴肅財經(jīng)法紀,反映企業(yè)資產(chǎn)、負債、盈虧真實情況,為企業(yè)下一步的決策提供精準的數(shù)據(jù)參考。機器學習技術(shù)的快速發(fā)展使得企業(yè)審計智能化成為大勢所趨,而部分企業(yè)審計智能化水平比較低,在激烈的企業(yè)競爭中處于不利的地位。有機硅材料、橡膠等在電力行業(yè)中應用十分廣泛,同時審計水平不高,會使得企業(yè)的經(jīng)營決策不科學,增加企業(yè)的經(jīng)營風險[2]。為充分發(fā)揮企業(yè)審計的作用,必須持續(xù)提升企業(yè)審計的智能化水平。有報道,采用粒子群算對卷積神經(jīng)網(wǎng)絡進行改進,提出了改進卷積神經(jīng)網(wǎng)絡的故障診斷算法,并將其應用于化工故障診斷中,其平均故障檢出率高達91.2%[3]。引入機器學習算法構(gòu)建了一種海上蒸發(fā)波導特性智能化預測的模型,該模型的實際偏差小,相對誤差小,在提高我國區(qū)域范圍內(nèi)預測蒸發(fā)波導高度準確率方面具有良好性能[4]。支持向量機(SVM)作為經(jīng)典機器學習算法,其性能受到參數(shù)的影響比較大,獲取SVM 最佳參數(shù)是關(guān)鍵,也引起了學術(shù)界廣泛關(guān)注[5]。本研究采用回溯搜索優(yōu)化算法(BSA)對 SVM 參數(shù)優(yōu)化,得到 BSA-SVM 模型,并將其應用于企業(yè)智能化審計中,期待對提升審計工作效率和質(zhì)量提供參考。
1 企業(yè)審計智能化構(gòu)建
審計工作在企業(yè)管理中發(fā)揮著至關(guān)重要的作用,審計工作的智能化水平直接影響到審計工作開展的效率和質(zhì)量,進而影響到企業(yè)的發(fā)展??茖W制定企業(yè)審計智能化評價指標直接影響到審計工作質(zhì)量的提升,通過提升企業(yè)審計的智能化水平來達到降低企業(yè)審計成本的目的。采用平衡計分卡方法構(gòu)建企業(yè)審計智能化水平評價指標,具體如圖1所示。
2 基于SVM機器學習的審計智能化模型
2.1 SVM 算法
SVM 是經(jīng)典的機器學習算法,其按照監(jiān)督學習的方式對數(shù)據(jù)分類,屬于二元廣義分類器。目前,SVM 在文本分類、績效考核、人臉識別等領(lǐng)域得到了廣泛的應用[6-7]。SVM 算法數(shù)學性能優(yōu)良,實際工程應用效果好,引起了學術(shù)界的廣泛關(guān)注。SVM 算法對樣本分類的過程是確定分類超平面的過程,其目標是尋找最優(yōu)超平面;二維狀態(tài)下的最優(yōu)超平面如圖2所示。
不妨設(shè)企業(yè)審計智能化水平評價指標與評價結(jié)果構(gòu)成數(shù)據(jù)集合 D ,即
式中:xi 為審計智能化水平評價指標所構(gòu)成的向量;yi e {<1 , 1}為審計智能化水平評價結(jié)果。不妨設(shè)最優(yōu)分類超平面方程為[8]:
式中:x 為最優(yōu)分類超平面法向量;b 為偏置位移。
SVM 算法的核心問題是求解 x 和 b ,使得樣本D 滿足[9]: {
由于并非所有的樣本均能夠被正確分割,通過引入懲罰系數(shù)和松弛變量的方式來求解。在引入松弛變量之后,少部分的樣本點可以在邊界線上,同時當樣本數(shù)據(jù)被錯誤劃分或者具有比較多的樣本點在邊界線上時實施懲罰,這樣來確保邊距的最大化要求,懲罰系數(shù)的大小直接反映了懲罰的強度。在引入懲罰系數(shù) C 和松弛變量ε之后,求解 x 和 b 可以轉(zhuǎn)化為最小值求解問題,即[10]:
為了便于求解,引入拉格朗日乘子 ai ,其拉格朗日函數(shù)為:
最小值求解問題轉(zhuǎn)化為對偶問題,即:
對線性不可分割的樣本數(shù)據(jù),引入核函數(shù)將線性不可分割樣本升維,達到在高維空間樣本線性可分的目的。徑向基核函數(shù)是常用的核函數(shù),其表達式為[11]:
引入核函數(shù)后,決策函數(shù)為[12]:
很明顯,核函數(shù)參數(shù)(g)以及懲罰系數(shù)(C)對 SVM 的性能具有至關(guān)重要的影響,要通過優(yōu)化算法對參數(shù)組合(C ,g)進行優(yōu)化,從而提高SVM 的分類性能。
2.2BSA 算法
BSA 是Civicioglu P 提出的種群元啟發(fā)式優(yōu)化算法,算法的框架和差分進化算法類似;但是變異、交叉操作和差分進化算法存在本質(zhì)的不同[13],其相對于差分進化算法全局尋優(yōu)能力更強,收斂效率更高。 BSA有記憶種群功能,這使得算法具有優(yōu)良的挖掘歷史信息能力;BSA流程如圖3所示[14]。
2.2.1 種群初始化
BSA 初始化與差分進化算法不同,其是對種群(P)和歷史種群(oldP)的初始化。設(shè)種群大小為 NP ,問題維數(shù)為 D ,那么 P 和oldP均是NPx D 的矩陣,在矩陣中的每一行均是優(yōu)化問題的一個解。
Pi.j和oldPi.j為矩陣第i行、j 列的元素,搜索空間區(qū)域為[l . u]; lj和uj為第j 維分空間的上界與下界,種群初始化過程為[15]:
式中:r1和 r2為區(qū)間(0.1)上的隨機數(shù)。
2.2.2 選擇Ⅰ
選擇Ⅰ操作用來選擇一個新的歷史種群oldP,即[16]
式中:r3和r4為區(qū)間(0.1)上服從均勻分布的隨機數(shù)。
在變異方程中,oldP是引導種群,選擇Ⅰ使得oldP可以選擇當代的種群,也可以選擇當代之前的任何一代歷史種群,這使得BSA 的全局尋優(yōu)性能大大提升。
2.2.3 變異
在確定oldP之后,對oldP中的個體隨機排序,并且重新賦予oldP,實施變異操作,即
式中:F 為變尺度系數(shù)。
變尺度系數(shù)(F)用于對搜索方向矩陣(oldP一 P)的幅度進行控制,其服從正態(tài)分布,即
2.2.4 交叉
通過交叉操作產(chǎn)生最終的實驗種群(T),BSA 的交叉策略有2種方式:第1種方式為任意選擇一維,對原個體和同位置變異個體該維上的元素進行交換;第2種方式為每一行生成一個[1.2.….D]的隨機重排sorti(D),任意選取ni作為交叉長度[17]:
式中:mix rate 為交叉概率;r(i)是區(qū)間(0.1)上的隨機數(shù);D 是問題維度。
BSA的交叉操作為2種交叉策略等概率隨機調(diào)用。
2.2.5 選擇Ⅱ
對 P 和 T 的同位置行向量進行大小比較,結(jié)合適應度值來競賽選擇。對于極小值優(yōu)化求解問題,選擇Ⅱ算子描述為[18]:
2.3 審計智能化水平優(yōu)化模型
采用BSA 對SVM 的參數(shù)組合(C .g)進行優(yōu)化,得到BSA-SVM 模型,并將該模型應用于電力企業(yè)審計智能化水平評價中;電力企業(yè)審計智能化水平評價模型如圖4所示。
3 實例分析
3.1 數(shù)據(jù)來源
企業(yè)內(nèi)部審計作為最重要的職能部門之一,在企業(yè)經(jīng)營風險識別、風險度量、風險管理、內(nèi)部控制、流程優(yōu)化等方面發(fā)揮著至關(guān)重要的作用。數(shù)據(jù)來源于某電力企業(yè),通過問卷調(diào)查以及具體的數(shù)據(jù)作為輸入和輸出數(shù)據(jù)。由于有的數(shù)據(jù)為定量化數(shù)據(jù),有的數(shù)據(jù)為定性化數(shù)據(jù),需要對定性化數(shù)據(jù)進行量化處理,最終統(tǒng)一轉(zhuǎn)化為定量數(shù)據(jù)。不同的評價指標存在量綱差異,這會造成BSA-SVM 模型訓練的誤差大、效率低等問題。對定量數(shù)據(jù)進行歸一化處理,將歸一化處理后的數(shù)據(jù)作為模型的數(shù)據(jù)來源。
3.2 收斂性對比
不同的智能優(yōu)化算法對SVM 參數(shù)組合(C .g)的優(yōu)化性能存在一定的差別,對比 BSA、遺傳算法(GA)、粒子群算法(PSO)的優(yōu)化性能,設(shè)置迭代次數(shù)為200,對比GA-SVM[19]、PSO-SVM[20]和BSA-SVM 之3種模型的分類準確率尋優(yōu)過程,結(jié)果如圖5所示。
從圖5可以看出,BSA對SVM的優(yōu)化效果明顯優(yōu)于GA 和PSO,在經(jīng)過4次迭代之后就獲得了最優(yōu)值。與BSA 相比,GA 優(yōu)化SVM 所得到的GA-SVM 模型的分類準確率比較低,陷入了局部最優(yōu)狀態(tài)。PSO 相對于GA 的收斂速度比較快,但是PSO-SVM 更加容易陷入局部最優(yōu)的狀態(tài)。由此可見,采用BSA 優(yōu)化SVM 參數(shù)組合(C .g)具有收斂速度快、準確性高的優(yōu)點。
3.3 優(yōu)化結(jié)果對比
分別采用 GA、PSO、BSA 對 SVM 的參數(shù)組合(C .g)進行優(yōu)化,并將優(yōu)化得到的參數(shù)作為SVM的最優(yōu)參數(shù)。采用訓練數(shù)據(jù)分別對GA-SVM、PSO-SVM、 BSA-SVM 進行訓練,并采用測試數(shù)據(jù)對訓練好的模型進行測試,優(yōu)化和測試結(jié)果對比如表1所示。
由表1可知,BSA-SVM 對企業(yè)審計智能化水平評價的識別準確率為94.5%,明顯高于 GA-SVM、 PSO-SVM,識別準確率分別提高了4.3%和8.2%。從迭代的時間來看,BSA-SVM 模型的時間也最短,為36.28 s,比GA-SVM模型縮短了33.58 s,比PSO-SVM 模型縮短了20.5 s。通過對比3種模型的識別準確率和迭代時間,BSA-SVM 模型對企業(yè)審計智能化水平的評價具有十分明顯的優(yōu)勢。
采用BSA-SVM 模型對企業(yè)審計智能化水平進行評價,實際和預測結(jié)果對比如圖6所示。
4 結(jié)語
從4個維度構(gòu)建了審計智能化水平評價指標,并采用BSA 對SVM 參數(shù)優(yōu)化,提出了基于BSA-SVM 的企業(yè)審計智能化水平評價模型。通過與 GA-SVM、 PSO-SVM模型的對比,BSA-SVM對電力企業(yè)審計智能化水平評價的識別準確率為94.5%,明顯高于 GA-SVM、PSO-SVM,識別準確率分別提高了4.3%和8.2%。BSA-SVM 模型的迭代時間也最短,為36.28 s,比GA-SVM 模型縮短了33.58,比PSO-SVM 模型縮短了20.5 s。結(jié)果表明,所提出的BSA-SVM 審計智能化水平評價模型,明顯優(yōu)于其他模型。
【參考文獻】
[1] 萬嬋.電力企業(yè)數(shù)據(jù)資產(chǎn)監(jiān)控體系的建立[J].粘接,2020,42(6):73-77.
[2] 張侃,張浩海,顧新橋,等.基于A-Workflow的電力倉儲化資產(chǎn)盤活方法研究[J].粘接,2021,46(5):164-168.
[3] 許洪光,李鳳英,郭茜.機器學習算法改進及在化工故障診斷中的應用[J].粘接,2022,49(5):85-89.
[4] 石廣亮,楊鋮,王健.基于機器學習的海上蒸發(fā)波導特性智能化預測[J].指揮與控制學報,2022,8(2):198-205.
[5] 張蜀紅.基于支持向量機的機械設(shè)備故障診斷研究[J].粘接,2021,47(9):129-132.
[6] 徐竟?jié)?,吳作宏,徐巖,等.融合PCA、LDA 和SVM 算法的人臉識別[J].計算機工程與應用,2019,55(18):34-37.
[7] 朱亞軍,次曲,擁措.基于SVM 算法的藏文微博情感分析研究[J].計算機仿真,2022,39(8):226-229.
[8] 裴愛根,張洋,黃濤,等.基于支持向量機激光技術(shù)提取電力線信息的研究[J].粘接,2022,49(12):155-159.
[9] 王濤,李治軍. PSO-SVM 模型在黑龍江省水資源承載力評價中的應用[J].水電能源科學,2023,41(1):30-33.
[10] 王昱琛,楊仕教,郭欽鵬,等.基于MPA-SVM的煤礦拋擲爆破爆堆形態(tài)預測[J].爆破器材,2023,52(1):58-64.
[11] 丁茜,趙曉東,吳鑫俊,等.基于RBF 核的多分類SVM 滑塌易發(fā)性評價模型[J].中國安全科學學報,2022,32(3):194-200.
[12] 徐超,孫金莉,楊郡,等.基于分布式支持向量機的電網(wǎng)錯誤數(shù)據(jù)注入檢測法[J].粘接,2023,50(2):188-192.
[13] 魏鋒濤,史云鵬,石坤.具有組合變異策略的回溯搜索優(yōu)化算法[J].計算機工程與應用,2020,56(9):41-47.
[14] 韓宇,孫志鵬,黃睿,等.基于回溯搜索算法的灌區(qū)優(yōu)化配水模型[J].工程科學與技術(shù),2020,52(1):29-37.
[15] 薛博水,陳杰,趙四洪,等.基于諧波特征和BSA 優(yōu)化的非侵入式負荷識別算法研究[J].昆明理工大學學報(自然科學版),2022,47(5):113-120.
[16] 吳忠強,尚夢瑤,申丹丹,等.基于BSA-RELM 的純電動汽車鋰離子電池SOC估計[J].計量學報,2019,40(4):693-699.
[17] 尚秋峰,郭家興.基于VMD-BSA-SVM 的海纜振動信號識別方法[J].激光與光電子學進展,2022,59(17):65-74.
[18] 李占英,時應虎,張海傳,等.基于RBF-BSA的鋰離子電池SOC 混合估算算法[J].華中科技大學學報(自然科學版),2019,47(12):67-72.
[19] 楊曉炳,閆澤鵬,尹升華,等.基于GA-SVM 的鋼渣基膠凝材料開發(fā)及料漿配比優(yōu)化[J].工程科學學報,2022,44(11):1897-1908.
[20] 鄒紅波,宋家樂,劉媛,等.基于PSO-SVM 算法的輸電線路覆冰舞動預測模型[J].振動與沖擊,2023,42(3):280-286.