徐菁鴻 臧英杰
摘? 要: 常規(guī)的聚類算法由于不具備全局性的分析能力,導(dǎo)致企業(yè)效率提升效果較差。為此,研究蟻群優(yōu)化聚類算法在企業(yè)效率提升方面的應(yīng)用。該算法在論域空間建立最大近鄰粗糙集,獲取影響企業(yè)效率提升的因素基本特征;通過設(shè)置蟻群算法二維網(wǎng)格定義相似度參數(shù),計(jì)算數(shù)據(jù)的撿拾概率和遺棄概率;根據(jù)算法的4個(gè)聚類階段,實(shí)現(xiàn)對(duì)企業(yè)資源的合理分配,從而提升企業(yè)效率。實(shí)驗(yàn)結(jié)果表明:與3種常規(guī)方法相比,所提算法具有極強(qiáng)的全局性分析能力,因而在企業(yè)效率提升方面的應(yīng)用效果更佳。由此可見,蟻群優(yōu)化聚類算法的應(yīng)用更能滿足企業(yè)的發(fā)展現(xiàn)狀。
關(guān)鍵詞: 蟻群優(yōu)化聚類算法; 企業(yè)效率; 粗糙集; 相似度; 撿拾概率; 遺棄概率; 聚類與分配
中圖分類號(hào): TN911.1?34; TP391.4? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)17?0151?04
Abstract: The conventional clustering algorithms lack the ability of global analysis, which leads to poor effect of efficiency improvement. Therefore, the application of ant colony optimization clustering algorithm in the improvement of enterprise efficiency is studied. In the proposed algorithm, the largest neighbor rough set is built in the universe to obtain the basic characteristics of the factors that affect the improvement of enterprise efficiency. The two?dimensional grid of ant colony algorithm is set to define the similarity parameters for the calculation of picking?up probability and abandonment probability of data. According to the 4 clustering stages of the algorithm, the rational allocation of enterprise resources is realized, thus the enterprise efficiency is improved. The experimental results show that, in comparison with the 3 conventional methods, the proposed algorithm has powerful global analysis ability, so it has a better application effect in the improvement of enterprise efficiency. Thus it can be seen that the ant colony optimization clustering algorithm can better meet the development of enterprise.
Keywords: ant colony optimization clustering algorithm; enterprise efficiency; rough set; similarity; picking?up probability; abandonment probability; clustering and allocation
0? 引? 言
隨著科技手段的不斷成熟,越來越多的企業(yè)走向系統(tǒng)化、一體化的發(fā)展方向,形成更具有自身特色的產(chǎn)業(yè)結(jié)構(gòu)鏈。企業(yè)生產(chǎn)運(yùn)作的最終目的就是獲取最大的經(jīng)濟(jì)效益,通過豐厚的收入優(yōu)化企業(yè)生產(chǎn)與運(yùn)營(yíng)方式,建立一個(gè)高效的生產(chǎn)體系。由于企業(yè)效益與效率之間是相互依存、相互支撐的關(guān)系,因此,為保證企業(yè)經(jīng)濟(jì)效益,文獻(xiàn)[1]提出基于數(shù)據(jù)挖掘的算法,通過模糊分析影響企業(yè)效率因素,提升企業(yè)效率。文獻(xiàn)[2]結(jié)合影響因素熵,通過多種群博弈蟻群算法,找出企業(yè)效益與效率之間的關(guān)系,以此實(shí)現(xiàn)效率提升。文獻(xiàn)[3]則利用蟻群算法的多條路徑,類比分析歷史影響因素特征,得出可以提升企業(yè)效率的參數(shù)。
但在實(shí)際應(yīng)用中,3種常規(guī)方法并沒有明顯提升企業(yè)效率,因而針對(duì)這一問題,分析蟻群優(yōu)化聚類算法在企業(yè)效率提升方面的應(yīng)用。蟻群優(yōu)化聚類算法是一種處理效率較高的算法,該算法通過特征提取、層次劃分以及聚類分析手段,實(shí)現(xiàn)對(duì)影響企業(yè)效率的因素劃分,從第一環(huán)節(jié)找到可以改善企業(yè)效率的影響參數(shù),提升企業(yè)在生產(chǎn)環(huán)節(jié)、加工環(huán)節(jié)、配送環(huán)節(jié)以及服務(wù)等環(huán)節(jié)的工作效率,以及在人力資源管理和企業(yè)運(yùn)營(yíng)模式等方面的工作效率,推動(dòng)企業(yè)快速發(fā)展。
1? 蟻群優(yōu)化聚類算法及其應(yīng)用
在企業(yè)效率提升方面引入蟻群優(yōu)化聚類算法,利用該算法的數(shù)據(jù)獲取、處理、分析環(huán)節(jié),對(duì)影響企業(yè)效率的因素展開詳細(xì)分析,明確影響因素之間的關(guān)聯(lián)程度、影響因素與效率之間的關(guān)聯(lián)程度,從表層和深層兩方面入手,實(shí)現(xiàn)企業(yè)效率的提升。
1.1? 基于最大近鄰粗糙集獲取影響效率因素特征
蟻群優(yōu)化聚類算法應(yīng)用的第一步,就是利用該算法中的論域,建立一個(gè)最大近鄰粗糙集,獲取常規(guī)因素、異常因素的特征參量。粗糙數(shù)據(jù)集利用已知影響條件,描述不確定的影響因素,發(fā)現(xiàn)數(shù)據(jù)的潛在特點(diǎn)。假設(shè)論域是影響因素等相關(guān)數(shù)據(jù)的非空集合,用字母[W]表示,根據(jù)該集合將研究的影響數(shù)據(jù)進(jìn)行分類,將特征性相似或不同的數(shù)據(jù)歸結(jié)為對(duì)象相同或者不同的類簇子集,子集可用[w1,w2,…,wi]予以表示[4]。粗糙數(shù)據(jù)集在此論域空間上,對(duì)集合中的因素按照等價(jià)關(guān)系劃分,其中類目相同且差距較小的數(shù)據(jù)關(guān)系,稱之為不可辨關(guān)系[5]。假設(shè)給定一個(gè)論域[U],用[γi]表示該論域[U]中的等價(jià)關(guān)系;設(shè)置[xi]為[U]中的對(duì)象,[u1,u2,…,ui]為論域[U]的子集,判斷屬于[ui]的數(shù)據(jù)[xi]組成的最大集合[umax],該集合為集合[ui]關(guān)于等價(jià)關(guān)系[γi]的上逼近;而與[ui]相交的非空等效并集為最小集合[umin],此時(shí),稱之為集合[ui]關(guān)于等價(jià)關(guān)系[γi]的下逼近[6]。
粗糙集特征提取過程如圖1所示。
通過上述提取過程,得出影響因素特征參量,該參量可以利用下列公式描述:
式中:[qixi]表示第[i]個(gè)論域子集上的粗糙集在等價(jià)關(guān)系約束下的特征參量;[xi]表示影響企業(yè)效率的變量因子;[a]表示該因素的表層影響關(guān)系;[b]表示該因素的深層影響關(guān)系;[Δxai,xbi]表示不同關(guān)聯(lián)深度下的挖掘系數(shù)[7]。通過式(1)得到具有相似特征的影響參量,為定義相似度提供精確的數(shù)據(jù)。
1.2? 定義相似度參數(shù)計(jì)算數(shù)據(jù)撿拾和遺棄概率
根據(jù)特征數(shù)據(jù)[qixi]定義影響因素相似度,從而計(jì)算影響因素的撿拾和遺棄概率。選取兩個(gè)可用范數(shù),在向量[y1]和[y2]之間設(shè)置一個(gè)相似度,用[gy1,y2]表示。對(duì)于一些實(shí)值向量,采用歐幾里得距離作為兩個(gè)向量間的相似度度量依據(jù),形成兩個(gè)極值化的組間距離,即最大距離之間被完全分割,最小距離之間的數(shù)據(jù)向量間距極小,形成稠密緊湊的數(shù)據(jù)組[8]。將特征數(shù)據(jù)以節(jié)點(diǎn)的形式放置到二維網(wǎng)格上,如圖2所示。
圖2中的帶框區(qū)域是對(duì)最小距離的標(biāo)注,其他則為隨意距離和最大距離節(jié)點(diǎn)。在觀察不同路徑的周圍區(qū)域時(shí),通過該算法建立一個(gè)捕獲位置節(jié)點(diǎn)[d],對(duì)周圍網(wǎng)格所示的[n×n]區(qū)域獲取最優(yōu)路徑,得到最優(yōu)相似度參數(shù)[9]。假設(shè)螞蟻在[t0]時(shí)刻所處的位置為[d],對(duì)具有同樣相似特征數(shù)據(jù)的路徑進(jìn)行串聯(lián),得到的相似度結(jié)果為:
式中:[ω]表示相似數(shù)值;[L]表示根據(jù)歐幾里得距離函數(shù)捕捉特征量相似范數(shù)的最優(yōu)路徑;[n]表示區(qū)域面積[10]。根據(jù)該相似度的具體取值,得出對(duì)影響因素的撿拾概率和遺棄概率:
式中:[p1]表示撿拾概率;[p2]表示遺棄概率;[λ1]表示淺層影響數(shù)據(jù)之間的關(guān)聯(lián)程度;[λ2]表示深層影響數(shù)據(jù)之間的關(guān)聯(lián)程度。
利用該算法對(duì)最優(yōu)路徑選擇分析,實(shí)現(xiàn)對(duì)企業(yè)效率提升因素的獲取,剔除對(duì)企業(yè)效率提升沒有幫助的其他因素[11]。
1.3? 聚類效率影響因素實(shí)現(xiàn)企業(yè)資源合理分配
根據(jù)撿拾概率得到可以提升企業(yè)效率的因素,設(shè)蟻群為[antM],該算法中的螞蟻數(shù)量為[M],每個(gè)螞蟻的所在位置均為一個(gè)[m]維的向量,可表示為[antρt],其中,[1≤ρ≤M],且[ρ]為自然數(shù)[12?13]。令蟻群從圖2中的任意位置展開搜索,即對(duì)[antρ1t,antρ2t,…,antρnt]初始賦值;然后允許螞蟻在設(shè)定范圍內(nèi)自由搜索,讓[antρt]值在[n]次迭代中不斷變化,直到完成聚類。該因素聚類過程可分為如圖3所示的4個(gè)階段[14]。
根據(jù)聚類結(jié)果,得到影響因素的最優(yōu)目標(biāo)函數(shù),經(jīng)計(jì)算得出影響因素的最大指標(biāo)。企業(yè)可根據(jù)該指標(biāo)在產(chǎn)品生產(chǎn)與加工環(huán)節(jié)、人力資源使用環(huán)節(jié)以及企業(yè)管理體系等方面做出嚴(yán)格調(diào)整,設(shè)置效率最大化的企業(yè)管理模式,實(shí)現(xiàn)蟻群優(yōu)化聚類算法在企業(yè)效率提升方面的應(yīng)用效果,促進(jìn)企業(yè)協(xié)調(diào)發(fā)展[15]。
2? 實(shí)驗(yàn)測(cè)試
將蟻群優(yōu)化聚類算法應(yīng)用到企業(yè)的實(shí)際管理中,通過實(shí)驗(yàn)平臺(tái)分析該算法的應(yīng)用效果。為保證實(shí)驗(yàn)結(jié)果具有直觀性和說服性,將文獻(xiàn)中提到的3種方法引入到此次實(shí)驗(yàn)測(cè)試中,分析4種方法對(duì)企業(yè)效率提升的影響差異,得出實(shí)驗(yàn)結(jié)論。
2.1? 實(shí)驗(yàn)準(zhǔn)備過程
將測(cè)試軟件載入到測(cè)試平臺(tái)中,隨機(jī)選擇一個(gè)成立10年以上的企業(yè)作為實(shí)驗(yàn)對(duì)象,將該企業(yè)5年內(nèi)的各項(xiàng)生產(chǎn)數(shù)據(jù)、管理數(shù)據(jù)、效益數(shù)據(jù)以及人力資源管理數(shù)據(jù)等資料,上傳到測(cè)試系統(tǒng)中,作為實(shí)驗(yàn)測(cè)試基礎(chǔ)數(shù)據(jù),將不同類型的數(shù)據(jù)包進(jìn)行分類,每一數(shù)據(jù)的屬性編號(hào)和對(duì)應(yīng)的屬性名稱如表1所示。
上述數(shù)據(jù)準(zhǔn)備完畢后,將數(shù)據(jù)包中的數(shù)據(jù)投放到一個(gè)二維平面中,采集位置重合的數(shù)據(jù),如圖4所示。
數(shù)據(jù)采集空間設(shè)置完畢后,分別將4種實(shí)驗(yàn)測(cè)試算法應(yīng)用到該測(cè)試系統(tǒng)中,對(duì)表中的數(shù)據(jù)包進(jìn)行特征提取、數(shù)據(jù)分類以及關(guān)聯(lián)挖掘,并得出測(cè)試結(jié)果。
2.2? 測(cè)試結(jié)果與分析
隨機(jī)挑選屬性不同的數(shù)據(jù)包作為實(shí)驗(yàn)對(duì)象,將本文所提出算法的應(yīng)用結(jié)果為實(shí)驗(yàn)A組,文獻(xiàn)[1?3]提出的3種常規(guī)算法的實(shí)驗(yàn)結(jié)果分別為實(shí)驗(yàn)B組、實(shí)驗(yàn)C組和實(shí)驗(yàn)D組,測(cè)試結(jié)果如圖5所示。
圖5中的[P1~P7]表示7個(gè)不同方向的企業(yè)效率。分析圖5可知:所提出算法在測(cè)試實(shí)驗(yàn)中,對(duì)于每一方向上的企業(yè)效率提升均有極高的應(yīng)用效果,可見該算法應(yīng)用下對(duì)企業(yè)效率提升,具有全局性的影響能力;而文獻(xiàn)[1]的算法只對(duì)[P1]和[P6]方向上的企業(yè)效率提升具有提升作用;文獻(xiàn)[2]只對(duì)[P6]方向上的企業(yè)效率有提升作用;而文獻(xiàn)[3]雖然對(duì)大多數(shù)方向上的企業(yè)效率提升有所幫助,但仍不具備全局性的特點(diǎn)。綜合實(shí)驗(yàn)測(cè)試結(jié)果可知,所提出的算法更具備全局性特點(diǎn),而文獻(xiàn)中提到的3種常規(guī)方法只能提升企業(yè)在部分環(huán)節(jié)上的效率。
3? 結(jié)? 語(yǔ)
通過找出常規(guī)算法應(yīng)用的不足,引入蟻群優(yōu)化聚類算法,研究該算法在企業(yè)效率提升方面的應(yīng)用效果。通過詳細(xì)的計(jì)算,得出影響數(shù)據(jù)之間的隱含關(guān)聯(lián),根據(jù)這些關(guān)聯(lián)數(shù)據(jù)調(diào)整企業(yè)運(yùn)行現(xiàn)狀,實(shí)現(xiàn)對(duì)企業(yè)全局的效率提升。此次研究不僅為企業(yè)效率提升提供了創(chuàng)新思路,同時(shí)也為學(xué)習(xí)、工作等效率提升問題提供了一個(gè)科學(xué)的研究方向。今后還要將該算法進(jìn)一步優(yōu)化,完善該算法在其他領(lǐng)域內(nèi)的應(yīng)用效果。
參考文獻(xiàn)
[1] 郭俊鳳,齊景嘉.基于數(shù)據(jù)挖掘算法的決策支持系統(tǒng)的優(yōu)化研究[J].科技通報(bào),2018,34(3):192?194.
[2] 陳佳,游曉明,劉升,等.結(jié)合信息熵的多種群博弈蟻群算法[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(16):170?178.
[3] 鄭延斌,王林林,席鵬雪,等.動(dòng)態(tài)環(huán)境下改進(jìn)蟻群算法的多Agent路徑規(guī)劃[J].計(jì)算機(jī)工程與科學(xué),2019,41(6):1078?1085.
[4] 趙曉君,張立梅,杜坤.基于聚類算法和粗糙集理論的分布式電源狀態(tài)約簡(jiǎn)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2019,31(5):103?109.
[5] 范年柏,張寧,孫濤.變精度粗糙集推廣模型及其性質(zhì)研究[J].計(jì)算機(jī)應(yīng)用研究,2018,35(5):1399?1402.
[6] 余修武,劉琴,李向陽(yáng),等.基于改進(jìn)蟻群的BP神經(jīng)網(wǎng)絡(luò)WSN數(shù)據(jù)融合算法[J].北京郵電大學(xué)學(xué)報(bào),2018,41(4):91?96.
[7] 唐新宇,張新政.基于大數(shù)據(jù)的激光光柵數(shù)據(jù)特征挖掘算法[J].激光雜志,2019,40(7):107?111.
[8] 朱艷,游曉明,劉升.基于啟發(fā)式機(jī)制的改進(jìn)蟻群算法[J].信息與控制,2019,48(3):265?271.
[9] 鄭本立,李躍輝.基于改進(jìn)蟻群算法的SDN網(wǎng)絡(luò)負(fù)載均衡研究[J].計(jì)算機(jī)科學(xué),2019,46(z1):291?294.
[10] 張碩望,歐陽(yáng)純萍,陽(yáng)小華,等.融合《知網(wǎng)》和搜索引擎的詞匯語(yǔ)義相似度計(jì)算[J].計(jì)算機(jī)應(yīng)用,2017,37(4):1056?1060.
[11] 董書琴,張斌.一種面向流量異常檢測(cè)的概率流抽樣方法[J].電子與信息學(xué)報(bào),2019,41(6):1450?1457.
[12] 唐益明,豐剛永,任福繼,等.面向結(jié)構(gòu)復(fù)雜數(shù)據(jù)集的模糊聚類有效性指標(biāo)[J].電子測(cè)量與儀器學(xué)報(bào),2018,32(4):119?127.
[13] 劉欣.基于抖動(dòng)策略優(yōu)化的云計(jì)算安全調(diào)度方案[J].控制工程,2018,25(5):889?896.
[14] 周亞勤,楊長(zhǎng)祺,呂佑龍,等.雙資源約束的航天結(jié)構(gòu)件車間生產(chǎn)調(diào)度方法[J].機(jī)械工程學(xué)報(bào),2018,54(9):55?63.
[15] 劉層層,李南,張欽.中國(guó)光伏上市企業(yè)效率的實(shí)證分析:基于IAHP保證域的DEA模型[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2019,49(5):20?30.