董翔英, 呂亞飛, 鄒饒邦彥
(1. 軍事交通學(xué)院軍用車輛系, 天津 300161; 2. 軍事交通學(xué)院研究生管理大隊(duì), 天津 300161)
基于數(shù)據(jù)挖掘的車輛器材倉(cāng)庫(kù)庫(kù)存結(jié)構(gòu)分析
董翔英1, 呂亞飛2, 鄒饒邦彥2
(1. 軍事交通學(xué)院軍用車輛系, 天津 300161; 2. 軍事交通學(xué)院研究生管理大隊(duì), 天津 300161)
針對(duì)后方車輛器材倉(cāng)庫(kù)庫(kù)存車型結(jié)構(gòu)、庫(kù)存器材品種結(jié)構(gòu)和數(shù)量結(jié)構(gòu)不合理問(wèn)題,以車輛器材實(shí)際消耗的歷史數(shù)據(jù)為挖掘?qū)ο?,?yīng)用K-均值聚類算法和BP神經(jīng)網(wǎng)絡(luò),建立了基于數(shù)據(jù)挖掘的定品種、定數(shù)量的庫(kù)存結(jié)構(gòu)分析模型,并利用R語(yǔ)言對(duì)所建模型進(jìn)行了驗(yàn)證,為確定車輛器材的庫(kù)存品種結(jié)構(gòu)和數(shù)量結(jié)構(gòu)提供了理論支撐。
車輛器材倉(cāng)庫(kù); 庫(kù)存結(jié)構(gòu); 數(shù)據(jù)挖掘; R語(yǔ)言
后方車輛器材倉(cāng)庫(kù)(簡(jiǎn)稱“倉(cāng)庫(kù)”)是實(shí)施車輛器材供應(yīng)保障的基地,對(duì)提高車輛裝備的保障能力具有重要作用,其基本任務(wù)是組織車輛器材的接收、保管和發(fā)放等業(yè)務(wù)以及管理活動(dòng)。庫(kù)存結(jié)構(gòu)是指在一定庫(kù)存中,各器材的品種和數(shù)量構(gòu)成的相互比例關(guān)系,主要包括各器材品種、數(shù)量所占比例以及單品種數(shù)量所占比例。庫(kù)存結(jié)構(gòu)主要采用庫(kù)存車型、各車型器材品種和數(shù)量3類參數(shù)來(lái)描述。因此在編制車輛器材周轉(zhuǎn)量計(jì)劃時(shí),要進(jìn)行“三定”,即定品種、定數(shù)量、定總值,以確保庫(kù)存結(jié)構(gòu)的合理性,使庫(kù)存器材結(jié)構(gòu)和車輛維修所需器材的實(shí)際消耗相匹配,既滿足器材消耗需求,又避免積壓浪費(fèi),使有限的周轉(zhuǎn)器材發(fā)揮最大的軍事和保障效益。目前,各倉(cāng)庫(kù)的庫(kù)存結(jié)構(gòu)基本能滿足各保障單位對(duì)車輛維修器材的需求,能完成車輛維修保障任務(wù),但由于人員崗位輪換性大、器材消耗規(guī)律難以掌握等問(wèn)題,現(xiàn)有的器材庫(kù)存結(jié)構(gòu)與車輛維修保障的實(shí)際需求仍有一定偏差,難以達(dá)到現(xiàn)代化后勤的“精確化保障”要求。
國(guó)內(nèi)對(duì)庫(kù)存器材的分類主要采用ABC分類法,如羅雪等[1]利用層次分析法建立了一套包含器材籌備難易程度、關(guān)鍵程度及經(jīng)濟(jì)性的評(píng)價(jià)指標(biāo)對(duì)器材進(jìn)行ABC分類;郭智敏等[2]基于器材的損耗規(guī)律、籌措敏捷度及關(guān)鍵程度將器材歸為ABCD四類。ABC分類法具有一定的指導(dǎo)性和實(shí)用性,但由于其應(yīng)用過(guò)程中評(píng)價(jià)指標(biāo)的建立和關(guān)鍵程度的區(qū)分需要采用專家打分法,主觀性較強(qiáng),分類結(jié)果存在不確定性。數(shù)據(jù)挖掘是從數(shù)據(jù)庫(kù)中自動(dòng)發(fā)現(xiàn)有用信息和相關(guān)模式的過(guò)程,即從大量的、有噪聲的、不完全的、隨機(jī)的和模糊的數(shù)據(jù)中,發(fā)現(xiàn)并提取隱含其中的、事先所不知道的、潛在有用信息及知識(shí)的過(guò)程,數(shù)據(jù)挖掘的常用算法有預(yù)測(cè)、聚類和關(guān)聯(lián)等[3]。
目前,主要依經(jīng)驗(yàn)判斷進(jìn)行器材倉(cāng)庫(kù)庫(kù)存結(jié)構(gòu)調(diào)整,主觀因素影響大,K-均值聚類和BP神經(jīng)網(wǎng)絡(luò)算法通過(guò)對(duì)歷史數(shù)據(jù)的挖掘分析,可得到更為客觀的分類和預(yù)測(cè)結(jié)果[4],為此,筆者運(yùn)用K-均值聚類算法和BP神經(jīng)網(wǎng)絡(luò)建立器材品種分析模型和器材數(shù)量預(yù)測(cè)模型,為確定車輛器材的品種結(jié)構(gòu)、數(shù)量結(jié)構(gòu)提供理論依據(jù)。
聚類分析是根據(jù)數(shù)據(jù)中所發(fā)現(xiàn)的對(duì)象及其關(guān)系的相關(guān)信息,將數(shù)據(jù)對(duì)象分組,使組內(nèi)對(duì)象之間相關(guān),不同組的對(duì)象之間不相關(guān)。組內(nèi)對(duì)象的相關(guān)性越大,組間對(duì)象的差別越大,則聚類結(jié)果越符合實(shí)際。
K-均值聚類是一種基于原型的簇劃分的聚類方法,即以歐幾里得距離為劃分指標(biāo),以數(shù)據(jù)集的平均值為原型,將數(shù)據(jù)對(duì)象劃分為指定的k個(gè)簇[5]。目標(biāo)函數(shù)為所有簇的數(shù)據(jù)對(duì)象與質(zhì)心之間的誤差平方和小于設(shè)定的閾值,即
(1)
其中:o為數(shù)據(jù)對(duì)象;mi為第i個(gè)簇Ci的質(zhì)心。
1.1 器材品種分類模型構(gòu)建
與地方物流倉(cāng)庫(kù)相比,后方車輛器材倉(cāng)庫(kù)的出入庫(kù)不受“市場(chǎng)需求”的影響,出入庫(kù)完全按照制定的出庫(kù)計(jì)劃、入庫(kù)計(jì)劃和調(diào)撥計(jì)劃進(jìn)行,計(jì)劃性較強(qiáng)[6],因此筆者不考慮器材的備貨期、到貨情況和同類器材的替換情況等,以出庫(kù)量、出庫(kù)頻率和價(jià)格為參數(shù)對(duì)各種器材進(jìn)行聚類分析,具體步驟如下:
1)數(shù)據(jù)獲取。將車輛器材管理信息系統(tǒng)中的出庫(kù)記錄導(dǎo)出,并進(jìn)行數(shù)據(jù)預(yù)處理,形成數(shù)據(jù)出庫(kù)表,每條記錄包括器材編碼(qc)、出庫(kù)憑證號(hào)(id)、單次收發(fā)數(shù)和單價(jià)。
2)數(shù)據(jù)分組。應(yīng)用R語(yǔ)言的ddply函數(shù)對(duì)數(shù)據(jù)進(jìn)行分組整合,計(jì)算每種器材的總出庫(kù)量(count)、出庫(kù)頻率(fre)和單價(jià)(price),形成聚類初始表。
3)數(shù)據(jù)挖掘。應(yīng)用R語(yǔ)言的kmeans函數(shù)進(jìn)行挖掘分析。
4)結(jié)果分析。利用R語(yǔ)言的可視化函數(shù)生成聚類結(jié)果分布圖,分析各類器材的特點(diǎn)。
1.2 實(shí)例驗(yàn)證和結(jié)果分析
1.2.1 實(shí)例驗(yàn)證
以某車輛器材倉(cāng)庫(kù)2014年度的出庫(kù)歷史記錄(共2383條)為實(shí)驗(yàn)數(shù)據(jù),借助R語(yǔ)言進(jìn)行挖掘分析和驗(yàn)證。按車型該數(shù)據(jù)分為CA1122、EQ2050、EQ2102和EQ2050共4類,表1為EQ2050出庫(kù)記錄表。
表1 EQ2050出庫(kù)記錄
應(yīng)用ddply函數(shù)
count1<-ddply(iq,.(qc), function(x) sum(x$count)) #各種器材總出庫(kù)量
count2<-ddply(iq,.(qc), summarize, number=length(qc)#各種器材頻率
對(duì)表1的數(shù)據(jù)進(jìn)行分組,得到如表2所示的聚類初始表。
表2 聚類初始表
利用kmeans函數(shù)對(duì)表2中的數(shù)據(jù)進(jìn)行聚類分析,聚類數(shù)定為4類,相應(yīng)的程序代碼如下。
library(xlsx) #載入包
workbook<-"C:/zhong.xlsx" #導(dǎo)入數(shù)據(jù)
mydata<-read.xlsx(workbook,1)
cludata<-mydata[,2 ∶4] #提取聚類變量
set.seed(12345)
clur<-kmeans(x=cludata,centers=4,nstart=4)
應(yīng)用Clur$size、Clur$centers和Clur$cluster函數(shù)查看聚類結(jié)果,如圖1所示。
利用R語(yǔ)言的可視化函數(shù)plot和scatterplotMatrix
圖1 聚類結(jié)果
分別生成聚類結(jié)果分布圖和單價(jià)出庫(kù)頻率、總出庫(kù)量3個(gè)聚類要素的矩陣散點(diǎn)圖,如圖2、3所示。
圖2 聚類結(jié)果分布圖
圖3 單價(jià)、出庫(kù)頻率和總出庫(kù)量的矩陣散點(diǎn)圖
1.2.2 結(jié)果分析
由圖3可見(jiàn):通過(guò)聚類分析將所有器材分為4類,其中:第1、3、4類器材的數(shù)量(Clur$size)都較少,分別只有16、6、19種,大部分器材為第2類器材,共178種;且第1類器材為價(jià)格(Clur$centers price)最便宜的小件器材,出庫(kù)頻率(Clur$centers fre)和總出庫(kù)量(Clur$centers count)均最大,該類器材應(yīng)確定為最重要類器材,應(yīng)保持較大的庫(kù)存量;第2類器材為價(jià)格一般的中小件器材,出庫(kù)頻率和總出庫(kù)量均位居第2,應(yīng)確定為次重要類器材,應(yīng)保持一定的庫(kù)存量;第3類器材為價(jià)格高昂的大件總成,其總出庫(kù)量和出庫(kù)頻率均最小,一年只有幾次,應(yīng)確定為不重要類器材;第4類器材為價(jià)格較高的大中件器材,總出庫(kù)量和出庫(kù)頻率與第2類器材相當(dāng),應(yīng)確定為次重要類器材。這樣,便將所有器材分為重要類、次重要類和不重要類3類,具體如表3所示。
表3 聚類結(jié)果表
表4為該倉(cāng)庫(kù)的庫(kù)存器材結(jié)構(gòu)與其2014年度的出庫(kù)器材結(jié)構(gòu)對(duì)比情況。
表4 某倉(cāng)庫(kù)庫(kù)存器材結(jié)構(gòu)與2014年度出庫(kù)器材結(jié)構(gòu)對(duì)比
由表4可以看出:庫(kù)存器材結(jié)構(gòu)與出庫(kù)器材結(jié)構(gòu)不符,不重要類器材庫(kù)存積壓過(guò)多,次重要類器材庫(kù)存量不足,重要類器材庫(kù)存量偏多,因此,在制訂下一季度的器材入庫(kù)量時(shí),應(yīng)結(jié)合分析結(jié)果進(jìn)行調(diào)整,大幅減少不重要類器材的入庫(kù)量,增加次重要類器材的入庫(kù)量,適當(dāng)減少重要類器材的入庫(kù)量。
2.1 器材數(shù)量預(yù)測(cè)模型構(gòu)建
由于神經(jīng)網(wǎng)絡(luò)具有出色的自學(xué)能力,其能以任意精度逼近非線性關(guān)系,可用來(lái)預(yù)測(cè)器材的出庫(kù)量,因此筆者采用BP神經(jīng)網(wǎng)絡(luò)對(duì)編號(hào)為142784200的器材出庫(kù)量進(jìn)行預(yù)測(cè)。
表5為2014年度該倉(cāng)庫(kù)142784200器材的出庫(kù)記錄。
表5 2014年度器材142784200的出庫(kù)記錄
由于器材的出庫(kù)記錄為一維數(shù)據(jù),而B(niǎo)P神經(jīng)網(wǎng)絡(luò)的輸入為多維數(shù)據(jù),因此筆者以器材前4次的出庫(kù)量(m-4、m-3、m-2、m-1)為輸入,預(yù)測(cè)后1次(第m次)出庫(kù)量。為了使輸入數(shù)據(jù)的數(shù)量級(jí)與傳遞函數(shù)的輸出范圍相符,需將輸入數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使其在[0,1]區(qū)間內(nèi)[7]。因此,根據(jù)
(2)
對(duì)表5的數(shù)據(jù)進(jìn)行處理,得到如表6所示的預(yù)處理樣本數(shù)據(jù)。式中:n為所有數(shù)據(jù)中最大值的整數(shù)位,這里取n=2。
這樣,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可確定為3層,其中:輸入層節(jié)點(diǎn)數(shù)為4,即器材前4次出庫(kù)量;隱含層節(jié)點(diǎn)數(shù)一般為輸入層節(jié)點(diǎn)數(shù)×2+1,這里取9;輸出層節(jié)點(diǎn)數(shù)為1,即出庫(kù)量預(yù)測(cè)值[8]。
表6 預(yù)處理樣本數(shù)據(jù)
2.2 實(shí)例驗(yàn)證與結(jié)果分析
應(yīng)用R語(yǔ)言的neuralnet函數(shù)
bpnet1<-neuralnet(m~m4+m3+m2+m1,data=mydata,hidden=9, err.fct=“sse”,linear.output=FALSE,threshold=0.00001)
對(duì)所建模型進(jìn)行驗(yàn)證。
以表5中的前24組數(shù)據(jù)為學(xué)習(xí)樣本,最后2組數(shù)據(jù)為測(cè)試樣本,神經(jīng)網(wǎng)絡(luò)運(yùn)行過(guò)程和結(jié)果分別如圖4、5所示。
圖4 神經(jīng)網(wǎng)絡(luò)運(yùn)行過(guò)程
圖5 神經(jīng)網(wǎng)絡(luò)運(yùn)行結(jié)果
在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練過(guò)程中共進(jìn)行了10 764次迭代,損失值為0.000 033;第1節(jié)點(diǎn)m-4到隱含層第1節(jié)點(diǎn)的偏差為1.080 14,權(quán)重為-0.956 93;隱含層第1節(jié)點(diǎn)到輸出層的偏差為0.969 3,權(quán)重為-1.906 41。
應(yīng)用表5中的最后2組數(shù)據(jù)對(duì)所建BP網(wǎng)絡(luò)模型進(jìn)行測(cè)試,輸入數(shù)據(jù)分別為M1=(0.05, 0.05,0.02,0.1)和M2=(0.05,0.02,0.1,0.1),預(yù)測(cè)結(jié)果如圖6所示,利用compute函數(shù)可得結(jié)果分別為0.087和0.053,其平均誤差為e=1/2(0.087/0.1+0.053/0.06)=87.7%,因此,可認(rèn)為該神經(jīng)網(wǎng)絡(luò)具有較好的擬合性。
圖6 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
利用測(cè)試后的神經(jīng)網(wǎng)絡(luò)對(duì)各器材的出庫(kù)量進(jìn)行預(yù)測(cè),得到各器材的出庫(kù)量預(yù)測(cè)結(jié)果,如表7所示。器材助理員根據(jù)表7所示的預(yù)測(cè)結(jié)果可預(yù)測(cè)下一季度各器材的需求量,并據(jù)此上報(bào)倉(cāng)庫(kù)下一季度總的器材需求量。
表7 器材出庫(kù)量預(yù)測(cè)結(jié)果
[1] 羅雪, 崔南方. 維修備件基于AHP的ABC分類模型[J]. 工業(yè)工程與管理, 2004, 11(6):17-19.
[2] 郭智敏, 嚴(yán)洪森, 陳施華,等. 備件庫(kù)存控制方法研究[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2003,9(11):128-132.
[3] OliviaParrRud. 數(shù)據(jù)挖掘?qū)嵺`[M]. 朱揚(yáng)勇,譯. 北京:機(jī)械工業(yè)出版社, 2003:65-72.
[4] 肖娟. 數(shù)據(jù)挖掘在物流業(yè)的應(yīng)用綜述[J]. 統(tǒng)計(jì)與決策, 2013 (11): 95-97.
[5] 薛薇. 基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘[M]. 北京:中國(guó)人民大學(xué)出版社, 2015: 273-379.
[6] 趙復(fù)濤. 軍用車輛器材周轉(zhuǎn)量?jī)?yōu)化研究[D]. 天津: 軍事交通學(xué)院, 2012.
[7] 劉晶璟. 基于BP神經(jīng)網(wǎng)絡(luò)的零售連鎖企業(yè)安全庫(kù)存預(yù)測(cè)方法[J]. 物流技術(shù), 2012, 31(11): 326-328.
[8] 曹艷華, 陳春良, 龔正波, 等. 基于神經(jīng)網(wǎng)絡(luò)趨勢(shì)預(yù)測(cè)的裝甲車輛柴油機(jī)壽命預(yù)測(cè)[J]. 裝甲兵工程學(xué)院學(xué)報(bào), 2014, 28(5): 29-33.
(責(zé)任編輯:王生鳳)
Inventory Structure Analysis of Vehicle Material Warehouse Based on Data Mining
DONG Xiang-ying1, Lü Ya-fei2, ZOU Rao-bangyan2
(1. Department of Military Vehicles, Academy of Military Transportation, Tianjin 300161, China; 2. Brigade of Postgraduate Management, Academy of Military Transportation, Tianjin 300161, China)
Aiming at the problems of the unreasonable structure of inventory vehicle types, inventory varieties and inventory quantities in the vehicle material warehouse, this paper, making full use of the data of actual consumption of vehicle material, establishes the analysis model on determining the variety and determining the quantity based on K-means cluster analysis and BP neural network. The model is verified in R and the result provides theoretic support for the decision of variety and quantity structure of the vehicle material warehouse.
vehicle material warehouse; inventory structure; data mining; R language
1672-1497(2016)05-0031-05
2016-07-07
董翔英(1963-),女,教授,碩士。
E92
A
10.3969/j.issn.1672-1497.2016.05.006