任小強(qiáng),夏耩,吳光華,管一霖
(1 中國移動(dòng)通信集團(tuán)甘肅有限公司蘭州分公司,蘭州 730000; 2 成都理工大學(xué),成都 610059)
基于疊加馬爾可夫鏈的4G流量訂購量分析與預(yù)測*
任小強(qiáng)1,2,夏耩2,吳光華1,管一霖1
(1 中國移動(dòng)通信集團(tuán)甘肅有限公司蘭州分公司,蘭州 730000; 2 成都理工大學(xué),成都 610059)
針對馬爾可夫鏈預(yù)測的局限性,本文提出了能夠定量計(jì)算疊加4G流量訂購量的馬爾可夫鏈預(yù)測方法。以定西地區(qū)2月4G流量訂購量進(jìn)行狀態(tài)分級,劃分為滯銷、偏滯銷、一般、偏暢銷和暢銷,計(jì)算狀態(tài)轉(zhuǎn)移矩陣,將不同步長轉(zhuǎn)移矩陣求得的預(yù)測值進(jìn)行加權(quán)平均,并運(yùn)用疊加馬爾可夫鏈方法建立該地區(qū)4G流量訂購量模型,分析擬合結(jié)果。結(jié)果表明,該模型的預(yù)測精度達(dá)到了87.99%,預(yù)測效果較好,為4G流量訂購量的預(yù)測提供了一種方法。
疊加馬爾科夫鏈;4G流量訂購量;狀態(tài)分級
通信運(yùn)營商資費(fèi)主要由話音資費(fèi)、4G流量資費(fèi)、數(shù)據(jù)業(yè)務(wù)資費(fèi)3部分組成,4G流量業(yè)務(wù)是資費(fèi)的組成部分之一??茖W(xué)合理地預(yù)測4G流量訂購量,既是合理安排促銷人員的科學(xué)依據(jù),又是制定方針政策的有效指導(dǎo)。然而由于多種條件因素的綜合影響增加了4G流量訂購量預(yù)測的復(fù)雜性,如人員流動(dòng)、地理差異和時(shí)間變化等。常見的預(yù)測方法有線性擬合方法、插值法、函數(shù)逼近法、迭代法、解析法等方法,實(shí)際工作中,通常需要預(yù)測出未來某時(shí)段訂購量的變化區(qū)間,進(jìn)而預(yù)測某時(shí)段訂購量的數(shù)值,而馬爾科夫鏈模型比較適合預(yù)測波動(dòng)比較大的隨機(jī)動(dòng)態(tài)過程,但是只能預(yù)測某個(gè)時(shí)期預(yù)測量處于某種狀態(tài)的概率,預(yù)測結(jié)果是一個(gè)區(qū)間,預(yù)測效果較為模糊。針對馬爾科夫鏈模型的局限性,分析疊加馬爾科夫鏈模型在4G流量訂購量中的應(yīng)用,它能夠充分利用已知信息,得到具體的預(yù)測結(jié)果,該方法應(yīng)用較為廣泛。
本文選取定西市2016年2月中國移動(dòng)4G流量訂購量作為研究對象,采用均值——方差設(shè)立分級標(biāo)準(zhǔn),將其分為滯銷、偏滯銷、一般、偏暢銷和暢銷5種狀態(tài),并用疊加馬爾科夫鏈預(yù)測方法對4G流量訂購量進(jìn)行預(yù)測,利用馬爾科夫鏈的穩(wěn)態(tài)分布求的每種狀態(tài)分級出現(xiàn)的概率,為當(dāng)?shù)剡\(yùn)營商提供分析和制定政策的科學(xué)依據(jù)。
定西市位于甘肅中部,距離蘭州市98 km,截至2015年12月31日定西市管轄6縣1區(qū),包括安定區(qū)、通渭、隴西、渭源、臨洮、漳縣和岷縣,常住人口297萬,占地面積20 330 km2。主要以中國移動(dòng)、中國電信和中國聯(lián)通三大運(yùn)營商為主,由于地處偏僻,加之交通較為不便,當(dāng)?shù)鼐用竦钠骄杖胨捷^低,有些地區(qū)4G信號甚至還沒有完全覆蓋,仍然以傳統(tǒng)的非智能機(jī)為主,所以這一地區(qū)的流量訂購量相比其它地區(qū)較差,但是也呈現(xiàn)出一定的規(guī)律。以2016年2月4G流量訂購量為原始序列,其變化曲線如圖1所示。由圖1可知,該地區(qū)4G訂購量的變化區(qū)間為[4 000,120 000],在1-8日、26-29日高于平均水平,其它日期段的訂購量低于平均水平,不過15日附近有個(gè)緩慢增減趨勢。
圖1 研究區(qū)2016年2月4G流量訂購量變化曲線
定西市地區(qū)2016年2月4G流量訂購量的原始序列的均值及均方差的無偏估計(jì)量由下式計(jì)算得出:
采用均值方差法將4G流量訂購量序列進(jìn)行分級,這里分為5種狀態(tài):分別為滯銷、偏滯銷、一般、偏暢銷和暢銷。因此,用均值方差法把該序列劃分為5個(gè)區(qū)間,每個(gè)區(qū)間對應(yīng)一個(gè)馬爾科夫狀態(tài),4G流量訂購量分級標(biāo)準(zhǔn)如表1所示。
依據(jù)表1中的分級標(biāo)準(zhǔn)對定西市地區(qū)2016年2月4G流量訂購量進(jìn)行分級,結(jié)果如表2所示。
表1 4G流量訂購量分級標(biāo)準(zhǔn)
表2 研究地區(qū)2月4G流量訂購量狀態(tài)等級劃分
在建立馬爾可夫鏈模型前,需要計(jì)算步長為1-4的狀態(tài)轉(zhuǎn)移矩陣,其中第k步狀態(tài)轉(zhuǎn)移矩陣中第i行,第j列的元素,表示由狀態(tài)i經(jīng)過第k步轉(zhuǎn)移到狀態(tài)j的概率,即
4G流量訂購量的狀態(tài)均值向量分量是其分級區(qū)間的上下限均值,第一個(gè)分量的下限是原始序列的最小值,最后一個(gè)分量的上限是原始序列的最大值,計(jì)算得到均值向量a={5 804、5 092、6 320、7 429、8 864}。根據(jù)2016年2月4G流量訂購量序列及其相應(yīng)步長的狀態(tài)轉(zhuǎn)移概率矩陣對2月26-29日的訂購量進(jìn)行預(yù)測,26日的4G流量訂購量分級狀態(tài)為3,距離3月的步長為4,就可以利用均值向量的轉(zhuǎn)置與狀態(tài)為3,步長為4的狀態(tài)轉(zhuǎn)移矩陣進(jìn)行相乘,得到的預(yù)測值為6 162,與實(shí)際值的相對誤差為0.030 9,依次類推,27-29日預(yù)測結(jié)果與相對誤差如表3和圖2所示。
表3 研究地區(qū)26-29號4G流量訂購量預(yù)測結(jié)果
圖2 研究地區(qū)26-29日4G流量訂購量預(yù)測值與實(shí)際值
由疊加馬爾可夫鏈對2月26-29日的4G流量訂購量的預(yù)測結(jié)果來看,預(yù)測值總體偏小,其相對誤差達(dá)到-0.243 4。其中一般狀態(tài)等級下的誤差較小,如26、27日。偏暢銷狀態(tài)等級下的誤差較大,如28日。暢銷狀態(tài)等級下的誤差也較大,如29日。在上述預(yù)測的基礎(chǔ)上,用疊加馬爾可夫鏈對2016年研究地區(qū)3月的4G流量訂購量進(jìn)行預(yù)測,結(jié)果如表4和圖3所示。對表4中的相對誤差進(jìn)行平均,得到0.120 1,則疊加馬爾科夫鏈的預(yù)測精度為0.879 9,預(yù)測效果較好。
表4 研究地區(qū)3月4G流量訂購量預(yù)測結(jié)果
設(shè)穩(wěn)態(tài)分布的概率為P=(π1,π2,π3,π4,π5),由于2步狀態(tài)轉(zhuǎn)移概率矩陣與其它的狀態(tài)轉(zhuǎn)移概率矩陣都有聯(lián)系,這里選擇2步長狀態(tài)轉(zhuǎn)移概率矩陣求其4G流量訂購量的馬爾科夫鏈模型的平穩(wěn)分布,即
代入2步狀態(tài)轉(zhuǎn)移概率矩陣得
解以上方程組,得到π1,π2,π3,π4,π5的值分別為0.144 6、0.204 5、0.431 4、0.128 6和0.090 9。這說明,研究地區(qū)的4G流量訂購量的變化過程,在很多次狀態(tài)轉(zhuǎn)移以后,該商品處于滯銷、偏滯銷、一般、偏暢銷和暢銷出現(xiàn)的概率分別為0.144 6、0.204 5、0.431 4、0.128 6和0.090 9。
圖3 研究3月4G流量訂購量預(yù)測值與實(shí)際值
(1)疊加馬爾可夫鏈預(yù)測方法克服了馬爾可夫鏈預(yù)測方法不能給出具體預(yù)測值的缺陷,利用已知4G流量訂購量數(shù)據(jù)信息,對未來4G流量訂購量進(jìn)行預(yù)測,為運(yùn)營商制定政策和安排促銷人員等提供了科學(xué)依據(jù)。
(2)馬爾可夫鏈的狀態(tài)轉(zhuǎn)移概率矩陣的元素都是某一狀態(tài)下的事件發(fā)生的概率,需要較多的資料數(shù)據(jù)才能進(jìn)行較為合理的預(yù)測。本文采用研究地區(qū)29天的4G流量訂購量作為原始數(shù)據(jù)序列,這種情況下的頻率可以近似于概率,從而使馬爾可夫鏈模型對4G流量訂購量預(yù)測提供了科學(xué)依據(jù),預(yù)測精度達(dá)到0.8799,說明該方法改進(jìn)了馬爾可夫鏈預(yù)測方法,其預(yù)測精度更高。
(3)利用馬爾可夫鏈中的遍歷性定理,計(jì)算出研究地區(qū)的穩(wěn)態(tài)分布概率,得出研究地區(qū)4G流量訂購量處于滯銷、偏滯銷、一般、偏暢銷和暢銷出現(xiàn)的概率分別為0.1446、0.2045、0.4314、0.1286和0.0909。
(4)這里選取2016年2月定西市地區(qū)數(shù)據(jù),運(yùn)用疊加馬爾可夫鏈預(yù)測4G流量訂購量的變化趨勢,由于樣本量較少,加上時(shí)間影響,使其預(yù)測值與實(shí)際值的相對誤差較大,下一步的主要工作就是利用大數(shù)據(jù)和快數(shù)據(jù)的特點(diǎn),并結(jié)合疊加馬爾可夫鏈方法對研究地區(qū)的4G流量訂購量進(jìn)行分析與預(yù)測,使預(yù)測的相對誤差更小。
[1] 裘俊紅, 郭天民. 若干數(shù)據(jù)線性擬合方法分析[J]. 中國石油大學(xué)學(xué)報(bào):自然科學(xué)版, 1996(6):121-125.
[2] 涂俐蘭, 黃丹. 插值法在數(shù)據(jù)修正中的應(yīng)用[J]. 數(shù)學(xué)理論與應(yīng)用, 2012(3):110-116.
[3] 吳方應(yīng). 可靠性計(jì)算中失效區(qū)線性逼近的最小割集模型研究及驗(yàn)證[D]. 合肥:合肥工業(yè)大學(xué), 2015.
[4] 楚敬龍. 解析法在山區(qū)地下水環(huán)境影響評價(jià)中的應(yīng)用[J]. 有色金屬:礦山部分, 2011, 63(5):71-74.
[5] 張聰聰, 陳效民, 陳旭, 等. 基于馬爾可夫鏈的太湖流域典型地區(qū)年降水量分析與預(yù)測[J]. 水土保持通報(bào), 2015, 35(1).
[6] 廖普明. 基于馬爾科夫鏈狀態(tài)轉(zhuǎn)移概率矩陣的商品市場狀態(tài)預(yù)測[J]. 統(tǒng)計(jì)與決策, 2015(2):97-99.
[7] 張有存. 馬爾可夫鏈在韶關(guān)市年降水量預(yù)測中的應(yīng)用[J]. 韶關(guān)學(xué)院學(xué)報(bào), 2015(4):4-7.
Analysis and prediction of 4G data traffic order based on superimposed markov chain
REN Xiao-qiang1,2, XIA Jiang2, WU Guang-hua1, GUAN Yi-lin1
(1 China Mobile Group Gansu Co., Ltd. Lanzhou Branch, Lanzhou 730000, China; 2 Chengdu University of Technology, Chengdu 610059, China)
Aiming at the limitation of Markov chain prediction, a Markov chain forecasting method is proposed to calculate and superpose the order amount of the 4G roaming data quantitatively. In the Dingxi prefecture’s order amount of the 4G roaming data in february for example, it is classified by status, which includes five parts, the unsalable, the partial unsalable, the general, the popular and the bestselling. The model of the region’s 4G roaming data ordering amount is established by using the additive Markov chain method, through weighted averages of the predicted value obtained by the different step transfer matrix. Last but not least, the results show that the prediction accuracy of the model is up to 87.99%, and the prediction effect is good, which provides a method for the prediction of 4G traffic order quantity.
superimposed Markov chain; business dealing of 4G data traffic; status classification
TP391.1
A
1008-5599(2017)08-0082-04
2017-03-04
2016年國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201610616091)和2016四川省科技創(chuàng)新苗子工程(2016138)。