趙 玲,許宏科
(1.西安郵電大學(xué)通信與信息工程學(xué)院,陜西 西安 710121;2.長安大學(xué)電子與控制工程學(xué)院,陜西 西安 710064)
Abstract:In order to predict the Internet access population accurately, a forecasting method based on Gray Markov Verhulst model is proposed. The method uses historical data to construct gray Verhulst model, gets the expression of time response series of the Internet access population by determining coefficients, and obtains the development sequences of the Internet access population in the near future. Based on the Markov chain, the sequence states are divided into three parts, the state probability and medium prediction value are obtained by determining the state transition matrix, and further the modification values of each sequence are obtained. Finally, the Internet access population from December 2006 to June 2012 is used as original data to establish the forecasting model so as to predict the number of Internet users from December 2012 to June 2014. The results show that the prediction accuracy of the gray Markov Verhulst forecasting model has fewer errors and better prediction precision, gives the fluctuation range and the probability of the prediction results, and provides the decision-making basis for network construction and management.
Keywords:Internet;population prediction;Gray Markov;Verhulst model;prediction accuracy
互聯(lián)網(wǎng)自1994年進(jìn)入中國以來,經(jīng)過20年的快速發(fā)展,取得了令人矚目的成績。網(wǎng)絡(luò)規(guī)模不斷擴(kuò)大,上網(wǎng)人數(shù)躍居世界第二,信息資源開發(fā)水平不斷提高,互聯(lián)網(wǎng)已經(jīng)成為社會重要的信息基礎(chǔ)設(shè)施。分析、預(yù)測我國互聯(lián)網(wǎng)用戶人數(shù)的統(tǒng)計(jì)信息,可以使國家和企業(yè)掌握互聯(lián)網(wǎng)在我國的動態(tài)發(fā)展情況,為網(wǎng)絡(luò)建設(shè)及管理提供決策依據(jù)。
目前,互聯(lián)網(wǎng)發(fā)展的預(yù)測方法很多,如回歸分析法、RBF神經(jīng)網(wǎng)絡(luò)預(yù)測法、Bass模型法和灰色理論預(yù)測法等[1~6]?;貧w分析法需要大量樣本數(shù)據(jù)才能得出相對準(zhǔn)確的預(yù)測模型,即它依賴于歷史數(shù)據(jù)的完備程度。RBF神經(jīng)網(wǎng)絡(luò)法涉及神經(jīng)網(wǎng)絡(luò)的建立和訓(xùn)練過程,過程較為復(fù)雜,運(yùn)算量偏大。文獻(xiàn)[2]運(yùn)用Bass模型預(yù)測互聯(lián)網(wǎng)人數(shù),但Bass模型法的缺點(diǎn)是其參數(shù)的確定比較麻煩,選用不同的方法確定模型參數(shù)對于預(yù)測的精度有很大的影響。文獻(xiàn)[3]基于灰色災(zāi)變原理將GM(1,1)模型和一元線性回歸模型結(jié)合來解決數(shù)據(jù)跳變問題,但跳變點(diǎn)的選取憑肉眼觀察判斷可能會造成誤差。文獻(xiàn)[4]在GM(1,1)模型基礎(chǔ)上建立殘差修正GM(1,1)后才取得較好的預(yù)測精度,其缺點(diǎn)是運(yùn)算過程復(fù)雜。文獻(xiàn)[5,6]均采用灰色Verhulst模型預(yù)測因特網(wǎng)訪問人數(shù),實(shí)例表明其具有理論可靠、方法簡單、預(yù)測精度高等優(yōu)點(diǎn)。馬爾可夫理論在描述動態(tài)系統(tǒng)的狀態(tài)轉(zhuǎn)移方面獨(dú)具優(yōu)勢,經(jīng)常和灰色理論相結(jié)合用于預(yù)測長期的、波動性大的預(yù)測問題,并在諸多領(lǐng)域獲得了廣泛應(yīng)用[7,8]。
然而,互聯(lián)網(wǎng)用戶人數(shù)的分析、預(yù)測與我國人口數(shù)量、受教育水平、GDP指標(biāo)及網(wǎng)絡(luò)建設(shè)情況等許多因素有關(guān),其時(shí)間序列正是該系統(tǒng)內(nèi)部各因素之間相互制約、相互影響與協(xié)調(diào)發(fā)展的結(jié)果。要全面考慮所有相關(guān)因素建立因特網(wǎng)訪問量發(fā)展趨勢的準(zhǔn)確預(yù)測模型是不現(xiàn)實(shí)的。近年來發(fā)展起來的灰色理論為各類“小樣本”、“貧信息”的不確定問題提供了解決思路,它通過信息覆蓋來尋求現(xiàn)實(shí)現(xiàn)象中存在的規(guī)律。
本文針對近幾年互聯(lián)網(wǎng)訪問人數(shù)這種綜合灰色量挖掘有用信息,以灰色理論為基礎(chǔ),結(jié)合Verhulst模型和馬爾可夫鏈的各自優(yōu)點(diǎn),提出灰色馬爾可夫Verhulst模型用于因特網(wǎng)訪問人數(shù)預(yù)測,用Verhulst模型來揭示因特網(wǎng)訪問人數(shù)的總體趨勢,用馬爾可夫鏈模型修正結(jié)果的波動范圍并給出不同范圍的出現(xiàn)概率,試圖尋找和揭示網(wǎng)絡(luò)訪問量發(fā)展趨勢的內(nèi)在規(guī)律,提高因特網(wǎng)訪問人數(shù)的預(yù)測精度,為政府和企業(yè)制定出科學(xué)合理的互聯(lián)網(wǎng)發(fā)展目標(biāo)提供參考依據(jù)。
灰色Verhulst模型主要是用來描述非單調(diào)的擺動發(fā)展序列或具有飽和狀態(tài)的S型序列。自從2000年以來,我國互聯(lián)網(wǎng)上網(wǎng)人數(shù)一直保持著比較強(qiáng)勁的增長勢頭,并在一定時(shí)間段上是呈部分“S”型變化的, 所以在一定程度上互聯(lián)網(wǎng)上網(wǎng)人數(shù)的變化情況可以通過建立灰色 Verhulst 模型進(jìn)行預(yù)測。建模原理如下:
對X(0)作緊臨均值生成序列:
k=0,1,…,n-1
(1)
2.2.1 狀態(tài)劃分
?i=[?i1,?i2],
(2)
其中,i=1,2,…,n,Ai、Bi均依據(jù)對象和原始數(shù)據(jù)而定。
2.2.2 計(jì)算狀態(tài)轉(zhuǎn)移概率矩陣
設(shè)Nij(n)為由狀態(tài)?i經(jīng)過n步轉(zhuǎn)移到狀態(tài)?j的原始數(shù)據(jù)樣本數(shù);Ni為處于狀態(tài)?i的原始數(shù)據(jù)樣本數(shù),稱Pij(n)=Nij(n)/Ni為由狀態(tài)?i到狀態(tài)?j的n步狀態(tài)轉(zhuǎn)移概率。則構(gòu)造n步狀態(tài)轉(zhuǎn)移概率矩陣為:
(3)
狀態(tài)轉(zhuǎn)移概率矩陣P(n)反映了系統(tǒng)各狀態(tài)之間的轉(zhuǎn)移規(guī)律。通過狀態(tài)轉(zhuǎn)移概率矩陣和初始狀態(tài),就可以確定未來的發(fā)展趨勢。通過考察一階狀態(tài)轉(zhuǎn)移矩陣P(1)即可確定預(yù)測對象的下一步轉(zhuǎn)移狀態(tài)。當(dāng)矩陣P(1)中某行有兩個(gè)或兩個(gè)以上相同或相近時(shí),可以參考P(2)或P(m)來確定狀態(tài)的未來轉(zhuǎn)向。
2.2.3 計(jì)算預(yù)測值
未來的轉(zhuǎn)移狀態(tài)?i確定之后,也就確定了預(yù)測值的變動區(qū)間[?i1,?i2],預(yù)測值為區(qū)間中點(diǎn),即:
(4)
互聯(lián)網(wǎng)的發(fā)展問題是近年來信息經(jīng)濟(jì)學(xué)中的熱點(diǎn)問題。1997年11月,中國互聯(lián)網(wǎng)信息中心(CNNIC)第1次發(fā)布《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》受到了普遍關(guān)注,于是CNNIC從1998年7月開始,每隔半年就發(fā)布一次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,公布我國因特網(wǎng)上網(wǎng)計(jì)算機(jī)數(shù)、用戶人數(shù)、用戶分布、信息流量分布、域名注冊等方面情況的統(tǒng)計(jì)信息。本文選取CNNIC于2012年7月發(fā)布的第30次《中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》的最新統(tǒng)計(jì)數(shù)據(jù)(見表1),以我國上網(wǎng)用戶人數(shù)為例,用上述介紹的方法進(jìn)行應(yīng)用分析。
Table 1 China’s Internet access numbers from December 2006 to June 2012表1 2006年12月~2012年6月我國因特網(wǎng)訪問人數(shù) 萬
注:數(shù)據(jù)來源于2006年12月~2012年7月CNNIC發(fā)布的《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》。
為了減少計(jì)算機(jī)運(yùn)算產(chǎn)生的舍入誤差,首先將表中數(shù)據(jù)縮小1 000倍,通過參數(shù)計(jì)算,可以建立如下灰色Verhulst預(yù)測模型:
(5)
其中,a=-0.2896,b=-0.004719。將預(yù)測后得到的結(jié)果乘以1 000倍,計(jì)算結(jié)果如表2所示。
為和Verhulst模型比較,筆者也用原始數(shù)據(jù)建立了灰色GM(1,1)模型,模型預(yù)測結(jié)果如表2所示。
Table2 Actual value-predicted value list of China’s Internet access numbers )表2 我國因特網(wǎng)訪問人數(shù)實(shí)際值—預(yù)測值一覽表
當(dāng)前經(jīng)濟(jì)環(huán)境下,企業(yè)財(cái)務(wù)管理仍然需要在傳統(tǒng)基礎(chǔ)上做進(jìn)一步的創(chuàng)新和優(yōu)化,包括財(cái)務(wù)管理工具運(yùn)用、財(cái)務(wù)管理制度體系完善等。其中比較重要的是關(guān)注企業(yè)員工的行為規(guī)范,建立更加完善科學(xué)的財(cái)務(wù)內(nèi)控制度,增強(qiáng)企業(yè)內(nèi)部控制,充分發(fā)揮“人”這一企業(yè)生產(chǎn)中最靈活、最有價(jià)值的要素的作用。在結(jié)合《會計(jì)法》、《企業(yè)內(nèi)部控制規(guī)范》等相關(guān)財(cái)務(wù)法律法規(guī)及企業(yè)內(nèi)控監(jiān)管要求的同時(shí),也需要加強(qiáng)企業(yè)自身的資金管理和項(xiàng)目管理,完善財(cái)務(wù)分析、效益分析、收支管理等工作內(nèi)容,更加全面、細(xì)致、準(zhǔn)確的反應(yīng)企業(yè)財(cái)務(wù)信息,輔助企業(yè)科學(xué)決策,實(shí)現(xiàn)企業(yè)管理規(guī)范,全面促進(jìn)企業(yè)管理創(chuàng)新進(jìn)程。
根據(jù)馬爾可夫鏈分析方法的實(shí)際應(yīng)用經(jīng)驗(yàn)[10,11],根據(jù)表2中灰色Verhulst預(yù)測結(jié)果的相對誤差,可以將因特網(wǎng)訪問人數(shù)預(yù)測結(jié)果(2007/06月~2012/06月)劃分為三個(gè)狀態(tài):
根據(jù)表2中的數(shù)據(jù),結(jié)合上述狀態(tài)劃分,可獲得2007/06~2012/06統(tǒng)計(jì)時(shí)段因特網(wǎng)訪問人數(shù)的狀態(tài)轉(zhuǎn)移情況,如表3所示。
Table 3 Markov state transition表3 馬爾可夫狀態(tài)轉(zhuǎn)移情況
根據(jù)轉(zhuǎn)移的樣本數(shù)與原始狀態(tài)樣本數(shù)的比值可以得到一步狀態(tài)轉(zhuǎn)移矩陣為:
現(xiàn)用馬爾可夫鏈修正用灰色Verhulst模型預(yù)測出的2012/12~2014/06的因特網(wǎng)訪問人數(shù),具體數(shù)值及計(jì)算結(jié)果如表4所示。表4中,預(yù)測區(qū)間一列是根據(jù)實(shí)際有效的三種狀態(tài)的劃分界限求得的;預(yù)測中值一列是預(yù)測區(qū)間上下限的均值;由一步狀態(tài)轉(zhuǎn)移矩陣P(1),可得到從2012/06統(tǒng)計(jì)時(shí)段轉(zhuǎn)移至2012/12~2014/06的2步、3步、4步轉(zhuǎn)移矩陣,故易得轉(zhuǎn)移至統(tǒng)計(jì)時(shí)段各狀態(tài)的概率。
由于2012/06統(tǒng)計(jì)時(shí)段的互聯(lián)網(wǎng)上網(wǎng)人數(shù)處于狀態(tài)?2,從狀態(tài)轉(zhuǎn)移矩陣P(1)可以看出,系統(tǒng)從狀態(tài)?2轉(zhuǎn)移到狀態(tài)?2的概率遠(yuǎn)遠(yuǎn)超過轉(zhuǎn)移到其它兩個(gè)狀態(tài)的概率,即近幾年因特網(wǎng)訪問人數(shù)處于相對穩(wěn)定的可能性很大。
Table 4 Predicted value of Internet access numbers from December 2012 to June 2014表4 2012/12~2014/6因特網(wǎng)訪問人數(shù)的預(yù)測值
因特網(wǎng)的發(fā)展也會經(jīng)歷從啟動期、成長期、成熟期到飽和期的發(fā)展趨勢, 我國2003年~2009年因特網(wǎng)訪問人數(shù)處于成長期,這和Internet的剛興起以及政府的大力推廣等因素有關(guān),2010年~2012年因特網(wǎng)訪問人數(shù)的發(fā)展逐步過渡到成熟期,未來幾年訪問人數(shù)會逐漸趨于飽和,這一現(xiàn)象符合事物的發(fā)展規(guī)律。
本文研究思路避開了自然環(huán)境、社會經(jīng)濟(jì)條件和政策導(dǎo)向等因素,采用以灰色系統(tǒng)理論和馬爾可夫鏈相結(jié)合的方法,對近期的因特網(wǎng)訪問人數(shù)進(jìn)行預(yù)測。用Verhulst模型揭示因特網(wǎng)訪問人數(shù)的總體趨勢,利用馬爾可夫鏈模型預(yù)測出結(jié)果的波動范圍及結(jié)果修正。通過理論研究及實(shí)例應(yīng)用,總結(jié)如下:
(1)灰色Verhulst模型適合描述具有飽和態(tài)的“S形”過程預(yù)測,近年來我國因特網(wǎng)訪問人數(shù)已逐漸趨向飽和,故本文用Verhulst預(yù)測因特網(wǎng)訪問人數(shù),理論可靠,方法簡單,值得推廣。
(2)通過建立狀態(tài)轉(zhuǎn)移概率矩陣可確定因特網(wǎng)訪問人數(shù)位于不同區(qū)間的可能性,通過綜合考慮區(qū)間預(yù)測中值與區(qū)間發(fā)生概率可更加準(zhǔn)確地把握未來上網(wǎng)人數(shù)發(fā)展趨勢。
(3)由于灰色系統(tǒng)注重新數(shù)據(jù),故選取2006/6~2012/6統(tǒng)計(jì)時(shí)段的數(shù)據(jù)進(jìn)行建模。實(shí)際應(yīng)用中,應(yīng)根據(jù)不斷得到的新數(shù)據(jù)對預(yù)測模型進(jìn)行不斷的修正,以此提高預(yù)測精度。
[1] Dang Yue-chen, Xu Juan. Research on the number of internet users forecast model based on Matlab[J]. Journal of Beijing Institute of Technology(Social Sciences),2010,12(2):47-49.
[2] Chen Jing-jing,Mao Qian,Liu Guo-hui. Study on forecast of internet users in China[J]. Study on Optical Communications,2007(1):1-3. (in Chinese)
[3] Ding Jie.Prediction model of internet users based on grey disaster theory[J]. Intelligence Theory and Practice,2005,28(5):482-484. (in Chinese)
[4] Lian Fei. Gray prediction of China’s internet users based on GM (1,1) model[J]. Statistics and Consulting,2008(4):28-29.(in Chinese)
[5] Bai Yan,Zhu Miao-miao,Ma Guang-si.The prediction and analysis of the Internet access population based on the Grey Verhulst model[J]. Computer Engineering & Science,2008,30(10):19-21. (in Chinese)
[6] Zhu Miao-miao,Niu Guo-feng,Le De-guang.Prediction of the number of people using the internet based on the gray Verhulst dynamic model[J]. Microcomputer & Its Applications,2011,30(23):91-93. (in Chinese)
[7] Qian Wei-dong,Liu Zhi-qiang. Road traffic accident forecast based on Gray-Markov model[J].China Safety Science Journal,2008,18(3):33-36. (in Chinese)
[8] Zhang Zong-guo.The research on forecast method and application of Markov Chain[D].Nanjing:Hohai University,2005. (in Chinese)
[9] Liu Si-feng,Dang Yao-guo,Fang Zhi-gen.Grey system theory and application[M].Beijing:Science Press,2004. (in Chinese)
[10] Li Dong,Su Xiao-hong,Ma Shuang-quan. Stock price prediction algorithms based on grey Markov model[J]. Journal of Harbin Institute of Technology,2003,35(2):244-248. (in Chinese)
[11] Zhao Xiao-mei,Gai Mei.Urban water consumption forecasting in Dalian based on equal dimensional and new information grey Markov forecasting model[J].Journal of China Hydrology,2011,31(1):66-69. (in Chinese)
附中文參考文獻(xiàn):
[2] 陳晶晶,毛謙,劉國輝.我國互聯(lián)網(wǎng)用戶數(shù)預(yù)測研究[J].光通信研究,2007(1):1-3.
[3] 丁潔. 基于灰色災(zāi)變原理的互聯(lián)網(wǎng)用戶人數(shù)預(yù)測模型[J]. 情報(bào)理論與實(shí)踐,2005,28(5):482-484.
[4] 連飛. 基于GM(1,1)模型的我國互聯(lián)網(wǎng)上網(wǎng)人數(shù)灰色預(yù)測[J]. 統(tǒng)計(jì)與咨詢,2008(4):28-29.
[5] 白燕,朱苗苗,馬光思.基于灰色Verhulst模型的因特網(wǎng)訪問人數(shù)預(yù)測分析[J].計(jì)算機(jī)工程與科學(xué),2008,30(10):19-21.
[6] 朱苗苗,牛國鋒,樂德廣.基于灰色Verhulst的互聯(lián)網(wǎng)上網(wǎng)人數(shù)動態(tài)預(yù)測模型[J]. 微型機(jī)與應(yīng)用,2011,30(23):91-93.
[7] 錢衛(wèi)東,劉志強(qiáng).基于灰色馬爾可夫的道路交通事故預(yù)測[J].中國安全科學(xué)學(xué)報(bào),2008,18(3):33-36.
[8] 張宗國. 馬爾可夫鏈預(yù)測方法及其應(yīng)用研究[D]. 南京:河海大學(xué),2005.
[9] 劉思峰,黨耀國,方志耕.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社, 2004.
[10] 李東,蘇小紅,馬雙全.基于新維灰色馬爾科夫預(yù)測模型的股價(jià)預(yù)測算法[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2003,35(2):244-248.
[11] 趙曉梅,蓋美.基于等維新息灰色馬爾可夫模型的大連城市用水量預(yù)測[J].水文,2011,31(1):66-69.