孫磊 袁欣晨
摘要:本文根據(jù)棉花價格波動趨勢分析歷史數(shù)據(jù),并利用馬爾科夫鏈建立數(shù)學模型,來預測2020年棉花的月度和日度價格區(qū)間。結(jié)果表明:在正常情況下,用馬爾科夫鏈預測的棉花價格區(qū)間基本符合實際市場數(shù)據(jù)變動,且波動較小的短期棉花價格指數(shù)變化更適合運用馬爾科夫鏈來預測。
關(guān)鍵詞:棉花價格;馬爾科夫鏈;預測
一、棉花價格預測的意義
紡織業(yè)為我國的國民經(jīng)濟發(fā)展提供了強大的動力,棉花作為重要的紡織原料,成為制約行業(yè)發(fā)展的關(guān)鍵因素,其采購成本占用大量資金,棉花價格的波動也影響棉紡織產(chǎn)品的價格和利潤空間。棉紡織企業(yè)很關(guān)注棉花價格,如果能有效預測出棉花的價格區(qū)間,可以助力有關(guān)紡織企業(yè)作出科學的市場判斷和決策,為企業(yè)生產(chǎn)作科學指導。因此,針對國內(nèi)棉花價格預測的重要性也不言而喻,既可以控制產(chǎn)能,又可以進行成本管控,規(guī)避風險。
二、馬爾科夫鏈模型的理論基礎
1.馬爾科夫鏈的定義
俄國數(shù)學家Markov最早提出馬爾科夫性的概念[1],他提出在設定一定的條件下,系統(tǒng)或者隨機過程依賴于現(xiàn)有的狀態(tài),未來狀態(tài)的發(fā)展趨勢只跟現(xiàn)有的狀態(tài)有關(guān),與之前的情況無關(guān)聯(lián),這樣的特性被稱為馬爾科夫性。隨機過程中具有這樣的性質(zhì)被稱為馬爾科夫過程,此過程具有3個典型的特點,分別是離散性、隨機性和無后效性,利用概率對隨機過程中時間預測的這種方法貫穿于馬爾科夫鏈研究過程。
2.馬爾科夫鏈的過程
馬爾科夫鏈是一個隨機過程,設定一組{Xn,n=0,1,2,…},這就是一組隨機變量,Xn是能夠任意取的一個數(shù)值,這被稱為狀態(tài)。在這樣的條件下,這組隨機變量{Xn,n=0,l,2,…}的狀態(tài)轉(zhuǎn)變到另一種狀態(tài),變化的原因與之前的狀態(tài)無關(guān),只與現(xiàn)在的狀態(tài)相關(guān)聯(lián),每一個數(shù)值的變化只與前一個數(shù)值有關(guān),這樣的一個變化過程被稱為馬爾科夫過程[2]。馬爾科夫鏈中有一個隨機概率矩陣P,一組概率向量:X0,X1,X2,…與P相關(guān)聯(lián),得出X1=PX0,X2=PX1,X3=PX2,…因此可以用一階差分方程來表示馬爾科夫鏈:
3.齊次馬爾科夫鏈、轉(zhuǎn)移概率
馬爾科夫鏈在時間和狀態(tài)上都是離散的性質(zhì)[3]。齊次馬爾科夫鏈過程簡單概述為:設定一個馬爾科夫鏈在u這個時間點上所處的狀態(tài)為i,變化到u+t這個時間點處于的狀態(tài)i所關(guān)聯(lián)的轉(zhuǎn)移矩陣,與一開始的時間點u沒有關(guān)聯(lián)。
設所處的狀態(tài)i轉(zhuǎn)移到狀態(tài)j這一步的轉(zhuǎn)移矩陣稱為Pij,則Pij=P{Xn+1=j|Xn=i},i,j=0,1,2,…,依據(jù)線性代數(shù)理論,其轉(zhuǎn)移概率矩陣P:
4.馬氏性檢驗
在正常狀態(tài)下,預測事物變化發(fā)展的狀態(tài),要依靠現(xiàn)有的狀態(tài)和過去的狀態(tài),來預測未來的一個發(fā)展方向。大多數(shù)預測的方法多是依據(jù)這兩種狀態(tài),比如區(qū)間估計、時間序列、方差分析等這些預測方法,都是需要掌握一定時間段內(nèi)的現(xiàn)在和過去的狀態(tài),收集這兩種狀態(tài)所發(fā)生的數(shù)據(jù)資料,以此為基礎利用數(shù)學模型來對未來的發(fā)展趨勢作預測。但是馬爾科夫預測法只需要掌握現(xiàn)有的情況,不需要掌握過去的情況,就可以預測未來的情況,這種無后效性的特征被稱為馬爾科夫性。馬爾科夫性這一典型特征能夠彌補其他預測方法的缺陷,一些無法解決的問題得以解決,在運用和理論上都具有其優(yōu)勢。
運用馬爾科夫鏈模型分析預測實際問題,首要的就是檢驗隨機變量是否具有“馬氏性”。當前大部分研究工作者在運用此模型解決實際問題的時候,可能忽略了要驗證是否具有“馬氏性”,對于分析問題的嚴謹性來說,這是不客觀的,得出的結(jié)論也是不科學的。
5.馬爾科夫鏈模型進行價格預測基本步驟
預測過程如下:
(1)基于有序聚類法,可以將歷史變量分隔成n 個狀態(tài)空間,可用數(shù)字表示;
(2)記錄狀態(tài)轉(zhuǎn)移頻數(shù),得到狀態(tài)轉(zhuǎn)移頻數(shù)矩陣Fij和狀態(tài)轉(zhuǎn)移概率矩陣Pij;
(3)列出邊際概率,計算統(tǒng)計量x2,進行顯著性檢驗,若顯著,則符合馬氏性;
(4)把初始狀態(tài)向量帶入狀態(tài)轉(zhuǎn)移矩陣計算得到預測狀態(tài),即預測價格所在區(qū)間;
(5)預測價格區(qū)間和實際價格對比分析,計算相對、絕對誤差,預測效果說明。
三、棉花價格預測
1.數(shù)據(jù)選取與采集
本文將對在中國棉花協(xié)會網(wǎng)上搜集到的數(shù)據(jù)進行分析,利用馬爾科夫鏈建模預測2020年的棉花價格走勢。根據(jù)研究內(nèi)容共分為2個時間序列。時間序列1用于國內(nèi)棉花價格波動轉(zhuǎn)移概率計算,選取選取2017年~2019年的國內(nèi) CC Index 3128B棉花月度價格指數(shù)增長率(單位:元/噸,下同),共 36 組數(shù)據(jù);時間序列2用于國內(nèi)棉花日度價格轉(zhuǎn)移概率計算,選取2019年 12 月~2020年1月中上旬的國內(nèi) CC Index 3128B(單位:元/噸,下同)棉花當日價格指數(shù),如表2所示共31組數(shù)據(jù)。
2.基于馬爾科夫鏈的棉花月度價格波動狀態(tài)預測
(1)建立棉花月度價格波動狀態(tài)轉(zhuǎn)移矩陣
對棉花月度價格增長率進行有序聚類法分析處理(見表3),可將32組數(shù)據(jù)分為[-10%,-1%)、[-1%,0%)、[0%,1%)、[1%,5%)4個狀態(tài)空間,用數(shù)字“1”“2”“3”“4”表示這4種狀態(tài)。
運用馬爾科夫鏈來預測棉花價格波動的前提是進行馬氏檢驗,檢驗隨機變量序列是否符合馬爾科夫鏈的性質(zhì),符合后才能運用馬爾可夫鏈建立數(shù)學模型分析和解決實際問題。按照公式得出棉花月度價格指數(shù)增長率的狀態(tài)轉(zhuǎn)移概率矩陣,令Pij為第i狀態(tài)轉(zhuǎn)移至1狀態(tài)的概率,求出狀態(tài)轉(zhuǎn)移頻數(shù)矩陣和狀態(tài)轉(zhuǎn)移概率矩陣:
給定顯著性水平α=0.05,查表可得分位點x2α((m-1)2)=x2α(9)=16.919。由于x2=20.5858>x2α((m-1)2),故根據(jù)定理 2 知2017年~2019年月度棉花價格指數(shù)序列滿足馬氏性。
2020年1月增長率初始狀態(tài)向量為(0,0,1,0),根據(jù)公式(3) ,帶入狀態(tài)轉(zhuǎn)移概率矩陣計算得到2020年1~6月度棉花價格走勢預測結(jié)果,見表7。
表6 2020年1月~2月棉花價格波動預測
與實際波動對比結(jié)果
單位:元/噸
月份實際價格 預測狀態(tài)實際狀態(tài)預測概率絕對誤差相對誤差
1 13827[0%,1%) 4.87% 45.45% 673 4.37%
2 13418[0%,1%) -2.96% 33.99% -409 3.46%
表7 2020年1月~8月度棉花價格波動預測結(jié)果表
時間 預測狀態(tài)預測狀態(tài)
1 2 3 4
2020.1[0%,1%) 27.27% 18.18% 45.45% 9.09%
2020.2[0%,1%) 29.16% 23.42% 33.99% 13.43%
2020.3[0%,1%) 28.83% 25.19% 31.78% 14.21%
2020.4[0%,1%) 28.64% 25.62% 31.45% 14.29%
2020.5[0%,1%) 28.58% 25.71% 31.42% 14.29%
2020.6[0%,1%) 28.57% 25.71% 31.43% 14.29%
(2)棉花價格波動預測結(jié)果分析
棉花價格波動預測結(jié)果表明,2020年1月~8月棉花價格指數(shù)的增長率都以大概率落在[0%,1%)區(qū)間內(nèi),棉花價格波動長期趨于穩(wěn)定,呈緩慢上升態(tài)勢,實際情況也表明棉花價格指數(shù)緩慢回升,棉花2020年2月價格13418元/噸較2019年12月價格13154元/噸,2個月總體上升2%,符合預測結(jié)果。由此表明,2020年棉花價格將緩慢地增長,長期看來會以每月[0%,1%)的速率上升,預測的結(jié)果有參考意義。
3.基于馬爾科夫鏈的棉花每日價格預測
(1)建立棉花日度價格狀態(tài)轉(zhuǎn)移矩陣
對棉花日度價格進行有序聚類法分析處理(見表8),可將31組數(shù)據(jù)分為[Min,13100)、[13100,13400)、[15000,16000)、[16000,Max)4個狀態(tài)空間,用數(shù)字“1”“2”“3”“4”表示這4種狀態(tài)。
給定顯著性水平α=0.05,查表可得分位點χx2α((m-1)2)=x2α(9)=16.919。由于x2=65.7918>x2α((m-1)2),故根據(jù)定理 2 知2017年~2019年月度棉花價格指數(shù)序列滿足馬氏性。
2020年1月15日棉花當日價格為13949元,處于第四區(qū)間[16000,Maxprice),帶入初始狀態(tài)向量(0,0,0,1),根據(jù)公式(2-4) 狀態(tài)轉(zhuǎn)移概率矩陣Pij計算得到對未來8日棉花價格的走勢預測,預測結(jié)果如表11所示。
(2)棉花日度價格預測結(jié)果分析
結(jié)果表明(見表11),預測的棉花價格處于[13700,max)區(qū)間,與實際情況基本相符,預測值絕對誤差較小,相對誤差也均小于0.5%。說明馬爾科夫鏈對于日度價格的預測基本準確,從價格指數(shù)波動范圍來分析,棉花月度價格指數(shù)波動大,棉花日度價格指數(shù)波動比較平穩(wěn),結(jié)果表明波動較小的短期棉花價格指數(shù)變化更適合運用馬爾科夫鏈來預測。
四、結(jié)論
利用馬爾科夫鏈建模分析2020年棉花價格指數(shù)走勢情況,結(jié)果表明用馬爾科夫鏈預測受歷史數(shù)據(jù)影響較大,波動較小的短期棉花價格指數(shù)變化更適合運用馬爾科夫鏈來預測。預測的價格在正常情況下是比較平穩(wěn)的,然而棉花這種期貨價格存在太多不確定因素,受人工成本、自然災害、相關(guān)政策影響較大,也受國際事件影響,例如:2019年6月,由于中美貿(mào)易戰(zhàn),導致棉花價格大幅下降,2020年1月,受疫情影響大量生產(chǎn)口罩也使棉花價格有所回升。
參考文獻:
[1]金峻炎,陳進.加權(quán)馬氏鏈在房地產(chǎn)投資回收期預測中的應用[J].湖南科技大學學報(自然科學版),2010,25(2):63~66.
[2]茹正亮,楊芝艷,朱文剛,等.加權(quán)馬爾科夫AR-GARCH-GED模型在降水量中的預測[J].系統(tǒng)工程,2013,31(12):98~102.
[3]王增民,王開玨.基于灰色加權(quán)馬爾可夫鏈的移動通信市場預測[ J].數(shù)學的實踐與認識,2012,42(22):8~15.
作者簡介:1.孫磊,供職于南通市農(nóng)機化技術(shù)推廣中心,碩士。
2.袁欣晨,蘇州大學碩士研究生;研究方向:紡織材料與經(jīng)濟。