• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      運用RJMCMC 方法對上證指數(shù)連漲連跌收益率的Bayes 分析

      2023-12-09 08:03:12程慧慧許淑月
      溫州大學學報(自然科學版) 2023年4期
      關鍵詞:變點伽馬后驗

      程慧慧,許淑月

      (華北水利水電大學數(shù)學與統(tǒng)計學院,河南 鄭州 452370)

      變點是指觀測序列值在某一個位置或時間點發(fā)生了分布或者數(shù)字特征的突然變化,這個發(fā)生突變的位置或時間點就被稱為變點.不考慮可能的變點就進行統(tǒng)計分析很可能會得到具有誤導性的結(jié)果,因此關于變點問題的研究在金融、醫(yī)學、氣象學等方面有著廣泛的應用價值.變點問題的研究始于Page[1]在1954 年發(fā)表的一篇關于連續(xù)抽樣檢驗的文章,人們通過檢測產(chǎn)品質(zhì)量是否超過控制范圍來判斷產(chǎn)品質(zhì)量是否發(fā)生顯著波動,當產(chǎn)品質(zhì)量超過控制范圍就認為發(fā)生質(zhì)變,質(zhì)變的時刻就稱為變點。隨后變點問題受到了很多學者的重視并在理論[2-3]和應用[4-5]方面有了快速發(fā)展,處理變點問題的方法[6-10]也得到了進一步的完善.陳希孺等[6]利用局部法研究了變點問題;James 等[7]使用似然比方法檢驗多元正態(tài)分布中變點是否存在;Chemoff 等[8]應用貝葉斯(Bayes)方法檢驗正態(tài)分布中變點是否存在;李拂曉等[9]使用二元分割方法來檢驗多元Logistic 回歸模型中存在的變點;陳睿軒等[10]利用非參數(shù)極大似然方法來估計金融時間序列中的變點.馬爾可夫鏈蒙特卡洛(Markov Chain Monte Carlo,MCMC)方法是一種重要的貝葉斯計算方法,可將貝葉斯統(tǒng)計中復雜的計算簡單化,在變點個數(shù)已知情形下,使用MCMC 方法可使變點檢測變得更加簡便.張晗等[11]在艾拉姆咖分布單變點模型中運用MCMC 方法得到了變點位置的有效估計;石凱等[12]采用MCMC 方法為多維混合分布數(shù)據(jù)的參數(shù)估計和識別提供了一種有效的解決途徑;胡紅波[13]將MCMC 方法運用到不確定評估的測量中,并介紹了關于指數(shù)分布的采樣實例.1995 年Green[14]提出了可逆跳躍馬爾可夫鏈蒙特卡洛(Reversible Jump MCMC,RJMCMC)方法,該方法實現(xiàn)了抽樣過程在不同維數(shù)的參數(shù)子空間之間跳躍,十分適用于變點個數(shù)未知情形下的變點檢測.Zhao 等[15]在層次貝葉斯框架下利用RJMCMC 算法識別極端事件序列中的多個突變狀態(tài),石永亮[16]利用RJMCMC 算法對線性回歸模型的異常點進行識別,范元靜[17]利用RJMCMC 算法確定泊松分布參數(shù)多變點模型中變點的個數(shù)并得到了參數(shù)估計.

      股票收益率的波動一定程度上反映了股票的內(nèi)在規(guī)律[18-20].通常股票收益率會受一些重大事件或政策的影響,由此產(chǎn)生一系列異常點,即變點.由雷鳴等[21]的研究可知,上證指數(shù)的連漲連跌收益率都服從伽馬分布.關于伽馬分布參數(shù)變點的研究,已有一些結(jié)果,如文獻[22-26]討論了典型的伽馬分布序列中的單變點問題,Hsu[26]討論了在伽馬分布的形狀參數(shù)已知時,檢測伽馬隨機變量序列中尺度參數(shù)偏移的方法,并將其應用于股票市場收益率和交通流的分析中.但有關伽馬分布雙參數(shù)的多變點的研究還是比較少.2017 年胡俊迎[27]在變點模型中假設形狀參數(shù)不發(fā)生變化,利用RJMCMC 算法對2005 年6 月至2015 年5 月的上證指數(shù)進行了研究,但是這樣可能會忽略股市大勢的影響.因此本文考慮在不限于形狀參數(shù)不發(fā)生變化的情形下,建立伽馬分布雙參數(shù)的多變點模型,利用RJMCMC 方法確定模型的變點個數(shù)并得到變點位置的估計,最后將該方法應用到對上證指數(shù)連漲連跌數(shù)據(jù)序列的分析中.

      1 連漲連跌收益率的理論分布與檢驗

      本文研究了從2016 年5 月3 日至2022 年5 月20 日的上證股指,采用對數(shù)收益率作為每日收益率Rt,即Rt=lnPt-lnPt-1,其中Pt為每日收盤價.雷鳴等[21]由每日收益率Rt得到了連漲連跌的收益率,也就是統(tǒng)計每次股指開始上漲至上漲結(jié)束時收益率的和(連漲收益率),以及股指開始下跌至下跌結(jié)束時收益率的和(連跌收益率).他們還把生存分析引入到對股指的研究中,將連漲收益率和連跌收益率看作是兩個不同的生存過程,這樣連續(xù)漲跌的收益率就可被視為每次漲跌的壽命.由此,本文得到連漲連跌數(shù)據(jù)序列,見表1 和圖1.

      圖1 上證指數(shù)連漲連跌收益率數(shù)據(jù)序列

      表1 2016 年5 月3 日至2022 年5 月20 日上證指數(shù)連漲連跌收益率

      譚長春等[22]研究發(fā)現(xiàn),伽馬分布可以很好地擬合連漲連跌收益率分布.設Y總體服從伽馬分布,其概率密度函數(shù)為:

      2 基于RJMCMC 下的伽馬分布雙參數(shù)的變點研究

      2.1 建立伽馬分布雙參數(shù)的變點模型

      為了方便,規(guī)定c0= 0,ck+1=n,其中,變點個數(shù)k以及變點位置c1,c2, … ,ck都是未知的,那么關于伽馬分布雙參數(shù)多變點模型,需要估計的參數(shù)有3(k+1) 個,分別是變點個數(shù)k,變點位置c1,c2,… ,ck,形狀參數(shù)v1,v2,…,vk+1和尺度參數(shù)λ1,λ2, …,λk+1.

      2.2 RJMCMC 方法介紹

      貝葉斯統(tǒng)計學是基于總體信息、樣本信息、先驗信息進行的統(tǒng)計推斷.設參數(shù)θ的先驗信息分布為π( )θ,隨機變量θ給定值時,總體的條件概率函數(shù)為p(x| )θ.樣本X和參數(shù)θ的聯(lián)合分布為h(X,θ)=p(X|θ)π(θ),利用貝葉斯公式

      對參數(shù)θ進行統(tǒng)計推斷.(2)式中m(X) 是樣本X的邊際密度函數(shù),m(X) 不含關于θ的任何信息.本文數(shù)據(jù)序列的參數(shù)θ={k,c1,c2, …,ck,v1,v2, …,vk+1,λ1,λ2, …,λk+1}.

      在實際問題中,上述后驗密度分布(2)通常是比較復雜的未知形式,RJMCMC 方法作為一種重要的貝葉斯方法可以很好地解決這一難題,它以目標后驗分布作為平穩(wěn)分布的馬爾可夫鏈生成隨機數(shù),代替從后驗分布中直接抽取樣本.

      基于RJMCMC 下的伽馬分布參數(shù)的變點分析,需要確定選取各參數(shù)的先驗分布.可考慮各參數(shù)的先驗分布如下.

      1)變點個數(shù)k服從截斷的泊松分布為標準化常數(shù),kmax,α為給定的超參數(shù).

      2)從離散的均勻分布{0,1,2,3, …,n}上產(chǎn)生2k+ 1個順序統(tǒng)計量,c1,c2,… ,ck作為其中的偶數(shù)階統(tǒng)計量,其中0

      3)取形狀參數(shù) {v1,v2,… ,vk+1}獨立同分布于形狀參數(shù)a和尺度參數(shù)b的Gamma 分布且均與變點位置相互獨立,則vj~Gamma(a,b),j=1,2, …,k+1.

      4)取尺度參數(shù){λ1,λ2, …,λk+1}獨立同分布于形狀參數(shù)c和尺度參數(shù)d的Gamma 分布且均與變點位置相互獨立,則λj~Gamma(c,d),j=1,2, …,k+1.

      由貝葉斯分層理論,可得所有未知參數(shù)的聯(lián)合先驗分布:

      再結(jié)合總體信息、樣本信息得到參數(shù)后驗分布的核密度函數(shù):

      接下來設計下面的移動類型來改變馬爾可夫鏈的狀態(tài){k,c1…ck,v1…v k+1,λ1…λk+1}.

      (a)任意改變一個形狀參數(shù)值;

      (b)任意改變一個尺度參數(shù)值;

      (c)任意改變一個變點的位置;

      (d)在{1,2, …,n}{c1,c1, …,ck}上任意選擇新增加一個;

      (e)在 {c1,c1, …,ck}中任意選擇減少一個.

      需要得到每種移動下的接受概率.

      若m=(a),假定vj被選擇,新的形狀參數(shù)滿足=v j×eu且u是一個隨機樣本服從區(qū)間為[-0.5,0.5]的均勻分布.為了計算簡便,選取的建議分布為q(vj,)=,則此種移動下的接受概率Pallow=min{1,A1},這里

      同理,若m=(b),Pallow=min{1,A2},這里

      若m=(c),從c1,c2, …,ck中任意選擇cj發(fā)生改變,新的變點位置為.選cj-1+ 1,cj-1+2, …,cj+1-1上的離散均勻分布為建議分布經(jīng)計算,可得接受概率Pallow=min{1,A3},這里,當

      對于m=(d),假設在區(qū)間(c j-1,cj)上增加一個變點c*,則在區(qū)間(c j-1,c*)和(c*,cj)上會產(chǎn)生新的參數(shù)()和(),且vj在和之間,其關系用權重方式表示為:

      經(jīng)計算,似然比可直接表示為

      先驗比為

      因此隨機增加一個新變點c*的接受概率為Pallow=min{1,A4},這里

      其中l(wèi).r.、p.r.、pro.r.、Jacobian 分別表示似然比、先驗比、建議比、雅可比行列式.

      針對m=(e),假設隨機選擇被減去的變點為cj,則區(qū)間(c j-1,c j,cj+1)變?yōu)?c j-1,cj+1).假設(v j′ ,λj′ ),(vj+1′,λj+1′ )為區(qū)間(c j-1,c j,cj+1)上的舊參數(shù),(v j,λj)為區(qū)間(c j-1,cj+1)上的新參數(shù),同理可得,隨機減少變點cj的可接受概率為Pallow=min{1,A5},這里

      2.3 數(shù)值模擬

      隨機生成含有400 個數(shù)據(jù)的Gamma 分布序列,分為3段,1―100,101―200,201―400,數(shù)據(jù)分別服從Gamma(1,1),Gamma(2,8),Gamma(5,15).3 段數(shù)據(jù)的參數(shù)不一致,可見存在2 個變點,分別在100 處和200 處.400 個隨機數(shù)據(jù)模擬圖如圖2(a)所示.設定參數(shù)的初始值k= 3,c1=20,c2=50,c3=200,超參數(shù)kmax= 10,α= 5,a=25/4,b=5/4,c= 3,d= 1.迭代10 000 次算法,去掉前7 000 次,用后3 000次的結(jié)果來估計變點個數(shù)的后驗概率,得出的變點個數(shù)估計如圖2(b)所示.

      圖2 變點在(100, 200)的Gamma 分布數(shù)據(jù)模擬圖及變點個數(shù)估計直方圖

      由圖2(b)可知,變點個數(shù)為2 的后驗概率最大,因此確定400 個Gamma 分布序列的變點個數(shù)為2.在變點個數(shù)的基礎上進一步利用MCMC 方法估計變點位置參數(shù)和Gamma 分布參數(shù).通過R 軟件實現(xiàn)模擬,在模擬過程中進行40 000 次迭代抽樣.為保證參數(shù)的收斂性,舍棄前20 000次抽樣,根據(jù)后20 000 次結(jié)果進行統(tǒng)計分析.形狀參數(shù)、尺度參數(shù)和位置參數(shù)的后驗密度估計如圖3 和圖4 所示.由圖3(a)可知,形狀參數(shù)的后驗密度分布有3 個峰,分別在1、2、5 附近;由圖3(b)可知,尺度參數(shù)的后驗密度分布有3 個峰,分別在1、8、15 附近.由圖4 可知,變點位置的后驗密度分布有2 個峰,分別在100、200 附近.以上數(shù)據(jù)與模擬的真實變點位置及所服從的Gamma 分布參數(shù)相符,這說明了算法對Gamma 分布雙參數(shù)多變點檢測的有效性.

      圖3 形狀參數(shù)和尺度參數(shù)的后驗密度分布

      圖4 兩變點位置的后驗密度分布及迭代圖

      3 實證檢驗與分析

      通過對上證指數(shù)的連漲連跌收益率進行KS 檢驗,發(fā)現(xiàn)其分布仍服從伽馬分布,則在此基礎上運用上述的RJMCMC 變點理論方法對服從伽馬分布的數(shù)據(jù)序列作參數(shù)變點檢驗.

      由上述RJMCMC 方法分別對連漲連跌收益率先進行變點個數(shù)的確定,然后進一步利用MCMC 方法得到變點位置參數(shù)和分布參數(shù)的后驗估計.同樣地先將方法進行10 000 次迭代去掉前7 000 次,確定變點個數(shù),在此基礎上再進行40 000 次迭代抽樣并舍棄前20 000 次,根據(jù)后20 000 次抽樣結(jié)果進行統(tǒng)計分析,結(jié)果如圖5(a)、圖6(a)所示.由圖5 可看出,連漲數(shù)據(jù)序列存在2 個變點,變點位置分別在81,191(對應日期分別為2018 年3 月8 日,2020 年7 月31日);由圖6 可看出,連跌數(shù)據(jù)序列存在3 個變點,變點位置分別在70,190,264(對應日期分別為2017 年12 月14 日,2020 年8 月2 日,2022 年1 月25 日).

      圖5 連漲收益率數(shù)據(jù)序列的參數(shù)變點檢驗圖

      圖6 連跌收益率數(shù)據(jù)序列的參數(shù)變點檢驗圖

      從上述的實證結(jié)果來看,連漲收益率與連跌收益率數(shù)據(jù)的前兩個變點與實際情況是基本吻合的,也就是說股市在2018 年初以及2020 年下半年不論漲跌都發(fā)生了較大幅度的震蕩.首先,2016年到2017 年年末這段時間內(nèi)沒有變點,剛好對應著股市長達近兩年的慢牛行情.其次,連漲的第一個變點在2018 年3 月8 日附近,連跌的第一個變點在2017 年年末,都剛好處于2018 年中美貿(mào)易戰(zhàn)爆發(fā)的時間端口.連漲和連跌的第二個變點集中在2020 年8 月初附近.2019 年末國內(nèi)爆發(fā)新冠疫情,隨后疫情肆虐全球,全球經(jīng)濟不斷下行.在2020 年下半年,隨著我國疫情逐漸好轉(zhuǎn),民眾的恐慌心理得以緩解,我國股市也開始一路小漲,呈現(xiàn)穩(wěn)中向好的趨勢.第二個變點時間也都正好與2020 年8 月中國首個新冠疫苗被授予專利權以及數(shù)字人民幣試點開始實施等的時間點相對應.最后關于連跌數(shù)據(jù)序列最后一個變點2022 年1 月25 日,應該與2022 年美聯(lián)儲的多次加息、疫情的不斷反復、俄烏沖突的不斷升級以及1 月全球股市大跌相關.

      4 結(jié) 語

      本文針對上證指數(shù)收益率數(shù)據(jù),基于伽馬分布雙參數(shù)多變點模型,首先通過建立RJMCMC方法來得到數(shù)據(jù)序列中的變點個數(shù)及變點位置的后驗估計,然后對上證指數(shù)的連漲連跌收益率進行實證分析,判斷上證指數(shù)收益率是否存在變點,確定變點的個數(shù)及位置,進一步分析由此給股市帶來的變化.分析結(jié)果證明了該方法的有效性,也說明了金融序列中變點發(fā)生的時間與國際經(jīng)濟環(huán)境、國家宏觀經(jīng)濟、國家重大政策等存在必然的聯(lián)系.變點的產(chǎn)生意味著股票市場不正常的劇烈波動,蘊藏著股票市場的未來趨勢.因此,基于RJMCMC 算法對金融序列中變點問題進行研究,有利于分析股市變化,可以為投資者提供一定的理論依據(jù),對合理度量市場風險、進行風險管理有一定的理論和現(xiàn)實意義.

      猜你喜歡
      變點伽馬后驗
      “拉索”精確測量最亮伽馬暴
      軍事文摘(2024年4期)2024-03-19 09:40:02
      宇宙中最劇烈的爆發(fā):伽馬暴
      軍事文摘(2023年18期)2023-10-31 08:11:44
      回歸模型參數(shù)的變點檢測方法研究
      正態(tài)分布序列均值變點檢測的貝葉斯方法
      基于對偶理論的橢圓變分不等式的后驗誤差分析(英)
      基于二元分割的多變點估計
      河南科學(2020年4期)2020-06-03 07:18:22
      獨立二項分布序列變點的識別方法
      貝葉斯統(tǒng)計中單參數(shù)后驗分布的精確計算方法
      Understanding Gamma 充分理解伽馬
      一種基于最大后驗框架的聚類分析多基線干涉SAR高度重建算法
      雷達學報(2017年6期)2017-03-26 07:53:04
      两当县| 遵义市| 肇东市| 吉林市| 鹤岗市| 武宣县| 新河县| 岫岩| 巴林左旗| 双辽市| 石狮市| 凤翔县| 广西| 双峰县| 梁河县| 肃南| 陆良县| 阿勒泰市| 曲阜市| 安陆市| 安塞县| 江安县| 绥中县| 济宁市| 金堂县| 桃园市| 岱山县| 昭通市| 集安市| 江华| 丘北县| 紫阳县| 永安市| 昌黎县| 曲沃县| 湛江市| 本溪市| 乌拉特前旗| 无为县| 来宾市| 荔浦县|