• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      金融指數(shù)的單變點非參數(shù)極大似然估計研究

      2019-03-13 05:54:30陳睿軒田海濤
      統(tǒng)計與決策 2019年3期
      關(guān)鍵詞:變點預(yù)處理程序

      陳睿軒,田海濤,黃 磊

      (西南交通大學(xué) 數(shù)學(xué)學(xué)院,成都 611756)

      0 引言

      變點問題的研究源于實際的需要。自1954年P(guān)age提出變點問題以來,變點問題經(jīng)過長期的研究發(fā)展,已經(jīng)應(yīng)用于諸多領(lǐng)域。在金融計量經(jīng)濟(jì)學(xué)中,變點分析可以用于找出市場(或經(jīng)濟(jì))的發(fā)展方向[1],此外變點分析還能用于找出信用卡詐騙[2]和其他的異常情況。在信號處理方面,對一個圖像流中重要變化的估計是十分重要的問題[3]。在醫(yī)學(xué)上,變點問題在DNA的拷貝數(shù)變異檢測上有了很大的應(yīng)用,而在現(xiàn)代基因芯片技術(shù)所產(chǎn)生的海量數(shù)據(jù)中找出拷貝數(shù)的變異就是變點問題的一個最新的發(fā)展方向[4]。在數(shù)據(jù)挖掘中,變點問題也起著很重要的作用[5]。

      近些年,越來越多的學(xué)者開始研究金融領(lǐng)域的變點問題[6-10]。然而,其研究內(nèi)容都只局限于ARCH、GARCH等參數(shù)模型,很多時候金融市場數(shù)據(jù)往往不能很好地用參數(shù)模型去擬合,這時非參數(shù)的方法就應(yīng)該被考慮到。本文的重點就是研究如何將非參數(shù)的變點方法應(yīng)用到金融指數(shù)數(shù)據(jù),并通過統(tǒng)計模擬實驗和實際數(shù)據(jù)分析說明方法的可行性與實用性。

      由于非參數(shù)方法不對數(shù)據(jù)所服從分布的結(jié)構(gòu)提出任何的參數(shù)假設(shè),其推斷的有效性通常依靠漸進(jìn)的證明,不同累積分布函數(shù)間有任何的差異,都將保證變點被漸進(jìn)地探測出來。又由于非參數(shù)方法不對數(shù)據(jù)的分布做任何的假設(shè),所以它可以靈活地適用于任何的分布。同時,單變點是變點問題研究中最為基礎(chǔ)的問題,且單變點在實際處理數(shù)據(jù)中具有易操作性。因此,單變點非參數(shù)的估計方法是本文研究的重點。

      對于金融領(lǐng)域的時間序列型數(shù)據(jù)而言,數(shù)據(jù)之間往往具有自相關(guān)性。在很多情況下,忽略自相關(guān)性而進(jìn)行模型變點的估計,就會得到有偏差或者不相合的參數(shù)估計值,這將降低模型的預(yù)測能力,該問題可參見文獻(xiàn)[11,12]關(guān)于非線性時間序列模型的研究。因此本文提出一個簡單易行的方法,使得單變點非參數(shù)估計方法能適用于具有自相關(guān)性的金融時間序列數(shù)據(jù)。

      本文中所考慮的金融時間序列數(shù)據(jù)為上證綜合指數(shù)。上證綜合指數(shù)從總體上反映了上海證券交易所上市股票價格的變動情況,也反映了當(dāng)前中國市場的狀況。當(dāng)市場的經(jīng)濟(jì)形式發(fā)生變化,上證綜合指數(shù)也會發(fā)生相應(yīng)的變化,對這種變化的研究是十分有意義的。由于上證綜合指數(shù)數(shù)據(jù)不是一個獨立同分布的數(shù)據(jù),帶有自相關(guān)性,因此不能直接使用非參數(shù)估計方法,需要做相應(yīng)的改進(jìn)。本文的方法能有效地找出上證綜合指數(shù)中存在的變點,這可以對中國經(jīng)濟(jì)的研究起到輔助作用,特別是宏觀經(jīng)濟(jì)調(diào)控效果以及經(jīng)濟(jì)周期的研究。

      1 單變點非參數(shù)極大似然估計

      1.1 單變點問題的定義

      設(shè)X1,X2,…,Xn是隨機(jī)變量的觀測值,一般情況下,假定X1,X2,…,Xn相互獨立。如果X1,…,Xr-1同分布于F,Xr,…,Xn同分布于G,且F≠G,其中r是未知的正整數(shù)(2≤r≤n),稱其為變點。而單變點問題要解決的就是如何有效地估計出r的正確位置。

      對于參數(shù)方法,首先需要假設(shè)F、G屬于一些已知的參數(shù)函數(shù)族。再采用最小二乘法或者極大似然法,并通過一個動態(tài)選擇程序來確定變點。然而參數(shù)方法雖然簡便,但是需要確保對F、G分布假設(shè)的準(zhǔn)確性。當(dāng)假設(shè)不正確時,其估計結(jié)果與真實結(jié)果往往會有很大的偏差,而實際生活中,通常很難得知數(shù)據(jù)所屬的真實分布。由于參數(shù)方法在實際問題中的局限性很大,所以大多時候都采用不需要考慮數(shù)據(jù)所屬分布的非參數(shù)方法。

      1.2 非參數(shù)極大似然方法

      本文的方法是基于Zou等(2014)[13]所提出的非參數(shù)極大似然估計方法并對其進(jìn)行改進(jìn),然后將改進(jìn)后的方法應(yīng)用于單變點問題。這樣做的目的有兩點:第一,對于金融時間序列型數(shù)據(jù),數(shù)據(jù)量往往不大,比如研究股票日收益率,觀測時間長度T取值過大會導(dǎo)致不同區(qū)間的異方差性,參見文獻(xiàn)[14]。因此,在這種情況下,用傳統(tǒng)的圖形技術(shù)就能輕易地探測出變點。而且,對于中等或較小的數(shù)據(jù)樣本,多變點模型會導(dǎo)致過度擬合;第二,對于確實需要進(jìn)行多變點研究的數(shù)據(jù),單變點方法可以通過迭代推廣成多變點方法。因此本文主要研究單變點非參數(shù)極大似然估計,以及其對自相關(guān)金融時間序列數(shù)據(jù)的改進(jìn)。

      假設(shè)Z1,…,Zn獨立同分布于F0,并讓表示該樣本的經(jīng)驗累積分布函數(shù),則有,其中將其看作是有著成功概率(u)的二元數(shù)據(jù)的樣本時,則可以得到非參數(shù)極大對數(shù)似然函數(shù):

      對于單變點問題,由于它是有兩段獨立同分布的數(shù)據(jù)序列拼接而成的,因此可以得到它的聯(lián)合對數(shù)似然函數(shù)(Kn=1):

      為了估計變點1<≤n,在一個積分的形式下將式(1)最大化,得到:

      其中,ω(·)是一些正的權(quán)重函數(shù),所以Rn(·)是有限的,這個積分可以用來結(jié)合所有u的信息。

      它是隨著θ→q1,從兩邊逼近于的,且在q1點處具有極大值。

      其中:

      1.3 參數(shù)選擇

      本文所采用的極大對數(shù)似然方法的一個重要特性是可分離性,因此把任意點看作變點時,它都可以通過動態(tài)規(guī)劃運(yùn)算來計算出一個似然值,并把似然值最大的那個點當(dāng)作估計變點,其總共的計算復(fù)雜度為O(n2)(參見文獻(xiàn)[15,16]的動態(tài)規(guī)劃運(yùn)算的偽代碼)。Hawkings(2001)[15]建議在一個m?n值的坐標(biāo)格中使用動態(tài)規(guī)劃運(yùn)算。Harchaoui和 Levy-Leduc(2010)[17]提出使用一個LASSO型罰參數(shù)的評估值來達(dá)到最小二乘法的一個簡化版本。

      在實際應(yīng)用時,本文采用Zou等(2014)[13]提出的:

      它被認(rèn)為比dω(u)=(u)更有效。

      當(dāng)u∈(-∞,X(1))和u∈(X(n),∞)時(其中:X(1)<…<X(n)表示次序統(tǒng)計量),Lu=0,則式(2)可以改寫成:

      同時,本文使用施瓦茨-貝葉斯信息準(zhǔn)則(BIC)來判斷變點是否存在。如果存在變點,L=1;如果不存在變點,則L=0。

      BIC準(zhǔn)則是主觀貝葉斯派歸納理論的重要組成部分,是最簡單也是最典型的貝葉斯變量選擇的方法。在信息不完全的情況下,本文采用主觀概率來估計那些未知的狀態(tài),然后通過貝葉斯公式對所得概率進(jìn)行修正,最后再利用期望值和修正概率來做出最優(yōu)決策。因此,本文通過最小化BICL來確定L的值:

      并且ζn是一個趨于無窮大的序列。

      Yao(1988)[18]使用ζn=logn的BIC來選擇變點的數(shù)量,并在最小二乘法的框架下顯示出了它的連貫性,因此本文直接使用這個結(jié)果。

      2 統(tǒng)計模擬

      本文將通過模擬研究來測試非參數(shù)方法的一致性和有效性。在模擬研究中,本文將隨機(jī)生成獨立的數(shù)據(jù)序列和經(jīng)典的時間序列。由式(3)和式(4)編寫的程序?qū)?yīng)用于探測變點。

      2.1 改進(jìn)程序1

      在模擬研究中,本文發(fā)現(xiàn)該方法對于變點存在性的判別不夠準(zhǔn)確。當(dāng)模擬的數(shù)據(jù)序列中不存在變點,有時該方法卻判斷出:數(shù)據(jù)序列的前端或尾部存在估計變點。經(jīng)過對數(shù)據(jù)序列的分析后,本文發(fā)現(xiàn)該方法在數(shù)據(jù)序列兩端出現(xiàn)極端值點時易將該極端值點視為變點,形成誤判。所以將該方法加以改進(jìn),當(dāng)估計變點出現(xiàn)在兩端2.5%處的數(shù)據(jù)量范圍內(nèi)時,判斷該段數(shù)據(jù)序列不存在變點,該改進(jìn)方法對應(yīng)的程序稱為改進(jìn)程序1。當(dāng)樣本量特別?。ㄐ∮?000)時,把比例從2.5%提高到5%才能較為有效地減少誤判變點的發(fā)生。同時,采用ζn=(logn)2+c2,(c=0.1),將更為有效[13]。

      2.2 改進(jìn)程序1的獨立數(shù)據(jù)的模擬結(jié)果

      表1記錄了在不同分布和樣本量的情況下,變點估計的均方誤差。在模擬研究中,估計的是θ。樣本量N分別為100、200、400,相應(yīng)的把真實變點設(shè)為51、101、201。所以相應(yīng)的變點分位數(shù)θ為0.51、0.505、0.5025。令估計變點的分位數(shù)為q1,則均方誤差其中,n是模擬的次數(shù),本文中n=200。

      表1 變點估計的均方誤差統(tǒng)計結(jié)果

      由表1可以看出,改進(jìn)程序1用于對常用分布組合的變點估計的準(zhǔn)確度很高,且隨著樣本量的增大,對變點分位數(shù)估計的精度越來越高。因此,對于大多數(shù)獨立數(shù)據(jù)序列變點的探測,改進(jìn)程序1將會給出一個可信的結(jié)果。

      2.3 金融時間序列上的應(yīng)用

      變點問題在時間序列上一直有著廣泛的應(yīng)用,也經(jīng)常需要判斷時間序列中是否存在變點以及變點的位置。但由于金融時間序列數(shù)據(jù)往往具有自相關(guān)性,而該非參數(shù)極大似然的方法要求每段數(shù)據(jù)序列是獨立同分布的,因此,該非參數(shù)方法需要一些改進(jìn)。

      本文使用平穩(wěn)的ARMA模型生成時間序列的隨機(jī)數(shù)據(jù)。自回歸滑動平均模型(Auto-Regressive and Moving Average Model,ARMA模型)是研究時間序列的重要方法,也是研究平穩(wěn)隨機(jī)過程有理譜的典型方法,適用于很大一類實際問題。

      ARMA模型分為以下三種:自回歸模型(Auto-Regressive,AR模型)、移動平均模型-(Moving-Average,MA模型)、自回歸滑動平均模型(ARMA模型)。

      在模擬研究中,本文采用AR模型來生成時間序列的隨機(jī)數(shù)據(jù),之后嘗試直接使用改進(jìn)程序1進(jìn)行變點的估計。結(jié)果顯示,直接使用改進(jìn)程序1來估計變點有著很大的偏差。所以本文決定對數(shù)據(jù)序列進(jìn)行預(yù)處理來減少數(shù)據(jù)間的相關(guān)性,采用差分的方法來對原始時間序列數(shù)據(jù)做預(yù)處理并得到一個新的數(shù)據(jù)序列。把加入預(yù)處理的程序稱為改進(jìn)程序2,模擬結(jié)果記錄在表2中。

      表2 兩種改進(jìn)程序?qū)r間序列變點估計的均方誤差結(jié)果比較

      表2記錄了兩種改進(jìn)程序的變點估計的結(jié)果。表2的結(jié)構(gòu)與表1相同,且樣本的模擬次數(shù)n=200。

      從表2中可以看出,對于時間序列,改進(jìn)程序2比改進(jìn)程序1有著更好的估計結(jié)果。改進(jìn)程序2變點估計的均方誤差更小,估計更準(zhǔn)確,也更令人滿意。因此,本文認(rèn)為,非參數(shù)極大似然方法不能直接用于時間序列的變點估計,但是在做差分的預(yù)處理后,該方法是可行的。雖然在一些情況下,估計結(jié)果不如獨立同分布的數(shù)據(jù)序列的估計結(jié)果好,但是仍然可以接受。對于復(fù)雜的時間序列,估計的偏差總是存在,這可能是因為對于復(fù)雜的時間序列,差分的預(yù)處理并不足以有效地消除數(shù)據(jù)間的相關(guān)性。如果有更為有效的預(yù)處理方法,那么非參數(shù)極大似然方法仍是有效的,這也將是下一步的研究方向。

      3 金融指數(shù)實證分析

      上證綜合指數(shù)反映了上海證券交易所上市股票價格的變動情況,是分析整個市場狀況的一個良好數(shù)據(jù)。本文對2015年4月7日至2017年4月6日的上證綜合指數(shù)(共463個數(shù)據(jù))進(jìn)行分析。由于是金融類的時間序列數(shù)據(jù),所以預(yù)處理采用log差分,即采用Rt=log(Yt)-log(Yt-1),得到回報波動率進(jìn)行考慮。對log差分后的數(shù)據(jù)Rt進(jìn)行自相關(guān)分析(見圖1)。

      圖1 Rt樣本自相關(guān)函數(shù)

      從圖1可以看出,log差分后的數(shù)據(jù)Rt在5階內(nèi)可以認(rèn)為相關(guān)性不顯著,說明用log差分代替差分作為預(yù)處理手段是可行的。之后對Rt進(jìn)行變點的判別。結(jié)果如圖2所示。

      圖2 各變點似然函數(shù)值

      從圖2可以看出,最大值點為228。由于序列中的第1個點是不能作為變點的,所以本文從第2個點開始判斷,圖中顯示的變點228實際上指的是Rt中的第229個點。本文以變點229為分界繪制Rt的數(shù)據(jù),情況如圖3所示。

      圖3 Rt樣本的數(shù)據(jù)分布

      從圖3可以看出,以變點229分割后的兩段Rt數(shù)據(jù)分布有著明顯的不同:第一段數(shù)據(jù)序列的波動性更大,第二段的數(shù)據(jù)序列更為穩(wěn)定。而Rt數(shù)據(jù)序列的變點229對應(yīng)的是2016年3月31日。此結(jié)果與市場的反饋是一致的。

      采購經(jīng)理指數(shù)(PMI:Purchase Management Index)是一套月度發(fā)布的、綜合性的經(jīng)濟(jì)監(jiān)測指標(biāo)體系。PMI有著及時性與先導(dǎo)性、綜合性與指導(dǎo)性、真實性與可靠性、科學(xué)性與合理性、簡單易行五大特點。PMI是經(jīng)濟(jì)回暖的先行指數(shù),對于經(jīng)濟(jì)預(yù)測和商業(yè)分析方面都有著重要的意義。

      通過國家統(tǒng)計局公布的數(shù)據(jù)繪制圖4。

      圖4 制造業(yè)PMI指數(shù)(經(jīng)季節(jié)調(diào)整)

      從圖4可知,2016年3月前的PMI數(shù)據(jù)大多在50%以下,表現(xiàn)出國內(nèi)經(jīng)濟(jì)狀態(tài)的低迷。而在2016年3月,中國制造業(yè)PMI為50.2%,比上月上升1.2個百分點,重回擴(kuò)張區(qū)間。并且從該點開始,其后的PMI數(shù)據(jù)大多在50%以上,這顯示國內(nèi)經(jīng)濟(jì)形勢變好。這與之前的低迷狀況不相同,說明這兩段時期的經(jīng)濟(jì)狀況所屬分布是不同的。這證明了非參數(shù)極大似然方法所找出的變點:2016年3月31日是和市場經(jīng)濟(jì)的宏觀調(diào)控結(jié)果一致的,也說明了該方法在實際應(yīng)用中是可行的。

      4 結(jié)論

      變點問題是當(dāng)前的熱門問題之一,本文采用一種非參數(shù)極大似然方法來解決單變點問題。該非參數(shù)極大似然方法對于獨立數(shù)據(jù)序列的變點判別有著很高的精度。再加入差分作為預(yù)處理手段后,該方法對于金融時間序列數(shù)據(jù)也有著很好的效果。統(tǒng)計模擬顯示,本文所提出的改進(jìn)方法將會獲得更加一致的估計結(jié)果,改進(jìn)后的非參數(shù)極大似然方法在實際數(shù)據(jù)分析中也是可行的。通過對2015年4月7日至2017年4月6日的上證綜合指數(shù)的變點分析,發(fā)現(xiàn)估計變點的結(jié)果與實際PMI指數(shù)的變化是吻合的。變點估計顯示上證綜合指數(shù)在2016年3月31日存在變點,市場在此前后的狀態(tài)是不同的。而實際PMI指數(shù)顯示,市場在2016年3月后經(jīng)濟(jì)形式脫離低迷狀態(tài),重回增長狀態(tài)。由此可見,本文所提出的方法在實際應(yīng)用中的效果明顯,同時也說明對于自相關(guān)的金融時間序列數(shù)據(jù),預(yù)處理的改進(jìn)措施是必要的。改進(jìn)后的非參數(shù)極大似然方法可以做進(jìn)一步拓展使其適用于其他情形,如多元的情況。這些后續(xù)的問題仍需要進(jìn)一步的研究分析。

      猜你喜歡
      變點預(yù)處理程序
      回歸模型參數(shù)的變點檢測方法研究
      正態(tài)分布序列均值變點檢測的貝葉斯方法
      基于二元分割的多變點估計
      獨立二項分布序列變點的識別方法
      試論我國未決羈押程序的立法完善
      “程序猿”的生活什么樣
      基于預(yù)處理MUSIC算法的分布式陣列DOA估計
      英國與歐盟正式啟動“離婚”程序程序
      淺談PLC在預(yù)處理生產(chǎn)線自動化改造中的應(yīng)用
      創(chuàng)衛(wèi)暗訪程序有待改進(jìn)
      尚志市| 喀什市| 海盐县| 上高县| 修武县| 钦州市| 盘锦市| 岫岩| 广汉市| 芜湖市| 呼和浩特市| 双江| 富民县| 昂仁县| 惠水县| 尚义县| 德格县| 孟州市| 蓬莱市| 辛集市| 二手房| 建瓯市| 山丹县| 云梦县| 弥勒县| 星座| 邹平县| 左贡县| 康定县| 方城县| 锦屏县| 华阴市| 凯里市| 柳州市| 晴隆县| 合阳县| 津市市| 潍坊市| 偃师市| 仲巴县| 神木县|