• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于無截?cái)郆artlett核估計(jì)的函數(shù)重構(gòu)方法及其應(yīng)用

      2021-06-29 07:08:08李氣芳蘇梽芳
      關(guān)鍵詞:樣本容量相依協(xié)方差

      李氣芳 ,蘇梽芳,馬 翠

      (1.閩南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,福建漳州363000;2.華僑大學(xué)經(jīng)濟(jì)與金融學(xué)院,福建泉州362021;3.漳州第一職業(yè)中專學(xué)校,福建漳州363000)

      大數(shù)據(jù)時(shí)代,隨著科學(xué)技術(shù)的發(fā)展和存儲(chǔ)技術(shù)的提高,越來越容易收集到函數(shù)型數(shù)據(jù)(Functional Data)[1].函數(shù)型數(shù)據(jù)分析(Functional Data Analysis,F(xiàn)DA)已經(jīng)成為統(tǒng)計(jì)分析的一個(gè)研究熱點(diǎn),廣泛地應(yīng)用到氣象[2]、生物[3-4]、金融[5-8]等領(lǐng)域.

      函數(shù)型數(shù)據(jù)分析的第一步,也是非常重要的一步,是如何利用平滑技術(shù)準(zhǔn)確的把收集到的函數(shù)型數(shù)據(jù)重構(gòu)成函數(shù)曲線,函數(shù)曲線重構(gòu)的好壞直接影響到模型估計(jì)、預(yù)測(cè)等相關(guān)統(tǒng)計(jì)分析.函數(shù)重構(gòu)的方法一般分為兩種:一是利用給定的外生基函數(shù)(如樣條基、傅里葉基等),把函數(shù)曲線重構(gòu)成某種外生基函數(shù)的線性組合[9-10];二是利用內(nèi)生的譜分解方法,對(duì)協(xié)方差函數(shù)進(jìn)行分解,得到正交特征函數(shù)(函數(shù)主成分),再利用K-L 展開式來重構(gòu)函數(shù)曲線[11-12].外生基函數(shù)的重構(gòu)方法與數(shù)據(jù)本身無關(guān),而內(nèi)生的函數(shù)主成分方法是數(shù)據(jù)本身驅(qū)動(dòng)的,所以該方法越來越受專家學(xué)者青睞.

      然而,實(shí)際的數(shù)據(jù)分析中,經(jīng)常會(huì)收集到一些函數(shù)型數(shù)據(jù),由于系統(tǒng)慣性或時(shí)間上的延續(xù)性等原因,它們之間具有一定的相依性,比如經(jīng)濟(jì)金融等領(lǐng)域的高頻數(shù)據(jù).此時(shí),樣本協(xié)方差函數(shù)不再是總體協(xié)方差函數(shù)的一致估計(jì)量.如果還利用獨(dú)立同分布下的協(xié)方差函數(shù)計(jì)算得到的函數(shù)主成分來重構(gòu)函數(shù)曲線是不夠準(zhǔn)確的,也會(huì)導(dǎo)致后續(xù)的統(tǒng)計(jì)分析出現(xiàn)偏差.針對(duì)這種函數(shù)型數(shù)據(jù),Hormann 等[13]、Kokoszka 等[14]提出可以利用長(zhǎng)期協(xié)方差函數(shù)代替協(xié)方差函數(shù)來修正.但是長(zhǎng)期協(xié)方差函數(shù)的估計(jì)面臨著核函數(shù)和最優(yōu)窗寬的選擇問題.如果核函數(shù)和最優(yōu)窗寬選擇不合適,同樣會(huì)造成一定的估計(jì)誤差.

      于是,本文把Kiefer[15]研究多元回歸模型中長(zhǎng)期協(xié)方差估計(jì)的方法推廣到函數(shù)型數(shù)據(jù)情形,提出基于無截?cái)唳rtlett 核的函數(shù)重構(gòu)方法,該估計(jì)方法是基于無截?cái)唳rtlett 核的,不需要選擇核函數(shù)和窗寬.從理論上講,它比傳統(tǒng)的長(zhǎng)期協(xié)方差函數(shù)估計(jì)方法要簡(jiǎn)便、合理,避免了選擇核函數(shù)和窗寬的人為主觀因素.最后,通過Monte Carlo模擬和實(shí)例進(jìn)行了對(duì)比分析.

      1 函數(shù)重構(gòu)

      1.1 基于協(xié)方差函數(shù)的函數(shù)重構(gòu)

      設(shè)Xi(t)(i= 1,2,…,n)為滿足如下條件的函數(shù)型數(shù)據(jù),即當(dāng)h≠0時(shí),有

      它的均值函數(shù)和協(xié)方差函數(shù)分別為

      協(xié)方差函數(shù)滿足特征方程

      從特征方程中解出正交的特征函數(shù)(函數(shù)主成分)?k(t)和特征值λk,代入K-L展開式可以得到重構(gòu)函數(shù)為

      其中(ξik,k≥1 )是獨(dú)立的隨機(jī)變量序列,E(ξik)= 0,var(ξik)=λk.函數(shù)主成分得分為

      實(shí)際問題分析中,當(dāng)收集到觀測(cè)數(shù)據(jù)后,可以計(jì)算樣本協(xié)方差函數(shù)

      其中K是由方差比例(累積貢獻(xiàn)率)決定的,一般選取δ≥0.90.

      1.2 基于長(zhǎng)期協(xié)方差函數(shù)的函數(shù)重構(gòu)

      當(dāng)收集到的是金融等領(lǐng)域中的函數(shù)型數(shù)據(jù)時(shí),因?yàn)榻鹑谙到y(tǒng)慣性,數(shù)據(jù)之間具有相依特征,即當(dāng)h≠0時(shí),有

      此時(shí)的樣本協(xié)方差函數(shù)不再是總體協(xié)方差函數(shù)的一致估計(jì)量.Hormann 等[13]、Kokoszka 等[14]等提到可以利用長(zhǎng)期協(xié)方差函數(shù)代替協(xié)方差函數(shù)來修正.

      長(zhǎng)期協(xié)方差函數(shù)定義如下:

      其中Γ0= c(s,t),Γh(s,t)為自協(xié)方差函數(shù)

      當(dāng)收集到觀測(cè)數(shù)據(jù)后,利用核函數(shù)法對(duì)長(zhǎng)期協(xié)方差函數(shù)進(jìn)行估計(jì):

      雖然長(zhǎng)期協(xié)方差函數(shù)可以很好的刻畫相依的函數(shù)型數(shù)據(jù),但是對(duì)于長(zhǎng)期協(xié)方差函數(shù)的估計(jì)面臨核函數(shù)和最優(yōu)窗寬的選擇.常用的核函數(shù)是Newey-West估計(jì)

      利用Newey-West估計(jì)得到樣本長(zhǎng)期協(xié)方差函數(shù)后,就可以計(jì)算得到對(duì)應(yīng)的主成分函數(shù)(t)和特征值,那么函數(shù)可以重構(gòu)為

      1.3 基于Βartlett核估計(jì)的函數(shù)重

      Kiefer 等[15]研究了k元回歸模型中長(zhǎng)期協(xié)方差估計(jì)的問題,構(gòu)造一個(gè)基于無截?cái)唳rtlett 核的長(zhǎng)期協(xié)方差估計(jì)統(tǒng)計(jì)量,不需要選擇核函數(shù)和窗寬.長(zhǎng)期協(xié)方差的具體表達(dá)式為

      式(1)是直接對(duì)自變量向量進(jìn)行估計(jì)得到長(zhǎng)期協(xié)方差矩陣,我們把向量推廣到無窮維的函數(shù).如果只討論時(shí)點(diǎn)變量s和t之間的長(zhǎng)期協(xié)方差,有

      那么,樣本長(zhǎng)期協(xié)方差函數(shù)的估計(jì)式可推廣為

      利用式(2)對(duì)長(zhǎng)期協(xié)方差函數(shù)進(jìn)行估計(jì)后,就可以計(jì)算得到對(duì)應(yīng)的函數(shù)主成分?(t)和特征值,進(jìn)而求得函數(shù)主成分得分,最后把函數(shù)重構(gòu)為

      2 數(shù)值模擬與分析

      利用Monte Carlo 模擬的方法對(duì)三種方法的函數(shù)重構(gòu)效果進(jìn)行比較分析.選取積分平方誤差平方根(XRISE)來評(píng)價(jià)函數(shù)重構(gòu)效果,具體公式如下:

      2.1 數(shù)據(jù)生成

      為保證生成的函數(shù)型數(shù)據(jù)是相依的,借鑒Kokoszka等[14]的做法,數(shù)據(jù)由一階函數(shù)自回歸模型FAR(1)產(chǎn)生.其中誤差項(xiàng)εn(t)為標(biāo)準(zhǔn)正態(tài)分布,t在區(qū)間[0,1]上等間隔取101 個(gè)點(diǎn).樣本容量n取30、50、100、200、300,每個(gè)樣本容量下模擬200次.

      為了保證方法的穩(wěn)健性,回歸系數(shù)函數(shù)選擇兩種形式:

      1)借鑒Kokoszka等[14]的做法,令β1(s,t)= 0.5st;

      2)借鑒Horváth等[16]的做法,令β2(s,t)=

      具有的數(shù)值模擬步驟如下:

      步驟1:利用標(biāo)準(zhǔn)正態(tài)分布生成(n+30)*101個(gè)隨機(jī)誤差數(shù)據(jù),由FAR(1)模型生成(n+30)*101個(gè)自變量數(shù)據(jù).

      步驟2:為保證數(shù)據(jù)的客觀性,去掉前30條曲線數(shù)據(jù),訓(xùn)練集選取n*101個(gè)樣本數(shù)據(jù).

      步驟3:不考慮樣本的相依性,利用獨(dú)立同分布條件下的協(xié)方差函數(shù)得到函數(shù)主成分,然后利用函數(shù)主成分進(jìn)行函數(shù)重構(gòu)得到(t).

      步驟4:考慮樣本的相依性,利用Newey-West估計(jì)式來估計(jì)長(zhǎng)期協(xié)方差函數(shù),然后利用函數(shù)主成分進(jìn)行函數(shù)重構(gòu)得到(t).

      步驟5:考慮樣本的相依性,利用本文基于無截?cái)唳rtlett核的方法估計(jì)長(zhǎng)期協(xié)方差函數(shù),然后利用函數(shù)主成分進(jìn)行函數(shù)重構(gòu)得到(t).

      步驟6:計(jì)算積分平方誤差平方根(XRISE),并重復(fù)步驟1-5共200次,計(jì)算平均的XRISE.

      步驟7:替換回歸系數(shù)函數(shù)β2(s,t),重復(fù)上述步驟.

      2.2 結(jié)果分析

      模擬結(jié)果見表1 和表2.FPC 表示獨(dú)立同分布條件下基于協(xié)方差函數(shù)的重構(gòu)方法,NW 表示基于Newey-West 估計(jì)式的長(zhǎng)期協(xié)方差函數(shù)重構(gòu)方法,WTΒ 表示基于無截?cái)唳rtlett 核的長(zhǎng)期協(xié)方差函數(shù)重構(gòu)方法.

      表1 β1(s,t)下積分平方誤差平方根(XRISE)的均值Tab.1 Mean of XRISE under β1(s,t)

      表2 β2(s,t)下積分平方誤差平方根(XRISE)的均值Tab.2 Mean of XRISE under β2(s,t)

      從表1可以看出:1)每個(gè)樣本容量下,三種函數(shù)重構(gòu)方法的誤差很接近;2)每個(gè)樣本容量下,考慮樣本相依性的估計(jì)方法NW 和WTΒ 比沒有考慮樣本相依性的方法FPC 的函數(shù)重構(gòu)誤差要小;3)隨著樣本容量的增加,三種函數(shù)重構(gòu)方法的誤差都有上升的趨勢(shì).

      同樣,從表2 也可以看出:1)每個(gè)樣本容量下,三種函數(shù)重構(gòu)方法的誤差很接近;2)每個(gè)樣本容量下,考慮樣本相依性的估計(jì)方法NW 和WTΒ 比沒有考慮樣本相依性的方法FPC 的函數(shù)重構(gòu)誤差要??;3)隨著樣本容量的增加,三種函數(shù)重構(gòu)方法的誤差都有上升的趨勢(shì).

      綜合表1 和表2,每個(gè)樣本容量下,本文提出的基于無截?cái)唳rtlett 核的長(zhǎng)期協(xié)方差重構(gòu)方法WTΒ 比現(xiàn)有的其他兩種函數(shù)重構(gòu)方法的誤差要小,具有一定的穩(wěn)健性.

      3 實(shí)例分析

      本文選取2018年滬深300 的5 分鐘數(shù)據(jù),一共有242 個(gè)交易日,每個(gè)交易日有48 個(gè)數(shù)據(jù).數(shù)據(jù)來源銳思金融數(shù)據(jù)庫(RESSET).每天共48個(gè)數(shù)據(jù)可以看成是由隨機(jī)函數(shù)曲線生成的函數(shù)型變量Xi(t)的一個(gè)樣本,基于R語言,對(duì)數(shù)據(jù)取對(duì)數(shù),分別選取200、220、242天數(shù)據(jù)利用前文介紹的不同方法進(jìn)行函數(shù)重構(gòu),函數(shù)重構(gòu)誤差見表3.

      表3 數(shù)據(jù)重構(gòu)誤差均值Tab.3 Mean of data reconstruction error

      從表3可以看出,隨著樣本容量的增加,三種函數(shù)重構(gòu)方法的重構(gòu)誤差都在增加.在每個(gè)樣本容量下,本文提出的基于無截?cái)唳rtlett核的長(zhǎng)期協(xié)方差重構(gòu)方法WTΒ比現(xiàn)有的其他兩種函數(shù)重構(gòu)方法的誤差要小,其他兩種方法的函數(shù)重構(gòu)誤差幾乎一樣.

      函數(shù)重構(gòu)誤差小,說明方法利用觀測(cè)到的離散數(shù)據(jù)重構(gòu)的函數(shù)更加準(zhǔn)確,基于更加準(zhǔn)確的重構(gòu)函數(shù)進(jìn)行的函數(shù)回歸分析、函數(shù)假設(shè)檢驗(yàn)等也會(huì)更加可靠.

      4 結(jié)論

      本文把基于無截?cái)唳rtlett 核的長(zhǎng)期協(xié)方差估計(jì)方法推廣到函數(shù)型數(shù)據(jù)情形,提出了基于無截?cái)唳rtlett核的函數(shù)重構(gòu)方法,并通過兩種Monte Carlo模擬和2018年滬深300高頻數(shù)據(jù)進(jìn)行了對(duì)比分析.數(shù)值模擬和實(shí)例分析均表明:1)三種函數(shù)重構(gòu)方法的誤差很接近;2)提出的基于無截?cái)唳rtlett核的長(zhǎng)期協(xié)方差重構(gòu)方法WTΒ比現(xiàn)有的其他兩種函數(shù)重構(gòu)方法的誤差要小;3)隨著樣本容量的增加,三種函數(shù)重構(gòu)方法的誤差都有上升的趨勢(shì);4)方法具有一定的穩(wěn)健性和有效性.

      猜你喜歡
      樣本容量相依協(xié)方差
      采用無核密度儀檢測(cè)壓實(shí)度的樣本容量確定方法
      家國兩相依
      相守相依
      相依相隨
      特別文摘(2016年18期)2016-09-26 16:43:49
      相依相伴
      特別文摘(2016年15期)2016-08-15 22:11:53
      不確定系統(tǒng)改進(jìn)的魯棒協(xié)方差交叉融合穩(wěn)態(tài)Kalman預(yù)報(bào)器
      一種基于廣義協(xié)方差矩陣的欠定盲辨識(shí)方法
      廣義高斯分布參數(shù)估值與樣本容量關(guān)系
      多種檢測(cè)目標(biāo)下樣本容量設(shè)計(jì)的比較
      縱向數(shù)據(jù)分析中使用滑動(dòng)平均Cholesky分解對(duì)回歸均值和協(xié)方差矩陣進(jìn)行同時(shí)半?yún)?shù)建模
      涞源县| 黔南| 宣汉县| 鄂伦春自治旗| 临沭县| 阿克苏市| 康定县| 永泰县| 淮阳县| 贡嘎县| 宜昌市| 卓尼县| 浦江县| 措美县| 阜康市| 盘山县| 阿克陶县| 长兴县| 永嘉县| 尖扎县| 靖西县| 兰溪市| 梧州市| 天等县| 竹溪县| 莱芜市| 孟连| 灵山县| 麻城市| 文成县| 财经| 山阳县| 靖江市| 林州市| 黄陵县| 栖霞市| 珠海市| 凌源市| 建水县| 江西省| 广昌县|