• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于B樣條的概率密度函數(shù)非參數(shù)估計

      2022-06-24 05:52:40張夢珠王旭輝
      大學數(shù)學 2022年3期
      關鍵詞:密度估計概率密度函數(shù)概率密度

      張夢珠, 王旭輝

      (合肥工業(yè)大學數(shù)學學院,合肥230601)

      1 引 言

      概率論與數(shù)理統(tǒng)計研究的對象是隨機現(xiàn)象,隨機變量的引進使得對隨機現(xiàn)象結果進行定量的數(shù)學處理成為可能.給定一個隨機變量,其概率分布情況有著廣泛的應用[1].因此獲取其概率分布情況是一個值得研究的課題.在連續(xù)型隨機變量中,密度函數(shù)是一個核心概念[2].現(xiàn)實生活中大量復雜問題其狀態(tài)受到內(nèi)在和外在雙重因素的影響,為了掌握這類事物的內(nèi)在規(guī)律并對未來可能發(fā)生的狀態(tài)變換作出預測,就需要通過數(shù)據(jù)分析、概率建模等方式,尋找一個概率分布.了解隨機變量的概率分布有助于計算分布的均值、方差和進行結構可靠性分析或風險分析[3].此外,銀行學、經(jīng)濟學、生理學等都以概率密度函數(shù)估計為基礎,展開對所在領域的知識和問題的探討與研究[4].但實際生活中,隨機變量的概率分布一般是未知的.事實上,所獲得的只是一個觀察樣本.假設這些數(shù)據(jù)點是一個未知概率密度函數(shù)的樣本,概率密度估計就是從觀測數(shù)據(jù)中構造密度函數(shù)的估計.

      概率密度函數(shù)估計方法主要有三類:參數(shù)化方法、非參數(shù)化方法和半?yún)?shù)估計方法.參數(shù)概率密度函數(shù)估計,總是假設概率密度函數(shù)的參數(shù)形式已知[5],但在實際問題中參數(shù)形式的假設可能會產(chǎn)生誤導的結論或結果.而本文要討論的非參數(shù)密度估計可以避免概率建模和推理中的參數(shù)假設,從而為上述問題提供了新的解決思路[6].非參數(shù)密度估計方法不需要對點樣本分布的參數(shù)形式做事先的假設,而僅僅從采樣數(shù)據(jù)本身對概率密度函數(shù)做出估計.半?yún)?shù)估計是將參數(shù)化估計與非參數(shù)化估計相結合的一種方法.非參數(shù)密度估計是一個持久和不斷發(fā)展的研究領域,在金融、金融計量經(jīng)濟學、物理和社會科學等學科中有著廣泛的應用,它提供了參數(shù)化方法的另一種選擇,在數(shù)據(jù)建模中實現(xiàn)了更大的靈活性,降低了模型誤用的風險.本文重點討論的是單變量密度函數(shù)的非參數(shù)估計.

      20世紀以前,參數(shù)化的概率密度函數(shù)估計方法得到了廣泛的應用.到了20世紀上半葉,不需要對總體特征作假設的非參數(shù)統(tǒng)計方法迅速發(fā)展起來[7].自20世紀50年代以來,已經(jīng)出現(xiàn)了一些強大的方法來提高概率密度估計的性能,而不僅僅是簡單的直方圖表示,還包括正交序列、核函數(shù)和樣條三類非參數(shù)估計方法.直方圖估計的缺點是它的形狀取決于樣本范圍劃分的寬度的主觀選擇,且直方圖密度估計在高維空間很少有實效.參考文獻[8-10]研究的正交序列估計方法用正交級數(shù)(如埃爾米特、傅立葉或三角標準正交函數(shù)系)展開逼近概率密度函數(shù).但其主要缺點是得到的估計結果無法保證滿足概率密度函數(shù)條件(非負且積分為1).關于核密度估計的文獻很廣泛,包括Fix、Hodges[11]、RosenBlatt[12]等.相比于傳統(tǒng)直方圖,核密度估計不僅能更好地分析所研究的概率分布,而且可以生成概率密度函數(shù)的平滑估計[13].核函數(shù)的形狀和平滑系數(shù)是核估計的兩個基本概念,其中平滑系數(shù)是核估計的關鍵.此外,參考文獻[14]提出了一種局部基的非參數(shù)密度估計方法,結合基對偶理論介紹了基于有限維B樣條基投影的伽遼金方法.

      本文結合非參數(shù)密度估計方法,提出了從給定的數(shù)據(jù)樣本中識別連續(xù)隨機變量的概率密度函數(shù)的方法,在信息熵的無偏估計的基礎上,利用內(nèi)點法優(yōu)化得到了B樣條基函數(shù)的對應系數(shù).在數(shù)值實驗部分,本文將基于B樣條的概率密度估計方法與經(jīng)典的核密度估計方法以及正交序列估計方法進行了對比.此外,本文討論了兩個評價指標MAE,MSE用來評估模型的擬合程度.實驗結果表明,基于B樣條的概率密度估計方法取得了較優(yōu)估計效果.

      2 預備知識

      定義1B樣條基函數(shù)的定義如下:

      設U=[u0,u1,…,um+k+1]是非遞減實數(shù)序列,即ui≤ui+1(i=0,1,…,m+k),其中ui稱為節(jié)點,U稱為節(jié)點序列.第i個k次(k+1階)B樣條基函數(shù)Ni,k(t)的遞歸定義如下:

      (1)

      定義2給定節(jié)點向量U=[u0,u1,…,um+k+1],則B樣條函數(shù)的定義為

      其中di∈R(i=0,1,…,m)為控制系數(shù),Ni,k(t)(i=0,1,…,m)為(1)式定義的B樣條基函數(shù).

      3 B樣條函數(shù)的概率密度估計

      給定概率密度函數(shù)一個隨機樣本,設其樣本容量為N.采樣點記為yt(t=1,2,…,N),其中p=min{y1,y2,…,yN},q=max{y1,y2,…,yN}.

      本文使用二次B樣條函數(shù)

      (2)

      (i)βj≥0 (j=1,2,…,M);

      (3)

      為了便于計算,將節(jié)點向量選取為

      U=[p,p,p,u1,u2,…,un,q,q,q],u1

      則(3)式可表示為

      (4)

      (5)

      (6)

      進而,概率密度函數(shù)Φ(y)的最佳估計問題可轉(zhuǎn)換為如下的優(yōu)化問題:

      (7)

      (7)式是一個帶有約束條件的非線性規(guī)劃問題,求解約束非線性規(guī)劃問題的方法主要有Lagrange乘數(shù)法、可行方向法、懲罰函數(shù)法等方法[15].本文利用內(nèi)點法解決該優(yōu)化問題.

      注 文中選擇了二次B樣條基函數(shù)進行估計,也可將其推廣至其它次數(shù)B樣條情形.

      3 數(shù)值實例

      本節(jié)對一些模擬采樣數(shù)據(jù),針對其概率密度函數(shù)進行B樣條估計,求解優(yōu)化問題(7)得到的解為B樣條基函數(shù)的對應系數(shù),從而得到一個估計模型.為了說明本文方法的有效性,與經(jīng)典的核密度估計方法(核函數(shù)為高斯函數(shù))以及正交序列估計方法(傅里葉為正交級數(shù))進行了對比.對于核密度估計方法[13],文中采樣了三種策略進行帶寬選擇,依次為ROT[13],LCV[13],HALL[16].實驗中,本文討論了MAE,MSE兩個評價指標,其中MAE為平均絕對誤差,MSE為均方誤差,其計算公式為:

      本節(jié)實例中樣本量均為800,即N=800,樣本點記為y1,y2,…,yN.記p=min{y1,…,yN},q=max{y1,…,yN}.

      例1隨機變量Y的概率密度函數(shù)ΦY~N(0,4).

      以ΦY~N(0,4)為例說明基函數(shù)個數(shù)M是如何選取的.熵的無偏估計ME越小越好,選取與其對應的基函數(shù)個數(shù)M作為估計模型中B樣條基函數(shù)的個數(shù).圖1表示的是選取不同的基函數(shù)個數(shù)M得到的擬合結果.由表1知,當基函數(shù)個數(shù)M=5擬合效果最佳.

      圖1 ΦY~N(0,4)的擬合結果

      表1 密度函數(shù)ΦY~N(0,4)的計算結果

      例2隨機變量Y的概率密度函數(shù)ΦY~χ2(3).

      圖2 ΦY~χ2(3)的擬合結果

      表2 密度函數(shù)ΦY~χ2(3)的計算結果

      例3隨機變量Y的概率密度函數(shù)ΦY~0.5N(0,1)+0.5N(4,1).

      圖3 ΦY~0.5N(0,1)+0.5N(4,1)的擬合結果

      表3 密度函數(shù)ΦY~0.5N(0,1)+0.5N(4,1)的計算結果

      圖4 ΦY~N(0,3)的擬合結果

      表4 密度函數(shù)ΦY~N(0,3)的計算結果

      4 結 論

      數(shù)值實驗結果表明,由內(nèi)點法作為系數(shù)矢量的優(yōu)化策略的B樣條函數(shù)估計方法取得了不錯的效果.由圖2到圖4和表2到表4,擬合效果以及評價指標MAE,MSE兩方面都表明:本文給出的估計方法相較于核密度估計方法與正交系列估計方法有更好的估計表現(xiàn).但是該方法效率比較低,下一步工作將在此基礎上對如何讓進一步縮短計算時間展開研究.此外,文中選擇了二次B樣條基函數(shù)進行估計,也可將其推廣至其它次數(shù)B樣條情形.

      致謝作者非常感謝相關文獻對本文的啟發(fā)以及審稿專家提出的寶貴意見.

      猜你喜歡
      密度估計概率密度函數(shù)概率密度
      中國人均可支配收入的空間區(qū)域動態(tài)演變與差異分析
      m-NOD樣本最近鄰密度估計的相合性
      面向魚眼圖像的人群密度估計
      冪分布的有效估計*
      基于MATLAB 的核密度估計研究
      科技視界(2021年4期)2021-04-13 06:03:56
      連續(xù)型隨機變量函數(shù)的概率密度公式
      已知f(x)如何求F(x)
      當代旅游(2018年8期)2018-02-19 08:04:22
      Hunt過程在Girsanov變換下的轉(zhuǎn)移概率密度的表示公式
      隨機變量線性組合的分布的一個算法
      隨機結構-TMD優(yōu)化設計與概率密度演化研究
      奇台县| 宝丰县| 娱乐| 内丘县| 平南县| 扎囊县| 南乐县| 获嘉县| 贵港市| 桦南县| 新竹市| 雅安市| 宕昌县| 夏邑县| 额敏县| 分宜县| 武强县| 金湖县| 宁陵县| 泽州县| 东丽区| 汉阴县| 泰兴市| 延吉市| 五寨县| 汶上县| 石屏县| 综艺| 苏尼特右旗| 金川县| 千阳县| 富阳市| 来宾市| 拜泉县| 甘肃省| 襄城县| 大田县| 财经| 新河县| 香格里拉县| 田阳县|