• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      多元零膨脹Poisson-Lindley分布

      2022-06-24 09:01:54熊朝松黃希芬
      高師理科學(xué)刊 2022年5期
      關(guān)鍵詞:置信區(qū)間參數(shù)估計計數(shù)

      熊朝松,黃希芬

      多元零膨脹Poisson-Lindley分布

      熊朝松,黃希芬

      (云南師范大學(xué) 數(shù)學(xué)學(xué)院,云南 昆明 650500)

      零值過多的多元計數(shù)數(shù)據(jù)出現(xiàn)在生活中的各個領(lǐng)域,這類數(shù)據(jù)成為了統(tǒng)計學(xué)研究的一個熱點.基于隨機(jī)表示提出了一個新的多元零膨脹Poisson-Lindley分布,主要用于研究存在過度分散的多元計數(shù)數(shù)據(jù),進(jìn)一步討論了其相關(guān)統(tǒng)計性質(zhì),構(gòu)造EM算法獲得參數(shù)的極大似然估計.通過2組隨機(jī)模擬試驗驗證了參數(shù)估計方法能得到穩(wěn)定有效的結(jié)果,真實數(shù)據(jù)分析結(jié)果表明,多元零膨脹Poisson-Lindley分布在數(shù)據(jù)處理中具有較強的實用性.

      多元計數(shù)數(shù)據(jù);隨機(jī)表示;多元零膨脹Poisson-Lindley分布;EM算法

      實際生活中經(jīng)常能觀測到許多非負(fù)整數(shù)的計數(shù)數(shù)據(jù),這類數(shù)據(jù)廣泛存在于臨床醫(yī)學(xué)、公共衛(wèi)生、生態(tài)環(huán)境、生物研究、金融保險、計量經(jīng)濟(jì)學(xué)和農(nóng)牧業(yè)等諸多領(lǐng)域,具有重要的研究價值和實際意義.目前,對于觀測到的計數(shù)數(shù)據(jù),學(xué)者們普遍利用統(tǒng)計學(xué)中的經(jīng)典離散分布進(jìn)行分析研究,如Poisson分布和Negative Binomial分布等.然而,在生產(chǎn)生活中會產(chǎn)生各式各樣的數(shù)據(jù),其中有很多數(shù)據(jù)不具備經(jīng)典離散分布的結(jié)構(gòu),因此不能很好地被擬合分析.為了應(yīng)對不同類型的計數(shù)數(shù)據(jù),學(xué)者們通過廣義一般化、混合模型、復(fù)合技術(shù)和離散化連續(xù)分布等方法開發(fā)出了不同的離散分布,如廣義Poisson分布、有限維混合分布[1]、離散化泊松-指數(shù)混合分布[2]等.Sankaran[3]利用復(fù)合技術(shù),在假設(shè)Poisson分布的參數(shù)服從Lindley分布[4]形式的條件下,得到了一個單參數(shù)的離散Poisson-Lindley分布.由于該分布的期望小于其方差,因此在擬合過度分散的計數(shù)數(shù)據(jù)時,具有很好的靈活性.在Sankaran提供的實例分析中Poisson-Lindley分布比Poisson分布擬合得更好,且與雙參數(shù)的Hermite分布和Negative Binomial分布的擬合效果大致相同.該離散分布的提出為模擬計數(shù)數(shù)據(jù)提供了一個新的有效思路,并在大量的實踐中驗證了其優(yōu)秀的擬合效果[5-6].

      在實際遇到的計數(shù)數(shù)據(jù)中,過量零的出現(xiàn)引起了人們的關(guān)注,這類數(shù)據(jù)中零值的數(shù)量超過了一般離散分布隨機(jī)產(chǎn)生的數(shù)量,呈現(xiàn)出過分散特征,學(xué)者們將此現(xiàn)象稱為零膨脹(zero-inflated,ZI)現(xiàn)象.用于分析零膨脹數(shù)據(jù)的零膨脹模型具有很長的研究歷史,最早可以追溯到20世紀(jì)60年代,直至今日仍是統(tǒng)計學(xué)研究的熱點.Cohen[7]討論了零膨脹Poisson(ZIP)分布;Lambert[8]等討論了帶有協(xié)變量的ZIP回歸模型并應(yīng)用于制造缺陷數(shù)據(jù);Minami[9]等研究了零膨脹Negative Binomial(ZINB)分布模型,并利用其對鯊魚捕獲數(shù)據(jù)進(jìn)行建模分析;在文獻(xiàn)[3]提出的Poisson-Lindley分布模型的基礎(chǔ)上,Xavier[10]等拓展了適用于零膨脹和零欠缺(zero-deflated)情形的零修正Poisson-Lindley(ZMPL)分布模型,并在2組真實數(shù)據(jù)中驗證了ZMPL模型的良好效果.

      在觀測到零膨脹計數(shù)數(shù)據(jù)的同時,往往包含了不同方面的記錄情況,同時這些不同方面的數(shù)據(jù)之間存在一定的關(guān)系.如在制造業(yè)中制造產(chǎn)品時發(fā)生不同類型缺陷的數(shù)量,在車禍?zhǔn)鹿手胁煌闆r傷害(財產(chǎn)或人身)的數(shù)量等.此時如果分別使用一元的分布模型擬合多方面數(shù)據(jù),得到的分析結(jié)果往往無法解釋其中隱藏的數(shù)據(jù)關(guān)聯(lián),顯得過于片面,因此開發(fā)多元零膨脹計數(shù)模型是必要的.Li[11]等提出了一個多元零膨脹Poisson分布來建模分析制造業(yè)數(shù)據(jù)中過多零的情況;Gomez[12]等討論了Poisson-Lindley分布的多元情況,能夠應(yīng)用于邊際過度離散的多元相關(guān)計數(shù)數(shù)據(jù),并給出了該多元分布的相關(guān)性質(zhì)和估計方法;Liu[13]等利用隨機(jī)表示構(gòu)造了一種新的多元ZIP分布,相對于文獻(xiàn)[11]所給的多元零膨脹Poisson分布,該分布在數(shù)據(jù)分析中擬合性能更好.受到文獻(xiàn)[13]所考慮的多元零膨脹Poisson分布的啟發(fā),本文利用隨機(jī)表示開構(gòu)造了多元零膨脹Poisson-Lindley分布(多元ZIPL分布),來擬合更多的多元零膨脹計數(shù)數(shù)據(jù).同時,給出多元ZIPL分布的相關(guān)統(tǒng)計性質(zhì)及其參數(shù)估計方法,利用自助抽樣法構(gòu)造估計的置信區(qū)間.最后,通過隨機(jī)模擬試驗和一組真實數(shù)據(jù)來評估多元ZIPL分布的性能.

      1 多元零膨脹Poisson-Lindley分布

      1.1 概率質(zhì)量函數(shù)和累積分布函數(shù)

      綜上可知

      1.2 混合矩和矩生成函數(shù)

      1.3 邊際分布

      2 似然推斷

      2.1 EM算法

      對應(yīng)的對數(shù)似然函數(shù)為

      2.2 自助抽樣置信區(qū)間

      3 隨機(jī)模擬

      每組實驗重復(fù)進(jìn)行1 000次模擬,計算出參數(shù)估計的平均偏差(BIAS)和均方誤差(MSE),最終結(jié)果見表1~2.

      表1 第1組實驗二元ZIPL分布參數(shù)極大似然估計結(jié)果

      表2 第2組實驗三元ZIPL分布參數(shù)極大似然估計結(jié)果

      由表1~2可以看出,在不同組合下參數(shù)估計值均能收斂到給定的真值.同時,隨著樣本的增加,BIAS和MSE均在減小,表明參數(shù)估計的效果越來越好,越穩(wěn)定地接近真實值.

      4 實例分析

      4.1 澳大利亞健康調(diào)查數(shù)據(jù)

      利用本文提出的模型方法研究Cameron[15]等提供的一項健康調(diào)查數(shù)據(jù)的一個子集,過去兩天的處方藥總數(shù)和非處方藥物總數(shù).網(wǎng)站http://cameron.econ.ucdavis.edu/racd2/RACD2programs.html可以獲取到關(guān)于原始數(shù)據(jù)集的具體細(xì)節(jié).

      表3 處方藥總數(shù)和非處方藥物總數(shù)的交叉表

      各個參數(shù)的極大似然估計(MLE),自助抽樣樣本的標(biāo)準(zhǔn)差(SD),以及2種置信水平為95%自助抽樣置信區(qū)間見表4.

      表4 參數(shù)的極大似然估計值及其置信區(qū)間

      注:95%自助抽樣置信區(qū)間I由式(12)計算得到;95%自助抽樣置信區(qū)間II由式(13)計算得到.

      4.2 模型選擇

      分別使用了二元零膨脹Poisson分布[12]和二元Poisson-Lindley分布[13]擬合此數(shù)據(jù)集,并與本文提出的二元零膨脹Poisson-Lindley分布進(jìn)行比較,采用Akaike 信息準(zhǔn)則(AIC)和Bayes 信息準(zhǔn)則(BIC)驗證本

      文提出的模型的有效性.各模型模擬的AIC和BIC值見表5.

      表5 模型選擇結(jié)果

      由表5可以看出,二元零膨脹Poisson-Lindley分布的AIC和BIC值均小于其他2個模型,表明本文提出的分布模型擬合效果更好,更適用于該數(shù)據(jù)集.

      5 結(jié)語

      本文根據(jù)隨機(jī)表示提出了結(jié)構(gòu)簡單、解釋性強的多元零膨脹Poisson-Lindley分布模型,研究了包括概率質(zhì)量函數(shù)、累積分布函數(shù),矩和矩生成函數(shù),邊際分布等在內(nèi)的統(tǒng)計性質(zhì).利用EM算法研究了多元零膨脹Poisson-Lindley分布似然推斷,推導(dǎo)出了方便計算的參數(shù)估計式,并通過2組仿真模擬驗證了估計的有效性.利用提出的模型進(jìn)行實例分析,在與其它2種模型比較中,AIC和BIC模型選擇方法均選擇了本文所提出的二元零膨脹Poisson-Lindley分布.在今后的研究中,為了適應(yīng)生活中更多的多元計數(shù)數(shù)據(jù),可以考慮多元零調(diào)整Poisson-Lindley分布擬合零過多和零欠缺情況.

      [1] 全星澄,李?。贓M算法的有限維混合分布參數(shù)估計研究[J].統(tǒng)計與決策,2017,33(12):25-29.

      [2] 任美芳,劉祿勤.離散化泊松-指數(shù)混合分布的性質(zhì)和參數(shù)估計[J].統(tǒng)計與決策,2019,35(19):25-29.

      [3] Sankaran M.The discrete Poisson-Lindley distribution[J].Biometrics,1970,26(1):145-149.

      [4] 劉晏辰,代瑩,王蓉華,等.Lindley分布的統(tǒng)計分析[J].統(tǒng)計與決策,2017,33(18):77-80.

      [5] Ghitany M E,Al-Mutairi D K.Estimation methods for the discrete Poisson–Lindley distribution[J].Journal of Statistical Computation & Simulation,2009,79(1):1-9.

      [6] Al-Babtain A A,Gemeay A M,Afify A Z.Estimation Methods for the Discrete Poisson-Lindley and Discrete Lindley Distributions with Actuarial Measures and Applications in Medicine[J].Journal of King Saud University - Science,2021,33(2):101224.

      [7] Cohen A C.Estimation in mixtures of discrete distributions[C]//Classical and contagious discrete distributions.Calcutta: Statistical Pub. Society,1963:373-378.

      [8] Lambert D,Zero-Inflated P R.With an Application to Defects in Manufacturing[J].Technometrics,1992,34(1): 1-14.

      [9] Minami M,Lennert-Cody C E,Gao W,et al.Modeling shark bycatch:The zero-inflated negative binomial regression model with smoothing[J].Fisheries Research,2007,84(2):210-221.

      [10] Xavier D,Santos-Neto M,Bourguignon M,et al.Zero-Modified Poisson-Lindley distribution with applications in zero-inflated and zero-deflated count data[J/OL].Methodology,2017(12)[2017-12-12].https://arxiv.org/abs/1712.04088.

      [11] Li C S,Lu J C,Park J,et al.Multivariate Zero-Inflated Poisson Models and Their Applications[J].Technometrics,1999,41(1):29-38.

      [12] Gomez-Deniz E,Sarabia J M,Balakrishnan N.A multivariate discrete Poisson-Lindley distribution:extensions and actuarial applications[J].ASTIN Bulletin,2012,42(2): 655-678.

      [13] Liu Y,Tian G L.Type I multivariate zero-inflated Poisson distribution with applications[J].Computational Statistics & Data Analysis,2015,83:200-222.

      [14] 王博.基于EM算法的多水平零膨脹負(fù)二項混合效應(yīng)回歸模型的參數(shù)估計[J].高師理科學(xué)刊,2019,39(3):10-14.

      [15] Cameron A C,Trivedi P K.Regression analysis of count data[M].2nd ed.New York:Cambridge university press,2013.

      Multivariate zero-inflated Poisson-Lindley distribution

      XIONG Chaosong,Huang Xifen

      (School of Mathematics,Yunnan Normal University,Kunming 650500,China)

      Multivariate count data with excessive zero values appear in various fields of life,and this kind of data has become a hot spot in statistical research.Based on random representation,a new multivariate zero-inflated Poisson-Lindley distribution is proposed,which is mainly used to study multivariate count data with excessive dispersion,and its related statistical properties are further discussed.Finally,the EM algorithm is constructed to obtain the maximum likelihood estimation of parameters.Two groups of random simulation experiments show that the parameter estimation method can obtain stable and effective results.The real data analysis results show that the multivariate zero-inflated Poisson-Lindley distribution has strong practicability in data processing.

      multivariate count data;stochastic representation;multivariate zero-inflated Poisson-Lindley distri-

      1007-9831(2022)05-0005-07

      O212

      A

      10.3969/j.issn.1007-9831.2022.05.002

      bution;EM algorithm

      2021-12-03

      熊朝松(1997-),男,湖北荊門人,在讀碩士研究生,從事數(shù)理統(tǒng)計研究.E-mail:chsoxiong@163.com

      黃希芬(1988-),女,云南昆明人,講師,博士,從事生存分析研究.E-mail:xf_yellow@126.com

      猜你喜歡
      置信區(qū)間參數(shù)估計計數(shù)
      定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
      基于新型DFrFT的LFM信號參數(shù)估計算法
      古人計數(shù)
      p-范分布中參數(shù)的置信區(qū)間
      多個偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
      遞歸計數(shù)的六種方式
      古代的計數(shù)方法
      列車定位中置信區(qū)間的確定方法
      這樣“計數(shù)”不惱人
      Logistic回歸模型的幾乎無偏兩參數(shù)估計
      平乐县| 兰坪| 襄樊市| 白河县| 东城区| 彰化市| 淄博市| 阿城市| 吉水县| 江门市| 增城市| 鄂尔多斯市| 门源| 盈江县| 璧山县| 周口市| 蒙山县| 正宁县| 阿鲁科尔沁旗| 石柱| 大化| 抚顺市| 托克托县| 阿拉善左旗| 额敏县| 高唐县| 环江| 榆树市| 枞阳县| 兴山县| 伊宁市| 丽江市| 宜州市| 开原市| 保山市| 松滋市| 定兴县| 葫芦岛市| 丹巴县| 万宁市| 井陉县|