• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      面向貝葉斯方法的作戰(zhàn)試驗(yàn)樣本量估算研究*

      2022-04-27 09:04:14廖學(xué)軍白洪波
      火力與指揮控制 2022年3期
      關(guān)鍵詞:后驗(yàn)樣本量貝葉斯

      薄 云,廖學(xué)軍,白洪波,白 宇

      (1.航天工程大學(xué)研究生院,北京 101416;2.中國白城兵器試驗(yàn)中心,吉林 白城 137001;3.航天工程大學(xué)航天保障系,北京 102206;4.國防大學(xué)聯(lián)合勤務(wù)學(xué)院,北京 100039)

      0 引言

      貝葉斯方法作為一套重要的數(shù)據(jù)分析與決策支持框架,以知識(shí)更新的方式,融合了多種來源的信息,不僅利于減少試驗(yàn)的樣本需求量,而且它的推理過程和推理結(jié)果比數(shù)理統(tǒng)計(jì)具有更加明確的概率含義,既便于理解,也便于推廣應(yīng)用。但貝葉斯方法需要計(jì)算非常復(fù)雜的數(shù)學(xué)期望,因此,在計(jì)算機(jī)普及之前,它的應(yīng)用通常只限于基于共軛分布的有限范圍。這也是自它創(chuàng)立以來,少有武器裝備試驗(yàn)鑒定相關(guān)實(shí)踐的原因。

      作戰(zhàn)試驗(yàn)是我軍武器裝備試驗(yàn)鑒定體制機(jī)制改革引入的新型試驗(yàn)。通過組織作戰(zhàn)人員在模擬實(shí)戰(zhàn)條件下“試用”被試武器裝備,判斷該武器裝備對(duì)于既定作戰(zhàn)任務(wù)的完成程度和適用程度,進(jìn)而輔助決策是否應(yīng)當(dāng)大批量采購該武器裝備,表現(xiàn)出高度實(shí)戰(zhàn)化的特征。這一方面保證了作戰(zhàn)和裝備管理部門可以在和平環(huán)境下,以理性的方式遴選出最適用于戰(zhàn)場的武器裝備,另一方面也使得作戰(zhàn)試驗(yàn)的組織過程耗資巨大、組織艱難且具有很高的危險(xiǎn)性。因此,以盡可能少的試驗(yàn)次數(shù),獲取足夠的輔助決策數(shù)據(jù),即科學(xué)估算樣本量,是作戰(zhàn)試驗(yàn)策劃中的重中之重。

      考慮到貝葉斯方法在數(shù)據(jù)分析和決策支持方面的優(yōu)勢,且隨著計(jì)算手段的不斷豐富,尤其是各類馬爾科夫鏈蒙特卡羅方法的引入,為貝葉斯方法在試驗(yàn)鑒定領(lǐng)域的廣泛應(yīng)用提供了可能,我軍后續(xù)的作戰(zhàn)試驗(yàn)也勢必會(huì)增大相關(guān)應(yīng)用比重,而當(dāng)前的相關(guān)研究主要集中于貝葉斯方法的基本原理和應(yīng)用框架的論述,比較缺乏樣本量估算方面的研究,因此,本文分析了貝葉斯方法在作戰(zhàn)試驗(yàn)中的兩種主要應(yīng)用模式,其次探討了作戰(zhàn)試驗(yàn)樣本量估算的基本準(zhǔn)則,接著根據(jù)準(zhǔn)則分別給出了兩種應(yīng)用模式下的樣本量估算方法步驟,最后通過算例展示了這些樣本量估算方法的有效性和可拓展性,從而可為我軍后續(xù)相關(guān)實(shí)踐提供良好參考。

      1 作戰(zhàn)試驗(yàn)中的貝葉斯方法

      截止目前,試驗(yàn)鑒定所依據(jù)的各類經(jīng)典數(shù)理統(tǒng)計(jì)方法基本上都可以在貝葉斯方法中找到對(duì)應(yīng)版本,而且在諸如可靠性這樣需要融合多源信息的應(yīng)用場合中,貝葉斯方法的解決方案通常要優(yōu)于經(jīng)典數(shù)理統(tǒng)計(jì)。所以,本節(jié)參照經(jīng)典數(shù)理統(tǒng)計(jì)在作戰(zhàn)試驗(yàn)中的應(yīng)用情況,概述未來貝葉斯方法在作戰(zhàn)試驗(yàn)中的可能應(yīng)用模式,并概述相應(yīng)的處理過程。

      1.1 兩種應(yīng)用模式

      當(dāng)前作戰(zhàn)試驗(yàn)分解武器裝備作戰(zhàn)需求形成指標(biāo)體系,通過試驗(yàn)獲取底層指標(biāo)數(shù)據(jù),以某種效能評(píng)估方法評(píng)估武器裝備的作戰(zhàn)效能和作戰(zhàn)適用性。在此過程中,底層指標(biāo)數(shù)據(jù)的獲取是各層級(jí)作戰(zhàn)效能與作戰(zhàn)適用性評(píng)估的基礎(chǔ)。貝葉斯方法在作戰(zhàn)試驗(yàn)中的應(yīng)用,也聚焦于這些底層指標(biāo),具體有兩種模式。

      一是推斷考核指標(biāo)是否達(dá)到并超過合同規(guī)定。作戰(zhàn)試驗(yàn)需要對(duì)照被試武器裝備的研制總要求、試驗(yàn)鑒定總案和具體的試驗(yàn)方案,對(duì)被試武器裝備的大量作戰(zhàn)效能和作戰(zhàn)適用性指標(biāo)進(jìn)行考核。其基本途徑就是根據(jù)實(shí)裝試驗(yàn)數(shù)據(jù),判斷被試武器裝備是否達(dá)到并超過合同規(guī)定。在這一過程中,應(yīng)用的統(tǒng)計(jì)學(xué)工具主要是各類假設(shè)檢驗(yàn)。

      二是給出裝備參數(shù)滿足規(guī)定精度的數(shù)值估計(jì)。除了考核武器裝備是否達(dá)到并超過研制合同規(guī)定的各項(xiàng)指標(biāo)之外,作戰(zhàn)試驗(yàn)還有可能針對(duì)武器裝備未來的作戰(zhàn)應(yīng)用,或是產(chǎn)品型號(hào)的升級(jí)改進(jìn),而對(duì)武器裝備的一些重要參數(shù)進(jìn)行探索性摸底。在這一過程中,應(yīng)用的統(tǒng)計(jì)學(xué)工具主要是區(qū)間估計(jì)。

      1.2 處理過程概述

      首先是推斷的處理過程。如前所述,作戰(zhàn)試驗(yàn)在推斷武器裝備的某項(xiàng)指標(biāo)是否達(dá)到合同規(guī)定時(shí),通常使用的統(tǒng)計(jì)學(xué)工具是假設(shè)檢驗(yàn),即根據(jù)統(tǒng)計(jì)法則,判斷武器裝備的作戰(zhàn)試驗(yàn)數(shù)據(jù)是否支持指標(biāo)通過考核的結(jié)論。在貝葉斯的方法框架下,可以利用貝葉斯因子開展類似的推斷過程,但更直觀的處理方式通常如下頁圖1 所示。

      圖1 基于貝葉斯方法的作戰(zhàn)試驗(yàn)指標(biāo)推斷過程

      第1 步,確定一個(gè)指標(biāo)規(guī)定值的等效區(qū)間(Region of Practical Equivalence,ROPE)。例如合同規(guī)定被試武器裝備的毀傷概率應(yīng)大于0.75,試驗(yàn)中,定義該指標(biāo)的ROPE 為[0.745,0.755],即認(rèn)為在實(shí)踐中,從0.745 ~0.755 之間的毀傷概率和0.75 的毀傷概率并沒有實(shí)質(zhì)區(qū)別。

      第2 步,根據(jù)武器裝備性能試驗(yàn)或模擬仿真的結(jié)果,確定該指標(biāo)的先驗(yàn)分布和似然函數(shù)。例如beta 分布與n 重貝努利分布的分布律。

      第3 步,依據(jù)作戰(zhàn)試驗(yàn)采集的實(shí)裝數(shù)據(jù),按照貝葉斯法則計(jì)算指標(biāo)后驗(yàn)分布,并在該分布中求取指定后驗(yàn)概率的最高密度區(qū)間(Highest Density Interval,HDI)。例如滿足95%后驗(yàn)概率的分布,且概率密度最高的區(qū)間范圍。

      第4 步,比對(duì)該HDI 是否超過ROPE,且相互不重疊。如果答案是肯定的,則認(rèn)為作戰(zhàn)試驗(yàn)數(shù)據(jù)支持該指標(biāo)達(dá)到合同規(guī)定要求,并且該論斷的正確概率大于95%。

      其次是估計(jì)的計(jì)算過程。從推斷的計(jì)算過程可以看出,當(dāng)不考慮ROPE,仍然按照上述流程組織試驗(yàn),并由后驗(yàn)分布計(jì)算得出的HDI 實(shí)際上就是符合特定概率要求的指標(biāo)估計(jì)。

      由于經(jīng)典數(shù)理統(tǒng)計(jì)的區(qū)間估計(jì)表達(dá)的含義是在所有按照統(tǒng)計(jì)模型計(jì)算得出的數(shù)值區(qū)間中,有置信概率的區(qū)間包含了真實(shí)的指標(biāo)值,但當(dāng)前得出的置信區(qū)間是否包含指標(biāo)真值卻無從得知;而HDI 表達(dá)的含義是根據(jù)最新數(shù)據(jù)對(duì)于先驗(yàn)知識(shí)的更新,指標(biāo)具有最高概率的區(qū)間即為HDI,從而更加符合一般人對(duì)于指標(biāo)“置信”區(qū)間的認(rèn)識(shí),因此,從這個(gè)意義上說,HDI 對(duì)于非數(shù)據(jù)專業(yè)人士的決策輔助更加直接有效。

      2 相應(yīng)的樣本量估算研究

      2.1 估算的準(zhǔn)則

      1)基于統(tǒng)計(jì)功效。即假設(shè)檢驗(yàn)備擇假設(shè)為真時(shí),正確拒絕原假設(shè)的概率。由于試驗(yàn)的結(jié)果受隨機(jī)性的影響,并不總能真實(shí)反映被考核指標(biāo)的真實(shí)情況,所以經(jīng)典的數(shù)理統(tǒng)計(jì)和貝葉斯方法都定義了統(tǒng)計(jì)功效的概念,來量化試驗(yàn)結(jié)果對(duì)于真實(shí)情況的捕獲能力。文獻(xiàn)[12-14]論證了統(tǒng)計(jì)功效與結(jié)果正確性之間的交互關(guān)系,指出統(tǒng)計(jì)功效低下的試驗(yàn)會(huì)得出具有誤導(dǎo)性的結(jié)論,并指出即使是國際頂級(jí)期刊,其發(fā)布的很多研究結(jié)論由于試驗(yàn)統(tǒng)計(jì)功效低下而可能是錯(cuò)誤的??紤]到實(shí)施作戰(zhàn)試驗(yàn)的目的是通過考核武器裝備決策是否大批量采購并部署武器裝備,所以它的結(jié)論的正確性關(guān)系到戰(zhàn)爭的勝敗和戰(zhàn)士的生死。因此,考慮面向貝葉斯方法的作戰(zhàn)試驗(yàn)樣本量的估算問題時(shí),也應(yīng)當(dāng)把滿足統(tǒng)計(jì)功效作為選取樣本量的客觀標(biāo)準(zhǔn)。

      2)區(qū)分應(yīng)用模式。經(jīng)典數(shù)理統(tǒng)計(jì)的統(tǒng)計(jì)功效被定義為原假設(shè)不真實(shí)時(shí),正確拒絕原假設(shè)的概率。而在貝葉斯的方法框架下,需要區(qū)分具體的應(yīng)用是上述的推斷問題還是估計(jì)問題。

      對(duì)于面向推斷的貝葉斯方法來說,它的統(tǒng)計(jì)功效實(shí)際上是在給定先驗(yàn)信息和似然函數(shù)的前提下,后驗(yàn)HDI 可以超出ROPE 并不與其相交的概率。

      對(duì)于面向估計(jì)的貝葉斯方法來說,它的統(tǒng)計(jì)功效則是在給定先驗(yàn)信息和似然函數(shù)的前提下,后驗(yàn)HDI 的寬度小于指定精度要求的概率。

      3)投入最少原則。一般來說,可以通過3 個(gè)因素提升特定試驗(yàn)的統(tǒng)計(jì)功效,①降低試驗(yàn)的干擾因素影響;②提升數(shù)據(jù)采集的精度;③增加樣本量。由于前兩個(gè)因素在試驗(yàn)開始前已經(jīng)固定,所以只能通過第3 條途徑,也就是通過增加樣本量提升試驗(yàn)的統(tǒng)計(jì)功效。而作戰(zhàn)試驗(yàn)耗資巨大,且具有一定的危險(xiǎn)性,所以在試驗(yàn)具有一定的統(tǒng)計(jì)功效,可以確保數(shù)據(jù)質(zhì)量的前提下,應(yīng)當(dāng)遵從投入最小原則,即樣本量應(yīng)當(dāng)盡可能地小。

      2.2 估算的方法步驟

      第1 步,根據(jù)性能試驗(yàn)、仿真試驗(yàn)、甚至是類似裝備的已有數(shù)據(jù),確定待考核指標(biāo)的驗(yàn)前分布。

      第2 步,根據(jù)被試裝備的最新狀態(tài),估計(jì)待考核指標(biāo)各生成參數(shù)的概率分布。

      第3 步,由這些參數(shù)的概率分布,生成N 組參數(shù)的隨機(jī)值,再由每組參數(shù)的隨機(jī)值生成s 個(gè)該考核指標(biāo)的模擬值。

      第4 步,把這些模擬值當(dāng)做實(shí)際采集的裝備數(shù)據(jù),結(jié)合第一步確定的先驗(yàn)分布,利用貝葉斯法則,計(jì)算指標(biāo)的后驗(yàn)分布。如果這其中有n 個(gè)后驗(yàn)分布達(dá)成目標(biāo),則該試驗(yàn)的統(tǒng)計(jì)功效約為β=n/N。

      第5 步,判斷該統(tǒng)計(jì)功效是否達(dá)到要求,如沒有,則令s=s+1,返回第3 步,直至統(tǒng)計(jì)功效達(dá)到要求,此時(shí)的s 即為所求的樣本量。

      3 算例演示

      通過前述可以看出,作戰(zhàn)試驗(yàn)中基于貝葉斯方法的考核在進(jìn)行樣本量估算時(shí),主要是利用仿真,模擬作戰(zhàn)試驗(yàn)的數(shù)據(jù)采集過程,然后通過分析這些仿真結(jié)果來估算考核的統(tǒng)計(jì)功效,并令能夠達(dá)到統(tǒng)計(jì)功效要求的最小樣本量為所求的樣本量。同樣,這里的樣本量計(jì)算也需要區(qū)分考核是基于貝葉斯方法的推斷問題還是估計(jì)問題。

      3.1 針對(duì)統(tǒng)計(jì)推斷的樣本量估算演示

      假設(shè)研制總要求規(guī)定某型衛(wèi)星通信終端通話質(zhì)量的滿意度大于80%,則估算過程如下:

      第1 步:定義為滿意度水平,利用性能試驗(yàn)、仿真試驗(yàn)的已有數(shù)據(jù),確定待考核指標(biāo)的驗(yàn)前分布為服從形狀參數(shù)為106 與19 的beta 分布。

      第2 步:通過該型衛(wèi)星通信終端性能改進(jìn)的最新情況,估計(jì)生成的概率分布的眾數(shù)Omega 和聚集參數(shù)Kappa 分別服從形狀參數(shù)為96、6 的beta 分布和形狀參數(shù)為2 000 、尺度參數(shù)為1 的gamma 分布,而實(shí)際生成的作戰(zhàn)試驗(yàn)數(shù)據(jù)服從以p 為參數(shù),以樣本量s 為規(guī)模的二項(xiàng)分布。

      第3 步:由第2 步估計(jì)的各分布模擬生成試驗(yàn)數(shù)據(jù)。通過觀察圖2 左上角的分圖,發(fā)現(xiàn)當(dāng)模擬次數(shù)達(dá)到3 000 次時(shí),仿真結(jié)果基本完成收斂,僅在很小的范圍內(nèi)上下波動(dòng)。因此,樣本量估算的數(shù)據(jù)分析皆基于3 000 次仿真模擬的試驗(yàn)數(shù)據(jù)。

      第4 步:結(jié)合以上信息,利用貝葉斯法則,計(jì)算后驗(yàn)分布,并求得在各樣本量水平s 下每次仿真結(jié)果的HDI。

      第5 步:統(tǒng)計(jì)各樣本量水平s 下3 000 個(gè)HDI超出ROPE 的比例,即為該樣本量水平下的統(tǒng)計(jì)功效,得到如圖2 右上角分圖所示的統(tǒng)計(jì)功效變化趨勢圖??梢钥闯?,當(dāng)s≥23 時(shí),統(tǒng)計(jì)功效大于0.80,即在0.8 的統(tǒng)計(jì)功效水平要求下,試驗(yàn)的樣本量應(yīng)取23。

      3.2 針對(duì)統(tǒng)計(jì)推斷的樣本量估算演示

      假設(shè)研制總要求規(guī)定在某型衛(wèi)星通信終端的試驗(yàn)中獲得通話質(zhì)量小于0.1 精度水平的滿意度估計(jì),則樣本量的估算過程如下:

      第1 步~第4 步仍然同上。

      將第5 步調(diào)整為:統(tǒng)計(jì)各樣本量水平s 下3 000個(gè)HDI 的長度小于規(guī)定精度要求的比例,即為該樣本量水平下的統(tǒng)計(jì)功效,如圖2 左下角分圖所示,進(jìn)而分析可得如圖2 右下角分圖所示的統(tǒng)計(jì)功效變化趨勢圖??梢钥闯觯?dāng)s≥48 時(shí),統(tǒng)計(jì)功效大于0.80,即在0.8 的統(tǒng)計(jì)功效水平要求下,試驗(yàn)的樣本量應(yīng)取48。

      3.3 應(yīng)用估算方法的特殊問題

      一是仿真結(jié)果收斂性對(duì)樣本量估算的影響。本文的樣本量估算方法是基于仿真的,必定存在隨機(jī)性,為獲得相對(duì)正確的樣本量估算結(jié)果,應(yīng)當(dāng)確保仿真結(jié)果可收斂。即隨著仿真步數(shù)的增加,仿真結(jié)果逐漸收縮至一個(gè)相對(duì)較小范圍。如果通過觀察,發(fā)現(xiàn)仿真結(jié)果不具備收斂性,則需要判斷無法收斂的原因是該仿真模擬的數(shù)據(jù)生成過程與實(shí)際情況不符,還是實(shí)際上即將開展的試驗(yàn)永遠(yuǎn)無法達(dá)到規(guī)定的統(tǒng)計(jì)功效水平。通過觀察圖2 的左上分圖可以看出,在仿真結(jié)果可收斂的情況下,仿真的步數(shù)越多,結(jié)果變化的震蕩幅度越小,并逐漸收斂至真實(shí)值附近,但仿真的步數(shù)越多,計(jì)算的開銷越大,因此,在實(shí)際的樣本量估算過程中,應(yīng)當(dāng)選擇合適的仿真步數(shù)。

      圖2 算法有效性驗(yàn)證示意圖

      二是試驗(yàn)結(jié)果計(jì)算過程對(duì)樣本量估算的影響。本文給出的算例相對(duì)較為簡單,它們用到的先驗(yàn)和似然分別為beta 分布和二項(xiàng)分布的分布律,而beta分布和二項(xiàng)分布互為共軛,即利用傳統(tǒng)的解析方法完全可以基于統(tǒng)計(jì)功效估算樣本量。然而當(dāng)前試驗(yàn)鑒定應(yīng)用貝葉斯方法的主要場景是諸如可靠性指標(biāo)考核這樣需要融入大量先驗(yàn)信息的情況,幾乎無法使用解析方法計(jì)算試驗(yàn)結(jié)果,必須利用馬爾科夫鏈蒙特卡洛這樣的仿真方法計(jì)算試驗(yàn)結(jié)果。但通過分析本文提出的樣本量計(jì)算過程可以看出,在利用統(tǒng)計(jì)功效作為估算法則的前提下,只需要試驗(yàn)結(jié)果的計(jì)算方法可生成后驗(yàn)分布即可,并不區(qū)分它是利用解析方法,還是仿真方法。因此,本文提出的樣本量估算方法,可以推廣至基于貝葉斯方法開展的可靠性考核等復(fù)雜場景。

      三是更多決策因素對(duì)樣本量估算的影響。本文提出的樣本量估算方法是以統(tǒng)計(jì)功效作為判斷標(biāo)準(zhǔn)的,即主要考慮樣本量的選擇能否滿足試驗(yàn)的數(shù)據(jù)質(zhì)量要求。但在實(shí)際的試驗(yàn)工作中,常常還需要考慮試驗(yàn)資金、日程安排、實(shí)施可行性等更多方面因素。這實(shí)際上是在樣本量的估算問題中引入了更多的約束條件。因此,如果實(shí)際的試驗(yàn)工作確實(shí)需要考慮這些約束條件,還需要進(jìn)一步利用最優(yōu)化的規(guī)劃方法,計(jì)算得出一個(gè)試驗(yàn)樣本量的滿意解。

      4 結(jié)論

      通過分析當(dāng)前作戰(zhàn)試驗(yàn)應(yīng)用貝葉斯方法的現(xiàn)狀,本文指出主要有指標(biāo)推斷和指標(biāo)估計(jì)兩大類的應(yīng)用場景,在討論了樣本量估算的準(zhǔn)則之后,分別給出這兩類應(yīng)用場景下的樣本量估算步驟。通過算例的演示和方法應(yīng)用的討論,可以看出,本文提出的方法是具有一定的通用性,基本可以覆蓋當(dāng)前作戰(zhàn)試驗(yàn)基于貝葉斯方法考核的樣本量估算需求,因此,可以為我軍后續(xù)的相關(guān)試驗(yàn)鑒定任務(wù)實(shí)踐提供較好的參考。

      猜你喜歡
      后驗(yàn)樣本量貝葉斯
      醫(yī)學(xué)研究中樣本量的選擇
      基于對(duì)偶理論的橢圓變分不等式的后驗(yàn)誤差分析(英)
      貝葉斯統(tǒng)計(jì)中單參數(shù)后驗(yàn)分布的精確計(jì)算方法
      航空裝備測試性試驗(yàn)樣本量確定方法
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      貝葉斯公式及其應(yīng)用
      一種基于最大后驗(yàn)框架的聚類分析多基線干涉SAR高度重建算法
      基于貝葉斯估計(jì)的軌道占用識(shí)別方法
      一種基于貝葉斯壓縮感知的說話人識(shí)別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      IIRCT下負(fù)二項(xiàng)分布參數(shù)多變點(diǎn)的貝葉斯估計(jì)
      波密县| 盖州市| 家居| 醴陵市| 神木县| 通城县| 黄龙县| 内江市| 全州县| 库伦旗| 枣阳市| 麟游县| 福建省| 呈贡县| 弥渡县| 大名县| 长海县| 武平县| 巴林右旗| 江源县| 新民市| 麦盖提县| 尉氏县| 柘城县| 桦川县| 泸西县| 高尔夫| 宝山区| 建瓯市| 治县。| 柳州市| 新田县| 绵阳市| 龙里县| 马龙县| 琼结县| 华蓥市| 翁源县| 上蔡县| 灵宝市| 连城县|