• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      Logistic回歸聯(lián)合ROC曲線模型在雷電潛勢(shì)預(yù)報(bào)中的應(yīng)用

      2022-05-18 01:30:02吳安坤郭軍成黃天福
      中低緯山地氣象 2022年2期
      關(guān)鍵詞:潛勢(shì)探空雷暴

      吳安坤,郭軍成,黃天福

      (1.貴州省氣象災(zāi)害防御技術(shù)中心,貴州 貴陽(yáng) 550081;2.貴州省安順市氣象局,貴州 安順 561000;3.貴州省六盤水市氣象局,貴州 六盤水 553000)

      0 引言

      雷暴活動(dòng)作為常見的強(qiáng)對(duì)流天氣過(guò)程,造成的災(zāi)害是聯(lián)合國(guó)公布的十大最嚴(yán)重的自然災(zāi)害之一。隨著社會(huì)經(jīng)濟(jì)不斷發(fā)展,每年因強(qiáng)對(duì)流天氣過(guò)程造成的損失越加嚴(yán)重。因此,加強(qiáng)雷暴活動(dòng)的預(yù)測(cè)預(yù)報(bào),對(duì)防災(zāi)減災(zāi)有十分重要的指導(dǎo)意義。雷暴云的發(fā)生發(fā)展伴隨著不穩(wěn)定環(huán)境中氣團(tuán)的抬升,探空資料觀測(cè)大氣中的溫濕壓、水汽和抬升等物理量參數(shù),對(duì)研究局地雷電潛勢(shì)預(yù)報(bào)具有很好的指示作用[1-4]。目前采用探空對(duì)流參數(shù)開展的雷暴預(yù)報(bào)研究,大多直接采用多元統(tǒng)計(jì)線性回歸方法,需解決雷暴發(fā)生與否的非線性與探空資料之間的線性回歸問題。線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,且自變量和因變量之間呈現(xiàn)線性關(guān)系。當(dāng)因變量為分類型變量,且自變量與因變量沒有線性關(guān)系時(shí),線性回歸模型的假設(shè)條件就會(huì)遭到破壞。而采用Logistic回歸分析模型可以很好地解決此類問題,它對(duì)因變量的分布沒有要求,巧妙地避開了分類型變量的分布問題。Logistic回歸作為一種非線性概率性預(yù)測(cè)模型,可實(shí)現(xiàn)對(duì)研究觀察結(jié)果進(jìn)行分類、處理協(xié)變量之間的多變量分類分析[5],被廣泛用于流行病學(xué)的病因研究中,分析疾病與危險(xiǎn)因素間聯(lián)系,所觀測(cè)的因素常以二分變量取值,如生存與死亡、是否發(fā)病等,即因變量為0或者1。如羅蒙等[6]將具有統(tǒng)計(jì)學(xué)意義的檢查指標(biāo)納入多因素Logistic 回歸分析,預(yù)測(cè)新型冠狀病毒肺炎患者發(fā)生危重癥的風(fēng)險(xiǎn)。而ROC曲線是目前學(xué)術(shù)界公認(rèn)的診斷價(jià)值最佳的方法,其操作簡(jiǎn)便,且具有通過(guò)圖形就能夠判斷分析的診斷性能[7-9]。宗迎迎等[10]應(yīng)用Logistic 回歸和ROC曲線研討血清Dickkopf、高爾基體糖蛋白73和甲胎蛋白對(duì)原發(fā)性肝癌的診斷價(jià)值。張宇等[11]應(yīng)用Logistic 模型聯(lián)合ROC 曲線法對(duì)新型冠狀病毒肺炎嚴(yán)重程度進(jìn)行判別,具有較高的正確率。引入Logistic回歸聯(lián)合ROC曲線模型采用探空物理量資料開展雷電潛勢(shì)預(yù)報(bào)研究,分析雷電活動(dòng)有、無(wú)問題,目前未見相關(guān)技術(shù)研究。因此,本文選取閃電監(jiān)測(cè)資料和探空觀測(cè)參數(shù),篩選數(shù)據(jù)樣本納入單因素邏輯回歸模型,選取有統(tǒng)計(jì)學(xué)意義的參數(shù)納入多因素邏輯回歸模型,采用ROC曲線聯(lián)合二分類Logistic回歸模型開展雷暴活動(dòng)潛勢(shì)預(yù)報(bào)研究。

      1 數(shù)據(jù)來(lái)源及處理

      探空資料來(lái)源于Micaps系統(tǒng)提供的T-lnp探空數(shù)據(jù),提取貴陽(yáng)站2020年1—10月逐日08時(shí)和20時(shí)的修正總指數(shù)、K指數(shù)、沙氏指數(shù)、Faust指數(shù)、最大抬升指數(shù)、對(duì)流穩(wěn)定度指數(shù)等72種物理參數(shù)。為保證數(shù)據(jù)的可靠性,采用四分位檢測(cè)異常值,剔除上四分位+1.5 IQR距離、下四分位-1.5 IQR距離以外時(shí)刻的數(shù)據(jù)。閃電資料來(lái)源于貴州省閃電監(jiān)測(cè)網(wǎng),考慮實(shí)際業(yè)務(wù)中T-lnp探空數(shù)據(jù)每天主要包括08時(shí)和20時(shí)2個(gè)時(shí)次,以及探空站之間的距離。規(guī)定該站當(dāng)日08時(shí)或20時(shí)以后12 h內(nèi)、100 km范圍內(nèi)若發(fā)生50次以上的閃電,則將當(dāng)日08時(shí)或者20時(shí)對(duì)應(yīng)的物理參量作為1個(gè)雷暴天氣樣本,反之為非雷暴天氣。本文通過(guò)篩選得到294個(gè)雷暴、238非雷暴天氣樣本以及對(duì)應(yīng)的72個(gè)物理參數(shù)值、閃電活動(dòng)次數(shù)。

      2 分析方法

      以篩選的樣本中72個(gè)對(duì)流參數(shù)為因變量,納入單因素邏輯回歸模型,篩選變量,將有顯著性統(tǒng)計(jì)學(xué)意義(P<0.001) 的變量納入多因素邏輯回歸模型,選取滿足一定檢驗(yàn)條件的參數(shù)代入模型計(jì)算概率預(yù)測(cè)值。以此概率預(yù)測(cè)值為檢驗(yàn)變量,樣本雷暴活動(dòng)情況為狀態(tài)變量,繪制ROC曲線,以敏感度與特異性之和最大所對(duì)應(yīng)的概率值作為截?cái)嘀担{入氣象預(yù)報(bào)質(zhì)量評(píng)分檢驗(yàn)。

      2.1 Logistic 模型聯(lián)合ROC曲線法

      假設(shè)雷暴發(fā)生情況y,發(fā)生為1,未發(fā)生為0。影響雷暴發(fā)生情況y的m個(gè)對(duì)流參數(shù)分別為x1,x2,…,xm。雷暴活動(dòng)發(fā)生的概率記為P(y=1|xi)=Pi,發(fā)生與否的2個(gè)概率分別為:

      (1)

      (2)

      其中Pi代表在第i個(gè)觀測(cè)中雷暴發(fā)生的概率,1-Pi對(duì)應(yīng)雷暴未發(fā)生的概率,均為對(duì)流參數(shù)xi構(gòu)成的非線性函數(shù)。雷暴發(fā)生與不發(fā)生的概率之比Pi/(1-Pi),稱為事件的發(fā)生比(Odds),對(duì)Odds取對(duì)數(shù)變換,得到邏輯回歸模型的線性模式如下:

      (3)

      得到雷暴活動(dòng)發(fā)生概率P如下所示:

      (4)

      ROC 曲線(receiver operating characteristic curve)分析被認(rèn)為是一種診斷試驗(yàn)評(píng)價(jià)中理想和經(jīng)典的方法。其思路是以邏輯回歸模型所得的預(yù)測(cè)概率為基礎(chǔ),選取不同截?cái)嘀蛋凑毡?描述的雷暴預(yù)報(bào)混淆矩陣進(jìn)行統(tǒng)計(jì),計(jì)算不同截?cái)嘀迪碌拿舾卸扰c特異度。

      表2 探空物理量參數(shù)為因變量構(gòu)建單因素、多因素邏輯回歸模型Tab.2 Single factor and multi factor Logistic regression models with sounding physical parameters as dependent variables

      2.2 氣象預(yù)報(bào)檢驗(yàn)

      對(duì)于雷電等強(qiáng)對(duì)流天氣的小概率時(shí)間檢驗(yàn)采用Donaldson[13]提出的方法,計(jì)算命中率(POD)、虛警率(FAR)、臨界成功指數(shù)(CSI)、失誤率(FOM)衡量預(yù)報(bào)方程的準(zhǔn)確率和進(jìn)行預(yù)報(bào)質(zhì)量評(píng)分。在表1混淆矩陣的基礎(chǔ)上,計(jì)算POD、FAR、CSI、FOM如下所示:

      表1 混淆矩陣Tab.1 Confusion matrix

      (5)

      (6)

      (7)

      (8)

      3 結(jié)果分析

      3.1 Logistic回歸分析模型

      通過(guò)單因素分析顯示瑞士第二雷暴指數(shù)(SWISS12)、瑞士第一雷暴指數(shù)(SWISS00)、抬升指數(shù)(LI)、最大抬升指數(shù)(BLI)、條件對(duì)流穩(wěn)定度指數(shù)(IL)、沙氏指數(shù)(SI)、通氣管指數(shù)(TQG)、修正杰弗遜指數(shù)(TMJ)、Faust指數(shù)(Faust)、修正對(duì)流指數(shù)(DCI)、修正K指數(shù)(mK)、抬升凝結(jié)處溫度(TCL_T)、對(duì)流凝結(jié)高度處溫度(CCL_T)、整層比濕積分(IntegralQ)14個(gè)對(duì)流參數(shù),有統(tǒng)計(jì)學(xué)意義(均有P<0.001),即以上14個(gè)參數(shù)對(duì)雷暴活動(dòng)趨勢(shì)有指示作用,涉及大氣熱力因子、動(dòng)力條件及綜合指數(shù)等,可綜合反映中低層熱動(dòng)力穩(wěn)定度特性。其中SWISS12、SWISS00、LI、BLI、IL、SI6個(gè)參數(shù)OR<1,表征參數(shù)越小,發(fā)生雷暴活動(dòng)的可能性越大;反之其他8個(gè)參數(shù)值越大,發(fā)生雷暴活動(dòng)的可能性越大。進(jìn)一步對(duì)有統(tǒng)計(jì)學(xué)意義的14個(gè)參數(shù)采用多因素分析,結(jié)果顯示SWISS00(OR=0.74,95%CI:0.58~0.94,P<0.05)、LI(OR=0.65,95%CI:0.45~0.96,P<0.05)、BLI(OR=0.81,95%CI:0.71~0.92,P<0.05)、IntegralQ(OR=1.00,95%CI:0.90~1.20,P<0.05)4個(gè)參數(shù)為雷電潛勢(shì)預(yù)報(bào)多參數(shù)邏輯回歸指標(biāo),即ln(p/(1-p))=0.306×SWISS00+0.424×LI+0.214×BLI-0.001×IntegralQ。

      3.2 ROC曲線

      在概率截?cái)嘀禐?.5水平下,如表3所示,單因素構(gòu)建邏輯回歸模型預(yù)準(zhǔn)確度介于68.2%~75.4%,ROC曲線的曲線下面積介于0.751~0.793,以整層比濕積分相對(duì)最好、沙氏指數(shù)相對(duì)最差。若以整層比濕積分(IntegralQ)作為單因素指標(biāo)開展雷電潛勢(shì)預(yù)報(bào),準(zhǔn)確度為75.4%。

      表3 單因素指標(biāo)ROC曲線下的面積Tab.3 Area under ROC curve of single factor index

      采用多因素邏輯回歸模型,ROC曲線的曲線下面積為0.839(0.804~0.875),P<0.001,預(yù)測(cè)能力較單因素模型有所提高,具有較好的預(yù)測(cè)價(jià)值(圖1)。當(dāng)Logistic回歸分析模型得到的預(yù)測(cè)值為0.611時(shí),其敏感度為0.789,特異度為0.799,二者之和最大,因此將該值作為最佳臨界點(diǎn)將研究對(duì)象分為2組,即Logistic回歸分析模型預(yù)測(cè)概率值≥0.611認(rèn)為有雷電天氣過(guò)程,在此條件下,準(zhǔn)確度由單因素的75.4%提高到79.5%。

      圖1 多因素邏輯回歸ROC曲線Fig.1 Multivariate Logistic regression ROC curve

      3.3 預(yù)報(bào)質(zhì)量校驗(yàn)

      根據(jù)確定的概率截?cái)嘀?.611,在混淆矩陣的基礎(chǔ)上統(tǒng)計(jì)TP為247、FP為47、FN為62、TN為176,采用氣象預(yù)報(bào)評(píng)分計(jì)算命中率(POD)為84.01%、虛警率(FAR)為26.05%、臨界成功指數(shù)(CSI)69.38%、失誤率(FOM)為20.06%。

      4 結(jié)論與討論

      本文選取72個(gè)探空物理量參數(shù)作為自變量,閃電監(jiān)測(cè)系統(tǒng)探測(cè)是否發(fā)生閃電作為因變量,將單因素指標(biāo)逐一納入邏輯回歸模型,篩選具有顯著性統(tǒng)計(jì)學(xué)意義(P<0.001)的指標(biāo)進(jìn)入多因素回歸模型,選取滿足檢驗(yàn)條件P<0.05的參數(shù)得到雷電潛勢(shì)預(yù)報(bào)模型ln(p/(1-p))=0.306×SWISS00+0.424×LI+0.214×BLI-0.001×IntegralQ。得到結(jié)論如下:

      ①多因素邏輯回歸模型預(yù)警效果優(yōu)于單因素模型,預(yù)警準(zhǔn)確度從75.4%提高到79.5%。

      ②聯(lián)合ROC曲線確定預(yù)報(bào)模型的概率閾值為0.611,雷電潛勢(shì)預(yù)報(bào)的命中率POD為84.01%,虛假警報(bào)率FAR為26.05%,臨界成功指數(shù)CSI為69.38%。準(zhǔn)確率較高,雷電潛勢(shì)預(yù)報(bào)具有較好的預(yù)報(bào)能力。

      Logistic回歸模型處理“二分類”問題,旨在擬合結(jié)果的“有”“無(wú)”問題,有效彌補(bǔ)了線性回歸的缺陷;同時(shí)結(jié)合ROC曲線對(duì)模型進(jìn)行檢驗(yàn),確定合適的預(yù)測(cè)概率值,可進(jìn)一步提高預(yù)警準(zhǔn)確率。Logistic回歸模型聯(lián)合ROC曲線法在氣象預(yù)測(cè)預(yù)報(bào),特別是非線性預(yù)測(cè)中有一定的應(yīng)用價(jià)值。

      猜你喜歡
      潛勢(shì)探空雷暴
      探空氣球?yàn)楦呖諝庀蟆鞍衙}”
      新德里雷暴
      賀蘭山沿山地區(qū)強(qiáng)對(duì)流潛勢(shì)預(yù)報(bào)方法研究
      臨渙選煤廠浮選效果評(píng)價(jià)與尾煤再選潛勢(shì)分析
      氨對(duì)甲苯二次有機(jī)氣溶膠生成潛勢(shì)影響的實(shí)驗(yàn)研究
      能源工程(2021年2期)2021-07-21 08:39:54
      阜新地區(qū)雷暴活動(dòng)特點(diǎn)研究
      綠色科技(2018年22期)2019-01-15 05:36:08
      廣西富川縣雷暴氣候特征分析
      “適者生存”?
      雜文月刊(2017年24期)2017-03-03 07:42:55
      TK-2GPS人影火箭探空數(shù)據(jù)與L波段探空數(shù)據(jù)對(duì)比分析
      淺談凈舉力對(duì)探空氣球升速及施放高度的影響
      河南科技(2014年14期)2014-02-27 14:12:08
      伊川县| 绥芬河市| 霞浦县| 栖霞市| 深水埗区| 长葛市| 六枝特区| 罗平县| 玛纳斯县| 民权县| 安溪县| 南汇区| 内黄县| 新密市| 潮州市| 合作市| 孙吴县| 平江县| 海口市| 青海省| 邢台市| 焦作市| 巴林右旗| 沧州市| 报价| 融水| 郯城县| 梅州市| 吉水县| 潢川县| 荔浦县| 泰顺县| 保康县| 聊城市| 长宁区| 溆浦县| 池州市| 正宁县| 商城县| 永福县| 海安县|