• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于ARIMA的冬季日最低溫度預(yù)測與分析

      2022-09-09 05:51:26劉芳葛瑞婷
      電子技術(shù)與軟件工程 2022年12期
      關(guān)鍵詞:差分均值準(zhǔn)確率

      劉芳 葛瑞婷

      (淄博市氣象局 山東省淄博市 255000)

      1 引言

      隨著社會的發(fā)展、經(jīng)濟(jì)的進(jìn)步,天氣預(yù)報對人們的生活、出行、農(nóng)業(yè)及經(jīng)濟(jì)等方面所起到的影響越來越大。天氣預(yù)報的重要特點(diǎn)之一就是時效性,人們需要提前知道,并根據(jù)預(yù)報信息來做出合理的安排、計(jì)劃。如果在大風(fēng)、暴雨、低溫、高溫、冰雹及暴雪等惡劣天氣來臨之前,假如相關(guān)部門、單位及群眾提前獲知天氣并做好防御措施,這在一定程度上能夠減少甚至避免一些人員傷亡和經(jīng)濟(jì)損失。正如鄭州“7?20”特大暴雨發(fā)生后,許多專家學(xué)者對此過程做了分析和總結(jié),針對不同城市特點(diǎn)提出了相應(yīng)的防御對策,來防患于未然。因此,預(yù)測未來天氣是氣象領(lǐng)域一個至關(guān)重要的任務(wù),天氣預(yù)測就是對某一地點(diǎn)的大氣運(yùn)動狀態(tài)來進(jìn)行預(yù)測。它在氣候監(jiān)測、災(zāi)害性天氣預(yù)測、農(nóng)業(yè)、軍事及交通等方面的應(yīng)用都具有巨大的作用。

      從古至今,人們從未停止過對天氣變化趨勢的研究與預(yù)測。觀測方法由最初的人工觀測演變?yōu)樽詣佑^測,這不僅減少了人力成本的投入,更重要的是擺脫了條件惡劣區(qū)域人工不能觀測的困境,而且收集到的數(shù)據(jù)日漸增多。大量的氣象數(shù)據(jù)為更加準(zhǔn)確的預(yù)測天氣要素奠定了堅(jiān)實(shí)的基礎(chǔ)。當(dāng)然隨著氣象大數(shù)據(jù)時代的到來,原始的預(yù)測方法具有局限性。同時,天氣過程是千變?nèi)f化,且十分復(fù)雜的,單憑人工經(jīng)驗(yàn)觀測得到的準(zhǔn)確率已不能滿足現(xiàn)在人們、社會的需求。因此,目前也有許多物理預(yù)測法、基于統(tǒng)計(jì)學(xué)的方法、綜合預(yù)測方法被提出和應(yīng)用。物理預(yù)測法是利用氣象理論知識,擬合大氣運(yùn)動函數(shù),在明確初始值和邊界條件的情況下對函數(shù)做積分計(jì)算,從而實(shí)現(xiàn)對天氣要素的預(yù)測?;诮y(tǒng)計(jì)學(xué)的方法主要利用數(shù)據(jù)統(tǒng)計(jì)分析方法,統(tǒng)計(jì)某一氣象要素的數(shù)值在一段時間內(nèi)出現(xiàn)的頻率,從而推算出未來一段時間內(nèi),在相似環(huán)境條件下該氣象要素出現(xiàn)的概率。郭等使用自回歸模型來預(yù)測季節(jié)的降雨量。綜合預(yù)測方法把不同的預(yù)報方法結(jié)合,從而獲得更加準(zhǔn)確的結(jié)果。

      時間序列模型也是一種常用的預(yù)測方法之一。時間序列是指按照相同的統(tǒng)計(jì)指標(biāo)并根據(jù)其發(fā)生的先后時間順序排列而成的一組數(shù)據(jù),而時間序列分析主要是根據(jù)已有的歷史數(shù)據(jù)來對未來一段時間進(jìn)行預(yù)測。差分整合移動平均自回歸模型(Autoregressive Integrated Moving Average model,ARIMA)是最經(jīng)典的時間序列預(yù)測模型之一,目前已有許多利用ARIMA模型來預(yù)測股票、經(jīng)濟(jì)走勢、天氣中溫度、空氣質(zhì)量指數(shù)等氣象要素的研究。

      本文基于對日常的公共氣象服務(wù)內(nèi)容的分析,發(fā)現(xiàn)人們對于冬季(11月-次年2月)日最低溫有強(qiáng)烈的需求,尤其對農(nóng)業(yè)、交通、供熱公司等部門有重要的作用。例如,對于高速公路修建公司,他們需要提前知道當(dāng)年進(jìn)入冬季的時間,需要確定大約在哪個時間溫度低于0℃,因?yàn)樗麄冃枰诘陀?℃的嚴(yán)冷天氣的前期,為一些怕凍的材料、機(jī)器及路面做好保護(hù),為停工做準(zhǔn)備,以防造成凍災(zāi),減少或者避免造成經(jīng)濟(jì)損失。因此,本文主要關(guān)注于利用ARIMA模型來預(yù)測未來年份的冬季日最低氣溫。本文收集了山東省某市1990-2021年10、11和12月、1990-2022年1、2月日最低氣溫做訓(xùn)練數(shù)據(jù)集,來評估ARIMA預(yù)測該市冬季日最低氣溫的性能。本文根據(jù)使用的歷史時間序列數(shù)據(jù)的不同,給出了兩種預(yù)測方法。首先,ARIMA利用預(yù)測月份的上個月的日最低溫數(shù)據(jù)來預(yù)測該月份的數(shù)據(jù)值,如利用1990年10月1-31日真實(shí)的日最低溫來預(yù)測1990年11月1-30日的日最低溫,該方法稱為ARIMA_LM(ARIMA based on Last Month data)。其次,為了預(yù)測距當(dāng)前時間更長久時間的冬季日最低溫度,本文利用1990年-2021(2022)年所有跟預(yù)測月份、日數(shù)都一致的數(shù)據(jù)來預(yù)測未來年份的該月和日的最低溫。假如要預(yù)測2022年11月1日的最低溫時,需要統(tǒng)計(jì)1990年-2021年中每年11月1日的數(shù)據(jù)值來完成預(yù)測,該方法稱為ARIMA_D(ARIMA based on Daily data over the past years)。最后,通過實(shí)驗(yàn)分別評估了ARIMA_LM和ARIMA_D的準(zhǔn)確性,并利用ARIMA_D方法預(yù)測了山東省該市未來一年冬季日最低溫度。

      2 基于ARIMA的冬季日最低溫度預(yù)測

      2.1 ARIMA模型

      ARIMA模型主要由自回歸(AR)模型、移動平均(MA)模型和差分模型組合而成,是一種有效的時間序列預(yù)測模型之一,表示為ARIMA(p,d,q),其中p、q、d分別為AR、MA、差分模型中的參數(shù)。因此,接下來主要介紹差分法、AR、MA和ARMA模型。

      2.1.1 差分法

      在實(shí)際生活中,獲取的大部分時間序列數(shù)據(jù)分布是各種各樣的,但是要預(yù)測未來一段時間的數(shù)據(jù)值,就要求這個時間序列數(shù)據(jù)具有一種慣性,即需要該時間序列數(shù)據(jù)是平穩(wěn)的。

      定義1 時間序列數(shù)據(jù)的平穩(wěn)性。隨機(jī)生成一個時間序列{Y}(t=1, 2, …),{Y}中的每一個數(shù)值是從一個概率分布中隨機(jī)獲得的。如果{Y}滿足下列條件:

      (1)均值E(Y)=a,a是跟時間t無關(guān)的常數(shù);

      (2)方差Var(Y)=S,S是與時間t無關(guān)的常數(shù);

      (3)協(xié)方差Cov(Y, Y)=v,v是只與時期間隔k有關(guān),與時間t無關(guān)的常數(shù)。

      也就是說,平穩(wěn)性時間序列數(shù)據(jù)的均值和方差不隨時間變化而發(fā)生明顯變化。

      為了讓一個非平穩(wěn)的時間序列數(shù)據(jù)呈現(xiàn)出平穩(wěn)性,本文采用差分法:

      給定時間序列數(shù)據(jù)Y(t=1, 2, …),差分后的時間序列F滿足以下條件:

      (1)F=Y-0,當(dāng)t=1時;

      (2)F=Y-Y,當(dāng)t≥2時。

      利用Y中的每個數(shù)據(jù)與其前一項(xiàng)的差值,來得到差分后的時間序列數(shù)據(jù)F的方法,稱為差分法。做一次差分操作稱為一階差分,d次差分稱為d階差分。此外,當(dāng)Y做一階差分獲得的時間序列數(shù)據(jù)F依然不具有平穩(wěn)性,可以對F再做一次差分操作,一次類推,直到得到平穩(wěn)的時間序列。

      2.1.2 自回歸(AR)模型

      自回歸模型描述的是當(dāng)前值與歷史值之間關(guān)系,利用其自身的歷史數(shù)據(jù)來對未來進(jìn)行預(yù)測,這就要求自身的歷史數(shù)據(jù)滿足平穩(wěn)性的條件。

      AR模型表示為:

      其中,μ是常數(shù)項(xiàng),p為階數(shù),表示當(dāng)前值與前p個歷史值相關(guān), ε為誤差,γ為自相關(guān)系數(shù)。

      2.1.3 移動平均(MA)模型

      MA模型主要是自回歸模型中誤差項(xiàng)的累加,是為了有效地消除AR模型的隨機(jī)波動。MA模型表示為:

      其中,μ是常數(shù)項(xiàng),q為階數(shù), θ為參數(shù)。

      2.1.4 自回歸移動平均(ARMA)模型

      假設(shè)在任意時刻t的數(shù)值為y,與歷史時間點(diǎn)的自身相關(guān)的同時,還需與歷史時刻影響模型的誤差也存在一定的相關(guān)性,滿足上述特點(diǎn)的模型稱為ARMA(p,q)模型。實(shí)際上,ARMA(p,q)模型是自回歸模型AR(p)和移動平均模型MA(q)的組合,表示為:

      因此,ARIMA模型是將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后將因變量的前p階數(shù)值、隨機(jī)誤差項(xiàng)的現(xiàn)值和前q階誤差值,進(jìn)行回歸建立的預(yù)測模型。

      2.2 選取參數(shù)p,q值

      對于AR模型和MA模型中的參數(shù)p,q,通過利用自相關(guān)函數(shù)(Autocorrelation Function,ACF)和偏自相關(guān)函數(shù)(Partial Autocorrelation Function,PACF)求得。ACF是衡量時間序列中間隔k個時間范圍(y與y之間)觀測值間的相關(guān)性,表示為:

      也就是說,ACF是y和y之間的協(xié)方差與y方差的比值。

      而PACF是剔除了中間k-1個隨機(jī)變量y,y,y......y的擾動,僅保留y對y的相關(guān)性。

      本文首先計(jì)算ACF和PACF,對于AR(p)模型中參數(shù)p,滿足偏自相關(guān)函數(shù)的p階落在置信區(qū)間內(nèi)(也稱為p階截尾),自相關(guān)函數(shù)隨時間t的增加而衰減趨于零,如表1中第二行。MA(q)中參數(shù)q,滿足ACF是q階截尾,PACF也呈現(xiàn)衰減趨于零的趨勢,如表1中的第三行。

      表1:參數(shù)p、q取值

      2.3 ARIMA_LM方法和ARIMA_D方法

      2.3.1 ARIMA_LM方法

      本小節(jié)詳細(xì)地描述了ARIMA_LM方法(ARIMA based on Last Month data)的過程,如算法1所示。

      算法1:ARIMA_LM方法

      Input:Historical dataset HD,forecast days n;

      Output:predicted value for n days

      (1)ini(HD) ←preprocessing dataset HD

      (2)d-difference method for HD

      (3) p、q←compute ACF、PACF

      (4) Build model ARIMA(p,d,q)

      (5) optimize model ARIMA(p,d,q)

      (6)return Set

      首先,預(yù)處理歷史時間序列數(shù)據(jù),剔除異常值、空值等(如1)所示;然后,對歷史時間序列數(shù)據(jù)HD進(jìn)行差分處理,使其具有平穩(wěn)性(如2)所示;之后,計(jì)算d階差分后的HD的ACF、PACF,來確定AR(p)、MA(q) 模型中的參數(shù)p、q(如3)所示,最后建立、優(yōu)化ARIMA,并返回預(yù)測的未來n天數(shù)據(jù)值集合Set(如4-6)行所示。

      2.3.2 ARIMA_D方法

      本小節(jié)給出了ARIMA_D方法(ARIMA based on Daily data over the past years)的過程。

      算法2:ARIMA_D方法

      Input:Historical dataset HD,forecast days n;

      Output:predicted values

      (1) ini(HD) ←preprocessing dataset HD

      (2)for p∈HD do

      (3) p←time index of p

      (4) day←segmentDay(p)

      (5) Set←Set∪{p}

      (6)for Set∈Setdo

      (7) d-difference method for Set

      (8) p、q←compute ACF、PACF

      (9) Build model ARIMA(p,d,q)

      (10) optimize model ARIMA(p,d,q)

      (11) p←predict by ARIMA

      (12) Set←Set∪{p}

      (13) return Set

      該方法主要適用于已有20、30年甚至更久的歷史時間數(shù)據(jù),采用幾十年具有相同月份、日數(shù)的數(shù)據(jù)來預(yù)測未來該月份、日數(shù)的數(shù)據(jù)值,如通過1990-2021年每年11月1日的歷史數(shù)據(jù)來預(yù)測2022年11月1日的數(shù)據(jù)值。首先,預(yù)處理歷史時間序列數(shù)據(jù),剔除異常值、空值等,如(1)所示;然后,針對歷史時間序列數(shù)據(jù)集HD中的每個對象,提取其時間索引中的日數(shù)(如2019年11月01日,日數(shù)為01;2019年11月18日,日數(shù)為18,記為day,并按照day存放到相對應(yīng)的集合Set中。也就是,把日數(shù)相等的數(shù)據(jù)對象放到一個集合,如(2)-(5)所示。之后,依次對每個集合Set進(jìn)行差分處理,使其具有平穩(wěn)性,對平穩(wěn)后的時間序列數(shù)據(jù)計(jì)算ACF、PACF,來確定AR(p)、MA(q) 模型中的參數(shù)p、q。接下來,建立、優(yōu)化ARIMA,并把預(yù)測的未來一年該月份且日數(shù)為day的數(shù)據(jù)值存放到預(yù)測集合Set中,如(6)-(12)所示,最終得到未來一年該月的預(yù)測數(shù)據(jù)值。

      3 實(shí)驗(yàn)評估

      本文主要采集了山東省某市1990-2021年10、11、12月、1990-2022年1、2月每日最低氣溫作為實(shí)驗(yàn)數(shù)據(jù)集。本文采用90%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),10%的數(shù)據(jù)作為測試數(shù)據(jù),來驗(yàn)證所提方法的準(zhǔn)確性。

      3.1 預(yù)測有效性評估

      本小節(jié)主要利用準(zhǔn)確率和平均絕對誤差(Mean Absolute Error,MAE)來衡量ARIMA_LM和ARIMA_D方法預(yù)測該市冬季日最低溫的準(zhǔn)確性。

      3.1.1 正確性評估

      本小節(jié)評估了所提方法預(yù)測該市冬季日最低溫的準(zhǔn)確率,準(zhǔn)確率=((R∩D))?D,其中R表示所提方法預(yù)測的時間序列集合,D表示當(dāng)前預(yù)測時間段中真實(shí)的數(shù)據(jù)值集合。首先,本文分別給出了ARIMA_LM方法預(yù)測2019、2020、2021年11、12月,2020、2021、2022年1、2月前5天(1-5日)、10天(1-10日)、15天(1-15日)、20天(1-20日)及1個月的準(zhǔn)確率,見圖1。

      圖1:ARIMA_LM預(yù)測準(zhǔn)確率

      從圖1中可以看出,預(yù)測2019、2020、2021年11月前5天(1-5日)的準(zhǔn)確率分別為80%、60%、80%(如圖1(a));2019、2020、2021年12月1-5日準(zhǔn)確率分別為80%、60%、60%(如圖1(b));2020、2021和2022年1、2月1-5日最高準(zhǔn)確率可達(dá)80%,該準(zhǔn)確率是接近甚至高于該市預(yù)報冬季日最低溫的真實(shí)準(zhǔn)確率。預(yù)測2019、2020、2021年11月 前10(1-10日)、15(1-15日)、20(1-20日)天及整月(1-30日)中最高準(zhǔn)確率分別為60%、60%、50%、37%;同樣,12月分別為70%、60%、55%、39%。2020-2022年1、2月前10天平均準(zhǔn)確率為60%,而15、20天及整月的平均準(zhǔn)確率分別為57%、55%、46%。

      通過實(shí)驗(yàn)結(jié)果可以看到,預(yù)測未來的天數(shù)越多準(zhǔn)確率越低,這說明如果預(yù)測的數(shù)據(jù)不是周期性、規(guī)律性的,預(yù)測長期的結(jié)果會受到前面預(yù)測有偏差,甚至錯誤結(jié)果的影響。因此,ARIMA預(yù)測短期數(shù)據(jù)比長期數(shù)據(jù)更加有效。

      其次,圖2展示了ARIMA_D方法預(yù)測2019-2021年11、12月及2020-2022年1、2月的準(zhǔn)確率,圖2中橫坐標(biāo)表示預(yù)測的月份。從圖2中可以看到,準(zhǔn)確率最高達(dá)60%,結(jié)合ARIMA_LM方法預(yù)測結(jié)果分析,可以獲得預(yù)測某天的最低溫度,與其臨近該日的一段時間的最低溫度相關(guān)性較大。

      圖2:ARIMA_D預(yù)測準(zhǔn)確率

      3.1.2 平均絕對誤差評估

      平均絕對誤差(Mean Absolute Error, MAE)表示為:

      其中,y是真實(shí)值,為預(yù)測值,n為預(yù)測天數(shù)。MAE值越小,說明預(yù)測值越接近真實(shí)值。

      表2展示了ARIMA_LM方法預(yù)測一個月份不同天數(shù)的平均絕對誤差值。第一列表示預(yù)測的年份、月份,第一行表示預(yù)測一個月的前5天、10天、15天、20天及整月的天數(shù)。第二行表示預(yù)測2019、2020和2021年11月前5天(1-5日)、10天(1-10日)、15天(1-15日)、20天(1-20日)及整月的平均絕對誤差和的均值。同理,第三行是預(yù)測2019-2021年12月前5天、10天、15天、20天及整月的平均絕對誤差值和的均值,第四行、五行分別表示預(yù)測2020-2022年01月、2020-2022年02月前5天、10天、15天、20天及整月的平均絕對誤差值和的均值。

      從表2可知,預(yù)測11、12、1、2月前5天的平均絕對誤差值(第二列所示),相比預(yù)測11、12、1、2月前10、15、20天及整月的平均絕對誤差值是最小的。隨著預(yù)測天數(shù)的增多,其誤差值也基本呈現(xiàn)增大趨勢,最后一列是預(yù)測2019-2021年11月平均絕對誤差均值和的均值、2019-2021年12月平均絕對誤差和的均值,及2020-2022年1月和2月的平均絕對誤差和的均值。這些值都大于預(yù)測相應(yīng)月份中前5、10、15、20天中誤差值最大的,這說明預(yù)測的天數(shù)越多,預(yù)測值與真實(shí)值偏差越大,準(zhǔn)確率越低。

      表2:ARIMA_LM預(yù)測不同天數(shù)誤差值的均值

      表3是ARIMA_D方法預(yù)測2019-2021年11、12月,2020-2022年1、2月的平均絕對誤差值。第一列表示預(yù)測的年份,第一行是預(yù)測的月份。

      表3:ARIMA_D預(yù)測整月的平均絕對誤差值

      對比表3 與表2的最后一列發(fā)現(xiàn),表2中2019、2020和2021年 11月的平均絕對誤差和的均值比表3中2019、2020和2021年 11月的平均絕對誤差值都大。同樣,表2中預(yù)測2019-2021年12月、2020-2022年1、2月的平均絕對誤差和的均值大于表3中預(yù)測相同月份的誤差值。這再次驗(yàn)證了ARIMA_LD前面天數(shù)預(yù)測得到偏差較大甚至錯誤的數(shù)據(jù)值,會導(dǎo)致后面預(yù)測值的誤差越來越大。同時,也說明ARIMA_LD方法預(yù)測短期內(nèi)的數(shù)據(jù)值更加有效,預(yù)測未來較長時間段的數(shù)據(jù)值,ARIMA_D方法比ARIMA_LD方法誤差更小,效果更好。

      3.2 預(yù)測最低溫

      據(jù)3.1.1和3.1.2節(jié)分析,本小節(jié)給出了利用ARIMA_D方法來預(yù)測未來一年冬季(即2022年11、12月,2023年1、2日)日最低溫,見圖3。橫坐標(biāo)表示每月中的日數(shù),縱坐標(biāo)表示預(yù)測的溫度值。從圖3可知,從11月23日左右開始進(jìn)入零下氣溫模式,而12月大部分時間維持在零下,且基本上都低于-2.5℃。2023年1月平均溫度最低,2月溫度開始緩慢回升,從19日開始最低溫有大于0℃的情況。

      圖3:ARIMA_D方法預(yù)測未來一年冬季日最低溫結(jié)果

      該預(yù)測結(jié)果可以提前幾個月或更久的時間獲知,能夠粗略的預(yù)知未來年份最低溫低于0℃的天氣出現(xiàn)的時間,為提前準(zhǔn)備防凍災(zāi)工作奠定基礎(chǔ)。此外,在臨近冬季的時候,可以采用ARIMA_LM方法來預(yù)測短期溫度,獲得更加準(zhǔn)確的預(yù)測結(jié)果。

      4 總結(jié)

      本文主要利用時間序列模型ARIMA來預(yù)測冬季日最低溫度,根據(jù)提前獲得時間的長短不同,給出了不同的預(yù)測方法。第一種方法是ARIMA_LM,該方法主要用來預(yù)測近期未來時間段內(nèi)的數(shù)據(jù)值。第二種為了提前幾個月甚至更久的時間,預(yù)知未來年份冬季日最低溫,提出了ARIMA_D方法。在真實(shí)數(shù)據(jù)集上實(shí)驗(yàn)發(fā)現(xiàn),ARIMA_LM預(yù)測未來較短期的準(zhǔn)確率可高達(dá)80%,而隨著預(yù)測天數(shù)的增加,準(zhǔn)確率逐漸降低。因此,在實(shí)際生活中,首先利用ARIMA_D方法提前幾個月或更長時間,來預(yù)知冬季的日最低溫,粗略的制定防凍災(zāi)措施,然后臨近冬季的前幾天或一個月,利用ARIMA_LM方法獲得更加準(zhǔn)確的預(yù)測結(jié)果,據(jù)預(yù)測結(jié)果合理調(diào)整防凍災(zāi)措施,從而進(jìn)一步減少甚至避免因低溫對農(nóng)業(yè)、交通等各部門、公眾造成的損失。

      猜你喜歡
      差分均值準(zhǔn)確率
      數(shù)列與差分
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
      2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗(yàn)分析
      高速公路車牌識別標(biāo)識站準(zhǔn)確率驗(yàn)證法
      均值不等式失效時的解決方法
      均值與方差在生活中的應(yīng)用
      關(guān)于均值有界變差函數(shù)的重要不等式
      基于差分隱私的大數(shù)據(jù)隱私保護(hù)
      對偶均值積分的Marcus-Lopes不等式
      怀来县| 加查县| 仙居县| 祁连县| 磴口县| 喀什市| 岑溪市| 北票市| 平陆县| 东丽区| 新蔡县| 邵东县| 西乡县| 松潘县| 凌云县| 绥滨县| 孟村| 富宁县| 柞水县| 阿瓦提县| 德阳市| 博罗县| 台北县| 石棉县| 屏边| 瑞金市| 新泰市| 伊宁县| 北票市| 延吉市| 兴和县| 兴山县| 贵州省| 通许县| 邹平县| 洪江市| 金华市| 秦安县| 阜平县| 广安市| 泗水县|