• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于機(jī)器學(xué)習(xí)的機(jī)場用水量預(yù)測方案設(shè)計

      2019-09-16 12:56:26張玄弋張瀟霄徐英超
      關(guān)鍵詞:超平面用水量機(jī)器

      張玄弋 張瀟霄 徐英超

      北京首都國際機(jī)場股份有限公司 北京 100000

      引言

      隨著近幾年不斷發(fā)展,機(jī)場航班數(shù)量以及旅客的吞吐量不斷上升,機(jī)場水資源的消耗也隨之同步增長,例如北京首都國際機(jī)場,據(jù)了解,2016年的首都國際機(jī)場實(shí)際總用水量就達(dá)到了1089.9511萬立方米,用水量驚人,但機(jī)場高用水量與水資源利用水平卻存在著矛盾,表現(xiàn)在機(jī)場用水規(guī)劃不合理,用水浪費(fèi),供水方水資源分配不合理,供水水壓過大或過小,本文簡單構(gòu)思并舉例介紹了機(jī)器學(xué)習(xí)在機(jī)場用水方面的應(yīng)用,討論了建立用水量預(yù)測模型的方法,從而有助于實(shí)施節(jié)水措施,更加合理的分配水資源供給,使機(jī)場朝著綠色機(jī)場的方向發(fā)展,保障機(jī)場水資源服務(wù)質(zhì)量。另一方面,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)技術(shù)的快速發(fā)展,算法落地實(shí)際場景解決實(shí)際問題的可行性越來越高;深度學(xué)習(xí)與機(jī)器學(xué)習(xí)相比,存在明顯的可解釋性弱,維護(hù)成本大的問題;本文以機(jī)器學(xué)習(xí)算法為例,深度分析機(jī)器學(xué)習(xí)算法應(yīng)用于機(jī)場用水量預(yù)測的問題。

      1 場景分析

      機(jī)場的用水量影響因素有很多,主要影響因素就是機(jī)場進(jìn)出港人數(shù)以及影響其人流量的各種因素,比如天氣與氣溫、季節(jié)、是否節(jié)假日、機(jī)場當(dāng)?shù)厥欠裼写笮突顒?、以及政治因素等等?/p>

      2 機(jī)器學(xué)習(xí)算法簡述

      機(jī)器學(xué)習(xí)的本質(zhì)是在大數(shù)據(jù)的基礎(chǔ)上的統(tǒng)計學(xué)習(xí),擁有深厚的數(shù)學(xué)理論支撐。機(jī)器學(xué)習(xí)算法發(fā)展至今已經(jīng)演化出了多種建模角度、幾何或物理意義的算法,例如邏輯回歸算法、支持向量機(jī)算法、決策樹算法以及集成學(xué)習(xí)類的隨機(jī)森林、梯度提升決策樹等。

      2.1 SVR

      支持向量機(jī)(Support Vector Machine, SVM),是一類試圖在多維度、多特征的數(shù)據(jù)中尋找能夠分隔不同類別數(shù)據(jù)的超平面的算法,引入核函數(shù)的SVM算法對高維數(shù)據(jù)有很好的適應(yīng)性,對分類結(jié)果也有較強(qiáng)的可解釋性。SVR(支持向量回歸)是SVM中的一個重要分支,多用來解決回歸問題,回歸通俗意義上講就是尋找一堆數(shù)據(jù)的內(nèi)在關(guān)系,不論這堆數(shù)據(jù)由幾種特征值構(gòu)成,回歸結(jié)果得到一個超平面又或是一個函數(shù),使所有的樣本點(diǎn)距離這個超平面或者函數(shù)的距離最小。傳統(tǒng)回歸是所有樣本點(diǎn)完全處在某個超平面或者完全符合某個函數(shù)才認(rèn)為是預(yù)測正確,而SVR是事先設(shè)置好一個閾值,只要樣本點(diǎn)距離超平面或函數(shù)的距離偏離程度小于此閾值,就認(rèn)為預(yù)測正確。

      公式 1 SVR最優(yōu)化表達(dá)式

      公式 2 超平面解析式

      圖表 1 SVR示意圖

      圖表 2 SVR幾何意義

      圖表 3 實(shí)驗(yàn)流程圖

      2.2 集成學(xué)習(xí)

      集成學(xué)習(xí)是機(jī)器學(xué)習(xí)算法思想的又一次創(chuàng)新,其核心思想可以簡單用一句中國經(jīng)典諺語——“三個臭皮匠賽過諸葛亮”來概括。顧名思義,集成學(xué)習(xí)在機(jī)器學(xué)習(xí)經(jīng)典算法的基礎(chǔ)上,采用多模型融合的思想,將例如:邏輯回歸、決策樹、支持向量機(jī)等單一模型作為元模型,然后將元模型組合或疊加,綜合決策結(jié)果作為最終輸出,已經(jīng)證明多模型融合的決策的合理性理論上高于單模型決策,集成學(xué)習(xí)以多個元模型為基礎(chǔ),具體決策方案分為boosting和bagging兩種[3];boosting在訓(xùn)練時,元模型的粒度上是串行的,用前一個元模型的輸出與真實(shí)值的差距作為下一個元模型的輸入,循環(huán)這一過程直至滿足條件就得到了最終模型,常見的boosting算法有g(shù)bdt、xgboost、lightgbm等;bagging是另一類算法,訓(xùn)練時元模型粒度上是串行訓(xùn)練,決策時元模型同時決策,然后對元模型的結(jié)果進(jìn)行加權(quán)平均即可得到最終的預(yù)測結(jié)果,常見的bagging算法有random forest、extra random forest等。

      3 模型構(gòu)建

      3.1 問題分析與建立模型

      機(jī)場的用水量是連續(xù)型的數(shù)值,外界影響的因素很多,存在峰值波動幅度較大的特點(diǎn),對于每天累計的用水量預(yù)測,可將其看做分類問題,查看歷史流量波動、歷史平均用水量等數(shù)據(jù),將用水量數(shù)值按照頻次分位數(shù)分為100等份,即將此問題轉(zhuǎn)化為一個多分類問題;另一方面每天累計的用水量預(yù)測也可直接作為回歸問題處理。對于上述兩種方法在不同的場景下各有優(yōu)劣,本文以回歸問題為例繼續(xù)討論。

      3.2 數(shù)據(jù)預(yù)處理

      使用地下管網(wǎng)水流量傳感器分時段統(tǒng)計用水量信息,并記錄對應(yīng)日期的外界條件,比如:天氣狀況、日平均氣溫以及每日出入港人數(shù)等;對收集到的相關(guān)數(shù)據(jù)整理,對于連續(xù)型特征,若存在缺失值,則采取補(bǔ)0、填充中位數(shù)或平均數(shù)等操作,然后對其使用最大最小歸一化;對于離散型特征,若存在缺失值,則將其單獨(dú)作為一類處理或填充出現(xiàn)次數(shù)最多的類別。

      3.3 日供水量簡單預(yù)測模型

      此模型適用于機(jī)場在一個短周期內(nèi)每日出入港人數(shù)變化波動較小的情況下,此時不考慮機(jī)場每日出入港人數(shù)的影響,把7天作為一個周期,將連續(xù)的7天內(nèi)每日用水量作為一個訓(xùn)練集,采用支持向量機(jī)算法,可使用matlab中l(wèi)ibsvm工具來實(shí)現(xiàn),來預(yù)測第8天的用水量。

      圖表 4 樣本用水量數(shù)據(jù)表

      3.4 復(fù)雜預(yù)測模型

      此模型相比前兩個模型需要的數(shù)據(jù)維度更為廣泛,所以預(yù)測的結(jié)果也會更為準(zhǔn)確,我們將進(jìn)出港人數(shù)總和,季節(jié),天氣氣溫,是否節(jié)假日,當(dāng)?shù)厥欠裼写笮突顒拥纫磺锌梢粤炕闹笜?biāo)都作為訓(xùn)練樣本的特征,例如,我們將春夏秋冬分別設(shè)定為1、2、3、4,節(jié)假日設(shè)為1,非節(jié)假日為0,有大型活動為1,無大型活動為0,以及其他可量化并且與用水量有一定相關(guān)性的特征都添加到訓(xùn)練樣本中,增加樣本的特征數(shù)量來提高模型的泛化能力,以及提高預(yù)測的準(zhǔn)確率。

      圖表 5 樣本數(shù)據(jù)特征表

      3.5 模型調(diào)優(yōu)與評估

      以上述結(jié)構(gòu)化數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),對SVM和集成學(xué)習(xí)GBDT模型進(jìn)調(diào)優(yōu);SVR模型作回歸分析預(yù)測的時候需要調(diào)節(jié)的參數(shù)主要是懲罰參數(shù)c和核函數(shù)g,集成學(xué)習(xí)GBDT算法的主要參數(shù)有迭代樹的顆數(shù)n_estimators、學(xué)習(xí)速率learning_rate以及抑制過擬合的正則化參數(shù)等。

      選取合適的參數(shù)能夠使預(yù)測模型預(yù)測準(zhǔn)確率大大提高,對于SVM和GBDT算法,搜索超參數(shù)以及模型評價的方法一般采用交叉驗(yàn)證(CV,Cross Validation) 的方法。常見的CV方法如下:

      (1)多折交叉驗(yàn)證 (K-fold Cross Validation, K-CV)

      原始數(shù)據(jù)被平均分為K組,將每一組數(shù)據(jù)輪流分別做一次測試集,剩下的K-1組作為訓(xùn)練集,一共會得到K個模型,將這K個模型最終分類準(zhǔn)確率到平均數(shù)作為此K-CV下的評估指標(biāo)。

      (2)留一法 (Leave-One-Out Cross Validation, LOO-CV)

      假設(shè)一共有N個樣本,將每個樣本都單獨(dú)作為一次測試集,剩下的N-1個樣本作為訓(xùn)練集,訓(xùn)練后會得到N個模型,將這N個模型最終分類準(zhǔn)確率的平均數(shù)作為LOO-CV下分類器的評估指標(biāo)。

      將搜索的結(jié)果比對評價指標(biāo),得到性能最優(yōu)的超參數(shù)組合放入模型即可訓(xùn)練出最終模型。

      4 總結(jié)

      機(jī)場地下管網(wǎng)系統(tǒng)作為機(jī)場基礎(chǔ)服務(wù)的保障,水量供給方面需要做到未雨綢繆,合理高效的對機(jī)場用水量進(jìn)行預(yù)測可以很好地解決這個問題。而另一方面隨著機(jī)器學(xué)習(xí)、深度學(xué)習(xí)技術(shù)的不斷向前發(fā)展,算法落地的配套設(shè)施更加完善,實(shí)際應(yīng)用人工智能算法解決實(shí)際場景的復(fù)雜問題成為了可能。本文對機(jī)場地下的用水量預(yù)測這一問題進(jìn)行了適當(dāng)?shù)挠懻?,探討了?yīng)用傳統(tǒng)機(jī)器學(xué)習(xí)為機(jī)場用水量預(yù)測的可行性與合理性,并對具體的操作流程做出來適當(dāng)?shù)拿枋隹偨Y(jié)。

      猜你喜歡
      超平面用水量機(jī)器
      機(jī)器狗
      機(jī)器狗
      全純曲線的例外超平面
      你的用水量是多少?
      涉及分擔(dān)超平面的正規(guī)定則
      澳大利亞研發(fā)出新型農(nóng)業(yè)傳感器可預(yù)測農(nóng)作物用水量
      以較低截斷重數(shù)分擔(dān)超平面的亞純映射的唯一性問題
      未來機(jī)器城
      電影(2018年8期)2018-09-21 08:00:06
      分擔(dān)超平面的截斷型亞純映射退化性定理
      無敵機(jī)器蛛
      德阳市| 宁海县| 镇赉县| 无锡市| 米林县| 苏州市| 灯塔市| 南投市| 吴堡县| 万州区| 枣庄市| 宣威市| 长岛县| 博兴县| 门头沟区| 潜江市| 卓资县| 克山县| 江源县| 永嘉县| 伊川县| 都江堰市| 通榆县| 澄江县| 克东县| 麻江县| 鄂托克旗| 平利县| 伊宁县| 来安县| 大连市| 舟曲县| 溧水县| 夹江县| 宁武县| 伽师县| 威信县| 邵武市| 亳州市| 兴宁市| 依兰县|