• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      機器學習方法在CO濃度中的預測研究

      2021-01-29 03:06:44魏萊王新民長春工業(yè)大學數(shù)學與統(tǒng)計學院
      數(shù)碼世界 2020年12期
      關鍵詞:決策樹分類器機器

      魏萊 王新民 長春工業(yè)大學數(shù)學與統(tǒng)計學院

      1 引言

      近些年,空氣的污染對社會的危害愈發(fā)嚴重,它往往悄無聲息的存在于人們身邊并給人們的身體帶來傷害。多種有危害的氣體都能長時間的存在于人們生活的世界中,其中最主要的就是一氧化碳。CO的濃度受很多生活方面的影響,它會因為人類或者自然界的排放增加自己的濃度,想解決它的危害問題就要明確的預測它不同時間階段的濃度規(guī)律,但是它的不規(guī)則性和不穩(wěn)定性讓了人們難于預測其濃度。想要精準的預測其濃度是有難度的。本文想要尋求一種滿足人們要求的預測方法對CO的濃度進行精準的預測。

      人們最近幾年對CO的治理和對空氣質量的預測也進行了很多研究。葉珊珊等人在2020年對一氧化碳中毒的流行病例特征進行分析,同時提及急性CO中毒起與日均氣溫、平均氣壓和空氣相對濕度均存在相關性,同時也希望科普CO對社會的危害并正視它。蔡澤棟在2020年使用機器學習的算法對復雜的金融數(shù)據(jù)進行了預測,運用幾種機器學習方法進行對比,從其文章中可以了解到機器學習算法對于此類數(shù)據(jù)的預測精準度有很大的提升。劉紅等人2020年運用隨機森林算法對溫室氣溫進行預測,同時建立多種機器學習的方法與之進行對比,通過實驗驗證了隨機森林在預測模型方面的優(yōu)越性。李畸勇等人2020年運用SVR算法建立預測模型,在其數(shù)據(jù)預測中SVR模型為結果最優(yōu)模型,作者也表示文章中所提供的模型泛化性能很優(yōu)越。張順航等人2019年根據(jù)往年江蘇省的氣象數(shù)據(jù),探究氣象對小麥產(chǎn)量的影響,對小麥歷年的產(chǎn)量進行預測,結果表明Adaboost算法預測的最為精準??梢钥吹綑C器學習的算法在各個領域都大放光彩,本文將機器學習應用到空氣污染的成員之一的CO的濃度數(shù)據(jù)上進行結合,并觀察各個不同的算法在預測精準度上能達到怎樣的程度。

      2 機器學習

      2.1 機器學習

      機器學習(Machine Learning)是一個多學科組成的專業(yè),它在人們的認知內已經(jīng)存在了很長時間了。直到今日,它漸漸成為各行各業(yè)研究數(shù)據(jù)分類和回歸的熱點,機器學習的目的是讓機器像人一樣思考學習,傳統(tǒng)的機器學習主要包括決策樹、隨機森林、人工神經(jīng)網(wǎng)絡、支持向量回歸機、Adaboost、迭代決策樹等。近些時間,機器學習對人來說已經(jīng)不陌生了,人們生活的現(xiàn)代社會處處都有機器學習的體現(xiàn),機器學習的發(fā)展也讓人們的工作和生活有了良好的改變。

      2.2 支持向量回歸機

      支持向量回歸機(SVR)是支持向量機(SVM)中的一個重要的組成部分,支持向量機是一種按照監(jiān)督學習的方法將數(shù)據(jù)分成兩類的分類器,SVM從被提出開始就被廣泛地應用于各個問題的應用,為人們解決了很多發(fā)展附帶的不利問題。

      2.3 Adaboost

      Adaboost是一種迭代算法,其思想是將多個不同的分類器組合成一個更強的分類器,它應用大多的分類問題上,也出現(xiàn)了一些回歸問題上的應用,它具有較高的檢測速率,且不易出現(xiàn)過適應現(xiàn)象

      2.4 決策樹

      決策樹(Decision Tree)是以諸多情況的概率為基礎,通過構成決策樹并通過決策樹的求取概率,判斷哪種方法是可行的,是一種非常直觀的圖解法,其運作并不復雜,在解決問題方面也有自己良好的性能。由于這種方法像一棵樹的樹干,所以稱它為決策樹。

      2.5 隨機森林

      隨機森林(Random Decision Forests)本質上就是一個包含多個決策樹的分類器,它具有很多優(yōu)點。首先針對于很多數(shù)據(jù)它可以產(chǎn)生很優(yōu)的分類器,其次它可以被延伸用在未被標記的資料上,另外它的學習過程也是很快速的。構建隨機森林需要兩個方面,首先從原數(shù)據(jù)中采取有放回的抽樣,構造出一個和原數(shù)據(jù)集數(shù)據(jù)量相同的子數(shù)據(jù)集,它控制決策樹各不相同的方法就是控制最優(yōu)的特征,使其隨機選取。

      2.6 迭代決策樹

      迭代決策樹(GBDT/Gradient Boosting Decision Tree) 又叫MART(Multiple Additive Regression Tree),是一種迭代的決策樹算法,它與隨機森林一樣都是由多個決策樹組成,不同的是,它是由這些決策樹的結論加起來生成最終的答案并加以運算的。它與SVM也有共同點,它們的構造讓它們的泛化能力很優(yōu)秀,GBDT更是因為機器學習的發(fā)展更加受大家的關注。

      3 實驗結果與分析

      3.1 數(shù)據(jù)集

      本文選擇UCI數(shù)據(jù)集上的空氣質量數(shù)據(jù),從數(shù)據(jù)中挑選出CO濃度數(shù)據(jù)并對其進行缺失值處理。本文選擇前70%的處理后的數(shù)據(jù)作為訓練數(shù)據(jù),其他作為測試數(shù)據(jù),共7819條數(shù)據(jù)。其中使用均值填充和刪除缺失數(shù)據(jù)兩種方法處理數(shù)據(jù)。

      3.2 實驗結果與分析

      為了對比出算法在本文數(shù)據(jù)上預測精準度的優(yōu)劣,本文將Adaboost、SVR、隨機森林、GBDT進行比較,用MSE和R2作為其評價指標,四種方法的 MSE 分別為:0.70、0.78、0.63、0.60,四種方法的 R2分別為:0.67、0.63、0.70、0.71。由實驗結果可以看出無論評價指標是MSE還是R2最優(yōu)的模型是GBDT模型算法,其MSE為0.60,R2為0.71。隨機森林的結果也不錯但是跟GBDT還是有一部分差距。

      4 結論

      本文出于運用機器學習預測CO濃度的角度,對本數(shù)據(jù)進行處理,并同時運用Adaboost、SVR、隨機森林、GBDT進行比較,對比它們結果,其中MSE的結果是:Adaboost為、SVR為、隨機森林為、GBDT為,MAPE的結果是:Adaboost為、SVR為、隨機森林為、GBDT為,可以看出在這四種機器學習算法中,結果最優(yōu),預測最精準的是GBDT。未來的研究可以圍繞著各個空氣質量指標進行深度的解剖研究,也可以引入更多的算法模型進行預測,對比各個模型的優(yōu)劣。

      猜你喜歡
      決策樹分類器機器
      機器狗
      機器狗
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機森林方法在管理決策中的應用
      電子制作(2018年16期)2018-09-26 03:27:06
      未來機器城
      電影(2018年8期)2018-09-21 08:00:06
      BP-GA光照分類器在車道線識別中的應用
      電子測試(2018年1期)2018-04-18 11:52:35
      加權空-譜與最近鄰分類器相結合的高光譜圖像分類
      結合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
      基于決策樹的出租車乘客出行目的識別
      無敵機器蛛
      青岛市| 屏边| 东台市| 紫阳县| 依兰县| 汕头市| 德令哈市| 成安县| 宽甸| 融水| 格尔木市| 仪征市| 桐庐县| 嘉善县| 大丰市| 潮安县| 恩平市| 仲巴县| 旬阳县| 德惠市| 吴桥县| 前郭尔| 永寿县| 江孜县| 会同县| 临颍县| 叙永县| 九江市| 沁阳市| 汶川县| 青田县| 苍溪县| 板桥市| 高淳县| 枝江市| 昌图县| 邛崃市| 卓尼县| 周宁县| 东平县| 龙岩市|