• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于監(jiān)督學(xué)習(xí)算法的污水出水化學(xué)需氧量(COD)預(yù)測

      2022-07-15 21:10:29張凌超胡銘楊剛軼金李濤
      科技研究·理論版 2022年4期
      關(guān)鍵詞:機器學(xué)習(xí)

      張凌超 胡銘 楊剛軼 金李濤

      摘要:出水化學(xué)需氧量(COD)是衡量污水處理效果的核心指標(biāo)之一。本文采用線性回歸、K近鄰、決策樹、梯度提升回歸樹等監(jiān)督學(xué)習(xí)算法,構(gòu)建機器學(xué)習(xí)模型,對某市污水處理廠出水化學(xué)需氧量進行預(yù)測,誤差均值為3.14mg/L。提供了一種預(yù)測出水化學(xué)需氧量的方法,為污水處理的優(yōu)化提供了一種有效的方法。

      關(guān)鍵詞:機器學(xué)習(xí);監(jiān)督學(xué)習(xí);COD預(yù)測

      引言:城市的高速發(fā)展導(dǎo)致了用水量急劇增長,相應(yīng)的污水排放量不斷增加,使得污水的處理與排放顯得尤為重要。如何快速、準(zhǔn)確的衡量污水處理效果并保證出水水質(zhì)的穩(wěn)定十分關(guān)鍵,是污水處理行業(yè)所追求的目標(biāo)[1]。出水的化學(xué)需氧量(COD)是衡量污水處理效果的重要指標(biāo),通過對出水COD的預(yù)測,可以為污水處理高效穩(wěn)定的運行提供幫助。

      人工智能(ArtificialIntelligence,AI)作為計算機科學(xué)行業(yè)的頂尖技術(shù)之一,從1956年達特茅斯會議上正式提出開始就一直備受各行業(yè)關(guān)注。人工智能技術(shù)隨著算法的不斷改進和算力的不斷提升,進入了飛速發(fā)展的時期,在各領(lǐng)域都有廣泛的應(yīng)用[2-3]。機器學(xué)習(xí)(MachineLearning,ML)是人工智能的核心,通過讓機器去模擬人類學(xué)習(xí)的能力,從而使機器變得更加智能。

      本文基于傳統(tǒng)污水處理工藝技術(shù)及某市污水處理廠監(jiān)測公開數(shù)據(jù),結(jié)合進水化學(xué)需氧量、PH值、氨氮、色度、懸浮物等與污水處理出水水質(zhì)密切相關(guān)的幾大因素,使用機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法:線性回歸(LinearRegression)、K近鄰(K-NearestNeighborKNN)、決策樹(DecisionTree)和梯度提升回歸樹(GradientBoostingRegressionTree),通過對進水樣本特征的建模與計算,提供了一種有效預(yù)測出水COD的方法,為污水處理工藝高效穩(wěn)定的運行提供幫助。

      1出水化學(xué)需氧量預(yù)測模型的建立

      1.1實驗樣本的來源

      本文實驗所用樣本來自于某市生態(tài)環(huán)境局2018年至2019年間共9個月的污水處理廠監(jiān)督性檢測數(shù)據(jù)。樣本包含進水PH值、進水生化需氧量、進水化學(xué)需氧量、進水色度、進水氨氮、進水總氮、出水化學(xué)需氧量等15個特征,共計112組樣本。其中隨機選取93組樣本作為訓(xùn)練集,19組樣本作為測試集。

      1.2線性回歸模型(LinearRegression)

      線性回歸是一種用于回歸的線性模型,通過尋找參數(shù)w和b,使得預(yù)測值y與真實值y的均方誤差最小。線性回歸的預(yù)測公式為:

      設(shè)有數(shù)據(jù)集{(x1,y1),(x2,y2)…(xn,yn)},

      預(yù)測值y=wx+b。

      本次實驗將樣本中進水COD和出水COD的值作為輸入(x)和輸出(y),進行線性模型的訓(xùn)練。最終求得模型斜率(w)為-0.038,截距(b)為29.073。模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.39,9.71],誤差均值為4.86,均方誤差為29.97。

      1.3K近鄰(KNN)回歸模型

      K近鄰算法通過在訓(xùn)練集中尋找與預(yù)測值距離最相近的K個數(shù)據(jù)點,根據(jù)“投票法(voting)選取距離最近的K個數(shù)據(jù)點中出現(xiàn)次數(shù)最多的標(biāo)簽,作為預(yù)測值的標(biāo)簽。

      本次實驗的數(shù)據(jù)樣本特征均為連續(xù)值,根據(jù)K近鄰算法的特性,決定對訓(xùn)練集和測試集進行K近鄰回歸分析與建模;并使用歐氏距離(EuclideanDistance)計算測試集樣本與訓(xùn)練集樣本特征的差值。

      歐氏距離計算公式如下:

      設(shè)有數(shù)據(jù)點A(x1,x2…xn),數(shù)據(jù)點B(y1,y2…yn),則A、B兩點間的歐氏距離為:

      此算法通過迭代的方式,為每一個測試集中的樣本采用歐氏距離計算與所有訓(xùn)練集樣本特征間的差值,從而找出K個距離該測試點最近的訓(xùn)練集樣本,則K個距離最近訓(xùn)練集樣本標(biāo)簽的平均值為測試點的預(yù)測結(jié)果(出水COD)。同時,由于K近鄰算法的k值(鄰居數(shù)量)對模型的準(zhǔn)確度影響極大,為了得到最優(yōu)解,需要對不同K值對模型精確度的影響進行分析。

      經(jīng)過實驗分析,模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.52,12.26],誤差均值為3.64,均方誤差為19.79。

      1.4決策樹(DecisionTree)回歸模型

      決策樹算法是一種非常常用的機器學(xué)習(xí)算法,廣泛應(yīng)用于分類和回歸任務(wù)。決策樹是一種樹形結(jié)構(gòu),由一系列節(jié)點和分支組成。節(jié)點表示學(xué)習(xí)或決策過程中需要考慮的屬性,不同的分支則由不同的屬性構(gòu)成。利用某事例的屬性值,從決策樹的樹根節(jié)點往下搜索,直至葉子節(jié)點,便可對該事例進行學(xué)習(xí),做出決策[4]。構(gòu)建決策樹模型的具體方法是:檢測所有的屬性,計算信息增益(InformationGain),并選擇信息增益最大的屬性作為決策樹結(jié)點,并根據(jù)該屬性的不同取值建立分支,再對各分支的子集采用遞歸的方式建立決策樹結(jié)點的分支,直到所有子結(jié)點僅包含同一類別的數(shù)據(jù)為止[5]。

      信息增益(InformationGain)的計算方法:假設(shè)劃分前樣本為S,并用屬性A來劃分樣本S,則信息增益IG(S,A)等于樣本S的熵(Entropy)減去劃分完畢后子集的熵。公式如下:

      經(jīng)過實驗分析,模型預(yù)測出水COD與實際出水COD的誤差范圍為[0,9],誤差均值為3.68,均方誤差為20.84。

      1.5梯度提升回歸樹(GradientBoostingDecisionTree,GBDT)

      集成(ensemble)是一種通過合并多個機器學(xué)習(xí)的模型,從而構(gòu)建出一種更加強大的模型的方法。梯度提升回歸樹應(yīng)用了此集成方法,通過合并多個決策樹來構(gòu)建一個更加強大的機器學(xué)習(xí)模型。梯度提升樹模型中的主要參數(shù)是樹的數(shù)量(n_estimators)、學(xué)習(xí)率(learning_rate)和每棵樹的最大深度(max_depth)。其中決策樹的數(shù)量決定了模型的復(fù)雜程度;學(xué)習(xí)率控制每一棵樹對前面一棵樹錯誤的糾正強度;限制每棵樹的最大深度用于降低每棵樹的復(fù)雜度,使得內(nèi)存占用的更少,預(yù)測速度更快。

      經(jīng)過實驗分析,對于本樣本來說,樹的數(shù)量選用默認值、學(xué)習(xí)率取0.12、樹的最大深度為2時,模型泛化能力較強,模型精確度較高。最終,模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.13,6.84],誤差均值為3.14,均方誤差為13.41。

      2模型預(yù)測結(jié)果分析

      本文共建立了四個監(jiān)督學(xué)習(xí)模型對污水處理廠出水化學(xué)需氧量進行預(yù)測。四種模型的預(yù)測值和實際值對比如表1、圖1所示。表1四種監(jiān)督學(xué)習(xí)算法模型預(yù)測值與實際值的對比

      各模型預(yù)測出水COD值和實際出水COD值的誤差范圍、誤差均值和均方誤差如表二所示。

      對出水COD的預(yù)測誤差介于0.13~6.84ml/L之間,誤差均值為3.14ml/L,相較于線性回歸模型、K近鄰模型、決策樹模型算法,梯度提升回歸樹模型的預(yù)測結(jié)果更加顯著。

      3結(jié)論

      本文通過線性回歸、K近鄰、決策樹、梯度提升回歸樹等機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法,對某市污水處理廠出水化學(xué)需氧量進行預(yù)測研究。得到了一種可以快速有效預(yù)測出水化學(xué)需氧量的方法,對實際污水處理過程的優(yōu)化、調(diào)控具有一定的指導(dǎo)意義。

      參考文獻

      [1]陳威,陳會娟,戴凡翔,李忠.基于人工神經(jīng)網(wǎng)絡(luò)的污水處理出水水質(zhì)預(yù)測模型[J].給水排水,2020,56(S1):990-994.

      [2]任成.人工智能技術(shù)發(fā)展綜述[J].中國安防,2020(10):81-83.

      [3]郝欣愷.人工智能技術(shù)發(fā)展及應(yīng)用研究綜述[J].環(huán)渤海經(jīng)濟瞭望,2020(09):152-153.

      [4]魏茂勝.數(shù)據(jù)挖掘中的分類算法綜述[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017(06):65-66.

      [5]羅可,林睦綱,郗東妹.數(shù)據(jù)挖掘中分類算法綜述[J].計算機工程,2005(01):3-5+11.

      猜你喜歡
      機器學(xué)習(xí)
      基于詞典與機器學(xué)習(xí)的中文微博情感分析
      基于機器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
      時代金融(2016年27期)2016-11-25 17:51:36
      前綴字母為特征在維吾爾語文本情感分類中的研究
      下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
      活力(2016年8期)2016-11-12 17:30:08
      基于支持向量機的金融數(shù)據(jù)分析研究
      基于Spark的大數(shù)據(jù)計算模型
      基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
      基于圖的半監(jiān)督學(xué)習(xí)方法綜述
      機器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
      平顺县| 上杭县| 乌鲁木齐市| 嘉定区| 家居| 仪征市| 枣阳市| 柳江县| 海城市| 长葛市| 子长县| 满洲里市| 普陀区| 林口县| 临沂市| 三原县| 海原县| 塘沽区| 玉田县| 徐汇区| 晋中市| 张家口市| 淮南市| 宜春市| 竹山县| 常德市| 哈巴河县| 长武县| 宜黄县| 壶关县| 日照市| 无棣县| 新泰市| 衡阳县| 四会市| 茶陵县| 甘谷县| 乳山市| 三亚市| 宣恩县| 大庆市|