• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于圖像質(zhì)量分析的PM2.5空氣質(zhì)量預(yù)測(cè)

      2020-01-14 01:53:50李曉理
      關(guān)鍵詞:預(yù)測(cè)特征圖像

      李曉理,張 山,王 康,2

      (1.北京工業(yè)大學(xué)信息學(xué)部,北京 100124; 2.計(jì)算智能與智能系統(tǒng)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124;3.數(shù)字社區(qū)教育部工程研究中心,北京 100124; 4.北京未來網(wǎng)絡(luò)科技高精尖創(chuàng)新中心,北京 100124)

      近年來,城市化規(guī)模不斷擴(kuò)張,工業(yè)的發(fā)展和化石燃料的消費(fèi)也有所增加,導(dǎo)致了中國空氣污染的增加,許多城市出現(xiàn)了水、空氣和噪聲污染等嚴(yán)重的環(huán)境污染問題. 與使用有效的方法處理水和噪聲污染問題相比,目前,人們卻對(duì)最常見的空氣污染沒有更簡單、便捷的辦法,這使得環(huán)境可持續(xù)發(fā)展的目標(biāo)難以實(shí)現(xiàn). PM2.5是由具有高活性的有毒有害物質(zhì)組成,并且在大氣中顯示出長的停留時(shí)間和遠(yuǎn)距離的運(yùn)輸距離. 據(jù)報(bào)道,暴露于高質(zhì)量濃度的PM2.5會(huì)導(dǎo)致心血管和肺部疾病的增加,對(duì)健康特別有害,每年導(dǎo)致約700萬人死亡[1-4]. 當(dāng)其含量超過環(huán)境承載能力時(shí),空氣質(zhì)量將會(huì)惡化,導(dǎo)致人們的工作、生活、健康以及生態(tài)環(huán)境等遭受嚴(yán)重破壞. 此外,空氣污染的許多來源并不能得到有效控制,而且這些來源的數(shù)量不斷增加. 如上所述,在短時(shí)間內(nèi)徹底治理空氣污染問題是很困難的. 因此,大多數(shù)人逐漸重視大氣污染物質(zhì)量濃度預(yù)測(cè)和大氣污染預(yù)防措施. 此外,迫切需要一種用于監(jiān)測(cè)空氣質(zhì)量的有效且經(jīng)濟(jì)的方法,促進(jìn)環(huán)境部門做出決策,例如實(shí)時(shí)向所有用戶發(fā)布空氣質(zhì)量信息,并且他們可以提前采取預(yù)防措施.

      目前,在空氣污染預(yù)測(cè)應(yīng)用中有各種機(jī)器學(xué)習(xí)算法. 陳淳祺等[5]應(yīng)用多元線性回歸模型研究武漢市氣象環(huán)境對(duì)空氣質(zhì)量的影響和相關(guān)性. 白鶴鳴等[6]用神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)空氣質(zhì)量指數(shù). Liu等[7]使用反向傳播神經(jīng)網(wǎng)絡(luò)和選擇樣本規(guī)則來預(yù)測(cè)城市空氣質(zhì)量. 李翔[8]將遺傳算法優(yōu)化的誤差反向傳播網(wǎng)絡(luò)(back propagation neural network,BPNN)和模糊BPNN應(yīng)用于空氣質(zhì)量預(yù)測(cè). Sun等[9]用隱馬爾可夫模型算法預(yù)測(cè)北加利福尼亞州的PM2.5質(zhì)量濃度. 最近,Zhou等[10]利用混合集合經(jīng)驗(yàn)?zāi)J椒纸夂蛷V義回歸神經(jīng)網(wǎng)絡(luò)對(duì)PM2.5質(zhì)量濃度進(jìn)行預(yù)測(cè). 當(dāng)然,使用組合的方法能得到更好的預(yù)測(cè)結(jié)果,但是這些方法的弊端也是顯而易見的,如運(yùn)行時(shí)間長、成本高等.

      眾所周知,圖像在記錄信息、傳達(dá)思想和表達(dá)日常生活中的情感方面發(fā)揮著越來越重要的作用. 因此,本研究不同于以往單一的利用機(jī)器學(xué)習(xí)的方法,僅結(jié)合污染物質(zhì)量濃度數(shù)據(jù)和氣象數(shù)據(jù)對(duì)污染物質(zhì)量濃度進(jìn)行預(yù)測(cè),而是考慮空氣污染會(huì)影響圖像的質(zhì)量,從圖像質(zhì)量分析的角度,結(jié)合機(jī)器學(xué)習(xí)方法對(duì)污染物質(zhì)量濃度進(jìn)行預(yù)測(cè),目的是進(jìn)一步提高PM2.5質(zhì)量濃度預(yù)測(cè)的準(zhǔn)確性.

      1 特征提取

      1.1 圖像質(zhì)量分析

      與好的天氣相比,在惡劣天氣下拍攝的照片往往更為有序. 這一現(xiàn)象主要是因?yàn)轱柡投瓤梢钥醋魇且环N顏色與其最接近的自然光譜顏色之間的相似性,當(dāng)PM2.5質(zhì)量濃度較大時(shí),顏色特征參數(shù)會(huì)降低到一個(gè)很低的水平. 在這種情況下,圖像中每個(gè)像素的飽和度往往變成零,整個(gè)空間飽和度趨于穩(wěn)定和有序. 也就是說,霧霾天氣改變了圖像的對(duì)比度和自然統(tǒng)計(jì)特性,這反過來又影響圖像的質(zhì)量. 圖1很形象地說明了上述現(xiàn)象. 僅相差半個(gè)小時(shí),就可以直觀地感受到霧霾天氣給圖像帶來的明顯改變. 由此可知,直觀上不同顆粒質(zhì)量濃度的霾會(huì)影響圖像的視覺效果. 實(shí)質(zhì)上是因?yàn)閳D像的自然特性和對(duì)比度發(fā)生了變化. 因此,本文選擇與上述2種特性相關(guān)的圖像質(zhì)量評(píng)價(jià)模型進(jìn)行特征提取.

      1.2 特征提取

      本研究首先獲取日常天氣照片,得到大量的圖像數(shù)據(jù)集. 通過圖像質(zhì)量評(píng)價(jià)(image quality assessment,IQA)的方法,獲取相應(yīng)的特征. 目前,現(xiàn)有的特定的盲測(cè)量方法受到失真類別的先驗(yàn)知識(shí)和專用應(yīng)用場(chǎng)景的依賴性的極大限制,導(dǎo)致可以同時(shí)處理各種失真類型的通用型無參考(no reference, NR)IQA引起了更多關(guān)注,因而,有許多質(zhì)量度量被提出用來測(cè)量原始圖像和失真圖像之間的差異/保真度以預(yù)測(cè)質(zhì)量評(píng)分. 本文選擇了3種最新的圖像質(zhì)量評(píng)價(jià)模型(無參考的基于自由能的魯棒測(cè)量模型、使用圖像直方圖的相位一致性和統(tǒng)計(jì)信息來呈現(xiàn)用于對(duì)比度變化的模型和無參考調(diào)頻質(zhì)量指數(shù)模型)來提取特征.

      1.2.1 第1組特征

      第1組特征是利用文獻(xiàn)[11]中所用的模型進(jìn)行提取的,它根據(jù)所提出的一種NRIQA度量,稱作無參考的基于自由能的魯棒測(cè)量,使用最近揭示的基于自由能的大腦理論和經(jīng)典人類視覺系統(tǒng)(human visual system, HVS)原理來提取特征[12]. 這組特征又可以分為如下3個(gè)部分.

      第1部分涉及受自由能原理和結(jié)構(gòu)退化模型啟發(fā)的特征. 該特征來自2個(gè)有效的全參考IQA算法及其組合. 本文算法是根據(jù)自由能理論實(shí)現(xiàn)的,正如Friston揭示的自由能理論,將生物和自然科學(xué)中關(guān)于人類行為、感知和學(xué)習(xí)的幾種腦理論的解釋統(tǒng)一起來. 類似于貝葉斯腦假說[13],基于自由能的腦理論的基本前提是認(rèn)知過程,是由內(nèi)部生成模型操縱的. 使用這種生成模型,人類大腦可以主動(dòng)推斷輸入視覺信號(hào)的有意義信息的預(yù)測(cè),并以建設(shè)性的方式避免剩余的不確定性. 這個(gè)建設(shè)性模型是一個(gè)基本的概率模型,可以將其分解為可能性項(xiàng)和先驗(yàn)項(xiàng). 然后,視覺感知通過反轉(zhuǎn)這個(gè)可能性項(xiàng)來推斷給定場(chǎng)景的后驗(yàn)可能性. 在真實(shí)場(chǎng)景和大腦預(yù)測(cè)之間存在差距是自然的,因?yàn)樯赡P筒豢赡苁峭ㄓ玫? 外部輸入與生成模型預(yù)測(cè)結(jié)果產(chǎn)生的偏差被認(rèn)為與人類視覺感知的質(zhì)量密切相關(guān),甚至可以用于質(zhì)量測(cè)量.

      第2部分特征是由一些HVS啟發(fā)的特征(例如結(jié)構(gòu)信息和梯度)預(yù)測(cè)圖像的特征組成,也受到自由能理論的啟發(fā),這說明HVS總是試圖通過減少基于內(nèi)部生成模型的不確定性來感知和理解輸入視覺刺激.

      第3部分特征通過將廣義高斯分布(generalized Gauss distribution, GGD)擬合平均減去對(duì)比歸一化系數(shù)來量化失真圖像中“自然度”的可能損失. 在文獻(xiàn)[14]中,發(fā)現(xiàn)解相關(guān)函數(shù)可以通過應(yīng)用局部非線性運(yùn)算來對(duì)比亮度,以消除零對(duì)數(shù)對(duì)比中的局部平均位移并歸一化對(duì)數(shù)對(duì)比度的局部變化. 此外,這些歸一化的亮度值使自然圖像的高度趨近于單位正態(tài)高斯分布,該方法已被用于模擬早期人類視覺中的對(duì)比度增益掩蔽過程. 因此,可用GGD來有效捕捉失真圖像的更寬泛的統(tǒng)計(jì)量,根據(jù)公式

      (1)

      估計(jì)均值為零的GGD. 式中

      (2)

      (3)

      式中,參數(shù)μ控制著分布的形狀,而另一個(gè)參數(shù)σ2則表示分布的方差. 在本研究中,選擇局部歸一化亮度系數(shù)的分布是由于其通常是對(duì)稱的,所以選擇零均值分布. 通過部署這個(gè)參數(shù)模型來擬合扭曲圖像以及未失真圖像的局部歸一化亮度系數(shù)經(jīng)驗(yàn)分布. 對(duì)于每幅圖像,首先估算2個(gè)參數(shù)(μ,σ2),這2個(gè)參數(shù)分別通過對(duì)原始尺度進(jìn)行局部歸一化亮度參數(shù)的GGD擬合及使用低通濾波方法降低圖像分辨率的處理方法得到;然后進(jìn)行2倍因子下采樣,構(gòu)成最后一組特征;最后,通過這個(gè)模型共提取了750×19組特征.

      1.2.2 第2組特征

      第2組特征是根據(jù)文獻(xiàn)[15]中所用的模型進(jìn)行提取的. 目前,IQA的研究主要集中在噪聲、模糊、傳輸誤差和壓縮圖像方面. 通常,失真圖像的感知質(zhì)量低于其相應(yīng)的理想版本. 然而,對(duì)比度變化與上述失真類型不同. 為了填補(bǔ)這個(gè)空白,本文使用圖像直方圖的相位一致性和統(tǒng)計(jì)信息來呈現(xiàn)用于對(duì)比度變化的圖像質(zhì)量度量.

      該模型通過兩階段框架來描述圖像對(duì)比度變化的IQA[16]. 第1個(gè)階段是比較原始圖像和對(duì)比度變化圖像的相似性,因?yàn)楦哔|(zhì)量圖像應(yīng)該與其原始副本很相似. 此外,人們通常關(guān)注顯著區(qū)域,因此,用相位一致性原則(phase congruence, PC)搜索重要區(qū)域,然后估計(jì)原始圖像和對(duì)比度變化圖像中所選區(qū)域的熵差異. 第2個(gè)階段與“舒適度”有關(guān). 在這個(gè)框架中采用一階、二階統(tǒng)計(jì)量(均值和方差),根據(jù)它們?cè)趫D像質(zhì)量評(píng)估中的貢獻(xiàn)分別設(shè)為20和25. 另外,在神經(jīng)科學(xué)和自然場(chǎng)景統(tǒng)計(jì)中經(jīng)常使用第3和第4階統(tǒng)計(jì)量(偏度和峰度),其揭示了高階統(tǒng)計(jì)量與人的舒適感有關(guān).

      1) 相似性

      熵作為統(tǒng)計(jì)學(xué)中的一個(gè)主要概念[17],它通過量化其平均不可預(yù)測(cè)性來表示隨機(jī)信號(hào)的信息量. 高對(duì)比度圖像的熵通常較大. 首先將對(duì)比度變化圖像x的熵表示為

      (4)

      盡管熵能夠測(cè)量圖像信號(hào)的平均不可預(yù)測(cè)性,但它不能表征和區(qū)分各種圖像場(chǎng)景. 例如,雖然可以很容易地找出2個(gè)具有相同直方圖和熵的圖像,但它們分別呈現(xiàn)出美麗的景象和無序的圖像. 因此,通過計(jì)算原始圖像和對(duì)比度變化圖像的選擇性熵值的差異以測(cè)量相似度. 對(duì)于原始圖像s,基于PC的熵也被類似地定義為Hs(y),然后用相似度量化.

      R0=Hs(x)-Hs(y)

      (5)

      2) 舒適性

      原始圖像y的平均值或一階統(tǒng)計(jì)量決定了圖像直方圖的整體亮度. 在照相技術(shù)中,一對(duì)經(jīng)常遇到的問題是曝光過度(高平均亮度)和曝光不足(低平均亮度),這經(jīng)常會(huì)降低照片的質(zhì)量并降低用戶的舒適度. 因此,攝像機(jī)通常具有自動(dòng)調(diào)節(jié)圖像直方圖的功能,可以使用適當(dāng)?shù)腉amma傳輸. 但與此同時(shí),不正確的Gamma功能選擇將惡化圖像對(duì)比度和視覺質(zhì)量. 因此,通過引入一個(gè)高斯核函數(shù)

      R=exp [-((E(x)-α)/τ)2]

      (6)

      來設(shè)計(jì)一階統(tǒng)計(jì)相關(guān)項(xiàng),從而懲罰具有非常大或較小平均值的圖像.

      其中E(x)被定義為圖像x的期望值,并且α和τ是確定使用的高斯核的均值和形狀的固定模型參數(shù). 最后,將相似度和舒適度結(jié)合起來,得出對(duì)比度變化圖像的整體質(zhì)量分?jǐn)?shù). 最終,使用簡單的線性融合來整合基于PC的熵和四階統(tǒng)計(jì)的差異. 值得注意的是,此類模型只需要一個(gè)單一的數(shù)字,即原始圖像Hs(y)基于的PC熵與圖像文件的大小相比通??珊雎圆挥?jì),只需在頭文件中進(jìn)行編碼即可. 鑒于此,最終得到750×4組特征.

      1.2.3 第3組特征

      第3組特征是根據(jù)文獻(xiàn)[18]中所用的無參考調(diào)頻質(zhì)量指數(shù)模型進(jìn)行提取的. 由于動(dòng)態(tài)范圍的限制,色調(diào)映射圖像不能保留原始圖像的所有信息. 首先假設(shè)一張好的色調(diào)映射圖像包含大量信息是合理的,然后在此基礎(chǔ)上,評(píng)估色調(diào)映射圖像質(zhì)量的第1個(gè)考慮因素是直接估算其本身的信息量以及通過使原始亮度變暗/增亮所產(chǎn)生的中間圖像. 接下來,再尋求一種衡量信息量的方法,常用的如Kullback-Leibler散度及其修正的對(duì)稱格式. 通過實(shí)驗(yàn)發(fā)現(xiàn),散度的發(fā)散或其對(duì)稱版本的使用不能有助于性能增益的顯著提高,相反會(huì)引入很多成本時(shí)間,因此,決定用熵[17]來量化信息量.

      另外,考慮的第2點(diǎn)是圖像的統(tǒng)計(jì)自然性. 首先假設(shè)高質(zhì)量的色調(diào)映射圖像也應(yīng)該看起來很自然. 在過去的幾年中,為了促進(jìn)圖像/視頻處理技術(shù)的探索和對(duì)生物視覺的理解,有大量的文獻(xiàn)傾向自然圖像的統(tǒng)計(jì)[19]. 許多現(xiàn)有的NRIQA度量標(biāo)準(zhǔn)都是基于自然場(chǎng)景統(tǒng)計(jì)的[20]. 這些模型背后的基本思想在于,自然圖像通過局部平均去除和分裂歸一化處理,使歸一化系數(shù)嚴(yán)格地遵循高斯分布,不同的失真類型或級(jí)別的圖像將重新形成此分布.

      然而,上述統(tǒng)計(jì)模型在評(píng)估色調(diào)映射圖像的視覺質(zhì)量方面并不合適,因此,需要另一種基于自然統(tǒng)計(jì)特性的模型. 對(duì)色調(diào)映射圖像進(jìn)行自然統(tǒng)計(jì)的研究表明,自然度和圖像屬性存在高度相關(guān)性,特別是亮度和對(duì)比度[21]. 因此,所用的模型考慮了根據(jù)平均亮度和對(duì)比度形成的統(tǒng)計(jì)自然度模型[22]. 基本上,這個(gè)模型在捕捉自然圖像的關(guān)鍵因素的簡單性和能力之間達(dá)到平衡.

      第3點(diǎn)考慮的是校準(zhǔn)色調(diào)映射圖像保留主要結(jié)構(gòu)的能力. 在文獻(xiàn)[23]中,Wang等表明HVS高度適應(yīng)從輸入視覺刺激中提取結(jié)構(gòu)信息,并且他們還提供了大量示例來證明基于結(jié)構(gòu)相似性指數(shù)在評(píng)估圖像質(zhì)量方面優(yōu)于傳統(tǒng)的均方誤差. 事實(shí)上,許多高精度的IQA算法是基于結(jié)構(gòu)相似性[24]或梯度幅度相似性設(shè)計(jì)的,可以將其視為圖像結(jié)構(gòu)的另一種度量[25]. 最終,從色調(diào)映射圖像中提取了共750×11個(gè)特征.

      2 質(zhì)量濃度預(yù)測(cè)

      2.1 實(shí)驗(yàn)原理

      在特征提取之后,需要使用回歸模塊找到從特征空間到主觀平均意見分(mean opinion score,MOS)的合適映射,產(chǎn)生圖像質(zhì)量的度量. 根據(jù)預(yù)測(cè)模型與原始圖像數(shù)據(jù)之間的殘差,找到與PM2.5質(zhì)量濃度之間的聯(lián)系,用非線性映射的方法估計(jì)PM2.5質(zhì)量濃度的自然可能性.

      在實(shí)驗(yàn)中,將支持向量回歸機(jī)(support vector regression, SVR)[26]應(yīng)用于圖像質(zhì)量評(píng)估問題[12]. 首先,利用具有徑向基函數(shù)(radial basis function, RBF)內(nèi)核的SVR做了一個(gè)簡單的實(shí)驗(yàn). 隨后,為了展示提取特征的有效性并與最先進(jìn)的技術(shù)進(jìn)行比較,本文利用粒子群優(yōu)化的支持向量回歸機(jī)(support vector regression for particle swarm optimization,PSO-SVR)和用遺傳算法優(yōu)化的支持向量回歸機(jī)(support vector regression for genetic algorithm,GA-SVR)預(yù)測(cè)PM2.5質(zhì)量濃度. 最終的實(shí)驗(yàn)結(jié)果證實(shí)了PSO-SVR預(yù)測(cè)模型的優(yōu)越性. 利用粒子群算法對(duì)SVR參數(shù)進(jìn)行優(yōu)化的整體算法過程如圖2所示.

      2.2 參數(shù)的選取與優(yōu)化

      核函數(shù)是支持向量機(jī)的重要組成部分,通過把數(shù)據(jù)映射到高維特征空間來增加傳統(tǒng)的線性學(xué)習(xí)器的計(jì)算能力. 核函數(shù)的構(gòu)造及其相應(yīng)參數(shù)的選取都能對(duì)SVR的性能造成一定的影響,因此,要想提高預(yù)測(cè)精度必須選擇合適的核函數(shù)和相應(yīng)參數(shù). SVR模型有2個(gè)非常重要的參數(shù)c與g,其中c是懲罰系數(shù),即對(duì)誤差的寬容度.c越高,說明越不能容忍出現(xiàn)誤差,容易過擬合;c越小,容易欠擬合.g是將RBF函數(shù)作為核函數(shù)后該函數(shù)自帶的一個(gè)參數(shù),間接地決定了數(shù)據(jù)映射到新的特征空間后的分布,g越大,支持向量越少;g越小,支持向量越多. 支持向量的個(gè)數(shù)影響訓(xùn)練與預(yù)測(cè)的速度.

      本文選擇使用2種啟發(fā)式算法來查找SVR核函數(shù)的c和g. 首先,當(dāng)進(jìn)行第1個(gè)簡單的實(shí)驗(yàn)時(shí),將上述2個(gè)參數(shù)在一定范圍內(nèi)取值,最終取性能最好的值. 其次,先用第1種元啟發(fā)式算法- 遺傳算法(genetic algorithm,GA)對(duì)2個(gè)參數(shù)進(jìn)行優(yōu)化. 最后,再用PSO算法進(jìn)行優(yōu)化. 由于PSO是一種基于群體智能的進(jìn)化計(jì)算技術(shù),與GA相比,PSO沒有選擇、交叉、變異操作,而是在可行域中搜索跟隨的最佳粒子. 目前,該算法已在多領(lǐng)域有廣泛的應(yīng)用[27]. 基于PSO算法的函數(shù)極值尋優(yōu)算法的流程圖如圖3所示. 本實(shí)驗(yàn)中,適應(yīng)度函數(shù)是Ackley函數(shù)表達(dá)式,適應(yīng)度值為函數(shù)值. 種群粒子數(shù)為20,每個(gè)粒子的位數(shù)為2,算法迭代進(jìn)化次數(shù)為100.

      對(duì)于一組圖片,整體可能性越大,PM2.5質(zhì)量濃度越小. 因此,需要一個(gè)非線性映射來將殘差值轉(zhuǎn)換為最終的PM2.5質(zhì)量濃度. 鑒于此,需要采用非線性映射來提高性能的準(zhǔn)確性,但不影響輸入數(shù)據(jù)的單調(diào)性. 因此,本文選擇最簡單的三參數(shù)非線性函數(shù)

      (7)

      式中{λ1,…,λ2}是在曲線擬合過程中確定的自由參數(shù).

      3 實(shí)驗(yàn)與結(jié)果分析

      3.1 實(shí)驗(yàn)內(nèi)容

      3.1.1 數(shù)據(jù)獲取與處理

      為了評(píng)估基于圖像分析的PM2.5質(zhì)量濃度的預(yù)測(cè)能力和準(zhǔn)確性,建立一個(gè)數(shù)據(jù)庫是至關(guān)重要的. 在目前的工作中,選擇文獻(xiàn)[28]中使用的空氣質(zhì)量圖像數(shù)據(jù)庫作為測(cè)試平臺(tái)進(jìn)行驗(yàn)證. 該數(shù)據(jù)庫包含了過去3年不同PM2.5質(zhì)量濃度下相機(jī)拍攝的750張照片. 涉及公園、湖泊、公路、建筑物等多個(gè)場(chǎng)景,這樣可以近似表征自然場(chǎng)景中的空氣質(zhì)量分布. 這些照片的分辨率從500×261到978×550. 每幅照片的相關(guān)PM2.5質(zhì)量濃度由美國駐北京大使館提供的每小時(shí)PM2.5質(zhì)量濃度歷史數(shù)據(jù)以及參考安裝在北京工業(yè)大學(xué)校園內(nèi)的監(jiān)測(cè)設(shè)備獲取,以做比較與分析. 本文選擇2個(gè)設(shè)備及記錄數(shù)據(jù)界面,如圖4、5所示. 為了確保圖像的質(zhì)量,圖像的采集須有一定的前提條件,首先是要在無風(fēng)或有微風(fēng)的天氣拍攝,這樣可以最大限度地保證獲取到的圖像所對(duì)應(yīng)的PM2.5質(zhì)量濃度與監(jiān)測(cè)點(diǎn)報(bào)告的真實(shí)PM2.5質(zhì)量濃度接近. 其次是,捕獲的圖像必須包含天空,大約占1/3~1/2圖像的區(qū)域,并避免面對(duì)太陽. 在整個(gè)數(shù)據(jù)集中,PM2.5質(zhì)量濃度為1~423 g/m3(值越低,表示空氣質(zhì)量越好).

      同時(shí),由于光線的散射作用,天空在晴朗的日子是藍(lán)色的,在朦朧或陰天的時(shí)候,天空是灰色的或白色的. 天空中云的存在可以直接從圖像中檢測(cè)出來,用來區(qū)分它和朦朧的天空. 通過結(jié)合色彩和光滑的特點(diǎn),試圖確定清晰、部分陰天、陰天和朦朧的日子. 這些信息結(jié)合在線天氣數(shù)據(jù)可幫助最大限度地減少對(duì)天氣條件判斷的誤差.

      3.1.2 實(shí)驗(yàn)過程

      首先,獲取圖片數(shù)據(jù),根據(jù)2節(jié)提及的模型與方法進(jìn)行特征提取,分別得到750×19、750×4、750×11三組特征;其次,針對(duì)SVR、GA-SVR、PSO-SVR回歸模型預(yù)測(cè)方法,分別按訓(xùn)練集和測(cè)試集的比例7∶3、8∶2、9∶1進(jìn)行3組實(shí)驗(yàn),共9組實(shí)驗(yàn),用來比較各個(gè)實(shí)驗(yàn)的結(jié)果與模型性能. 同時(shí),驗(yàn)證預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)的相關(guān)性,具體的結(jié)果見表1.

      3.2 結(jié)果分析

      為驗(yàn)證所提出的PSO-SVR模型的高效性,將實(shí)驗(yàn)結(jié)果與一般的SVR和GA-SVR模型進(jìn)行比較. 相關(guān)性分析的圖表可反映2個(gè)變量之間的相互關(guān)系及其相關(guān)方向,但無法確切地表明2個(gè)變量之間相關(guān)的程度. 于是,實(shí)驗(yàn)選擇了利用計(jì)算相關(guān)系數(shù)以反映變量之間相關(guān)關(guān)系的密切程度. 引入了性能指標(biāo)皮爾遜相關(guān)系數(shù)來評(píng)估模擬結(jié)果,計(jì)算公式為

      表1 3種模型的數(shù)值性能和運(yùn)行時(shí)間的比較

      ①ρ1為皮爾遜相關(guān)系數(shù).

      (8)

      從表1可以看出,隨著訓(xùn)練集和測(cè)試集的比例從7∶3變到9∶1,3種模型的整體性能均逐漸變好. 當(dāng)訓(xùn)練與測(cè)試數(shù)據(jù)比例設(shè)置為9∶1時(shí),3個(gè)模型的性能由好到壞依次為:PSO-SVR、SVR、GA-SVR;當(dāng)訓(xùn)練與測(cè)試數(shù)據(jù)比例設(shè)置為4∶1時(shí),依次為PSO-SVR、GA-SVR、SVR;當(dāng)訓(xùn)練與測(cè)試數(shù)據(jù)比例設(shè)置為7∶3時(shí),依次為PSO-SVR、SVR、GA-SVR. 雖然PSO-SVR的執(zhí)行時(shí)間相對(duì)較長,但由于計(jì)時(shí)時(shí)間單位是s,并不會(huì)受太大影響. 總體來說,PSO-SVR的性能始終表現(xiàn)最好. 雖然在運(yùn)行時(shí)間上并不是很占優(yōu)勢(shì),但通過增加數(shù)據(jù)集,可讓模型在時(shí)間方面做進(jìn)一步驗(yàn)證.

      4 結(jié)論

      1) 考慮到霧霾天氣圖像的對(duì)比度和自然統(tǒng)計(jì)特性發(fā)生顯著變化,本文基于圖片數(shù)據(jù),結(jié)合圖像分析技術(shù)對(duì)PM2.5質(zhì)量濃度進(jìn)行預(yù)測(cè). 所研究的方向在領(lǐng)域內(nèi)具有一定的代表性.

      2) 獲取不同天氣、不同場(chǎng)景和不同時(shí)間的圖像數(shù)據(jù),參考多種已經(jīng)建立的圖像質(zhì)量評(píng)估模型,提取關(guān)于空間域和變換域的熵等多組特征. 本實(shí)驗(yàn)選擇了3個(gè)模型進(jìn)行特征提取.

      3) 利用熵特征和統(tǒng)計(jì)模型之間的關(guān)系尋找與PM2.5質(zhì)量濃度之間的相對(duì)關(guān)系,得出反映給定圖像PM2.5質(zhì)量濃度的可能性的相對(duì)值.

      4) 使用簡單的非線性邏輯函數(shù)將可能性測(cè)量映射到估計(jì)PM2.5質(zhì)量濃度. 最終結(jié)果驗(yàn)證了本文模型在數(shù)值方面獲得了所有模型中最好的性能,且具有計(jì)算成本低和實(shí)現(xiàn)效率高的優(yōu)點(diǎn).

      5) 本文設(shè)計(jì)了一個(gè)簡單且依賴于經(jīng)驗(yàn)的方案,而其他的基于機(jī)器學(xué)習(xí)的先進(jìn)技術(shù)將會(huì)在以后進(jìn)一步進(jìn)行研究.

      猜你喜歡
      預(yù)測(cè)特征圖像
      改進(jìn)的LapSRN遙感圖像超分辨重建
      無可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      有趣的圖像詩
      如何表達(dá)“特征”
      不忠誠的四個(gè)特征
      抓住特征巧觀察
      不必預(yù)測(cè)未來,只需把握現(xiàn)在
      線性代數(shù)的應(yīng)用特征
      河南科技(2014年23期)2014-02-27 14:19:15
      万山特区| 体育| 如东县| 石河子市| 同江市| 文山县| 卓资县| 个旧市| 临湘市| 黄陵县| 蕲春县| 尉氏县| 辉南县| 雷波县| 西乡县| 柘荣县| 奉节县| 临西县| 连江县| 尼木县| 军事| 昭苏县| 剑河县| 惠州市| 宁远县| 张家川| 和林格尔县| 华宁县| 临颍县| 杭锦旗| 化德县| 西盟| 石阡县| 扎鲁特旗| 瑞安市| 文安县| 金川县| 五台县| 鄂州市| 策勒县| 安庆市|