賀朝輝 曾鵬程
摘要:該文研究了將深度學(xué)習(xí)應(yīng)用于垃圾分類,使用模型為微調(diào)后的ResNet50預(yù)訓(xùn)練模型,數(shù)據(jù)來源于華為開源垃圾數(shù)據(jù)集。通過對原始數(shù)據(jù)的標(biāo)注、劃分和增廣得到該文所使用的數(shù)據(jù)集。增廣方式包括幾何變換、明亮度更改和添加噪聲。經(jīng)測試驗(yàn)證,本項(xiàng)目在測試集上的準(zhǔn)確率能夠達(dá)到87%,同時(shí)在實(shí)際場景中也有較好的泛化性。最后通過Flask、Gunicorn和微信小程序進(jìn)行模型以及前端界面的部署。
關(guān)鍵詞:垃圾分類;遷移學(xué)習(xí);數(shù)據(jù)增廣;卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP311? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2022)03-099-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
1 前言
在2018年,中國已經(jīng)成了為全球產(chǎn)生垃圾最多的國家,且在近幾年生活垃圾產(chǎn)量保持5%左右的增長[1]。據(jù)國家統(tǒng)計(jì)局發(fā)布的《中國統(tǒng)計(jì)年鑒2020》指出,在2019年全國生活垃圾清運(yùn)量就已達(dá)24206.2萬噸[2]。與日俱增的垃圾不僅對寶貴空間資源造成了占用,而且污染生態(tài)環(huán)境。垃圾分類作為垃圾回收利用的起點(diǎn),在垃圾回收利用的過程中起著至關(guān)重要的作用。按照相關(guān)規(guī)定將生活垃圾依照其對應(yīng)類別進(jìn)行分類可以有效地促進(jìn)可回收垃圾再利用,減小了生活垃圾的處理量以及空間資源的占用,在生態(tài)和經(jīng)濟(jì)領(lǐng)域都有重要意義。
雖然垃圾分類百利而無一害,但是居民參與度一直較低。解放日報(bào)曾對該現(xiàn)象進(jìn)行過一次調(diào)查采訪,多達(dá)51.8%的受訪者表示分類標(biāo)準(zhǔn)對于他們來說比較復(fù)雜,在模擬垃圾分類實(shí)驗(yàn)中甚至有23.8%的受訪者將可回收的玻璃瓶歸類為有害垃圾。不難看出居民對垃圾分類標(biāo)準(zhǔn)的模糊制約著垃圾分類的實(shí)行。近年來深度學(xué)習(xí)在圖像分類領(lǐng)域的快速發(fā)展使得通過深度學(xué)習(xí)進(jìn)行垃圾分類成為可能。本項(xiàng)目的在于構(gòu)建基于深度學(xué)習(xí)的識別分類準(zhǔn)確率高的模型,幫助居民進(jìn)行正確的垃圾分類,提高居民對垃圾分類的參與度。
2 ResNet模型
隨著神經(jīng)網(wǎng)絡(luò)深度的不斷增加,模型精度并沒有如人們所想的那樣按照網(wǎng)絡(luò)深度的增加而增加,反而訓(xùn)練誤差和測試誤差都升高了,顯然這個(gè)問題并不是由于模型深度過深過于負(fù)責(zé)導(dǎo)致了過擬合,因?yàn)檫^擬合的現(xiàn)象表現(xiàn)為訓(xùn)練誤差小,測試誤差大,而深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差和測試誤差都比淺層神經(jīng)網(wǎng)絡(luò)要大。這種加深神經(jīng)網(wǎng)絡(luò)的深度反而使神經(jīng)網(wǎng)絡(luò)模型性能下降的問題被稱為退化問題,針對退化問題何凱明等人于2015年提出了ResNet[3],并在2015年ImageNet競賽中獲得第一名。何凱明等人指出退化問題可能是由于網(wǎng)絡(luò)深度過深導(dǎo)致了梯度爆炸或者梯度消失阻礙了網(wǎng)絡(luò)的收斂,同時(shí)深層次的神經(jīng)網(wǎng)絡(luò)中含有大量的ReLU等非線性激活函數(shù),由于非線性激活函數(shù)是不可逆函數(shù)無法從輸出推導(dǎo)出輸入,這導(dǎo)致訓(xùn)練過程中信息的丟失使得函數(shù)無法表示自己本身,即難以表達(dá)恒等映射函數(shù)H(x)=x,為解決上述問題,ResNet引入了殘差結(jié)構(gòu),如圖1所示。
3 等比例縮放的應(yīng)用
在模型訓(xùn)練前,為滿足神經(jīng)網(wǎng)絡(luò)的輸入要求,需要按照要求將圖片尺寸進(jìn)行更改,但當(dāng)仔細(xì)查看數(shù)據(jù)集時(shí),可以發(fā)現(xiàn)數(shù)據(jù)集中某些分類之間存在著特殊的關(guān)系,比如食用油桶和飲料瓶,牙簽和竹筷。因?yàn)樗鼈兊牟馁|(zhì)和形狀的高度一致導(dǎo)致這些物體之間的最大的差異不是通常的形狀和顏色差異,而是物體的長寬比例。但是如果進(jìn)行縮放的圖片的長寬比例與網(wǎng)絡(luò)要求的長寬比例不相等,則會導(dǎo)致物體的長寬比例發(fā)生改變,最終影響模型的準(zhǔn)確率。
為解決上訴問題,本文采用等比例縮放方法對圖片進(jìn)行處理。對一張尺寸為(H, W)的圖片,求出等比例縮放比例R ,R表示如式1所示:
[R=minHobjH, WobjW? #? ? ? ? ? ? ? ? ? ? ? ? ? ?1]
其中Hobj和Wobj是目標(biāo)尺寸,H和W是圖片原始尺寸,min()函數(shù)為取兩者中的較小值。將H,W按比例R進(jìn)行縮放,縮放后尺寸小于目標(biāo)值的一邊用零值進(jìn)行補(bǔ)齊,最后得到等比例縮放的圖片。圖2(a)是數(shù)據(jù)集中未經(jīng)處理的原始圖像,其尺寸為(200,268);圖2(b)是未使用等比例縮放進(jìn)行縮放至(224,224)的圖片;圖2(c)是使用等比例縮放進(jìn)行縮放至(224,224)的圖片。使用等比例縮放可以有效避免傳統(tǒng)縮放方法在縮放圖片的過程中對物體的長寬比例進(jìn)行改變,在長寬比例特征較為重要的數(shù)據(jù)集中能夠保持不同分類之間的差異性,有助于模型對物體更好地進(jìn)行識別[4-5]。
4 基于ResNet的生活垃圾分類算法實(shí)現(xiàn)
本項(xiàng)目采用ResNet50預(yù)訓(xùn)練模型作為backbone,對backbone最后一層的全連接層進(jìn)行修改,將含有1000輸出神經(jīng)元的全連接層替換為輸出神經(jīng)元為40的全連接層,對應(yīng)40類垃圾。
5 實(shí)驗(yàn)結(jié)果及分析
在Kaggle平臺使用GPU對神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練25批次,運(yùn)行結(jié)果如下所示,在測試集上準(zhǔn)確率能達(dá)到87%,圖3為loss對比圖,圖4為準(zhǔn)確率對比圖。由于本項(xiàng)目所使用的數(shù)據(jù)集于2019年比賽結(jié)束后才正式公開,在此之前有關(guān)垃圾分類的文獻(xiàn)使用的數(shù)據(jù)集規(guī)模多為4000張左右,缺乏對比性。使用該數(shù)據(jù)集的公開項(xiàng)目較為知名的有由thomas-yanxin開源的公開項(xiàng)目“慧眼識垃圾”,并于2021年4月17日獲得了飛槳PaddlePaddle公眾號的周推薦第一名。本項(xiàng)目與其最大的區(qū)別在于模型選擇以及縮放方法。在模型選擇上,本項(xiàng)目采用的是ResNet50預(yù)訓(xùn)練模型,可以減少模型的訓(xùn)練時(shí)長?!盎垩圩R垃圾”采用的是ResNet50_vd,ResNet50_vd在ResNet50的基礎(chǔ)上添加了知識蒸餾,雖然使模型能夠達(dá)到更好的精度,但由于模型更大以及冷啟動,所以推理時(shí)間更長且訓(xùn)練所需時(shí)間更多。在縮放方法上面,本項(xiàng)目采用的是等比例縮放,“慧眼識垃圾”采用的是常規(guī)縮放。
6 結(jié)束語
本文驗(yàn)證了使用ResNet50進(jìn)行生活垃圾分類的可行性,并通過數(shù)據(jù)增廣等方式使模型在實(shí)際應(yīng)用場景中有較好的泛化性。在實(shí)際應(yīng)用場景的測試中,本項(xiàng)目的準(zhǔn)確率也能夠達(dá)到接近測試機(jī)準(zhǔn)確率的水平,對于實(shí)際應(yīng)用場景具有良好的泛化性。該項(xiàng)目的目的在于對進(jìn)行垃圾分類感到困難的居民提供一個(gè)簡潔、易上手的工具,幫助其正確地對垃圾進(jìn)行分類,為垃圾分類政策的推廣盡一份綿薄之力。
參考文獻(xiàn):
[1] 呂益敏.以史為鑒,開啟垃圾分類新時(shí)代[J].城鄉(xiāng)建設(shè),2020(3):30-32.
[2] 國家統(tǒng)計(jì)局工業(yè)統(tǒng)計(jì)司.中國工業(yè)統(tǒng)計(jì)年鑒-2020[M].北京:中國統(tǒng)計(jì)出版社,2020.
[3] He K M,Zhang X Y,Ren S Q,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.June 27-30,2016,Las Vegas,NV,USA.IEEE,2016:770-778.
[4] 董子源.基于深度學(xué)習(xí)的垃圾分類系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].北京:中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計(jì)算技術(shù)研究所),2020.
[5] 陳莎莎,杜慶東.基于深度學(xué)習(xí)的可回收垃圾分類算法[J].現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2021,11(1):22-23,40.
【通聯(lián)編輯:聞翔軍】