高圣寒 趙在東 孔維舸
摘 要:當(dāng)前,無(wú)論是學(xué)生食堂和企事業(yè)單位員工食堂,還是盈利為目的的餐廳,傳統(tǒng)的用餐模式主要三種,即窗口、套餐、自選。窗口模式就是就餐人員在許多個(gè)窗口排隊(duì)選擇菜品,服務(wù)員給打菜,菜選完以后,總額由服務(wù)員計(jì)算;套餐模式就是在規(guī)定套餐中,將菜品選擇,服務(wù)員給打菜準(zhǔn)備就餐,按照不同的套餐價(jià)格,收銀員進(jìn)行結(jié)算;自選模式就是服務(wù)員按份給打菜,放到窗口,就餐人員按自身喜歡取菜,將選好的菜放到托盤(pán)上,收銀員將整單總價(jià)人工核算。卷積神經(jīng)網(wǎng)絡(luò)智能網(wǎng)絡(luò),是一種新的自助結(jié)賬系統(tǒng)[1-2]。該文分析和研究了運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)智能識(shí)別技術(shù)進(jìn)行餐廳的自助結(jié)賬。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);智能識(shí)別技術(shù);餐廳自助結(jié)賬
卷積神經(jīng)網(wǎng)絡(luò)智能識(shí)別技術(shù),無(wú)論是學(xué)校食堂,還是企事業(yè)單位的員工食堂,都比較適用,點(diǎn)餐模式主要以自選為主,智能機(jī)器運(yùn)用識(shí)別判斷和掃描等一系統(tǒng)的流程,將就餐人員餐盤(pán)上的點(diǎn)菜總額結(jié)算出來(lái)。該自助結(jié)賬系統(tǒng),既優(yōu)化了點(diǎn)餐系統(tǒng),又簡(jiǎn)化了用餐流程,克服了人工結(jié)算的繁瑣和不便,從而使成本降低。
一、概述卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)由偏置常量的神經(jīng)元和可學(xué)習(xí)的權(quán)重構(gòu)成[3-4]。主要作用就是在圖片中將圖像特征提取。卷積神經(jīng)網(wǎng)絡(luò)在變化圖像時(shí),適應(yīng)性非常好,無(wú)論是圖像旋轉(zhuǎn)和平移,還是傾斜變化和大小縮放,其都能夠適應(yīng),主要是由于卷積神經(jīng)網(wǎng)絡(luò)的非線性學(xué)習(xí)能力結(jié)構(gòu)非常好。
(一)卷積層。在神經(jīng)網(wǎng)絡(luò)中,卷積層是最重要的組成部分,其由許多個(gè)卷積單元構(gòu)成,每個(gè)參數(shù)都是通過(guò)優(yōu)化反向傳播算法而獲得的。卷積層的作用主要是將輸入的不同特征提取,有些角和邊緣以及線條等低級(jí)的特征等,第一層卷積層就可以提取。為了將更加復(fù)雜的特征在低級(jí)特征中提取,必須要應(yīng)用多層卷積層。應(yīng)用卷積運(yùn)算,很大程度地減少了神經(jīng)網(wǎng)絡(luò)的參數(shù),但是,還是一個(gè)很大的數(shù)量。此時(shí)卷積層權(quán)值的共享機(jī)制,能夠使神經(jīng)網(wǎng)絡(luò)訓(xùn)練的參數(shù)進(jìn)一步地減少。權(quán)值共享機(jī)制,就是圖像中一部分與其他部有相關(guān)的聯(lián)系。參數(shù)共享機(jī)制運(yùn)用以后,能夠很大程度地減小參數(shù)數(shù)量。
(二)池化層。池化層,在卷積層以后,可以獲得比較大維度的特征,切割這些特征,多個(gè)區(qū)域就會(huì)獲得,無(wú)論是這些區(qū)域的平均值,還是最大值都能夠獲得,并且較小維度的新的特征也能夠獲得。通常池化層放在兩個(gè)卷積層之間,主要用于特征映射維度的降低和避免過(guò)擬合以及計(jì)算量的減少等問(wèn)題。通常其輸入是從上一層獲得的,將強(qiáng)大魯棒性提供為主要的作用。
(三)激活層。激活函數(shù)就是激活層,引用激活函數(shù),主要是由于網(wǎng)絡(luò)中不可以只有線性模型,激活函數(shù)是將非線性引入的因素。在神經(jīng)網(wǎng)絡(luò)中,通常非線性部分主要來(lái)自于神經(jīng)元之間選擇性的激活,這樣對(duì)于學(xué)習(xí)稀疏特征非常有利。在卷積神經(jīng)網(wǎng)絡(luò)中,Sigmoid和Tanh以及ReLU等為常用的激活函數(shù)。
針對(duì)于各個(gè)輸入數(shù)據(jù),Sigmoid運(yùn)用Sigmoid函數(shù)操作。該設(shè)計(jì)很簡(jiǎn)單,無(wú)需太多的參數(shù)。以下為計(jì)算公式:
從當(dāng)前來(lái)看,應(yīng)用比較廣泛的激函數(shù)就是ReLU,其廣泛應(yīng)用的原因,就是在確保ReLU效果比較良好的情況下,收斂的速度會(huì)更快。從本質(zhì)上,ReLU是一個(gè)分段的線性函數(shù),致使無(wú)論是前向計(jì)算,還是反向傳播計(jì)算,都比較簡(jiǎn)單。相對(duì)于其他激活函數(shù),ReLU具有很大的優(yōu)勢(shì)。通常Tanh和Sigmoid等激活函數(shù)具有飽和的現(xiàn)象,消失梯度的問(wèn)題就容易出現(xiàn),原因是在函數(shù)兩端這些函數(shù)的導(dǎo)數(shù)通常近于零,致使反向傳播以后,導(dǎo)致前面層數(shù)的梯度也基本變成了零。ReLU的計(jì)算公式:
(四)全連接層。在卷積神經(jīng)網(wǎng)絡(luò)中,全連接層為最后的部分,通常全連接層能夠轉(zhuǎn)化卷積出的多維特征為一維向量[5-6]。其作用是將前一層全部的激活函數(shù)結(jié)果在模型最后兩層完全連接。在全部連接層中,為了避免過(guò)擬合產(chǎn)生,通過(guò)運(yùn)用Dropout算法避免過(guò)擬合產(chǎn)生。在深度神經(jīng)網(wǎng)絡(luò)中訓(xùn)練模型時(shí),訓(xùn)練的數(shù)據(jù)若比較少,過(guò)擬合現(xiàn)象就容易出現(xiàn),即模型可以將訓(xùn)練集的特征更好地學(xué)習(xí),但是,泛化能力欠缺。為了防止產(chǎn)生過(guò)擬合,除了應(yīng)用傳統(tǒng)的正則化方法,還有一種就是Dropout方法,該方法主要用于對(duì)深度神經(jīng)網(wǎng)絡(luò)過(guò)擬合問(wèn)題進(jìn)行解決。2014年,Srivastava等人提出Dropout,他們指出每次進(jìn)行訓(xùn)練時(shí),需要更新一部分參數(shù),不用更新另一部分參數(shù),這樣可以避免有些特征協(xié)同的作用。在標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)中,各個(gè)參數(shù)具有的導(dǎo)數(shù)怎樣變化其都會(huì)告知,一直到最終減小損失的函數(shù)。
二、運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)智能識(shí)別技術(shù)實(shí)現(xiàn)餐廳自助結(jié)賬
(一)構(gòu)建中餐菜品檢測(cè)數(shù)據(jù)庫(kù)和識(shí)別數(shù)據(jù)庫(kù)。在VIREO Food-172的數(shù)據(jù)庫(kù)中,隨機(jī)在每一類菜品中抽取圖片100張,共計(jì)17200張圖片,并且手工標(biāo)注圖片中中餐菜品的位置,將檢測(cè)中餐菜品的數(shù)據(jù)庫(kù)構(gòu)建起來(lái)。檢測(cè)中餐菜品任務(wù)中可以應(yīng)用該數(shù)據(jù)庫(kù),主要作用是訓(xùn)練菜品檢測(cè)模型。識(shí)別中餐菜品的數(shù)據(jù)庫(kù),主要是以VIREO Food-172為基礎(chǔ),應(yīng)用檢測(cè)菜品,精準(zhǔn)切割各張圖片中的菜品圖像,將數(shù)據(jù)庫(kù)構(gòu)建起來(lái)。
(二)在識(shí)別中餐菜品任務(wù)中應(yīng)用檢測(cè)菜品。主要運(yùn)用YOLOv2模型,檢測(cè)中餐菜品。YOLOv2模型能夠準(zhǔn)確快速地檢測(cè)中餐菜品,具有很大的應(yīng)用價(jià)值。通過(guò)對(duì)比實(shí)驗(yàn)幾種常見(jiàn)的深度卷積神經(jīng)網(wǎng)絡(luò)模型,運(yùn)用實(shí)驗(yàn)方式,可以了解到檢測(cè)中餐菜品加入以后,的確有提高識(shí)別中餐菜品準(zhǔn)確率的作用。在識(shí)別中餐菜品任務(wù)中應(yīng)用檢測(cè)菜品,通過(guò)檢測(cè)中餐菜品,使識(shí)別中餐菜品的準(zhǔn)確率有效地提高。
(三)建立集成模型,解決識(shí)別中餐菜品的任務(wù)。主要在4種選擇性集成算法中應(yīng)用,即基于準(zhǔn)確率的排序、Orientation Ordering、Kappa Pruning、DHCEP,對(duì)識(shí)別中餐菜品的任務(wù)更好地解決。分析這幾種選擇集成算法獲得的最終集成模型,主要分析準(zhǔn)確率和多樣性。根據(jù)Kappa Pruning的算法,在準(zhǔn)確率識(shí)別得以保證的情況下,模型的多樣性比較好,識(shí)別的準(zhǔn)確率為84.56%,相對(duì)于VIREO Food-172的構(gòu)建者,在識(shí)別中餐菜品中用的算法識(shí)別準(zhǔn)確率的82.06%,已經(jīng)超過(guò)了,根據(jù)DHCEP選擇的集成算法,集成模型最終具有識(shí)別最高的準(zhǔn)確率為85.18%。在識(shí)別中餐菜品任務(wù)中應(yīng)用選擇性集成算法,也是一種創(chuàng)新。
在餐廳自助結(jié)賬中,有效運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)智能識(shí)別技術(shù),既能夠?qū)⒂貌腿藛T點(diǎn)的菜品總額結(jié)算出來(lái),又能夠使傳統(tǒng)人工結(jié)算的繁瑣和不便也能夠克服,非常值得應(yīng)用和推廣。
參考文獻(xiàn)
[1] 吳云華,張澤中,華冰,陳志明.應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的遙感圖像云層自主檢測(cè)[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2020(11):1-8.
[2] 葉靈楓.基于深度學(xué)習(xí)的食品自動(dòng)識(shí)別算法研究[D].浙江師范大學(xué),2020.
[3] 朱沛賢.基于卷積神經(jīng)網(wǎng)絡(luò)的單目圖像深度估計(jì)研究[D].南京郵電大學(xué),2018.
[4] 張曉明.基于卷積神經(jīng)網(wǎng)絡(luò)與3D幾何語(yǔ)義的室內(nèi)場(chǎng)景理解研究[D].北京交通大學(xué),2018.
[5] 崔建華.卷積神經(jīng)網(wǎng)絡(luò)在食材圖像分類中的應(yīng)用[D].湖南大學(xué),2017.
[6] 楊勇.基于卷積神經(jīng)網(wǎng)絡(luò)的RGB-D圖像室內(nèi)場(chǎng)景識(shí)別研究[D].浙江大學(xué),2017.
基金項(xiàng)目:利用卷積神經(jīng)網(wǎng)絡(luò)智能識(shí)別技術(shù)實(shí)現(xiàn)餐廳自助結(jié)賬,編號(hào):201913301023。