王寶旭 楊會玲 何烊波 張剛 周石柱 葉利華
摘要:本文旨在開發(fā)一套防范因關(guān)窗疏忽導(dǎo)致兒童墜樓危險的窗戶智能防護系統(tǒng),擬采用人臉檢測、年齡段識別、單目深度估計等人工智能技術(shù)檢測兒童靠近窗戶并自動關(guān)閉來規(guī)避危險事件的發(fā)生,提升智能家居安全水平。
關(guān)鍵詞:兒童安全;人臉檢測;深度學(xué)習(xí);年齡段識別;單目測距
中圖分類號:TP399 文獻標識碼:A
文章編號:1009-3044(2020)19-0065-02
開放科學(xué)(資源服務(wù))標識碼(OSID):
1 引言
近年來,兒童在居住場所意外墜樓事故頻頻發(fā)生,除了大人疏于看護等主觀原因,高層住戶窗戶缺乏防護欄等安全設(shè)施也是一個重要的因素。為了避免悲劇重演,家長須提高兒童安全監(jiān)管意識,同時應(yīng)做好防護措施。為了盡可能消除窗臺存在的隱患,開發(fā)一套自動預(yù)防兒童墜樓監(jiān)護系統(tǒng)實有必要[1]。目前,市面上已經(jīng)存在智能窗系統(tǒng),但其主要功能集中在防盜、放劫、防雨等方面[2],并沒有專門針對檢測與保障家中兒童安全的窗戶。因此研發(fā)一種新型的多功能兒童安全防護智能門窗成為智能居家與安全保障的發(fā)展趨勢[3]。
2 系統(tǒng)構(gòu)架與設(shè)計
兒童室內(nèi)安全智能門窗防護系統(tǒng)由終端設(shè)備、服務(wù)端和APP端組成,如圖1所示。該系統(tǒng)的硬件部分是一款基于人臉檢測、年齡識別、單目圖像深度估計來實現(xiàn)兒童識別的終端設(shè)備,它是兒童室內(nèi)安全智能門窗防護系統(tǒng)中的重要部分,主要包括兒童檢測、警報功能、單目測距、智能開關(guān)、數(shù)據(jù)記錄模塊等功能。服務(wù)端有云端數(shù)據(jù)控制,用戶終端控制等功能。系統(tǒng)基于tensorflow設(shè)計分類大腦,使用OpenCV對采集的圖像進行預(yù)處理,然后采用人臉檢測、年齡識別、單目圖像深度估計等算法進行風(fēng)險評估。
3 系統(tǒng)功能實現(xiàn)
3.1 終端技術(shù)實現(xiàn)
終端部分基于深度學(xué)習(xí)的人臉檢測、年齡段識別、單目圖像深度估計等人工智能算法為核心,實現(xiàn)門窗的自動開閉操作[4]。
終端運行流流程如下:
1)終端開啟后,硬件完成初始化,從服務(wù)器獲取設(shè)置;
2)通過攝像頭不斷地采集數(shù)據(jù),將圖像輸入到服務(wù)器端;
3)通過圖像處理與識別判別是否是兒童,再判斷風(fēng)險;
4)如果有危險就會發(fā)送關(guān)窗和警報信號,并將此事件上傳服務(wù)器存檔。
圖像處理與識別運行流程如圖2所示。人臉檢測判斷是否有人,如果有人,再通過年齡段識別判斷是否是兒童,如果是兒童,再通過行為預(yù)測和深度估計進行分析是否有危險。用戶通過APP端查看終端設(shè)備的運行記錄,如窗戶自動通風(fēng)記錄、窗戶自動防護記錄等信息。也可以設(shè)置住戶人臉、警戒距離、警報設(shè)置、自動防護等終端功能,通過服務(wù)器傳輸?shù)浇K端來設(shè)置終端的相應(yīng)功能。
年齡段識別由人臉檢測和年齡識別兩個部分構(gòu)成。1)人臉檢測:通過攝像頭輸入的圖像,不能直接拿來進行操作,由于受到各種環(huán)境,拍攝角度,人物姿態(tài),表情等因素,需要對圖像進行人臉檢測[5],找出圖像中人臉的具體位置,并將人臉提取出來。通過多任務(wù)學(xué)習(xí)方法[6],將人臉檢測分為三步(如圖3所示)。通過三次卷積計算實現(xiàn)由粗到細的生成結(jié)果,其中Pro-posal Network(P-Net)的全卷積網(wǎng)絡(luò),以此來獲得候選人臉窗口及其邊框的回歸向量并采用非極大值抑制(Non-maximum sup-pression,NMS)進行合并;Refine Network(R-Net),對上一階段得到的所有候選框進行篩選;Output Network(O-Net)輸出最終的人臉對象框,并輸出五個面部特征點的位置(如圖4所示)。在進行人臉對齊之前,需要對圖像中的人臉的關(guān)鍵點進行檢測。通過對人臉進行映射或仿射變化,得到正臉人臉圖像。2)年齡識別:年齡識別通過采用深度學(xué)習(xí)對人類進行學(xué)習(xí)并進行估計,直接輸出估計的年齡結(jié)果。
深度估計基于深度學(xué)習(xí)單目估計方法,其原理是利用像素值關(guān)系反映深度關(guān)系,通過是擬合一個函數(shù)f把圖像I映射成深度圖,利用函數(shù)映射關(guān)系從像素值中恢復(fù)出相對深度值[7]。
3.2 服務(wù)端實現(xiàn)
服務(wù)器端主要使用Html、css、Javascript、Java和Mysql等技術(shù)共同開發(fā)完成,服務(wù)端和APP端之間通過Socket建立連接,進行通信。首先ServerSocket將在服務(wù)端監(jiān)聽某個端口,當發(fā)現(xiàn)APP端有Socket來試圖連接時,accept該Socket的連接請求,同時在服務(wù)端建立一個對應(yīng)的Socket與之進行通信。服務(wù)器端記錄用戶和設(shè)備信息,并將記錄上傳到服務(wù)器的終端設(shè)置、識別數(shù)據(jù)、警報記錄等,用戶可以隨時在APP端查看這些數(shù)據(jù)信息。
4.3 結(jié)果分析
4.3.1 訓(xùn)練模型
通過在互聯(lián)網(wǎng)上采集4萬張兒童圖像構(gòu)建模型訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)包括兒童及非兒童兩種類型,如圖5測試庫部分樣例所示,其中圖集a是兒童樣例,圖集b為非兒童圖集。訓(xùn)練中,通過隨機抽取其中的60%用來訓(xùn)練模型,30%用于測試模型,剩余的10%用于驗證模型。
我們首先基于DCNN深度卷積網(wǎng)絡(luò)模型對圖像進行特征提取嘲,模型的各卷積層配置如圖6所示。
利用該模型對圖像進行特征提取,如圖7(a)所示;圖像與Sobel-Gx卷積核的卷積結(jié)果如圖7(b)所示;Sobel-Gy卷積核卷積層所得到的最終結(jié)果如圖7(c)所示。
4.3.2 實驗對比
由于三層不同卷積核操作之后的感受野不同,人臉在圖像中的大小不一。隨著卷積層數(shù)的逐漸增加,感受野的范圍在逐漸擴大。卷積神經(jīng)網(wǎng)絡(luò)通過這種層層推進的方式,每一個卷基層都能學(xué)習(xí)到不同的特征,最后實現(xiàn)相關(guān)的識別、分類功能。為了驗證卷積核大小對測試精度的影響,本文設(shè)計了四種卷積核進行測試,四種卷積核大小的不同組合下的實驗結(jié)果如表1所示:
上述實驗結(jié)果表明,模型中的卷積核大小對識別準確率有較大影響,相同卷積層數(shù)的情況下,每層卷積核越大,識別精度越高。在保證性能相差不大且CNN規(guī)模較小的考慮下,本文將網(wǎng)絡(luò)的結(jié)構(gòu)改進為三層卷積核為5*5的卷積層。
4.3.3 識別示例
為了消除指標之間的量綱影響,實驗中對數(shù)據(jù)標準化處理,解決數(shù)據(jù)指標之間的可比性。原始數(shù)據(jù)經(jīng)過數(shù)據(jù)標準化處理后,各指標處于同一數(shù)量級,再進行綜合對比評價。實驗結(jié)果如圖8所示。
5 結(jié)束語
針對目前兒童意外墜樓事故頻頻發(fā)生的問題,本文設(shè)計了兒童安全智能門窗的防護系統(tǒng),有效解決兒童門窗安全防護問題。隨著生活方式的改變,兒童安全智能門窗的防護系統(tǒng)在生活中有著越來越重要的作用。新型的多功能兒童安全防護智能門窗必將成為智能居家與安全保障重要組成部分。
參考文獻:
[1]錢坤,馬淑文.家用超聲波兒童防墜樓監(jiān)護系統(tǒng)[J].大眾科技,2016,18(7):26-28.
[2]不公告發(fā)明人.一種基于物聯(lián)網(wǎng)的智慧安防數(shù)據(jù)系統(tǒng):CN110471346A[Pl. 2019-11-19.
[3]鄧輝.建筑智能門窗及技術(shù)發(fā)展分析[J].門窗,2017(4):32-34.
[4]林水清,林泰立,趙寶田,梁聰偉.門窗開關(guān)裝置:CN207332598U[Pl. 2018-05-08.
[5]譚萍.人臉識別門鎖:CN205680149U[P]. 2016-11-09.
[6]湯旭.基于深度學(xué)習(xí)的跨年齡人臉識別[Dl.北京:中國科學(xué)院大學(xué),2017.
[7]席林,孫韶媛.基于SVM模型的單目紅外圖像深度估計方法:CN102708569A[P]. 2012-10-03.
[8]許路,趙海濤,孫韶媛.基于深層卷積神經(jīng)網(wǎng)絡(luò)的單目紅外圖像深度估計[Jl-光學(xué)學(xué)報,2016,36(7):0715002.
[通聯(lián)編輯:唐一東]收稿日期:2020-03-15
基金項目:浙江省新苗人才計劃項目(編號:2019R417037);國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(編號:201910354027)
作者簡介:王寶旭(1999-),男,主要研究領(lǐng)域為人工智能;楊會玲(1998-),女,主要研究領(lǐng)域為圖像處理;何烊波(1999-),男,主要研究領(lǐng)域為人工智能;張剛(1999-),男,主要研究領(lǐng)域為軟件工程;周石柱(1997-),男,主要研究領(lǐng)域為軟件工程;葉利華(1978-),男,主要研究領(lǐng)域為機器學(xué)習(xí)。