孫楚怡,王 洋,趙紀元
(沈陽建筑大學信息與控制工程學院,遼寧 沈陽 110168)
近年來,黨和國家的大力支持投入建設發(fā)展安全建筑生產基礎配套設施,全國廣大范圍內對于加強建筑生產企業(yè)的安全設施生產經營管理的新理念也正在逐步深入地進行研究和推廣。2019 年上半年,據住房和城鄉(xiāng)建設部通報,建筑行業(yè)事故發(fā)生頻率人數總量依舊一直較高。2019 年,全國累計至少發(fā)生各類建筑工程建設安全事故773 起、死亡904 人,與2018 年同期相比,事故發(fā)生頻率人數總量和死亡事故人數總量分別上升了5.31%和7.62%。在各種建筑事故中,因建筑物體高空移動掉落或物體碰撞墜落所造成的死亡事故約占全體建筑工人建筑施工總死亡事故的15.91%。而安全帽保護作為對現場施工者頭部進行安全保護的重要裝置,不僅可以防止高處移動掉落或碰撞墜落的施工物體造成的傷害,有效減少施工人員可能遇到的危險,還可以降低頭部觸電風險,從而得到廣泛的工業(yè)應用。而在日常施工過程中往往疏于切實做好對佩戴安全帽工人佩戴的日常管理,監(jiān)督不力,就會時常出現各類安全事故。因此,對施工者隨時佩戴施工安全帽進行檢測已經逐漸成為施工現場的一項重要安全措施。目標檢驗技術作為當前計算機視覺技術領域的重要研究課題,已經廣泛應用于各個領域,在對施工人員安全帽的檢測上也有著突出表現。
2005 年VPR 上由來自法國巴黎國家學院計算機科學技術與過程控制中心研究法的一位研究員使用Navneeet Dalal和Bill Triggs 在一個短篇文章中首次明確提出了使用HOGS的方法。他們主要把這種識別方式研究應用于能夠動態(tài)顯示地形圖的電動行人安全檢測上,后來又把它廣泛地研究應用于電動安全帽行人檢測時的識別中。
周金芝、孟凡輝、曾春等人于2009 年提出了分割人體圖像中人體肢干在運動中幅度大小的方法來提取主要特征向量達到剔除不必要信息的目的。石志強等人[2]再次提出HOG 和BLOCK 兩種權重的計算方法,引入了權重的概念,通過對BLOCK 的合理選擇找到一個人體主要的特征矢量來識別安全帽。但是由于HOG 的一些主要缺點也很突出,它的一個描述子噪點產生的過程比較長,導致整個數據流的傳輸速度慢、實時性差。而且HOG 本身很難徹底解決其噪點遮擋性的問題,由于它本身是一個屬于梯度型的描述性質,這種型的描述子在較大程度上對它的噪點影響是相當敏感的。所以對于檢測窗口問題、特殊場景下人體檢測、檢測速度慢等問題成了主要研究方向。
LBP 最早是由OJALA、PIETIKAINEN 和HARWOOD在1994 年提出的,用來進行紋理特性的提取,并且這種提取形成的特性就是一個圖像局部紋理的特性。LBP 是一種性能優(yōu)越的算法,因其復雜程度低的特點被廣泛應用于人臉識別、安全帽檢測等領域。
2016 年黃德志[3]通過研究利用RGB 和HSV 的顏色空間,提出了一種基于這些顏色空間進行融合的就不二值模型;然后根據相鄰的區(qū)域尋找到一個顏色空間與相鄰的局部第二值模型,從而增強了提取安全帽與圖像內部一些可能的結構聯系,提升了包含安全帽特征的整體性,達到了提升對安全帽分類的效果。王蕓蕓[4]綜合考慮局部二值模式的改進算法,提出將ELBP 與離散余弦相結合來進行特征提取的方法,彌補了LBP 的部分缺點。但是LBP 只是在灰度領域上提取特征,同時沒有考慮可能存在的空間結構關系問題依然存在。
SILVA 等人[5]利用 HOG、LBP 和 circle Hough 變換(CHT)等混合描述子提取頭盔的邊緣、紋理和幾何特征,報告準確率為94.23%。此外,SILVA 等人嘗試結合小波變換(WT)、HOG 和LBP 特征,該方法的準確率為91.37%。RUBAIYAT 等人結合顏色和CHT 提取特征,該方法的準確率為81.0%。WU 等人利用LBP、Hu 矩不變量(HMI)和顏色直方圖(CH)特征,平均準確率為90.3%。
然而,上述方法通常都是基于運動目標和行人檢測,遮擋是一個嚴重的問題。因此,這些方法從一些簡單的場景中選擇測試樣本。同時,這些方法都是近場視頻中檢測安全頭盔的常用方法,無法討論尺度方差、透視失真、小物體檢測等問題。此外,這些方法使用移動目標和行人檢測,無法識別安全帽的載體。最后,由于沒有具有各種挑戰(zhàn)性問題的公共數據集,很難比較和評估這些算法。
近年來,基于深度學習的算法在目標檢測領域運用十分廣泛。FANG 等人提出了一種自動非硬帽使用(NHU)檢測技術,該技術使用了一種改進的更快的基于區(qū)域的卷積神經網絡(faster R-CNN)方法,收集了81 000 張具有各種挑戰(zhàn)性問題的圖像,如比例、遮擋和小物體檢測。NHU 工作人員在培訓階段被標記為ground truth,并且在測試階段被檢測到,其余的被確定為背景。該方法的準確率在90.1%~98.4%之間,取決于不同情況的影響。由于該方法只檢測NHU 工人,它沒有辦法識別在現場代表不同角色的安全帽顏色,同時基于行人檢測的方法無法識別安全帽的載體,存在遮擋問題,該算法還在改進中。
KRIZHEVSKY、SUTSKEVER 和HINTON 訓練了一種深度卷積神經網絡用于ImageNet 分類,他們的工作促進了深度學習方法的發(fā)展,該方法已經在許多科學領域得到應用,特別是在目標檢測方面。一方面,更快的R-CNN、you only look once(YOLO)、single shot detector(SSD)目前被廣泛用于物體檢測。但是,目前沒有公共的、廣泛的數據集來培養(yǎng)一個良好的頭盔檢測模型,因此直接利用這些模型進行頭盔檢測是不現實的。相反,人臉檢測是人工智能研究中最成功的領域之一,其主要原因之一是為訓練高級人臉檢測模型積累各種具有挑戰(zhàn)性的數據集。在人臉檢測模型的啟發(fā)下,提出了一種基于人臉邊界盒回歸的安全帽邊界盒算法,該算法可以根據人臉檢測結果生成安全帽邊界盒。另一方面,上述方法屬于通用的目標檢測模型,因此被廣泛應用于行人檢測、人臉檢測等領域。但是在人臉檢測中,存在著特征學習、缺失設計和錨點匹配等問題。
然而,新的研究表明,基于多尺度的特征更適合檢測微小物體。例如,自頂向下結構的特征金字塔網絡利用了所有具有高級語義信息的尺度?;谔卣鹘鹱炙W絡的PyramidBox 顯著提高了目標檢測。雙鏡頭人臉檢測器(DSFD)考慮層信息和錨點之間的上下文關系來增強特征。此外,DSFD 采用漸進性錨點丟失(PAL)改進了傳統的錨點丟失函數,在數據擴充中充分考慮了隨機采樣,使錨點匹配效果更好。
隨著工業(yè)現代化發(fā)展,各行各業(yè)對施工現場施工人員安全問題愈加重視。針對其中對施工人員安全帽佩戴檢測的問題,本文敘述了傳統目標檢測和深度學習目標檢測的國內外檢測進程及基于深度學習的安全帽檢測現狀?;谏衔臄⑹銮闆r看,基于深度學習的安全帽檢測還存在著不足。當施工現場工作人員身穿工作服顏色與安全帽相同時,檢測相對困難,后續(xù)可考慮進行雙重檢測。且對施工人員的安全帽檢測應具有實時性,目前的安全帽檢測算法皆主要側重于精度檢測,在檢測速度上還未到達實時性級別,應做相關改進以貼近工業(yè)化要求。