葉源豐德
摘要:文章針對當今社會中時有發(fā)生的突發(fā)性暴力危害事件,提出一款基于圖像處理與聲音狀況識別技術實現暴力事件預警的智能監(jiān)控產品設計,通過對實時監(jiān)控圖像執(zhí)行圖像處理以及通過無線電傳感器節(jié)點實現異常聲音采樣處理來判定是否存在暴力事件,從而實現及時預警,避免暴力事件造成嚴重后果,響應智慧城市的建設,為公共場所內公民的財產生命安全提供了新的保障方案。
關鍵詞:公共安全;產品設計;智慧城市;預警系統
中圖分類號:TB472? 文獻標志碼:A
1 研究背景
近幾年,隨著社會的發(fā)展,一些人為了個體或少數群體的利益,不惜以犧牲公眾的人身安全為代價,在公共場所或公共區(qū)域實施暴力事件。校園暴力也時有發(fā)生。2021年5月,最高人民法院的報告統計數據顯示,有35.31%的校園暴力案件中出現了宿舍一詞,而在這些案件中絕大部分案件的案發(fā)地就是宿舍。除宿舍外,教室(19.22%)、廁所(13.13%)、走廊樓道(11.22%)的案件量占比也都超過了10%。
目前,傳統安防設備系統不僅無法做到全地區(qū)覆蓋,還需要大量的相關人員對相關視頻進行實時判斷,這種方式工作量巨大、識別速度慢。現有系統需要耗費較高的人力成本,由于人無法時刻保持警戒狀態(tài),很難做到實時監(jiān)控。據有關數據分析,20分鐘后監(jiān)控人員可能錯過最多高達95%的畫面。由此可見,加強對暴力事件的監(jiān)控預警迫在眉睫。
在智慧城市建設持續(xù)縱深推進的同時,隨著算法準確率和環(huán)境適應性的不斷提高,智能視頻分析技術的普遍應用是大勢所趨。通過聲音識別技術不斷擴大危險判斷的范圍、進一步加強危險判斷的準確性,也是未來公民安全保障的必然需求。
2 設計目標
現如今,公共場所的暴力事件時有發(fā)生,加強公共場所的安全防護,營造和諧共處的社會環(huán)境,是當今社會治安的重要部分。
大型商圈、交通樞紐、大型場館、熱點景區(qū)等人群密集場所內人員存量大,進出流量大,人員間活動相對獨立。為做到場所內人群活動日常監(jiān)測與風險預警,應基于全局覆蓋監(jiān)控視頻,結合視頻智能分析的人群計數、密度估計、行人追蹤、活動烈度識別等技術[1],大幅度提升安防監(jiān)控在維護社會公共安全方面的價值,保障人民生命財產安全。
因此,本文旨在設計研發(fā)一款基于圖像處理與聲音狀況識別技術實現暴力事件預警的智能監(jiān)控攝像產品。該產品通過高清攝像設備獲得實時拍攝圖像,執(zhí)行圖像處理以提取場景數據,確定是否存在暴力事件,從而實現及時預警,避免暴力事件所造成的嚴重后果,為保障公共場所中公民的生命財產安全提供了新的解決方案。
3 技術分析
3.1 基本組成
視頻監(jiān)控部分主要采用基于內容的圖像檢索CBIR技術,只需傳入檢索圖像,就可以在圖像庫中獲得相近的圖像信息,隨著圖像特征提取與匹配算法的不斷演變,對于圖像內容細節(jié)的要求也逐漸趨于主觀判斷的結果[2]。同時,采用分布式并行運算的方式緩解運算時間過長的問題,并將預警截圖和視頻保存到數據庫形成報表,可根據時間段對預警記錄和預警截圖、視頻進行查詢,方便進行事后軌跡回溯,快速查找嫌疑人。
然而只憑借視頻監(jiān)控缺乏可靠性,攝像頭容易受到遮擋或者光線的影響,不法分子一般會在作案前提前規(guī)劃好路線,有意識地避開或者遮擋攝像頭進行犯罪。此時就需要通過實時采集相關聲音信號并進行深入分析,對異常聲音事件進行檢測,做到以視頻監(jiān)測為主、音頻監(jiān)控為輔,達到提高監(jiān)測準確性的目的。因此,對于監(jiān)控盲區(qū),本系統通過音頻采集器實現異常聲音采樣,聲音狀況技術將音頻信號經過處理來判定是否存在異常聲音,在詳細分析了異常聲音的時頻域特征之后,使用SVM分類器實現聲音識別,同時,在聲音識別的過程中引入深度學習的注意力機制。近年來,隨著深度學習的深入,為了進一步提升視覺任務的網絡性能,引進了注意力機制。該機制的本質是讓網絡自動關注重要的特征,抑制其他無用的干擾信息。將視覺任務的注意力引入聲音事件識別任務,通過神經網絡為每幀級特征分配相應的權重,這種方法相較普通的神經網絡訓練有顯著的提升,提高了監(jiān)控過程中對特定聲音情景的識別準確性[3]。
3.2 創(chuàng)新點
3.2.1 嵌入式系統設計,使系統運行穩(wěn)定
嵌入式系統設備采用DSP芯片技術,運行經過剪裁的LINUX操作系統,具有抗木馬病毒攻擊能力,支持本地USB存儲。對于大型網絡監(jiān)控,可以實現前端直接向IPSAN等設備進行存儲。
3.2.2 人體異常行為算法監(jiān)測
普通的監(jiān)控無法對人的行為進行判斷,此設備可在視頻中人體的具體特征也不明顯的情況下,基于時空的MRF方法,用于辨識群聚事件。
3.2.3 聲音狀況分析技術
國外主要將聲音信號的檢測技術用于健康狀況的檢測,國內主要將聲音檢測技術用于石油管道的工作狀況檢測以及軸承質量的檢測等。此項目側重于人聲狀況的分析,如哭聲、尖叫聲等,通過提取聲音信號的時域特征參數和頻域特征參數,并將兩者結合起來應用到異常聲音識別系統中的識別算法。
3.2.4 基于時間差(TDOA)的聲源定位技術
此項目使用GPS定位系統,結合聲源定位技術,更精準地定位危險情況,結合現有人臉識別技術,輔助確定犯罪嫌疑人。
3.2.5 無線電傳感器降低能耗
為了防止監(jiān)控攝像頭被蓄意毀壞,設計子母系統,攝像頭損壞時,啟動備用攝像頭對嫌犯進行記錄,并及時匯報給遠程防控中心,便于技術人員及時到場進行維修。使用DPM算法,在傳感器節(jié)點沒有收發(fā)數據時,無線通信模塊進入休眠狀態(tài)以降低能耗。
3.2.6 AI深度學習算法
針對不同的事發(fā)場景,將可能遇到的識別問題分類為單人的行為判別、少數人之間的突發(fā)暴力行為以及群聚事件。在廣場等環(huán)境下,攝像頭監(jiān)控的范圍較廣,視頻中人體的具體特征也不明顯,還需要準確地識別出異常聲音,例如,正常情況下兒童的哭鬧聲、節(jié)日慶祝的高分貝聲音等,這些與暴力事件聲音相似的音頻該如何分辨。在這些情況中,引入AI加持下的人體異常行為識別算法和聲音狀況識別技術,綜合社會治安、道路交通、智能家居等應用場景特點,將監(jiān)控視頻區(qū)分為盜竊搶劫、打架斗毆、交通事故、非法聚集、應急救援5種具體場景[4]。以現有案例不斷喂養(yǎng)AI引擎,同時輔以人工判斷,提升準確性。
4 市場分析
4.1 市場定位
本產品用于對公共場所突發(fā)的暴力事件進行預警。當今公共場所的暴力事件時有發(fā)生,加強公共場所安全防護,保障人們在公共場所的日?;顒影踩巧鐣伟驳闹刂兄亍=柚曇魻顩r處理系統進行廣范圍監(jiān)控,也適用于校園、居民住宅、宿舍區(qū)等監(jiān)控攝像稀疏點。
4.2 市場需求
隨著視頻處理、分析、傳輸技術的不斷進步,監(jiān)控系統從純模擬系統向模數結合、純IP監(jiān)控方式發(fā)展,監(jiān)控系統的智能分析需求也應運而生,安防監(jiān)控領域對智能監(jiān)控技術的要求,來自具體行業(yè)特色監(jiān)控的各種實際需求。公共場所的危險智能預警作為細分市場的個性化需求,必須密切關注公共場所監(jiān)控的特殊性,在廁所這樣的監(jiān)控盲區(qū),很容易出現處理危險不夠及時的情況。例如,治安監(jiān)控,重點關注人比較密集的場所,需要打擊“兩搶”,防止群發(fā)的惡性事件;在廣場、車站等地方的監(jiān)控點,密切注意人流的動向,對人群的突然聚集進行分析和報告。智能視頻分析技術在監(jiān)控領域的使用已超過10年,但由于行業(yè)需求的差異,仍處于蓬勃發(fā)展、不斷細化的過程中[5]。
5 應用場景
本產品可廣泛用于公共場所暴力事件預警。現如今,公共場所的暴力案件時有發(fā)生,加強公共場所安全防護,保障人們在公共場所的日?;顒影踩钱斀裆鐣伟驳闹匾獌热荨τ谲囌?、地鐵、橋梁、地下車庫等監(jiān)控大量覆蓋區(qū),基于實時圖像處理系統可實現精準有效防控。借助聲音狀況處理系統進行遠程廣角監(jiān)控,同時適用于校園、居民住宅、宿舍區(qū)等監(jiān)控攝像稀疏點。
另外,針對隱私問題,可通過加強監(jiān)控系統的制度建設來解決。政府可以從4個方面入手:(1)明確監(jiān)控系統的設置權和管理權歸屬;(2)明確監(jiān)控資料作為證據使用的法定程序;(3)規(guī)范公共場所監(jiān)控音視頻的采集、保管與使用;(4)明確違反相關規(guī)定的法律責任。在政府相關制度的約束下,監(jiān)控預警系統能夠確保在不侵犯公民隱私權的情況下實時識別暴力行為,保障公民生命安全[6]。
6 應用價值
社會整體治安問題是當今社會關注的重點之一。傳統安防設備需要大量人力、物力和財力,并且傳統安防手段難以對衛(wèi)生間、宿舍等地進行覆蓋監(jiān)控。本篇所述產品通過聲音識別技術進一步擴大危險判斷的范圍,用聲音覆蓋到監(jiān)控盲區(qū),提高危險判斷的準確度,是未來對公民安全保障強有力的技術支撐。而智能視頻音頻監(jiān)控技術能大幅提升現有安防監(jiān)控在維護社會公共安全方面的應用價值,更加完善地保障人民生命財產安全。
因此,本篇所述的暴力預警監(jiān)控產品設計依靠圖像和聲音的分析能夠更加準確地對危險事件進行預警,以達到有效減少人力資源、實時自動化識別等目的。本款暴力預警監(jiān)控產品不僅可以運用于宿舍等監(jiān)控較為缺乏的場所,還可以運用在飯店、廣場、劇院等已有普通監(jiān)控系統的場所,進一步保障公民的生命財產安全。
7 結語
智能視頻分析技術的應用是大勢所趨,而通過聲音識別技術對危險判斷的范圍進行擴大、對危險判斷的準確性進行加強,是進一步保障公民安全的要求。本文響應國家“十四五”規(guī)劃和2035年遠景目標綱要中,我國視頻監(jiān)控設備行業(yè)向智慧社區(qū)進軍的發(fā)展方向。此暴力預警監(jiān)控系統基于圖像和聲音的分析能夠更加準確地對危險事件進行預警,減少惡性事件的發(fā)生,加快社區(qū)安防監(jiān)控系統和安防設施提升工程建設進程,提高民眾幸福感[7]。同時,在持續(xù)推進智慧城市建設的背景下,政府也大力支持智能監(jiān)控視頻技術的發(fā)展,后續(xù)將繼續(xù)改進完善該產品設計,為公共安全提供更加完備的方案。
參考文獻
[1]陳沖,白碩,黃麗達,等.基于視頻分析的人群密集場所客流監(jiān)控預警研究[J].中國安全生產科學技術,2020(4):143-148.
[2]于蕭榕,席屏,黃健榮.監(jiān)控系統預警視頻的分布式檢索設計與實現[J].計算機測量與控制,2015(7):2511-2514.
[3]劉慧.基于深度學習的聲音事件識別算法研究[D].綿陽:西南科技大學,2022.
[4]李澤華.基于深度學習的視頻監(jiān)控預警系統[J].河北軟件職業(yè)技術學院學報,2022(4):11-14.
[5]寧鴻雁.公共安全視頻監(jiān)控系統管理制度研究[D].保定:河北大學,2016.
[6]郎江濤.公安系統天網工程瓶頸及未來展望[J].科技與創(chuàng)新,2017(9):45-46.
[7]陳歡歡.智慧城市建設中的市域社會治理問題探究[J].領導科學論壇,2022(10):27-31.
(編輯 何 琳)
Intelligent monitoring product design for early warning of violence
Ye? Yuanfengde
(Jiangnan University, Wuxi 214122, China)
Abstract:? In view of the sudden violence and harmful events that occur from time to time in todays society, this paper proposes an intelligent monitoring product design based on image processing and sound condition recognition technology to realize the early warning of violence events. Through image processing of real-time monitoring images and abnormal sound sampling processing through wireless sensor nodes to determine whether there are violence events, so as to achieve timely early warning. To avoid serious consequences caused by violent incidents, respond to the construction of smart cities, and provide new security schemes for citizens property and life safety in public places.
Key words: public safety; product design; smart city; early warning system