源乘
信息科技的蓬勃發(fā)展催生了圖像監(jiān)控(又稱為“攝像機(jī)”)的普及化?;诎踩婪兜目剂浚缃窀魇礁鳂拥臄z像機(jī)出現(xiàn)在大街小巷之中,甚至走進(jìn)了居民住宅的私密空間。據(jù)上海市公安局交通警察總隊(duì)的統(tǒng)計(jì)數(shù)據(jù),截至2017年6月,本市公安機(jī)關(guān)用于監(jiān)控的攝像機(jī)已達(dá)到1.4萬余個??梢哉f,我們已經(jīng)被攝像機(jī)包圍!
但是,目前監(jiān)控?cái)z像機(jī)的主要用途是“實(shí)時監(jiān)控”,便于使用者在事后查找錄像、鎖定證據(jù)、追尋線索。而在警戒、分析、預(yù)判等方面的功能卻尚不夠完善。面對數(shù)量如此龐大的攝像機(jī)以及海量的視頻,如果我們?nèi)匀谎赜谩叭肆ΡO(jiān)控、人工查詢”,結(jié)果只會效率低下。因此,如果能將“視頻圖像”轉(zhuǎn)換成計(jì)算機(jī)能夠識別的信息數(shù)據(jù)并前置于攝像機(jī)之中,由計(jì)算機(jī)代替使用者去實(shí)施查找、警戒、分析、預(yù)判,那么所有問題將迎刃而解!在這樣的大背景下,“視頻智能分析”,“后端智能”,乃至“前端智能”的感知型攝像機(jī)逐步走進(jìn) 了人們的視野,被使用到我們的生活與工作之中。
視頻智能分析(Video Analyzing)
所謂“視頻智能分析”,是指依托計(jì)算機(jī)從視頻圖像中通過特定的程序運(yùn)算和分析模型,提取視頻圖像中有價值的內(nèi)容信息、運(yùn)動信息等數(shù)據(jù)信息的一項(xiàng)科學(xué)技術(shù)方法。簡而言之,就是通過計(jì)算機(jī)代替使用者去監(jiān)控、查詢、分析、警戒視頻圖像。對計(jì)算機(jī)而言,攝像機(jī)記錄的視頻圖像僅僅是一個包含每一幀、每一個像素點(diǎn)的灰度值或者彩色值的數(shù)列?!耙曨l智能分析”實(shí)現(xiàn)了計(jì)算機(jī)對于視頻圖像的“理解”。使用者確定的目標(biāo)信息包含在那些像素點(diǎn)的值所組成的平面圖像序列之中,需要計(jì)算機(jī)從“整體”上進(jìn)行“理解”才能獲取,才能明白視頻圖像中所呈現(xiàn)的內(nèi)容或者發(fā)生的事情。
目前,該項(xiàng)技術(shù)應(yīng)用的目的在于自動地提取視頻圖像源(主要是攝像機(jī)或者視頻錄像設(shè)備)中的關(guān)鍵信息或者特征信息,并根據(jù)使用者的要求進(jìn)行智能化分析,再通過設(shè)置一定的條件和規(guī)則對其進(jìn)行高效判斷。
如果我們將“視頻圖像源”比喻為“人類的眼睛”,那么就可以把“視頻智能分析技術(shù)”看做是“人類的大腦”。它負(fù)責(zé)代替人腦對視頻圖像畫面中的海量數(shù)據(jù)進(jìn)行高效分析,為人們提供有價值的關(guān)鍵信息。當(dāng)前,視頻智能分析的功能主要包含“畫中畫、運(yùn)動檢測、目標(biāo)跟蹤、動態(tài)人臉識別”四個方面。
畫中畫(Picture-in-Picture)
作為一種視頻內(nèi)容的呈現(xiàn)方式,“畫中畫”是指在一部視頻全屏播放的同時,于畫面的小面積區(qū)域上同時播放另一部視頻,被廣泛用于視頻錄像、監(jiān)控設(shè)備。目前,各國警方在審訊室中多采用此項(xiàng)技術(shù)。比如,我國在執(zhí)法辦案場所設(shè)置的訊(詢)問室基本配備了具備畫中畫功能的攝像機(jī)。公安部GB/T 28181-2011《安全防范視頻監(jiān)控聯(lián)網(wǎng)系統(tǒng)信息傳輸、交換、控制技術(shù)要求》更是對攝像機(jī)畫中畫功能作出了測試要求。在具備畫中畫功能的多臺攝像機(jī)的覆蓋下,畫面通過線路傳輸運(yùn)送至指揮室中的支持多路高清視頻接入的計(jì)算機(jī)。使用計(jì)算機(jī)的警察看到的主畫面反映的是“訊問場所的全景”,小畫面則反映的是“被訊(詢)問人的特寫正面中景或者辦案人員的特寫”。(如圖所示)同時監(jiān)控畫面能全程反映被訊(詢)問人的體態(tài)、表情,并顯示同步錄像時間。這樣的設(shè)置方便警察更清晰地看到辦案區(qū)人員的小動作、微表情。
目前,“畫中畫”技術(shù)已經(jīng)可以實(shí)現(xiàn)二畫面、三畫面、四畫面的任意合成,畫中畫的大小畫面均可切換,小畫面的大小及位置亦可任意調(diào)整。
運(yùn)動檢測(Motion Detection)
“運(yùn)動檢測”是指把視頻圖像中變化的區(qū)域與背景圖像精確分離出來,即正確分割出運(yùn)動目標(biāo)的區(qū)域或者輪廓,確認(rèn)和檢測出運(yùn)動物體的存在。目前,我國在運(yùn)動檢測智能分析方面做得較為完善的企業(yè)不多。以杭州海康威視數(shù)字技術(shù)股份有限公司(以下簡稱:??低暎槔鹤鳛槲覈囊曇纛l編碼解碼卡的生產(chǎn)商,??低曉跀?shù)字信號處理器上能夠完成MPEG4/H264的實(shí)時編碼,并通過SDK的接口,提供有效的運(yùn)動檢測分析功能。在這方面,上海市公安局交通警察總隊(duì)已經(jīng)開啟了先行先試的探索。自2017年9月下旬起,上海市公安局交通警察總隊(duì)在寶林路近牡丹江路路段安裝了一套專門用于抓拍“不按規(guī)定使用燈光”違法行為的新型智能電子警察。截至2017年10月10日,市公安局交通警察總隊(duì)已經(jīng)累計(jì)查處了“不按規(guī)定使用燈光”違法行為67起,收效明顯。
目標(biāo)跟蹤(Object Tracking)
“目標(biāo)跟蹤”,俗稱“盯梢”,是指通過對攝像機(jī)采集到的圖像序列進(jìn)行計(jì)算分析,計(jì)算出目標(biāo)在每一幀圖像上的二維位置坐標(biāo),并根據(jù)不同的特征值,將圖像序列中、不同幀中同一運(yùn)動目標(biāo)關(guān)聯(lián)起來,獲得各個運(yùn)動目標(biāo)完整的運(yùn)動軌跡。這就好比目前刑事偵查中非常流行的圖偵(即“視頻圖像偵查”)。通過計(jì)算機(jī),對攝像機(jī)獲取的視頻監(jiān)控圖像資料進(jìn)行分析、研判,從而固定犯罪證據(jù)、發(fā)現(xiàn)和確定犯罪嫌疑人、提供偵查線索或者方向。以美國著名系列電影《生化危機(jī)》中的人工智能“紅皇后(Red Queen)”為例。作為蜂巢內(nèi)部的頂尖人工智能系統(tǒng),“紅皇后”就是依托攝像機(jī)捕捉下各種目標(biāo)特征信息,從而獲得各個運(yùn)動目標(biāo)完整的運(yùn)動軌跡,達(dá)到實(shí)時跟蹤、實(shí)時監(jiān)控、實(shí)時捕捉、實(shí)時聚焦。
動態(tài)人臉識別(Dynamic Face Recognition)
通常來說,“動態(tài)人臉識別技術(shù)”,是指利用人臉的特征信息,將“目標(biāo)人員的面部圖像”與“數(shù)據(jù)庫中的人臉面部特征”進(jìn)行比較與分析后,從而做出身份識別的專門性科學(xué)技術(shù)。該項(xiàng)科學(xué)技術(shù)將應(yīng)用于安全檢查、刑事偵查、智能門禁、戶籍調(diào)查、治安巡邏、出入境管理等諸多領(lǐng)域。
然而,在人群中對移動的人臉進(jìn)行識別存在著客觀實(shí)現(xiàn)的難點(diǎn)。首先,人的正臉有一個比例叫做“三庭五眼”,這個詞很正確地概括了人臉部的比例。人的側(cè)臉則會出現(xiàn)兩個正方形?!暗谝粋€正方形”是指眼尾至耳朵前端的距離等于眼睛至嘴角的距離、眼尾至耳朵前端的距離,也等于耳后至腦后的距離;“第二個正方形”是指眼尾至耳后的距離等于眼睛至下顎的距離。盡管每個人的正臉和側(cè)臉完全相同的可能性較低,但是不同個體之間的人臉結(jié)構(gòu)可能存在相仿性。這些相仿性無疑將增加人臉圖像識別與區(qū)分的難度。其次,目前高清攝像機(jī)能夠在目標(biāo)靜態(tài)的情況下清晰地捕捉到使用者通過程序算法指定的人臉,但是攝像機(jī)在人群中細(xì)分差異并找到目標(biāo)對象卻受到拍攝角度、明暗光線、人臉部位變化、遮臉物、個體的刻意偽裝等多方面因素的制約。綜上所述,動態(tài)人臉識別需要攻克的技術(shù)難點(diǎn)還有很多。endprint
當(dāng)前,為了攻克動態(tài)人臉識別技術(shù),世界各國已經(jīng)開展了專門的技術(shù)研究與公關(guān)。比如:根據(jù)上海“智慧公安”建設(shè)的要求,上海市公安局正在研發(fā)“智能圖像識別系統(tǒng)”,建設(shè)人臉基礎(chǔ)信息的中間庫(又稱為“人臉特征庫”),將“人臉基礎(chǔ)數(shù)據(jù)”同步至計(jì)算機(jī)系統(tǒng)之中,同時研發(fā)“安全調(diào)用的接口”,與計(jì)算機(jī)系統(tǒng)進(jìn)行數(shù)據(jù)信息對接。據(jù)悉,俄羅斯莫斯科也在嘗試在公共區(qū)域的監(jiān)控?cái)z像頭中引入動態(tài)人臉識別技術(shù)。2017年年初,莫斯科會同俄羅斯本土公司Tech.Lab Ltd進(jìn)行了為期六個月的測試,結(jié)果裝備了動態(tài)人臉識別技術(shù)的監(jiān)控?cái)z像機(jī),發(fā)現(xiàn)了俄羅斯聯(lián)邦政府六名重要的犯罪嫌疑人。該家俄羅斯公司的動態(tài)人臉識別技術(shù)已經(jīng)獲得了美國商務(wù)部和華盛頓大學(xué)的官方認(rèn)可,在測試階段的識別準(zhǔn)確率已經(jīng)高達(dá)70%。
后端智能(Intelligent Back)
早期,受限于前端芯片的運(yùn)算性能,“智能視頻分析技術(shù)”幾乎均在后端進(jìn)行有效運(yùn)作。一般來說,后端智能的實(shí)現(xiàn)方式是由高清攝像機(jī)采集視頻圖像信號,由后臺進(jìn)行物理存儲,再通過后端智能服務(wù)器進(jìn)行運(yùn)算分析,最終將運(yùn)算分析結(jié)果返送至存儲設(shè)備之中。此種部署方案的最大頑疾就是“帶寬受到制約”。后端的運(yùn)算分析需要大量占用帶寬的傳遞數(shù)據(jù),從而令后端運(yùn)算分析出現(xiàn)時間上的延遲,甚至造成了數(shù)據(jù)信息的丟失,阻滯和影響運(yùn)算分析的結(jié)果。另一方面,后端智能的運(yùn)算分析設(shè)備的動用量、存儲量極大,成本相當(dāng)高。
當(dāng)然,后端智能模式也有優(yōu)勢。一方面,后端智能模式對于排除故障大有裨益。另一方面,后端智能模式可以節(jié)省大量的“模擬攝像機(jī)轉(zhuǎn)數(shù)字?jǐn)z像機(jī)”的成本投入,只需對服務(wù)器進(jìn)行智能化升級即可。
當(dāng)前,市場上具備智能分析能力的攝像機(jī),一般只能提供一些基礎(chǔ)智能功能,比如越界偵測、區(qū)域入侵偵測、場景變更偵測、進(jìn)入?yún)^(qū)域偵測、離開區(qū)域偵測、人員聚集偵測、停車偵測、區(qū)域防范等。以上海市公安局交通警察總隊(duì)啟用“電子警察抓拍違法行為短信及時告知平臺”為例。目前,市交通警察總隊(duì)主要通過特寫攝像機(jī)、全景攝像機(jī)、環(huán)境攝像機(jī)等攝像機(jī)抓拍違法行為,在后端計(jì)算機(jī)中設(shè)置相應(yīng)的程序算法,將“違法停車、違法變道、違規(guī)使用公交專用車道行駛、超速、闖禁令、闖紅燈”等違法行為納入實(shí)時監(jiān)管狀態(tài)。據(jù)市交通警察總隊(duì)統(tǒng)計(jì),自2016年8月1日至2017年8月1日一年的時間內(nèi),電子警察抓拍違法行為短信及時告知平臺累積發(fā)送違法及時告知短信23萬余條。(如圖一所示)
然而,上述攝像機(jī)輸出的信息比較簡單!雖然具備警告、識別描述畫面中的內(nèi)容等智能功能,然而這畢竟是后端智能,且需通過人工操作,還無法達(dá)到真正的“前端智能”的效果。
智能分析前置化(Front Intelligent Analyzing)
如上所述,后端智能的運(yùn)作模式是前端攝像機(jī)采集視頻圖像信號,后端由智能分析服務(wù)器進(jìn)行分析并提取視頻中有價值的目標(biāo)信息,最后生成使用者想要的結(jié)構(gòu)化數(shù)據(jù)信息??墒?,受性能限制,當(dāng)前主流的服務(wù)器一臺只能同時分析六路至八路的高清視頻。若要實(shí)現(xiàn)2000路的智能分析,至少需動用250臺服務(wù)器。面對智慧城市幾千路到幾十萬路不等的監(jiān)控點(diǎn)規(guī)模,成本之高不容忽視!因此,智能分析算法移至前端的想法應(yīng)運(yùn)而生。前端智能的價值在于預(yù)防和事中控制環(huán)節(jié),將智能處理、分析、研判融入到攝像機(jī)之中。
誠如蘇州科達(dá)科技股份有限公司市場總監(jiān)劉志強(qiáng)所言,“智能前移可以讓前端攝像機(jī)具備直接的分析能力,其成本又可控,無疑將推動智能分析在智慧城市建設(shè)中的規(guī)模化應(yīng)用。”將智能前移,在攝像機(jī)中就可以完成目標(biāo)識別、特征描述以及圖片抓拍工作,這樣后端就節(jié)省了大量的智能分析服務(wù)器。可以說,智能前置的攝像機(jī)是智能分析經(jīng)濟(jì)性和規(guī)模化部署的基礎(chǔ)。只有前端實(shí)現(xiàn)智能,才能形成規(guī)?;闹悄軕?yīng)用。這將深刻影響到整個安防行業(yè)的發(fā)展格局,為安全防范迎來更長足的進(jìn)步和更寬廣的市場空間。
感知型前端攝像機(jī)(Front Intelligent Cameras)
在智能攝像機(jī)領(lǐng)域,早期智能攝像機(jī)產(chǎn)品是替代紅外對射等設(shè)備來使用的,現(xiàn)階段僅適用于禁止人們闖入和走動的應(yīng)用場景,只是告警信號而已,但這種告警誤報率很大,在警戒區(qū)內(nèi),動物的闖入、巡更人員的走動以及燈光的變化,都可能引起報警,因?yàn)樗鼘﹃J入的物體無法識別。而感知型攝像機(jī)能夠“識別”視頻中的內(nèi)容;可以“思考”視頻中發(fā)生了什么事情;最終把視頻中的內(nèi)容和有異常的事件,用語言、圖片等方式“描述”出來。根據(jù)監(jiān)控場景和需要識別的內(nèi)容,感知型攝像機(jī)主要包括三個系列:1.特征分析攝像機(jī);2.車輛卡口攝像機(jī);3.人員卡口攝像機(jī)。(如表一所示)
具備感知功能的前端攝像機(jī)可以在收集海量特征信息的基礎(chǔ)上,直接執(zhí)行復(fù)雜智能算法,將圖像信息與目標(biāo)的特征、內(nèi)容、警戒信息進(jìn)行比對,生成語義描述,從而在智慧城市、智能交通、智慧執(zhí)法等諸多領(lǐng)域發(fā)揮巨大的作用。以2017年廈門的金磚會議安防為例。1500余臺具備前端智能的感知型攝像機(jī)分布在廈門各個檢查站、安檢大棚、酒店、城際卡口等重要場所,實(shí)行安檢監(jiān)控,實(shí)時對違停、黑名單比對進(jìn)行分析處理,真正達(dá)成了會議安全區(qū)域監(jiān)控的全覆蓋。
毫無疑問,如果將攝像機(jī)比作是“鷹眼”,那么具備感知功能的前端攝像機(jī)就是“會思考的鷹眼”!
編輯:黃靈 yeshzhwu@foxmail.comendprint