山東省棗莊廣播電視臺 李修剛
?
數(shù)字電視技術(shù)在高清監(jiān)控系統(tǒng)中的應(yīng)用探討
山東省棗莊廣播電視臺李修剛
【摘要】隨著高清監(jiān)控技術(shù)的不斷發(fā)展和進(jìn)步,高清監(jiān)控不只是IP的單獨(dú)專項,監(jiān)控設(shè)備和管理系統(tǒng)在應(yīng)用和功能方面,不斷融合廣電技術(shù)。本文以廣電MPEG-2、H.264編碼技術(shù),智能視頻識別技術(shù)和全臺網(wǎng)MSB技術(shù)在高清監(jiān)控的應(yīng)用為例,探討廣電數(shù)字技術(shù)在安防高清監(jiān)控系統(tǒng)中的應(yīng)用。
【關(guān)鍵詞】IP監(jiān)控;ASMF文件系統(tǒng);MPEG-2;H264;最高有效位MSB
近年來的發(fā)展表明,隨著網(wǎng)絡(luò)和電視視頻編碼技術(shù)飛速發(fā)展,視頻監(jiān)控進(jìn)入到網(wǎng)絡(luò)化、智能化時代,與過去的監(jiān)控相比智能分析和圖像處理能力更加強(qiáng)大,基于網(wǎng)絡(luò)和數(shù)字電視技術(shù)的高效監(jiān)控管理軟件實現(xiàn)應(yīng)用服務(wù)的全數(shù)字化,為用戶提供了更多智能視頻分析和提前預(yù)警功能,很大程度上提高視頻監(jiān)控的效率。
在數(shù)字化進(jìn)程中,數(shù)字信號的標(biāo)準(zhǔn)化是最重要的環(huán)節(jié)之一。MPEG-2的視頻編碼被分為三類,稱為I幀,P幀和B幀,后綴“I”和“P”分別表示隔行掃描與逐行掃描,I幀圖像利用單幀圖像內(nèi)的空間相關(guān)性,采用幀內(nèi)編碼方式,P幀和B幀圖像利用空間和時間上的相關(guān)性,采用幀間編碼方式。提高壓縮和圖像質(zhì)量的方法是利用P幀圖像前向時間預(yù)測的原理,意即P幀中的宏塊既可以前向預(yù)測,也可以是幀內(nèi)編碼;B幀圖像采用雙向時間預(yù)測,可以大大提高壓縮倍數(shù)。數(shù)字高清信號數(shù)字電視掃描線的分為1080P、1080I、720P,1080P是最高等級高清視頻編碼,逐行掃描可以獲得更好的動態(tài)圖像,這原本用于廣電行業(yè)的高清視頻標(biāo)準(zhǔn)目前已被視頻監(jiān)控行業(yè)作為公認(rèn)的技術(shù)標(biāo)準(zhǔn)而普通沿用。
在編碼格式MPEG-2、MPEG-4、H.264和VC-1這四種算法中。H.264編碼效率是最高的。在同等圖像質(zhì)量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍,所以H.264有很高的數(shù)據(jù)壓縮比率。H.264高的壓縮比,主要是低碼率起的作用,下載時間和數(shù)據(jù)流量收費(fèi)將降低很多。高質(zhì)量流暢的圖像、高壓縮的視頻數(shù)據(jù),占用傳輸帶寬小,因此更加經(jīng)濟(jì)有效。
上述由ITU-T或ISO/IEC標(biāo)準(zhǔn)化組織制定的視頻壓縮編碼標(biāo)準(zhǔn)是一個規(guī)范了壓縮碼流數(shù)據(jù)結(jié)構(gòu)的開放式標(biāo)準(zhǔn),可以提供給研究和開發(fā)者更多關(guān)鍵技術(shù)的創(chuàng)新空間。如消除空間相關(guān)性的變換編碼技術(shù)、幀內(nèi)預(yù)測編碼技術(shù),消除時間相關(guān)性的幀間預(yù)測編碼技術(shù)都被應(yīng)用在這些標(biāo)準(zhǔn)中。此外,H.264標(biāo)準(zhǔn)中采用幀內(nèi)預(yù)測技術(shù),更小塊整數(shù)變換技術(shù)等。通過運(yùn)動估計的幀間預(yù)測編碼技術(shù)消除了時間冗余,前向、后向和雙向預(yù)測技術(shù)解決了運(yùn)動對象移動引起的遮擋、覆蓋等問題,進(jìn)一步提高壓縮包。視頻監(jiān)控主要采用H.264標(biāo)準(zhǔn)。(見圖1)
圖1 MEPG-2幀間結(jié)構(gòu)
高效全格式幀精確編解碼的技術(shù)是高清安防系統(tǒng)關(guān)鍵。MPEG-2編碼標(biāo)準(zhǔn)制定了標(biāo)清和高清數(shù)字電視的壓縮方案和規(guī)范,其碼率上限可達(dá)100Mbt/s,所以MPEG-2除適用于廣播級的編碼,更適用監(jiān)控的10Mbps的高碼率要求。
圖像中大量的冗余信息是由于MPEG-2壓縮編碼的空間和時間的相關(guān)特性所致,在傳輸中去除多余的冗余信息,保存少量非相關(guān)信息,可以節(jié)省傳輸帶寬。在接收端依照非相關(guān)信息的解碼算法,可以還原圖像。盡可能有效地去除圖像中的冗余信息就是好的壓縮編碼。
在播出和非線性編輯系統(tǒng)中,采用幀間壓縮的方式MPEG-2,幀內(nèi)壓縮由I幀的來處理,通過前后預(yù)測獲得B幀和P幀,較高的壓縮比數(shù)據(jù)量也較小,因此,由幀之間的時間相關(guān)性即可得到傳輸和運(yùn)算的數(shù)據(jù)。MPEG-2在非線性編輯系統(tǒng)得到普及和應(yīng)用,節(jié)約了人員和編輯設(shè)備的成本,實現(xiàn)了精確快速搜索包括連續(xù)回放和逐幀倒放等。MPEG-2的解壓縮標(biāo)準(zhǔn)是開放和兼容的,壓縮數(shù)據(jù)的壓縮器件和解壓縮器可由不同廠家設(shè)計和制造,能過保證各設(shè)備之間通用。
目前采用純以太網(wǎng)組建非線性編輯網(wǎng)絡(luò)系統(tǒng)是最為成熟的網(wǎng)絡(luò),加上有比較完善的管理系統(tǒng),性價比較高。
H.264實現(xiàn)了毫秒級的幀精確定位,能夠滿足安防監(jiān)控秒級檢索定位。
高碼率表征了高清晰度,較高安全性、實效性和可靠性是高碼率數(shù)據(jù)存儲的基本要求,文件格式MXF就符合這項要求。
能夠滿足廣播制作的所有需求的文件外殼格式目前還沒有。MXF設(shè)計為能夠允許不同的公司間不需依賴特定的文件格式就能交換資源,滿足絕大數(shù)新舊的媒體交換的需求。媒體在不同的載體上交換是我們的愿望,如音視頻服務(wù)器、存儲系統(tǒng)、編輯工作站、錄像設(shè)備、流媒文件格式等。無疑MXF解決了這些問題。而蘋果公司著名的非編軟件Final Cut Pro最新推出的5.0版本中,可以直接導(dǎo)入MXF。
發(fā)送端和接受端設(shè)備必須支持相同的音視頻壓縮、無壓縮格式和數(shù)據(jù)格式才是真正的兼容。不斷增加新的MXF支持的格式可以支持各種業(yè)務(wù)的要求,MXF的特性被MXF的操作規(guī)范定義了多種,如壓縮類型、數(shù)據(jù)結(jié)構(gòu)等,如一個規(guī)范支持DV和多軌音頻格式,另一種規(guī)范則支持D10 MPEG-2格式等。MXF的全兼容,是繼續(xù)努力發(fā)展的方向。
對音視頻設(shè)備和非線性設(shè)備的升級就要率先用到MXF。MXF作為存儲格式使用時,要與其他文件格式能夠共存,并把這些格式轉(zhuǎn)化為MXF格式來使用,MXF真的普及有待時日(見圖2)。
圖2 ASMF高級媒體文件格式
把ASMF文件核心技術(shù)中的平行域架構(gòu)、多級金字塔索引架構(gòu)、虛擬存儲條帶、N+M備份策略等多種技術(shù)引進(jìn)系統(tǒng)管理平臺當(dāng)中,可使各監(jiān)控系統(tǒng)互聯(lián)互通、并可進(jìn)行秒級海量數(shù)據(jù)檢索以及監(jiān)控系統(tǒng)的平滑升級。
多級金字塔式索引技術(shù)。智能監(jiān)控采用了多級金字塔式超級索引,運(yùn)用ASMF文件技術(shù),通過數(shù)據(jù)庫、存儲服務(wù)器、文件的三級索引,實現(xiàn)視頻圖像的秒級回放的速度。多級金字塔式超級索引技術(shù)在定位時采用逐層分段查詢方式,不需要分析整個索引,就能夠快速找到文件中的任意幀及視頻段,極大地提高文件定位和響應(yīng)速度;ASMF文件完全獨(dú)立于操作系統(tǒng),直接對磁盤進(jìn)行讀寫操作,具有極高的I/O讀寫性能,可控多個高清攝像頭,海量存儲、20PB數(shù)據(jù)檢索實現(xiàn)秒級檢索回放。
無限擴(kuò)展的虛擬存儲條帶技術(shù)。智能監(jiān)控集成管理平臺提供了虛擬存儲條帶技術(shù),所謂虛擬存儲條帶技術(shù),就是通過精確核算,將一定規(guī)模的攝像頭、對應(yīng)容量的存儲單元,和存儲流媒體服務(wù)器關(guān)聯(lián)起來,構(gòu)成一個基本單元,這個基本單元就是虛擬存儲條帶,虛擬存儲條帶可以無限擴(kuò)展,滿足監(jiān)視監(jiān)控系統(tǒng)的無縫擴(kuò)容,能夠支持從幾十路到數(shù)萬路攝像頭的無縫搭建,從而構(gòu)建大型、超大型監(jiān)控系統(tǒng),虛擬存儲條帶既相對獨(dú)立,又被管理平臺統(tǒng)一管理,統(tǒng)一調(diào)度。
智能視頻分析技術(shù)主要包括圖像處理、跟蹤技術(shù)、模式識別、數(shù)字信號處理等系統(tǒng)通常都具有以下功能:
(1)圖像采集與還原。監(jiān)控采集圖像信號通常是以壓縮流的形式存在,可以將圖像流解壓還原成原始圖像格式后再進(jìn)行分析。對于圖像處理系統(tǒng)來說,在接收到視頻圖像后,對計算機(jī)而言只是一個數(shù)據(jù)數(shù)列,視頻識別技術(shù)便是為了通過特定的核心算法程序提取視頻信號中所包含的內(nèi)容信息,以實現(xiàn)計算機(jī)對于視頻的“理解”,讓計算機(jī)能“明白”視頻中所展現(xiàn)的是什么內(nèi)容或者發(fā)生的是什么樣的“事件”。
(2)對動態(tài)物體檢測捕捉。系統(tǒng)采用高清的IP攝像頭和高速的視頻抓取、跟蹤和圖像質(zhì)量評估算法,保證了所采集圖像為高質(zhì)量的清晰圖,使監(jiān)控人員能夠在不身處現(xiàn)場的情況下通過攝像頭看到現(xiàn)場的情景,而這一現(xiàn)場還由于傳輸技術(shù)的進(jìn)步通過數(shù)字網(wǎng)絡(luò)傳輸視頻擺脫了地域的限制;而視頻分析技術(shù)則給監(jiān)控系統(tǒng)加上了“大腦”,使機(jī)器能夠代替人來隨時監(jiān)看這些視頻,無須再由人工隨時去監(jiān)看這些視頻。
(3)多個物體跟蹤技術(shù)。跟蹤就是把發(fā)現(xiàn)的同一物體每一幀沿時間順序串起來,在多個運(yùn)動物體,多個相機(jī)之間互相影響情況下進(jìn)行有效檢測。利用先進(jìn)的識別算法為基礎(chǔ),通過高性能超級圖形計算,能對高清視頻實時全幀分析,多種算法相結(jié)合,對目標(biāo)多維度進(jìn)行比較識別,能有效提高識別的準(zhǔn)確度,減少誤報干擾。
在廣電領(lǐng)域中,體育節(jié)目制作部門會經(jīng)常制作一個足球精彩射門集錦,以前都是通過制作人員逐個瀏覽足球賽錄像資料,將其中的精彩片段剪輯到一起,非常耗時,工作效率非常低。后來廣電設(shè)備廠商針對這個問題研發(fā)了一個足球精彩度分析智能算法,能自動分析錄像中足球射門鏡頭,并這些鏡頭自動剪輯成一個短片,制作人只需對剪輯完成的短片做出簡單調(diào)整就可播出,極大地縮短了節(jié)目制作周期。這里的足球精彩度分析智能算法其實就是安防領(lǐng)域中提到的視頻智能算法,通過識別畫面中的人群密度,足球運(yùn)動速度、球門的特征和守門員特殊的服裝顏色等參數(shù)準(zhǔn)確識別出射門的精彩鏡頭。
當(dāng)前安防網(wǎng)絡(luò)化的重點(diǎn)側(cè)重在多個監(jiān)控子系統(tǒng)間的聯(lián)網(wǎng),監(jiān)控與相關(guān)業(yè)務(wù)、與工作流程的結(jié)合還比較少。在這方面,廣電領(lǐng)域的MSB(媒體服務(wù)總線,見圖3)高清全臺網(wǎng)的技術(shù)體系架構(gòu)就與用戶的業(yè)務(wù)和流程結(jié)合的較好,通過在中央電視臺、奧運(yùn)會等項目的運(yùn)用,取得了不錯的效果,非常值得在設(shè)計視頻監(jiān)控系統(tǒng)時借鑒。
圖3 MSB廣播電視全臺網(wǎng)的技術(shù)體系架構(gòu)
將“松耦合”網(wǎng)絡(luò)技術(shù)應(yīng)用于電視節(jié)目生產(chǎn)業(yè)務(wù)系統(tǒng),使得子系統(tǒng)能夠相對獨(dú)立的建設(shè)和運(yùn)行,降低存儲壓力和網(wǎng)絡(luò)帶寬要求。系統(tǒng)以媒體資產(chǎn)管理技術(shù)作為系統(tǒng)核心,為全臺業(yè)務(wù)系統(tǒng)提供了資料的歸檔、管理、再利用和數(shù)據(jù)交換,實現(xiàn)全臺共享資源,為用戶權(quán)限認(rèn)證、生產(chǎn)進(jìn)程控制等提供支撐。系統(tǒng)應(yīng)用全程非線性工作技術(shù),使得資料從收錄或上載開始,就工作在非線性文件模式中,實現(xiàn)全程無帶化文件工作方式。
采用工作流引擎驅(qū)動的流程管理技術(shù),系統(tǒng)能夠靈活高效地管理和控制各個業(yè)務(wù)流程,提高了管理水平和工作效率。應(yīng)用演播室網(wǎng)絡(luò)播出技術(shù)、后臺整理技術(shù)和后臺合成服務(wù)器技術(shù),實現(xiàn)全臺演播室播出網(wǎng)絡(luò)化。以媒體服務(wù)總線的軟件架構(gòu)、基于FC協(xié)議和SNFS文件系統(tǒng)二次共享為基礎(chǔ)的柔性可擴(kuò)充網(wǎng)絡(luò)構(gòu)建的信息整合平臺,實現(xiàn)了系統(tǒng)間的互聯(lián)互通。通過控制矩陣切換,實現(xiàn)演播室與播出服務(wù)器的“多對多”的工作模式。OA應(yīng)用與非線性編輯技術(shù)的有機(jī)融合實現(xiàn)辦公與生產(chǎn)整合后的桌面終端。
全臺網(wǎng)基于SOA架構(gòu)設(shè)計,引入MSB媒體服務(wù)總線旗下的ESB和EMB兩大企業(yè)系統(tǒng)集成利器,對各系統(tǒng)進(jìn)行松耦合的互聯(lián);同時各應(yīng)用系統(tǒng)的高內(nèi)聚設(shè)計特性保證其可以完整獨(dú)立運(yùn)行。MSB媒體服務(wù)總線是構(gòu)建全臺業(yè)務(wù)主干支撐平臺。借助MSB,可以實現(xiàn)電視臺多個業(yè)務(wù)系統(tǒng)間元數(shù)據(jù)、媒體數(shù)據(jù)和流程的互聯(lián)互通,實現(xiàn)業(yè)務(wù)流程的高效管理和有效監(jiān)控。為用戶提供一個高可靠性的文件存儲環(huán)境,保障用戶的業(yè)務(wù)流程可靠、安全,保障業(yè)務(wù)的安全完整。這一架構(gòu)的全臺網(wǎng)絡(luò)增強(qiáng)了視音頻應(yīng)用系統(tǒng)安全高效的運(yùn)行能力,滿足廣電用戶大數(shù)據(jù)量、高帶寬、快速響應(yīng)的要求。
高清數(shù)字監(jiān)控系統(tǒng)是信息時代發(fā)展的產(chǎn)物。監(jiān)控系統(tǒng)采用數(shù)字電視技術(shù)技術(shù),使數(shù)字監(jiān)控系統(tǒng)技術(shù)上了一個新臺階。高清數(shù)字監(jiān)控系統(tǒng)已成為行業(yè)安保管理系統(tǒng)重要環(huán)節(jié),結(jié)合無線、移動通信的快速發(fā)展,以視頻技術(shù)為核心的無線多媒體傳感網(wǎng)得到人們的普遍關(guān)注,共同推動智能高清監(jiān)控時代的來臨。
參考文獻(xiàn)
[1]杜百川.數(shù)字電視[M].中國電子學(xué)會廣播電視技術(shù)分會,1998.
[2]《視頻安防監(jiān)控系統(tǒng)工程設(shè)計規(guī)范》GB50395-2007[S].
李修剛(1967-),男,山東棗莊人,工程師,現(xiàn)供職于棗莊廣播電視臺,從事廣播電視技術(shù)方面工作及研究。
作者簡介: