黃鶴 孟廣仕
摘 要:隨著多媒體技術(shù)的迅猛發(fā)展,數(shù)字視頻信息量飛速增長。如何有效地在海量視頻數(shù)據(jù)中查找用戶感興趣的內(nèi)容,已經(jīng)成為當(dāng)今信息社會亟待解決的技術(shù)問題。本設(shè)計針對互聯(lián)網(wǎng)視頻的檢索,分別從基于文本的方法和基于視頻內(nèi)容的方法出發(fā),研究包括視頻網(wǎng)頁的識別和視頻文本特征提取以及大規(guī)模視頻數(shù)據(jù)處理等視頻檢索系統(tǒng)中的關(guān)鍵技術(shù)和問題,設(shè)計并實現(xiàn)了通用的視頻檢索系統(tǒng)。
關(guān)鍵詞:視頻檢索模式;識別;設(shè)計
引言
隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的迅速發(fā)展,圖像、音頻和視頻等各種多媒體數(shù)據(jù)呈爆炸性增長。如何對這些數(shù)量巨大的多媒體數(shù)據(jù)進行有效的管理與檢索已經(jīng)成為目前研究的熱點。由于多媒體數(shù)據(jù)的多樣性和復(fù)雜性,傳統(tǒng)的基于文本的檢索技術(shù)已不能完全滿足現(xiàn)在用戶的需求。近年來,隨著優(yōu)酷網(wǎng)、土豆網(wǎng)、CNTV等大小數(shù)百家視頻分享網(wǎng)站紛紛建立,訪問者對于網(wǎng)站的服務(wù)要求也越來越高,傳統(tǒng)的檢索系統(tǒng)已經(jīng)不能勝任目前的需求。另一方面,網(wǎng)絡(luò)上充斥了一些違法、盜版等不利于網(wǎng)絡(luò)視頻健康發(fā)展的內(nèi)容,而如何有效的過濾上述視頻資料也顯得尤為重要。綜上所述,能夠滿足當(dāng)前需求的視頻檢索系統(tǒng)對于各大視頻網(wǎng)站、視頻發(fā)布商、網(wǎng)絡(luò)監(jiān)管機構(gòu)是十分重要的。
1 MPEG-7標準
MPEG-7是國際標準化組織即將推出的新一代多媒體國際標準,該標準主要用于對各種不同類型的多媒體信息進行標準化描述,并將該描述與所描述的內(nèi)容相聯(lián)系,以實現(xiàn)對多媒體信息快速有效的搜索。MPEG家族的新成員叫作多媒體內(nèi)容專用解決方案的有限的能力進行擴展,特別是它還包括了更多的數(shù)據(jù)類型。MPEG-7全稱為“多媒體內(nèi)容描述接口”,MPEG-7的目標是支持多種音頻和視覺的描述,包括自由文本、客觀屬性、主觀屬性、N維時空結(jié)構(gòu)、統(tǒng)計信息、生產(chǎn)屬性和組合信息。對于視覺信息,描述將包括顏色、視覺對象、紋理、草圖、形狀、體積、空間關(guān)系、運動及變形等。MPEG-7規(guī)定了一套標準描述子來描述各種多媒體信息,并且預(yù)先定義了描述子的結(jié)構(gòu)以及它們之間的關(guān)系。如今,越來越多的人希望能從世界各地許許多多信息源中獲取各種類型的多媒體信息。然而,在獲取這些信息之前,目光必須找到存儲所需信息的位置。
2 系統(tǒng)設(shè)計
本系統(tǒng)設(shè)計是基于元信息的視頻檢索技術(shù)在互聯(lián)網(wǎng)上使用的比較多,如Google、百度等搜索引擎提供的視頻搜索,以及youtube、優(yōu)酷、土豆等視頻分享網(wǎng)站提供的站內(nèi)視頻搜索等。本設(shè)計針對國內(nèi)外視頻檢索技術(shù)進行了深入的研究和改進,設(shè)計出檢索質(zhì)量與效率更高的視頻檢索系統(tǒng),一方面幫助用戶有效的在浩瀚的互聯(lián)網(wǎng)中檢索和瀏覽互聯(lián)網(wǎng)視頻片段。利用結(jié)構(gòu)化查詢語言中過程與函數(shù)實現(xiàn)了基于主色特征的鏡頭級視頻檢索,設(shè)計并實現(xiàn)了一個基于客戶/服務(wù)器構(gòu)架的基于內(nèi)容視頻檢索(CBVR)原型系統(tǒng)。該系統(tǒng)包括服務(wù)器端、網(wǎng)絡(luò)傳輸和客戶端三個主要模塊,具有特征提取、特征入庫、特征匹配和檢索點播等功能,并且可以基于媒體文件與XML文件兩種方式進行檢索。
MPEG-7標準可以支持非常廣泛的應(yīng)用,具體如下:音視數(shù)據(jù)庫的存儲和檢索;廣播媒體的選擇(廣播、電視節(jié)目);因特網(wǎng)上的個性化新聞服務(wù);智能多媒體、多媒體編輯;教育領(lǐng)域的應(yīng)用(如數(shù)字多媒體圖書館等);遠程購物;社會和文化服務(wù)(歷史博物館、藝術(shù)走廊等)。視頻檢索系統(tǒng)通過對所有入庫視頻進行預(yù)處理,包括自動方式和人工方式,允許在入庫前對視頻資源進行編輯、壓縮、格式轉(zhuǎn)換和人工分類標簽標注,結(jié)合視頻低層特征和語義標注,預(yù)先生成存儲視頻資源的目標數(shù)據(jù)庫。并且預(yù)處理過程允許自定義審批流程,通過完善的權(quán)限控制,保證視頻資源的安全性。系統(tǒng)提供多種檢索方式,快速檢索目標結(jié)果集,并允許對目標結(jié)果集查看、復(fù)制。
3 模塊設(shè)計
視頻檢索系統(tǒng)主要包括采集、審核發(fā)布、檢索等三個子系統(tǒng),其中采集子系統(tǒng)通過直接接駁視頻監(jiān)控系統(tǒng)或手工批量導(dǎo)入的方式,快速導(dǎo)入視頻流,并對不同格式的視頻流進行格式轉(zhuǎn)換,統(tǒng)一轉(zhuǎn)換為MPEG-4格式,還可對視頻流進行壓縮,過濾掉監(jiān)控類視頻中大量無活動內(nèi)容部分,大幅度縮減視頻流尺寸;發(fā)布子系統(tǒng)通過智能提取視頻關(guān)鍵幀,輔助人工標簽標注的方式,實現(xiàn)針對視頻的語義描述,并使得描述定義符合MPEG-7格式,并經(jīng)過可自定義的審核流程,發(fā)布經(jīng)審核通過的視頻文件;檢索子系統(tǒng)對入庫視頻自動提取底層圖像特征,提供豐富的查詢接口,允許通過語義標簽或視頻低層特征聯(lián)合檢索,檢索結(jié)果采用圖像列表形式展現(xiàn),方便用戶選擇瀏覽。本系統(tǒng)通過結(jié)合MPEG-4和MPEG-7標準來同時從內(nèi)容和語言上描述一個視頻流,實現(xiàn)針對視頻流的快速檢索。
4 結(jié)束語
本設(shè)計以具有如下優(yōu)點:
(1)幫助用戶有效的在浩瀚的互聯(lián)網(wǎng)中檢索和瀏覽互聯(lián)網(wǎng)視頻片段,主要面向各大視頻網(wǎng)站、數(shù)字電視媒體以及遠程教育網(wǎng)絡(luò)等機構(gòu)。
(2)通過盜版視頻檢測,可自動檢測網(wǎng)絡(luò)上的色情、暴力等有害視頻,可用于視頻網(wǎng)站自檢、有害視頻過濾,可面向政府機構(gòu)提供監(jiān)測服務(wù)等功能。
參考文獻
[1]張硯秋,陳川,何明德.基于MVC設(shè)計模式構(gòu)筑JSP/Servlet+EJB的Web應(yīng)用[J].計算機工程,2011(11).
[2]黃強,李敏,樓新遠.一個基于AOP的Bean鎖算法[J].成都信息工程學(xué)院學(xué)報,2013(2).
[3]陳穎峰,王玉紅.MVC設(shè)計模式在WEB應(yīng)用系統(tǒng)中的實現(xiàn)[J].承德石油高等專科學(xué)校學(xué)報,2012(3).
[4]呂子泉.基于Web的圖像數(shù)據(jù)挖掘研究與應(yīng)用[D].山東大學(xué),2013.
[5]曾嘯天.基于感興趣區(qū)域可分級視頻編碼研究[D].大連理工大學(xué),2011.