• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于語義的視頻檢索關(guān)鍵技術(shù)綜述

      2012-01-19 12:15:36孔英會(huì)劉淑榮張少明范啟躍
      電子科技 2012年8期
      關(guān)鍵詞:關(guān)鍵幀檢索語義

      孔英會(huì),劉淑榮,張少明,范啟躍

      (華北電力大學(xué)電氣與電子工程學(xué)院,河北保定 071003)

      基于語義的視頻檢索關(guān)鍵技術(shù)綜述

      孔英會(huì),劉淑榮,張少明,范啟躍

      (華北電力大學(xué)電氣與電子工程學(xué)院,河北保定 071003)

      隨著大量視頻的出現(xiàn),視頻內(nèi)容檢索是當(dāng)今多媒體應(yīng)用的一個(gè)重要研究方向?,F(xiàn)有的視頻檢索技術(shù)多是基于低層特征,這些低層特征與高層語義概念相差較多,嚴(yán)重影響了視頻內(nèi)容檢索系統(tǒng)的實(shí)用性。由于低層特征和高層語義概念間的語義鴻溝,如何從視頻內(nèi)容中提取人類思維中的語義概念,正成為目前視頻內(nèi)容檢索中最具有挑戰(zhàn)性的研究內(nèi)容。文中介紹了語義視頻檢索出現(xiàn)的背景和國內(nèi)外最新研究動(dòng)態(tài),分析了現(xiàn)有方法的優(yōu)缺點(diǎn),對現(xiàn)有的關(guān)鍵技術(shù)進(jìn)行綜述。

      語義鴻溝;語義視頻檢索;底層特征;高層語義概念

      隨著多媒體視頻數(shù)據(jù)在捕獲、存儲(chǔ)、傳播方面取得的重大技術(shù)進(jìn)步,人們可以方便快捷地獲得大量的數(shù)字視頻,并且出現(xiàn)新的視頻應(yīng)用。如何從網(wǎng)絡(luò)數(shù)據(jù)資源中,實(shí)現(xiàn)對含有豐富時(shí)空信息的視頻數(shù)據(jù)檢索成為人們關(guān)注的焦點(diǎn)問題。

      早期的圖像數(shù)據(jù)庫沿襲了傳統(tǒng)的數(shù)據(jù)庫檢索方式,采用文本進(jìn)行檢索。這種對視頻手工建立關(guān)鍵詞用文本描述信息的方式,已不適應(yīng)視頻信息檢索的要求。主要原因在于:(1)視頻內(nèi)容豐富,僅使用幾個(gè)關(guān)鍵字很難將其內(nèi)容描述清楚。(2)依靠人工對視頻數(shù)據(jù)進(jìn)行內(nèi)容概括并標(biāo)注,其工作量大、成本高、效率低、可擴(kuò)展性差。(3)人工標(biāo)注的主觀性強(qiáng),同一段視頻,而不同的標(biāo)注者可能標(biāo)注不同,也可能不是同一段視頻不同的標(biāo)注者對其標(biāo)注相同,由此可能引發(fā)矛盾和混亂。因此傳統(tǒng)的方法不能滿足人們實(shí)際應(yīng)用的需要。

      人們習(xí)慣用語義概念檢索自己需要的視頻,但由于底層特征和高層語義概念之間存在語義鴻溝,在語義概念層次進(jìn)行視頻內(nèi)容的描述和操縱面臨較大的困難。如何從視頻內(nèi)容中提取人類思維中的語義概念,成為目前視頻內(nèi)容檢索中具有挑戰(zhàn)性的研究內(nèi)容[1]。

      盡管隨著人工智能、圖形處理、多媒體技術(shù)等技術(shù)的發(fā)展,前人也做了大量相關(guān)工作,基于語義視頻檢索系統(tǒng)的查全率、查準(zhǔn)率有了一定的提高,但離真正的實(shí)際應(yīng)用還有較大的距離。存在以下不足:(1)視頻的特征信息提取不全面、不準(zhǔn)確。有些特征效果不好,不能準(zhǔn)確地實(shí)現(xiàn)高層語義映射。(2)不能有效地降低視頻底層特征和高層語義概念間的語義鴻溝,直接影響檢索精度。(3)視頻圖像中包含大量的語義信息,并且這些信息之間存在復(fù)雜的關(guān)系,因此需要一個(gè)具有強(qiáng)大的表達(dá)能力的方法;其次,由于圖像理解的主觀性,視頻圖像語義的表示方法需要一定的模糊和非精確性,用以支持視頻圖像的相似度檢索。

      1 國內(nèi)外研究動(dòng)態(tài)

      視頻信息檢索是多媒體領(lǐng)域的重要研究課題,是跨越圖像處理、計(jì)算機(jī)視覺、模式識(shí)別、人工智能以及數(shù)據(jù)庫等領(lǐng)域的交叉學(xué)科,是對文本、圖像、聲音等多種媒體形式的綜合分析和查詢。當(dāng)前視頻信息檢索的研究主要集中在兩大類:一類是基于視頻低層特征的樣例或樣圖查詢(Query by Examples);另一類是基于視頻描述信息的語義查詢(Query by Keywords)。第一類屬于基于樣本視頻或圖片的查詢,是利用用戶給出的查詢樣例,提取樣例視頻和數(shù)據(jù)庫視頻的低層物理特征,并根據(jù)一定的相似度度量,通過計(jì)算二者之間的相似度得到用戶所需的查詢結(jié)果。第二類屬于基于關(guān)鍵詞的查詢,是通過對視頻庫中的視頻數(shù)據(jù)進(jìn)行高層語義分析,通過用戶提供的查詢關(guān)鍵詞對視頻內(nèi)容進(jìn)行檢索。這兩類視頻檢索方法分別從低層物理特征和高層語義特征兩個(gè)方面,對視頻內(nèi)容進(jìn)行分析和檢索,是視頻檢索領(lǐng)域兩個(gè)重要的研究方向。從2001年至今,諸如CMU、IBM等研究機(jī)構(gòu)已相繼提出了一些優(yōu)秀的高層語義提取算法,并且取得了較好的研究成果[2]。典型的視頻檢索系統(tǒng)主要有:

      (1)QBIC(Query By Image Content)系統(tǒng)。其允許用戶使用例子圖像、用戶構(gòu)建的草圖和畫圖及其選擇的顏色和紋理模式、以及鏡頭和目標(biāo)運(yùn)動(dòng)等圖形信息,對大型圖像和視頻數(shù)據(jù)庫進(jìn)行查詢。

      (2)Visual Seek系統(tǒng)。是美國哥倫比亞大學(xué)研究的一種在互聯(lián)網(wǎng)上使用的基于內(nèi)容的檢索系統(tǒng)。Visual Seek同QBIC一樣提供了多種查詢方法:根據(jù)視覺特征、圖像注釋、草圖等。

      (3)VideoQ系統(tǒng)。是哥倫比亞大學(xué)的一個(gè)研究項(xiàng)目,它擴(kuò)充了傳統(tǒng)的關(guān)鍵字和主題導(dǎo)航的查詢方法,允許用戶使用視覺特征和時(shí)空關(guān)系來檢索視頻。

      (4)Photo Book系統(tǒng)。由美國麻省理工學(xué)院媒體研究室研究的Photo Book系統(tǒng),能夠支持相似性圖像的檢索,可以利用人臉、形狀、紋理、相片簿等分別對人臉圖像、工具和紋理進(jìn)行基于內(nèi)容的檢索。

      2 視頻檢索系統(tǒng)關(guān)鍵技術(shù)

      視頻語義檢索模型主要包括底層特征提取模塊、底層特征向高層語義映射模塊、視頻語義查詢模塊[3]。

      2.1 底層特征提取模塊

      該模塊主要包括:視頻鏡頭檢測、關(guān)鍵幀提取、特征提取3種關(guān)鍵技術(shù)。

      視頻鏡頭檢測是將視頻自動(dòng)地分割為鏡頭以作為視頻基本的索引單元,因此鏡頭的自動(dòng)分割是視頻結(jié)構(gòu)化的基礎(chǔ)。視頻鏡頭的邊界變換分為兩大類:突變(cut)和漸變(Gradual Transition)。目前已經(jīng)提出的算法,從方向上可分為兩類:(1)非壓縮域。(2)壓縮域。在非壓縮域,典型的鏡頭邊界檢測算法包括像素差異法、統(tǒng)計(jì)量法、直方圖法、基于邊緣及運(yùn)動(dòng)特征的方法及基于編輯模型的方法等[4]。由于現(xiàn)在多數(shù)視頻都是壓縮的,所以在壓縮域進(jìn)行鏡頭檢測是一個(gè)趨勢。壓縮域視頻則表現(xiàn)為3種類型的幀,分別為I幀、P幀和B幀。I幀為主要信息攜帶者,其表現(xiàn)為DCT系 數(shù),DCT系數(shù)又分為直流系數(shù)(DC)和交流系數(shù)(AC),文獻(xiàn)[5]提出了一種基于RS理論的壓縮域鏡頭分割算法。該算法首先根據(jù)MPEG壓縮標(biāo)準(zhǔn),從視頻流中提取DCT系數(shù);經(jīng)預(yù)處理得到每一幀的DC系數(shù);最后依據(jù)DC系數(shù)建立鏡頭分割信息系統(tǒng)模型,通過RS理論的劃分與屬性約簡得到視頻鏡頭。

      關(guān)鍵幀提取模塊。由于鏡頭中包含大量相同或相似的視頻內(nèi)容,存在冗余性,可以在每個(gè)鏡頭中提取最具代表性的、反映該鏡頭主要內(nèi)容的若干幀來代替這個(gè)鏡頭,這些幀稱為關(guān)鍵幀。通過關(guān)鍵幀的提取,可以用微小的數(shù)據(jù)量把一個(gè)鏡頭的靜態(tài)特性表示出來,從而在視頻檢索中大大地減少數(shù)據(jù)量,為視頻索引瀏覽和檢索提供合適的摘要減少了視頻操作的數(shù)據(jù)處理量。

      試驗(yàn)用“水洗”低K(K≤80 mg/kg)MoO3費(fèi)氏平均粒度較大,經(jīng)過兩種不同工藝試驗(yàn)結(jié)果見圖2、圖3。

      典型關(guān)鍵幀的提取算法有:(1)基于鏡頭邊界的方法。(2)基于視覺內(nèi)容的方法。(3)基于鏡頭運(yùn)動(dòng)的方法。(4)基于運(yùn)動(dòng)分析的方法。(5)基于聚類的方法。這些方法各自有優(yōu)缺點(diǎn),根據(jù)不同的應(yīng)用環(huán)境和應(yīng)用要求,選擇合適的方法。

      近年來又提出了一些新的方法和改進(jìn)的方法,文獻(xiàn)[6]提出了一種類模糊C均值聚類的關(guān)鍵幀提取算法,用該算法提取的關(guān)鍵幀不僅可以充分表達(dá)出視頻的主要內(nèi)容,而且還可以根據(jù)內(nèi)容的變化提取出適當(dāng)數(shù)量的關(guān)鍵幀。缺陷是需要首先設(shè)定一個(gè)最初聚類中心。文獻(xiàn)[7]是對文獻(xiàn)[6]進(jìn)行的改進(jìn),提出一種基于無監(jiān)督聚類的自適應(yīng)閾值改進(jìn)算法。

      特征提取模塊。是對前一模塊的關(guān)鍵幀,提取視覺特征和非視覺特征。其中視覺特征主要包括顏色、紋理、形狀及運(yùn)動(dòng)等的低層視覺特征,以及提取場景、行為等高層語義特征。非視覺特征包括音頻特征、文本特征等?,F(xiàn)階段主要對視覺特征的研究居多,其中底層視覺特征分為全局特征和局部特征,常用的全局特征有顏色特征,紋理特征、形狀特征等。常用局部特征,例如SIFT特征,將圖像中關(guān)鍵點(diǎn)的局部表觀信息作為圖像的特征。全局特征和局部特征的結(jié)合,視覺特征和非視覺特征的結(jié)合,能有效提高視頻檢索的檢索效率和準(zhǔn)確率。

      圖1 視頻語義檢索模型

      2.2 底層特征向高層語義映射模塊

      底層特征空間包括視覺特征和非視覺特征,這些特征一般可以從視頻數(shù)據(jù)中直接提取。語義概念空間對應(yīng)于人們通常思維中的高級語義概念。從認(rèn)知層次角度進(jìn)行視頻語義劃分的語義概念,主要包括事件、場景/地點(diǎn)和對象3類。但底層特征對用戶不可見,只有將其映射到高層語義概念空間,才能使用戶識(shí)別,它們之間無法直接用數(shù)學(xué)模型完成映射轉(zhuǎn)換,這兩個(gè)空間之間存在著難以直接跨越的語義鴻溝,如何解決語義鴻溝是視頻語義檢索研究的重點(diǎn)。

      底層特征向高層語義映射模塊主要使映射變換模型的構(gòu)建,即語義概念分類模型的構(gòu)建。提取視頻語義的主要方法包括概率統(tǒng)計(jì)方法、統(tǒng)計(jì)學(xué)習(xí)方法、基于規(guī)則推理的方法、結(jié)合特定領(lǐng)域的等方法。

      (1)概率統(tǒng)計(jì)方法。將視頻語義對象提取看作是待提取視頻語義對象的分類問題,利用模式分類方法來嘗試跨越語義鴻溝。語義檢索的隨機(jī)方法關(guān)注的是模型概率特性,其核心思想是用隨機(jī)數(shù)學(xué)方法來描述對象的不同特征并存此基礎(chǔ)建立多媒體概念模式分類器。隨機(jī)模型中加入學(xué)習(xí)/識(shí)別模塊,主要是為了能反映媒體內(nèi)容本質(zhì)的非確定性[8]。

      (2)統(tǒng)計(jì)學(xué)習(xí)方法。支持向量機(jī)(Support Vector Machine,SVM)基于統(tǒng)計(jì)學(xué)習(xí)理論,建立在計(jì)算學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則之上。其目的是在高維空間中尋找一個(gè)超平面作為兩類的分割,以保證最小的分類錯(cuò)誤率。此類模型在只有小訓(xùn)練樣例集的情況下,分類效果較好。

      文獻(xiàn)[9]先提取訓(xùn)練圖像庫的底層特征信息,然后利用SVM對所提取的特征進(jìn)行訓(xùn)練,構(gòu)造多分類器。在此基礎(chǔ)上,利用分類器對測試圖像自動(dòng)分類,得到圖像屬于各個(gè)類別的概率。文獻(xiàn)[10]提出一種基于主動(dòng)學(xué)習(xí)SVM分類器的視頻分類算法。該算法分為兩個(gè)步驟:首先分析并提取與視頻類型有關(guān)的10維底層視覺特征;然后用SVM分類器建立這些底層特征與視頻類型之間的聯(lián)系。

      (3)基于規(guī)則推理的方法?;谝?guī)則推理的方法考慮直接從系統(tǒng)外給定分類標(biāo)準(zhǔn),因此語義概念的種類固定,難以滿意地描述視頻內(nèi)容中大量隨機(jī)出現(xiàn)的語義概念。文獻(xiàn)[11]通過分析足球視頻的語義結(jié)構(gòu),按照足球比賽轉(zhuǎn)播、視頻編輯的一般規(guī)律,結(jié)合視頻特征的時(shí)空關(guān)系,定義足球視頻主要的語義規(guī)則,從而提出了足球視頻語義事件的分析框架結(jié)合基于專業(yè)知識(shí)的規(guī)則推理,達(dá)到有效分析足球視頻語義的目的。

      (4)結(jié)合特定領(lǐng)域。通過限定、縮小視頻領(lǐng)域(Narrowing the Donmin)是目前跨越語義鴻溝的有效方法之一。限定特定的領(lǐng)域后,語義概念和事件的隨機(jī)性就被縮小了,簡化了底層和高層之間的語義映射關(guān)系。例如在影片語義分析領(lǐng)域,Rasheed等結(jié)合影片的特點(diǎn)只用4個(gè)視覺特征將電影分為悲劇、動(dòng)作、戲劇和恐怖片幾種類型,達(dá)到影片語義分類的目的[12]。

      完全手工標(biāo)注的不足之處在前面已經(jīng)提到過,基于機(jī)器學(xué)習(xí)的標(biāo)注方法采用統(tǒng)計(jì)學(xué)習(xí)領(lǐng)域的最新研究成果,為低層特征和高層語義特征之間建立了映射,基于機(jī)器學(xué)習(xí)的方法通過對手工標(biāo)注的訓(xùn)練視頻數(shù)據(jù)的學(xué)習(xí),建立各語義概念的模型,然后用該模型對未標(biāo)注的視頻數(shù)據(jù)集進(jìn)行分類,標(biāo)注對應(yīng)的語義概念[13]。文獻(xiàn)[14]利用機(jī)器學(xué)習(xí)對視頻的視頻類型層標(biāo)注,關(guān)鍵幀圖像層標(biāo)注和圖像中的物體層標(biāo)注4個(gè)層次進(jìn)行研究。

      2.3 視頻語義查詢模塊

      視頻語義查詢模塊使用戶通過查詢接口輸入相應(yīng)的查詢語義,系統(tǒng)應(yīng)能在視頻語義庫中進(jìn)行信息匹配,并將查詢結(jié)果返回用戶。用戶根據(jù)本次查詢結(jié)果與自己期望結(jié)果間的相關(guān)性,向系統(tǒng)提交相關(guān)反饋信息。相關(guān)反饋在信息檢索中是一種指導(dǎo)性學(xué)習(xí)技術(shù),用以提高系統(tǒng)的檢索能力。近幾年,人們對相關(guān)反饋有了很深的研究,許多新穎的算法被提出,主要有3類:第一類是以Rui為代表的權(quán)重調(diào)整算法[15];第二類是基于支持向量機(jī)的反饋方法[16],是在每次反饋過程中對用戶標(biāo)記的正例和反例樣本進(jìn)行學(xué)習(xí),建立SVM分類器作為模型,并根據(jù)該模型進(jìn)行檢索;第三類是基于Bayes準(zhǔn)則的相關(guān)反饋方法[17],其基本思想是根據(jù)用戶反饋的信息進(jìn)行統(tǒng)計(jì)判斷。

      2.4 語義詞典的應(yīng)用

      在視頻檢索系統(tǒng)中,利用文本標(biāo)注對圖像進(jìn)行檢索是比較常用的方法,但一般的系統(tǒng)都是先對標(biāo)注作簡單的文字匹配,然后提交相應(yīng)的結(jié)果。文本標(biāo)注和用戶輸入二者文字不同,而語義一致,這種方法就無法檢索到相應(yīng)的內(nèi)容,雖然有些系統(tǒng)能對這類同義詞作例外處理,但卻無法窮舉所有的情況,更無法對更高層次的語義作檢索。

      許多研究者把語義詞典引入到基于語義的視頻檢索中來[18],實(shí)現(xiàn)圖像語義關(guān)鍵詞的擴(kuò)充,提高了檢索的全面性。WordNet是一個(gè)英文詞匯的語義本體,它以認(rèn)知同義詞集合為單位來組織詞語的關(guān)系。其中詞語的關(guān)系包括上下位關(guān)系、整體部分關(guān)系、同義反義關(guān)系等。正是由于wordNet的這種構(gòu)建方式,越來越多的研究者將其引入到了信息檢索領(lǐng)域。文獻(xiàn)[19]描述了一個(gè)基于本體詞匯的三維模型語義檢索的方法,該方法首先對一個(gè)三維模型庫的詞匯進(jìn)行語義上擴(kuò)充,然后基于關(guān)鍵詞進(jìn)行檢索,而不是簡單的文字匹配。

      3 結(jié)束語

      介紹了語義視頻檢索技術(shù)的國內(nèi)外研究動(dòng)態(tài)及研究內(nèi)容和方法,總結(jié)和歸納了現(xiàn)有研究方法的不足。在特征提取方面,現(xiàn)階段的研究主要集中在視覺特征的提取,繼續(xù)提出一些新的特征是一個(gè)研究方向,同時(shí)將視覺特征和音頻、文本特征有效地結(jié)合是下一階段研究的重點(diǎn),這樣才能全面、準(zhǔn)確地表達(dá)視頻的內(nèi)容。如何有效選擇特征,及對特征的的融合,是研究的另一個(gè)重點(diǎn)方向。

      底層特征向高層語義映射模塊中視頻標(biāo)注和語義擴(kuò)展,這個(gè)問題一直是語義視頻檢索的瓶頸,有待進(jìn)一步的研究和深化。目前視頻檢索中用的語義概念還主要針對對象語義,對場景語義、行為語義和情感語義的研究還較少,這些語義的不斷豐富,有利于視頻內(nèi)容的語義細(xì)化描述,建立層次語義的檢索,進(jìn)而使得視頻檢索更接近和滿足實(shí)際應(yīng)用。

      [1]魏維,游靜,劉鳳玉,等.語義視頻檢索綜述[J].計(jì)算機(jī)科學(xué),2006,33(2):1 -8.

      [2]AMIR A,ARGILLANDER J O,BERG M,et al.IBM research TRECVID -2004 video retrieval system[C].MD,USA:NIST TRECVID 2004 Workshop,Gaithersburg,2004:15 -16.

      [3]張治國,劉懷亮,馬志輝,等.基于高層語義的視頻檢索研究[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(18):168 -180.

      [4]印勇,侯海珍.基于直方圖幀差的自適應(yīng)鏡頭分割算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(9):186 -189.

      [5]李向偉,李戰(zhàn)明,張明新,等.一種新的基于RS理論的壓縮域鏡頭分割算法[J].計(jì)算機(jī)應(yīng)用研究,2009,26(4):1588-1590.

      [6]張亞迪,李俊山,胡雙演.類模糊 C均值聚類的關(guān)鍵幀提取算法[J].微電子學(xué)與計(jì)算機(jī),2009,26(2):89 -92.

      [7]李全棟,陳樹越,張微.一種改進(jìn)的無監(jiān)督聚類的關(guān)鍵幀提取算法[J].應(yīng)用光學(xué)2010,31(5):741 -744.

      [8]韓智廣,吳玲達(dá),謝毓湘,等.基于貝葉斯網(wǎng)絡(luò)的視頻靜態(tài)語義探測新方法[J].武漢理工大學(xué)學(xué)報(bào),2009,31(18):179-181.

      [9]廖綺綺,李翠華.基于支持向量機(jī)語義分類的兩種圖像檢索方法[J].廈門大學(xué)學(xué)報(bào):自然科版,2010,49(4):487 -494.

      [10]袁勛,吳秀清,洪日昌,等.基于主動(dòng)學(xué)習(xí)SVM分類器的視頻分類[J].中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2009,39(2):473 -478.

      [11]彭利民,周毅.基于規(guī)則推理的足球視頻語義事件分析研究[J].廣州體育學(xué)院學(xué)報(bào),2008,28(2):91 -94.

      [12]RASHEED Z,SHEIKH Y,SLLAH M.The use of comdutable features for film classification [J].IEEE Transactions on Circuits and Systems for Video Technology,2005,15(1):52 -64.

      [13]賀莉娜.視頻語義特征提取的研究[D].北京:北京交通大學(xué),2008.

      [14]袁勛.層次化視頻語義標(biāo)注與檢索[D].安徽:中國科學(xué)技術(shù)大學(xué),2008.

      [15]RUI Yong,HUANG T.Optimizing learning in image retrieval[J].Proceedings of Cornputer Vision and Pattern Recognition,2000,1(13 -15):236 -243.

      [16]HONG Pengyu,QI Tian,HUANG T.Incorporate support vector machines to content-based image retrieval with relevant feedbank[EB/OL].(2000 -03 -10)[2004 -11 -14]http:/www.ifp.uiuc.edu.

      [17]施智平,李清勇,史俊,等.集成視覺特征和語義信息的相關(guān)反饋方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2007,19(9):1138-1142.

      [18]SARA M,MOHAMMADREZA E,LILLY S A.Developing context model supporting spatial relations for semantic video retrieval[C].International Conference on Information Retrieval and Knowledge Management:Exploring the Invisible World,CAMP'10,2010:40 -43.

      [19]阮佳彬,楊育彬,林金杰,等.基于本體詞匯的三維模型語義檢索[J].計(jì)算機(jī)科學(xué),2009,36(2):152 -154.

      A Survey on Semantic-based Video Retrieval Key Techniques

      KONG Yinghui,LIU Shurong,ZHANG Shaoming,F(xiàn)AN Qiyue
      (School of Electrical and Electronic Engineering,North China Electric Power University,Baoding 071003,China)

      With the emergence of much video,video content retrieval becomes an active research direction in the multimedia applications.Most of the existing video retrieval technologies are based on low-level features.These features are quite different from the semantic concepts.It seriously influences the practicality of the video content retrieval system.The gap between low-level features and high semantics is difficult to narrow,so how to extract semantic concepts in the human thought from video is becoming a most challenging research of the video content retrieval.This paper introduces the background of semantic video retrieval and the latest and dynamic research at home and abroad,analyzes the advantages and disadvantages of the existing methods and summarizes the existing key technologies.

      semantic gas;semantic video retrieval;low-level features;high-level semantic concept

      TP391.3

      A

      1007-7820(2012)08-150-04

      2012-03-05

      孔英會(huì)(1964—),女,教授。研究方向:視頻檢索,圖像檢索。劉淑榮(1985—),女,碩士研究生。研究方向:視頻分析與視頻檢索。

      猜你喜歡
      關(guān)鍵幀檢索語義
      語言與語義
      2019年第4-6期便捷檢索目錄
      基于改進(jìn)關(guān)鍵幀選擇的RGB-D SLAM算法
      “上”與“下”語義的不對稱性及其認(rèn)知闡釋
      基于相關(guān)系數(shù)的道路監(jiān)控視頻關(guān)鍵幀提取算法
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      基于聚散熵及運(yùn)動(dòng)目標(biāo)檢測的監(jiān)控視頻關(guān)鍵幀提取
      認(rèn)知范疇模糊與語義模糊
      論“關(guān)鍵幀”在動(dòng)畫制作中的作用
      語義分析與漢俄副名組合
      江城| 包头市| 桃园市| 潜江市| 玉溪市| 三原县| 浦县| 英山县| 西昌市| 大同县| 饶阳县| 长泰县| 莒南县| 庐江县| 吉安县| 班戈县| 宜兰市| 剑河县| 凤山市| 临猗县| 和政县| 封丘县| 平顶山市| 武隆县| 丹阳市| 宁国市| 青阳县| 平邑县| 蚌埠市| 历史| 余江县| 康定县| 苍南县| 琼海市| 虎林市| 汨罗市| 德令哈市| 准格尔旗| 丰顺县| 阿勒泰市| 成安县|