劉可盈 高琦琛 袁禾 王嘉敏 裴聽(tīng)雨
摘? ?要:近年來(lái),古裝劇在傳統(tǒng)文化傳播中扮演著重要角色,如何檢測(cè)其是否符合時(shí)代背景、將與歷史朝代不符的錯(cuò)誤作出標(biāo)記,成為研究的重要課題。文章基于圖像識(shí)別技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了“影視劇圖像幀檢測(cè)系統(tǒng)”,運(yùn)用深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)手段,按多層次設(shè)計(jì)出人工神經(jīng)網(wǎng)絡(luò),對(duì)目標(biāo)進(jìn)行特征點(diǎn)提取和識(shí)別檢測(cè),有效地找出影視劇中不符合歷史場(chǎng)景的因素,極大地加深用戶的觀影體驗(yàn),在一定程度上提高了圖像識(shí)別的準(zhǔn)確性和影視的收視率。
關(guān)鍵詞:圖像識(shí)別;深度學(xué)習(xí);影視圖幀;檢測(cè)系統(tǒng)
隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),網(wǎng)絡(luò)視頻流量日新月異地增長(zhǎng),用戶大都喜歡觀看具有時(shí)代特征的電影或電視劇,其中,古裝劇偏多。由于古裝劇所演繹的內(nèi)容年代久遠(yuǎn),演員的衣著搭配、影視中的場(chǎng)景有時(shí)會(huì)不符合當(dāng)時(shí)的背景,造成極大的失誤。因此,為提高用戶的觀影感受,減輕影視劇制作人的負(fù)擔(dān),保證每一部電影或電視劇中涉及的人物及場(chǎng)景符合當(dāng)時(shí)的背景顯得尤為重要。本文提出的“影視劇圖像幀檢測(cè)系統(tǒng)”,通過(guò)開發(fā)一款可靠、有效、新穎的圖像檢測(cè)APP,來(lái)檢測(cè)影視劇中不符合歷史場(chǎng)景的因素,大大地減少導(dǎo)演和制片人的工作任務(wù),解決了目前影視劇及生活中服裝及場(chǎng)景存在的一些問(wèn)題。
1? ? 研究現(xiàn)狀
近年來(lái),圖像識(shí)別借助深度學(xué)習(xí)技術(shù)得到了較大的發(fā)展,被廣泛應(yīng)用到國(guó)內(nèi)外各個(gè)領(lǐng)域中。有學(xué)者將圖像識(shí)別技術(shù)運(yùn)用到影視劇圖像幀的檢測(cè)中,李宗民[1]針對(duì)現(xiàn)有的檢索場(chǎng)景和服裝框架問(wèn)題,即因服裝款式識(shí)別優(yōu)化存在服裝信息丟失和場(chǎng)景款式識(shí)別的問(wèn)題,提出了一種新的服裝分割方法和基于跨域字典學(xué)習(xí)的服裝款式識(shí)別。吳銳航[2]提出一種基于尺度不變特征變換(Scale-Invariant Feature Transform,SIFT)特征的新的圖像信息檢索算法,應(yīng)用到基于內(nèi)容的圖像信息檢索中,并且改進(jìn)傳統(tǒng)的圖像相似度的方法,對(duì)圖像的內(nèi)容進(jìn)行準(zhǔn)確、快速地掃描。Kiapour[3]提出了使用經(jīng)典的Imagenet作為提取服裝及場(chǎng)景特征的深度網(wǎng)絡(luò),對(duì)專門的數(shù)據(jù)進(jìn)行多次針對(duì)性的訓(xùn)練,使得網(wǎng)絡(luò)特征更具顯著。圖像識(shí)別技術(shù)越來(lái)越多地滲透到日常生活中,為了提高收視率以及使古裝劇的各個(gè)場(chǎng)景更加準(zhǔn)確,圖像識(shí)別技術(shù)為影視劇中場(chǎng)景是否符合歷史背景提供了新的思路。
2? ? 研究?jī)?nèi)容
2.1? 研究目標(biāo)
本項(xiàng)目旨在利用圖像處理和識(shí)別技術(shù),研發(fā)一種可識(shí)別出演員的穿著搭配以及拍攝場(chǎng)景是否符合拍攝需要的軟件。運(yùn)用深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)技術(shù),在基于圖像識(shí)別技術(shù)上,按多層次設(shè)計(jì)出人工神經(jīng)網(wǎng)絡(luò),對(duì)目標(biāo)進(jìn)行特征點(diǎn)提取分析和識(shí)別檢測(cè),有效地找出影視劇中不符合歷史場(chǎng)景的因素。
2.2? 研究方法
基于特征點(diǎn)的圖像匹配[4],通過(guò)鎖定某一幀的圖像,調(diào)取數(shù)據(jù)庫(kù)中和該圖像類似的衣服或場(chǎng)景有關(guān)元素的圖片,進(jìn)行邊緣提取兩幅圖片的特征點(diǎn),并在相應(yīng)特征點(diǎn)附近區(qū)域進(jìn)行像素灰度相關(guān)性的計(jì)算,通過(guò)相關(guān)系數(shù)來(lái)判斷兩幅圖像是否為同一時(shí)期的場(chǎng)景?;谔卣鼽c(diǎn)的圖像匹配流程如圖1所示。
3? ? 功能實(shí)現(xiàn)
首先,用戶向APP中傳入圖像;其次,系統(tǒng)利用深度學(xué)習(xí),提取圖像中的人物配飾服裝的特征點(diǎn),在預(yù)先處理過(guò)的數(shù)據(jù)庫(kù)中進(jìn)行遍歷搜索和分析;最后,返回與輸入圖像特征匹配度最高的圖像,同時(shí),鑒定原有圖像中服飾及場(chǎng)景等因素是否準(zhǔn)確,給出判斷結(jié)果。系統(tǒng)模塊介紹如下。
3.1? 交互模塊
通過(guò)APP與用戶進(jìn)行交互。用戶上傳圖片后,APP有兩個(gè)功能選擇:(1)歷史分析,檢測(cè)到圖片上的東西(比如衣服)的背景。(2)歷史鑒定,檢測(cè)上傳的圖片中人物或場(chǎng)景是否符合當(dāng)時(shí)的歷史背景。
3.2? 展示模塊
搭建關(guān)于此系統(tǒng)的官方網(wǎng)站,全方位、立體化地向廣大用戶展示推廣本產(chǎn)品,擴(kuò)大影響力。同時(shí),提供配套APP下載與升級(jí)服務(wù)、接受用戶的反饋意見(jiàn)、不斷完善系統(tǒng)、提供更高質(zhì)量的服務(wù)。
3.3? APP頁(yè)面展示
登錄頁(yè)面如圖2所示,歷史鑒定如圖3所示,歷史分析如圖4所示,“我的頁(yè)面”如圖5所示。
4? ? 結(jié)語(yǔ)
本系統(tǒng)利用深度學(xué)習(xí)中的圖像識(shí)別技術(shù),實(shí)現(xiàn)了一種可識(shí)別出演員穿著搭配以及拍攝場(chǎng)景是否符合拍攝需要的APP,通過(guò)對(duì)特征點(diǎn)的圖像進(jìn)行匹配,鑒別出影視劇中不符合時(shí)代背景的畫面,能夠有效保證影視劇的畫面質(zhì)量,對(duì)于影視劇制作人的工作效率和影片的精準(zhǔn)度的提高具有重大的意義。
[參考文獻(xiàn)]
[1]李宗民,李妍特,劉玉杰,等.結(jié)合層次分割和跨域字典學(xué)習(xí)的服裝檢索[J].中國(guó)圖像圖形學(xué)報(bào),2017(3):358-365.
[2]吳銳航.基于SIFT特征的圖像檢索技術(shù)研究[D].廈門:廈門大學(xué),2007.
[3]KIAPOUR M H,HAN X,LAZEBNIK S,et al.Where to buy it:matching street clothing photos in online shops[C].Beijing:IEEE International Conference on Computer Vision,2015.
[4]張瑞倩.基于特征點(diǎn)圖像匹配的面部識(shí)別方法[J].科技風(fēng),2014(7):122-123.