摘 要:視音頻資料是數(shù)字圖書館館藏文獻的重要組成部分,由于視音頻資料數(shù)據(jù)量大、關系復雜,如何科學、有效地進行視音頻編目是高校數(shù)字圖書館正在探討研究的重要問題。本文通過對高校數(shù)字圖書館視音頻編目技術的分析,并對計算機視音頻編目技術進行研究,結(jié)合高校視音頻編目技術的應用現(xiàn)狀,并提出了行之有效的視音頻編目方案,以期為高校數(shù)字圖書館的視音頻編目提供參考。
關鍵詞:數(shù)字圖書館;視音頻編目技術;高校
數(shù)字圖書館是一個國家信息基礎設施的核心,主要提供信息庫和資源庫。數(shù)字圖書館是運行在互聯(lián)網(wǎng)上超大規(guī)模的、便于使用的、沒有時空限制的知識中心。中國對數(shù)字圖書館工程的規(guī)劃目標也是如此,現(xiàn)代高新技術所支持的數(shù)字信息資源系統(tǒng)將成為下一代互聯(lián)網(wǎng)網(wǎng)上信息資源的管理模式,可從根本上改變目前網(wǎng)上信息分散、不便使用的現(xiàn)狀。數(shù)字圖書館的規(guī)劃要點主要有數(shù)字化資源(多媒體)、網(wǎng)絡化分布化的體系結(jié)構(gòu)、統(tǒng)一的透明的用戶接口、全球化(非單一實體)、元數(shù)據(jù)與對象管理和新的服務體系與模式等。許多中國知名的高校都建立了自己的數(shù)字圖書館,并且擁有自建視音頻數(shù)據(jù)庫,甚至還有部分高校已經(jīng)引進媒體資產(chǎn)管理系統(tǒng),實現(xiàn)了學校原有的珍貴資料數(shù)字化存儲和教學應用。
1 視音頻編目要求
采用元數(shù)據(jù)編目是數(shù)字圖書館對信息資源進行有序化組織的主要手段。目前主要的元數(shù)據(jù)標準有描述網(wǎng)絡資源的DC、描述視覺資料的VRA、多媒體內(nèi)容描述接口MPEG-7、機讀編目格式標準MARC、國內(nèi)行業(yè)標準《廣播電視音像資料編目規(guī)范》、《CELTS-42基礎教育教學資源元數(shù)據(jù)規(guī)范》與《全國文化信息資源共享工程視頻資源編目規(guī)范》等。
《廣播電視音像資料編目規(guī)范》規(guī)定編目元數(shù)據(jù)體系總體上分為四個層次,即節(jié)目層、片段層、場景層、鏡頭層,每個層次包含相應的著錄項目,其中節(jié)目層有15大類100個著錄項目,片斷層有14大類52個著錄項目。由于教學資源在高校數(shù)字圖書館的媒體資產(chǎn)中占有很大比例,圖書館設定編目核心元數(shù)據(jù)時,在基于《廣播電視音像資料編目規(guī)范》的基礎上,可以結(jié)合參考《全國文化信息資源共享工程視頻資源編目規(guī)范》和教育部發(fā)布的《基礎教育教學資源元數(shù)據(jù)規(guī)范》。高校數(shù)字圖書館可以根據(jù)實際需求選擇合適的編目元數(shù)據(jù)及著錄項目,例如可以設定節(jié)目層編目著錄項目為39個,其中10個標有*的為必須著錄項目,具體如下:
(1)題名項:*正題名、并列正題名、副題名、系列(系列題名、分集總數(shù)、分集次)
(2)主題項:*廣電分類、*學科分類、*關鍵詞、主題詞
(3)描述項:*內(nèi)容描述、主題人物、獲獎描述、欄目描述、適用對象
(4)責任者項:*責任者名稱、責任方式、其他信息
(5)出版者項:出版者描述、出品者描述
(6)版權(quán)項:版權(quán)所有者名稱
(7)語種項:*聲道語種、字幕語種
(8)日期項:制作完成日期、出版日期
(9)類型項:*節(jié)目類型、節(jié)目形態(tài)
(10)格式項:*實長、色彩、聲道格式、壓縮率、文件格式、制式
(11)標識符項:國際標準音像制品編碼、庫房編號
(12)覆蓋范圍項:時間段描述、空間范圍
(13)來源項:*資料獲取方式、資料提供者
2 高校圖書館視音頻編目技術
圖1編目流程
高校數(shù)字圖書館編目系統(tǒng)必須具有一定的靈活性和開放性,可以設計為最多4層的分層編目方式,以適應今后業(yè)務需求的發(fā)展與變動,同時選擇XML(Extensible Markup Language)文檔作為存儲和交換元數(shù)據(jù)的文件格式,實現(xiàn)不同系統(tǒng)間的數(shù)據(jù)交換及資源共享。在對視音頻資料進行流程化、層次化編目時,必須從節(jié)目層開始著錄,其他三層可以根據(jù)需求靈活選擇。以浙江傳媒學院自主研發(fā)的媒體資產(chǎn)管理系統(tǒng)為例,編目系統(tǒng)首先接收視音頻數(shù)據(jù)和初始編目數(shù)據(jù)(如視音頻資料的實長、聲道格式、壓縮率等),編目人員分析接收到的相關數(shù)據(jù)并進行級別審定,決定其編目標引深度;其次調(diào)用相關的編目模板并進入精編目環(huán)節(jié),參考《廣播電視資料分類法》(GY/Z 199-2004),對各個著錄項進行規(guī)范著錄并對己經(jīng)完成的內(nèi)容簽章確認;最后由審編人員嚴格審核已提交的編目數(shù)據(jù),不合格的編目數(shù)據(jù)打回相應環(huán)節(jié)修改,合格的最終編目數(shù)據(jù)寫入數(shù)據(jù)庫供用戶檢索使用。編目系統(tǒng)的編目流程如圖1:
高校數(shù)字圖書館在進行編目時應該充分考慮視音頻資料的節(jié)目類型、內(nèi)容價值和實際使用情況來確定編目深度,例如:教學片、影視劇、動畫片、紀錄片、綜藝節(jié)目以及高校組織的各類比賽(如歌詠比賽、體育賽事等)能直接用于播出或使用,編目層次一般設定為一層(節(jié)目層),節(jié)目層著錄標引要揭示節(jié)目的主題內(nèi)容、背景信息、形式特征,同時提煉具有利用與檢索價值的信息。對于某些高校圖書館,特別是藝術類高校圖書館,可以根據(jù)利用價值、經(jīng)典片段和節(jié)目表演為主體對整場劇本、綜藝節(jié)目等視音頻資料進行切分,編目層次可以設定為二層,即節(jié)目層、片段層;高校擁有許多具有重要典藏價值的資料,例如記錄本校發(fā)展歷史或重大事件的視音頻資料,在編目時可以根據(jù)節(jié)目內(nèi)容深入到場景層或鏡頭層。
由于視音頻資料不同層次的內(nèi)容在編目中需要的專業(yè)技能差別很大,高校圖書館可以根據(jù)自己的業(yè)務能力配備不同職能的編目人員,例如畫面分析員、普通編目員、高級編目員、編目審編員。畫面分析員主要負責將待編目資料的重點片段層、場景層、鏡頭層標識出來,以便確定編目深度及提供相應編目環(huán)節(jié)使用;普通編目員主要完成一些較為簡單的元數(shù)據(jù)項的數(shù)據(jù)錄入,例如題名、責任者、日期等元數(shù)據(jù)項;高級編目員主要完成已建編目條目的信息完善著錄工作,工作重點是內(nèi)容介紹、主題詞、關鍵詞、分類等需要一定專業(yè)知識和分析歸納能力的著錄項目;編目審編員及時對已完成編目數(shù)據(jù)進行審核。通過采用流水線方式對視音頻資料進行流程化、層次化編目,有利于實現(xiàn)數(shù)據(jù)質(zhì)量的控制和管理。
3 計算機輔助視頻編目技術
基于內(nèi)容的視頻編目技術就是有效地組織和管理視頻數(shù)據(jù),視頻編目技術的基礎是視頻結(jié)構(gòu)化處理。視頻結(jié)構(gòu)化是對視頻流中的連續(xù)幀序列進行切分,原始視頻流從上往下可分為視頻、故事單元、場景、鏡頭和圖像幀,其中能夠描述鏡頭序列主要內(nèi)容的圖像幀就是關鍵幀。對于高校數(shù)字圖書館編目系統(tǒng)而言,由于大量的工作在于人工錄入,編目效率和質(zhì)量難以保證,因此引入計算機自動輔助編目技術是一個很好的解決方案。計算機輔助視頻編目技術主要有鏡頭邊界檢測和關鍵幀提取。
3.1 鏡頭邊界檢測
鏡頭邊界的變換方式有突變(Abrupt Change)和漸變(Gradual Change)兩種形式。鏡頭的突變就是攝像機的停機或者鏡頭的切換;漸變是通過一些編輯手段使兩個鏡頭的銜接過渡得更為平緩,比如淡入、淡出、溶解、掃換等。目前主要的鏡頭邊界檢測方法有:模板匹配法、直方圖比較法、似然比較法、基于邊緣的方法、基于DCT系數(shù)和DC系數(shù)的方法等。
浙江傳媒學院MAM研發(fā)組提出了一種基于混合投影函數(shù)的快速鏡頭切換檢測方法。通過對幀間距離度量和鏡頭邊界處幀間差變化特征等方面的深入研究,并對積分投影函數(shù)和方差投影函數(shù)進行適當?shù)奶幚?,研發(fā)組提出了一種改進的混合投影函數(shù),利用該混合投影函數(shù)在兩個正交方向上計算視頻幀的差分和積分投影來定義特征向量V,取視頻幀間差FFD(Frame-to-Frame Difference)的向量長度為幀間距離,從而利用幀間距離與自適應閾值T(i)的比較來檢測鏡頭切換,實驗結(jié)果證明了該方法的有效性。
3.2 關鍵幀提取
關鍵幀的有效性取決于如何從視頻序列中選取它們,關鍵幀提取方法主要有5種:(1)基于鏡頭的方法,即選取鏡頭的首幀、中間幀或末幀作為關鍵幀,該方法適用于內(nèi)容活動性小的鏡頭。(2)基于相鄰幀間距離的方法,若相鄰幀的距離大于某個預先設置的閾值,則認為產(chǎn)生新的關鍵幀,該方法計算量較小。(3)基于內(nèi)容分析的方法,即通過分析視頻內(nèi)容(顏色直方圖、運動信息)隨時間的變化情況來選擇所需關鍵幀的數(shù)目。該方法所提取關鍵幀之間的顏色差別較大,但是無法量化地表示運動信息的變化。(4)基于聚類的方法,該方法從一個初始化的聚類出發(fā),將樣本集中的每個元素分配給某個聚類,然后將各類中離聚類中心最近的幀作為關鍵幀。該方法效果較好,但是計算量較大。(5)基于運動分析的方法,該方法借助光流分析技術計算每幀光流,取局部最小值所對應的幀為關鍵幀。該方法較好地反映了獲取鏡頭的主要內(nèi)容,但是計算量較大并且局部最小值也不一定準確。
視音頻資料是數(shù)字圖書館館藏文獻的重要組成部分,由于視音頻資料數(shù)據(jù)量大、關系復雜,如何科學、有效地進行視音頻編目是高校數(shù)字圖書館正在探討研究的重要問題。高校數(shù)字圖書館可以綜合參考《廣播電視音像資料編目規(guī)范》、《CELTS-42基礎教育教學資源元數(shù)據(jù)規(guī)范》等標準選擇合適的元數(shù)據(jù)元素并且制定相應的著錄規(guī)則,采用流程化、層次化編目技術進行四個層次的流程化編目(以節(jié)目層、片段層為主),同時引入計算機輔助視頻編目技術實現(xiàn)鏡頭分割、關鍵幀提取,從而提高視音頻資料編目、檢索和利用效率。
參考文獻
[1]朱渝,孫曉.高校圖書館視頻點播服務實證研究[J].圖書館工作與研究,2009(3):39-41
[2]嚴明,蘇新寧.數(shù)字視頻信息的元數(shù)據(jù)研究[J].情報學報,2009(5):605-609
[3]GY/T202.1-2004,廣播電視音像資料編目規(guī)范[S].北京:國家廣播電影電視總局,2009.
[4]孫利濤,楊雷.視頻鏡頭分割技術綜述[J].山東輕工業(yè)學院學報(自然科學版)[J].2007(1):36-39
作者簡介
菅紅(1963-),女,漢,內(nèi)蒙陜壩人,本科,館員,主要從事采編工作。