王靖 毛莉花
[摘要]為解決精品課程教學錄像標準的應用問題,文章分析了當今主流視頻編碼標準以及應用實例,并據(jù)此總結(jié)出視頻應用的特點與規(guī)律。在此基礎上,闡述對于新技術環(huán)境下教學視頻應用標準架構(gòu)基本原則,即多種編碼方式共存、優(yōu)選通用編碼方式、兼顧互操作性并考慮應用的可持續(xù)性。提出了基于應用域與應用階段的教學視頻實用標準(參考)方案。并就該方案應用于教學實踐中的成功經(jīng)驗和面臨的具體問題進行了討論。
[關鍵詞]視頻教學資源;實用標準;視頻壓縮編碼;GOP結(jié)構(gòu)
[中圖分類號]G40-057 [文獻標識碼]A [論文編號]1009-8097(2012)10-0040-05
一、引言
在實際應用中,我們注意到“國家精品課程教學錄像上網(wǎng)技術標準(2010)”在關于“視頻素材采集的技術標準”和“視頻上網(wǎng)發(fā)布標準”所規(guī)定的內(nèi)容中存在一些不明確之處。例如,標準中僅僅規(guī)定了視頻文件的格式,而未明確相應的具體編碼標準,因而在實際應用中會出現(xiàn)視頻壓縮標準和質(zhì)量效果的不確定性。隨著視頻公開課在國內(nèi)掀起的熱潮,教育部近期啟動了高校視頻公開課的建設,使得上述問題再一次凸顯。我們知道,擴展名相同的視頻(在分辨率、碼率相同的條件下)由于壓縮方式的不同在圖像質(zhì)量和播放環(huán)境上會表現(xiàn)出相當大的差異,這勢必會給教學視頻的質(zhì)量控制和應用效果帶來問題。為此,我們嘗試著對現(xiàn)有教學錄像標準進行細化和補充,以使之更具有可操作性,并形成了能應用于教學實踐的“教學視頻實用標準(參考)”。
二、視頻應用標準改進的依據(jù)
1.對主流視頻編碼標準的解讀
面對眾多的視頻編碼標準如何選擇,一直以來是視頻應用的一個重要問題。我們認為,首先要看視頻編碼的壓縮效率,特別是編碼能否提供質(zhì)量與所用軟硬件資源之間的最佳平衡,其次要看該視頻格式的通用程度,即是否具有良好的互操作性,此外還需要了解主流視頻編碼標準及其應用情況。
(1)視步頁編碼向高效壓縮和多領域應用發(fā)展
第一代視頻編碼標準中的MPEG-2,因設計了2維的類(Profile)和級(Level)的分層編碼結(jié)構(gòu),加上GOP可由不同類型幀(I、P、B)靈活搭配的構(gòu)成機制,能夠適應多種解析度、不同應用階段以及多種碼率下的視頻編碼,獲得了廣泛的應用。MPEG-4作為第二代編碼標準,壓縮效率有所提高,但囚主要針對低碼率視頻編碼故僅在一定范圍內(nèi)得到應用。屬于第三代視頻編碼的MPEG-4 AVC/H.264、VC-1和AVS標準由于綜合運用了多種視頻編碼的最新技術,壓縮效率比MPEG-2編碼提高了1~2倍,還能夠同時滿足高分辨率圖像和低碼率環(huán)境應用的需求,已成為高清和IP視頻應用的主流格式。
(2)第三代視頻編碼標準的應用特點
①H.264編碼的應用
H.264編碼性能十分優(yōu)越。這一方面得益于H.264設有4:2:2 Intra Profile類,可被用于高清視頻素材和制作業(yè)務的編碼;另一方面H.264具有較強的抗誤碼、抗丟包能力,在復雜多變的網(wǎng)絡環(huán)境和移動應用領域能夠以較低的碼率傳送基于1P網(wǎng)絡協(xié)議的視頻流,因此被廣泛應用于IPTV的業(yè)務。
H.264的廣泛應用已經(jīng)從一個側(cè)面證明其是一個優(yōu)秀的壓縮編碼算法,但是H.264也面臨一個不容忽視的問題,即其卓越性能是以增加編解碼的復雜度為代價的,需要增加專用的編解碼硬件或者是占用大量的CPU資源進行編解碼運算。不過隨著硬件技術的發(fā)展特別是顯卡GPU功能的增強,H.264編解碼困難的問題將有所緩解。
②VC-1和AVS的應用
VC-1和AVS這兩個標準目前都不支持4:2:2取樣和全I幀方式的編碼,因此不適合用于高質(zhì)量視頻素材的記錄和編輯。VC一1和AVS標準都采用了相對簡化的設計理念,用降低技術復雜度方式來提高自身編解碼的易實現(xiàn)度,非常適合于視頻節(jié)目的播放和網(wǎng)絡發(fā)布的應用。
(3)封裝格式與壓縮格式的關系
視頻壓縮格式是針對視頻實體的編碼方式,是決定視頻壓縮質(zhì)量的主要因素:而視頻封裝格式是用于視頻文件交換和播放識別的封裝容器。同一種封裝格式可以支持多種壓縮編碼格式,如同為AVI擴展名的視頻文件,其壓縮編碼可以是DV格式,也可以是MP4或H.264格式。因此不能僅僅根據(jù)文件的擴展名來決定視頻應用。
2.主流視頻應用實例的參考
按照應用域與應用階段相結(jié)合的方法進行劃分,當今視頻主流應用實例見表2,其中不同應用的編碼方式和參數(shù)配置為教學視頻應用的細化提供了參考。
3.數(shù)字視頻應用的特點與規(guī)律
(1)視頻壓縮與透明碼率
視頻壓縮雖屬有損壓縮,但只要將壓縮視頻的碼率保持在“透明質(zhì)量”要求的最低碼率之上,就能獲得近似“透明”的壓縮效果;從素材制作到節(jié)目發(fā)布,隨著對圖像質(zhì)量冗余度要求的依次降低視頻壓縮的最低碼率可以相應地減少。這種適度壓縮保證了質(zhì)量與資源的雙重優(yōu)化,視頻素材和節(jié)目編碼應遵守最低透明碼率原則。在網(wǎng)絡視頻應用中為了適應信道帶寬,需要進一步壓低視頻編碼碼率時,可采用縮小圖幅或降低幀頻率的方法予以適配,不過應通過主觀評價試驗來確定圖像質(zhì)量的下限。
(2)不同階段質(zhì)量冗余要求與編碼參數(shù)配置
數(shù)字視頻工作流程包括素材采集、后期制作和節(jié)目發(fā)布等階段。不同階段對圖像質(zhì)量冗余和壓縮編碼結(jié)構(gòu)有著不同的要求,應充分運用視頻編碼在取樣方式、幀類型(I、P、B)和圖像組(GOP)結(jié)構(gòu)上具有的多重選擇性,有針對性地優(yōu)化編碼參數(shù)配置,以獲得最佳的壓縮效果。
①視頻素材編碼
由于要用于后期編輯處理,因此素材編碼要求具有幀精度的編輯能力和經(jīng)受多次編解碼處理的質(zhì)量冗余。前者意味著編碼的GOP結(jié)構(gòu)宜短不宜長,采用全I幀方式要優(yōu)于IBP長GOP方式;后者表明在4:2:2取樣要優(yōu)于4:2:0或4:1:1方式。在分辨率一定時,為滿足這2個條件就必須保持相對較高的記錄碼率,為此IMX、DvcPr050等廣播級標清素材記錄格式都選擇了4:2:2取樣加全I幀的編碼結(jié)構(gòu)和50Mb/s的高碼率記錄。
②節(jié)目存檔與發(fā)布編碼
用于節(jié)目發(fā)布或存檔的視頻文件,處于應用鏈的末端,因而可以降低對質(zhì)量冗余的要求,編碼重點在于去除不必要的質(zhì)量冗余,充分提高資源利用率。因此標清電視的DVB標準和DVD格式都選擇了4:2:0取樣加IBBP長GOP結(jié)構(gòu)的編碼組合,并將記錄碼率減低到6-9Mb/s。
(3)網(wǎng)絡環(huán)境低碼率應用特點
網(wǎng)絡視頻在擁有自主交互應用優(yōu)勢的同時,卻不得不對圖像進行深度壓縮以適應網(wǎng)絡帶寬的限制。與廣播電視編碼側(cè)重信源編碼(注重圖像質(zhì)量的可接受性)的要求不同,網(wǎng)絡視頻編碼則更具有信道編碼的屬性,即更多地考慮信道帶寬和傳輸后的最終效果。在H.264標準中就設有CABAC和CAVLCL兩種熵編碼方式,前者運用復雜的編碼技術,適用于追求高質(zhì)量高碼率壓縮的場合;后者則采用簡化的編碼方式,更適用于網(wǎng)絡和移動傳輸環(huán)境下使用。
三、教學視頻實用標準(參考)的構(gòu)架
1.關于系統(tǒng)架構(gòu)的思考
(1)基本原則
實用標準應能適應數(shù)字視頻分級分層應用的需求;應符合應用域通用圖像的標準;應能體現(xiàn)不同應用階段視頻編碼的特點。由于沒有一種視頻格式能夠滿足所有的應用,多種編碼格式共存將不可避免,為此在保證主要應用的編碼質(zhì)量和效率時,還需兼顧不同應用間的互操作性。
(2)系統(tǒng)架構(gòu)與標準應用的流程
首先根據(jù)應用目標進行分級分層,并以該應用域中壓縮質(zhì)量高,資源占用少且通用性好的標準格式作為編碼格式。其次以應用域通用圖像格式標準確定圖像分辨率、掃描方式(隔行或逐行)和幀頻率等基本參數(shù)。接下來按照應用階段訴求重點確定編碼參數(shù)配置方案。最后根據(jù)前述兩項工作的組合定位從既定的編碼格式標準中找出與之相對應的壓縮碼率。
(3)可持續(xù)性應用的考慮
視頻教學資源的建設是一個長期積累的過程,在這樣的一個過程中,技術的更新?lián)Q代是一個不可避免的現(xiàn)實問題。就目前而言,用第三代壓縮技術取代曾經(jīng)居于主導地位的MPGE-2編碼,以獲得更高的圖像質(zhì)量和資源利用效率,已是不可逆轉(zhuǎn)的趨勢。但顯然此過程并非一蹴而就的,因此比較可行的做法是先從高清視頻素材的積累和新技術應用環(huán)境的引入著手,做好下一步全面應用的資源和技術儲備,同時有計劃地將現(xiàn)有視頻資源按新標準進行轉(zhuǎn)換,以實現(xiàn)教學視頻資源的可持續(xù)性應用。
2.教學視頻實用標準(參考)的內(nèi)容
(1)教學視頻的圖像標準與壓縮編碼標準
教學視頻須按照應用目的進行分級分類,圖像的主要參數(shù)應符合應用域通用圖像的標準,詳見表3。
如前所述,視頻編碼應選用應用域中的主流視頻編碼格式,對于高清電視應用,首選H.264格式與WMV9格式。標清電視應用,MPEG-2、DV傳統(tǒng)格式與H.264和WMV9格式共用。網(wǎng)絡多媒體應用,在PC環(huán)境下應采用微軟VC-1標準的WMV9格式。
(2)視頻素材編碼與存檔標準
視頻素材編碼的目的在于提供符合應用域標準的高畫質(zhì)編輯素材,其要求是易于編輯并留有多代編解碼的質(zhì)量冗余。因而在編碼方式上采用4:2:2取樣與短GOP結(jié)構(gòu)的編碼組合,存檔碼率不低于主流應用格式素材存檔的最低透明碼率。
這里需要強調(diào)的是,在素材編碼與存檔時,應注意:1)標準選項與該應用域標準圖像質(zhì)量相對應,是標準應用時的首選方案;可用選項是在資源條件受限時,降低標準應用時的備選方案;2)素材的使用,應堅持不可逆的下變換原則,即高分辨率素材可用于低分辨率標準的視頻制作:而低分辨率素材不得用于高分辨率標準應用的視頻制作,必須使用時應作特別說明;3)用于網(wǎng)絡直播(無需后期處理)的視頻可按照網(wǎng)絡視頻節(jié)目發(fā)布的標準直接對素材源進行壓縮編碼和傳送。
(3)教學視頻節(jié)目發(fā)布與存檔編碼標準
與素材不同,視頻節(jié)目編碼旨在提供符合視頻發(fā)布規(guī)范的視頻文件,其要求是去除質(zhì)量冗余,充分提高壓縮效率。因而在編碼方式上采用4:2:0取樣與IBBPl5幀(PAL)長GOP結(jié)構(gòu)的編碼組合,存檔視頻碼率應不低于主流應用標準節(jié)目存檔的最低碼率。
壓縮碼率的上限值與該應用域標準圖像質(zhì)量相對應,這是標準應用時的首選方案;下限值是在資源條件受限時,降低標準應用時的備選方案。
(4)網(wǎng)絡發(fā)布的視頻節(jié)目編碼標準
網(wǎng)絡視頻編碼的目的是在網(wǎng)絡環(huán)境中提供聲畫同步良好,收視效果流暢的網(wǎng)絡視頻節(jié)目。根據(jù)應用環(huán)境的特點選擇適合于系統(tǒng)平臺和信道帶寬的編碼方式和壓縮碼流。
壓縮碼率的上限值與該應用域標準準圖像質(zhì)量相對應,是標準應用時的首選方案;下限值是在資源條件受限時,放低標準應用時的備選方案。
四、教學視頻實用標準(參考)在我校的應用實踐
1.規(guī)范視頻應用操作提高視頻資源質(zhì)量
按照上述實用標準的具體要求,在素材采集、節(jié)目存檔和網(wǎng)絡發(fā)布等應用環(huán)節(jié)中,抓住視頻編碼格式(針對具體的應用域)和最低透明碼率(與分辨率、編碼參數(shù)配置相掛鉤)這兩大關鍵因素,推行規(guī)范化操作。從而避免了之前普遍存在的隨意性和盲目性,有效地提高了視頻資源的質(zhì)量和應用效率。具體做法是:
(1)統(tǒng)一素材拍攝標準,把好視頻源頭質(zhì)量
高質(zhì)量、標準化的素材是視頻節(jié)目的源頭,其質(zhì)量高低直接影響最終節(jié)目的效果。建議標清素材記錄仍使用DVCPro 50M或25M格式,以發(fā)揮現(xiàn)有設備的余力。高清素材記錄選用H.264編碼標準。高層次應用為AVC/H.264 Intra100M格式,低層次應用為AVCI-ID格式記錄。
(2)統(tǒng)一視頻節(jié)目發(fā)布和存檔標準
為了提高視頻教學節(jié)目的利用率,建議高清節(jié)目存檔,采用H.264或WMV9格式編碼,大容量高密度Blu-ray Disc光盤存儲,記錄文件為藍光DVD編著文件或H.264和VC-l的數(shù)據(jù)文件;標清節(jié)目存檔,MPEG-2、H.264或WMV格式共用,以傳統(tǒng)容量DVD光盤存檔:網(wǎng)絡應用節(jié)目發(fā)布,采用WMV和FLV格式,發(fā)布碼率控制要求適配應用網(wǎng)絡的帶寬條件同時主觀評價可接受。
2.應用中的問題與解決辦法
(1)高碼率素材的保存問題
AVC/H.264格式的素材采用P2卡記錄,記錄材料成本極高,需要要及時轉(zhuǎn)錄到其他介質(zhì)上保存。即使采用大容量藍色光盤記錄也難以將碼率高達100Mb/s的素材全部保留,應篩選精簡后再以源碼數(shù)據(jù)進行存檔。
(2)H.264格式素材的后期編輯問題
H.264視頻編解碼的復雜程度分別是MPEG-2的10倍和3倍,因此對H.264素材的編輯具有一定難度。目前Avid等主流非編平臺都已支持H.264格式素材的編輯與合成。主要采取的方式有三種,一是AVC Intra源碼的直接編輯。全I幀的幀內(nèi)壓縮結(jié)構(gòu)本身就易于實現(xiàn)源封裝數(shù)據(jù)的直接剪輯,同時AVC Intra采用了幀內(nèi)分片編碼的技術,能夠更好地支持多核CPU的并行處理運算,加快軟件編輯的處理速度,但只適用于對素材的簡單編輯。二是變換為中間編輯格式進行編輯。先將不同格式的素材統(tǒng)一變換成制作平臺支持的中間編輯格式,再進行多層特效的合成制作是一種有效的混編制作方法。中間編輯格式都具有高質(zhì)量、高效率的壓縮特性,如Avid平臺的DNxHD格式和Fin Cut平臺的ProRes422 HD格式和Eduis平臺的H0格式等。三是AVCHD格式長GOP素材的編輯。由于采用了長GOP的幀間編碼,AVC HD格式在獲得更高壓縮比的同時,也因數(shù)據(jù)的幀間依存關系而增加了后期處理的復雜程度。好在低成本的H.264編解碼硬件已開始投放市場,通過其中的硬件加速引擎實時完成H.264視頻的編輯和生成,輸出H.264文件的GOP結(jié)構(gòu)可選,支持多種分辨率標準,壓縮碼率可從100Kb/s到50Mb/s不等。這使得對AVC IID格式的實時編輯不再困難。
(3)原有視頻資源的轉(zhuǎn)換與利用
視頻教學資源在學校領域的應用具有較長的歷史積累。各學校都有大量多年積累下來的視頻資料,這些資料既是寶貴的資源,但同時由于其格式紛雜,我們必須采取合適的策略加以利用。在實踐中,運用視頻轉(zhuǎn)換軟件將其中有價值的部分轉(zhuǎn)換成格式相對統(tǒng)一,壓縮效率更高的視頻格式進行存檔。經(jīng)過大量的測試,我們建議使用下述三種轉(zhuǎn)換工具。一是Adobe Media Encoder CS4,作為ADOBE公司出品的壓縮編碼工具,其可輸出多種碼率、多種分辨率的H.264和WMV9文件。二是TMPGEnc 4.0 XPress,該編碼工具一向以高質(zhì)量著稱,可輸出H.264(僅BP和MP類)和WMV9(MP和Advanced P類)文件。三是JetAudio\Convert Video,其優(yōu)勢是可將含有字幕語言可選功能的MKV文件轉(zhuǎn)換成H.264和WMV9文件。
為保證轉(zhuǎn)換質(zhì)量,應對源文件進行分級分類,并以實用標準中相應類別要求的碼率值轉(zhuǎn)換輸出;保持原有圖像的分辨率、圖幅比例和像素高寬比是避免不必要的轉(zhuǎn)碼劣化,保證圖像質(zhì)量傳承的有效方法。
五、結(jié)束語
在數(shù)字化教學資源建設中,視頻資源既是重要的一環(huán),同時也是相對薄弱的一環(huán),其部分原因來自多媒體網(wǎng)絡環(huán)境下視頻應用多樣化所帶來的復雜性。視頻應用多樣化符合教育技術實踐的要求,但也正是由于多樣化應用帶來的復雜性使數(shù)字視頻資源建設規(guī)范的建立被有意無意的回避。教學視頻應用規(guī)范的缺失勢必導致視頻質(zhì)量缺乏保證,進而影響視頻其教學應用的有效性。建設數(shù)字教學視頻應用規(guī)范是一項系統(tǒng)工程,需要教育技術同行的共同努力。本文中的實用標準(參考)只是我們的初步探索和一孔之見。在此拋磚引玉,意在引起大家的關注,促進共同交流。
作者簡介:王靖,蘇州科技學院傳媒科學與技術系講師,研究方向為信息化教學設計與數(shù)字媒體。
收稿日期:2012年6月19日
編輯:李婷