周楓 薛熒熒 李千目
摘要:近年來,微電子器件、DSP技術、計算機、通信網等相關技術的不斷進步,大量頻繁的視頻信息的交流和存貯帶來許多新的問題,數據通信,特別是數字視頻技術進入新的發(fā)展階段。本文對現代數字視頻若干關鍵基礎技術及發(fā)展進行綜述。論文首先指出,符合國際標準的視頻編碼及相關技術仍是研究熱點;其次,數字視頻的多樣化獲取方式、視頻格式的相互兼容和轉換以及計算機動畫也極具發(fā)現前景;此外,數字視頻非話業(yè)務的信息傳遞和交流日益成為通信的主要內容。
關鍵詞:數字視頻;視頻編碼;非話業(yè)務
中圖分類號:TN941.1 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2015.04.020
0.引言
目前,計算機的應用逐漸進入多媒體時代,信息載體擴展到文、圖、聲等多種類型,數字視頻技術得到了發(fā)展。在數字視頻技術的發(fā)展初期,數字視頻的數據量非常大,存儲、傳輸和處理都有很大的困難。這使得視頻數據壓縮的研究成為必要。近年來,一些國際組織相繼制定了關于視頻圖像的編碼標準,壓縮編碼技術日臻成熟。其次,計算機處理速度和存儲容量針對視頻數據而言還遠遠不能滿足要求,因此視頻數據的處理成了多媒體技術中的關鍵性技術,眾多視頻存儲格式應運而生。另外,計算機動畫的發(fā)展也將數字視頻技術引入了新的發(fā)展階段。
本文將對以上所述的視頻技術的發(fā)展與應用進行介紹和分析。
1.視頻的壓縮編碼
視頻信號信息量非常大,傳輸網路帶寬要求高,在這種情況下對存儲、傳輸和處理都有很大困難。所以需要將視頻信號在傳送前先進行壓縮編碼,以便節(jié)省傳送帶寬和存儲空間。視頻信號壓縮編碼有兩個基本的要求:(1)必須壓縮在一定的帶寬內,即,具有足夠的壓縮比;(2)視頻信號在壓縮之后,經解壓重建應保持一定的視頻質量。此外,視頻編碼器的設計應力求簡單、易實現、成本低、可靠性高。
1.1視頻數據壓縮的技術可能性
一幅圖像是由許多像素點構成的。大量的統(tǒng)計表明,同一幅圖像的像素之間具有較強的相關性,兩個像素之間的距離越短,其相關性越強,通俗地講,兩個像素的值越接近。換言之,兩個相鄰像素的值發(fā)生突變的概率極小,相等、相似或緩變的概率極大,這使得視頻信息的每個畫面內部有許多信息冗余。并且,我們還可以利用幀間相關性進行壓縮編碼,由于鄰近幀之間的相關性一般比幀內像素間的相關性更強,可以得到更大的壓縮比。人眼的視覺靈敏度有限,可以允許畫面有一定失真,一些冗余信息的失去對觀看視頻沒有太大影響。
1.2壓縮編碼
1.1.1有損與無損
無損壓縮是指壓縮前和解壓縮后的數據完全一致。多數的無損壓縮都采用RLE行程編碼算法。
有損壓縮意味著解壓縮后的數據與壓縮前的數據不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復。幾乎所有高壓縮的算法都采用有損壓縮,這樣才能達到低數據率的目標。丟失的數據率與壓縮比有關,壓縮比越小,丟失的數據越多,解壓縮后的效果一般越差。此外,有些有損壓縮算法采用多次重復壓縮的方式,這樣還會引起額外的數據丟失。
1.2.2幀內與幀間
幀內壓縮也稱為空間壓縮。當壓縮一幀圖像時,僅考慮本幀的數據而不考慮相鄰幀之間的冗余信息。幀內一般采用有損壓縮算法,由于幀內壓縮時各個幀之間沒有相互關系,所以壓縮后的視頻數據仍可以以幀為單位進行編輯。幀內壓縮一般達不到很高的壓縮。
幀間壓縮是基于連續(xù)前后兩幀具有很大的相關性,或者說前后兩幀信息變化很小的特點。也即,連續(xù)的視頻其相鄰幀之間具有冗余信息,根據這一特性,壓縮相鄰幀之間的冗余量就可以進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮,它通過比較時間軸上不同幀之間的數據進行壓縮。幀間壓縮一般是無損的。幀差值算法就是一種典型的時間壓縮法,它通過比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少數據量。
1.2.3對稱性
對稱性是壓縮編碼的一個關鍵特征。對稱意味著壓縮和解壓縮占用相同的計算處理能力和時間,對稱算法適合于實時壓縮和傳送視頻,比如視頻會議應用就適合采用對稱的壓縮編碼算法。
在電子出版和其它多媒體應用中,一般是把視頻預先壓縮處理好,再播放,因此可以采用不對稱編碼。不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視頻的時間比回放(解壓縮)該視頻的時間要多得多。例如,壓縮一段三分鐘的視頻片斷可能需要10多分鐘的時間,而該片斷實時回放時間只有三分鐘。
1.3國際數字視頻標準分析
近年來,視頻圖像編碼技術得到了迅速發(fā)展和廣泛利用,日臻成熟。一些國際組織也相繼制定了關于視頻圖像的編碼標準。例如ITU-T制定的H.26X系列標準、ISO/IEC制定的關于靜態(tài)圖像的編碼標準JPEG和JPEG2000以及活動圖像的編碼標準MPEG系列等。這些標準圖像的編碼算法融合了各種性能優(yōu)良的圖像編碼方法,代表了目前圖像編碼的發(fā)展水平。如表1所示,H.261、MPEG-1、和MPEG-2采用了第一代壓縮編碼方法,如:預測編碼、變換編碼、熵編碼以及運動補償。從MPEG-4標準以后,采用的是第二代視頻編碼方法,如分段編碼、基于模型的編碼和基于對象的編碼等。
其中,隨著多媒體應用領域的不斷擴展,傳統(tǒng)JPEG壓縮技術已無法滿足人們對多媒體影像資料的要求。JPEG中采用的算法靠丟棄頻率信息實現壓縮,因而圖像壓縮率越高,頻率信息丟棄的越多。在極端情況下,JPEG圖像只保留了反映圖像的基本信息,精細的圖像細節(jié)都損失了。為此,JPEG制定了新一代靜止圖像壓縮標準JPEG2000。JPEG2000放棄了JPEG所采用的以離散余弦變換(DCT)為主的區(qū)塊編碼方式,而采用以小波變換為主的多解析編碼方式,很好地保存了圖像信息中的相關性,達到了更好的壓縮編碼效果。JPEG具有高壓縮率且提供無損和有損兩種壓縮方式的特點,但應用并不廣泛,在圖像品質要求比較高的醫(yī)學圖像的分析和處理中已經有了一定程度的應用。endprint
H.26X是ITU-T及其前身CCITT研究和制定的一系列視頻編碼的國際標準。其中,應用最廣泛的是H.261、H.263、H.264。H.261是世界上第一個得到廣泛承認、針對動態(tài)圖像的視頻壓縮標準,而且其后出現的MPEG系列、H.263等視頻壓縮標準都是以H.261為核心。H.263在H.261基礎上增加了一些功能,從而進一步改善了圖像質量,提高了壓縮比。后來出現的H.26L的編碼效率比已有的其他視頻編碼標準有很大的提高。在相同PSNR下與H.263和MPEG4相比,H.263在低碼率時的輸出碼率平均節(jié)省分別約為40%和36%,在高碼率時的輸出碼率平均節(jié)省分別約為55%和45%,具有較高壓縮比,尤其適用于公眾交換電話網及無線/Internet網絡環(huán)境下的視頻傳輸。H.264是比MPEG和H.263性能更好的視頻壓縮編碼標準,不僅具有高壓縮比,而且在惡劣的網絡傳輸條件下,具有較高的抗誤碼性能,但是性能提高的同時,也增加了計算的復雜度。
MPEG-X是一組由IEC和ISO制定發(fā)布的視頻、音頻、數據的壓縮標準,已成為國際上影響最大的多媒體技術標準。MPEG-1最初用于數字信息存儲體上活動圖像及其伴音的編碼,其速率為15Mb/s。MPEG-X是一組由IEC和ISO制定發(fā)布的視頻、音頻、數據的壓縮標準,已成為國際上影響最大的多媒體技術標準。MPEG-1最初用于數字信息存儲體上活動圖像及其伴音的編碼,其速率為15Mb/s。MPEG-2是一個通用多媒體編碼標準,具有更廣闊應用范圍和更高的編碼質量。由于性能出色,已能適應HDTV,使得MPEG-3被拋棄。它的另一特點是可提供一個范圍較廣的可變壓縮比,能夠適應不同的畫面質量、存儲容量以及帶寬的要求。MPEG-4持多種多媒體應用,特別是多媒體信息基于內容的檢索和訪問,可根據應用的不同要求現場配置解碼器。編碼系統(tǒng)也是開放的,可以隨時加入新的有效的算法模塊:它可以將各種多媒體技術充分利用進來,包括壓縮本身的一些工具、算法,也包括圖像合成、語音合成等技術。MPEG-4標準既可用于的高碼率的視頻壓縮編碼,又可用于低碼率的視頻壓縮編碼;既可用于傳統(tǒng)的矩形幀圖像,又可用于任意形狀的視頻對象壓縮編碼。
此外,近年來,本領域另一個研究熱點是聲像數據的基于內容的檢索。實現這種基于內容檢索的一個關鍵步驟是要定義一種描述聲像信息內容的格式,而這與聲像信息的編碼又是密切相關的,MPFG-7就是這種壓縮編碼的代表性技術,其名稱叫做“多媒體內容描述接口”,它為各種類型的多媒體信息規(guī)定一種標準化的描述,這種描述與多媒體信息的內容本身一起,支持用戶對其感興趣的各種“資料”進行快速、有效地檢索。
盡管MPEG取得了種種成功,但在人們的信息交流中尚存有眾多的不便之處,如不同網絡之間的障礙、知識產權得不到有效保護等;不同的多媒體信息、網絡、設備、協(xié)議和標準、分布在不同的地點等都給用戶造成不能以統(tǒng)一的方式進行多媒體信息交互。如何通過一個綜合標準來對上述不便之處加以協(xié)調,使多媒體業(yè)務暢通無阻,這就是MPEG墨爾本會議提出的多媒體框架的概念,此即MPEG-21。MPEG-21標準的正式名稱為“多媒體框架”或者“數字視聽框架”,它致力于為多媒體傳輸和使用定義一個標準化的、可互操作的和高度自動化的開放框架,這個框架考慮到了DRM(Digital Rights Management,數字版權管理)的要求、對象化的多媒體接入以及使用不同的網絡和終端進行傳輸等問題,這種框架會在一種互操作的模式下為用戶提供更豐富的信息。MPEG-21的最終目標是要為多媒體信息的用戶提供透明而有效的電子交易和使用環(huán)境。任何與MPEG-21多媒體框架標準環(huán)境交互或使用MPEG-21數字項實體的個人或團體都可以被視為用戶。從純技術角度來看,MPEG-21對于“內容供應商”和“消費者”沒有任何區(qū)別。
MPEG-21標準是新一代多媒體內容描述標準,它吸收新技術,同時消除多媒體系統(tǒng)框架中的缺陷,使得由于不同的設備、體系結構和標準造成隔閡被逐步消除。對于用戶而言,新的多媒體系統(tǒng)是一個與設備無關的、互動性強大的、高度智能化的、符合用戶各種不同需要的體系。
1.4我國視頻壓縮編碼的發(fā)展現狀
AVS標準是具有我國自主知識產權的編碼標準,是一套包含系統(tǒng)、視頻、音頻、媒體版權管理在內的完整標準體系。其編碼效率比MPEG-2高2~3倍,與H,264相當,但其算法復雜度比H.264低30%,達到了新一代編碼標準的最高水平,主要面向高清晰度電視廣播和數字存儲媒體。
2013年6月,AVS視頻編碼標準已經成為了IEEE標準,標準號為IEEE 1857。AVS標準的逐步完善與發(fā)展應用,成為了標志著我國在視頻壓縮編碼領域從跟蹤國際到自主創(chuàng)新再到國際推廣的里程碑。
1.5未來發(fā)展趨勢
目前,在視頻行業(yè)廣泛采用的壓縮和傳輸標準是2003年推出的H.264,在視頻編碼標準朝著高清晰度、低碼率的方向發(fā)展進程中,H.264占據著統(tǒng)帥的地位,但是,在未來的五到十年內,H.265將會掀起引領超高清時代的潮流。H.265于2013年1月25日獲得了國際電聯(lián)的批準,H.265不僅在碼流、算法、編碼質量上進行了改善及優(yōu)化,而且同時支持4K(4096×2160)和8K(8192×4320)超高清視頻。H265標準下的畫面效果更流暢、更高清,勢必會對整個視頻行業(yè)在互聯(lián)網應用中以及視頻壓縮編碼技術上引起一場巨大的變革。
2.視頻文件格式
2.1多媒體視頻文件格式
目前視頻的數據在計算機內部的存儲格式眾多,其壓縮比、質量和適用領域等各不相同,下面就此對其常用格式及發(fā)展進行介紹和分析。
2.1.1QuickTime(MOV)格式
MOV格式的英文全稱是Movie Digital Video Technology。MOV格式能夠跨平臺、存儲空間要求小,得到了業(yè)界的廣泛認可。QuickTime文件格式支持25位彩色,支持領先的集成壓縮技術,提供150多種視頻效果,并提供200多種MIDI兼容音響和設備的聲音裝置。該格式具有較高的壓縮比率和較完美的視頻清晰度,最大的特點是跨平臺性,目前已成為數字媒體軟件技術領域的事實上的工業(yè)標準。endprint
2.1.2AVI格式
AVI的英文全稱是Audio Video Interleaved,叫做音頻視頻交錯,是由微軟公司開發(fā)的一種數字視頻文件格式。AVI是Windows操作系統(tǒng)上最基本的、最常用的一種媒體文件格式,支持256色和RLE壓縮,但壓縮標準不統(tǒng)一,不具有兼容性,體積龐大,用不同壓縮算法生成的AVI文件,必須使用相對應的解壓縮算法才能播放。它最大的優(yōu)點是調用方便、圖像質量好;還可以根據不同的應用要求,隨意調整AVI的分辨率,而且對計算機的配置要求不高,可以先做成AVI格式的視頻,在轉換為其他格式。
2.1.3MPEG-2(DVD)
PAL制式的標準MPEG-2分辨率高達720X576。MPEG-2在編碼時使用了幀間壓縮和幀內壓縮兩種方式,并且通過運動補償等技術來改善畫質。從清晰度來看,MPEG-2幾乎是無可挑剔的,但是MPEG-2也并非十全十美。由于MPEG-2沒能在壓縮技術上有所突破,因此其數據量比MPEG-1大。此外,MPEG-2的壓縮數據的碼流比較特殊,各種編輯軟件無法隨機訪問,因此在進行非線性編輯時會導致素材搜索很遲緩。更為重要的是,MPEG-2過大的編解碼必須依賴強大的處理芯片。
2.1.4DivX和XviD格式
MPEG在開始的時候建立了4個版本:MPEG-1-MPEG-4,分別適應于不同的帶寬和數字影像質量的要求。DivX和XviD就是一種MPEG-4編碼格式,只不過舊版的MPEG-4編碼不允許在AVI文件格式上使用,才會有DivX和XviD編碼格式的出現。不過現在國內外稱呼的DivX和XviD是MPEG/MP3影片,即影像部分以MPEG-4格式壓縮,Audio部分以MP3格式壓縮組合而成的AVI影片。它的好處是生成的文件體積小,約為同樣播放時間的DVD的1/5到1/10,但是聲音及影像的品質都相當不錯,當然比DVD還是差一點,但比起VCD要好很多,也就是說,DivX和XviD只要一張光盤就可以放下一個90分鐘的電影,而且清晰度要比兩張光盤的VCD好許多。在視頻采集時,DivX和XviD編碼對于系統(tǒng)性能的要求并不高,數據量的降低可以明顯減輕CPU與磁盤系統(tǒng)的負擔。
2.1.5 RM(Real Media)格式
Real Media是Real Networks公司所制定的音頻視頻壓縮規(guī)范,包含RealAudio(.ra,聲音文件)、RealVideo(.rm,視頻文件)和Real Flash(.ram,矢量動畫)三類文件。Real Media可以根據網絡數據傳輸速率的不同制定不同的壓縮比,實現在低速率的廣域網上進行彩像數據的實時傳送和實時播放。
2.1.6FLV格式
FLV全稱為Flash video,是在Sorenson公司的壓縮算法的基礎上開發(fā)出來的。FLV格式不僅可以輕松地導入Flash中,速度極快,并且能起到保護版權的作用。由于它形成的文件極小、加載速度極快,使得網絡觀看視頻文件成為可能,它的出現有效地解決了視頻文件導入flash后,使導出的SWF文件體積龐大,不能在網絡上很好地使用等缺點,是目前增長最快、最為廣泛的視頻傳播格式。目前各在線視頻網站均采用此視頻格式。
2.2媒體格式的發(fā)展分析
影響多媒體文件格式發(fā)展的因素有很多,歸納起來主要有應用和技術兩個方面??偟膩碇v,一種格式有存在的必要,必須有一定的應用范圍,而壓縮、解壓縮等技術的發(fā)展必將促使新格式的產生。
影像視頻的發(fā)展必將淘汰傳統(tǒng)的影響視頻格式。隨著視頻壓縮技術和視頻編輯處理技術的不斷創(chuàng)新和改進,傳統(tǒng)的影像視頻(如AVI和MPEG-1格式等)一般體積較大且清晰度較差,因此這些格式必將被體積小數倍,而且具有超高清晰度的新視頻格式所代替。另外,隨著移動通信的不斷發(fā)展,市場需求和技術進步共同推動移動視頻業(yè)務發(fā)展的同時,必將極大地推動視頻技術的發(fā)展,對于視頻文件格式的發(fā)展產生巨大影響。
隨著多媒體技術的迅速發(fā)展、各種壓縮算法在該領域的應用,對目前存在的各種文件格式很難準確評價孰優(yōu)孰劣,從壓縮率、質量而言,每一種格式都有其優(yōu)缺點,而且都被大批軟件所支持,占有一定的應用領域。因此,在一定時期內,多種文件格式共存的局面不會改變,但隨著時間的推移,應用的發(fā)展和技術的革新,將不斷涌現新的、先進的格式,淘汰落后的格式。
3.計算機動畫
3.1計算機動畫的原理與分類
計算機動畫是采用連續(xù)播放靜止圖像的方法產生物體運動的效果,利用計算機生成一系列可供實時演播的畫面的技術。它可輔助傳統(tǒng)卡通動畫片的制作,也可通過對三維空間中虛擬攝象機、光源及物體運動和變化(形狀、色彩等)的描述,逼真地模擬客觀世界中真實的或虛構的三維場景隨時間而演變的過程。所生成的一系列畫面可在顯示屏上動態(tài)演示,也可將它們記錄在電影膠片上或轉換成視頻信息輸出到錄像帶上。計算機動畫由于采用數字處理方式,動畫的運動效果、
畫面色調、紋理、光影效果等可以不斷改變,輸出方式也多種多樣。計算機動畫分為四類。
實時動畫:采用各種算法來實現運動物體的運動控制或指可直接在顯示屏幕上實時顯示動畫圖像。
逐幀動畫:記錄下每一幀畫面,然后按顯示動畫的圖象序列一幀一幀播放而實現運動的效果。
三維動畫:畫中的景物有正面、側面和反面,調整三維空間的視點,能夠看到不同的內容。
二維動畫:平面上的畫面,由紙張、照片或計算機屏幕顯示。
在屏幕上實現動畫有三種方式:(1)位置不動形態(tài)變化。(2)形態(tài)不變位置變化。(3)位置和形態(tài)均變化。
計算機動畫的主要研究內容包括:①動畫形體造型技術;②動畫運動控制和描述;③動畫圖象繪制技術和算法;④動態(tài)模擬、動畫系統(tǒng)的集成環(huán)境;⑤關節(jié)體、人體動畫;⑥動畫語言與系統(tǒng);⑦用于動畫運動控制和生成的專門硬件設備及接口;⑧特殊視覺效果生成技術。endprint
3.2計算機動畫技術
計算機動畫的研究始于20世紀60年代初。1963年美國AT&TBell實驗室制作了第一部計算機動畫片。在80年代之前,計算機動畫主要集中于二維動畫系統(tǒng)的研制,應用于教學演示和輔助傳統(tǒng)的動畫片制作。
三維動畫的研究始于70年代初,當時開發(fā)了一些三維計算機動畫系統(tǒng)。直至80年代中后期,由于具有實時處理能力的超級圖形工作站的出現,三維幾何造型技術和真實感圖形生成技術取得很大進展,促進了具有高度逼真效果的三維計算機動畫技術迅速發(fā)展,并達到實用商品化地步。到90年代初,計算機動畫技術應用于電影特技取得了顯著成就。
與此同時,為適應科學研究與復雜系統(tǒng)中的動態(tài)模擬、視覺模擬、機器人學和生物力學等領域的需求,基于物理的造型和動畫的研究的開展,已成為計算機動畫研究中的一個重要課題。
人體動畫是近年來發(fā)展起來的計算機動畫新課題。它是研究開發(fā)基于人造角色的集成動畫系統(tǒng),該系統(tǒng)產生涉及人造角色在三維場景中具有人的自覺意識的行為動畫,這樣的系統(tǒng)是以多種學科的知識、技術和方法為基礎的,如動畫、力學、機器人學、生物學、心理學和人工智能等?,F在的Poser就是著名的MetaCreations公司生產的具有特色的人體建模三維動畫制作軟件。
目前,主流的計算機動畫技術包括:
(1)參數關鍵幀技術:關鍵幀技術最初僅僅用來插值幀與幀之間卡通畫的形狀,后來該技術馬上發(fā)展成為可以用來插值影響運動的任何參數(例如,一個物體的平移、比例變換、旋轉、材料、紋理、形狀、可見性參數等都可作為關鍵幀參數,另外,攝象機和燈光的大部分參數也可作為關鍵幀參數)。
(2)軌跡驅動技術:指先設計好物體的運動軌跡,然后指定物體沿該軌跡運動。通常,物體的運動軌跡為三次樣條曲線(也稱為樣條驅動),并且由用戶交互給出。
(3)變形動畫技術:為了制作一種形態(tài)變形的動畫,即將物體外觀上發(fā)生變化的過程記錄下來,生成一個形態(tài)連續(xù)變化的動畫序列。
(4)關節(jié)動畫技術:它的主要目的是模擬骨架動物(尤其是人體)的運動。
(5)過程動畫技術:指物體的運動或變形可由一個過程來描述。最簡單的過程動畫是用一個數學模型去控制物體的幾何形狀和運動,較復雜的過程動畫則是包括物體的變形、彈性理論、動力學、碰撞檢測在內的物體的復雜運動。
(6)基于物理的動畫技術:一種具有潛在優(yōu)勢的三維造型和運動模擬技術。盡管該技術比傳統(tǒng)動畫技術的計算復雜度要高得多,但它能逼真地模擬各種自然物理現象,這是基于幾何的傳統(tǒng)動畫生成技術所無法比擬的。
3.3計算機動畫的未來發(fā)展趨勢
從國際上看,計算機動畫技術的發(fā)展正在趨向于規(guī)?;?、標準化、網絡化。
從技術的發(fā)展方向看,體視動畫會是未來的熱點。目前人們正在研究降低立體眼鏡的成本、提高圖像質量的方法和有關的替代技術,未來我們很可能不用立體眼鏡的幫助也能欣賞逼真的立體效果。另一個熱點會是虛擬現實(vR)技術,與一般的動畫相比,VR的特點在于實時、交互。VR中的場景會隨參觀者的位置、視點變化而實時動態(tài)生成,并具有人機交互的能力,這種技術在未來將大有可為。
今后的幾年,還可以繼續(xù)從以下幾個方面研究和發(fā)展:
1、新造型技術的設計。盡管造型技術在CAD和CAGD中得到了廣泛的研究,但計算機動畫對傳統(tǒng)的實體、曲面造型提出了一些新的要求。這導致許多針對動畫應用而設計的造型技術。
1)Catmull-Clark細分曲面的造型和動畫研究。由Catmull和Clark提出的根據任意拓撲控制網格生成B樣條曲面的細分曲面方法近幾年來在計算機動畫中越來越受到人們的重視。在AliasIWavefront公司的動畫軟件Maya中,基于Catmull-Clark細分曲面的造型和動畫已經成為其重要手段。
2)隱式曲面的造型和動畫研究。隱式曲面是圓球的更一般形式,它在表現人體的肌肉、水滴、云、樹等物體的造型和動畫方面有很大的優(yōu)勢。該研究方向近年來逐漸為人們研究的熱點,歐洲圖形學學會專門設立了相應的Implicit Surface學術會議。
2、運動捕獲動畫數據的處理。運動捕獲技術在電影《泰坦尼克》中取得了非常大的成功,該片中乘客從船上落入水中的許多驚險鏡頭都是由動畫特技來完成的。實際上,運動捕獲已成為現代高科技電影不可缺少的工具。怎樣把運動捕獲動畫數據重用和重置目標值得進一步的研究。
3、三維Morphing和變形研究。二維圖象的Morphing雖然已經比較成熟,但三維Morphing方法尚存在各種各樣的缺陷,具有任意拓撲的兩三維物體之間的Morphing技術還有待于進一步的發(fā)展?;诩s束的變形也是值得研究的方向。
4.數字視頻的其他技術
4.1數字電視技術
數字電視是數字技術的產物,它將電視信號進行數字化,然后以數字形式進行編輯、制作、傳輸、接收和播放。
數字電視除了具有頻道利用率高、圖像清晰度好等特點之外,它還可以開展交互式數據業(yè)務,包括電視購物、電視銀行、電視商務、電視通信、電視游戲、實時點播電視、電視網上游覽、觀眾參與的電視競賽等。
目前,數字電視已成功地應用于衛(wèi)星直播,有線電視也在向數字方式過渡。整個電視傳播業(yè)已進人了從模擬式向數字式過渡的時代。整個數字電視系統(tǒng)由信源編碼、業(yè)務復用和信道傳輸與發(fā)送三個部分構成。美國的DTV、歐洲的DVB和日本的ISDB這幾種標準,信源編碼中視頻都采用MPEG-2標準,音頻采用MPEG-2或Dolby AC-3;業(yè)務復用采用的都是MPEG-2系統(tǒng)層規(guī)范或其擴展形式,它們的主要差別在于信道及發(fā)送部分。
數字電視的傳輸途徑是多種多樣的,因特網性能的不斷提高也將使其成為數字電視傳播的一種新媒介。圖1是數字電視傳播系統(tǒng)的示意圖。數字電視接收機(簡稱DTV接收機)大體有三種形式:一種是傳統(tǒng)模擬電視接收機的換代產品——數字電視接收機,另一種是傳統(tǒng)模擬電視機外加一個數字機頂盒,第三種是可以接收數字電視的PC機。endprint
4.2點播電視(VOD)技術
VOD(Video On Demand)是視頻點播(也稱為點播電視)技術的簡稱,意即用戶可以根據自己的需要收看電視節(jié)目。VOD技術從根本上改變了用戶過去被動收看電視的不足。
視頻點播系統(tǒng)可分為TVOD(True VOD)和NVOD(Near VOD)兩種。在TVOD(真視頻點播)環(huán)境下,用戶提出要求后即可及時從VOD系統(tǒng)得到服務,這種系統(tǒng)為每一個用戶提供一個單獨的連接,每個連接需要占用一定的網絡帶寬;NVOD(準視頻點播)是視頻點播的另一種實現方案。采用這種方案,系統(tǒng)可每隔一段時間(例如10分鐘)在不同的頻道上開始播放同一個節(jié)目,用戶可以選擇收看。如果用戶需要“倒退”功能,可以切換到比他當前頻道晚10分鐘播放的頻道,需要“快進”功能,可切換到比當前頻道早10分鐘的頻道。顯然,這種方式不能為用戶及時提供點播服務功能,但減少了用戶連接數目,節(jié)省了網絡帶寬與費用,服務器的性能要求也可適當降低。
視頻點播是基于數字網絡的一種數字視頻服務。網絡中的音頻視頻數據必須以實時數據流的形式進行傳輸,傳輸一旦開始,就必須以穩(wěn)定的速率進行,以保證節(jié)目平滑地播放。任何由于網絡擁塞,CPU爭用或磁盤的I/O瓶頸產生的系統(tǒng)或網絡的停滯,都可能導致視頻傳送的延遲,影響用戶的收看。因此,大型視頻點播系統(tǒng)在技術上是有相當難度的。
視頻點播系統(tǒng)的工作過程如下:用戶在客戶端啟動播放請求,通過網絡傳送給分配服務器,經驗證后,系統(tǒng)把視頻服務器中可訪問的節(jié)目單發(fā)送給用戶瀏覽,用戶選擇節(jié)目后,視頻服務器讀出節(jié)目的內容,并傳送到客戶端進行播放。
4.3可視電話與視頻會議技術
可視電話:通話雙方能互相看見的一種電話系統(tǒng),電話機具有攝像、顯示、聲音等功能,內置高質量CCD鏡頭及MODEM。其應用之一就是視頻會議,
視頻會議:多人同時參與的一種音/視頻通信系統(tǒng)類似于可視電話,但多人參加通話,提供的功能也更加豐富。
兩種實施方式:(1)在電信局的數字通信網上進行;(2)在互聯(lián)網上進行,例如使用下列即時通信軟件:微軟的MSN Messenger,騰迅的QQ,網易的POPO,新浪的UC等。
5.結論
本文通過從五個方面,對數字視頻及其技術應用在近年的研究內容、方法和進展做了比較全面的回顧和分析。從中可以看出,數字視頻的壓縮編碼主要方向集中在基于國際數字視頻標準及其應用、IP網絡和無線網絡視頻的可靠性編碼及傳輸技術、新的高效編碼方法(小波變換編碼等)、面向對象的編碼等以及3D視頻編碼,其未來的應用前是非常廣闊的。同時,數字視頻壓縮編碼領域的重大突破推動了可視電話等“會話型”和DVD等“非會話型”視頻業(yè)務。另外,數字視頻的獲取與視頻的文件格式是難以分割的,很多情況下,視頻的獲取需要轉換文件格式,而且視頻獲取往往因為文件太大而需要數字視頻壓縮編碼。從國際上看,計算機動畫技術的發(fā)展正趨于會規(guī)?;?、標準化、網絡化??梢灶A見,在不久的將來,VR技術將取得巨大的進步。endprint