□劉海蘭 李海彬 李榮瑋 黎朗
淺談視頻文件幀頻轉(zhuǎn)換的一些方法及常見問題
□劉海蘭 李海彬 李榮瑋 黎朗
國內(nèi)電視的播出幀頻是25幀/秒,但很多攝錄設(shè)備并不按此幀頻進(jìn)行拍攝,要將這些視頻在電視上播出,必須進(jìn)行幀頻轉(zhuǎn)換。本文主要闡述幀頻轉(zhuǎn)換的一些技術(shù)要點(diǎn)和注意事項(xiàng),并針對幀頻轉(zhuǎn)換的一些方法進(jìn)行重點(diǎn)介紹和分析。
幀頻;電視制式;采樣時(shí)間
在使用非編系統(tǒng)制作電視節(jié)目時(shí),常常會(huì)遇到不同攝錄設(shè)備產(chǎn)生的視頻文件,既有記者使用專業(yè)攝像機(jī)拍攝的視頻,也有通過相機(jī)、手機(jī)拍攝的視頻,但在節(jié)目制作中,一些電腦上播放流暢的視頻,經(jīng)過非編軟件處理后在電視機(jī)上播出時(shí),畫面卻出現(xiàn)抖動(dòng),這是怎么回事呢?較大的可能是原始視頻的幀頻與電視播出的幀頻不同造成的。
在模擬電視時(shí)代,電視分為NTSC、PAL、SECAM三大制式。
(一)NTSC制式電視的分辨率為720×480,幀頻為每秒29.97幀(一般簡化為30幀),場頻為每秒60場,這種制式的色度信號(hào)調(diào)制特點(diǎn)為平衡正交調(diào)幅制,即包括了平衡調(diào)制和正交調(diào)制兩種。
(二)PAL制式電視的分辨率為720×576,幀頻為每秒25幀,場頻為每秒50場,它對同時(shí)傳送的兩個(gè)色差信號(hào)中的一個(gè)色差信號(hào)采用逐行倒相,另一個(gè)色差信號(hào)進(jìn)行正交調(diào)制方式,是中國目前使用的制式。
(三)SECAM制式電視的分辨率為720×576,幀頻為每秒25幀,場頻為每秒50場,在信號(hào)傳輸過程中,亮度信號(hào)每行傳送,而兩個(gè)色差信號(hào)則逐行依次傳送。
幀頻(frame rate)是指每秒鐘放映或顯示的幀或圖像的數(shù)量。因?yàn)橐郧暗碾娨暀C(jī)使用顯像管來成像,所以三大制式都采用隔行掃描的方式,即將1幀畫面分為奇數(shù)場和偶數(shù)場來顯像,因而場頻是幀頻的一倍。
由于三大制式之間的參數(shù)不同,在使用錄像機(jī)進(jìn)行電視節(jié)目的編輯時(shí),不同制式的錄像帶是不能互相兼容的,制式間的轉(zhuǎn)換也需要專門的設(shè)備,一般很少進(jìn)行轉(zhuǎn)換。
在數(shù)字電視時(shí)代,電視制式被漸漸忽略了,至少在節(jié)目制作域中,它已經(jīng)被淡化了。因?yàn)殡娨曀夭牡膩碓?,已不僅僅是用專業(yè)的攝像機(jī)來錄制的視頻,手機(jī)、照相機(jī)、攝像頭等設(shè)備都可以錄制視頻并以文件的方式存儲(chǔ),這些文件是沒有制式之說的。
但是視頻的幀頻對于電視的播出仍然是重要的,因?yàn)閲鴥?nèi)各電視臺(tái)的節(jié)目播出,標(biāo)清采用PAL制,高清采用1080 50i,其幀頻都是25幀/秒,在使用非編軟件制作電視節(jié)目時(shí),無論原始視頻的幀頻是多少,最終必須轉(zhuǎn)換為25幀/秒,而幀頻的轉(zhuǎn)換可能會(huì)影響最終的節(jié)目成像質(zhì)量。
人眼視覺惰性的活動(dòng)閾值是每秒24次,即每秒鐘連續(xù)顯示24幅以上的不同靜止畫面時(shí)人眼就會(huì)感覺圖像是連續(xù)運(yùn)動(dòng)的而不會(huì)把它們分辨為一幅幅靜止畫面。
在拍攝電視時(shí),視頻的錄制并不是連續(xù)的,而是每隔一個(gè)固定的時(shí)間拍攝一幀畫面并記錄下來,播放時(shí)再按拍攝的速度進(jìn)行重放,由于相鄰兩幀畫面的間隔時(shí)間很短,人眼看來就是連續(xù)的了。
根據(jù)設(shè)置的幀頻,可以確定每秒記錄幾幀畫面,以及相鄰兩幀畫面的采樣間隔時(shí)間,它與幀頻的計(jì)算公式為:采樣間隔時(shí)間=1000毫秒÷幀頻。當(dāng)幀頻為25幀/秒時(shí),1000÷25=40毫秒,30幀/秒時(shí)約等于33.33毫秒,50幀/秒時(shí)等于20毫秒,每幀畫面的時(shí)間戳將按這個(gè)間隔遞增。
拍攝時(shí)使用的幀頻越高,記錄的畫面就越多,圖象細(xì)節(jié)也會(huì)更豐富。在一些體育賽事的轉(zhuǎn)播中,經(jīng)常會(huì)使用高速攝像機(jī)以電視幀頻兩倍以上的速度錄制視頻信號(hào),再將錄制幀頻轉(zhuǎn)換為電視的播出幀頻;而在慢動(dòng)作重放時(shí),這些在正常播出時(shí)沒有用到的畫面發(fā)揮了很大的作用,它讓我們看到的慢動(dòng)作過程是連貫的而不是卡頓的。
看到這里,你可能會(huì)有一種感覺,就是從高的幀頻轉(zhuǎn)為低的幀頻是沒有損失的,就像將一張4000×2250像素的照片,縮小到1920×1080像素,放到1280×720的顯示器里觀看,圖片的質(zhì)量并不會(huì)降低。那幀頻從高向低轉(zhuǎn)換,是否也是這樣的?這個(gè)需要看情況而定。圖1是25幀/秒分別與30幀/秒、50幀/秒的采樣時(shí)間對比。
從圖1可以知道,除原點(diǎn)(即0ms)外,25幀/秒與30幀/秒每秒鐘內(nèi)對畫面進(jìn)行采樣的時(shí)間點(diǎn)位是不相同的;而50幀/秒采樣畫面的時(shí)間點(diǎn),會(huì)與25幀/秒的出現(xiàn)重合周期。
當(dāng)采用播出幀頻的倍頻錄制視頻時(shí),如50幀/秒,將其幀頻降為25幀/秒,只需將50幀/秒的畫面每兩幀抽取1幀,即可降為25幀/秒,視頻的連續(xù)性基本不會(huì)有任何的影響,音頻也不會(huì)不同步,這就是為什么高速攝像機(jī)采用多倍頻進(jìn)行記錄的原因。
而如果是反過來將25幀/秒提升至50幀/秒時(shí)也很方便,將25幀畫面每幀寫入2次即可,雖然畫質(zhì)沒有提高,但不會(huì)出現(xiàn)任何問題。
圖1 視頻采樣記錄時(shí)間
但將幀頻從30幀/秒轉(zhuǎn)至25幀/秒,或者反方向轉(zhuǎn)換時(shí),就沒有這么幸運(yùn)了,由于兩者的采樣間隔時(shí)間不成整數(shù)倍關(guān)系,無論如何處理,都會(huì)對視頻的連續(xù)性和視音頻的同步產(chǎn)生些許影響。
國內(nèi)電視制式的幀頻是25幀/秒,而手機(jī)、相機(jī)拍攝時(shí)常用的幀頻是30幀/秒,一方面拍攝者可能不清楚幀頻對電視播出的影響,另一方面某些手機(jī)、相機(jī)不支持以25幀/秒拍攝,因此幀頻從30幀/秒降為25幀/秒是比較常見的,下面介紹幾種降低幀頻的方法。
(一)丟棄部分幀并重組視頻
這種方法常見于轉(zhuǎn)碼軟件,轉(zhuǎn)換時(shí)將每秒30幀的圖像,每隔數(shù)幀丟棄1幀,將剩下的25幀重新組成1秒的視頻,圖2是轉(zhuǎn)碼軟件FFMPEG降幀頻后每秒保留的原幀畫面。
圖2 FFMPEG降幀頻后的畫面分解
降幀頻后,每秒內(nèi)的30幀畫面,其中的第5、11、17、23、29幀被抽走并丟棄,不再出現(xiàn)在新組成的視頻中,并且除了第1幀外,其它各幀的采樣時(shí)間也發(fā)生了變化,如表1所示。
表1降頻前、后采樣時(shí)間及偏差值
從表1可知,新組成的各幀畫面,采樣時(shí)間最慢的是滯后原視頻畫面約21ms,最快的是超前6ms,即有些畫面出來得慢了,有些又出來得快了,加上丟棄了5幀,畫面的
連續(xù)性較差,并且視音頻會(huì)產(chǎn)生輕微的不同步。
(二)相鄰兩幀做透明疊加融合
這種方法多見于非編軟件,如Edius、大洋非編軟件等,它們的做法是將相鄰的兩幀進(jìn)行一個(gè)類似于半透明的過渡處理,圖3是Edius降幀頻后重新生成的畫面。
從圖3可知,相鄰的兩幀畫面按不同的透明比例進(jìn)行疊加融合,并重新渲染為新的一幀畫面,從某種意義上來說,這里沒有丟棄任何一幀畫面,因此畫面的連續(xù)性可以得到保證,但是又產(chǎn)生一個(gè)新的問題,即融合后的畫面可能會(huì)產(chǎn)生少許的重影、模糊、拖尾。
圖3 Edius降幀頻后的視頻分解圖
這種方式處理的視頻,其各幀的采樣時(shí)間已不好估算,無法計(jì)算出轉(zhuǎn)換后各幀的超前和滯后情況,但視音頻輕微不同步現(xiàn)象仍然不可避免。
(三)降速變換
這種方法有點(diǎn)像慢放,即將原來每秒鐘播放30幀改為播放25幀,但后面的5幀并不丟棄,而是放到下一秒鐘,原來1秒鐘的視頻變成了1秒加200毫秒,由于每秒鐘的視頻變慢了,因此音頻也要作相應(yīng)的調(diào)整,這樣才能保證聲畫同步。由于轉(zhuǎn)換工序復(fù)雜,并且視頻明顯變慢,這種方法并不常見,僅在一些特殊情況下使用。
綜上,在原始幀頻與播出幀頻不存在倍頻關(guān)系的條件下,無論采用上述的何種處理方式,在降低幀頻后,畫面都會(huì)產(chǎn)生一定的失真。
提高幀頻的方法與降低幀頻的差不多,基本上就是其逆運(yùn)算過程。
(一)按比例重復(fù)插幀:根據(jù)源幀頻與目標(biāo)幀頻的差值,每隔數(shù)幀向目標(biāo)視頻插入一幀,如15幀/秒提高至25幀/秒時(shí),平均每1.66幀插入相鄰的1幀。
(二)某兩相鄰幀疊加產(chǎn)生第3幀:原幀畫面不變,根據(jù)轉(zhuǎn)換幀頻的比例,某兩幀畫面按不同的透明度疊加產(chǎn)生新的第3幀。
(三)全部相鄰幀疊加產(chǎn)生多幀:全部畫面重新渲染,相鄰兩幀按不同的透明度產(chǎn)生多幀。
當(dāng)幀頻低于人眼視覺惰性的活動(dòng)閾值時(shí),由于原始畫面的細(xì)節(jié)丟失嚴(yán)重,無論通過何種方式,基本上無法提高畫面質(zhì)量。
當(dāng)視頻的錄制幀頻與電視幀頻不是整數(shù)倍關(guān)系時(shí),是一個(gè)比較難以處理的情況,轉(zhuǎn)換后的視頻肯定會(huì)有一些失真。文中談及的幾種轉(zhuǎn)換方法,并未提及何種方法更優(yōu),這需要根據(jù)視頻畫面的構(gòu)成而定。我們要做的是,將轉(zhuǎn)換失真降到最低點(diǎn),在有條件的情況下,盡可能采用幾種方法做轉(zhuǎn)換,在完成的視頻文件中挑選一個(gè)效果最好的。
(作者單位:廣西電視臺(tái)新聞中心)