盧勇文
(廣東廣播電視臺(tái),廣東 廣州 510066)
?
基于字幕時(shí)間信息的響度測量設(shè)想
盧勇文
(廣東廣播電視臺(tái),廣東廣州 510066)
介紹了各種關(guān)于電視節(jié)目響度測量的標(biāo)準(zhǔn),以及幾種電視節(jié)目響度控制的方法,同時(shí)提出了基于GY/T270—2013《數(shù)字電視隱藏字幕系統(tǒng)規(guī)范》的利用字幕出現(xiàn)的時(shí)間同步信息的響度測量設(shè)想。該設(shè)想與Dolby公司的對白歸一方法非常接近,可應(yīng)用到符合GY/T270—2013規(guī)范的雙聲道節(jié)目中,具有一定的參考價(jià)值。
響度;對白歸一;字幕;同步
觀眾在觀看電視節(jié)目的過程中,在不同的頻道之間切換、或同一頻道廣告插入時(shí),電視節(jié)目的音量就經(jīng)常會(huì)發(fā)生變化。這是由于不同的電視節(jié)目來源不同、制作標(biāo)準(zhǔn)不同以及播出平臺(tái)不相同,導(dǎo)致觀眾在收看不同節(jié)目時(shí)其音頻信號(hào)的電平各不相同,而造成主觀感覺上的響度不同。有調(diào)查表明,同一個(gè)電視節(jié)目在不同頻道轉(zhuǎn)播時(shí),伴音響度差可達(dá)26dB之多,而經(jīng)不同的衛(wèi)星鏈路傳輸?shù)碾娨暪?jié)目,其伴音響度差也可達(dá)28dB[1],這給觀眾在收看電視節(jié)目帶來了極大的不便。因此,如何讓不同電視節(jié)目的響度保持相對穩(wěn)定的幅度就成為一個(gè)熱門課題。
為了讓電視節(jié)目具有合適的響度,國際電信聯(lián)盟建立了ITUBS.1770系列測量音頻節(jié)目響度和真峰值電平的算法標(biāo)準(zhǔn),采用K濾波器對音頻節(jié)目進(jìn)行預(yù)設(shè)加權(quán)后,再對一定時(shí)間內(nèi)的音頻信號(hào)進(jìn)行能量均方,即可得到響度值[2-6]。以最新的ITUBS.1770-3標(biāo)準(zhǔn)為基礎(chǔ),結(jié)合在算法中是否使用針對微弱信號(hào)門限的不同,各個(gè)國家或地區(qū)都出臺(tái)了自己的相應(yīng)標(biāo)準(zhǔn),例如歐洲廣播聯(lián)盟EBUR128標(biāo)準(zhǔn)設(shè)定節(jié)目的響度不會(huì)超過-23LUFS[7],美國ATSCA/85標(biāo)準(zhǔn)[8]和日本TR-B32標(biāo)準(zhǔn)[9],還有澳洲的OP-59標(biāo)準(zhǔn)都是-24LKFS[10]。
中國也有自己的響度標(biāo)準(zhǔn),據(jù)《數(shù)字電視節(jié)目平均響度和真峰值音頻電平技術(shù)要求》標(biāo)準(zhǔn)規(guī)定,電視節(jié)目的平均響度應(yīng)在-24LKFS±2LU內(nèi)。它與GY/T262—2012《節(jié)目晌度和真峰值音頻電平測量算法》(等同采用ITU-RBS.1770-2)、GY/T263—2012《響度和真峰值指示儀表技術(shù)要求》(等同采用ITU-RBS.1771)一起,形成了規(guī)范廣播電視節(jié)目響度的三項(xiàng)行業(yè)標(biāo)準(zhǔn)[11]。
目前有幾種可行的控制方法,各有優(yōu)缺點(diǎn),簡單介紹如下。
2.1硬件電路控制方法
采用模擬電路形式的響度控制設(shè)備,可插入到機(jī)頂盒和電視機(jī)之間的音頻通路,通過自動(dòng)增益控制原理,對輸入的音頻信號(hào)進(jìn)行實(shí)時(shí)幅度檢測,然后通過擴(kuò)展和壓縮、限幅電路,對弱電平信號(hào)進(jìn)行擴(kuò)展,對過強(qiáng)電平的信號(hào)進(jìn)行壓縮,并對輸出信號(hào)進(jìn)行限幅,以使音頻信號(hào)保持一定目標(biāo)范圍內(nèi)的恒定[12]。這種采用模擬電路進(jìn)行自動(dòng)增益控制的方法雖然簡單可行,但其調(diào)試難度較大,其響度控制的精確度和范圍也較難保證。
2.2Dolby元數(shù)據(jù)技術(shù)
采用Dolby元數(shù)據(jù)技術(shù)進(jìn)行響度控制,是在節(jié)目制作時(shí)就在Dolby數(shù)字音頻編碼流中加入標(biāo)識(shí)其響度數(shù)值的對白歸一元數(shù)據(jù)。當(dāng)電視信號(hào)傳輸?shù)接脩舳撕?,機(jī)頂盒會(huì)根據(jù)這些元數(shù)據(jù)調(diào)節(jié)輸出增益,使響度值復(fù)原到其原始設(shè)定,在這整個(gè)過程中并沒有對音頻進(jìn)行信號(hào)處理,只是復(fù)原,這樣可以保證用戶獲取最佳的與節(jié)目制作原意高度符合的響度體驗(yàn)[13]。這種方法要求節(jié)目制作采用Dolby音頻和元數(shù)據(jù)編碼技術(shù),且用戶端的硬件部分也支持Dolby音頻和元數(shù)據(jù)解碼才行,這對于普及來說有較高難度。
2.3音量描述符方法
音量描述符方法與Dolby的元數(shù)據(jù)技術(shù)有些類似,即在進(jìn)行信號(hào)復(fù)用時(shí),在節(jié)目的PMT/SDT表中對每個(gè)頻道增加有一定取值范圍的音量描述符的方法,即對各頻道的響度做數(shù)值標(biāo)簽,機(jī)頂盒在解碼時(shí)會(huì)根據(jù)當(dāng)前頻道的對應(yīng)音量描述符數(shù)值進(jìn)行音量衰減或增加[14]。此方法經(jīng)濟(jì)可行,但需要提前制定各節(jié)目的音量描述符表格并需要及時(shí)更新,否則無法達(dá)到預(yù)期效果。
2.4采用廣播級專用產(chǎn)品的方法
生產(chǎn)用于響度控制的廣播級專業(yè)產(chǎn)品的廠家有很多,如Dolby、T.C.Electronics、Orban、Junger、大洋、捷成等。以T.C.Electronics的DB8產(chǎn)品為例,其核心是LC6n響度修正功能,可以根據(jù)不同的響度計(jì)算標(biāo)準(zhǔn)進(jìn)行響度計(jì)算,然后調(diào)整到設(shè)定的響度值。該產(chǎn)品可插入到電視臺(tái)播出系統(tǒng)的末級環(huán)節(jié)中,在信號(hào)復(fù)合之前,針對所接入的頻道節(jié)目信號(hào)進(jìn)行響度自動(dòng)檢測和調(diào)節(jié),使其達(dá)到最終的目標(biāo)響度值,然后才進(jìn)行碼流復(fù)合并傳輸?shù)浇K端用戶的機(jī)頂盒中。此方法可以獲得非常良好的效果,但需要龐大的資金并對現(xiàn)有各電視臺(tái)的播出系統(tǒng)進(jìn)行改造,短期內(nèi)很難實(shí)現(xiàn),目前也只有CCTV配備了100臺(tái)DB8MKII,以一對一備份的方式,對50個(gè)頻道進(jìn)行了處理[15],其他電視臺(tái)還未能大規(guī)模使用這種設(shè)備。
根據(jù)Dolby公司的研究,電視節(jié)目中的對白在響度感知中占據(jù)非常重要的地位,人耳對對白響度改變的容忍度相對于音樂而言要小得多,因而觀眾更在乎的是不同節(jié)目切換時(shí)對白響度的一致性,所以Dolby公司建議響度控制應(yīng)以對白歸一化為基礎(chǔ)進(jìn)行[13]。因此,如能將對白信號(hào)單獨(dú)分離出來進(jìn)行響度測量,對白歸一化將可以完美進(jìn)行。DolbyAC-3等有獨(dú)立對白通路的音頻格式是可以很方便地進(jìn)行響度測量的,但對于目前以兩路立體聲為主的電視節(jié)目來說,其對白信號(hào)與其他非語言音頻信號(hào)已經(jīng)混為一體,對白歸一化的方法就很難進(jìn)行。如果采用某些特定的語言識(shí)別類算法進(jìn)行分離,一來需要耗費(fèi)更多的DSP資源,增加硬件成本,二來對白分離的準(zhǔn)確度又難以保證。
隨著GY/T270—2013《數(shù)字電視隱藏字幕系統(tǒng)規(guī)范》的發(fā)布,在將來的電視節(jié)目中,字幕數(shù)據(jù)將被封裝在PES流中以獨(dú)立編碼的形式整合到數(shù)字電視的復(fù)用信號(hào)中,用戶機(jī)頂盒對解復(fù)用后的字幕編碼流進(jìn)行解碼后,用戶就可選擇關(guān)閉字幕顯示,或選擇想要的語種進(jìn)行字幕的顯示。要想達(dá)到此功能,字幕編碼流中必然包含有與音視頻信號(hào)同步的時(shí)間信息,才能達(dá)到字幕與音畫同步的目的。《數(shù)字電視隱藏字幕系統(tǒng)規(guī)范》中規(guī)定,PES中的PTS字段的值應(yīng)該與對應(yīng)的視頻幀的顯示時(shí)間對應(yīng)[16],也就是說,每條字幕都有其顯示的起始時(shí)間和終止時(shí)間。通常情況下,字幕顯示和對白是同步進(jìn)行的,可以根據(jù)這些時(shí)間信息讀取對應(yīng)字幕顯示期內(nèi)的音頻信息,這些音頻信息必然以對白為主,即使某些情況下混合了其他非對白信號(hào),也可通過信號(hào)處理的方法,增加例如符合語言特征的300~3 000Hz帶通濾波器來提取語言頻帶內(nèi)的信號(hào),然后以這些信號(hào)作為對象來進(jìn)行響度值的計(jì)算,所得結(jié)果與Dolby對白歸一的方法就極為接近了。這個(gè)設(shè)想的流程框圖如圖1所示。
上述圖框中,Li為當(dāng)前字幕段對白的平均響度值,可以看作是短期響度值。La則為該節(jié)目從第一句對白開始累加到當(dāng)前對白的平均響度值,當(dāng)節(jié)目剛開始時(shí),La可以看作是短期平均值,可以此作為響度的瞬間或短期調(diào)節(jié)的依據(jù),隨著時(shí)間的推移,它會(huì)逐步趨向于整條節(jié)目的對白平均響度值,此時(shí)作為調(diào)節(jié)響度的依據(jù)將更為準(zhǔn)確有效。真峰值Pi則作為對信號(hào)進(jìn)行壓縮或限幅的依據(jù)。
圖1 基于字幕時(shí)間信息的對白響度測量設(shè)想流程框圖
需要注意的是,不同國家或地區(qū)以ITU-RBS.1770規(guī)定算法為基礎(chǔ)而得到的-23LUFS或-24LKFS目標(biāo)響度值,在信號(hào)電平意義上是一個(gè)絕對電平值,對于節(jié)目制作具有參考意義。但對于觀眾而言,他們不懂響度值如何計(jì)算,也不關(guān)心響度的絕對值是否符合標(biāo)準(zhǔn)規(guī)定,而是關(guān)心在觀看過程中,廣告接入或更換節(jié)目時(shí),電視音量是否變化很大而需要重新調(diào)節(jié)音量,也就是說,響度的相對變化值對于用戶而言更有意義。因此,在進(jìn)行響度值控制時(shí),其測量不一定要嚴(yán)格按照ITUBS.1770的標(biāo)準(zhǔn)進(jìn)行,只要測量響度的算法統(tǒng)一,即使不同頻道節(jié)目的響度絕對值存在誤差,這些誤差在計(jì)算不同頻道或同一頻道但不同時(shí)刻的響度相對值時(shí)也會(huì)被抵消,由此所獲得的相對值仍然是有絕對意義的,可以作為響度調(diào)節(jié)的可靠依據(jù)。
不同頻道或不同節(jié)目間響度的不同,對觀眾造成了一定的困擾。在眾多響度控制的方法中,由于觀眾對對白響度改變的容忍度很小,因此Dolby公司的對白歸一化響度控制方法被認(rèn)為是最為精確的方法。但此方法必須在有獨(dú)立對白信號(hào)通路的情況下才有用,在目前還是占主導(dǎo)地位的兩聲道傳統(tǒng)節(jié)目上很難實(shí)現(xiàn)。
本文針對將來符合GY/T270—2013《數(shù)字電視隱藏字幕系統(tǒng)規(guī)范》要求的節(jié)目源,提出一種基于對白同步信息的響度測量設(shè)想:分析電視節(jié)目的PES流,可獲取含有對白時(shí)間同步信息的PTS值,基于此值可抽取對應(yīng)于對白時(shí)間段內(nèi)的音頻信號(hào)進(jìn)行響度值計(jì)算,非對白的音頻信號(hào)則盡可能地被排除在外,由此所得響度值即可與Dolby對白歸一的方法極為近似,并為將來可能的響度控制方法提供了更為真實(shí)而可靠的依據(jù)。此設(shè)想方法簡單,原理可靠,對傳統(tǒng)的雙聲道節(jié)目也有效,可行性高,具有一定的參考價(jià)值。
[1]鄧向東.電視節(jié)目伴音響度一致性方案研究[J].廣播與電視技術(shù),2011(S1):60-79.
[2]ITU-RBS.1770-0,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2006.
[3]ITU-RBS.1770-1,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2007.
[4]ITU-RBS.1770-2,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2011.
[5]ITU-RBS.1770-3,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2012.
[6]ITU-RBS.1770-4,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2015.
[7]EBUR.128-2011,Loudnessnormalisationandpermittedmaximumlevelofaudiosignals[S].2011.
[8]ATSCA/85,Techniquesforestablishingandmaintainingaudioloudnessfordigitaltelevision[S].2013.
[9]ARIBTR-B32,Operationalguidelinesforloudnessofdigitaltelevisionprograms[S].2015.
[10]FreeTVOP-59,Measurementandmanagementofloudnessinsoundtracksfortelevisionbroadcasting[S].2010.
[11]張建東.數(shù)字電視節(jié)目平均響度和真峰值音頻電平技術(shù)要求標(biāo)準(zhǔn)解讀[J].廣播與電視與技術(shù),2014,41(12):54-61.
[12]樂文華.簡便實(shí)用的機(jī)頂盒伴侶優(yōu)化設(shè)計(jì)及應(yīng)用[J].電聲技術(shù),2013,37(8):29-34.
[13]張麗娜.杜比元數(shù)據(jù)技術(shù)詳述[J].現(xiàn)代電視技術(shù),2014(6):128-131.
[14]溫志強(qiáng).實(shí)現(xiàn)數(shù)字電視系統(tǒng)音量平衡的一種方法[J].有線電視技術(shù),2005(9):64-66.
[15]ELECTRONICTC.CCTVINSTALLS100DB8MKII[EB/OL].[2016-05-08].http://www.tcelectronic.com/cctv-installs-100-db8-mkii-transmission-processors/.
[16]GY/T270—2013,數(shù)字電視隱藏字幕系統(tǒng)規(guī)范[S].2013.
責(zé)任編輯:時(shí)雯
Ideaofloudnessmeasurementwithtimeinformationofcaption
LUYongwen
(Guangdong TV Station,Guangzhou 510066,China)
AmethodforloudnessmeasurementwithtimeinformationofcaptionwhichbasedonthestandardGY/T270—2013specficationofclosedcaptionsystemfordigitaltelevisionwasintroducedbythispaper.Comparedtotheotherloudnessmeasurementmethods,thismethodissimilartothemethodofDolbydialoguenormalization,andithasthecertainreferencevalueandcanbeusedfortwochannelTVprogramwhichaccordingtothestandardGY/T270—2013.
loudness;dialoguenormalization;caption;synchronization
TN945+.7
BDOI:10.16280/j.videoe.2016.08.016
2016-07-11
文獻(xiàn)引用格式:盧勇文.基于字幕時(shí)間信息的響度測量設(shè)想[J].電視技術(shù),2016,40(8):84-86.
LUYW.Ideaofloudnessmeasurementwithtimeinformationofcaption[J].Videoengineering,2016,40(8):84-86.