馮 勇
內(nèi)蒙古廣播電視網(wǎng)絡集團有限公司 內(nèi)蒙古 呼和浩特市 010051
聲音是人們接觸世界、了解世界的重要介質(zhì)。近年來,隨著科技日新月異的進步,數(shù)字電子產(chǎn)品越來越豐富人們的生活,電視作為家用電子設備在日常生活中已經(jīng)普及開來,成為人們生活中不可缺少的重要組成部分。隨著科技的不斷發(fā)展,人們的生活水平不斷提高,對電視能提供的功能及帶來的感官效果越來越注重,在追求大屏幕、高清晰度的同時,對電視音質(zhì)及立體聲效果上也不斷提出要求。在這樣的背景下,電視機聲音菜單的功能越來越強大,配有各種音效設置以及均衡器調(diào)節(jié),以滿足人們的視聽需求。
各衛(wèi)視電視臺制作電視節(jié)目,并將通過審核的節(jié)目上傳到衛(wèi)星,但是各衛(wèi)視電視臺通過衛(wèi)星傳播的直播節(jié)目,由于沒有統(tǒng)一的音量標準,因此在同一個機頂盒終端上用同樣的音量播出時,存在聲音有高有低的情況,并且目前大多數(shù)電視機在左右聲道的平衡調(diào)節(jié)方面,都是憑借用戶自身的聽覺技巧來判斷聲道是否平衡,而且還需要用戶再次通過手動調(diào)整的方法在電視機的聲道均衡器中進行調(diào)節(jié)。顯而易見,同樣音量播出時音量高低的不同使得用戶需要不斷進行人工調(diào)節(jié),不僅費時費力,還會給用戶帶來很不好的使用體驗。為了順應時代的發(fā)展、滿足社會的需要,廣電行業(yè)一直對視頻清晰特性、聲音特性進行著深入的研究與試驗,推動著相關產(chǎn)業(yè)技術(shù)的發(fā)展,目前超高清視頻產(chǎn)業(yè)已經(jīng)開始廣泛發(fā)展,視頻聲音自適應技術(shù)產(chǎn)業(yè)也有了一定的成果,但還需進一步的開發(fā)創(chuàng)新。
隨著社會的快速發(fā)展,人們對生活質(zhì)量的追求越來越高,對音視頻的各種功能及所帶來的體驗效果要求也越來越高。先進的聲音自適應技術(shù)可以節(jié)約用戶寶貴的時間,給用戶的日常工作和生活帶來便利,可以滿足人們對聲音更舒適化、調(diào)控更簡單化、統(tǒng)一化的需求,有利于提高廣大用戶的體驗效果。同時又可以幫助有關運營商節(jié)約成本,推動廣電行業(yè)相關技術(shù)的進步,從而實現(xiàn)多贏的局面。
各衛(wèi)視電視臺通過衛(wèi)星傳播的直播節(jié)目,由于沒有統(tǒng)一音量標準,因此在同一個機頂盒終端上用同樣的音量播出時,存在聲音高低不同的情況。因此迫切需要開發(fā)出一種技術(shù),可以根據(jù)電視機等的聲音播放裝置或其他設備,自動調(diào)整揚聲器播放聲音時的音量,使得在同一機頂盒用同樣的音量播放不同衛(wèi)視節(jié)目時,聲音音量高低效果一致。針對這一問題,業(yè)內(nèi)的解決方式大體可概括為以下兩種方案。
針對上述問題,其中一種方案是在聲源傳輸?shù)那岸思尤胂嚓P控制設備,對聲音進行調(diào)控處理。主要形式表現(xiàn)為:在前端加入聲音采集設備,包含聲音采集模塊、音頻分析模塊等。聲音采集模塊主要對聲音進行采集,獲取聲音信息;音頻分析模塊實時記錄信號音頻,并根據(jù)電視機當前設定的音量,計算出該電視信號音頻通過所述揚聲器產(chǎn)生的分貝值,計算出與設定音量之間的增益。在前端加入聲音控制設備,將聲音信號及計算結(jié)果發(fā)送到聲音控制設備,控制模塊對聲音進行增益處理,使其達到標準設定值,然后輸出??傊?,該方案是通過在前端加入相關音頻處理設備進行調(diào)控。
為了解決上述問題,一些企業(yè)一直在進行積極的研究與試驗,同時將各大運營商的運營成本考慮在內(nèi),提出了一種基于終端的解決方案。為了保證現(xiàn)網(wǎng)的單雙向機頂盒均能夠適用,該方案首先基于前端相關設備判斷出音頻與采用音量標準之間的差值,確定增益值,然后采用通過EPG系統(tǒng)播發(fā)私有描述符(音頻屬性描述符)的方式,將各service 的默認音頻參數(shù)通過單向網(wǎng)絡廣播下發(fā)到機頂盒終端,由機頂盒終端接收并處理,達到自動適應各頻道聲音的目的。
2.2.1 具體實現(xiàn)(音頻屬性描述符)
將該描述符插入到SDT 表中,用于描述頻道的默認聲音參數(shù)。描述符的語法結(jié)構(gòu)如表1所示。
描述符標簽descriptor_tag
8 位字段,聲音屬性描述的標簽固定為0xF0。
描述符長度descriptor_length
表1
8 位字段,指出從本字段的下一個字節(jié)開始的描述符的總字節(jié)長度,本描述符中該字段值固定為2。
默認音軌audio_track
2 位字段,描述該service 的默認伴音,按照PMT 表中的伴音順序從0 至3。
默認聲道audio_mode
2 位字段,描述該service 的默認聲道,具體定義如表2所示。
表2
音量增益audio_level
4 位字段,描述該service 的音量增益,分為15級,對應于基礎音量的調(diào)整步長(如表3所示)。
2.2.2 聲音自適應解決方案二創(chuàng)新點
聲音自適應解決方案二具有以下幾點創(chuàng)新。第一,采用基于終端的處理方式,即通過EPG 系統(tǒng)播發(fā)私有描述符(音頻屬性描述符)的方式,將各service 的默認音頻參數(shù)通過單向網(wǎng)絡廣播下發(fā)到機頂盒終端,由機頂盒終端接收并處理。第二,在EPG 軟件系統(tǒng)里播發(fā)音頻描述符,操作性強,便于實現(xiàn)和修改。第三,保證了現(xiàn)有網(wǎng)絡的單雙向機頂盒均能夠適用。第四,幫助運營商節(jié)省了運營成本。第五,從新的方向促進了廣電行業(yè)相關技術(shù)的進一步研究與發(fā)展。
表3
通過對上述兩種方案進行詳細的對比可以發(fā)現(xiàn)以下主要不同。第一,針對聲音自適應問題的研究,第一種方案更注重在音頻信號傳輸前端進行解決,例如聲音采集器、音頻控制器、聲音均衡器等相關設備,其解決方法主要是通過添加硬件設備進行相關的音頻采集與分析;第二種方案主要是基于終端機頂盒,在前端判斷出音頻音量與標準音量之間的差值之后,通過在EPG 軟件系統(tǒng)添加私有的音頻描述符下發(fā)到機頂盒,然后進行相關處理。第二,第一種解決方案在前端增加了設備,也就意味著風險的增多;第二種方案是在EPG 軟件系統(tǒng)里添加描述符,相對來說風險極小。第三,增加硬件設備意味著成本投入的增加,而第二種方案的成本相對較小。
在內(nèi)蒙古廣播電視網(wǎng)絡集團有限公司有線電視前端,利用聲音自適應解決方案二進行如下應用測試。
(1)利用解碼器和編碼器微調(diào)CCTV-1 高清節(jié)目的聲音音量,用分貝儀和人耳相結(jié)合的方式測試,電視機音量值固定為默認50、機頂盒音量值為25 時,音量大小適中,聲音效果良好。后續(xù)以CCTV-1 高清節(jié)目的聲音音量為基準。
(2)在調(diào)整其他播出節(jié)目音量時,電視機音量值固定為默認50、機頂盒音量值為25 時,用分貝儀結(jié)合人耳判斷出其他播出節(jié)目音量與CCTV-1高清基準音量之間的差值,確定調(diào)整增益值,如表4所示。
表4
(3)按照調(diào)整差值,在EPG 系統(tǒng)調(diào)整播發(fā)私有描述符(音頻屬性描述符)。
(4)通過分貝儀結(jié)合人耳試聽調(diào)整后節(jié)目音量,在電視機音量值固定為默認50、機頂盒音量值為25 時,全網(wǎng)節(jié)目音量基本均衡,聲音效果良好,達到預期目的。
該方案有效地解決了音頻均衡問題,滿足了用戶對聲音更舒適化、調(diào)控更簡單化統(tǒng)一化等需求,進一步提升了用戶的使用體驗,同時最大程度的為運營商節(jié)約了成本,實現(xiàn)了多贏。