新疆廣播電視臺(tái):卡納提·薩依
數(shù)字技術(shù)的發(fā)展帶來概念性轉(zhuǎn)變,傳統(tǒng)的模擬領(lǐng)域逐漸轉(zhuǎn)變?yōu)楦把氐臄?shù)字音頻技術(shù),廣播事業(yè)發(fā)展也必將走向全新數(shù)字音頻技術(shù)時(shí)代。因此,深入探究廣播電視工程建設(shè)中數(shù)字音頻技術(shù)的優(yōu)勢與應(yīng)用就顯得更為重要。
數(shù)字音頻技術(shù),是將傳統(tǒng)的音頻模擬信號(hào)轉(zhuǎn)化為0、1二進(jìn)制數(shù)據(jù)存取格式。數(shù)字音頻實(shí)際上是將音頻文件轉(zhuǎn)化可以直接存儲(chǔ)于計(jì)算機(jī)數(shù)據(jù)庫的文件格式,然后再將其電平信號(hào)轉(zhuǎn)化成二進(jìn)制數(shù)據(jù)保存,廣播電臺(tái)音頻工程師可以用這些數(shù)據(jù)信息通過模擬電平信號(hào)發(fā)出。數(shù)字音頻的存儲(chǔ)成本更低,不易丟失和損耗,所以相對(duì)聲音保真度也很高,后期處理和編輯更為便捷。
數(shù)字化音頻技術(shù)高速發(fā)展與廣播電臺(tái)的數(shù)字化目標(biāo)相輔相成,從廣播音頻節(jié)目制作流程來看,廣播節(jié)目制作、加工、傳播等一系列對(duì)原始音頻素材的處理,主要是以模擬信號(hào)和數(shù)字信號(hào)為主,而后才能將音頻資料傳播出去。為了適應(yīng)音頻技術(shù)發(fā)展并推動(dòng)廣播行業(yè)進(jìn)步,實(shí)則需要從技術(shù)和設(shè)備兩個(gè)層面推陳出新,這不僅僅是對(duì)于數(shù)字音頻設(shè)備的升級(jí),更需要確保音頻信號(hào)傳輸環(huán)節(jié)上盡量弱化失真現(xiàn)象,從而增強(qiáng)廣播音頻的兼容性,進(jìn)一步用數(shù)字音頻技術(shù)來替代傳統(tǒng)的模擬音頻處理技術(shù)??傮w而言,為了更好地促進(jìn)廣播事業(yè)發(fā)展,有必要對(duì)模擬音頻技術(shù)進(jìn)行升級(jí),用音質(zhì)效果更為突出的數(shù)字音頻技術(shù)來構(gòu)建廣播系統(tǒng)。
聲音的本質(zhì)音波,而聽眾能夠清晰聽見的波形頻率是在20Hz到20kHz之間的稱為聲波。音頻的模擬信號(hào)具有連續(xù)的函數(shù)特性,屬于不同頻率和振幅的聲波疊加形成而來。而數(shù)字音頻也相當(dāng)于量化了模擬信號(hào),最為典型的音頻模式是對(duì)應(yīng)時(shí)間坐標(biāo)完成同等比例的時(shí)間間隔,采樣之后的振幅可以完成數(shù)據(jù)量化。這便是單位時(shí)間內(nèi)對(duì)采樣次數(shù)完成的聲源數(shù)據(jù)采集,也被稱為采樣頻率。當(dāng)一段聲波被數(shù)字化,也就產(chǎn)生了可以被計(jì)算機(jī)識(shí)別的數(shù)據(jù)值,每個(gè)數(shù)值逐一對(duì)應(yīng)抽樣點(diǎn)振幅值,并按順序完成排列組合,最終數(shù)字排列結(jié)果也就形成了音頻信號(hào)。
上述便是ADC(模擬-數(shù)字轉(zhuǎn)換)過程,而DAC(數(shù)字-模擬轉(zhuǎn)換)的過程則相反,是將數(shù)字信號(hào)按之前采樣的排列組合形式進(jìn)行轉(zhuǎn)化,用ADC解碼后完成從數(shù)字信號(hào)到模擬信號(hào)的轉(zhuǎn)化。因數(shù)字音頻格式不同,通常也會(huì)使用PCM完成轉(zhuǎn)化。但是需要通過DAC轉(zhuǎn)換器放大模擬信號(hào)功率,進(jìn)而達(dá)到廣播電臺(tái)的播放要求并被聽友人耳所識(shí)別。伴隨數(shù)碼音頻技術(shù)發(fā)展,更多音頻處理器的功能也在逐漸升級(jí),如EV DX38和KT DN9848等,通過一體化的DSP數(shù)字音頻處理芯片模塊,可以將時(shí)間、頻率、幅度等方面的信號(hào)處理功能逐漸完善并整合在同一個(gè)音頻設(shè)備之中。音頻信號(hào)僅通過AD轉(zhuǎn)換或DA轉(zhuǎn)換即可還原音頻素材,數(shù)字音頻在量化后的失真度也微乎其微。
應(yīng)用數(shù)字音頻技術(shù),通過制作、管理、播出三個(gè)關(guān)鍵環(huán)節(jié)組成。而數(shù)字音頻技術(shù)帶給廣播節(jié)目最大的技術(shù)支持便是拓寬音軌,在使用了數(shù)字音頻技術(shù)之后很大程度上保證了聲音傳播質(zhì)量,可以確保無損音質(zhì)被完整傳輸,所以廣播節(jié)目質(zhì)量得到了強(qiáng)大的技術(shù)保證。現(xiàn)階段廣播電臺(tái)主要使用64軌數(shù)字音頻技術(shù),從音頻錄制到管理再到播出達(dá)到了較高的音質(zhì)水平。廣電部門在應(yīng)用數(shù)字音頻技術(shù)之后,工作效率有所提升,且廣播音頻質(zhì)量也得到全面改善。
傳統(tǒng)的模擬信號(hào)在存儲(chǔ)時(shí)需要考慮音頻質(zhì)量,故而曾經(jīng)使用過如磁帶這種相對(duì)古老的存儲(chǔ)設(shè)備。但是無論是磁帶存儲(chǔ)還是CD存儲(chǔ),都會(huì)無形占用線下存儲(chǔ)空間,而且在多次播放后也會(huì)產(chǎn)生對(duì)于音質(zhì)的損耗,再次使用時(shí)就會(huì)出現(xiàn)雜音和聲音質(zhì)感弱化的現(xiàn)象。以往時(shí)期磁帶管理音頻資料的階段,工作人員需要對(duì)音頻資料手工標(biāo)記,查閱和管理都消耗了巨大的人力、物力、財(cái)力,對(duì)廣電工作人員的精力和時(shí)間消耗都是難以衡量的。而在數(shù)字音頻技術(shù)之下,僅用本地聯(lián)網(wǎng)的終端PC機(jī)便可輕松管理數(shù)以億計(jì)的音頻資料,而且在查閱和搜索數(shù)字音頻資料時(shí),僅需短短數(shù)秒鐘便可直接獲得精準(zhǔn)的數(shù)字音頻資料,這無疑是提高音頻資料管理工作效率的重要方法,必然能夠促使廣電事業(yè)更好地發(fā)展。
音頻資料不僅在存儲(chǔ)管理方面強(qiáng)烈依靠于數(shù)字音頻技術(shù),而且在剪輯制作方面也得益于數(shù)字音頻技術(shù)的支持,才能在短時(shí)間內(nèi)毫無誤差地完成音頻剪輯工作。廣播節(jié)目在使用音頻資料時(shí),很難直接將音頻資料拿來使用,而是需要對(duì)一些音頻資料進(jìn)行剪輯、加工、處理。而這一系列的音頻制作工作中,又需要確保剪輯音頻位置的誤差保持在千分之一秒內(nèi)。數(shù)字音頻技術(shù)可以將原始的音頻數(shù)據(jù)資料通過視覺化方式呈現(xiàn)出來,音頻剪輯過程中可以直接看到聲音波形被放大后的圖示結(jié)構(gòu),那么在使用耳麥和顯示設(shè)備之后,音頻剪輯的精準(zhǔn)度必然有所提升。因此,數(shù)字音頻技術(shù)實(shí)際上是對(duì)于普通音頻資料的全視角放大,能夠?qū)崿F(xiàn)對(duì)音頻資料的精準(zhǔn)剪輯,即便是合并多個(gè)音頻資料素材,也能夠確保音頻資料具有無縫銜接的效果,這在很大程度上提高了廣播音頻的流暢度。
數(shù)字調(diào)音臺(tái)是廣電傳媒最早引進(jìn)數(shù)字音頻技術(shù)的起源,數(shù)字調(diào)音臺(tái)也可以理解為是擴(kuò)聲系統(tǒng)(Audio Mixing Console),是影音錄音中最為常見的通用設(shè)備。數(shù)字調(diào)音臺(tái)可以同時(shí)共用多路輸入,每路數(shù)字音頻信號(hào)都可以完成單獨(dú)播放。其中也包括對(duì)于數(shù)字音頻的制作和加工,可放大音量和不同聲道的音源識(shí)別度,作高音、中音、低音方面的數(shù)字音頻音質(zhì)補(bǔ)償,給輸入到廣播節(jié)目中的聲音增加韻味和藝術(shù)性,對(duì)多路聲源泉作空間定位等操作。當(dāng)然也可以完成對(duì)于數(shù)字音頻的各種聲音混合,混合比例可調(diào),且擁有多種輸出方式,包括:左右立體聲輸出、編輯輸出、混合單聲輸出、監(jiān)聽輸出、錄音輸出以及各種輔助輸出等。數(shù)字調(diào)音臺(tái)在廣播系統(tǒng)中起著極為重要的作用,可以為廣播節(jié)目創(chuàng)作背景音樂、立體聲、美化聲音,也可以抑制數(shù)字音頻資料中潛藏的噪聲、控制播放數(shù)字音頻資料的音量,是廣播節(jié)目對(duì)數(shù)字音頻資料進(jìn)行加工和制作的重要聲音藝術(shù)處理工具。
AI數(shù)字音頻技術(shù)最早是應(yīng)用于車載廣播的終端領(lǐng)域,運(yùn)用AI人工智能技術(shù)對(duì)廣播音頻節(jié)目進(jìn)行數(shù)據(jù)化升級(jí),可以實(shí)現(xiàn)“場景化+智能電臺(tái)流”的數(shù)字音頻技術(shù)應(yīng)用,除了根據(jù)地域位置推送電臺(tái)直播流,彌補(bǔ)電臺(tái)信號(hào)不足問題外之外,AI人工智能技術(shù)可以對(duì)數(shù)字音頻進(jìn)行智能識(shí)別,依據(jù)終端用戶的收聽習(xí)慣、時(shí)間、地點(diǎn)、人物、當(dāng)前事件定義場景,從而完成對(duì)于聽友所需數(shù)字音頻內(nèi)容的精準(zhǔn)定位。AI人工智能在啟用大數(shù)據(jù)系統(tǒng)聯(lián)合發(fā)布數(shù)字音頻之后,AI技術(shù)實(shí)際上是對(duì)終端用戶進(jìn)行了精準(zhǔn)的畫像,基于場景和用戶畫像的大數(shù)據(jù)結(jié)果之上,按需智能組合來分類廣播節(jié)目訊息,如新聞資訊、音樂、娛樂、出行信息等相關(guān)的數(shù)字音頻內(nèi)容,均可實(shí)現(xiàn)24小時(shí)不間斷的AI電臺(tái)流推送方式,為終端用戶提供適應(yīng)度和針對(duì)性更高的數(shù)字音頻服務(wù)。
毫無疑問,這套專為廣播電臺(tái)研發(fā)的AI智能生產(chǎn)工具,也是更懂主持人的廣播播出系統(tǒng),加上中央廣播電視總臺(tái)的新媒體客戶端80多年歷史沉淀的優(yōu)質(zhì)節(jié)目資源數(shù)據(jù)庫,億級(jí)聽友的客戶端聯(lián)動(dòng),以及4000萬云聽車機(jī)用戶的領(lǐng)先布局,AI智能廣播的商業(yè)價(jià)值將進(jìn)一步放大,數(shù)字音頻技術(shù)借助AI人工智能加持必定突破廣播聲量,成為下一代廣播事業(yè)發(fā)展的核心技術(shù)。
云音頻技術(shù)是聯(lián)合云存儲(chǔ)技術(shù)拓展的新型數(shù)字音頻技術(shù)。如騰訊云開發(fā)了RT-ONE?網(wǎng)絡(luò),整合了實(shí)時(shí)通信網(wǎng)絡(luò)(TRTC)、即時(shí)通信網(wǎng)絡(luò)(IM)以及流媒體分發(fā)網(wǎng)絡(luò)(CDN),為業(yè)界最完整的音頻傳播構(gòu)建了PaaS平臺(tái)基座。廣播音頻開始追求空間音頻和高品質(zhì)音樂的實(shí)時(shí)傳輸。RTC即Real-Time Communication,這里面C代表Communication。但隨著音頻技術(shù)的不斷發(fā)展,其邊界也在不斷延展,現(xiàn)在C不僅僅是Communication,它還可以是Content、Control等等。
在終端用戶使用移動(dòng)網(wǎng)絡(luò)收聽廣播節(jié)目時(shí),實(shí)時(shí)場景下具有云端音頻數(shù)據(jù)存儲(chǔ)功能,所以內(nèi)容層面上RTC便成為了面向終端聽友群體的Real-Time Content。而在云電腦、遠(yuǎn)程駕駛、實(shí)時(shí)同屏等場景中,端到端小于100毫秒的延時(shí),可以在很大程度上確保無損音質(zhì)的廣播服務(wù)。因此,云技術(shù)實(shí)際上是對(duì)于數(shù)字音頻技術(shù)的全面升級(jí),無論在音質(zhì)保護(hù)還是在多場景應(yīng)用方面,都具有更加先進(jìn)的技術(shù)服務(wù)優(yōu)勢。此外,云技術(shù)也正在適應(yīng)各種能夠播放數(shù)字音頻的終端設(shè)備,如TRTC的整體架構(gòu)內(nèi)可以適應(yīng)iOS、Android、Windows、macOS、Linux等多種系統(tǒng)平臺(tái)。所以,廣播節(jié)目應(yīng)用數(shù)字音頻和云端技術(shù)之后,將有利于拓寬音頻數(shù)據(jù)化的應(yīng)用層面,并確保更多終端設(shè)備接入廣播數(shù)字音頻服務(wù)。
即便是最好的終端接收設(shè)備,也可能因5G信號(hào)衰弱而產(chǎn)生斷斷續(xù)續(xù)的數(shù)字音頻信號(hào)丟失,以至于終端用戶無法收聽到完整的廣播節(jié)目。因?yàn)閿?shù)字音頻信號(hào)必須是續(xù)的,但如果將這個(gè)數(shù)字音頻在時(shí)間顆粒度上放小,就會(huì)發(fā)現(xiàn)聲音是的連續(xù)波形被破壞,如果在傳輸數(shù)字音頻時(shí)丟失一小部分,則可以運(yùn)用預(yù)判波形來補(bǔ)齊完整的數(shù)字音頻聲波。這種技術(shù)被稱為PLC,但如果終端用戶丟失掉的連續(xù)波形比較多,恢復(fù)最初的廣播音頻難度便會(huì)隨之增加。目前互聯(lián)網(wǎng)移動(dòng)音頻場景下,正在逐步開發(fā)TRTC數(shù)字音頻補(bǔ)償技術(shù)。
TRTC的cPLC技術(shù)可以很好地應(yīng)對(duì)音頻連續(xù)丟包的場景,cPLC會(huì)根據(jù)歷史數(shù)字音頻幀進(jìn)行上下文分析,然后再利用數(shù)字音頻波形合成最初的廣播音頻,即使在120毫秒級(jí)別連續(xù)丟幀的情況下,終端用戶收聽到的廣播音頻也能夠具有較好的連續(xù)性,收聽效果流暢度仍然較為完整。
綜上所述,通過分析數(shù)字音頻概念及原理可知,廣播電視工程建設(shè)中數(shù)字音頻技術(shù)的優(yōu)勢主要體現(xiàn)在拓寬音軌、提高儲(chǔ)存能力以及完成精準(zhǔn)剪輯等方面。而在具體的應(yīng)用層面上,數(shù)字調(diào)音臺(tái)、AI數(shù)字音頻技術(shù)、云端音頻數(shù)據(jù)技術(shù)、數(shù)字音頻補(bǔ)償技術(shù)的全面應(yīng)用,將促進(jìn)廣播節(jié)目質(zhì)量全面提升,也必將加速廣播電視工程建設(shè)和高質(zhì)量發(fā)展。