姚瀚飛
(蘇州大學(xué) 傳媒學(xué)院 江蘇 蘇州 215000)
杜比全景聲(Dolby Atoms)是杜比實驗室推出的給予聽眾沉浸式聽感體驗的先進(jìn)解決方案,最初用于烘托影視畫面,使影視作品的受眾更加具有沉浸感體驗。杜比全景聲最直觀的特質(zhì)表現(xiàn)為其用聲響塑造了一個三維的空間,觀眾如置身該空間之內(nèi),身臨其境。由此,傳統(tǒng)5.1,7.1 聲道的概念被打破,從此帶來了聲音立體性、擬真性、動態(tài)的跳躍性等特征的全新突破。它可以適用于影院最多64個獨(dú)立揚(yáng)聲器、128 個通道的播放。隨著技術(shù)壁壘的不斷淡化,杜比全景聲逐步從影視行業(yè)推廣到音樂制作領(lǐng)域,使得音樂混音也可以借助杜比全景聲工作套件(Dolby Atoms Production Suit,DAPS)與數(shù)字音頻工作站(Digital Audio Workstation,DAW)的聯(lián)動,創(chuàng)造出更為豐富多彩的音樂聽感,將聽眾包圍在聲音當(dāng)中。越來越多的混音工作者開始逐步綜合杜比全景聲規(guī)格進(jìn)行音樂混音。
長久以來,音頻從業(yè)者與技術(shù)開發(fā)者一直在追求不斷進(jìn)步的視聽解決方案。由單聲道起始,發(fā)展到立體聲,緊接著是環(huán)繞聲,最典型的便是5.1 聲道環(huán)繞聲。環(huán)繞聲電影早在20 世紀(jì)70 年代就被應(yīng)用了起來。數(shù)字音頻的5.1 標(biāo)準(zhǔn)被電影首次應(yīng)用于1992 年的《蝙蝠俠·歸來》中,由此,行業(yè)標(biāo)準(zhǔn)被又一次地刷新,環(huán)繞聲成為此后電影的基本配備。直到世界上第一部杜比全景聲電影《勇敢傳說》于2012 年上映,往后距今的十年時間,不勝枚舉的全景聲規(guī)格電影如雨后春筍般不斷涌現(xiàn)。杜比全景聲快速、穩(wěn)定地占據(jù)了原本立體聲、環(huán)繞聲方案的聽眾,由此帶動了音頻制作從業(yè)者不斷地對杜比全景聲進(jìn)行探索與應(yīng)用。
與電影不同的是,音樂制作的標(biāo)準(zhǔn)長期停滯于立體聲的解決方案,主要原因為環(huán)繞聲的音樂需要在環(huán)繞聲設(shè)備環(huán)境下才可被正確回放。數(shù)據(jù)顯示,全球70%的音樂播放場景來自于耳機(jī),環(huán)繞聲音樂并不具備相應(yīng)的回放環(huán)境。因而,早期的環(huán)繞聲音樂并不具備被生產(chǎn)出的應(yīng)用價值與適配場景,僅為理想化、概念化但可以實現(xiàn)的產(chǎn)品。全景聲則更甚。無論是音樂生產(chǎn)者還是受眾,無法涉足全景聲音樂的原因往往來自于回放設(shè)備的限制。塑造一個收聽環(huán)繞聲的標(biāo)準(zhǔn)環(huán)境,需要從10 到64 個回放設(shè)備,這要求了相當(dāng)大的塑造成本。
但上述問題并非無法被解決。隨著杜比實驗室研發(fā)的Binaural Music(其實現(xiàn)原理將在后文詳細(xì)闡述)出現(xiàn),用耳機(jī)生產(chǎn)和收聽全景聲格式的音頻成為可能。隨之而來的是越來越多全景聲音樂作品的上線。Apple music 推出的全景聲播放模式也是基于Binaural 音樂,使聽眾得以用耳機(jī)收聽全景聲音樂。這其中大部分作品都是原音樂基于杜比全景聲規(guī)格進(jìn)行重新混音的產(chǎn)物。這表明全景聲制作可以不修改音樂制作的其他環(huán)節(jié),而只在混音環(huán)節(jié)上進(jìn)行修改,因此全景聲音樂愈加適配化、普遍化、流行化,對音樂混音制作者提出了時代性、創(chuàng)新型、變革性的要求。
2021 年6 月,Apple music 宣布支持杜比全景聲格式的音樂。2022 年4 月19 日,梅賽德斯-奔馳正式發(fā)布基于EVA 平臺的中大型純電豪華SUV——EQS SUV,成為奔馳品牌首個搭載杜比全景聲配置的汽車。在普通家用端,越來越多的聽眾應(yīng)用回音壁產(chǎn)品來模擬全景聲的回放環(huán)境。這似乎說明全景聲的音樂制作時代正在到來。
雙聲道立體聲的錄音,最早出現(xiàn)在20 世紀(jì)50年代。此前,單聲道音頻還是一切音頻類型的主流標(biāo)準(zhǔn)。1968 年,The Beatles 樂隊的歌曲《Hey Jude》中,聽眾仍然會聽到把架子鼓的聲像處理到極左的混音方式,這體現(xiàn)出在立體聲混音方式的習(xí)慣法出現(xiàn)前,混音工作者對于立體聲混音的探索過程。立體聲道通過二向的聲源,播放不同的聲音,使得聲音由原來單聲道的“點(diǎn)”變?yōu)榱恕熬€”,此時的聲音仍是一維的。
環(huán)繞聲出現(xiàn)后,在兩點(diǎn)聲源構(gòu)成的線外確立了一個或多個新的“點(diǎn)”。當(dāng)三個以上的點(diǎn)連接成面,標(biāo)志著立體聲拓展為環(huán)繞聲,聲音由此進(jìn)入二維的、扁平的空間,聽眾被包圍在僅具備平面、卻沒有縱深的二維面,聽眾則在這個“面”中,通過人耳收聽到的聲源播放變化而感知空間。因而,環(huán)繞聲的空間感仍具有有限性。
直到2012 年,全景聲的概念被首次提出,環(huán)繞聲自此發(fā)展到了全景聲。此時聲音具備了形成空間的X、Y、Z軸,真正成為一個聲音的“三維空間”。聽眾不再是被聲音“包圍”,而是被完整地“包裹”在由各聲源構(gòu)建的空間當(dāng)中。
全景聲像較以往環(huán)繞聲(以5.1 環(huán)繞聲標(biāo)準(zhǔn)為例)最典型的革新之處在于,由“聲道”的制作理念,轉(zhuǎn)變?yōu)榛凇鞍l(fā)聲體空間信息”的理念。例如,在由6 只音箱(中央聲道、前置左、右聲道、后置左、右環(huán)繞聲道,以及0.1 聲道重低音聲道)組成的5.1環(huán)繞聲系統(tǒng)的環(huán)境中,這些聲道在聲音播放時被分為左前、右前、左后、右后四組,在影院觀看5.1 環(huán)繞聲標(biāo)準(zhǔn)的電影時,影院播放環(huán)境內(nèi)的所有音箱,僅能被分為以上四組,聲像變化也是由一組轉(zhuǎn)化到另一組,并不能完全再現(xiàn)影片中聲音最精準(zhǔn)和細(xì)致的變化。即便發(fā)展到后來的7.1 聲道,也是由四組變?yōu)榱M,聲音的變化仍是“組”到“組”的變化。這些都不能算是讓聲音具象起來的最終解決方案。而杜比全景聲就是使每一只音箱都擁有自主獨(dú)立的聲道,由“組”的單位,變?yōu)椤皞€”的單位。在聲音移動時,每一只音箱都各自變化,播放不同的聲音。
上文所述的“發(fā)聲體空間信息”,在全景聲混音中具象為“對象(Object)”和“聲床(Bed)”兩個概念。
在以往的立體聲或環(huán)繞聲中,聲音的回放都是通過“通道”這一概念實現(xiàn)的。聲音的聲像變化的原理,是通過幾個音箱(通道)之間的響度變化實現(xiàn)的。而全景聲混音的理念,是讓聽眾沉浸于基于X、Y、Z軸塑造的空間當(dāng)中,它的每一個聲音不再是以通道為基礎(chǔ),而是以全新的“Object”為基礎(chǔ)。這個Object 不再是指某一個通道中的聲音,而是某一個特定的“物體”或聲源,從而實現(xiàn)在全景聲空間當(dāng)中更自由且精準(zhǔn)的移動,從而擺脫聲道的感念,擺脫回放設(shè)備中音箱數(shù)量對聲音位置變化的束縛,使任何一個音色都可以成為在全景聲模擬環(huán)境中存在的發(fā)聲體。Bed稱之為聲床,聲床是一個基于7.1.2的十通道環(huán)繞聲,一般用于不移動的環(huán)繞聲源,如音樂混音中的管弦樂、鼓、貝斯等等,或者是配樂中的混響、噪音、Pad 等相對穩(wěn)定的鋪底聲[1]。
全景聲音樂的混音方法與傳統(tǒng)立體聲音樂混音存在著革新性的差異,其處理方法幾乎是完全不同的。全景聲音樂混音截然不同的工作原理帶來了截然不同的工作要求。下文通過對其混音原理的推導(dǎo),分析未來其對混音工作可能帶來的新標(biāo)準(zhǔn)與要求。
在以往立體聲音樂的混音工作當(dāng)中,首要待解決的問題就是頻段沖突問題,即所謂頻段“打架”的問題。由于在立體聲音樂混音當(dāng)中,所要求的回放設(shè)備僅為兩只音箱,因而頻段沖突不可避免[2]。這也導(dǎo)致在混音過程中對于個別音色做出妥協(xié)成為常態(tài),只能通過各種手段進(jìn)行頻率的避讓。優(yōu)秀的混音作品,在各頻段的配合上相得益彰。當(dāng)各頻段的聲音由于不平衡而相互沖突時,會帶來雜亂、刺耳的聽感,各配器之間的動態(tài)與張力無法被表現(xiàn)出來。由此可見,“融合度”是混音工作中的一個默認(rèn)的標(biāo)準(zhǔn)。
而在全景聲的概念當(dāng)中,頻段沖突問題或不再成為考量混音作品合格與否的標(biāo)準(zhǔn),混音工作中對于各頻段的處理,不再要求將“融合度”這一概念作為混音的一大要義。所有配器、人聲及其他聲音的各頻段皆可被調(diào)整為其最佳狀態(tài),將其散播在三維聲場的廣大空間當(dāng)中?!叭诤稀边@一概念的向心力逐漸淡化,同頻段間的互斥性在全景聲音樂的混音制作中擁有了逐漸離心的過程。
經(jīng)由聽眾審美的不斷選擇,立體聲混音工作在自誕生到現(xiàn)在的近70 年的時間里,積累出具有歷史繼承性的習(xí)慣法,比如底鼓、貝斯等穩(wěn)固節(jié)奏的樂器必須放在聲場的正中間,人聲大多時候放在中間,原聲吉他、和聲要放到極左極右等等。但至少目前為止,全景聲混音并未像立體聲混音一樣形成相對完善和成熟的“規(guī)則”。在廣闊的三維空間中,聲像真正可以被擺放在其應(yīng)當(dāng)所處的任何位置。在全景聲混音工作中,對于聲音像位不再具有絕對性要求,同樣失去了客觀標(biāo)準(zhǔn)。唯一衡量最終的音樂像位“正確”與否的標(biāo)準(zhǔn),被賦予混音師自身的決定權(quán)上,即客觀標(biāo)準(zhǔn)轉(zhuǎn)向為混音師的主觀判斷。
以往的立體聲混音,幾乎是一個技術(shù)對藝術(shù)的加工過程?;煲羰欠駥儆谒囆g(shù)創(chuàng)作,仍是一個難以界定的問題。但可以確定的是,傳統(tǒng)混音工作是一個工具理性為主導(dǎo)的工業(yè)化生產(chǎn)過程。但在全景聲混音中,絕對的客觀性減少,主觀性加大,這必然是將混音工作藝術(shù)化的過程?;煲艄ぷ鞯膬r值理性占比大大增加,成為一個藝術(shù)創(chuàng)作的過程。
全景聲混音是通過數(shù)字渲染器實現(xiàn)的,而渲染器又并非模擬電路能夠?qū)崿F(xiàn),于是進(jìn)入全景聲混音階段后,模擬調(diào)音臺正在逐步被邊緣化,并被排擠出全景聲音樂制作的必要性工具之外。
全景聲制作最終導(dǎo)出的文件為ADM 文件,其中包含bed 和object 的全部空間信息以及bed 軌道和object 的分軌,可以實現(xiàn)工程互換。這對于音樂制作流程來說,會極大提高團(tuán)隊合作的可能性,從而使混音工作中主觀干擾與長時間工作的聽覺麻木對混音工作的負(fù)面影響大大減少,制作效率也得到極大程度的提高。
杜比實驗室結(jié)合頭部相關(guān)變換函數(shù)(Head Related Transfer Function,HRTF)模擬了人耳對聲音的感知特性,從而使大腦重構(gòu)出這些聲音的不同空間屬性[3]。一個完整的ADM 音樂文件,經(jīng)過HRTF 濾波后輸出為一個立體聲文件,可以極大程度地模擬出較為真實的“全景聲”空間感,這就是Binaural 版本的全景聲音頻。杜比全景聲渲染器的Binaural 模式,提供了在沒有合乎標(biāo)準(zhǔn)的回放環(huán)境下使用耳機(jī)進(jìn)行全景聲混音的可能。這意味著,即使混音師不在全景聲混音棚中,仍然可以使用耳機(jī)進(jìn)行全景聲音樂的混音。經(jīng)由Binaural 模式進(jìn)行混音的作品,放到全景聲回放環(huán)境中可能會有所偏差,但現(xiàn)在全景聲音樂的受眾,絕大多數(shù)收聽的也是Binaural 音樂,所以在全景聲音樂制作當(dāng)中,這個偏差幾乎可以忽略不計。但這種方式的不足之處也很明顯,即只有通過耳機(jī)重放才能獲得較好的效果,使用外放則會造成經(jīng)過人頭結(jié)構(gòu)濾波所造成的二次HRTF 染色[4]。
下文將討論如何使用耳機(jī),在Binaural 模式下進(jìn)行混音工作。
杜比全景聲工作套件已經(jīng)開發(fā)出兩個版本,分別是DAMS(Dolbby Atoms Mastering Suit)和DAPS(Dolby Atoms Production Suit)。其 中,DAPS 的功能足以滿足大部分音頻創(chuàng)作者對全景聲混音制作的要求。
DAPS 3.0 版本后,杜比實驗室開發(fā)了一個虛擬聲卡Dolby Atoms Bridge(DAB),這是一個基于Core Audio 的虛擬聲卡驅(qū)動。將Pro tools 軟件或者Nuendo 軟件的驅(qū)動(Driver)全部設(shè)置為DAB,就可以將Beds 和Objects 通過DAB 全部路由到渲染器(Dolby Atoms Renderer)中,將DAR 渲染后的喇叭信號輸出到聲卡輸出中。由于Pro tools 對Core Audio 聲卡格式的限制,暫時只能將32 個通道的Objects 和Beds 送到渲染器,但Nuendo 軟件不存在此類問題[5]。
具體制作時,首先需要打開DAPS 中的Dolby Atoms Renderer,在Preference 菜單中選擇Audio Driver 選項為Core Audio,Audio input device 選項中選擇Dolby Audio Bridge,通過這個虛擬設(shè)備使Renderer 接受來自DAW 的信號。Audio output device 選項選擇當(dāng)前鏈接監(jiān)聽設(shè)備的聲卡,這樣,來自Renderler 的聲音就可被聽到。在下方的external sync source 菜單選擇DAW 和Renderer 的同步機(jī)制。DAW 需要發(fā)送一個同步信號讓Renderer 接收,其中LTC 指的是同步信號的內(nèi)容是音頻,而MTC 指的是同步信號內(nèi)容是MIDI,選擇默認(rèn)的LTC 即可。
通過LTC 方式接收到音頻信號后,需要選擇一個通道進(jìn)行接收,于是需要在下方LTC inpute channel 選項中選擇通道,默認(rèn)是129。由于其他128 路是Beds 與Objects 的信號輸入,于是同步信號自然需要通過單獨(dú)的第129 路進(jìn)行接收。如圖1 所示。如果是制作Binaural 音樂,需要將下方的Headphone only mode開啟。其下方的幀率與采樣率,要確保與DAW 工程設(shè)置的幀率與采樣率一致。
圖1 聲卡、通道及輸入輸出選擇
進(jìn)入左側(cè)Headphone 選項,渲染模式選擇Binaural,如圖2 所示。
圖2 渲染模式選擇
隨后進(jìn)入宿主,選擇工程的音頻驅(qū)動為Dolby Atoms Bridge,將工程采樣率與幀率設(shè)置為與Renderer 一致。將Master 軌道改為多路輸出,硬件發(fā)送設(shè)置為與線路一致的數(shù)量,如將Master 輸出為64 路,則將硬件發(fā)送設(shè)置為1-64,如此一來,DAW的64 路輸出就接入到了Renderer 的64 路輸入。
新建FX 軌道,插入杜比LTC Generator 同步插件,設(shè)置好幀率,發(fā)送到第129 路輸出,并不輸出到除129 路外的任何一軌道,如圖3 所示。
圖3 幀率設(shè)置
此時在DAW 中進(jìn)行走帶時,Renderer 中的時間碼也在同步滾動。界面的左側(cè)有128 個圓圈,表示128 個通道,其中前十個紫色的圓圈為Bed 通道。數(shù)量為十個,表明默認(rèn)聲床是7.1.2 的配置,而其他通道則是Object。此時便可以在renderer 中開展全景聲音樂的混音工作了。
在DAW 中,每一聲音軌道需要與輸出到Renderer 中的軌道相對應(yīng)。比如有一個立體聲的音源,則需要選擇輸出為11-12 總線。通過Dolby Atoms Music Panner,替換DAW 中的panner 插件進(jìn)行全景聲聲像的擺位。
最后,為了在兼容杜比全景聲的系統(tǒng)或設(shè)備上正確播放,最終輸出的杜比全景聲混音作品的響度電平不得高于-18 LUFS。
本文總體敘述了全景聲音樂發(fā)展的背景,簡述了全景聲音樂混音的原理差異與實際應(yīng)用的方法,旨在闡述當(dāng)今全景聲音樂混音時代的大背景下,音樂的混音工作應(yīng)當(dāng)如何向新方向開展,以及如何創(chuàng)作出全景聲優(yōu)秀的全景聲音樂混音作品等,意在盡可能給予廣大混音工作者新的嘗試方案。
現(xiàn)如今,許多宿主均已內(nèi)嵌DAPS 系統(tǒng),如Cubase 12.0.2 版本、Nuendo 10.1 以上版本等。進(jìn)行全景聲音樂混音工作,不再要求一個特定的全景聲混音室,而是僅需要使用耳機(jī)就可以進(jìn)行Binaural 全景聲音樂的混音。在全景聲混音快速發(fā)展的今天,人人皆可嘗試用全景聲混音去制作出更新標(biāo)準(zhǔn)、更高質(zhì)量的音樂了。