席驍 劉娜
摘要:《創(chuàng)新中國》是由中央電視臺聯(lián)合深圳市委宣傳部于2018年1月22日推出的一部紀錄片。該片用鮮活的故事記錄當今中國偉大的創(chuàng)新實踐,并在宏大的國際視野中探討中國的創(chuàng)新成長及由此引領(lǐng)的世界影響。該片的最大亮點是在制作中沒有采用真人解說,而是開創(chuàng)性地使用了語音合成技術(shù),再現(xiàn)了已故著名配音大師李易的聲音,完成了世界首部采用人工智能解說的大型紀錄片。文章從《創(chuàng)新中國》人工智能解說創(chuàng)作的突破與困境的角度進行分析,并對未來紀錄片人工智能解說做以大膽展望,以期拋磚引玉,引起人們對紀錄片人工智能解說的關(guān)注和思考。
關(guān)鍵詞:人工智能 紀錄片解說 李易 創(chuàng)新中國
近年來,隨著“真實記錄”逐漸成為電視節(jié)目的發(fā)展趨勢,一批高品質(zhì)紀錄片涌現(xiàn),《創(chuàng)新中國》即其中之一?!秳?chuàng)新中國》由中央電視臺聯(lián)合深圳市委宣傳部于2018年1月22日推出,該片開創(chuàng)性地使用了語音合成技術(shù),再現(xiàn)了已故著名配音大師李易的聲音,完成了世界首部采用人工智能解說的大型紀錄片。本文將從《創(chuàng)新中國》人工智能解說創(chuàng)作的突破與困境角度分析,以期引起人們對紀錄片人工智能解說的關(guān)注和思考。以下將“人工智能解說”簡稱為“AI解說”。
紀錄片AI解說的新突破
根據(jù)紀錄片總導演史巖描述,紀錄片《創(chuàng)新中國》對于解說聲音的要求是“平緩敘事”,在配音員反復(fù)試音無果的同時,一個大膽的設(shè)想出現(xiàn)。是否可使用AI語音的創(chuàng)作方法,再現(xiàn)李易的聲音?!秳?chuàng)新中國》主創(chuàng)團隊與科大訊飛合作,精選出李易老師以往17小時的音頻素材,采用AI語音合成技術(shù)進行人工智能配音,從而“復(fù)活”了已故配音大師李易的聲音。
音色模仿的逼真。紀錄片解說的聲音選擇非常重要,好的選擇能夠起到整合素材、凸顯整體創(chuàng)作風格的作用。北京臺《環(huán)球影視》制片人楊愛華曾這樣評價李易,“李易在中國堪稱最高水平播音員,我們都覺得稿子被他一念就成了佳作”??梢娨徊考o錄片的成敗與解說息息相關(guān)。
“音色”包含“語音音色”和“嗓音音色”密不可分的兩重概念。在“語音音色”方面,畢業(yè)于北京廣播學院的李易,發(fā)音清晰、語句工整。配音演員趙可說,“李易的配音,既標準又自然,莊重而不呆板、活潑而不浮躁”。紀錄片《創(chuàng)新中國》的解說,借助于AI語音技術(shù),吐字歸音工整規(guī)范,音節(jié)之間銜接得當。特別是對于李易句尾音節(jié)獨特共鳴的復(fù)刻,余音繞梁不絕于耳。在“嗓音音色”方面,李易的音色寬厚自然,多運用虛實聲,聲帶基音與多重泛音共鳴配比和諧。在《創(chuàng)新中國》的解說創(chuàng)作中,正是借助李易獨有的嗓音質(zhì)感進行AI語音的生成,充滿紀實魅力,引發(fā)觀眾的審美愉悅。
語言表達的準確。張頌教授所講“有稿播音錦上添花”。紀錄片解說屬于有稿播音創(chuàng)作,要在一片“錦繡”之上運籌帷幄、接續(xù)創(chuàng)作,就要在紀錄片解說創(chuàng)作中錘煉語言表達,發(fā)揮深化主題、細節(jié)描述、思路引導等重要作用。
語言表達過程可分類為對于“邏輯”表達和“情緒”表達兩種傾向。當解說內(nèi)容側(cè)重于說理時,李易的重音多集中在邏輯主干,語速穩(wěn)健、多停少連,呈現(xiàn)出一絲不茍的信息傳遞。當解說內(nèi)容側(cè)重于“情緒表達”時,重音多停留在修飾成分中,停連節(jié)奏變化會更豐富。李易的紀錄片解說,凸顯對解說內(nèi)容的宏觀把握,通篇布局的語流變化精妙得當。在氣息支持下用“虛實聲”推動,語調(diào)隨之提升,點明文字主旨,表達效果極具張力?!秳?chuàng)新中國》的AI解說在“邏輯”的表達時重音清楚、邏輯明晰,在播講“重音”的選擇上與李易呈現(xiàn)出相似特征。同時,在“情緒”表達時,同樣也會凸顯語流的變化來進行抒情,但不足是起伏較快、停留時間較短、缺乏整體把握。輔之,紀錄片的墊樂分擔了部分情緒渲染任務(wù)。
紀錄片導演史巖表示,“我們的宗旨,并非完全復(fù)原,而是創(chuàng)造一個我們心目中的人,這個人從李易老師演化而來,帶有一部分語感特點,但所有的斷句、重音、字頭、字腹、字尾、動程,都是在現(xiàn)有語音合成技術(shù)上重新設(shè)計的?!?/p>
創(chuàng)作途徑的新穎。AI創(chuàng)作是一種新穎的形式,如今人工智能技術(shù)成為新一輪科技革命和產(chǎn)業(yè)變革的聚焦點。在藝術(shù)創(chuàng)作領(lǐng)域,人工智能早已有作品問世,例如微軟小冰的詩集《陽光失了玻璃窗》。國內(nèi)在媒體領(lǐng)域也早有AI智能的身影,例如新華社財經(jīng)欄目的機器人記者“快筆小新”。
AI解說屬于新穎創(chuàng)作途徑,目前AI作為播報工具發(fā)揮著重要作用,進而AI如何表達情感則是一個新的挑戰(zhàn)??拼笥嶏w主管江源表示,運用人工智能技術(shù)為紀錄片配音,這對他們來說也是一次優(yōu)化算法、提升人工智能水準的機會。AI解說也創(chuàng)造了一種新的可能性,李易是平實解說風格的開創(chuàng)者,用AI技術(shù)還原再現(xiàn)李易的解說,給創(chuàng)作者提出了一個新的思路。
紀錄片AI解說的困境
目前,AI人工智能技術(shù)還處于初級階段。有聲語言創(chuàng)作充分融入創(chuàng)作者的主觀能動性,具有人格化,符號交流過程飽含著情感態(tài)度。紀錄片的解說具有情感要求,成了AI解說的難題。
觀點態(tài)度表達困難。紀錄片的解說是一種接受美學創(chuàng)作,解說者觀點態(tài)度影響著觀眾對于紀錄片內(nèi)容的思考。觀點態(tài)度更多是內(nèi)心層面的思維活動,借助外部表達技巧實現(xiàn)?,F(xiàn)有不足是AI解說主要對于語言外部技巧進行模擬,難以深入語言的內(nèi)在意蘊,止步于信息傳遞,無法達到觀點態(tài)度的表達。
語流語氣運用生澀。語氣通過語流呈現(xiàn),是情感表達的關(guān)鍵。吐字歸音是“唇形、舌位、口腔、音調(diào)”的變化過程,字詞寓于語流之中,相鄰的音節(jié)也會產(chǎn)生音變。紀錄片的語言表達往往具有“一氣呵成”的創(chuàng)作美感,音節(jié)與音節(jié)之間的銜接恰如其分、自然流暢。相比之下的AI解說,有聲波堆疊的痕跡,語流略顯生澀。播音主持創(chuàng)作反對見字出聲,即對于語流作用的重視。AI解說時,語流變化幅度較小也不具有大跨度的語流分析能力,語氣表達略顯生澀。
創(chuàng)作風格依賴模仿。風格屬于美學范疇,由創(chuàng)作者自身因素和外部因素所決定?,F(xiàn)階段,AI播音員主持人往往具有真實原型,觀眾因為惟妙惟肖的模仿而產(chǎn)生新鮮感,并不是AI播音員主持人其自身生命力。紀錄片解說有著豐富的審美創(chuàng)作要求,李易的紀錄片解說將情感融入有聲語言創(chuàng)作,實現(xiàn)與觀眾的心聲交流,這一過程充滿了審美趣味。所以,如何讓AI具有“人性”,進而創(chuàng)作出具有獨立風格的作品,還是一個技術(shù)難題。
紀錄片AI解說的未來展望
計算機科學之父“圖靈”為人類打開了一扇人工智能的大門,如今人工智能技術(shù)在“藝術(shù)創(chuàng)作”和“情感陪伴”領(lǐng)域均有實踐,人們可展望隨著人工智能技術(shù)的提升,必然會繼續(xù)催生新的變革。
藝術(shù)創(chuàng)作是人類思維的碩果,AI技術(shù)的涌入拓展了創(chuàng)作的思路。對于紀錄片AI解說來說,專題紀錄片市場廣大,再加上新媒體帶來的大量快銷作品的創(chuàng)作需求,AI智能語音的準確度、穩(wěn)定品質(zhì)和創(chuàng)作高效率低成本,將會成為亮點,成為解說創(chuàng)作的新選擇。
腦機融合創(chuàng)作的思路。人腦擁有創(chuàng)作“意識”,AI智能語音擁有語音生成能力,提高紀錄片的情感表達,也許人機合作完成便是一種途徑。在《創(chuàng)新中國》的創(chuàng)作中,技術(shù)人員首先進行原聲素材采樣,運用AI技術(shù)生成紀錄片解說的聲音初稿,此時已具有了較高的完整度。剩下的問題語句和情感表達關(guān)鍵點則由主創(chuàng)團隊和技術(shù)人員共同完成。由主創(chuàng)團隊在文稿上重點標注之后再由技術(shù)人員利用語音“實驗室”級的技術(shù),實現(xiàn)重音、停連、節(jié)奏的人工調(diào)整,一段解說詞生成出不同的表達版本以供備選,再由主創(chuàng)團隊放入紀錄片畫面進行適配確定。再經(jīng)過多人多輪的審聽最終定稿,用主創(chuàng)者的說法即改掉了配音中的硬傷,使整體質(zhì)量達到了平均水平。
這是讓AI語音賦予情感的初次嘗試,也許創(chuàng)作過程艱辛,但也證明了人機結(jié)合方式的重要性。隨著腦機融合技術(shù)的發(fā)展,也許在紀錄片AI解說領(lǐng)域,即可出現(xiàn)腦波干預(yù)下的AI語音技術(shù),人類解說員的細膩情緒變化可通過傳感器融入AI解說創(chuàng)作,給機器賦予“靈性”,從而生成出真正的情感表達,值得人們思考。
人工智能情感技術(shù)的發(fā)展。人工智能情感技術(shù)是基于大數(shù)據(jù)、云計算、人工智能、深度神經(jīng)網(wǎng)絡(luò)等智能技術(shù)的融合。也許借此程序擁有人類感情可真正實現(xiàn),微軟的人工智能機器人“小冰”已在中國完成了300億次用戶對話,同時也提供了人類情感反應(yīng)模式的海量數(shù)據(jù)。在未來,人們與AI智能進行交流時,會和人類交流無差別。日本石黑浩教授在描述人工智能未來發(fā)展時,第一個詞是“意識”。展望未來,如果人們能夠更好地認知人類思維的形成機理,機器人便可能真正擁有“意識”“想象力”和“創(chuàng)新力”,從而具有情感魅力的紀錄片AI解說,便不再是“巧婦難為無米之炊”。
結(jié)語
紀錄片《創(chuàng)新中國》記述了現(xiàn)實中國的創(chuàng)新壯舉,讓國人為之興奮和驕傲。與此同時,主創(chuàng)團隊推動AI智能技術(shù)在紀錄片解說領(lǐng)域邁進,世界首創(chuàng)。AI紀錄片解說是人類“藝術(shù)”與“技術(shù)”的兩大實踐的相會,迸發(fā)出創(chuàng)新火花。人工智能的運用,讓人們更加深刻地認識了人類思維與情感的本質(zhì),人工智能技術(shù)也將繼續(xù)推動紀錄片AI解說向未來邁進,紀錄永駐,創(chuàng)新不止。(作者單位:江西應(yīng)用科技學院)
參考文獻:
1.姚喜雙:《播音主持藝術(shù)》,北京,北京廣播學院出版社,1997年版。
2.蔡自興,徐光祐:《人工智能及其應(yīng)用》(第五版),北京,清華大學出版社,2016年版。
3.翁佳:《智能語音技術(shù)對播音主持專業(yè)與行業(yè)影響探究》,《電視研究》,2017(12)。
4.程粟:《〈創(chuàng)新中國〉:新時代科技紀錄片的精品之作》,《當代電視》,2018(11)。