• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      智能語(yǔ)音技術(shù)在廣播產(chǎn)業(yè)中的四種應(yīng)用

      2020-04-15 03:55朱飛虎焦慶爭(zhēng)
      中國(guó)廣播 2020年3期
      關(guān)鍵詞:傳統(tǒng)廣播

      朱飛虎 焦慶爭(zhēng)

      【摘要】智能語(yǔ)音技術(shù)自上世紀(jì)末開(kāi)始在廣播產(chǎn)業(yè)中應(yīng)用,隨著深度學(xué)習(xí)算法的普及而有了強(qiáng)大的技術(shù)支撐。目前,智能語(yǔ)音在廣播產(chǎn)業(yè)中有四種應(yīng)用,即廣播內(nèi)容采集、廣播內(nèi)容生成、廣播內(nèi)容傳播、廣播內(nèi)容管理,本文對(duì)此做簡(jiǎn)單梳理,以明確下一步工作的推進(jìn)。

      【關(guān)鍵詞】智能語(yǔ)音 廣播產(chǎn)業(yè) 傳統(tǒng)廣播

      【中圖分類號(hào)】G221 【文獻(xiàn)標(biāo)識(shí)碼】A

      1997年,比利時(shí)萊爾努·豪斯派(Lernout&Hauspie)公司發(fā)布了Naturally Speaking軟件的1.0版本并大受好評(píng),這是第一款為世界所知的消費(fèi)級(jí)智能語(yǔ)音軟件產(chǎn)品。人們驚嘆于它的連續(xù)語(yǔ)音識(shí)別能力和準(zhǔn)確度,并愿意為此付費(fèi),這讓該公司很快取得了商業(yè)上的成功。

      Naturally Speaking的成功直接啟發(fā)了其他公司或組織對(duì)于加快智能語(yǔ)音應(yīng)用的思考。彼時(shí),NaturallySpeaking的愿景是為專業(yè)人士分擔(dān)工作,用語(yǔ)音識(shí)別的方式幫助他們完成文檔、報(bào)告、郵件、表格、日程安排等工作。但是,很快人們就將智能語(yǔ)音的應(yīng)用場(chǎng)景從個(gè)人辦公拓寬到汽車、醫(yī)療、通信、家電等行業(yè)應(yīng)用中,智能語(yǔ)音技術(shù)在廣播產(chǎn)業(yè)中的應(yīng)用也是從這一時(shí)期起步的。比如:日本電報(bào)電話公司(NTT,Nippon Telegraph&Tel Corp)自行研發(fā)了一套實(shí)驗(yàn)性的語(yǔ)音交互系統(tǒng),用于廣播和數(shù)字通信中的語(yǔ)音轉(zhuǎn)錄與信息提?。?997年);①美國(guó)麻省理工學(xué)院媒體實(shí)驗(yàn)室為廣播電臺(tái)設(shè)計(jì)了一款廣播內(nèi)容分析軟件,可以基于興趣偏好為用戶匹配類似的音頻新聞故事(2000年);②日本放送協(xié)會(huì)(NHK,Nippon hoso kyokai)在自己的廣播電視新聞節(jié)目中使用一套字幕實(shí)時(shí)轉(zhuǎn)錄系統(tǒng),解決了鍵盤(pán)輸人新聞字幕速度跟不上播音語(yǔ)速的同題(2000年);③歐洲的葡萄牙及很多其他葡萄牙語(yǔ)國(guó)家則應(yīng)用了一套名為AUDIMUS的語(yǔ)音識(shí)別引擎,用以進(jìn)行廣播播出監(jiān)控和音頻數(shù)據(jù)自動(dòng)轉(zhuǎn)錄,可以實(shí)現(xiàn)低誤差和后期4倍加速效果。④

      當(dāng)然,當(dāng)時(shí)的智能語(yǔ)音技術(shù)在廣播產(chǎn)業(yè)的這些應(yīng)用存在著非常大的局限性:一是基本只有智能語(yǔ)音中的語(yǔ)音識(shí)別技術(shù)得到了應(yīng)用,缺乏與其他技術(shù)的聯(lián)動(dòng),應(yīng)用的場(chǎng)景非常有限,多數(shù)用于廣播節(jié)目的后期轉(zhuǎn)錄存檔。二是應(yīng)用的范圍有限。因?yàn)楫?dāng)時(shí)語(yǔ)音識(shí)別軟件的穩(wěn)定性、適應(yīng)性還存在一些問(wèn)題,所以這種應(yīng)用只能在廣播播出間、編輯室中展開(kāi)。三是很多智能語(yǔ)音系統(tǒng)還處在實(shí)驗(yàn)性階段,大部分不甚成熟且造價(jià)較高,故這種應(yīng)用基本上只在一些發(fā)達(dá)國(guó)家的規(guī)模較大的廣播電臺(tái)中存在。

      智能語(yǔ)音技術(shù)在廣播產(chǎn)業(yè)中的應(yīng)用水平是以智能語(yǔ)音技術(shù)發(fā)展水平為前提的,2006年之后,隨著深度學(xué)習(xí)算法在智能語(yǔ)音研究領(lǐng)域中的普及,智能語(yǔ)音的技術(shù)水平才迅速發(fā)展。智能語(yǔ)音在廣播產(chǎn)業(yè)中的應(yīng)用也迅速鋪展開(kāi)來(lái),同時(shí)開(kāi)始向縱深推進(jìn)。

      一、智能語(yǔ)音在廣播內(nèi)容采集中的應(yīng)用

      傳統(tǒng)廣播內(nèi)容采編,主要依靠記者在現(xiàn)場(chǎng)通過(guò)錄音筆、電腦以及紙筆進(jìn)行記錄,而整理采訪資料時(shí)經(jīng)常需要重復(fù)聽(tīng)錄音,費(fèi)時(shí)費(fèi)力。智能語(yǔ)音的出現(xiàn)為這個(gè)問(wèn)題提供了一種解決方法。

      2015年,原中央人民廣播電臺(tái)和中國(guó)科學(xué)院簽署協(xié)議,決定共建中國(guó)廣播云平臺(tái),其中一項(xiàng)重要內(nèi)容就是建立國(guó)內(nèi)廣播電臺(tái)全媒體采編系統(tǒng),實(shí)現(xiàn)人工智能時(shí)代廣播新聞采編的進(jìn)化。在全媒體采編系統(tǒng)中,記者可以通過(guò)手機(jī)采編客戶端將采訪錄音實(shí)時(shí)轉(zhuǎn)化為文字,辨識(shí)正確率在95%以上,并且可以進(jìn)行語(yǔ)義修改,基本上達(dá)到了即采即發(fā)的標(biāo)準(zhǔn),極大地提高了新聞采編的效率。這套系統(tǒng)支持蒙古族、藏族、維吾爾族、哈薩克族、朝鮮族等5個(gè)少數(shù)民族語(yǔ)言和中、英、俄、法、日、韓等多國(guó)語(yǔ)言,可在采訪錄音時(shí)通過(guò)智能語(yǔ)音引擎將上述語(yǔ)言實(shí)時(shí)翻譯為中文,突破了記者個(gè)人能力的限制,將“不可能的采訪”變成了可能。

      不過(guò),這套全媒體采編系統(tǒng)仍然存在局限,比如需要依賴手機(jī)進(jìn)行錄音,在嘈雜的采訪環(huán)境或現(xiàn)場(chǎng)遠(yuǎn)距離采訪中效果就不甚理想;還需要依賴手機(jī)網(wǎng)絡(luò)信號(hào),遇到復(fù)雜網(wǎng)絡(luò)場(chǎng)景(如大型發(fā)布會(huì)現(xiàn)場(chǎng))或者無(wú)網(wǎng)絡(luò)場(chǎng)景(如偏遠(yuǎn)山區(qū))時(shí),語(yǔ)音轉(zhuǎn)化能力也大打折扣,語(yǔ)音翻譯則基本不可用。

      眾多的智能語(yǔ)音公司嘗試為新聞?dòng)浾呱a(chǎn)專門的智能語(yǔ)音采訪設(shè)備來(lái)解決這些問(wèn)題,科大訊飛股份有限公司就是其中的先行者。其在2018年推出了專門針對(duì)媒體工作者的專業(yè)轉(zhuǎn)寫(xiě)設(shè)備“訊飛M1轉(zhuǎn)寫(xiě)助手”,并將之提供給一些中央級(jí)媒體進(jìn)行全國(guó)兩會(huì)采訪使用。這款設(shè)備能夠有效拾取十米范圍內(nèi)的聲音并進(jìn)行數(shù)字降噪,實(shí)現(xiàn)遠(yuǎn)距離無(wú)損錄音;同時(shí)內(nèi)置離線智能語(yǔ)音數(shù)據(jù),可以實(shí)現(xiàn)無(wú)網(wǎng)絡(luò)條件下的轉(zhuǎn)寫(xiě)和翻譯。2019年,科大訊飛股份有限公司又推出面向會(huì)議采訪的語(yǔ)音轉(zhuǎn)寫(xiě)移動(dòng)工作站——訊飛轉(zhuǎn)寫(xiě)機(jī),除了能夠精準(zhǔn)拾取與識(shí)別會(huì)議、講座、發(fā)布會(huì)的語(yǔ)音內(nèi)容并實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)文字和即時(shí)翻譯之外,還能夠識(shí)別不同聲源,智能區(qū)分不同說(shuō)話者的聲音,并按照人物將文字稿分類排布。目前訊飛轉(zhuǎn)寫(xiě)機(jī)由于售價(jià)昂貴,尚未在記者群體中普及,但在不少大型會(huì)議現(xiàn)場(chǎng)已經(jīng)可以見(jiàn)到它的身影,主辦方主要使用訊飛轉(zhuǎn)寫(xiě)機(jī)進(jìn)行現(xiàn)場(chǎng)雙語(yǔ)字幕直播,同時(shí)為記者提供現(xiàn)場(chǎng)語(yǔ)音和文字實(shí)錄。其通過(guò)“語(yǔ)音+圖像”同步智能識(shí)別技術(shù),能夠自動(dòng)查找、識(shí)別演講者投影屏幕中的關(guān)鍵詞匯,并將其自動(dòng)添加到語(yǔ)音識(shí)別引擎中,實(shí)時(shí)生效,大幅提升了專業(yè)詞匯的識(shí)別效果,⑤減輕了記者后期文字編輯的工作量,也降低了可能出現(xiàn)的專業(yè)知識(shí)紕漏。

      類似的專業(yè)智能語(yǔ)音設(shè)備其實(shí)還有很多,比如瑞典Anoto公司生產(chǎn)的Livescribe智能筆,它支持記者在采訪時(shí)邊錄音邊用智能筆寫(xiě)下關(guān)鍵信息,并將錄音與文字同步到云端,在采訪結(jié)束后,在手機(jī)應(yīng)用中點(diǎn)擊相關(guān)文字時(shí),將會(huì)播放當(dāng)時(shí)的實(shí)況錄音,這將有利于音頻資料的查詢與廣播節(jié)目制作。還有北京搜狗公司推出的搜狗智能錄音筆C1,它在基本的語(yǔ)音轉(zhuǎn)文字功能的基礎(chǔ)上,還完善了自動(dòng)分段、語(yǔ)氣詞過(guò)濾、關(guān)鍵詞優(yōu)化、在線編輯、重點(diǎn)標(biāo)記等功能。⑥

      隨著越來(lái)越多的廣播電臺(tái)都開(kāi)始為記者配備這些體積小巧、功能完善的專業(yè)級(jí)智能語(yǔ)音采訪設(shè)備,智能語(yǔ)音技術(shù)正在廣播內(nèi)容采集中發(fā)揮越來(lái)越大的作用。

      二、智能語(yǔ)音在廣播內(nèi)容生成中的應(yīng)用

      盡管最早的CRT示波器在1897年就已經(jīng)出現(xiàn),但示波技術(shù)被廣泛應(yīng)用在廣播內(nèi)容制作上卻是20世紀(jì)60年代之后的事情,它讓廣播采集的內(nèi)容變?yōu)椤耙曈X(jué)可見(jiàn)”。盡管這是廣播內(nèi)容制作的一個(gè)巨大飛躍,但是它也存在著“可見(jiàn)卻難以理解”的原生缺陷,節(jié)目制作者往往需要花費(fèi)大量時(shí)間反復(fù)聆聽(tīng)來(lái)確認(rèn)具體內(nèi)容,故而效率也是無(wú)法保持的。要解決這一問(wèn)題,必須使廣播由“視覺(jué)可見(jiàn)”變?yōu)椤耙曈X(jué)可理解”,而智能語(yǔ)音恰恰能夠滿足這一點(diǎn)。

      2017年7月,江蘇省廣播電視總臺(tái)面向內(nèi)部推出了一套內(nèi)容編譯系統(tǒng),⑦用于廣播節(jié)目的后期制作。這套系統(tǒng)能夠通過(guò)智能語(yǔ)音將廣播音頻文件轉(zhuǎn)化為文字,并將音頻內(nèi)容與文字內(nèi)容一一對(duì)應(yīng)、說(shuō)話者聲音與特定顏色一一對(duì)應(yīng)。這套系統(tǒng)可以實(shí)現(xiàn)以下功能:一是支持通過(guò)文字進(jìn)行音頻尋址,這讓編輯可以快速找到所需音頻片段并進(jìn)行剪輯;二是支持預(yù)設(shè)敏感詞,并對(duì)含有敏感詞匯的廣播內(nèi)容進(jìn)行特定顏色標(biāo)注,這將有利于編輯進(jìn)行節(jié)目審核;三是支持視頻內(nèi)容字幕制作,為廣播電臺(tái)在新媒體平臺(tái)上的聲音、文字、視頻融合傳播提供便捷。觀察這套系統(tǒng)的運(yùn)行邏輯,我們會(huì)發(fā)現(xiàn),智能語(yǔ)音是其實(shí)現(xiàn)眾多功能的核心,它通過(guò)聲音與文本的內(nèi)容轉(zhuǎn)化,將音頻波形編輯轉(zhuǎn)變成文檔編輯甚至圖形編輯,從根本上打破了媒介編輯的界限,改變了傳統(tǒng)廣播內(nèi)容后期制作的方式,在極大程度上提高了廣播內(nèi)容制作效率。應(yīng)當(dāng)說(shuō),江蘇省廣播電視總臺(tái)的這套系統(tǒng)是智能語(yǔ)音技術(shù)在廣播內(nèi)容制作中后臺(tái)編譯方面的成功應(yīng)用,但這一系統(tǒng)目前還未推廣開(kāi)來(lái),無(wú)論是國(guó)內(nèi)還是國(guó)外,類似的嘗試還比較少見(jiàn)。

      與此同時(shí),智能語(yǔ)音技術(shù)在廣播內(nèi)容制作中的另一種應(yīng)用卻較為廣泛地出現(xiàn)在了各大廣播電臺(tái)中,這就是擬人化的智能語(yǔ)音角色參與到節(jié)目前臺(tái)播報(bào)之中。最具代表性的是由微軟(亞洲)互聯(lián)網(wǎng)工程院研發(fā)的“小冰”智能語(yǔ)音技術(shù),從2017年北京廣播電視臺(tái)青年廣播FM98.2、湖南廣播電視臺(tái)音樂(lè)之聲FM89.3、中央廣播電視總臺(tái)國(guó)廣HitFM FM88.7三家廣播頻率開(kāi)始,到2019年8月1日,“小冰”已經(jīng)在國(guó)內(nèi)主持了63檔電臺(tái)和電視臺(tái)的節(jié)目。⑧在這些節(jié)目中,“小冰”或與真人主持人搭檔,或自己全程主持,所表現(xiàn)出的主持水準(zhǔn)令人贊嘆。對(duì)于廣播內(nèi)容制作來(lái)說(shuō),“小冰”的加人所帶來(lái)的益處是顯而易見(jiàn)的:一是能夠讓廣播電臺(tái)真正實(shí)現(xiàn)全天候、不間斷地高質(zhì)量播出,充分保證了廣播節(jié)目制作和播出的持續(xù)性。二是能夠確保提供精確信息。因?yàn)椤靶”敝R(shí)儲(chǔ)備非常豐富,且不會(huì)出現(xiàn)口播差錯(cuò),保證了廣播節(jié)目制作和播出的穩(wěn)定性。三是通過(guò)了解聽(tīng)眾喜好,“小冰”能夠因人而變,實(shí)時(shí)為用戶提供精準(zhǔn)的內(nèi)容服務(wù),這提升了廣播節(jié)目制作和播出的針對(duì)性。四是能夠豐富廣播節(jié)目樣態(tài)?!靶”背丝梢宰鲋鞑?,還可以做新聞評(píng)論員、歌手、詩(shī)人等,它能應(yīng)聽(tīng)眾之邀不時(shí)地在廣播節(jié)目中唱上幾句或者評(píng)論一下時(shí)事,或?yàn)槟硞€(gè)來(lái)電聽(tīng)眾寫(xiě)首藏頭詩(shī),這些功能是普通真人主持人所難以一人兼具的。因?yàn)椤靶”钡某錾憩F(xiàn),正有越來(lái)越多的國(guó)內(nèi)廣播電臺(tái)向它發(fā)出邀請(qǐng)。

      三、智能語(yǔ)音在廣播內(nèi)容傳播中的應(yīng)用

      2019年6月,美國(guó)國(guó)家公共廣播電臺(tái)(NPR,National Public Radio)與美國(guó)愛(ài)迪生研究公司(EdisonResearch)發(fā)布了一份《智能語(yǔ)音報(bào)告》,報(bào)告顯示,在美國(guó)18歲以上的成年人中,21%的人擁有一臺(tái)智能音箱,擁有人數(shù)達(dá)到5300萬(wàn),而2018年這一數(shù)字是1400萬(wàn),其增長(zhǎng)率高達(dá)378.6%。在擁有智能音箱的被調(diào)查對(duì)象中,有42%的人會(huì)使用智能音箱來(lái)獲取新聞,37%的人會(huì)聽(tīng)AM/FM廣播,55%的人則認(rèn)為他們?cè)趽碛兄悄芤粝渲舐?tīng)了更多的音頻內(nèi)容,還有74%和66%的人表示他們會(huì)在做家務(wù)或者下廚的時(shí)候使用智能音箱。

      盡管這份報(bào)告表征的是美國(guó)智能音箱的使用現(xiàn)狀,但它是具有代表性的,至少說(shuō)明了智能語(yǔ)音在廣播內(nèi)容傳播中的幾個(gè)重要作用:一是擴(kuò)展了用戶的廣播收聽(tīng)渠道。這讓廣播在傳統(tǒng)廣播收音機(jī)、智能手機(jī)之外,有了更多傳播渠道的可能。在中國(guó),智能音箱2019年在中國(guó)市場(chǎng)的用戶規(guī)模已經(jīng)達(dá)到了2370萬(wàn)臺(tái),相較2018年的257萬(wàn)臺(tái)提升了近8倍。⑨在英國(guó),2018年智能音箱已經(jīng)有950萬(wàn)用戶,比2017年增長(zhǎng)98.6%,而這一數(shù)字在2019年將會(huì)再增長(zhǎng)31.6%,達(dá)到1260萬(wàn)人。⑩二是增加了用戶的廣播收聽(tīng)頻率。人們樂(lè)于通過(guò)簡(jiǎn)單的喚醒詞打開(kāi)智能音箱,并使用便捷的語(yǔ)音交互選擇自己喜歡的廣播頻率,讓它伴隨性地播放。三是使廣播重新進(jìn)入家庭。在客廳中,智能音箱越來(lái)越成為和電視一樣的必備家電,它使一家人聚在一起共同聆聽(tīng)廣播,就仿若在美國(guó)上世紀(jì)30年代一家人通過(guò)收音機(jī)聆聽(tīng)羅斯福的“爐邊談話”一般。

      智能語(yǔ)音技術(shù)為廣播的內(nèi)容傳播開(kāi)辟了新市場(chǎng),并吸引著越來(lái)越多的廣播電臺(tái)將自己的頻率與智能音箱連接,以便觸達(dá)更多用戶。早在2014年,美國(guó)國(guó)家公共廣播電臺(tái)便與亞馬遜Echo智能音箱合作,成為其默認(rèn)新聞提供商,而后又人駐谷歌Home智能音箱和蘋(píng)果Homepod智能音箱,為它們提供廣播音頻內(nèi)容;美國(guó)NBC環(huán)球集團(tuán)的消費(fèi)者新聞與商業(yè)頻道(CNBC,Consumer News and Business Channel)則從2016年12月起開(kāi)始為亞馬遜Echo智能音箱提供新聞服務(wù);英國(guó)廣播公司(BBC)也在2017年12月宣布,亞馬遜Echo智能音箱的用戶可以在這一平臺(tái)上收聽(tīng)英國(guó)廣播公司56個(gè)廣播頻率的內(nèi)容,同時(shí)還將《阿澈一家》《女性時(shí)間》等熱門節(jié)目搬到了上面。⑧同時(shí),值得關(guān)注的是,由于進(jìn)駐了這些智能語(yǔ)音平臺(tái),廣播公司所生產(chǎn)的內(nèi)容可以被用戶以語(yǔ)音控制的方式無(wú)障礙地發(fā)現(xiàn)。

      上述應(yīng)用非常重要,雖然這種連接,本質(zhì)上還只是廣播內(nèi)容傳播的渠道延伸。其實(shí),在智能語(yǔ)音這樣一個(gè)新的聲音消費(fèi)平臺(tái)上,業(yè)界更關(guān)注的是探索一種與廣播電臺(tái)、網(wǎng)絡(luò)電臺(tái)完全不同的聲音傳播與消費(fèi)形式,這是智能語(yǔ)音為廣播內(nèi)容傳播所帶來(lái)的新思考。從已有的實(shí)踐來(lái)看,這種形式主要有以下三種:

      猜你喜歡
      傳統(tǒng)廣播
      傳統(tǒng)廣播如何運(yùn)用新媒體“鎖定”聽(tīng)眾
      新媒體背景下傳統(tǒng)廣播與新媒體融合發(fā)展的策略探討
      新媒體背景下傳統(tǒng)廣播的發(fā)展策略
      傳統(tǒng)廣播與新媒體的有效融合探析
      活力(2016年8期)2016-11-12
      基于新媒體環(huán)境下的網(wǎng)絡(luò)廣播發(fā)展的思考
      新兴县| 夏河县| 呼伦贝尔市| 陵川县| 武邑县| 荔波县| 龙山县| 沈阳市| 汶川县| 蒙城县| 安远县| 曲靖市| 吉安市| 拉萨市| 澎湖县| 从江县| 长乐市| 邹城市| 江油市| 潞西市| 咸宁市| 德惠市| 永安市| 扬州市| 酒泉市| 千阳县| 阿勒泰市| 吴江市| 新闻| 卢湾区| 龙岩市| 阳朔县| 黄大仙区| 长垣县| 郸城县| 万安县| 安福县| 伊春市| 西丰县| 筠连县| 连城县|