孫 暢
(山西應(yīng)用科技學院,山西 太原 030062)
人工智能(Artificial Intelligence,AI)是當今數(shù)字時代的關(guān)鍵驅(qū)動力之一,其在新聞制播領(lǐng)域的應(yīng)用正日益引起廣泛關(guān)注。AI 技術(shù)提高了新聞生產(chǎn)效率,為媒體行業(yè)帶來了個性化內(nèi)容推送和創(chuàng)新的可能性[1]。本文旨在深入研究人工智能在新聞領(lǐng)域的應(yīng)用,探討自動化寫作、自然語言處理、AI 語音合成以及深度遷移學習等技術(shù)如何改變新聞傳播方式,為未來的媒體發(fā)展提供有益的見解。
人工智能是計算機科學領(lǐng)域的分支,旨在使計算機系統(tǒng)具備類似人類智能的能力。其基本概念包括機器學習(即計算機通過數(shù)據(jù)學習改進執(zhí)行任務(wù)的能力)和深度學習(一種模擬人類大腦神經(jīng)網(wǎng)絡(luò)的技術(shù))[2]。人工智能技術(shù)誕生于1956 年。直到20 世紀末,隨著計算能力的增強和大數(shù)據(jù)的普及,人工智能技術(shù)才取得顯著的進展。深度學習、卷積神經(jīng)網(wǎng)絡(luò)及循環(huán)神經(jīng)網(wǎng)絡(luò)等技術(shù)的崛起,推動了人工智能技術(shù)的快速發(fā)展,使其在自然語言處理、計算機視覺及自動化駕駛等領(lǐng)域取得了突破。今天人工智能技術(shù)已經(jīng)廣泛應(yīng)用于醫(yī)療保健、金融、交通及媒體等各個領(lǐng)域,成為現(xiàn)代科技和社會發(fā)展的關(guān)鍵推動力。
人工智能的關(guān)鍵技術(shù)包括深度學習(Deep Learning,DL)、人工智能生產(chǎn)內(nèi)容(Artificial Intelligence Generated Content,AIGC)、自然語言處理以及AI 語言合成等[3]。深度學習技術(shù)模仿人類大腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),用于訓練計算機從大量數(shù)據(jù)中學習和提取模式。目前,深度學習技術(shù)已進入升級優(yōu)化階段,圖像分類、機器翻譯等多類感知任務(wù)準確率大幅度提升,強化學習、遷移學習等新學習方法發(fā)展迅速?;谏疃葘W習理論的優(yōu)化技術(shù)發(fā)展迅速。GPT-3 等模型的發(fā)展,推動視覺處理、閱讀理解等任務(wù)處理能力提升。虛擬助手、多語種翻譯等智能應(yīng)用進入規(guī)?;瘧?yīng)用階段。隨著人工智能越來越多地被應(yīng)用于內(nèi)容創(chuàng)作領(lǐng)域,人工智能生產(chǎn)內(nèi)容的概念悄然興起。從技術(shù)和實現(xiàn)功能角度來看,AIGC 可分為智能數(shù)字內(nèi)容孿生、智能數(shù)字內(nèi)容編輯及智能內(nèi)容數(shù)字創(chuàng)作3 個方面。AIGC 被廣泛應(yīng)用于三維重構(gòu)、音頻修復(fù)、語音合成、視覺描述、摘要生成、數(shù)字人、智能作畫及短片創(chuàng)作等領(lǐng)域。自然語言處理(Natural Language Processing,NLP)是計算機科學、人工智能、語言學關(guān)注計算機與人類(自然)語言之間相互作用的領(lǐng)域,支持聊天機器人、語義分析及情感分析等應(yīng)用。AI 語言合成技術(shù)使計算機能夠?qū)⑽谋巨D(zhuǎn)化為逼真的語音,廣泛用于語音助手、有聲讀物等領(lǐng)域。
人工智能生產(chǎn)內(nèi)容與傳媒行業(yè)的融合應(yīng)用不斷升級,AIGC 作為全新的內(nèi)容生產(chǎn)方式,全面賦能傳媒行業(yè)的內(nèi)容生產(chǎn),推動新聞行業(yè)的制作升級[4]。比如,寫稿機器人、采訪助手、視頻字幕生產(chǎn)、語音播報、視頻集錦及人工智能合成主播等,助力新聞采集、編輯、播報的轉(zhuǎn)型升級。
在新聞采編環(huán)節(jié),通過語音識別技術(shù),可將錄音語音轉(zhuǎn)換成文字,提升新聞編輯的時效性。例如,2022 年冬奧會期間,科大訊飛智能錄音筆助力新聞記者進行跨語種語音轉(zhuǎn)寫,提升了新聞記者的采訪效率。人工智能基于算法自動編寫新聞,能夠?qū)崿F(xiàn)智能新聞寫作。以騰訊寫作機器人Dreamwriter 為例,它是一套基于數(shù)據(jù)和算法的智能寫作輔助系統(tǒng),每年可生產(chǎn)30 萬篇作品,助力新聞生產(chǎn),通過視頻字幕生成、視頻錦集、視頻拆條及視頻超分等實現(xiàn)視頻智能化剪輯。2020 年全國兩會期間,人民日報社通過智能云剪輯師完成新聞節(jié)目的制作工作,如自動匹配字幕、人物實時追蹤、畫面抖動修復(fù)及橫屏轉(zhuǎn)豎屏等技術(shù),實現(xiàn)了兩會新聞視頻的快速生成。
在新聞傳播環(huán)節(jié),AIGC 主要應(yīng)用于AI 合成主播新聞播報。AI 合成主播實現(xiàn)了實時新聞?wù)Z言與人物動畫的完美融合,輸入新聞文本內(nèi)容,可自動生成AI合成主播新聞視頻,并實現(xiàn)AI合成主播表情、動作的高度擬人化。當前,AI 合成主播的應(yīng)用領(lǐng)域不斷拓展,新華社、中央廣播電視總臺、人民日報、央視頻等紛紛推出AI 合成主播,如新小微、新小浩、小C 及王冠等。AI 合成主播在常規(guī)新聞播報領(lǐng)域的應(yīng)用逐漸成熟,并不斷拓展新的應(yīng)用領(lǐng)域,如多語種新聞播報和手語播報[5]。2022 年冬奧會期間,央視頻AI 手語主播“聆語”亮相冬奧會,憑借手語準確、清晰易懂等優(yōu)點深受大家喜愛?!榜稣Z”具備唇動、面部表情、肢體動作及手指動作等內(nèi)容生產(chǎn)功能,是2D 形象向3D 形象的重要轉(zhuǎn)變,在冬奧會期間完成手語手勢2 000 個,服務(wù)人次超216 萬次。
自然語言處理(NLP)在新聞制播領(lǐng)域的應(yīng)用范圍廣泛,利用計算機算法和語言學知識,使計算機能夠理解、處理和生成人類語言的文本[6]。超大預(yù)訓練模型的發(fā)展,推動了NLP 技術(shù)的新發(fā)展。自2020 年OpenAI 公司推出GPT-3 之后,谷歌、華為、百度、中科院及阿里巴巴等紛紛推出超大規(guī)模預(yù)訓練模型,如Switch Transformer、MT-NLG、盤古及悟道2.0 等,在參數(shù)數(shù)量與訓練數(shù)據(jù)規(guī)模方面有顯著提升。超大預(yù)訓練模型從早期的學習文本數(shù)據(jù)向文本、圖像、語音3 種模態(tài)發(fā)展。自然語言處理在新聞制播中的具體應(yīng)用如下。
(1)文本分析和信息提取。理解數(shù)字內(nèi)容是對其編輯和修改的前提。計算機視覺中的圖片、視頻剪輯和自然語言處理中的生成,都需要語義理解技術(shù)?;谏赡P偷目山怦钫Z義學習技術(shù)能夠很好解決這一問題。在新聞制播領(lǐng)域,NLP 技術(shù)用于從大量文本數(shù)據(jù)中提取關(guān)鍵信息,幫助記者和編輯快速獲取新聞線索。例如,新聞機構(gòu)使用NLP 算法來自動識別和提取關(guān)于特定主題或事件的關(guān)鍵詞和短語。
(2)情感分析。情感分析是一種NLP 應(yīng)用,用于分析文本中的情感和情緒。在新聞制播中,情感分析可以幫助了解公眾對某個事件或話題的情感反應(yīng)。例如,新聞網(wǎng)站使用情感分析應(yīng)用來監(jiān)測社交媒體上對其新聞報道的用戶反饋,以了解觀眾的情感傾向。
(3)文本生成。自動化文本生成是NLP 的一個重要應(yīng)用,用于生成新聞?wù)?、報道和新聞稿。?023 年6 月拓爾思發(fā)布的“拓天大模型”為例,其主要功能是內(nèi)容生產(chǎn)智能助手,基于拓爾思自有的超1 000億互聯(lián)網(wǎng)媒體資訊數(shù)據(jù)、超100億官媒數(shù)據(jù)、14 大類知識標引規(guī)范、12 000 多條知識標引規(guī)則作為專業(yè)訓練數(shù)據(jù),具有內(nèi)容生成、多輪對話、語義理解、跨模態(tài)交互、知識型搜索、邏輯推理、安全合規(guī)、數(shù)學計算、編程能力以及插件擴展十大基礎(chǔ)能力。其在新聞制播領(lǐng)域的應(yīng)用,能夠極大提升新聞的生產(chǎn)效率。
AI 語言合成技術(shù)在新聞制播中的應(yīng)用是將文本內(nèi)容自動轉(zhuǎn)化為逼真的語音,提供聲音新聞、播報和實時信息。為新聞機構(gòu)創(chuàng)造有聲新聞、播音員以及語音助手,改善用戶體驗。新聞應(yīng)用和網(wǎng)站使用AI 語言合成技術(shù)來為用戶提供新聞文章的語音版本,使用戶可以在駕車、鍛煉或處理多任務(wù)時方便地獲取新聞信息。AI 語言合成技術(shù)還可用于創(chuàng)建個性化的語音新聞播報,根據(jù)用戶的興趣和時間表定制播報內(nèi)容,提供更個性化的新聞服務(wù)。在新聞制播領(lǐng)域,AI 語言合成技術(shù)的典型應(yīng)用是5G 智慧電臺AI 主播,通過語音合成和深度學習等技術(shù),克隆出媲美真人主播播報能力的AI 主播,能夠智能抓取主流官方媒體新聞內(nèi)容,并依托AI 語音合成技術(shù)將新聞文字內(nèi)容轉(zhuǎn)換成音頻。5G 智慧電臺已有多位AI 新聞主播,如AI 主播慧琳、AI 主播智文、AI 主播慧嘉、AI 主播智云、AI 主播慧蕓及AI主播智凱等。
深度遷移學習在新聞制播中的應(yīng)用涉及將已經(jīng)訓練好的神經(jīng)網(wǎng)絡(luò)模型遷移到新的任務(wù)或領(lǐng)域,以提高模型的性能。在新聞制播中,這項技術(shù)用于改進新聞推薦系統(tǒng)。通過將先前訓練好的模型用于用戶行為分析、內(nèi)容推薦和個性化新聞策劃,新聞機構(gòu)可以更準確地理解用戶興趣,提供相關(guān)、有針對性的新聞內(nèi)容,提高用戶滿意度。這有助于增加用戶的參與度,提高新聞機構(gòu)的品牌忠誠度,同時為廣告定位提供更有效的平臺。以黑龍江廣播電視臺“基于深度遷移學習的新聞個性化推薦系統(tǒng)”為例,該系統(tǒng)通過分析用戶的歷史行為數(shù)據(jù),利用深度遷移學習技術(shù)學習用戶的興趣模式,從而為用戶精準推薦他們可能感興趣的新聞內(nèi)容。系統(tǒng)運用自然語言處理技術(shù),對新聞內(nèi)容進行深度的語義分析,以更準確地把握用戶的興趣所在,有效地提高新聞傳播的效果,滿足用戶個性化的新聞需求。
本文探討了人工智能技術(shù)在新聞制播領(lǐng)域的應(yīng)用,重點介紹了人工智能生產(chǎn)內(nèi)容、自然語言處理、AI 語言合成技術(shù)及深度遷移學習等方面。通過研究發(fā)現(xiàn),人工智能技術(shù)的應(yīng)用可以提高新聞制播的效率和質(zhì)量,同時能為用戶提供更加個性化的新聞服務(wù),實現(xiàn)新聞制播的更高質(zhì)量和更廣泛的影響。