【摘要】隨著我國電子科學技術(shù)的不斷進步,現(xiàn)代廣電媒資管理技術(shù)也有了新的改進。構(gòu)建以智能技術(shù)為基礎的媒資管理一體化系統(tǒng),不僅能降低成本,提高編目質(zhì)量,還能提高檢索效率,提升用戶的體驗感。因此,應充分認識人工智能技術(shù)的重要性,利用語音識別技術(shù)、人臉識別技術(shù)、語音合成技術(shù)以及圖像識別技術(shù)等Al技術(shù),為媒資管理業(yè)務提供素材管理、歸檔、交互、共享以及發(fā)布等功能,對各節(jié)目素材進行高效管理,實現(xiàn)電視節(jié)目智能化制作與運營,以此提升媒資系統(tǒng)對廣播電視臺的業(yè)務能力支撐。
【關(guān)鍵詞】智能技術(shù);現(xiàn)代廣電;媒資管理;有效應用
中圖分類號:G212? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2023.09.068
廣電媒資管理是對各種類型媒體資料數(shù)據(jù),如視音頻資料、文本文件和圖表等進行全面管理的完整解決方案。傳統(tǒng)的媒資管理存在人工成本高、編目的著錄層次低、用戶體驗感不佳等問題。隨著科技不斷的發(fā)展,智能技術(shù)日漸成熟,將智能技術(shù)應用在廣電媒資管理中,形成技術(shù)和內(nèi)容的生產(chǎn)革新。因此,為進一步推動現(xiàn)代廣電行業(yè)健康快速的發(fā)展,國家廣電總局發(fā)布《關(guān)于促進智慧廣電發(fā)展的指導意見》,提出加快人工智能技術(shù)在廣電行業(yè),特別是廣電媒資管理等方面的創(chuàng)新應用,增強廣播電視核心競爭力,推動廣播電視從數(shù)字化、網(wǎng)絡化向智慧化發(fā)展。
1. 智能技術(shù)的相關(guān)概述
智能技術(shù)是指利用計算機實現(xiàn)機器模擬智能行為的技術(shù)。其致力于通過分析海量數(shù)據(jù),把計算機效率和準確性以及判斷力提高到人類水平,完成與人類相同水平的復雜任務,同時也是未來發(fā)展的一個重要的指導方向。在現(xiàn)代廣電媒資管理系統(tǒng)中應用智能技術(shù),可以實現(xiàn)視音頻、圖片、文字的采集、存儲、檢索和再利用,提高了媒資管理系統(tǒng)的安全性和可靠性,提升了檢索體驗,從而推動了現(xiàn)代廣電媒資管理系統(tǒng)的發(fā)展。
2. 智能技術(shù)在現(xiàn)代廣電媒資管理中的重要作用
2.1 降低成本,提高編目質(zhì)量
在傳統(tǒng)媒資管理中,編目是一項既重要又困難的工作。其要將視聽信息作為數(shù)據(jù)單位進行抽取和分類。編目工作者要按照有關(guān)要求,對欄目進行分層次管理,選擇重點框架節(jié)目,提取關(guān)鍵幀,并對節(jié)目的內(nèi)容進行分析,描述所看到的畫面,最后對相應的注目項進行填寫。編目的好壞,將會對此類節(jié)目的后續(xù)再利用率產(chǎn)生重要的影響。在此階段,大部分的編目工作都是靠人工來進行,致使人力成本高,工作效率低。而利用語音識別、OCR識別等智能技術(shù),可以快速自動地編目媒資管理內(nèi)容,對于一些畫面和音質(zhì)較好的節(jié)目,特別是較長時間的節(jié)目內(nèi)容,可進行超過人工的高效、智能化的信息編目。
2.2 提高節(jié)目審核效率
所有出入庫的媒資管理節(jié)目都要經(jīng)過審核。在傳統(tǒng)媒資的審核工作中,大多采用人工方式,對敏感人物、敏感詞語等進行審核。在此期間,要想對敏感信息進行有效把控,審核人員不僅要有資深的專業(yè)知識,具備一定的工作經(jīng)驗,還要經(jīng)過長時間的、不間斷的訓練,這樣的人力資源成本會很高,并且不可避免的會出錯。而智能化技術(shù)中的自動化審核,則是在已有的程序?qū)徍嘶A上,將手工錄入、存取的方法轉(zhuǎn)化為有效的電子作業(yè)。通過互聯(lián)網(wǎng),配合審核機構(gòu),對節(jié)目中的敏感信息進行審核,并將信息與媒資管理系統(tǒng)有關(guān)的業(yè)務進行整合呈現(xiàn),以此提高節(jié)目審核效率。
2.3 提高檢索效率,提升用戶的體驗感
人工編目的著錄層次低導致很多節(jié)目的數(shù)據(jù)無法被完整地抽取,只能根據(jù)關(guān)鍵字進行檢索,致使檢索的維度很低。而編輯記者在使用過程中,也因自己查找不到所需要的節(jié)目而困惑。智能檢索是智能化技術(shù)的重要組成部分,它為廣電節(jié)目的編輯記者們提供了一個整合的平臺。用戶可以利用系統(tǒng)中所具有的全文檢索框,來對節(jié)目信息進行集中檢索。檢索的結(jié)果可以按需求進行歸類顯示,同時還可以利用知識庫的功能,將檢索到的有關(guān)詞匯和知識圖庫信息顯示出來,為用戶提供智能化的媒資管理推薦服務。對于所提取的節(jié)目信息,若有視頻信息使用者提出回調(diào)請求,則可以在各個媒資管理系統(tǒng)中完成回調(diào)過程。
3. 現(xiàn)代廣電媒資管理中常用的智能技術(shù)類型
3.1 基于圖像識別的智能技術(shù)
圖像識別是通過處理、分析和解析圖像,從而對圖像進行分類和對象存儲的一項智能化技術(shù)。人臉識別、場景識別和視頻識別等方面都是在圖像識別的基礎上進行的。從模式選擇及判別決策方法的角度來看,可將圖像識別技術(shù)分為模糊模式識別、統(tǒng)計模式識別、神經(jīng)網(wǎng)絡模式識別和句法模式識別四大類。卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)是目前使用最為廣泛的一種圖像識別方法,使用CNN進行圖像識別時,要先采用一種選擇式搜尋法,來檢測影像中物體所在的位置,再由CNN按順序擷取該影像的特征量,并將影像的特征量與儲存于資料庫內(nèi)的對象進行比較,從而得到識別的結(jié)果。
3.2 基于人臉識別的智能技術(shù)
人臉識別技術(shù)是根據(jù)人體面部的特點,來判斷圖像或視頻中有無人臉的一項智能技術(shù)。人臉識別技術(shù)具有非接觸性、便捷性、穩(wěn)定性和并發(fā)性等優(yōu)點,在安保、金融、媒體等諸多方面得到了廣泛的應用。其中,人臉識別的關(guān)鍵技術(shù)是面部捕捉與面部特征匹配。首先要對人臉進行捕捉,根據(jù)人臉的特征,來提取和定位信息,并進行人臉信息檢測和計算,然后將人臉與背景進行分割,從而實現(xiàn)對人臉信息的存儲。在采集到人臉信息后,利用卷積神經(jīng)模式識別等方法,對人臉信息進行提取和分類,最后實現(xiàn)人臉的識別。目前,基于深度學習的人臉識別方法在提高識別精度的同時,對光照、姿態(tài)和復雜的環(huán)境也有著很好的抗干擾功能。在實驗中,臉部識別和臉部圖像的識別都能達到99.5%的準確率。
3.3 基于OCR識別的智能技術(shù)
光學字符識別(OCR識別)是指將各種票據(jù)、報刊、書籍、文稿和其他印刷材料中的文字進行掃描,轉(zhuǎn)換成影像,然后將影像資料轉(zhuǎn)換成電腦輸出的一項智能技術(shù)。OCR技術(shù)在現(xiàn)代廣電產(chǎn)業(yè)中得到了廣泛的應用,其主要是將電視中的字幕內(nèi)容轉(zhuǎn)化為文字信息。OCR識別要根據(jù)文字場景特點,結(jié)合深度學習、圖像目標檢測和內(nèi)容識別技術(shù),利用特征提取、特征增強、邊界盒生成和邊界優(yōu)化等多種計算方法,來確定文本信息,然后進行文本校正、字符分割、字符分類,最終通過數(shù)據(jù)庫進行匹配,從而得出結(jié)果。
3.4 基于語音識別的智能技術(shù)
語音識別就是將人們說話的聲音轉(zhuǎn)化為對應的文本。語音識別技術(shù)是通過對語音信號進行終端檢測,判斷出聲音的起始和結(jié)束位置,并實時地對語音信號進行識別,然后利用超級語言模式,自動地預測句子中的會話上下文,并對句子和標點進行智能的預測。同時,語音識別技術(shù)還可以選擇定制的關(guān)鍵詞,以滿足使用者的需求。目前,在我國的主流語音識別系統(tǒng)中,漢語識別的正確率超過95%,可以極大地提升工作效率。
3.5 基于語音合成的智能技術(shù)
語音合成技術(shù)是通過計算機處理,把任意的文本信息變成標準的流利語音信息的智能化技術(shù)。其通常被應用在語音播報、語音導航和智能客服等方面。經(jīng)過了幾十年的發(fā)展,語音合成技術(shù)已相當成熟。其主要技術(shù)包括:波形拼接法、參數(shù)合成法以及規(guī)則合成法。波形拼接合成技術(shù)的基本原理是:將人的聲音直接進行編碼和儲存,然后在合成時,選擇對應的波形進行拼接和組合;參數(shù)合成法可以有效地減少波形拼接法所需的大量的話音儲存量,并預先抽取出相應的參數(shù),以節(jié)省內(nèi)存;而規(guī)則合成法,就是利用音律原理來產(chǎn)生聲音,儲存最少的音節(jié),然后根據(jù)人的語言規(guī)律,把各種音素和音節(jié)合成語音信息。
4. 現(xiàn)代廣電媒資管理中智能技術(shù)的有效應用
目前,廣電媒資管理系統(tǒng)的核心業(yè)務包括匯集節(jié)目內(nèi)容、制作、審核、編目和存儲和運營等,并對各頻道、各播出終端節(jié)目進行整合,以實現(xiàn)傳媒節(jié)目內(nèi)容的運營和管理。在媒資管理系統(tǒng)中,利用智能化技術(shù),可以實現(xiàn)電視節(jié)目智能化制作與運營,完成音頻內(nèi)容的結(jié)構(gòu)化處理,這既降低了人力、物力成本,提高工作效率,又可以利用輔助方式,提高節(jié)目的制作水平,挖掘節(jié)目的價值。
4.1 節(jié)目制作
4.1.1 智能拆條
目前,節(jié)目拆條大多采用EPG(Electronic Program Guide,即電子節(jié)目指南)信息與人工拆條相結(jié)合的方法,但由于EPG的信息不夠準確,人工拆條的工作量很大。而利用智能技術(shù),可以根據(jù)電視的內(nèi)容進行智能的解析,識別出視頻內(nèi)容與背景之間的目標,并進行切換,以此實現(xiàn)視頻拆條的自動化,從而達到快速拆條的效果,這主要是運用在新聞、娛樂等視頻中。
4.1.2 視頻增強
各個平臺的資料庫中都保存著大量的舊片源,這些片源的內(nèi)容都有一定的價值,尤其是對于老用戶來說,它們能夠滿足用戶的長期需要,但是它們的播放品質(zhì)并不能達到目前高清、超高清的標準。為了更好地發(fā)揮此類視頻的作用,提高觀眾的觀賞效果,可以應用視頻增強智能技術(shù),來進行視頻增強、老視頻還原、破損視頻修復等。視頻增強主要是在色彩、對比度、層次感這三個層面上加強圖像質(zhì)量。視頻還原是在每一幀圖像上添加噪點,以提高數(shù)碼圖像質(zhì)量。視頻修復是指在有損節(jié)目的情況下,根據(jù)像素的高可靠位置和強烈圖像梯度變化,對已有缺陷的內(nèi)容進行修復,從而得到完整的邊緣像素,并將其與周邊的像素進行比較。
4.2 內(nèi)容審核
目前,廣電行業(yè)正朝著融媒體方向發(fā)展,其發(fā)展既包括電視頻道的融合與創(chuàng)新,也包括節(jié)目內(nèi)容的整合與分享。節(jié)目內(nèi)容的拓展使其受眾范圍更廣,內(nèi)容審查的覆蓋面更廣,同時也增加了內(nèi)容發(fā)布的風險性。所以,在廣電媒資管理中,必須確保播出內(nèi)容的正確性和及時性。利用人工智能技術(shù),結(jié)合文字識別、語音識別、人臉識別等方式,可以有效地提升文本的審核效率。包括以下功能:一是鑒黃。運用智能技術(shù),將圖片中的涉黃信息精準地鑒別出來。二是鑒暴。運用智能技術(shù),精確地從影像中辨識出各種類型的槍支、反動旗幟、標志和血腥暴力等畫面。三是感測角色辨識。運用智能技術(shù),精準地辨識影像中的敏感角色,并提供角色名字。四是文本辨識。通過智能技術(shù),對影像中的字幕進行精確的辨識,并將其轉(zhuǎn)換成文本,從而將不規(guī)范的內(nèi)容辨識出來。
4.3 智能標簽/智能編目
如今,在廣電媒資管理過程中,采用AI辨識技術(shù)構(gòu)建的智能化媒資系統(tǒng)進行編目,其年產(chǎn)量可達到3萬小時,大大減少了人工成本。同時,該系統(tǒng)還整合了媒資檢索、媒資主題推介等業(yè)務,為編輯記者們提供了一種以人工智能技術(shù)為基礎的智能媒資服務。在智能媒資編目的具體實施過程中,對每個設備和應用模塊進行了規(guī)范化管理,也就是說,在保證應用模塊基本特征相同的情況下,可以通過其他軟件的程序和第三方應用,來替代所應用的模塊。此技術(shù)的規(guī)范化建設理念,為日后擴展自動化編目功能和技術(shù)更新提供了充足的空間。同時,通過字幕抽取、視頻內(nèi)容解析、文本分析、元數(shù)據(jù)清洗等手段,對節(jié)目中出現(xiàn)的臺詞、主題內(nèi)容等進行分類分析,并對節(jié)目內(nèi)容進行智能標注,如人物、時間、地點、場景等,根據(jù)知識庫,標記關(guān)聯(lián)的信息,實現(xiàn)節(jié)目內(nèi)容的智能標引,為節(jié)目編目、檢索、推薦等提供了依據(jù)。基于智能標記,采用個性化分類模式,對項目內(nèi)容進行標準化分類,替代了傳統(tǒng)的人工編目,減少了編目費用,提高了編目工作效率。
4.4 智能化運營支撐
運用人工智能技術(shù),能夠?qū)崿F(xiàn)對多個視頻、多個場景的檢索、瀏覽、調(diào)用和推薦等智能輔助服務。利用自然語音處理、語音識別和圖像識別等多種技術(shù),可以使使用者在大量的視頻檢索中,進行更多的人機互動,其中包含了自然語言短語、語句段落、語音和圖片等。在以上的智能標注與關(guān)聯(lián)分析的基礎上,用戶可以通過智能媒資系統(tǒng),高效、準確地搜索到自己想要的內(nèi)容。而智能媒資系統(tǒng)也會根據(jù)用戶的需求,進一步挖掘節(jié)目內(nèi)容的價值,給用戶提供不同發(fā)布渠道的個性化推薦服務。
5. 結(jié)束語
智能技術(shù)在現(xiàn)代廣電媒資管理中發(fā)揮著十分重要的作用。運用智能化技術(shù),不但能有效地保證用戶對節(jié)目的體驗感,加快與外部資訊的聯(lián)動,還能解決傳統(tǒng)廣電媒資管理的弊端。因此,應重視智能技術(shù)的應用,構(gòu)建以智能技術(shù)為基礎的媒資管理一體化系統(tǒng),運用智能化媒資系統(tǒng)開展制作、審核、編目、存儲和運營等工作,完成音頻內(nèi)容的結(jié)構(gòu)化處理,以此降低人力、物力成本,提高工作效率,提高節(jié)目的制作水平,從而推動現(xiàn)代廣電行業(yè)健康穩(wěn)步地發(fā)展。
參考文獻:
[1]于兵.人工智能為新媒體媒資管理插上智慧的翅膀[J].廣播電視網(wǎng)絡,2022,29(05):82-84.
[2]畢云天,于維緯.打造新一代視頻工廠——智慧媒資生產(chǎn)管理系統(tǒng)助力央視網(wǎng)轉(zhuǎn)型升級[J].現(xiàn)代電視技術(shù),2022(01):86-89.
[3]廉士勇,劉忠濤.人工智能技術(shù)在現(xiàn)代媒資管理系統(tǒng)中的應用[J].現(xiàn)代電視技術(shù),2022(01):90-92.
[4]倪明昊,單文火.人工智能時代新型媒資管理系統(tǒng)的構(gòu)建思路及技術(shù)實現(xiàn)[J].廣播與電視技術(shù),2019,46(03):32-35.
[5]馬蘇青.融媒體時代廣播電臺在媒資管理方面的定位方向與發(fā)展策略思考[J].國際公關(guān),2020(02):44,46.
作者簡介:佟永娜,遼寧省岫巖縣,中級工程師,研究方向:融媒體中心媒資管理.