人工智能發(fā)展與有聲閱讀平臺(tái)創(chuàng)新探析

2022-03-31 21:53:32余苗趙文聰

傳媒 2022年6期

余苗趙文聰

摘要：互聯(lián)網(wǎng)大數(shù)據(jù)、深度學(xué)習(xí)等新技術(shù)正在引領(lǐng)人工智能發(fā)展的新浪潮，并催生可提高眾多領(lǐng)域生產(chǎn)力與經(jīng)濟(jì)效益的新應(yīng)用。有聲閱讀平臺(tái)作為視聽媒介的新興代表，注重將人工智能技術(shù)運(yùn)用到內(nèi)容創(chuàng)作、分發(fā)、管理、反饋等關(guān)鍵流程，讓聲音在新技術(shù)助推下成為更智能的數(shù)字化產(chǎn)品。通過(guò)調(diào)研荔枝等音頻平臺(tái)并分析人工智能技術(shù)與平臺(tái)的發(fā)展現(xiàn)狀，本文探析人工智能對(duì)平臺(tái)的創(chuàng)新推動(dòng)以及面臨問(wèn)題，以期為有聲閱讀平臺(tái)的持續(xù)創(chuàng)新提供可行建議。

關(guān)鍵詞：人工智能??有聲閱讀??互聯(lián)網(wǎng)平臺(tái)??音頻傳播

互聯(lián)網(wǎng)廣泛普及帶來(lái)的數(shù)據(jù)電子化，推動(dòng)著以大數(shù)據(jù)、深度學(xué)習(xí)、自然語(yǔ)言處理等為代表的人工智能技術(shù)發(fā)展新浪潮。依托移動(dòng)互聯(lián)、智能終端的有聲閱讀平臺(tái)為拓展創(chuàng)新空間，將人工智能技術(shù)運(yùn)用到創(chuàng)作、分發(fā)、管理、反饋等流程的多個(gè)維度。在新興人工智能技術(shù)助推下，有聲閱讀平臺(tái)正加速向個(gè)性化、智能化、精準(zhǔn)化發(fā)展，但也存在隱私泄露、數(shù)據(jù)標(biāo)注等問(wèn)題亟待解決。

一、人工智能技術(shù)與移動(dòng)有聲閱讀平臺(tái)的發(fā)展

人工智能技術(shù)發(fā)展日趨成熟，深度學(xué)習(xí)、自然語(yǔ)言處理等相關(guān)技術(shù)已經(jīng)進(jìn)入大規(guī)模應(yīng)用期。有聲閱讀平臺(tái)的崛起與信息傳播技術(shù)息息相關(guān)，每次技術(shù)革新都會(huì)帶動(dòng)有聲閱讀領(lǐng)域的創(chuàng)新突破。人工智能技術(shù)在有聲閱讀平臺(tái)的廣泛運(yùn)用，正推動(dòng)平臺(tái)在內(nèi)容、功能、設(shè)備等方面的智能化發(fā)展。

1.實(shí)現(xiàn)智能化內(nèi)容。有聲閱讀平臺(tái)通過(guò)人工智能技術(shù)對(duì)內(nèi)容進(jìn)行智能處理，能夠?qū)崿F(xiàn)內(nèi)容創(chuàng)作的智能化。大多數(shù)有聲閱讀平臺(tái)屬于內(nèi)容型平臺(tái)，人工智能相關(guān)技術(shù)的有效運(yùn)用，可以幫助平臺(tái)探索個(gè)性化、風(fēng)格化、便捷化的內(nèi)容創(chuàng)作，在塑造平臺(tái)品牌風(fēng)格的同時(shí)提升互聯(lián)網(wǎng)用戶黏性。

2.打造智能化功能。有聲閱讀平臺(tái)正運(yùn)用人工智能技術(shù)，圍繞互聯(lián)網(wǎng)產(chǎn)品的重要功能嘗試優(yōu)化升級(jí)，以期實(shí)現(xiàn)平臺(tái)功能的智能化。有聲閱讀平臺(tái)當(dāng)前重點(diǎn)探索的智能化功能，大多聚焦搜索關(guān)聯(lián)、內(nèi)容推薦及搜索結(jié)果排序等方面。平臺(tái)期望通過(guò)廣泛的信息組織和提取，推進(jìn)基于互聯(lián)網(wǎng)大數(shù)據(jù)的算法優(yōu)化與深度學(xué)習(xí)，進(jìn)而對(duì)各類用戶實(shí)現(xiàn)更為精準(zhǔn)的目標(biāo)觸達(dá)。

3.開發(fā)智能化設(shè)備。有聲閱讀平臺(tái)作為視聽媒介的新興代表和互聯(lián)網(wǎng)音頻傳播的典型應(yīng)用，在注重平臺(tái)自身發(fā)展的基礎(chǔ)上，也在積極延伸產(chǎn)業(yè)鏈。例如，有聲閱讀平臺(tái)借助相對(duì)成熟的人工智能技術(shù)尋求外部合作，開發(fā)智能音箱、可穿戴設(shè)備等智能化終端，探索內(nèi)容的多終端傳播與跨平臺(tái)消費(fèi)，進(jìn)一步實(shí)現(xiàn)“耳朵經(jīng)濟(jì)”的更多場(chǎng)景布局。

二、人工智能助推有聲閱讀平臺(tái)內(nèi)容生產(chǎn)個(gè)性化

互聯(lián)網(wǎng)大數(shù)據(jù)、深度學(xué)習(xí)、自然語(yǔ)言處理等人工智能新技術(shù)的發(fā)展與應(yīng)用，正助推有聲閱讀平臺(tái)內(nèi)容的生產(chǎn)、管理、傳播等方面變革創(chuàng)新，其中平臺(tái)的內(nèi)容生產(chǎn)已經(jīng)朝著個(gè)性化定制、個(gè)性化社區(qū)等方向發(fā)展。

1.用戶聲音的個(gè)性化定制。媒介資源的富足提升了受眾的審美品位，使得受眾在滿足基本需求的基礎(chǔ)上，開始追求更能彰顯自我的個(gè)性化需求。有聲閱讀平臺(tái)以往千篇一律的機(jī)械合成聲音已不能滿足用戶需求，聲音的“定制化”成為新趨勢(shì)。人工智能技術(shù)在聲音商業(yè)化探索中扮演了重要的支持角色，通過(guò)對(duì)海量音頻信息的處理以及在此基礎(chǔ)上的認(rèn)知深化，為受眾提供多元個(gè)性化聲音模板，并通過(guò)語(yǔ)音合成技術(shù)實(shí)現(xiàn)即時(shí)的個(gè)性化聲音呈現(xiàn)，變換出聲音新玩法。

以專業(yè)的音頻分享平臺(tái)荔枝為例，用戶原創(chuàng)內(nèi)容（UGC，User-Generated Content）是荔枝平臺(tái)的核心優(yōu)勢(shì)。荔枝在聲音定制層面利用人工智能研發(fā)多種技術(shù)來(lái)重塑聲音，使人工智能有效賦能UGC內(nèi)容生產(chǎn)。AI在線音頻技術(shù)如美聲、調(diào)音臺(tái)、魔音（錄音棚、演唱會(huì)、小黃人等）、百變音效（歡呼、魔性笑聲、掌聲等），成為荔枝平臺(tái)每位用戶都能觸手可及的聲音美化工具，滿足了廣大受眾豐富多樣的個(gè)性化需求。

2.創(chuàng)新玩法的個(gè)性聲音社區(qū)。人工智能技術(shù)在諸多領(lǐng)域的前沿應(yīng)用，已經(jīng)引發(fā)一系列顛覆性的變革與創(chuàng)新。它在聲音娛樂(lè)層面不僅僅是形式上的技術(shù)“玩具”，更是已具化為實(shí)在的創(chuàng)新引導(dǎo)——通過(guò)AI研發(fā)的各類聲音互動(dòng)玩法成為音頻平臺(tái)發(fā)展的利器，商業(yè)化的成功促使有聲閱讀平臺(tái)搭建個(gè)性聲音社區(qū)，深入挖掘音頻傳播的娛樂(lè)性與社交性。

荔枝平臺(tái)通過(guò)開設(shè)“聽聲音找朋友”、“交友娛樂(lè)廳”、“聲鑒卡”、“聲音緣分”等板塊，利用用戶聲音開發(fā)新玩法，促使用戶發(fā)掘自身聲音的個(gè)性。如“聲鑒卡”玩法，用戶可錄制5秒以上的聲音進(jìn)行一句話挑戰(zhàn)，平臺(tái)利用AI技術(shù)識(shí)別用戶的音色如大叔音、正太音、女王音等，由此呈現(xiàn)給受眾專屬的聲音鑒定卡及最佳聲音CP、聲音迷人度等屬性，同時(shí)提供用聲音交朋友等功能，形成基于內(nèi)容與關(guān)系的個(gè)性聲音社區(qū)并提升產(chǎn)品的趣味性、娛樂(lè)性和社交性。

三、人工智能助推有聲閱讀平臺(tái)內(nèi)容管理智能化

以有聲閱讀平臺(tái)為代表的互聯(lián)網(wǎng)音頻應(yīng)用，每天會(huì)產(chǎn)生百萬(wàn)千萬(wàn)量級(jí)用戶的海量UGC自制內(nèi)容，人工智能技術(shù)能幫助這些平臺(tái)實(shí)現(xiàn)內(nèi)容管理的智能化，實(shí)時(shí)進(jìn)行風(fēng)險(xiǎn)內(nèi)容的審核識(shí)別以及優(yōu)質(zhì)內(nèi)容的挖掘推薦。

1.多模態(tài)分析技術(shù)保障內(nèi)容合規(guī)性。網(wǎng)絡(luò)視聽是互聯(lián)網(wǎng)重要業(yè)態(tài)之一，也是主管部門重點(diǎn)治理的領(lǐng)域。多個(gè)音頻平臺(tái)近年因違法違規(guī)被約談、下架或關(guān)停，這使得早期“野蠻生長(zhǎng)”的有聲閱讀平臺(tái)認(rèn)識(shí)到網(wǎng)絡(luò)視聽領(lǐng)域趨嚴(yán)的監(jiān)管治理等變化，平臺(tái)作為把關(guān)人也需不斷促進(jìn)自治機(jī)制的與時(shí)俱進(jìn)。

人工智能尤其是多模態(tài)分析的應(yīng)用，從技術(shù)層面創(chuàng)新完善著內(nèi)容管理流程。多模態(tài)用傳感器技術(shù)和機(jī)器學(xué)習(xí)建立并處理過(guò)程性數(shù)據(jù)的信息模型，目前在內(nèi)容創(chuàng)作、識(shí)別與合成等方面取得顯著成效。偏重UGC的荔枝平臺(tái)針對(duì)海量用戶自制內(nèi)容應(yīng)用多模態(tài)（音頻、圖片、文字）分析技術(shù)，對(duì)上傳內(nèi)容進(jìn)行全面風(fēng)險(xiǎn)檢測(cè)并高效識(shí)別風(fēng)險(xiǎn)內(nèi)容以確保合規(guī)性。

2.建立音質(zhì)模型進(jìn)行優(yōu)質(zhì)內(nèi)容挖掘。人工智能技術(shù)的運(yùn)用，還能幫助有聲閱讀平臺(tái)建立相對(duì)完整的評(píng)價(jià)體系，在用戶聲音大數(shù)據(jù)中挖掘優(yōu)質(zhì)內(nèi)容繼而實(shí)現(xiàn)聲音的傳播價(jià)值。音質(zhì)模型作為代表性技術(shù)在聲學(xué)領(lǐng)域已提出多年，如今在媒介智能化的趨勢(shì)下正被引入互聯(lián)網(wǎng)音頻平臺(tái)成為內(nèi)容挖掘的利器。gzslib202204012153

例如，荔枝為了篩選優(yōu)質(zhì)聲音設(shè)立多個(gè)評(píng)價(jià)維度，并利用人工智能技術(shù)建立對(duì)應(yīng)的音質(zhì)模型，以質(zhì)量為指向從人聲、背景音、噴麥、噪聲等維度綜合評(píng)價(jià)，篩選出平臺(tái)的優(yōu)質(zhì)聲音。荔枝還建立了專業(yè)的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)，結(jié)合自動(dòng)語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)對(duì)優(yōu)質(zhì)內(nèi)容提取特征進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練，持續(xù)提高數(shù)據(jù)池中優(yōu)質(zhì)內(nèi)容的推薦比例。

四、人工智能助推有聲閱讀平臺(tái)內(nèi)容傳播精準(zhǔn)化

以互聯(lián)網(wǎng)大數(shù)據(jù)為基礎(chǔ)的人工智能技術(shù)還可以通過(guò)更有效的用戶畫像，幫助有聲閱讀平臺(tái)實(shí)時(shí)觸達(dá)目標(biāo)用戶，并融合豐富的信息消費(fèi)場(chǎng)景實(shí)現(xiàn)平臺(tái)更多內(nèi)容的裂變傳播與精準(zhǔn)傳播。

1.數(shù)據(jù)迭代更新實(shí)現(xiàn)用戶畫像。用戶畫像是行為大數(shù)據(jù)挖掘的基礎(chǔ)工作，通過(guò)從多角度描述并細(xì)分互聯(lián)網(wǎng)用戶，為后續(xù)智能化的精準(zhǔn)傳播提供支持。有聲閱讀平臺(tái)運(yùn)用人工智能技術(shù)，設(shè)定畫像目標(biāo)、建立標(biāo)簽體系，并進(jìn)行數(shù)據(jù)采集和行為建模，實(shí)現(xiàn)用戶畫像可視化及數(shù)據(jù)迭代更新。結(jié)合算法更有效地實(shí)現(xiàn)內(nèi)容分發(fā)和業(yè)務(wù)運(yùn)營(yíng)的智能推薦，是有聲閱讀平臺(tái)用戶畫像的重要目標(biāo)。

2.內(nèi)容場(chǎng)景植入推動(dòng)裂變傳播。移動(dòng)時(shí)代的傳播場(chǎng)景正變得越來(lái)越重要。通過(guò)場(chǎng)景與聲音服務(wù)功能的有機(jī)結(jié)合，有聲閱讀平臺(tái)可以深入挖掘并細(xì)分消費(fèi)市場(chǎng)。懶人聽書APP通過(guò)調(diào)研發(fā)現(xiàn)，“上下班通勤”與“睡覺(jué)之前”這兩個(gè)場(chǎng)景是平臺(tái)收聽的峰值，于是結(jié)合不同場(chǎng)景特點(diǎn)進(jìn)行內(nèi)容推薦的優(yōu)化。5G時(shí)代萬(wàn)物互聯(lián)，聲音可觸及穿戴設(shè)備、智能音箱等更多終端，有聲閱讀平臺(tái)借助全場(chǎng)景布局能使多種智能終端切入不同生活場(chǎng)景，實(shí)現(xiàn)多元化的裂變式傳播。

3.混合推薦系統(tǒng)助力精準(zhǔn)傳播?；ヂ?lián)網(wǎng)平臺(tái)常見(jiàn)的推薦系統(tǒng)，主要有基于內(nèi)容特征推薦、基于用戶評(píng)價(jià)推薦以及綜合二者優(yōu)點(diǎn)的混合型推薦。由于用戶的復(fù)雜性快速變化，目前大多數(shù)平臺(tái)會(huì)使用混合型推薦系統(tǒng)。荔枝平臺(tái)從可量化的指標(biāo)入手，綜合運(yùn)用點(diǎn)擊量、播放量、完播率、點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)數(shù)等正負(fù)反饋行為作為特征，進(jìn)行深度學(xué)習(xí)訓(xùn)練并調(diào)整和優(yōu)化模型，以提供更符合用戶體驗(yàn)及期待的精準(zhǔn)傳播內(nèi)容與服務(wù)。

五、人工智能發(fā)展及移動(dòng)有聲閱讀平臺(tái)面臨挑戰(zhàn)

人工智能的發(fā)展正在模糊甚至消解人與機(jī)器間的界限，帶來(lái)越來(lái)越多信任和道德層面的挑戰(zhàn)與隱患。有聲閱讀平臺(tái)的創(chuàng)新發(fā)展在充分利用技術(shù)紅利的同時(shí)，也產(chǎn)生了用戶數(shù)據(jù)泄露、數(shù)據(jù)瓶頸以及人機(jī)抗?fàn)幍葐?wèn)題。

1.用戶數(shù)據(jù)運(yùn)用易導(dǎo)致隱私泄露。大數(shù)據(jù)、算法和模型是人工智能的核心要素。目前人工智能所需數(shù)據(jù)主要來(lái)源于學(xué)界業(yè)界共建的通用數(shù)據(jù)集和各行業(yè)的專業(yè)數(shù)據(jù)集，而有聲閱讀平臺(tái)的數(shù)據(jù)多來(lái)自后者以及平臺(tái)累積的數(shù)據(jù)。人工智能技術(shù)對(duì)用戶數(shù)據(jù)的運(yùn)用貫穿平臺(tái)運(yùn)作全過(guò)程，包括數(shù)據(jù)輸入、處理、輸出等環(huán)節(jié)，但這些關(guān)鍵節(jié)點(diǎn)都有暴露被攻擊導(dǎo)致用戶數(shù)據(jù)泄露的可能。目前國(guó)家明確規(guī)定互聯(lián)網(wǎng)平臺(tái)需保護(hù)用戶隱私，不可泄露和非法獲取用戶隱私數(shù)據(jù)，但不可控因素仍導(dǎo)致大量侵權(quán)事件、用戶數(shù)據(jù)被擴(kuò)散傳播甚至產(chǎn)生經(jīng)濟(jì)損失。這是有聲閱讀平臺(tái)在運(yùn)用人工智能技術(shù)過(guò)程中，尚未解決的難題和需著重關(guān)注的焦點(diǎn)所在。

2.數(shù)據(jù)標(biāo)注成為智能化發(fā)展瓶頸。“以‘深度學(xué)習(xí)+大規(guī)模數(shù)據(jù)訓(xùn)練為主要模式的人工智能系統(tǒng)，需要足量數(shù)據(jù)、足夠的運(yùn)算資源，才能不斷優(yōu)化性能，具備更加顯著的問(wèn)題解決能力，產(chǎn)生有意義的結(jié)果。”有聲閱讀平臺(tái)對(duì)有效數(shù)據(jù)的篩選需耗費(fèi)大量資源，存在一定困難和滯后性，同時(shí)數(shù)據(jù)清洗也是難題。音頻內(nèi)容識(shí)別首先難在沒(méi)有直觀的視覺(jué)呈現(xiàn)與畫面比對(duì)，違規(guī)內(nèi)容隱蔽難以察覺(jué)，而音頻原始數(shù)據(jù)還存在多層疊放等問(wèn)題，背景音樂(lè)、方言、外語(yǔ)等內(nèi)容的技術(shù)攻關(guān)也尚未完成。荔枝平臺(tái)在音色識(shí)別中，嘗試過(guò)將聲譜數(shù)據(jù)轉(zhuǎn)換成圖像數(shù)據(jù)進(jìn)行頻譜識(shí)別，雖然較容易提取到數(shù)據(jù)特征，但對(duì)音頻轉(zhuǎn)文字的應(yīng)用以及音樂(lè)等背景音影響顯著的類型，算法轉(zhuǎn)換的準(zhǔn)確率仍差強(qiáng)人意。

3.技術(shù)聲音與藝術(shù)聲音持續(xù)抗?fàn)??！奥曇羟啦粌H傳遞信號(hào)，同時(shí)也傳遞所有伴隨而來(lái)的理解、深思、同情和寬容。聲音中潛藏了能喚起感覺(jué)的信息?！彪S著人工智能技術(shù)的發(fā)展，內(nèi)容創(chuàng)作成為新技術(shù)進(jìn)入的熱點(diǎn)，喜馬拉雅、懶人聽書、荔枝等有聲閱讀平臺(tái)都出現(xiàn)了機(jī)器閱讀的有聲書。幾萬(wàn)到十幾萬(wàn)字的作品在既定技術(shù)模型下可輕易被創(chuàng)作出來(lái)，機(jī)器聲音雖能提升創(chuàng)作效率、降低創(chuàng)作成本，但機(jī)器“冰冷”的聲音從不是傳遞情感的最好方式。經(jīng)過(guò)數(shù)據(jù)計(jì)算的情感表達(dá)只是符號(hào)和代碼，技術(shù)聲音目前只能作為輔助而不應(yīng)成為信息傳播的主力。在人工智能未廣泛普及的今天，單純機(jī)器聲音的閱讀還沒(méi)能達(dá)到預(yù)期，但技術(shù)聲音成本和效率上的優(yōu)勢(shì)，仍會(huì)導(dǎo)致其未來(lái)與人類的藝術(shù)聲音持續(xù)抗?fàn)帯?/p>

在人工智能技術(shù)迭代發(fā)展并加速普及的趨勢(shì)下，移動(dòng)有聲閱讀平臺(tái)朝著個(gè)性化、智能化、精準(zhǔn)化的方向變革創(chuàng)新，但不可避免地會(huì)面臨更多新的問(wèn)題與挑戰(zhàn)，尤其需要關(guān)注藝術(shù)與技術(shù)的競(jìng)合關(guān)系。技術(shù)聲音仍是冰冷無(wú)生命的，藝術(shù)工作者面對(duì)人工智能要發(fā)揮主觀能動(dòng)性創(chuàng)作更多有溫度靈性的藝術(shù)聲音。有聲閱讀平臺(tái)在繼續(xù)利用人工智能技術(shù)時(shí)，要注重做技術(shù)的引領(lǐng)者而不是服從者，從而推動(dòng)音頻傳播領(lǐng)域更加健康、有序地創(chuàng)新發(fā)展。

作者單位??暨南大學(xué)新聞與傳播學(xué)院

本文系2020年度國(guó)家廣播電視總局部級(jí)社科研究項(xiàng)目“5G環(huán)境下網(wǎng)絡(luò)視聽內(nèi)容把關(guān)策略研究”（項(xiàng)目編號(hào)：GD2030）的研究成果。

參考文獻(xiàn)

[1]張琪，李福華，孫基男.多模態(tài)學(xué)習(xí)分析：走向計(jì)算教育時(shí)代的學(xué)習(xí)分析學(xué)[J].中國(guó)電化教育，2020（09）.

[2]彭蘭.場(chǎng)景：移動(dòng)時(shí)代媒體的新要素[J].新聞?dòng)浾撸?015（03）.

[3]新華社“人工智能時(shí)代媒體變革與發(fā)展”課題組.人工智能時(shí)代媒體變革與發(fā)展[J].大數(shù)據(jù)時(shí)代，2020（02）.

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

人工智能發(fā)展與有聲閱讀平臺(tái)創(chuàng)新探析