余苗 趙文聰
摘要:互聯(lián)網(wǎng)大數(shù)據(jù)、深度學(xué)習(xí)等新技術(shù)正在引領(lǐng)人工智能發(fā)展的新浪潮,并催生可提高眾多領(lǐng)域生產(chǎn)力與經(jīng)濟(jì)效益的新應(yīng)用。有聲閱讀平臺(tái)作為視聽媒介的新興代表,注重將人工智能技術(shù)運(yùn)用到內(nèi)容創(chuàng)作、分發(fā)、管理、反饋等關(guān)鍵流程,讓聲音在新技術(shù)助推下成為更智能的數(shù)字化產(chǎn)品。通過(guò)調(diào)研荔枝等音頻平臺(tái)并分析人工智能技術(shù)與平臺(tái)的發(fā)展現(xiàn)狀,本文探析人工智能對(duì)平臺(tái)的創(chuàng)新推動(dòng)以及面臨問(wèn)題,以期為有聲閱讀平臺(tái)的持續(xù)創(chuàng)新提供可行建議。
關(guān)鍵詞:人工智能??有聲閱讀??互聯(lián)網(wǎng)平臺(tái)??音頻傳播
互聯(lián)網(wǎng)廣泛普及帶來(lái)的數(shù)據(jù)電子化,推動(dòng)著以大數(shù)據(jù)、深度學(xué)習(xí)、自然語(yǔ)言處理等為代表的人工智能技術(shù)發(fā)展新浪潮。依托移動(dòng)互聯(lián)、智能終端的有聲閱讀平臺(tái)為拓展創(chuàng)新空間,將人工智能技術(shù)運(yùn)用到創(chuàng)作、分發(fā)、管理、反饋等流程的多個(gè)維度。在新興人工智能技術(shù)助推下,有聲閱讀平臺(tái)正加速向個(gè)性化、智能化、精準(zhǔn)化發(fā)展,但也存在隱私泄露、數(shù)據(jù)標(biāo)注等問(wèn)題亟待解決。
一、人工智能技術(shù)與移動(dòng)有聲閱讀平臺(tái)的發(fā)展
人工智能技術(shù)發(fā)展日趨成熟,深度學(xué)習(xí)、自然語(yǔ)言處理等相關(guān)技術(shù)已經(jīng)進(jìn)入大規(guī)模應(yīng)用期。有聲閱讀平臺(tái)的崛起與信息傳播技術(shù)息息相關(guān),每次技術(shù)革新都會(huì)帶動(dòng)有聲閱讀領(lǐng)域的創(chuàng)新突破。人工智能技術(shù)在有聲閱讀平臺(tái)的廣泛運(yùn)用,正推動(dòng)平臺(tái)在內(nèi)容、功能、設(shè)備等方面的智能化發(fā)展。
1.實(shí)現(xiàn)智能化內(nèi)容。有聲閱讀平臺(tái)通過(guò)人工智能技術(shù)對(duì)內(nèi)容進(jìn)行智能處理,能夠?qū)崿F(xiàn)內(nèi)容創(chuàng)作的智能化。大多數(shù)有聲閱讀平臺(tái)屬于內(nèi)容型平臺(tái),人工智能相關(guān)技術(shù)的有效運(yùn)用,可以幫助平臺(tái)探索個(gè)性化、風(fēng)格化、便捷化的內(nèi)容創(chuàng)作,在塑造平臺(tái)品牌風(fēng)格的同時(shí)提升互聯(lián)網(wǎng)用戶黏性。
2.打造智能化功能。有聲閱讀平臺(tái)正運(yùn)用人工智能技術(shù),圍繞互聯(lián)網(wǎng)產(chǎn)品的重要功能嘗試優(yōu)化升級(jí),以期實(shí)現(xiàn)平臺(tái)功能的智能化。有聲閱讀平臺(tái)當(dāng)前重點(diǎn)探索的智能化功能,大多聚焦搜索關(guān)聯(lián)、內(nèi)容推薦及搜索結(jié)果排序等方面。平臺(tái)期望通過(guò)廣泛的信息組織和提取,推進(jìn)基于互聯(lián)網(wǎng)大數(shù)據(jù)的算法優(yōu)化與深度學(xué)習(xí),進(jìn)而對(duì)各類用戶實(shí)現(xiàn)更為精準(zhǔn)的目標(biāo)觸達(dá)。
3.開發(fā)智能化設(shè)備。有聲閱讀平臺(tái)作為視聽媒介的新興代表和互聯(lián)網(wǎng)音頻傳播的典型應(yīng)用,在注重平臺(tái)自身發(fā)展的基礎(chǔ)上,也在積極延伸產(chǎn)業(yè)鏈。例如,有聲閱讀平臺(tái)借助相對(duì)成熟的人工智能技術(shù)尋求外部合作,開發(fā)智能音箱、可穿戴設(shè)備等智能化終端,探索內(nèi)容的多終端傳播與跨平臺(tái)消費(fèi),進(jìn)一步實(shí)現(xiàn)“耳朵經(jīng)濟(jì)”的更多場(chǎng)景布局。
二、人工智能助推有聲閱讀平臺(tái)內(nèi)容生產(chǎn)個(gè)性化
互聯(lián)網(wǎng)大數(shù)據(jù)、深度學(xué)習(xí)、自然語(yǔ)言處理等人工智能新技術(shù)的發(fā)展與應(yīng)用,正助推有聲閱讀平臺(tái)內(nèi)容的生產(chǎn)、管理、傳播等方面變革創(chuàng)新,其中平臺(tái)的內(nèi)容生產(chǎn)已經(jīng)朝著個(gè)性化定制、個(gè)性化社區(qū)等方向發(fā)展。
1.用戶聲音的個(gè)性化定制。媒介資源的富足提升了受眾的審美品位,使得受眾在滿足基本需求的基礎(chǔ)上,開始追求更能彰顯自我的個(gè)性化需求。有聲閱讀平臺(tái)以往千篇一律的機(jī)械合成聲音已不能滿足用戶需求,聲音的“定制化”成為新趨勢(shì)。人工智能技術(shù)在聲音商業(yè)化探索中扮演了重要的支持角色,通過(guò)對(duì)海量音頻信息的處理以及在此基礎(chǔ)上的認(rèn)知深化,為受眾提供多元個(gè)性化聲音模板,并通過(guò)語(yǔ)音合成技術(shù)實(shí)現(xiàn)即時(shí)的個(gè)性化聲音呈現(xiàn),變換出聲音新玩法。
以專業(yè)的音頻分享平臺(tái)荔枝為例,用戶原創(chuàng)內(nèi)容(UGC,User-Generated Content)是荔枝平臺(tái)的核心優(yōu)勢(shì)。荔枝在聲音定制層面利用人工智能研發(fā)多種技術(shù)來(lái)重塑聲音,使人工智能有效賦能UGC內(nèi)容生產(chǎn)。AI在線音頻技術(shù)如美聲、調(diào)音臺(tái)、魔音(錄音棚、演唱會(huì)、小黃人等)、百變音效(歡呼、魔性笑聲、掌聲等),成為荔枝平臺(tái)每位用戶都能觸手可及的聲音美化工具,滿足了廣大受眾豐富多樣的個(gè)性化需求。
2.創(chuàng)新玩法的個(gè)性聲音社區(qū)。人工智能技術(shù)在諸多領(lǐng)域的前沿應(yīng)用,已經(jīng)引發(fā)一系列顛覆性的變革與創(chuàng)新。它在聲音娛樂(lè)層面不僅僅是形式上的技術(shù)“玩具”,更是已具化為實(shí)在的創(chuàng)新引導(dǎo)——通過(guò)AI研發(fā)的各類聲音互動(dòng)玩法成為音頻平臺(tái)發(fā)展的利器,商業(yè)化的成功促使有聲閱讀平臺(tái)搭建個(gè)性聲音社區(qū),深入挖掘音頻傳播的娛樂(lè)性與社交性。
荔枝平臺(tái)通過(guò)開設(shè)“聽聲音找朋友”、“交友娛樂(lè)廳”、“聲鑒卡”、“聲音緣分”等板塊,利用用戶聲音開發(fā)新玩法,促使用戶發(fā)掘自身聲音的個(gè)性。如“聲鑒卡”玩法,用戶可錄制5秒以上的聲音進(jìn)行一句話挑戰(zhàn),平臺(tái)利用AI技術(shù)識(shí)別用戶的音色如大叔音、正太音、女王音等,由此呈現(xiàn)給受眾專屬的聲音鑒定卡及最佳聲音CP、聲音迷人度等屬性,同時(shí)提供用聲音交朋友等功能,形成基于內(nèi)容與關(guān)系的個(gè)性聲音社區(qū)并提升產(chǎn)品的趣味性、娛樂(lè)性和社交性。
三、人工智能助推有聲閱讀平臺(tái)內(nèi)容管理智能化
以有聲閱讀平臺(tái)為代表的互聯(lián)網(wǎng)音頻應(yīng)用,每天會(huì)產(chǎn)生百萬(wàn)千萬(wàn)量級(jí)用戶的海量UGC自制內(nèi)容,人工智能技術(shù)能幫助這些平臺(tái)實(shí)現(xiàn)內(nèi)容管理的智能化,實(shí)時(shí)進(jìn)行風(fēng)險(xiǎn)內(nèi)容的審核識(shí)別以及優(yōu)質(zhì)內(nèi)容的挖掘推薦。
1.多模態(tài)分析技術(shù)保障內(nèi)容合規(guī)性。網(wǎng)絡(luò)視聽是互聯(lián)網(wǎng)重要業(yè)態(tài)之一,也是主管部門重點(diǎn)治理的領(lǐng)域。多個(gè)音頻平臺(tái)近年因違法違規(guī)被約談、下架或關(guān)停,這使得早期“野蠻生長(zhǎng)”的有聲閱讀平臺(tái)認(rèn)識(shí)到網(wǎng)絡(luò)視聽領(lǐng)域趨嚴(yán)的監(jiān)管治理等變化,平臺(tái)作為把關(guān)人也需不斷促進(jìn)自治機(jī)制的與時(shí)俱進(jìn)。
人工智能尤其是多模態(tài)分析的應(yīng)用,從技術(shù)層面創(chuàng)新完善著內(nèi)容管理流程。多模態(tài)用傳感器技術(shù)和機(jī)器學(xué)習(xí)建立并處理過(guò)程性數(shù)據(jù)的信息模型,目前在內(nèi)容創(chuàng)作、識(shí)別與合成等方面取得顯著成效。偏重UGC的荔枝平臺(tái)針對(duì)海量用戶自制內(nèi)容應(yīng)用多模態(tài)(音頻、圖片、文字)分析技術(shù),對(duì)上傳內(nèi)容進(jìn)行全面風(fēng)險(xiǎn)檢測(cè)并高效識(shí)別風(fēng)險(xiǎn)內(nèi)容以確保合規(guī)性。
2.建立音質(zhì)模型進(jìn)行優(yōu)質(zhì)內(nèi)容挖掘。人工智能技術(shù)的運(yùn)用,還能幫助有聲閱讀平臺(tái)建立相對(duì)完整的評(píng)價(jià)體系,在用戶聲音大數(shù)據(jù)中挖掘優(yōu)質(zhì)內(nèi)容繼而實(shí)現(xiàn)聲音的傳播價(jià)值。音質(zhì)模型作為代表性技術(shù)在聲學(xué)領(lǐng)域已提出多年,如今在媒介智能化的趨勢(shì)下正被引入互聯(lián)網(wǎng)音頻平臺(tái)成為內(nèi)容挖掘的利器。gzslib202204012153例如,荔枝為了篩選優(yōu)質(zhì)聲音設(shè)立多個(gè)評(píng)價(jià)維度,并利用人工智能技術(shù)建立對(duì)應(yīng)的音質(zhì)模型,以質(zhì)量為指向從人聲、背景音、噴麥、噪聲等維度綜合評(píng)價(jià),篩選出平臺(tái)的優(yōu)質(zhì)聲音。荔枝還建立了專業(yè)的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),結(jié)合自動(dòng)語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)對(duì)優(yōu)質(zhì)內(nèi)容提取特征進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練,持續(xù)提高數(shù)據(jù)池中優(yōu)質(zhì)內(nèi)容的推薦比例。
四、人工智能助推有聲閱讀平臺(tái)內(nèi)容傳播精準(zhǔn)化
以互聯(lián)網(wǎng)大數(shù)據(jù)為基礎(chǔ)的人工智能技術(shù)還可以通過(guò)更有效的用戶畫像,幫助有聲閱讀平臺(tái)實(shí)時(shí)觸達(dá)目標(biāo)用戶,并融合豐富的信息消費(fèi)場(chǎng)景實(shí)現(xiàn)平臺(tái)更多內(nèi)容的裂變傳播與精準(zhǔn)傳播。
1.數(shù)據(jù)迭代更新實(shí)現(xiàn)用戶畫像。用戶畫像是行為大數(shù)據(jù)挖掘的基礎(chǔ)工作,通過(guò)從多角度描述并細(xì)分互聯(lián)網(wǎng)用戶,為后續(xù)智能化的精準(zhǔn)傳播提供支持。有聲閱讀平臺(tái)運(yùn)用人工智能技術(shù),設(shè)定畫像目標(biāo)、建立標(biāo)簽體系,并進(jìn)行數(shù)據(jù)采集和行為建模,實(shí)現(xiàn)用戶畫像可視化及數(shù)據(jù)迭代更新。結(jié)合算法更有效地實(shí)現(xiàn)內(nèi)容分發(fā)和業(yè)務(wù)運(yùn)營(yíng)的智能推薦,是有聲閱讀平臺(tái)用戶畫像的重要目標(biāo)。
2.內(nèi)容場(chǎng)景植入推動(dòng)裂變傳播。移動(dòng)時(shí)代的傳播場(chǎng)景正變得越來(lái)越重要。通過(guò)場(chǎng)景與聲音服務(wù)功能的有機(jī)結(jié)合,有聲閱讀平臺(tái)可以深入挖掘并細(xì)分消費(fèi)市場(chǎng)。懶人聽書APP通過(guò)調(diào)研發(fā)現(xiàn),“上下班通勤”與“睡覺(jué)之前”這兩個(gè)場(chǎng)景是平臺(tái)收聽的峰值,于是結(jié)合不同場(chǎng)景特點(diǎn)進(jìn)行內(nèi)容推薦的優(yōu)化。5G時(shí)代萬(wàn)物互聯(lián),聲音可觸及穿戴設(shè)備、智能音箱等更多終端,有聲閱讀平臺(tái)借助全場(chǎng)景布局能使多種智能終端切入不同生活場(chǎng)景,實(shí)現(xiàn)多元化的裂變式傳播。
3.混合推薦系統(tǒng)助力精準(zhǔn)傳播?;ヂ?lián)網(wǎng)平臺(tái)常見(jiàn)的推薦系統(tǒng),主要有基于內(nèi)容特征推薦、基于用戶評(píng)價(jià)推薦以及綜合二者優(yōu)點(diǎn)的混合型推薦。由于用戶的復(fù)雜性快速變化,目前大多數(shù)平臺(tái)會(huì)使用混合型推薦系統(tǒng)。荔枝平臺(tái)從可量化的指標(biāo)入手,綜合運(yùn)用點(diǎn)擊量、播放量、完播率、點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)數(shù)等正負(fù)反饋行為作為特征,進(jìn)行深度學(xué)習(xí)訓(xùn)練并調(diào)整和優(yōu)化模型,以提供更符合用戶體驗(yàn)及期待的精準(zhǔn)傳播內(nèi)容與服務(wù)。
五、人工智能發(fā)展及移動(dòng)有聲閱讀平臺(tái)面臨挑戰(zhàn)
人工智能的發(fā)展正在模糊甚至消解人與機(jī)器間的界限,帶來(lái)越來(lái)越多信任和道德層面的挑戰(zhàn)與隱患。有聲閱讀平臺(tái)的創(chuàng)新發(fā)展在充分利用技術(shù)紅利的同時(shí),也產(chǎn)生了用戶數(shù)據(jù)泄露、數(shù)據(jù)瓶頸以及人機(jī)抗?fàn)幍葐?wèn)題。
1.用戶數(shù)據(jù)運(yùn)用易導(dǎo)致隱私泄露。大數(shù)據(jù)、算法和模型是人工智能的核心要素。目前人工智能所需數(shù)據(jù)主要來(lái)源于學(xué)界業(yè)界共建的通用數(shù)據(jù)集和各行業(yè)的專業(yè)數(shù)據(jù)集,而有聲閱讀平臺(tái)的數(shù)據(jù)多來(lái)自后者以及平臺(tái)累積的數(shù)據(jù)。人工智能技術(shù)對(duì)用戶數(shù)據(jù)的運(yùn)用貫穿平臺(tái)運(yùn)作全過(guò)程,包括數(shù)據(jù)輸入、處理、輸出等環(huán)節(jié),但這些關(guān)鍵節(jié)點(diǎn)都有暴露被攻擊導(dǎo)致用戶數(shù)據(jù)泄露的可能。目前國(guó)家明確規(guī)定互聯(lián)網(wǎng)平臺(tái)需保護(hù)用戶隱私,不可泄露和非法獲取用戶隱私數(shù)據(jù),但不可控因素仍導(dǎo)致大量侵權(quán)事件、用戶數(shù)據(jù)被擴(kuò)散傳播甚至產(chǎn)生經(jīng)濟(jì)損失。這是有聲閱讀平臺(tái)在運(yùn)用人工智能技術(shù)過(guò)程中,尚未解決的難題和需著重關(guān)注的焦點(diǎn)所在。
2.數(shù)據(jù)標(biāo)注成為智能化發(fā)展瓶頸。“以‘深度學(xué)習(xí)+大規(guī)模數(shù)據(jù)訓(xùn)練為主要模式的人工智能系統(tǒng),需要足量數(shù)據(jù)、足夠的運(yùn)算資源,才能不斷優(yōu)化性能,具備更加顯著的問(wèn)題解決能力,產(chǎn)生有意義的結(jié)果。”有聲閱讀平臺(tái)對(duì)有效數(shù)據(jù)的篩選需耗費(fèi)大量資源,存在一定困難和滯后性,同時(shí)數(shù)據(jù)清洗也是難題。音頻內(nèi)容識(shí)別首先難在沒(méi)有直觀的視覺(jué)呈現(xiàn)與畫面比對(duì),違規(guī)內(nèi)容隱蔽難以察覺(jué),而音頻原始數(shù)據(jù)還存在多層疊放等問(wèn)題,背景音樂(lè)、方言、外語(yǔ)等內(nèi)容的技術(shù)攻關(guān)也尚未完成。荔枝平臺(tái)在音色識(shí)別中,嘗試過(guò)將聲譜數(shù)據(jù)轉(zhuǎn)換成圖像數(shù)據(jù)進(jìn)行頻譜識(shí)別,雖然較容易提取到數(shù)據(jù)特征,但對(duì)音頻轉(zhuǎn)文字的應(yīng)用以及音樂(lè)等背景音影響顯著的類型,算法轉(zhuǎn)換的準(zhǔn)確率仍差強(qiáng)人意。
3.技術(shù)聲音與藝術(shù)聲音持續(xù)抗?fàn)??!奥曇羟啦粌H傳遞信號(hào),同時(shí)也傳遞所有伴隨而來(lái)的理解、深思、同情和寬容。聲音中潛藏了能喚起感覺(jué)的信息?!彪S著人工智能技術(shù)的發(fā)展,內(nèi)容創(chuàng)作成為新技術(shù)進(jìn)入的熱點(diǎn),喜馬拉雅、懶人聽書、荔枝等有聲閱讀平臺(tái)都出現(xiàn)了機(jī)器閱讀的有聲書。幾萬(wàn)到十幾萬(wàn)字的作品在既定技術(shù)模型下可輕易被創(chuàng)作出來(lái),機(jī)器聲音雖能提升創(chuàng)作效率、降低創(chuàng)作成本,但機(jī)器“冰冷”的聲音從不是傳遞情感的最好方式。經(jīng)過(guò)數(shù)據(jù)計(jì)算的情感表達(dá)只是符號(hào)和代碼,技術(shù)聲音目前只能作為輔助而不應(yīng)成為信息傳播的主力。在人工智能未廣泛普及的今天,單純機(jī)器聲音的閱讀還沒(méi)能達(dá)到預(yù)期,但技術(shù)聲音成本和效率上的優(yōu)勢(shì),仍會(huì)導(dǎo)致其未來(lái)與人類的藝術(shù)聲音持續(xù)抗?fàn)帯?/p>
在人工智能技術(shù)迭代發(fā)展并加速普及的趨勢(shì)下,移動(dòng)有聲閱讀平臺(tái)朝著個(gè)性化、智能化、精準(zhǔn)化的方向變革創(chuàng)新,但不可避免地會(huì)面臨更多新的問(wèn)題與挑戰(zhàn),尤其需要關(guān)注藝術(shù)與技術(shù)的競(jìng)合關(guān)系。技術(shù)聲音仍是冰冷無(wú)生命的,藝術(shù)工作者面對(duì)人工智能要發(fā)揮主觀能動(dòng)性創(chuàng)作更多有溫度靈性的藝術(shù)聲音。有聲閱讀平臺(tái)在繼續(xù)利用人工智能技術(shù)時(shí),要注重做技術(shù)的引領(lǐng)者而不是服從者,從而推動(dòng)音頻傳播領(lǐng)域更加健康、有序地創(chuàng)新發(fā)展。
作者單位??暨南大學(xué)新聞與傳播學(xué)院
本文系2020年度國(guó)家廣播電視總局部級(jí)社科研究項(xiàng)目“5G環(huán)境下網(wǎng)絡(luò)視聽內(nèi)容把關(guān)策略研究”(項(xiàng)目編號(hào):GD2030)的研究成果。
參考文獻(xiàn)
[1]張琪,李福華,孫基男.多模態(tài)學(xué)習(xí)分析:走向計(jì)算教育時(shí)代的學(xué)習(xí)分析學(xué)[J].中國(guó)電化教育,2020(09).
[2]彭蘭.場(chǎng)景:移動(dòng)時(shí)代媒體的新要素[J].新聞?dòng)浾撸?015(03).
[3]新華社“人工智能時(shí)代媒體變革與發(fā)展”課題組.人工智能時(shí)代媒體變革與發(fā)展[J].大數(shù)據(jù)時(shí)代,2020(02).