張新彬
摘要:智能化推薦是目前傳媒行業(yè)非?;馃岬囊豁?xiàng)技術(shù),各大新聞?lì)怉PP競(jìng)相引入這一技術(shù),以期滿足不同人群對(duì)資訊的需求。本文以正觀新聞客戶端智能化推薦功能的開發(fā)、部署、應(yīng)用為例,詳解新聞客戶端在智能化應(yīng)用方面的趨勢(shì)與效果,并反思應(yīng)用中出現(xiàn)的問題。
關(guān)鍵詞:智能化推薦 人工智能 新媒體 媒體創(chuàng)新
智能化推薦是近幾年異軍突起的一項(xiàng)新媒體分發(fā)技術(shù),廣泛應(yīng)用于各大新聞資訊客戶端,但因這項(xiàng)技術(shù)開發(fā)難度較大,應(yīng)用效果也不盡相同,很多后來者雖然躍躍欲試,但也顧慮重重。2021年2月6日,“正觀新聞”客戶端全新上線了智能化推薦功能,經(jīng)過一年多的實(shí)踐,取得了不錯(cuò)的應(yīng)用效果,助力“正觀新聞”客戶端快速進(jìn)入全國(guó)原創(chuàng)新聞?lì)惪蛻舳说谝惶蓐?duì)。
智能化推薦是人工智能在新媒體應(yīng)用中的一個(gè)分支,也是目前傳媒行業(yè)非常推崇的一項(xiàng)分發(fā)技術(shù)?!敖袢疹^條”客戶端就是智能化推薦應(yīng)用的成功案例,幾乎憑一端之力,把中國(guó)乃至世界的新媒體分發(fā),帶入了智能化推薦時(shí)代。隨著頭條的日趨做大,騰訊、鳳凰、新浪等如夢(mèng)初醒,緊急上線形式各樣的智能化推薦功能,資訊市場(chǎng)上還涌現(xiàn)出諸如“東方頭條”、“趣頭條”、“天天快報(bào)”等同類產(chǎn)品,但“千人千面”的智能化推薦標(biāo)簽,已經(jīng)牢牢地貼在了頭條系產(chǎn)品的頭上,再也沒有競(jìng)品能撼動(dòng)它的江湖地位??梢哉f,智能化推薦成就了“今日頭條”以及頭條系龐大的產(chǎn)品庫(kù),讓字節(jié)跳動(dòng)成為中國(guó)最大的移動(dòng)資訊流量入口。
2020年9月13日,鄭州報(bào)業(yè)集團(tuán)精心打造的“正觀新聞”客戶端正式上線,愿景是建成新型主流媒體平臺(tái),并承擔(dān)起鄭州報(bào)業(yè)集團(tuán)媒體深度融合和產(chǎn)業(yè)升級(jí)轉(zhuǎn)型的重任?!罢^新聞”客戶端建設(shè)之初,就把智能化推薦當(dāng)成了重大攻關(guān)項(xiàng)目和產(chǎn)品特色,進(jìn)行了科學(xué)的規(guī)劃和設(shè)計(jì)。
“正觀新聞”技術(shù)團(tuán)隊(duì)認(rèn)為,“今日頭條”的智能化推薦是“正觀新聞”客戶端的學(xué)習(xí)榜樣,但又不能生搬硬套。二者出生相距近10年,媒體環(huán)境已經(jīng)發(fā)生了重大改變,技術(shù)的提升和資訊市場(chǎng)的成熟,讓“正觀新聞”不得不認(rèn)真審視自己,努力打造適合自己的智能化推薦產(chǎn)品。
2021年2月6日,“正觀新聞”客戶端2.2.1版本上線。這是“正觀新聞”正式上線半年以來,集30余名技術(shù)人員之力,推出的重大舉措??蛻舳祟^條頻道全新改版,新聞列表頁增加搜索框、新聞熱榜及推薦頻道;上線智能推薦功能,根據(jù)用戶閱讀文章喜好智能推薦其感興趣的資訊。
這項(xiàng)技術(shù)集成了第三方的智能化推薦引擎,并在策劃和設(shè)計(jì)中得以應(yīng)用不同的推薦策略和形式,給讀者以更加優(yōu)秀的閱讀體驗(yàn),為內(nèi)容引流。同時(shí),部分產(chǎn)品的細(xì)節(jié)在使用過程中不斷調(diào)整、優(yōu)化、更新?lián)Q代。
本次建設(shè)的智能推薦系統(tǒng)基于“正觀新聞”客戶端智能推薦的需求,及第三方數(shù)據(jù)機(jī)構(gòu)對(duì)同行業(yè)個(gè)性化推薦系統(tǒng)建設(shè)經(jīng)驗(yàn),可以滿足以下需求:一是基于“正觀新聞”客戶端應(yīng)用場(chǎng)景的推薦,支持各欄目中Feed流、詳情頁、搜索頁中內(nèi)容的個(gè)性化推薦、相關(guān)推薦、熱門推薦;二是基于“正觀新聞”客戶端內(nèi)容類型的推薦,實(shí)現(xiàn)對(duì)現(xiàn)有新聞內(nèi)容的智能推薦,由于視頻內(nèi)容推薦更加復(fù)雜,此次更新版本暫不涉及;三是支持多維度的智能推薦,支持按用戶偏好、熱門、相關(guān)性、地理位置、欄目等維度進(jìn)行推薦;四是支持對(duì)推薦效果的簡(jiǎn)單分析,系統(tǒng)支持按點(diǎn)擊率、曝光量、點(diǎn)擊量等維度對(duì)推薦效果進(jìn)行評(píng)估,從而幫助優(yōu)化推薦策略,更好地實(shí)現(xiàn)推薦服務(wù)。
智能推薦的效果是由數(shù)據(jù)與推薦模型決定的,所以在智能推薦系統(tǒng)中除了選用合適的模型外,最重要的就是獲取全量的數(shù)據(jù),數(shù)據(jù)是建設(shè)智能推薦系統(tǒng)的根基。在本次智能推薦項(xiàng)目中需要用戶屬性數(shù)據(jù)、用戶行為數(shù)據(jù)和物品信息數(shù)據(jù)。
一是用戶屬性數(shù)據(jù)。用戶屬性數(shù)據(jù)主要指用戶的基本屬性,基本不需要改動(dòng)的數(shù)據(jù),如年齡、地域、性別等。二是用戶行為數(shù)據(jù)。在智能推薦系統(tǒng)中,用戶行為數(shù)據(jù)是最為重要的一部分,主要用來描述哪個(gè)用戶在什么時(shí)間,什么地點(diǎn),通過什么方式做了什么事情。用戶行為數(shù)據(jù)主要有兩個(gè)目的:一方面是訓(xùn)練推薦模型的最為重要的數(shù)據(jù)來源;另一方面,需要通過用戶行為數(shù)據(jù)作為反饋,才能知道推薦系統(tǒng)的效果如何,從而及時(shí)迭代推薦策略。搭建智能推薦系統(tǒng)的一個(gè)秘籍就是積累用戶行為數(shù)據(jù),如果沒有將重要的用戶行為數(shù)據(jù)做采集,那么推薦系統(tǒng)的效果肯定是得不到保證的。三是物品信息數(shù)據(jù)。物品信息數(shù)據(jù)是指推薦系統(tǒng)中能采集到的描述每一個(gè)內(nèi)容的信息,主要包括內(nèi)容ID、標(biāo)題、類型、標(biāo)簽、發(fā)布時(shí)間等。
智能化推薦系統(tǒng)的建設(shè)不應(yīng)是為了建而建,應(yīng)該讓智能推薦系統(tǒng)發(fā)揮價(jià)值,而智能推薦效果的評(píng)估是評(píng)價(jià)系統(tǒng)價(jià)值的重要標(biāo)準(zhǔn),“正觀新聞”客戶端智能推薦效果通過以下幾個(gè)指標(biāo)進(jìn)行評(píng)價(jià)。
一是點(diǎn)擊率。點(diǎn)擊率是評(píng)價(jià)推薦效果的重要指標(biāo)之一,記錄了用戶每次進(jìn)入推薦內(nèi)容的點(diǎn)擊情況,能夠粗略衡量轉(zhuǎn)化效果。通過智能化推薦上線一年來的數(shù)據(jù)對(duì)比,發(fā)現(xiàn)月均點(diǎn)擊率提升在15%以上,智能化推薦效果明顯。
二是點(diǎn)擊人數(shù)比。點(diǎn)擊人數(shù)比是點(diǎn)擊的人數(shù)除以推薦曝光人數(shù),是用來衡量推薦系統(tǒng)觸達(dá)率的重要指標(biāo)。在評(píng)估推薦模型效果時(shí),可能點(diǎn)擊率上漲,但點(diǎn)擊人數(shù)并沒有變化,這說明推薦結(jié)果只對(duì)于部分老用戶產(chǎn)生了比較好的效果,對(duì)于其他的用戶,仍然沒有成功吸引他們,所以點(diǎn)擊人數(shù)比與點(diǎn)擊率是對(duì)推薦系統(tǒng)從不同維度的評(píng)估?!罢^新聞”客戶端智能化推薦上線半年來的數(shù)據(jù)表明,點(diǎn)擊人數(shù)比上升了35%。
三是人均點(diǎn)擊次數(shù)。人均點(diǎn)擊次數(shù)是指每個(gè)人在推薦系統(tǒng)中平均每天點(diǎn)擊了多少次。人均點(diǎn)擊次數(shù)能真正體現(xiàn)出用戶使用產(chǎn)品的深度,故該指標(biāo)是需要持續(xù)關(guān)注的指標(biāo)?!罢^新聞”客戶端智能化推薦上線半年來的數(shù)據(jù)表明,人均點(diǎn)擊次數(shù)上升了68%,效果非常突出。
四是留存率和轉(zhuǎn)化率。留存率和轉(zhuǎn)化率對(duì)于推薦系統(tǒng)來說,可能并不是一個(gè)非常直接的指標(biāo),如推薦對(duì)留存的影響到底有多大,很大程度上取決于內(nèi)容的質(zhì)量和類型,但它仍是我們?cè)u(píng)估推薦系統(tǒng)的一個(gè)指標(biāo),至少我們需要知道此次推薦系統(tǒng)的迭代到底對(duì)于留存率的影響有多大。如果迭代后的留存率下降,即使點(diǎn)擊率和點(diǎn)擊人數(shù)都在上升,但這一次迭代也無法上線,因?yàn)樗绊懥肆舸娴闹笜?biāo)?!罢^新聞”客戶端智能化推薦上線半年來的數(shù)據(jù)表明,留存率上升了23%,轉(zhuǎn)化率上升了39%。
“正觀新聞”客戶端智能化推薦上線以來,雖然分發(fā)效果明顯,但也面臨著幾個(gè)突出問題。
一是冷啟動(dòng)問題?;谛掠脩衾鋯?dòng)的問題,是智能推薦面臨的一大難題,由于是新用戶,所以基本拿不到用戶信息,造成推薦沒有依據(jù),無法有效的推薦模型,推薦效果不佳。正觀技術(shù)團(tuán)隊(duì)的解決方案是,針對(duì)新用戶的推薦策略做出如下調(diào)整:推薦日期較新的新聞、視頻、資訊等內(nèi)容;推薦瀏覽量TopN的新聞、視頻、資訊等熱點(diǎn)內(nèi)容;推薦用戶互動(dòng)(點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)、收藏)TopN的新聞、視頻、資訊等內(nèi)容;對(duì)推薦效果及時(shí)評(píng)估,及時(shí)調(diào)整推薦策略。
二是時(shí)效性問題。市場(chǎng)上的智能化推薦產(chǎn)品,多是UGC聚合平臺(tái),絕大多數(shù)內(nèi)容對(duì)時(shí)效性要求不高。而“正觀新聞”這類新聞客戶端,以原創(chuàng)內(nèi)容為主,智能化推薦系統(tǒng)向用戶推薦的內(nèi)容應(yīng)該是實(shí)時(shí)的,而非以用戶上周甚至上月的行為特征為依據(jù)向用戶推薦內(nèi)容,所以數(shù)據(jù)采集的實(shí)時(shí)性非常重要。如果不能滿足時(shí)效性,智能化推薦的效果就會(huì)大打折扣。“正觀新聞”客戶端的做法是和國(guó)內(nèi)知名新聞客戶端互換版權(quán),最大可能地豐富新聞資訊,并積極開設(shè)“正觀號(hào)”等欄目,多種舉措吸引UGC聚合內(nèi)容。
三是多樣性問題。智能化推薦需要按比例向用戶推薦不同類型的內(nèi)容。用戶可能有這樣的體驗(yàn):如果你對(duì)體育內(nèi)容感興趣,慢慢地你所有的推薦內(nèi)容都變成了體育相關(guān)內(nèi)容,似乎很難看到其他內(nèi)容,推薦的范圍越來越窄。短期來說,提升多樣性可能會(huì)讓點(diǎn)擊率有一些損失,但是長(zhǎng)期來說,多樣性是為了提升整個(gè)產(chǎn)品用戶體驗(yàn)所做的一種優(yōu)化,這里需要考慮長(zhǎng)期和短期的權(quán)衡。正觀技術(shù)團(tuán)隊(duì)的做法是:人工部分干預(yù)推薦的內(nèi)容,人為強(qiáng)制加入推薦元素和推薦欄目、位置。
四是穩(wěn)定性問題。如果服務(wù)器經(jīng)常宕機(jī),或者說響應(yīng)時(shí)間超過五秒鐘,這樣的服務(wù)基本上是不可用的。我們需要站在服務(wù)的角度去建設(shè)智能推薦系統(tǒng),為用戶提供成熟且穩(wěn)定的智能化產(chǎn)品。
智能化推薦越來越多地應(yīng)用到傳媒業(yè),引入形形色色的資訊產(chǎn)品中。但人工智能不是人工全能,機(jī)器可以替代我們的部分工作,但在開發(fā)、部署和應(yīng)用過程中,還需要諸多人工干預(yù)。我們可以依靠智能化推薦,但絕不能依賴它,要通過不斷研究與開發(fā),讓機(jī)器更善于學(xué)習(xí),更了解用戶的需求,更精準(zhǔn)地推薦內(nèi)容。
作者系鄭州報(bào)業(yè)集團(tuán)中原網(wǎng)總編輯
參考文獻(xiàn)
[1]梁寶琳.聚合類新聞客戶端“今日頭條”的智能化發(fā)展研究[D].長(zhǎng)沙:湖南大學(xué),2018.
[2]王珊珊.智能推薦系統(tǒng)在個(gè)性化數(shù)據(jù)挖掘中的應(yīng)用研究[J].山東農(nóng)業(yè)工程學(xué)院學(xué)報(bào),2019(06).
【編輯:左志新】