陳 都,苗 方,金立標,吳 敏
(1.中國傳媒大學 理工學部,北京100024;2.中國國際廣播電臺,北京 100040)
?
廣電智能推薦系統(tǒng)的應用研究
陳都1,苗方1,金立標1,吳敏2
(1.中國傳媒大學 理工學部,北京100024;2.中國國際廣播電臺,北京 100040)
摘要:隨著廣播電視媒體的發(fā)展已經(jīng)進入融合時代,融合媒體要求充分運用新技術、新應用創(chuàng)新傳播方式。為了充分挖掘分析潛在的用戶需求,針對廣電業(yè)務的推薦技術越來越受到關注。通過介紹近幾年推薦技術新的發(fā)展成果,在廣電推薦系統(tǒng)應用中充分結合媒體融合、時間因素等,建立廣電智能推薦系統(tǒng)的基本構架,提出廣電領域業(yè)務的進一步設想和展望。
關鍵詞:智能推薦;用戶行為分析;媒體融合
隨著互聯(lián)網(wǎng)應用的普及,海量信息資源的爆炸性增長,當今的世界正處在信息過載的時代。傳統(tǒng)廣電媒體作為大眾信息的主要傳播渠道,在面臨著互聯(lián)網(wǎng)媒體挑戰(zhàn)的同時也在日趨深入地與之融合。電視互動性不斷增強,觀眾的參與度大幅提升,原本被動收視的用戶開始更多有目的地“使用”電視所提供的資源與服務。然而隨著影視節(jié)目資源數(shù)量的指數(shù)型增長,內(nèi)容日趨多樣,面對海量的節(jié)目資源,用戶想找到自己需要的內(nèi)容變得越來越困難。因此需要一種智能的、個性化的廣電節(jié)目推薦系統(tǒng),幫助用戶在信息的海洋中發(fā)現(xiàn)自己需要的資源,同時也使內(nèi)容的生產(chǎn)、傳播更具有目的性和精準性,從而實現(xiàn)價值的最大化。 智能推薦技術應用于電子商務領域起步較早,也已經(jīng)比較成熟,但是在廣電領域應用智能推薦與之相比有很多不同之處:電子商務中推薦的商品特征多為結構性數(shù)據(jù),比較容易獲取并且可以準確描述,例如用戶喜歡的品牌、顏色、款式等。廣電系統(tǒng)中的視音頻素材特征較難提取,非結構化的數(shù)據(jù)處理比較困難,數(shù)據(jù)容量大且相似性度量不好定義。此外用戶分層差距較大,用戶反饋信息獲取不便,視頻資源的屬性特征無法直觀地表達用戶的興趣特征等也增大了廣電業(yè)務推薦的難度。
1智能推薦系統(tǒng)概述
1.1智能推薦系統(tǒng)的基本框架
智能推薦系統(tǒng)是一種建立在海量數(shù)據(jù)挖掘的平臺,通過收集并分析用戶大量的行為日志,根據(jù)用戶的偏好,推薦具有高度針對性的信息。幫助用戶發(fā)現(xiàn)對自己有價值的信息的同時也能讓信息展現(xiàn)在對其感興趣的用戶面前,從而實現(xiàn)信息消費者和信息生產(chǎn)者的雙贏[1]。
圖1是一個智能推薦系統(tǒng)的基本框架圖。
智能推薦系統(tǒng)輸入變量主要分為3個維度:
1)用戶維度,包括人口統(tǒng)計學特征、用戶興趣愛好、用戶行為等。
2)物品維度,包括物品的屬性(關鍵字、特征描述等)、當前熱門程度、平均分等。
3)時間維度,包括季節(jié)、觀看時段、時間間隔。
用戶自身興趣和關注點是隨著時間推移不斷變化的,關注用戶近期行為最能體現(xiàn)其目前的興趣,同時物品的熱度也會隨時間發(fā)生變化。用戶通過推薦系統(tǒng)給出推薦列表去訪問信息,并將反饋信息傳遞給智能推薦系統(tǒng)。推薦系統(tǒng)能夠實時響應用戶的反饋,個性化地調(diào)整推薦列表,從而滿足用戶不斷變化的興趣。
1.2智能推薦系統(tǒng)的核心算法
1)經(jīng)典推薦算法
智能推薦系統(tǒng)的核心是推薦算法,算法的優(yōu)劣決定著推薦系統(tǒng)的性能[2]。當前隨著用戶對推薦系統(tǒng)的需求不斷增長,很多經(jīng)典的推薦算法被廣泛應用。協(xié)同過濾(Collaborative Filtering-based)推薦算法主要是利用對用戶歷史行為的分析,尋找具有類似行為或興趣的用戶和其感興趣的物品,找到用戶或物品之間的相關性,然后基于這些相關性進行建議推薦?;趦?nèi)容(Content-based)推薦算法則不需要用戶對物品的評價,通過分析用戶瀏覽物品的特征,向用戶推薦與這些物品特征相似的物品。這些經(jīng)典的推薦算法主要研究對象主要是用戶和物品,通過比較二維矩陣中相似度來推薦。這些推薦算法也分別存在一些問題,例如協(xié)同過濾推薦存在冷啟動、數(shù)據(jù)稀疏、新穎性方面表現(xiàn)不佳,而基于內(nèi)容推薦則存在物品特征較難抽取、計算復雜、無法滿足即時推薦的要求等問題。
2)推薦算法的改進
近幾年隨著應用的推廣和研究的深入,許多新的或者改進的推薦算法被相繼提出。為提高用戶的興趣和物品之間的聯(lián)系,引入基于標簽的推薦算法可以深入了解用戶行為,指導并改進推薦系統(tǒng)的推薦質量。文獻[3]總結了國內(nèi)外基于標簽的推薦研究成果,利用基于圖論、基于聚類的標簽推薦來描述“用戶-標簽-物品”的三元關系,提高了推薦的準確率和新穎度。隨著Web2.0的發(fā)展,很多網(wǎng)站都利用Facebook的社交網(wǎng)絡數(shù)據(jù)給用戶提供社會化的推薦?;谏缃痪W(wǎng)絡的推薦算法受到關注和應用,文獻[4]通過研究社交網(wǎng)絡的社會關系、興趣傳播、信任傳遞、時間等因素,建立社交網(wǎng)絡用戶興趣模型,結合個人興趣和興趣傳播兩方面信息對目標用戶進行準確的推薦,提高了推薦的質量。推薦系統(tǒng)中引入時間維度,讓推薦系統(tǒng)能夠準確預測用戶在某個特定時間的興趣。用戶興趣不斷變化,推薦系統(tǒng)能夠實時響應用戶的新行為,讓推薦列表不斷變化,以此提高推薦效果。文獻[5]提出一種計算用戶評價時間與項目發(fā)布時間的時間間隔,根據(jù)用戶時間權重值的大小,可以判斷該用戶是積極用戶還是消極用戶,以及用戶對新項目的偏好程度的方法,能夠較好地解決冷啟動問題。文獻[6]先在傳統(tǒng)協(xié)同過濾算法的基礎上,通過引入反映人們遺忘規(guī)律的艾賓浩斯遺忘曲線,提出一種基于時間效應的改進協(xié)同過濾推薦算法,并通過引入時效性集合的概念對數(shù)據(jù)進行預過濾,提升了推薦的準確度。
廣電業(yè)務應用中用戶的偏好矩陣遠遠小于未觀看的物品矩陣,使用基于物品的協(xié)同過濾算法會影響推薦系統(tǒng)的性能?;谟脩舻膮f(xié)同過濾推薦則主要是給用戶推薦和他興趣相似的其他用戶喜歡的物品。加入時間信息后,相似用戶最近的興趣顯然比很久之前的興趣更加接近被推薦用戶當前的興趣。利用加入時間衰減函數(shù)的改進皮爾遜相關系數(shù)測出兩個用戶的相似度,時間衰減項越小,代表用戶之間產(chǎn)生這一行為的時間相隔越遠,兩個用戶的興趣相似度就會越小。
因電視的操作交互界面受到限制,推薦數(shù)量不宜太多。時間變化的推薦系統(tǒng)里,需要建立的是動態(tài)的推薦列表,并且提高推薦的精確性。文獻[7]提出了一種比較物品推薦數(shù)量和推薦評分的“數(shù)量-分數(shù)曲線”,如圖2所示。在“數(shù)量-分數(shù)曲線”中通過尋找拐點找到劃分推薦評級和推薦數(shù)量的最佳平衡點。
2智能推薦系統(tǒng)在廣電業(yè)務中的應用
廣播電視媒體的發(fā)展已經(jīng)進入融合時代,生產(chǎn)制作的節(jié)目其傳播渠道和呈現(xiàn)方式也不局限于傳統(tǒng)的廣播電視,還包括互聯(lián)網(wǎng)、移動終端APP、社交應用等。在融合媒體時代,內(nèi)容、渠道、用戶三者關系發(fā)生了根本的變化。生產(chǎn)制作域的融合和終端傳播域的分化,形成了新型的傳播模式。海量的媒體產(chǎn)品進行匯聚,再分流給多種終端,由用戶根據(jù)所需進行個性化配置。用戶希望精準迅速、隨時隨地獲得需要的內(nèi)容。在整個傳播體系中,用戶占據(jù)著主導的地位。隨著用戶需求和傳播渠道的變化,廣電媒體平臺在提供海量內(nèi)容的同時,還要提供豐富的服務。從服務的角度看,就是要更注重與觀眾的交互,分析掌握觀眾的個性化需求,才能真正把受眾變?yōu)橛脩簟V悄芡扑]是為用戶提供個性化服務的關鍵,也是媒體融合的一個重要體現(xiàn)。
廣電智能推薦系統(tǒng)的智能性體現(xiàn)在主動發(fā)現(xiàn)當前或潛在的用戶需求,根據(jù)用戶歷史行為記錄的積累分析以及對媒體和應用內(nèi)容的價值評估和熱度評估,將用戶信息與內(nèi)容信息進行智能關聯(lián)與匹配,預測用戶可能感興趣的內(nèi)容資源信息。預測分析結果輸出為智能推薦策略,包括共性化內(nèi)容推薦策略和個性化內(nèi)容推薦策略。共性化內(nèi)容包括熱點關注資源、根據(jù)收視情況統(tǒng)計出來的預計熱門媒體和應用內(nèi)容、根據(jù)相關媒體宣傳需要與用戶關注情況得出的熱點聚焦內(nèi)容等,同時也包括運營商推薦內(nèi)容,如時事要聞、重點推薦等。個性化內(nèi)容是在用戶歷史行為分析積累的基礎上得出的用戶當前或潛在的內(nèi)容資源需求。為了準確把握用戶的需求,可用于分析的信息包括用戶基本信息如年齡、性別、愛好等,由用戶行為的統(tǒng)計信息能夠刻畫用戶的收視習慣,由觀看內(nèi)容信息和社交關系的分析可以獲得用戶的興趣。
廣電的主要應用場景是家庭環(huán)境,通過多人家庭用戶的收視行為分析產(chǎn)生對個人的個性化推薦服務一直是廣電推薦業(yè)務的難點[8]。融合媒體時代的內(nèi)容傳播模式是立體的、全方位的,包括大量的用戶互動、參與,如“搖電視”、“伴隨客戶端”等形式,用戶也會通過微信、微博公眾號等方式關注,甚至參加線下活動。因此廣電業(yè)務需要構建全方位的信息采集和大數(shù)據(jù)分析,將傳統(tǒng)廣電渠道和互聯(lián)網(wǎng)渠道的數(shù)據(jù)打通,形成智能化的應用。
廣電智能推薦應用除了形成內(nèi)容與用戶之間的適配,還需要形成內(nèi)容與終端的適配。全媒體的業(yè)務分別在機頂盒、個人PC、手機、平板PC、互聯(lián)網(wǎng)電視等終端呈現(xiàn)。不同的終端對應著不同的發(fā)布渠道、傳播過程和展現(xiàn)形式。推薦系統(tǒng)需要識別終端類型與終端能力,建立用戶信息關聯(lián)和用戶終端設備可管理機制,實現(xiàn)跨媒體的立體式服務。
針對智能推薦系統(tǒng)在廣電中的應用,設計出廣電智能推薦應用系統(tǒng)架構如圖3所示。
廣電智能引擎推薦系統(tǒng)由如下7個方面組成:
1)用戶與廣電系統(tǒng)的交互接口:智能推薦系統(tǒng)通過該交互接口收集用戶的基本信息和行為記錄,同時用戶可以通過該交互接口獲取個性推薦結果。
2)移動端APP:在移動端方面,設置用戶關聯(lián)賬號,用戶可以通過移動端登錄廣電網(wǎng)絡的平臺,訂閱自己喜歡的頻道或者節(jié)目,用戶可以隨時隨地獲得心儀的節(jié)目推薦和節(jié)目預告。用戶行為收集方面,數(shù)據(jù)的來源不僅限于廣電網(wǎng)絡,用戶通過手機、平板等移動端設備參與互動、評價等活動是獲取用戶個性化信息的關鍵組成部分。利用語義分析等技術處理用戶的主觀評價數(shù)據(jù),追蹤用戶分享、轉發(fā)到社交應用的信息,可以更準確地把握用戶的偏好和需求。
3)用戶行為數(shù)據(jù)庫:該數(shù)據(jù)庫用于存儲用戶在使用廣電和移動端中的各種行為記錄,例如瀏覽記錄、播放記錄、具體的時間長短與播放時段,進行降噪和歸一化工作以及云端存儲,可供深度挖掘的原始數(shù)據(jù)資源。
4)用戶建模:推薦系統(tǒng)根據(jù)用戶注冊信息、歷史行為數(shù)據(jù),進行數(shù)據(jù)挖掘,為用戶建模,例如用戶年齡、職業(yè)、愛好、社交網(wǎng)絡關系等,同時也根據(jù)推薦對象的相關信息來構造對象模型[9]。
5)第三方信息平臺:視頻節(jié)目標簽特征提取也可以通過關聯(lián)互聯(lián)網(wǎng)的第三方平臺,例如國內(nèi)的豆瓣、時光網(wǎng);用戶標簽基于社交網(wǎng)絡,例如微博、微信、博客、QQ,在這些社交網(wǎng)站中,每個用戶都有自己的個性化信息墻,從中提取用戶標簽較為方便。
6)視頻節(jié)目資源庫:視頻節(jié)目資源數(shù)據(jù)庫的核心是視頻資源信息采集分類工作。數(shù)據(jù)采集量大,利用大數(shù)據(jù)、云計算等技術,通過網(wǎng)絡信息爬蟲抓取,模板建立進行標簽識別,從而抓取到準確的影視元數(shù)據(jù)。可引入對視頻內(nèi)容的畫面分析識別,深入挖掘出視頻節(jié)目背后具體的對象,例如一些商品、地名、人物等。
7)智能推薦引擎:利用用戶已構建好的模型和視頻資源信息特征作為輸入,通過智能推薦引擎的核心算法,輸出個性推薦列表返回給用戶??紤]到廣電業(yè)務中電視節(jié)目視頻的數(shù)據(jù)量龐大,數(shù)據(jù)相對不夠穩(wěn)定,內(nèi)容需頻繁更新,故選擇時間融合基于用戶的協(xié)同過濾推薦,引入時間效應,可以保證用戶每天收到的推薦是不一樣的,保持推薦結果的新穎性和多樣性,同時可以控制在一段時間內(nèi)熱門的視頻節(jié)目,防止用戶過于跟風。單一的推薦算法并不能發(fā)揮推薦系統(tǒng)應有的效果,可以引入近幾年興起的基于標簽的推薦、基于社交網(wǎng)絡的推薦,提高推薦算法的效率。Netflix從2006年起開始舉辦Netflix Prize推薦算法設計大賽[1],有很多選手綜合采用多種推薦算法去改進推薦結果,得到混合推薦算法,從而達到更好的推薦效果。
3總結與展望
為適應傳統(tǒng)媒體和新興媒體業(yè)務融合發(fā)展,廣電需要建立開放的、融合的、智能的推薦系統(tǒng)架構。廣電智能推薦系統(tǒng)對內(nèi)容、渠道、用戶三方面進行統(tǒng)一數(shù)據(jù)收集、信息管理、深度挖掘,從而識別用戶共性化和個性化需求,承載多樣化媒體業(yè)務新形態(tài)。同時廣電智能推薦系統(tǒng)存在一些難點,主要包括直播節(jié)目元數(shù)據(jù)關聯(lián)、用戶安全隱私、家庭用戶興趣偏好分析等問題。這些難點需要進一步深入研究。
本文設計了針對廣電業(yè)務的智能推薦應用系統(tǒng)框架,并對未來的研究方向進行構想。廣電智能推薦系統(tǒng)是家庭智能化的重要組成部分,服務于運營,通過媒體與用戶之間的雙向交流,站在用戶的角度為其提供定制服務。通過媒體融合的應用場景和相關技術,把視頻內(nèi)容與其背后蘊藏的豐富信息進行深度關聯(lián)、精準傳播。通過智能化平臺的建設,識別用戶共性、個性化的需求,利用內(nèi)容整合、網(wǎng)絡融合,為用戶高效率、高質量、立體化地提供其真正需要的內(nèi)容服務,以此提高廣電運營在未來的競爭力。
參考文獻:
[1]項亮. 推薦系統(tǒng)實踐[M].北京:人民郵電出版社,2012.
[2]陳萌,楊成,王歡,等. 交互式電視中個性化推薦系統(tǒng)的研究[J].電視技術,2012,36(14):37-40.
[3]易明,鄧衛(wèi)華.基于標簽的個性化信息推薦研究綜述[J].情報理論與實踐,2011,34(3):126-128.
[4]邢星. 社交網(wǎng)絡個性化推薦方法研究[D]. 大連:大連海事大學,2013.
[5]于洪,李俊華. 一種解決新項目冷啟動問題的推薦算法[J].軟件學報,2015,26(6):1395-1408.
[6]基于時間效應和用戶興趣變化的改進推薦算法研究[D]. 北京:北京郵電大學,2014.
[7]HIROI K,MORITA H. High-accuracy time-variant recommender system with number-score curve[C]// 2014 IEEE Fourth International Conference on Consumer Electronics Berlin (ICCE-Berlin).[S.l.]: IEEE Press,2014:106-110.
[8]李培琳,趙明,王炳飛.廣電家庭用戶個性化推薦的難點和解決思路[J].電視技術,2015,39(18):33-35.
[9]黃喬,尹四清. 網(wǎng)絡電視推薦系統(tǒng)框架及協(xié)同過濾算法的研究[J].電視技術,2013,37(9):136-138.
陳都,碩士生,主研信息網(wǎng)絡技術;
苗方,講師,主研寬帶網(wǎng)絡;
金立標,副教授,主要研究方向為數(shù)字電視信息網(wǎng)絡技術;
吳敏,中國國際廣播電臺技術管理辦公室主任。
責任編輯:許盈
Study on intelligent recommendation system applied in television broadcasting
CHEN Du1, MIAO Fang1, JIN Libiao1, WU Min2
(1.CommunicationUniversityofChinaFacultyofScienceandTechology,Beijing100024,China;2.ChinaRadioInternational,Beijing100040,China)
Key words:intelligent recommendation; user behavior analysis; media convergence
Abstract:With the development of radio and television media, convergence is coming. New technologies and applications are required to innovate communication ways in the time of convergence. In order to fully tap and analyze the potential needs of customers, intelligent recommendation technology for radio and television is increasingly concerned by people. The results of new recommendation technology are introduced in this paper. In addition, the framework of intelligent recommendation system is established with the consideration of time and media integration. The prospect of radio and television sector are given in the end.
中圖分類號:TP301.6
文獻標志碼:A
DOI:10.16280/j.videoe.2016.01.020
基金項目:科技部國家科技支撐計劃課題(2013BAH36F00)
作者簡介:
收稿日期:2015-11-04
文獻引用格式:陳都,苗方,金立標,等. 廣電智能推薦系統(tǒng)的應用研究[J].電視技術,2016,40(1):102-105.
CHEN D,MIAO F,JIN L B, et al. Study on intelligent recommendation system applied in television broadcasting[J].Video engineering,2016,40(1):102-105.