焦沫青
摘 要:現(xiàn)如今,隨著網(wǎng)絡(luò)技術(shù)的高速發(fā)展和網(wǎng)絡(luò)技術(shù)的廣泛普及,互聯(lián)網(wǎng)已經(jīng)成為大眾生活中不可缺少的一部分。然而越來越多的網(wǎng)絡(luò)用戶正面臨著一個問題,即當(dāng)使用網(wǎng)絡(luò)時,大量的網(wǎng)絡(luò)信息同時展現(xiàn)在用戶面前,用戶無法第一時間找到需要的信息:淘寶網(wǎng)上有上千件同樣的商品,Netfix上有數(shù)萬部影片,用戶何以快速得其所需?就此問題本文展開探討。
關(guān)鍵詞:網(wǎng)絡(luò)視頻 影評 推薦方式 探討
中圖分類號:J905 文獻標(biāo)識碼:A 文章編號:1672-3791(2018)12(b)-000-02
1 諸論
1.1 研究背景
基于互聯(lián)網(wǎng)進行的信息推薦技術(shù),正是解決以上這些難題的有效手段。它有利于用戶從因特網(wǎng)這個信息海洋中尋找所需的信息資源,并推薦其所需要的服務(wù),同時也能夠讓商家獲得用戶對其產(chǎn)品的反饋信息,比如阿里巴巴公司的淘寶網(wǎng)、國外購物網(wǎng)站Amazon、視頻網(wǎng)站Youtube等。用戶將基于推薦系統(tǒng)接受這些建議并給予反饋,這些反饋可以存儲在推薦數(shù)據(jù)庫中,并在未來的交互中生成新的建議。
在電影網(wǎng)站中很多用戶在看完電影后都會發(fā)表相應(yīng)的評論和評分,在被應(yīng)用于推薦系統(tǒng)方面時,用戶的電影評論非常有價值,這些評論信息直接反映了用戶對某個電影的喜好程度。當(dāng)用戶瀏覽網(wǎng)站尋找電影時,網(wǎng)站可以利用這些信息推薦給目標(biāo)用戶可能感興趣的一些電影,提高了用戶體驗,幫助用戶在最短的時間內(nèi)找到自己喜歡的電影欣賞。
然而如今視頻網(wǎng)站中,大部分采用的仍是以標(biāo)簽為主的推薦系統(tǒng),僅有少數(shù)視頻網(wǎng)站嘗試過以用戶評論為基礎(chǔ)的推薦系統(tǒng),使用過此種推薦系統(tǒng)的網(wǎng)站收到了不錯的用戶反饋,如國外知名的視頻網(wǎng)站Youtube與全球有名的在線影片租賃商Netfli。在非視頻網(wǎng)站中,知名電商Amazon和國內(nèi)的每日頭條等使用評論推薦系統(tǒng)。目前在結(jié)合評論挖掘的推薦方面,Adomavicius等通過深入研究各種推薦算法,指出推薦系統(tǒng)在應(yīng)用評論挖掘的方面還有待發(fā)展。針對目前推薦系統(tǒng)中結(jié)合電影評論研究相對缺乏的情況,本文希望對如今互聯(lián)網(wǎng)環(huán)境下以用戶評論為基礎(chǔ)的推薦系統(tǒng)的使用現(xiàn)況,優(yōu)點和發(fā)展前景進行調(diào)查研究。
1.2 本文主要目的
探究如今互聯(lián)網(wǎng)環(huán)境下基于用戶評論的推薦系統(tǒng)的應(yīng)用情況,調(diào)查此種推薦系統(tǒng)與其他推薦系統(tǒng)相比有何優(yōu)缺點之處,分析基于用戶評論的推薦系統(tǒng)未來發(fā)展前景。
1.3 本文結(jié)構(gòu)
本文的內(nèi)容安排如下。
第一章介紹了本文的研究和實踐背景,基本闡明了意見挖掘和推薦系統(tǒng)的結(jié)合在當(dāng)今互聯(lián)網(wǎng)時代下的意義以及本文對基于用戶評論的推薦系統(tǒng)進行研究的原因。
第二章描述了對基于用戶評論的推薦系統(tǒng)在當(dāng)今時代下的使用現(xiàn)狀。
第三章利用評論推薦系統(tǒng)對隨機選定的影片進行了過濾,并用影視網(wǎng)站原有的標(biāo)簽推薦系統(tǒng)進行過濾,通過對兩種推薦系統(tǒng)過濾出的影片進行閱覽,比較出評論推薦系統(tǒng)的優(yōu)缺點。
第四章綜合二、三章對用戶評論推薦系統(tǒng)進行了綜合分析,分析了基于用戶評論的推薦系統(tǒng)的發(fā)展前景。
2 對基于用戶評論的推薦系統(tǒng)使用現(xiàn)狀的調(diào)查
本章的第一部分是對基于用戶評論的推薦系統(tǒng)(以下簡稱“評論推薦系統(tǒng)”)使用現(xiàn)狀的調(diào)查。
2.1 使用評論推薦系統(tǒng)的視頻網(wǎng)站
目前全球主流視頻網(wǎng)站中,Youtube在其混合推薦系統(tǒng)中加入了評論推薦系統(tǒng)。Youtube巨大的用戶量所提供的用戶評論為評論推薦系統(tǒng)提供了可能。
2.2 非視頻網(wǎng)站上對于評論推薦系統(tǒng)的應(yīng)用
除視頻網(wǎng)站外,其他類型的大眾用戶型網(wǎng)站也對評論推薦系統(tǒng)有應(yīng)用,例如貓途鷹,其基于大量用戶評論的推薦系統(tǒng)已經(jīng)成為其網(wǎng)站招牌。
除以上網(wǎng)站外,還有其他使用評論推薦系統(tǒng)的網(wǎng)站,在此就不再一一論述。從以上的網(wǎng)站來看,評論推薦系統(tǒng)已經(jīng)被部分網(wǎng)站所使用,但在視頻網(wǎng)站上使用相對較少,而在非視頻網(wǎng)站的應(yīng)用則相對廣泛。
3 評論推薦系統(tǒng)的優(yōu)缺點調(diào)查
為了實際調(diào)查評論推薦系統(tǒng)的優(yōu)缺點及視頻網(wǎng)站用戶對評論推薦系統(tǒng)的滿意度,本章利用作者設(shè)計的評論推薦系統(tǒng)進行調(diào)查。
3.1 數(shù)據(jù)準(zhǔn)備及預(yù)處理
本文的數(shù)據(jù)來自豆瓣電影網(wǎng)頁信息,對豆瓣電影網(wǎng)頁信息抓取的基本思路是:首先得到網(wǎng)頁中電影的基本信息,包括電影名、評分、導(dǎo)演、演員、類型;其次再抓取整個電影的所有用戶評論,將所有元素保存在一份文件中。
本文選擇了豆瓣電影網(wǎng)上對電影《大偵探福爾摩斯》的影評,使用網(wǎng)絡(luò)信息搜集軟件八爪魚進行用戶評論采集,并提取用戶評論中的關(guān)鍵詞進行過濾,經(jīng)過分詞并將出現(xiàn)次數(shù)最多的關(guān)鍵詞與豆瓣網(wǎng)站其他電影評論進行逆向比較,選擇出與《大偵探福爾摩斯》影評最相近的3部電影。
3.1.1 影評數(shù)據(jù)采集
選定隨機目標(biāo),本文此次選擇豆瓣網(wǎng)對電影《大偵探福爾摩斯》的影評進行采集過濾。利用網(wǎng)絡(luò)信息采集軟件對影評進行采集。本文此次選擇“八爪魚采集器”軟件。
3.1.2 影評元素預(yù)處理
將前面抓取到的所有電影的評論,進行分詞,本文采用的是結(jié)巴分詞。分詞后詞表有很多無用詞,采用哈工大中文停用詞表,在此基礎(chǔ)上人工加入一些涉及到電影評論領(lǐng)域的停用詞,進行了去除停用詞的處理。(1)排除停用詞來減小詞表文件的大小。觀察統(tǒng)計好的詞表發(fā)現(xiàn),里面有很多詞作為評價詞沒有價值,并且出現(xiàn)的次數(shù)很少,因此做了排除低頻詞的處理。(2)經(jīng)過這三步預(yù)處理工作,電影的全部信息預(yù)處理完畢。如此,提取出5個高頻詞。
提取的5個高頻詞為:福爾摩斯、偵探、英、美、基,計算出高頻詞在總評論有效詞語中出現(xiàn)的百分比并記錄。將提取出的關(guān)鍵詞與豆瓣其他電影的影評關(guān)鍵詞進行對比,得出符合次數(shù)最多的兩部電影:《大偵探福爾摩斯2》《福爾摩斯歸來記》。同時記錄下上文5個關(guān)鍵詞在以上3部電影中有效詞語的百分比。
3.2 利用標(biāo)簽系統(tǒng)提取視頻
利用豆瓣電影網(wǎng)所使用的標(biāo)簽推薦系統(tǒng)進行視頻篩選。
對于《大偵探福爾摩斯》,豆瓣標(biāo)簽為“動作/懸疑/驚悚/犯罪/冒險美國/德國”等。利用類型標(biāo)簽進行篩選,運用如上方法,隨機選測其他兩部電影《羅馬假日》《復(fù)仇者聯(lián)盟》。
3.3 評價指標(biāo)
本文選擇對關(guān)鍵詞所占所有詞語百分比高低作為評價指標(biāo),若關(guān)鍵詞百分比符合度相似則證明篩選準(zhǔn)確。
3.4 實驗結(jié)果分析
總有效詞取2458個,從百分比綜合可以看出,評論推薦結(jié)果百分比更高,更加精確。其余兩部電影均得出相似結(jié)論,如表1所示。
4 評論推薦系統(tǒng)的綜合分析以及前景預(yù)測
4.1 評論推薦系統(tǒng)的綜合分析
綜上所述,評論推薦系統(tǒng)相較于標(biāo)簽推薦系統(tǒng),因其直觀的反映出了用戶的感受,所以推薦更具準(zhǔn)確性。但正如第三章中所演示的操作一樣,評論推薦系統(tǒng)需要通過采集用戶評論—提取評論關(guān)鍵詞—視頻評論關(guān)鍵詞比對—篩選比對結(jié)果—反饋給用戶這樣一個相對漫長且復(fù)雜的過程,而標(biāo)簽推薦系統(tǒng)僅需將標(biāo)簽相同的對象反饋給用戶即可,相對簡略。因此在主旨為向用戶提供視頻,而僅僅將推薦系統(tǒng)作為一種附屬系統(tǒng)的視頻網(wǎng)站中,評論推薦系統(tǒng)并未像標(biāo)簽推薦系統(tǒng)一樣的到廣泛的應(yīng)用。相反,在以向用戶推薦為主的旅游網(wǎng)站中,準(zhǔn)確度高的評論推薦系統(tǒng)得到了廣泛運用。
4.2 評論推薦系統(tǒng)的前景預(yù)測
由現(xiàn)在的網(wǎng)絡(luò)環(huán)境以及網(wǎng)絡(luò)技術(shù)來看,評論推薦系統(tǒng)未在視頻網(wǎng)站上的到廣泛運用的原因是其復(fù)雜的操作程序,較大的操作量難以吸引視頻網(wǎng)站對這種推薦方式進行開發(fā)研究,僅僅是具有代表性的Youtube對這種推薦方式進行了開發(fā)。在未來,隨著硬件技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,提取—過濾—反饋的過程會變得更加快捷簡單,評論推薦系統(tǒng)也會逐漸被各大視頻網(wǎng)站所采用。而在以推薦為主的旅游等服務(wù)型網(wǎng)站上,高準(zhǔn)確性的評論推薦系統(tǒng)會繼續(xù)發(fā)展下去。
參考文獻
[1] 周良,王璇.視頻網(wǎng)站運營中用戶評論的作用及實證分析[J].中國流通經(jīng)濟,2015,29(2):90-97.
[2] 李佳.基于意見挖掘與深度學(xué)習(xí)的推薦算法研究[D].吉林大學(xué),2018.
[3] 扈中凱,鄭小林,吳亞峰,等.基于用戶評論挖掘的產(chǎn)品推薦算法[J].浙江大學(xué)學(xué)報:工學(xué)版,2013,47(8):1475-1485.