何 麗,王京豪,段建勇
(1.北方工業(yè)大學(xué) 信息學(xué)院,北京 100144;2.北方工業(yè)大學(xué) CNONIX國家標(biāo)準(zhǔn)應(yīng)用與推廣實(shí)驗(yàn)室,北京 100144;3.北京城市治理研究基地,北京 100144)
個(gè)性化新聞推薦極大地提升了用戶篩選信息的效率,為用戶準(zhǔn)確推薦新聞。有研究表明,在推薦的同時(shí)提供文字解釋可以提升用戶對(duì)推薦系統(tǒng)的信賴,增加系統(tǒng)的可信度與滿意度[1]。
為了對(duì)推薦做出直觀的解釋,近來的一些研究使用元數(shù)據(jù),例如從用戶瀏覽記錄中獲取用戶感興趣的標(biāo)簽和主題闡明用戶偏好[2]。盡管這些方法可以使用外部元數(shù)據(jù)來解釋推薦,但是支持推薦解釋的可解釋特征很難獲取,因此,在真實(shí)數(shù)據(jù)中人們很難使用該方式生成推薦的解釋。
現(xiàn)有的一些可解釋推薦方法通常將推薦預(yù)測和生成解釋分成兩個(gè)獨(dú)立的步驟分別優(yōu)化,或是只優(yōu)化其中一個(gè)目標(biāo),例如嵌入法[3],其采用將解釋語句生成模塊直接整合到推薦模型中,其優(yōu)化目標(biāo)通常只為推薦準(zhǔn)確度,無法保證解釋的質(zhì)量;后處理法[4],先優(yōu)化常規(guī)推薦系統(tǒng)的準(zhǔn)確性,再根據(jù)推薦結(jié)果生成對(duì)應(yīng)解釋,這種解釋通常是固定模板的句式,很難使用戶對(duì)其產(chǎn)生信任。
可解釋推薦通常是基于用戶與內(nèi)容的交互信息,例如用戶的評(píng)分、評(píng)分等內(nèi)容,對(duì)推薦的內(nèi)容生成解釋[5]。也因此,現(xiàn)有的可解釋推薦系統(tǒng)通常進(jìn)行電影推薦、電商推薦等包含用戶評(píng)論和評(píng)分內(nèi)容的研究,新聞推薦領(lǐng)域則鮮有可解釋推薦系統(tǒng)。
基于此,本文提出了一種特征映射方法,通過將使用基本潛在因子模型學(xué)習(xí)的一般特征映射到可解釋的方面特征,可以在不影響基本潛在因子模型的推薦性能的情況下使用方面特征解釋輸出,將新聞數(shù)據(jù)中的一般不可解釋特征映射到可解釋的方面特征;同時(shí),采用聯(lián)合學(xué)習(xí)機(jī)制綜合學(xué)習(xí)用戶表征和新聞特征,模型借此來挑選出用戶最感興趣的新聞特征,進(jìn)而優(yōu)化解釋語句。
個(gè)性化新聞推薦是自然語言處理領(lǐng)域的一項(xiàng)重要任務(wù),其有著廣泛的應(yīng)用[6]。對(duì)于新聞推薦來說,學(xué)習(xí)到準(zhǔn)確的新聞表示和用戶表示是十分重要的,現(xiàn)有的方法大多只專注于優(yōu)化獲取到的用戶表征和新聞表示,如An Mingxiao等[7]提出的LSTUR模型能夠較好的結(jié)合用戶長期愛好和短期興趣的方法,Wu等[8]從新聞數(shù)據(jù)多個(gè)方面學(xué)習(xí)新聞特征,但是這些方法都沒有涉及推薦系統(tǒng)的可解釋性,無法提高系統(tǒng)的透明度、說服力和可信度。
傳統(tǒng)觀念認(rèn)為,可解釋性和準(zhǔn)確性被認(rèn)為是模型設(shè)計(jì)中兩個(gè)相互沖突的目標(biāo),可以選擇一個(gè)簡單的模型來獲得更好的可解釋性,或者選擇一個(gè)復(fù)雜的模型來獲得更好的準(zhǔn)確性[9]。然而,近年的研究表明開發(fā)具有可解釋性的深度學(xué)習(xí)模型成為了可能,例如Zhang等利用大規(guī)模文本評(píng)論和基于方面的方法,生成詞云解釋;Wang等[10]通過聯(lián)合張量因式分解框架,集成了推薦的用戶偏好建模和解釋的自定義內(nèi)容建模兩個(gè)配套學(xué)習(xí)任務(wù),生成個(gè)性化文本解釋。
針對(duì)新聞推薦,可解釋推薦系統(tǒng)則相對(duì)較少,主要是因?yàn)樾侣剶?shù)據(jù)中用戶的行為數(shù)據(jù)只包含用戶的瀏覽和點(diǎn)擊歷史,不包含用戶的評(píng)論、評(píng)分等交互數(shù)據(jù),因而很難生成個(gè)性化解釋語句。Wang等[11]利用知識(shí)圖譜發(fā)現(xiàn)用戶和項(xiàng)目之間的關(guān)聯(lián),但也只在電影和音樂這種有用戶評(píng)論的數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。本文利用映射方法將新聞數(shù)據(jù)中的一般特征映射為可解釋方面特征,并利用聯(lián)合學(xué)習(xí)模型獲取新聞和用戶特征之間的關(guān)聯(lián),在準(zhǔn)確推薦的同時(shí)提供推薦的解釋語句,實(shí)現(xiàn)了可靠的可解釋新聞推薦。
在本節(jié)中,首先介紹如何將新聞數(shù)據(jù)的一般特征映射到可解釋方面特征空間。方面(Aspect)[12]指的是表征項(xiàng)目的屬性。之后介紹基于互注意力機(jī)制的可解釋推薦模型,以及如何生成新聞推薦預(yù)測和解釋語句。
新聞數(shù)據(jù)通常包含不同類型的信息,比如主題類別、標(biāo)題、摘要等特征,它們對(duì)于學(xué)習(xí)新聞的表示都是很有幫助的。包含多種信息類別的新聞數(shù)據(jù)見表1。
表1 新聞數(shù)據(jù)樣例
為了實(shí)現(xiàn)可解釋推薦模型,首先新聞的類別要與用戶喜好的相似,本文利用映射到方面特征[12]來做可解釋特征。將新聞數(shù)據(jù)集的每種主題類別視作不同方面,如(體育、軍事、生活、娛樂、美食),例如表1中的新聞數(shù)據(jù)主題類別對(duì)應(yīng)的方面特征就為 (1,0,0,0,0), 同理對(duì)副類別也進(jìn)行方面特征映射,進(jìn)一步細(xì)粒度化新聞特征。
新聞數(shù)據(jù)集中用戶的行為一般只包含用戶的瀏覽和點(diǎn)擊新聞?dòng)涗洠瑪?shù)據(jù)樣例見表2。
表2 用戶行為數(shù)據(jù)樣例
(1)
如果是從未點(diǎn)擊或?yàn)g覽過的新聞,得分則定義為0。
最后,將這些映射后的新聞特征與用戶評(píng)分?jǐn)?shù)據(jù)作為模型的輸入,進(jìn)行新聞的可解釋推薦,具體細(xì)節(jié)將在2.2節(jié)中展示。
為了實(shí)現(xiàn)既可以準(zhǔn)確推薦新聞,又可以為推薦生成語句解釋,本文提出了一種將兩種任務(wù)聯(lián)合學(xué)習(xí)的模型,其整體模型如圖1所示。
圖1 聯(lián)合學(xué)習(xí)模型
經(jīng)過2.1節(jié)處理后得到的用戶評(píng)分矩陣作為新增的用戶數(shù)據(jù),與數(shù)據(jù)集中的用戶行為數(shù)據(jù)與新聞數(shù)據(jù)共同作為模型輸入。
模型先使用用戶編碼器和新聞編碼器來進(jìn)行用戶興趣建模和新聞特征建模,兩個(gè)編碼器的輸出作為預(yù)測評(píng)分和解釋生成的輸入;計(jì)算后的預(yù)測評(píng)分與2.1節(jié)映射后的用于可解釋的新聞方面特征也作為解釋生成的輸入,最終生成對(duì)應(yīng)的推薦解釋語句。模型將新聞推薦與解釋生成作為兩個(gè)任務(wù),聯(lián)合學(xué)習(xí),利用了兩個(gè)任務(wù)間共享的用戶和新聞的隱含表示。接下來對(duì)模型進(jìn)行詳細(xì)介紹。
2.2.1 編碼器
用戶編碼器的作用是從用戶瀏覽過的新聞中學(xué)習(xí)到用戶表示,這對(duì)于提高新聞推薦的準(zhǔn)確度來說至關(guān)重要。由于新聞是具有高度時(shí)效性的,用戶的興趣也是隨著時(shí)間在改變的,對(duì)于新聞推薦來說能夠同時(shí)學(xué)習(xí)用戶長期愛好和短期興趣表示的方法取得的效果較好[7],用戶的表示分為長期和短期的,學(xué)習(xí)長期用戶表示的方法為通過用戶ID的嵌入,用u表示用戶的id,Wu為用戶id的嵌入,長期用戶表示就為ue=Wu[u]。 之后,從用戶最近瀏覽過的新聞中學(xué)習(xí)用戶的短期表示,應(yīng)用門控遞歸網(wǎng)絡(luò)(GRU)來獲取新聞閱讀順序[13],將用戶的長期表示作為GRU網(wǎng)絡(luò)隱藏層的初始狀態(tài),用戶瀏覽過的新聞按順序表示為ni,k表示用戶瀏覽過的新聞總量,將這些新聞按順序通過新聞編碼器后得到對(duì)應(yīng)的新聞表示ei,由于改進(jìn)了新聞編碼器,因此得到的新聞表示ei是更為準(zhǔn)確的,這能夠幫助用戶編碼器更好學(xué)習(xí)用戶的短期表示,用戶短期表示的計(jì)算公式如下
ri=σ(Wr[hi-1,ei])zi=σ(Wz[hi-1,ei])gi=tanh(Wg[ri⊙hi-1,ei])hi=zi⊙hi+(1-zi)⊙gi
(2)
其中:σ為sigmoid函數(shù),W為GRU網(wǎng)絡(luò)的參數(shù),⊙表示同或運(yùn)算。最終,最后一個(gè)GRU網(wǎng)絡(luò)的隱藏狀態(tài)就是結(jié)合了長短期的用戶表示u=hk。
新聞編碼器用來從不同類別的信息(主題類別、副類別、標(biāo)題、摘要)中學(xué)習(xí)新聞的統(tǒng)一表示。同一新聞中不同的詞可能具有不同的信息量,所以采用注意力機(jī)制學(xué)習(xí)不同單詞的重要性。由于主題類別和副類別為一個(gè)單詞,通過主題類別編碼器、副類別編碼器得到的最終表示分別為ec,esc,其公式為
ec=ReLU(Pc×bc+pc)
(3)
式中:Pc,pc均是全連接層的參數(shù),ReLU是非線性激活函數(shù),同理得到esc。
(4)
(5)
式中:Pt,pt均是訓(xùn)練參數(shù),qt是注意力向量。最終得到新聞標(biāo)題的最終表示et
(6)
同理通過摘要編碼器得到新聞的摘要表示ea。
最后采用注意力機(jī)制模擬不同類型的新聞信息的信息量,以便于更好學(xué)習(xí)新聞表示。將新聞的主題類別、副類別、標(biāo)題和摘要的注意力權(quán)重分別表示為αc,αsc,αt,αa,以主題類別的計(jì)算公式為例,公式如下
(7)
式中:Oc,oc是訓(xùn)練參數(shù),qe是注意力向量,使用類似的方法,可以求得副類別、標(biāo)題和摘要的注意力權(quán)重αsc,αt,αa。新聞編碼器所學(xué)習(xí)的最終新聞表示輸出表示為
e=αcec+αscesc+αtet+αaea
(8)
2.2.2 聯(lián)合學(xué)習(xí)
本文使用多任務(wù)聯(lián)合學(xué)習(xí)方法預(yù)測評(píng)分和根據(jù)學(xué)習(xí)到的表示生成解釋。首先,生成新聞推薦的預(yù)測評(píng)分時(shí),采用點(diǎn)生產(chǎn)方法來計(jì)算新聞點(diǎn)擊概率得分,這種方法被證明不論是時(shí)間效率還是性能都很好[13]。將用戶表示為u,候選新聞表示為ex, 用戶點(diǎn)擊候選新聞的預(yù)測評(píng)分s就表示為
s(u,nX)=uTeX
(9)
評(píng)分預(yù)測任務(wù)的損失函數(shù)表示如下
(10)
其中,γ表示訓(xùn)練集,s*為經(jīng)過2.1節(jié)映射后得到的對(duì)應(yīng)新聞評(píng)分。
對(duì)于解釋生成任務(wù),生成的語句輸入為編碼器層輸出的新聞表示e、用戶表示u、新聞?lì)A(yù)測評(píng)分s以及特征映射后的新聞方面特征。首先使用門控遞歸網(wǎng)絡(luò)[13]將e、u、s轉(zhuǎn)換為單詞序列,為了將其整合到GRU中,通過以下公式計(jì)算初始隱藏層狀態(tài)h0
(11)
hn=GRU(hn-1,yn)
(12)
式中:yn為在n時(shí)刻生成的單詞的詞嵌入。這一隱藏層狀態(tài)傳入輸出層生成輸出單詞wn,其公式為
wn=softmax(ωwhn-1+vw)
(13)
其中,ωw∈R|V|×?,vw∈R|V|,|V| 表示詞匯量。
定義損失函數(shù)La用于使生成的解釋盡可能地使用映射后的方面特征,比如多使用標(biāo)題和分類中的單詞以增加解釋語句的可信度。將方面特征向量表示為ψ∈R|V|,ψx為1就表示第x個(gè)單詞是包含在方面特征中的,否則其值就為0。損失函數(shù)La的公式如下
(14)
最終,聯(lián)合學(xué)習(xí)模型將不同類型的損失函數(shù)線性組合,以共同學(xué)習(xí)兩個(gè)任務(wù),最終損失函數(shù)L表示為
(15)
式中:λa、λ?為平衡不同損失函數(shù)的權(quán)重,?為模型的所有參數(shù)。
為了驗(yàn)證改進(jìn)后的方法是否能夠提高新聞推薦的效果以及能否生成良好的解釋語句,本文設(shè)計(jì)了一系列對(duì)比實(shí)驗(yàn)。首先對(duì)實(shí)驗(yàn)設(shè)置進(jìn)行說明,然后探究改進(jìn)后的模型與其它方法的效果對(duì)比,最后驗(yàn)證了特征映射與聯(lián)合學(xué)習(xí)方法的有效性。
3.1.1 數(shù)據(jù)集
為了驗(yàn)證新聞推薦的效果提升,使用真實(shí)世界的新聞數(shù)據(jù)集是十分重要的。本次實(shí)驗(yàn)中,我們使用MIND數(shù)據(jù)集[15],這是微軟公司從微軟新聞網(wǎng)站的匿名行為日志中收集的用于研究新聞推薦的大型數(shù)據(jù)集。為了提升驗(yàn)證效率,我們使用了小規(guī)模的MIND數(shù)據(jù)集,數(shù)據(jù)集的詳細(xì)信息見表3和表4。
表3 用戶行為數(shù)據(jù)集
表4 新聞數(shù)據(jù)集
其中,用戶行為數(shù)據(jù)集的每條數(shù)據(jù)包括用戶行為ID、用戶ID、行為的時(shí)間、用戶的瀏覽歷史、用戶對(duì)新聞的行為,用戶對(duì)新聞的行為指的是用戶在此次用戶行為時(shí)間時(shí)展示給他的新聞他是否點(diǎn)擊過,點(diǎn)擊過的標(biāo)記為1否則為0。新聞數(shù)據(jù)集的每條新聞包括新聞ID、主題分類、副分類、標(biāo)題、摘要、正文鏈接、標(biāo)題的實(shí)體信息、摘要的實(shí)體信息,這些實(shí)體信息是標(biāo)題和摘要中的一些單詞實(shí)體的類別、維基百科ID、置信度等等,便于進(jìn)行詞嵌入等操作。
3.1.2 評(píng)價(jià)指標(biāo)與參數(shù)設(shè)置
在實(shí)驗(yàn)中,本文使用預(yù)訓(xùn)練的Glove嵌入法初始化詞嵌入,參數(shù)設(shè)置如下:用于標(biāo)題和摘要的詞嵌入維度設(shè)置為300,主題類別和副類別嵌入維度設(shè)置為100,CNN網(wǎng)絡(luò)過濾器設(shè)置為425,窗口大小設(shè)置為3,dropout設(shè)置為0.8,設(shè)置Adam優(yōu)化模型,學(xué)習(xí)率設(shè)置為0.01,batchsize設(shè)置為128,GRU單元設(shè)置為400,Attention queries設(shè)置為200。
實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)分為兩部分:對(duì)于評(píng)價(jià)新聞推薦準(zhǔn)確性,本文采用的實(shí)驗(yàn)評(píng)價(jià)指標(biāo)是與主流方法相同的AUC(計(jì)算ROC曲線下的面積)、MRR(平均倒數(shù)秩)和nDCG(歸一化折損累計(jì)增益)。算法給用戶推薦一個(gè)新聞列表,用戶實(shí)際點(diǎn)擊的新聞越靠前,則表明推薦準(zhǔn)確度越高,推薦效果越好,上述指標(biāo)的數(shù)值也會(huì)越大[16]。
對(duì)于評(píng)價(jià)解釋語句的質(zhì)量,本文采用BLEU和ROUGE這兩種評(píng)價(jià)指標(biāo),它們被廣泛地應(yīng)用于自然語言處理領(lǐng)域中,用于評(píng)價(jià)真實(shí)文本和生成文本之間的相似性[17]。BLEU和ROUGE的值越大,說明語句的可解釋性越好。
3.2.1 預(yù)測準(zhǔn)確度對(duì)比實(shí)驗(yàn)
首先,在推薦準(zhǔn)確性上,本文將與其它幾個(gè)作為基線的主流常規(guī)新聞推薦方法進(jìn)行對(duì)比,以此來驗(yàn)證改進(jìn)后的方法能夠提升推薦效果:
LibFM:將矩陣分解法應(yīng)用于推薦系統(tǒng)中,從瀏覽的新聞標(biāo)題中提取的TF-IDF特征和主題類別、副類別歸一化計(jì)數(shù)獲取用戶特征,之后再與新聞特征連接作為推薦總輸入。
DeepFM:結(jié)合了因子分解機(jī)(FM)和深層神經(jīng)網(wǎng)絡(luò),與LibFM特性相同。
CNN:利用卷積神經(jīng)網(wǎng)絡(luò)和最大化池相結(jié)合,從最顯著的特征中獲取新聞表示。
DKN[6]:結(jié)合了知識(shí)圖譜中的信息,包含了卷積神經(jīng)網(wǎng)絡(luò)和用戶瀏覽新聞歷史注意力機(jī)制的深度學(xué)習(xí)網(wǎng)絡(luò)。
NPA[18]:使用個(gè)性化注意力機(jī)制,用卷積神經(jīng)網(wǎng)絡(luò)從新聞標(biāo)題中學(xué)習(xí)新聞表示,根據(jù)用戶點(diǎn)擊歷史學(xué)習(xí)用戶表示并使用單詞級(jí)和新聞級(jí)的個(gè)性化注意力機(jī)制捕捉不同用戶的信息。
NRMS[19]:提出了一種多頭部自我注意力機(jī)制的方法從新聞和用戶瀏覽歷史中學(xué)習(xí)新聞表示和用戶表示。
LSTUR[7]:一種結(jié)合了用戶長期和短期表示的新聞推薦方法,利用卷積神經(jīng)網(wǎng)絡(luò)從新聞的標(biāo)題中學(xué)習(xí)新聞表示,從用戶信息中學(xué)習(xí)長期表示,利用GRU網(wǎng)絡(luò)從最近瀏覽的新聞中學(xué)習(xí)短期表示。
雖然以上提到的方法文中所使用的數(shù)據(jù)集與本文不同,但其所用的新聞數(shù)據(jù)中的新聞標(biāo)題、分類和用戶行為數(shù)據(jù)中的用戶點(diǎn)擊新聞歷史等,MIND數(shù)據(jù)集都包括。故通過對(duì)以上這些論文中提到的方法進(jìn)行復(fù)現(xiàn),使用本文方法相同的數(shù)據(jù)集和同樣的評(píng)價(jià)指標(biāo)得到的推薦結(jié)果展示在表5中。
表5 不同方法的新聞推薦準(zhǔn)確性結(jié)果
從中可以看出本文改進(jìn)的方法比其它的基線方法在AUC、MRR項(xiàng)上得分更高,在nDCG數(shù)值上雖然不是最大但也相差不多,說明使用了本文的特征映射和聯(lián)合學(xué)習(xí)模型后在生成解釋語句是同時(shí)也一定程度上可以提升推薦準(zhǔn)確性。
3.2.2 解釋語句質(zhì)量對(duì)比實(shí)驗(yàn)
對(duì)解釋語句的質(zhì)量評(píng)價(jià)時(shí),使用其它幾個(gè)生成解釋語句的方法作為基線:
Lexrank:一種基于隨機(jī)圖的方法來計(jì)算自然語言處理中文本的相對(duì)重要性。
NRT[20]:根據(jù)評(píng)論和評(píng)分的詞級(jí)分布生成解釋語句。
NARRE[2]:通過注意力機(jī)制獲得重要句子或評(píng)論用于解釋。
現(xiàn)有的可解釋推薦方法大多都需要用到用戶對(duì)物品的評(píng)分及評(píng)論,這在新聞數(shù)據(jù)中是很少見的,本次實(shí)驗(yàn)使用的MIND數(shù)據(jù)集中也并無此類數(shù)據(jù),在實(shí)驗(yàn)時(shí)復(fù)現(xiàn)對(duì)比方法代碼,并使用本文中2.1節(jié)的方法生成的近似評(píng)分矩陣,以及新聞標(biāo)題與分類的詞嵌入作為替代用戶評(píng)論的輸入,得到了生成的解釋語句的實(shí)驗(yàn)結(jié)果見表6。
表6 解釋語句評(píng)價(jià)結(jié)果
為了評(píng)估不同粒度下的解釋質(zhì)量,本文使用了ROUGE評(píng)估方法中的ROUGE-1、ROUGE-2、ROUGE-L進(jìn)行結(jié)果評(píng)估。從結(jié)果中可以看出,首先,本文方法在各項(xiàng)評(píng)價(jià)指標(biāo)上均優(yōu)于基線方法,說明生成的解釋語句質(zhì)量在這些評(píng)價(jià)指標(biāo)上比基線方法要高。NRT方法學(xué)習(xí)深度用戶項(xiàng)交互,并對(duì)解釋提供顯式約束,以提高解釋質(zhì)量,它在基線中結(jié)果最好,本文方法建立在其基礎(chǔ)上,同時(shí)結(jié)果要更好,說明特征映射與聯(lián)合學(xué)習(xí)對(duì)推薦系統(tǒng)中生成高質(zhì)量解釋語句是有幫助的。接下來通過一些例子來說明生成的解釋語句的不同。
從表7中可以看出,NRT方法生成的解釋則沒有包含足夠的新聞特征,NARRE方法則直接使用了新聞標(biāo)題作為解釋語句,當(dāng)然這可能也與MIND數(shù)據(jù)集沒有用戶評(píng)論數(shù)據(jù)有關(guān)。本文方法則由于引入了新聞方面特征,強(qiáng)調(diào)了新聞的標(biāo)題與分類,生成的解釋語句盡可能地包含了這些內(nèi)容,更容易吸引用戶的關(guān)注。
表7 解釋語句樣例
為了驗(yàn)證本文使用的特征映射與聯(lián)合學(xué)習(xí)方法的有效性,采用消融實(shí)驗(yàn)進(jìn)行對(duì)比實(shí)驗(yàn),分別從推薦準(zhǔn)確度與解釋生成兩方面進(jìn)行驗(yàn)證。
首先,從推薦準(zhǔn)確度的方面驗(yàn)證特征映射方法的有效性,在分別不使用用戶評(píng)分矩陣與映射后的新聞方面特征的情況下進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖2所示。
圖2 特征映射推薦準(zhǔn)確度對(duì)比實(shí)驗(yàn)
從實(shí)驗(yàn)結(jié)果中可以看出,共同使用用戶評(píng)分矩陣與新聞方面特征的情況下推薦結(jié)果的評(píng)價(jià)指標(biāo)得到了最高的評(píng)分。只使用新聞方面特征又比只使用用戶評(píng)分的結(jié)果更好一些,說明在推薦準(zhǔn)確性上,新聞方面特征比生成的用戶評(píng)分矩陣更有效。雖然提升不大,但同時(shí)使用兩種特征映射可以達(dá)到更好的效果,這也驗(yàn)證了特征映射方法在推薦預(yù)測上的有效性。
采用消融實(shí)驗(yàn)的方式驗(yàn)證特征映射方法對(duì)提高解釋語句質(zhì)量的有效性。當(dāng)不使用特征映射方法時(shí),由于沒有形成用戶評(píng)分矩陣與新聞的可解釋方面特征時(shí),只能使用基于內(nèi)容特征的方式生成文本語句,將其與本文方法進(jìn)行解釋語句質(zhì)量對(duì)比實(shí)驗(yàn),結(jié)果如圖3所示。
圖3 特征映射解釋生成對(duì)比實(shí)驗(yàn)
接著,又做了不使用聯(lián)合學(xué)習(xí)方法的情況下新聞推薦與解釋生成任務(wù)的對(duì)比實(shí)驗(yàn),結(jié)果如圖4和圖5所示。
圖4 聯(lián)合學(xué)習(xí)推薦準(zhǔn)確度對(duì)比實(shí)驗(yàn)
圖5 聯(lián)合學(xué)習(xí)解釋生成對(duì)比實(shí)驗(yàn)
從圖4中可以看出,如果在推薦預(yù)測時(shí)不使用聯(lián)合學(xué)習(xí)方法,在AUC和MRR評(píng)價(jià)指標(biāo)上有所下降,驗(yàn)證了本文使用的聯(lián)合學(xué)習(xí)方法對(duì)于提升推薦準(zhǔn)確度的有效性。從圖5中可以看出使用聯(lián)合學(xué)習(xí)方法比只生成解釋的情況下生成的解釋語句在各個(gè)評(píng)價(jià)指標(biāo)上都得分更高,驗(yàn)證了本文使用的聯(lián)合學(xué)習(xí)方法對(duì)于提升解釋語句質(zhì)量的有效性。
綜上所述,在MIND數(shù)據(jù)集上,使用基于特征映射和聯(lián)合學(xué)習(xí)的方法同時(shí)進(jìn)行推薦預(yù)測與解釋生成任務(wù)可以同時(shí)對(duì)兩個(gè)任務(wù)進(jìn)行提升,相比于基線方法,本文提出的該方法在推薦準(zhǔn)確度的AUC等評(píng)價(jià)指標(biāo)、解釋語句的BLUE等評(píng)價(jià)指標(biāo)上均達(dá)到了更好的效果。
本文提出了一種基于特征映射和聯(lián)合學(xué)習(xí)的可解釋新聞推薦方法。特征映射方法,將不可解釋的一般特征映射到可解釋的方面特征,消除了對(duì)元數(shù)據(jù)的需求;聯(lián)合學(xué)習(xí)模型平衡準(zhǔn)確預(yù)測和生成解釋這兩個(gè)任務(wù),在用戶評(píng)分與評(píng)論數(shù)據(jù)較少的新聞推薦領(lǐng)域?qū)崿F(xiàn)了可用的可解釋推薦功能,在推薦預(yù)測與解釋生成兩個(gè)任務(wù)上均達(dá)到了較為令人滿意的結(jié)果。在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,相比于其它基線方法,該方法在推薦準(zhǔn)確度和解釋語句質(zhì)量兩方面都有所提升。