孟祥武,史艷翠,王立才,張玉潔
(1.北京郵電大學(xué) 智能通信軟件與多媒體北京市重點(diǎn)實(shí)驗(yàn)室;2.北京郵電大學(xué) 計(jì)算機(jī)學(xué)院,北京 100876)
隨著“三網(wǎng)融合”和物聯(lián)網(wǎng)技術(shù)與應(yīng)用的飛速發(fā)展,移動(dòng)通信網(wǎng)絡(luò)在與傳統(tǒng)互聯(lián)網(wǎng)逐漸融合的過(guò)程中,對(duì)傳統(tǒng)互聯(lián)網(wǎng)信息服務(wù)進(jìn)行了延伸,可以為移動(dòng)用戶(hù)提供比傳統(tǒng)通信業(yè)務(wù)更加豐富多彩的移動(dòng)網(wǎng)絡(luò)服務(wù)。與此同時(shí),由于智能移動(dòng)設(shè)備、傳感器和射頻識(shí)別的日益普及,信息資源的獲取和推送可以發(fā)生在“任何時(shí)間、任何地點(diǎn)、以任何方式”,為移動(dòng)用戶(hù)提供無(wú)處不在的移動(dòng)網(wǎng)絡(luò)服務(wù)已經(jīng)成為可能[1]。然而,隨著移動(dòng)網(wǎng)絡(luò)服務(wù)的日益涌現(xiàn)及其廣泛應(yīng)用,移動(dòng)網(wǎng)絡(luò)服務(wù)類(lèi)型和信息內(nèi)容的增長(zhǎng)將逐漸超出人們所能接受的范圍,加之移動(dòng)設(shè)備的界面顯示、終端處理、輸入輸出等能力有限,將導(dǎo)致嚴(yán)重的“移動(dòng)信息過(guò)載”問(wèn)題[2],為移動(dòng)用戶(hù)帶來(lái)極為沉重的信息負(fù)擔(dān),移動(dòng)網(wǎng)絡(luò)服務(wù)及其運(yùn)營(yíng)資源利用率也將受到嚴(yán)重影響。
現(xiàn)在與未來(lái)通信服務(wù)研究的目標(biāo)是面向復(fù)雜、融合、協(xié)作的網(wǎng)絡(luò)環(huán)境和泛在的移動(dòng)網(wǎng)絡(luò)服務(wù)提供環(huán)境,不斷發(fā)現(xiàn)和滿(mǎn)足移動(dòng)網(wǎng)絡(luò)用戶(hù)的個(gè)性化需求及其變化,為其提供實(shí)時(shí)、準(zhǔn)確的個(gè)性化服務(wù)[3]。用戶(hù)偏好是提供個(gè)性化服務(wù)的關(guān)鍵所在,為了確保最終提供的移動(dòng)網(wǎng)絡(luò)服務(wù)能真正滿(mǎn)足移動(dòng)用戶(hù)的需求,獲取實(shí)時(shí)準(zhǔn)確的移動(dòng)用戶(hù)偏好已成為移動(dòng)網(wǎng)絡(luò)服務(wù)研究領(lǐng)域的關(guān)鍵問(wèn)題之一。
目前,國(guó)內(nèi)外尚未有詳細(xì)而全面介紹移動(dòng)用戶(hù)偏好學(xué)習(xí)技術(shù)研究成果和發(fā)展趨勢(shì)的綜述論文。鑒于移動(dòng)用戶(hù)偏好學(xué)習(xí)技術(shù)的重要學(xué)術(shù)研究意義和實(shí)用價(jià)值,筆者通過(guò)跟蹤研究,總結(jié)現(xiàn)階段該領(lǐng)域的研究成果、存在的問(wèn)題,并對(duì)發(fā)展趨勢(shì)進(jìn)行展望。
一個(gè)完整的移動(dòng)用戶(hù)偏好學(xué)習(xí)過(guò)程包括數(shù)據(jù)收集、移動(dòng)用戶(hù)偏好表示、移動(dòng)用戶(hù)偏好學(xué)習(xí)以及移動(dòng)用戶(hù)偏好評(píng)價(jià)4部分,因此本文安排如下:第1節(jié)主要介紹移動(dòng)用戶(hù)偏好的背景和意義;第2節(jié)介紹移動(dòng)用戶(hù)偏好學(xué)習(xí)所需數(shù)據(jù)以及現(xiàn)有獲取移動(dòng)數(shù)據(jù)集的方法;第3節(jié)介紹移動(dòng)用戶(hù)偏好的表示方法;第4節(jié)介紹移動(dòng)用戶(hù)偏好的學(xué)習(xí)方法,包括獲取技術(shù)以及自適應(yīng)更新方法;第5節(jié)介紹移動(dòng)用戶(hù)偏好的評(píng)價(jià)方法;第6節(jié)對(duì)移動(dòng)網(wǎng)絡(luò)服務(wù)中用戶(hù)偏好學(xué)習(xí)技術(shù)研究領(lǐng)域有待深入研究的難點(diǎn)和發(fā)展趨勢(shì)進(jìn)行展望;第7節(jié)為結(jié)束語(yǔ)。這樣的劃分可以使相關(guān)研究人員明確自己的研究是處于移動(dòng)用戶(hù)偏好學(xué)習(xí)的哪個(gè)過(guò)程。其中,移動(dòng)用戶(hù)偏好表示、移動(dòng)用戶(hù)偏好學(xué)習(xí)和移動(dòng)用戶(hù)偏好評(píng)價(jià)是通過(guò)閱讀文獻(xiàn),總結(jié)現(xiàn)有的常用方法。
隨著3G網(wǎng)絡(luò)的普及以及智能移動(dòng)手機(jī)功能的不斷完善,移動(dòng)用戶(hù)不僅可以通過(guò)語(yǔ)音、短信、飛信等方式進(jìn)行通信,而且手機(jī)還提供了拍攝、視頻錄制、音樂(lè)播放、網(wǎng)頁(yè)瀏覽、下載應(yīng)用軟件、GPS(global position system)定位等功能[1,4]。因此,可以根據(jù)用戶(hù)自身信息、用戶(hù)使用的移動(dòng)網(wǎng)絡(luò)服務(wù)(包括使用次數(shù)和頻率)以及相應(yīng)的上下文信息,例如時(shí)間、地點(diǎn)、周?chē)藛T等[4~6]學(xué)習(xí)移動(dòng)用戶(hù)偏好。
1) 移動(dòng)用戶(hù)信息
移動(dòng)用戶(hù)的人口統(tǒng)計(jì)學(xué)數(shù)據(jù)(如年齡、職業(yè)、收入、性別等)是學(xué)習(xí)移動(dòng)網(wǎng)絡(luò)服務(wù)中移動(dòng)用戶(hù)偏好的主要數(shù)據(jù)來(lái)源之一[7~9]。這些信息通常由移動(dòng)用戶(hù)入網(wǎng)注冊(cè)時(shí)填寫(xiě),也可以根據(jù)一些機(jī)器學(xué)習(xí)或者數(shù)據(jù)挖掘技術(shù)推理獲取(如可以在移動(dòng)用戶(hù)授權(quán)許可范圍內(nèi)根據(jù)身份證信息獲取其籍貫信息、通過(guò)移動(dòng)用戶(hù)購(gòu)買(mǎi)行為預(yù)測(cè)其收入信息、通過(guò)移動(dòng)社交化網(wǎng)絡(luò)挖掘移動(dòng)用戶(hù)的工作/教育背景等)。它們從概貌層面對(duì)移動(dòng)用戶(hù)進(jìn)行刻畫(huà),相比傳統(tǒng)互聯(lián)網(wǎng)用戶(hù)信息來(lái)講,具有明確的移動(dòng)用戶(hù)標(biāo)識(shí),更加真實(shí)可靠。此外,還可以通過(guò)某些方式獲取移動(dòng)用戶(hù)的其他信息,這對(duì)于特定的移動(dòng)網(wǎng)絡(luò)服務(wù)來(lái)說(shuō)是十分重要的,例如通過(guò)GPS或基站定位系統(tǒng)獲取移動(dòng)用戶(hù)的地理位置信息或者移動(dòng)用戶(hù)軌跡,有利于為移動(dòng)用戶(hù)提供基于位置的服務(wù),也有利于各種移動(dòng)網(wǎng)絡(luò)服務(wù)提供商提供地理信息系統(tǒng)方面的服務(wù)[10~12]。
2) 移動(dòng)用戶(hù)使用移動(dòng)網(wǎng)絡(luò)服務(wù)的行為信息
移動(dòng)用戶(hù)使用的移動(dòng)網(wǎng)絡(luò)服務(wù)包括2部分:基本業(yè)務(wù)和增值服務(wù)[13]。基本業(yè)務(wù)主要是指通過(guò)語(yǔ)音方式進(jìn)行的交互行為。移動(dòng)網(wǎng)絡(luò)中用戶(hù)的聯(lián)系人一般是家人、朋友、同學(xué)、同事等。通過(guò)用戶(hù)的通話(huà)行為以及時(shí)間和位置上下文信息可以推導(dǎo)出移動(dòng)用戶(hù)之間的社會(huì)關(guān)系[14~16]。分析通信行為構(gòu)建的移動(dòng)社會(huì)化網(wǎng)絡(luò),對(duì)學(xué)習(xí)移動(dòng)用戶(hù)偏好、提供移動(dòng)社交化網(wǎng)絡(luò)類(lèi)服務(wù)來(lái)講十分重要。文獻(xiàn)[17]通過(guò)分析移動(dòng)電話(huà)數(shù)據(jù)獲取移動(dòng)用戶(hù)之間關(guān)系的動(dòng)態(tài)變化。移動(dòng)用戶(hù)使用增值服務(wù)的行為主要是指短信、彩信、彩鈴、在線(xiàn)瀏覽、下載游戲、電子書(shū)/音樂(lè)/電影等多媒體信息、應(yīng)用軟件以及收發(fā)郵件等[5,13]。這些行為信息主要通過(guò)移動(dòng)用戶(hù)行為日志直接或者間接獲取,并利用移動(dòng)用戶(hù)行為挖掘方法來(lái)處理。
3) 移動(dòng)上下文信息及上下文用戶(hù)行為信息
與傳統(tǒng)互聯(lián)網(wǎng)相比,移動(dòng)網(wǎng)絡(luò)服務(wù)中用戶(hù)偏好受周?chē)舷挛囊蛩氐挠绊懜黠@。例如,有些用戶(hù)在工作時(shí)間喜歡使用語(yǔ)音方式進(jìn)行通信,在公共場(chǎng)所喜歡用文本方式進(jìn)行通信,如郵件、短信等[5];有些用戶(hù)喜歡在乘坐地鐵時(shí)通過(guò)移動(dòng)終端瀏覽網(wǎng)頁(yè)、看電子書(shū)、聽(tīng)音樂(lè)、看電影、玩游戲,有些用戶(hù)喜歡在晚上使用移動(dòng)微博服務(wù)等。移動(dòng)網(wǎng)絡(luò)中涉及的上下文包括時(shí)間、位置、周?chē)藛T、社會(huì)關(guān)系以及用戶(hù)情緒[5,18~22]等信息,這些信息可以通過(guò)傳感器或者安裝在移動(dòng)終端上的軟件直接或者間接推理獲取。由于移動(dòng)網(wǎng)絡(luò)中用戶(hù)行為很大程度上受上下文影響,記錄上下文相關(guān)的移動(dòng)用戶(hù)行為對(duì)移動(dòng)用戶(hù)偏好的學(xué)習(xí)十分重要。
目前包含用戶(hù)使用移動(dòng)網(wǎng)絡(luò)服務(wù)以及相應(yīng)上下文的公開(kāi)數(shù)據(jù)集比較少,因此可以采用以下3種數(shù)據(jù)集學(xué)習(xí)移動(dòng)用戶(hù)偏好。
1) 真實(shí)移動(dòng)數(shù)據(jù)集
目前,真實(shí)的移動(dòng)數(shù)據(jù)集主要是通過(guò)志愿者或者移動(dòng)運(yùn)營(yíng)商獲取[2,5,14~17],但這些數(shù)據(jù)集出于對(duì)用戶(hù)隱私的保護(hù)公開(kāi)的比較少。MIT Reality Mining[14]數(shù)據(jù)集是目前公開(kāi)的包含上下文信息和用戶(hù)使用移動(dòng)網(wǎng)絡(luò)服務(wù)行為的一個(gè)數(shù)據(jù)集。該數(shù)據(jù)集是麻省理工學(xué)院多媒體實(shí)驗(yàn)室在 2004年收集的用于社會(huì)感知計(jì)算的數(shù)據(jù)集,包括94個(gè)用戶(hù)從2004年9月到2005年6月共9個(gè)月的通信行為、周?chē)藛T信息、位置信息、手機(jī)狀態(tài)、用戶(hù)使用的服務(wù)以及相應(yīng)的時(shí)間信息。但該數(shù)據(jù)集只有 94個(gè)移動(dòng)用戶(hù)的行為信息,而且移動(dòng)用戶(hù)被局限在特定區(qū)域,因此研究的結(jié)果不具有普遍性。Nokia研究中心[15]對(duì)MIT數(shù)據(jù)集進(jìn)行了擴(kuò)展,增加了志愿者的人數(shù)以及使用時(shí)間,但該數(shù)據(jù)集考慮到用戶(hù)隱私問(wèn)題目前還沒(méi)有公開(kāi)。SUMATRA數(shù)據(jù)集[23]主要用于研究移動(dòng)用戶(hù)行為軌跡和用戶(hù)社區(qū)挖掘計(jì)算,包含180多萬(wàn)條移動(dòng)用戶(hù)的通話(huà)行為和位置信息。目前,由于成本問(wèn)題對(duì)于小型實(shí)驗(yàn)室來(lái)說(shuō),采集豐富的包含上下文信息關(guān)聯(lián)移動(dòng)用戶(hù)行為的數(shù)據(jù)集仍然比較困難。
2) 半模擬移動(dòng)數(shù)據(jù)集
上述真實(shí)數(shù)據(jù)集是針對(duì)特定的用戶(hù)偏好學(xué)習(xí)采集的,所采集的數(shù)據(jù)量比較少或者不全面。當(dāng)通過(guò)這些數(shù)據(jù)集學(xué)習(xí)移動(dòng)用戶(hù)偏好時(shí),只能得到用戶(hù)對(duì)部分通信服務(wù)或者增值服務(wù)的偏好。一個(gè)比較常見(jiàn)的數(shù)據(jù)集構(gòu)建方法是:在原有真實(shí)數(shù)據(jù)集基礎(chǔ)上,按照預(yù)先設(shè)定的合理規(guī)則增加移動(dòng)用戶(hù)數(shù)量、使用通信服務(wù)、增值服務(wù)等的行為信息[24~26]。例如,可以對(duì)MIT數(shù)據(jù)集進(jìn)行擴(kuò)展,通過(guò)分析MIT數(shù)據(jù)以及調(diào)研學(xué)習(xí)的合理規(guī)則可以將 MIT數(shù)據(jù)集擴(kuò)展為包括幾百甚至幾千個(gè)移動(dòng)用戶(hù)行為的數(shù)據(jù)集。
3) 仿真移動(dòng)數(shù)據(jù)集
仿真移動(dòng)數(shù)據(jù)集主要是根據(jù)調(diào)研得到的各種規(guī)則以及實(shí)驗(yàn)需要仿真生成的數(shù)據(jù)[6,27~29]。文獻(xiàn)[27]中通過(guò)仿真數(shù)據(jù)獲取移動(dòng)用戶(hù)偏好,并將其應(yīng)用在移動(dòng)服務(wù)選擇機(jī)制中。仿真數(shù)據(jù)集的優(yōu)點(diǎn)是可以針對(duì)具體問(wèn)題生成需要的數(shù)據(jù)集,與獲取真實(shí)的數(shù)據(jù)集相比,仿真數(shù)據(jù)集操作簡(jiǎn)單、獲取成本低。但仿真數(shù)據(jù)集對(duì)移動(dòng)用戶(hù)的分布以及使用行為是按照設(shè)定的規(guī)則產(chǎn)生的,因此存在局限性[30]。但目前由于公開(kāi)數(shù)據(jù)集比較少,在參考已公開(kāi)的數(shù)據(jù)集以及相關(guān)調(diào)查研究的基礎(chǔ)上生成仿真數(shù)據(jù)集是小型實(shí)驗(yàn)室進(jìn)行研究的一種可行方法。
與傳統(tǒng)互聯(lián)網(wǎng)相比,在移動(dòng)網(wǎng)絡(luò)中移動(dòng)用戶(hù)偏好學(xué)習(xí)將面臨動(dòng)態(tài)多樣的移動(dòng)網(wǎng)絡(luò)環(huán)境和泛在的移動(dòng)網(wǎng)絡(luò)服務(wù)提供環(huán)境,而且受上下文因素的影響更加明顯。為了提高移動(dòng)用戶(hù)偏好獲取的準(zhǔn)確性,文獻(xiàn)[31]將上下文引入到用戶(hù)偏好建模中,文獻(xiàn)[30]對(duì)上下文感知推薦系統(tǒng)進(jìn)行了綜述性分析,其中涉及上下文用戶(hù)偏好提取、基于上下文感知的移動(dòng)網(wǎng)絡(luò)服務(wù)推薦等。將上下文信息引入移動(dòng)用戶(hù)偏好學(xué)習(xí)后,其表示方法需要進(jìn)行相應(yīng)的擴(kuò)展以適應(yīng)移動(dòng)網(wǎng)絡(luò)對(duì)移動(dòng)用戶(hù)偏好學(xué)習(xí)的要求。通過(guò)閱讀文獻(xiàn)總結(jié),本文主要介紹常用的幾種表示方法。
向量空間模型(VSM, vector space model)是常用的移動(dòng)用戶(hù)偏好表示方法。該方法將移動(dòng)用戶(hù)偏好表示為n維特征向量{(t1,w1),(t2,w2),…,(tn,wn)},向量的每一維由一個(gè)關(guān)鍵詞及其權(quán)重組成,權(quán)重表示移動(dòng)用戶(hù)對(duì)某個(gè)移動(dòng)網(wǎng)絡(luò)服務(wù)感興趣的程度。當(dāng)移動(dòng)用戶(hù)偏好不受上下文影響時(shí),可以直接采用該方法進(jìn)行表示。文獻(xiàn)[32]通過(guò)向量空間模型表示短消息,并將其應(yīng)用在短信檢索中。當(dāng)移動(dòng)用戶(hù)偏好受上下文影響時(shí),需要從影響移動(dòng)用戶(hù)偏好的各種關(guān)聯(lián)因素角度出發(fā)對(duì)表示方法進(jìn)行擴(kuò)展,構(gòu)建一個(gè)包含用戶(hù)、移動(dòng)網(wǎng)絡(luò)服務(wù)、上下文信息、用戶(hù)偏好信息的多元組[5,6,10,18]。
基于向量空間模型的表示方法具有直觀、簡(jiǎn)單、擴(kuò)展性良好,能反映不同概念在用戶(hù)偏好中的重要程度,便于展開(kāi)數(shù)學(xué)計(jì)算的優(yōu)點(diǎn),可應(yīng)用在支持向量機(jī)[33]、貝葉斯分類(lèi)[20]方法中。但這種表示方法較少考慮影響用戶(hù)偏好獲取的各種因素之間存在的層次關(guān)系,在應(yīng)用時(shí)可能出現(xiàn)偏差。
用戶(hù)—項(xiàng)目評(píng)分矩陣是一個(gè)二維矩陣,矩陣中的元素表示用戶(hù)對(duì)給定項(xiàng)目的量化偏好/評(píng)分。當(dāng)移動(dòng)用戶(hù)偏好不受上下文影響時(shí),可以直接采用用戶(hù)—項(xiàng)目評(píng)分矩陣進(jìn)行表示[2,25]。當(dāng)移動(dòng)用戶(hù)偏好受上下文影響時(shí),矩陣需要擴(kuò)展為用戶(hù)—項(xiàng)目—上下文多維度評(píng)分矩陣[27]。
該表示方法簡(jiǎn)單易懂,主要應(yīng)用在協(xié)同過(guò)濾計(jì)算方法中。缺點(diǎn)是當(dāng)引入上下文后,矩陣由原來(lái)的二維矩陣擴(kuò)展為多維矩陣,加劇了矩陣的稀疏性,降低了移動(dòng)用戶(hù)偏好獲取的精確度。所以采用該表示方法獲取移動(dòng)用戶(hù)偏好時(shí),需要解決數(shù)據(jù)的稀疏性問(wèn)題。文獻(xiàn)[27]通過(guò)引入移動(dòng)用戶(hù)之間的信任度來(lái)緩解矩陣的稀疏性問(wèn)題。
基于神經(jīng)網(wǎng)絡(luò)的表示方法用網(wǎng)絡(luò)狀態(tài)表示用戶(hù)偏好。網(wǎng)絡(luò)狀態(tài)由網(wǎng)絡(luò)輸入狀態(tài)、網(wǎng)絡(luò)輸出狀態(tài)以及輸入與輸出之間的連接狀態(tài)組成。當(dāng)移動(dòng)用戶(hù)偏好不受上下文影響時(shí),可以直接用該方法表示;當(dāng)移動(dòng)用戶(hù)偏好受上下文影響時(shí),需要對(duì)輸入狀態(tài)進(jìn)行擴(kuò)展[12,19,34]。文獻(xiàn)[34]中通過(guò)將上下文信息添加到輸入向量對(duì)原有表示方法進(jìn)行擴(kuò)展。
然而,基于神經(jīng)網(wǎng)絡(luò)的表示方法依賴(lài)于用戶(hù)偏好學(xué)習(xí)過(guò)程中所采用的神經(jīng)網(wǎng)絡(luò)類(lèi)別和算法,其適用范圍較窄且表示不易被理解。
本體由實(shí)體、屬性、關(guān)系和公理組成,可以表示豐富的概念和實(shí)體之間的關(guān)系,可以在特定域內(nèi)對(duì)數(shù)據(jù)信息進(jìn)行一致性理解。研究人員考慮到本體在概念、領(lǐng)域知識(shí)表示方面的諸多優(yōu)點(diǎn),通過(guò)建立本體域,以期比較豐富、完整地表示移動(dòng)用戶(hù)偏好,并進(jìn)一步精確地獲取移動(dòng)用戶(hù)偏好[35]。上下文是在對(duì)數(shù)據(jù)信息一致理解的基礎(chǔ)上,考慮不同使用者、不同應(yīng)用場(chǎng)景所導(dǎo)致的對(duì)數(shù)據(jù)及其數(shù)值上的理解差異,文獻(xiàn)[36]將本體和上下文進(jìn)行集成化,并應(yīng)用在決策信息系統(tǒng)中。文獻(xiàn)[37]將上下文引入到本體中來(lái)表示移動(dòng)用戶(hù)偏好,并應(yīng)用在移動(dòng)網(wǎng)絡(luò)服務(wù)選擇中。
引入本體來(lái)表示用戶(hù)偏好的最大好處在于能夠?qū)崿F(xiàn)知識(shí)的重用和共享。但是這種表示方法的缺點(diǎn)是:本體的構(gòu)建成本太高。本體的設(shè)計(jì)在很大程度上依賴(lài)于研究人員的知識(shí)和經(jīng)驗(yàn),特別是當(dāng)定義域很大時(shí),本體設(shè)計(jì)的有效性更加難以保證。
1) 基于貝葉斯分類(lèi)器的移動(dòng)用戶(hù)偏好獲取技術(shù)
貝葉斯分類(lèi)器是一種用于分類(lèi)的概率方法。該方法首先計(jì)算用戶(hù)對(duì)給定項(xiàng)目屬于某個(gè)類(lèi)的概率,然后根據(jù)概率將項(xiàng)目進(jìn)行分類(lèi)。其優(yōu)點(diǎn)是需要較小的內(nèi)存空間,響應(yīng)時(shí)間比較短。當(dāng)移動(dòng)用戶(hù)偏好不受上下文影響時(shí)可以直接采用基于貝葉斯分類(lèi)器的用戶(hù)偏好獲取技術(shù)得到移動(dòng)用戶(hù)偏好;當(dāng)移動(dòng)用戶(hù)偏好受上下文影響時(shí),需要對(duì)其進(jìn)行改進(jìn)。文獻(xiàn)[20]在判定移動(dòng)用戶(hù)偏好類(lèi)別時(shí),將上下文作為一個(gè)條件添加到條件概率計(jì)算中,以提高移動(dòng)用戶(hù)偏好獲取的精確度。文獻(xiàn)[38]將上下文、服務(wù)內(nèi)容和用戶(hù)偏好作為顯著變量引入到貝葉斯網(wǎng)絡(luò)模型構(gòu)建中。
2) 基于神經(jīng)網(wǎng)絡(luò)的移動(dòng)用戶(hù)偏好獲取技術(shù)
神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)和自適應(yīng)能力,能夠通過(guò)調(diào)整權(quán)值適應(yīng)環(huán)境的變化。當(dāng)移動(dòng)用戶(hù)偏好不受上下文影響時(shí),可以直接采用該技術(shù)獲取移動(dòng)用戶(hù)偏好;當(dāng)移動(dòng)用戶(hù)偏好受上下文影響時(shí),需要對(duì)輸入向量進(jìn)行擴(kuò)展[12,19,34]。文獻(xiàn)[12]將時(shí)間、位置等上下文信息引入到人工神經(jīng)網(wǎng)絡(luò)的輸入向量中。文獻(xiàn)[19]將設(shè)備信息、用戶(hù)信息和服務(wù)信息作為神經(jīng)網(wǎng)絡(luò)的輸入信息。
3) 基于關(guān)聯(lián)規(guī)則的移動(dòng)用戶(hù)偏好獲取技術(shù)
關(guān)聯(lián)規(guī)則通過(guò)在數(shù)據(jù)集中找出具有用戶(hù)給定的最小支持度和最小置信度的項(xiàng)目來(lái)產(chǎn)生關(guān)聯(lián)規(guī)則。由于移動(dòng)終端輸入能力的限制,移動(dòng)用戶(hù)反饋的信息比較少,鑒于關(guān)聯(lián)規(guī)則方法在獲取和推理項(xiàng)目關(guān)聯(lián)性方面的優(yōu)勢(shì),有些研究人員將其引入移動(dòng)用戶(hù)偏好獲取過(guò)程以獲取一些新穎性的用戶(hù)偏好。Apriori算法是一種經(jīng)典的關(guān)聯(lián)規(guī)則方法。文獻(xiàn)[13]通過(guò) Apriori算法挖掘移動(dòng)網(wǎng)絡(luò)中增值業(yè)務(wù)之間的關(guān)聯(lián)性以獲取移動(dòng)用戶(hù)對(duì)移動(dòng)增值業(yè)務(wù)的偏好。當(dāng)移動(dòng)用戶(hù)偏好受上下文影響時(shí),需要對(duì)關(guān)聯(lián)規(guī)則進(jìn)行擴(kuò)展。文獻(xiàn)[28]采用Apriori算法挖掘在上下文約束下移動(dòng)用戶(hù)偏好之間的關(guān)聯(lián)性,在挖掘關(guān)聯(lián)規(guī)則時(shí)把相應(yīng)的上下文看作頻繁項(xiàng)來(lái)處理。
4) 基于決策樹(shù)的移動(dòng)用戶(hù)偏好獲取技術(shù)
決策樹(shù)是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,其優(yōu)點(diǎn)是建模速度快。文獻(xiàn)[39]中為了降低移動(dòng)用戶(hù)的流失,通過(guò)C5.0決策樹(shù)算法挖掘移動(dòng)用戶(hù)對(duì)通信服務(wù)的偏好信息。當(dāng)移動(dòng)用戶(hù)偏好受上下影響時(shí),需要將上下文添加到?jīng)Q策樹(shù)中。由于移動(dòng)網(wǎng)絡(luò)服務(wù)對(duì)上下文比較敏感,而上下文類(lèi)型和屬性之間的關(guān)系可以利用層次化樹(shù)來(lái)表示,使得決策樹(shù)模型較適合用于與上下文相關(guān)的移動(dòng)用戶(hù)偏好獲取中。文獻(xiàn)[11]中采用決策樹(shù)算法獲取移動(dòng)用戶(hù)對(duì)多媒體信息的偏好,在構(gòu)建決策樹(shù)時(shí),將上下文信息當(dāng)作屬性作為樹(shù)的節(jié)點(diǎn),在進(jìn)行分類(lèi)時(shí),從根節(jié)點(diǎn)比較相應(yīng)的上下文以及移動(dòng)用戶(hù)偏好的其他屬性。
5) 基于支持向量機(jī)的移動(dòng)用戶(hù)偏好獲取技術(shù)
支持向量機(jī)(SVM, support vector machine)可以解決小樣本、非線(xiàn)性和高維度等問(wèn)題,在分類(lèi)方面可以獲得比較好的精確度。文獻(xiàn)[33]提出了上下文支持向量機(jī)(C-SVM),通過(guò)將上下文信息添加到支持向量的特征向量中來(lái)實(shí)現(xiàn)對(duì)支持向量機(jī)的擴(kuò)展。但支持向量機(jī)的訓(xùn)練時(shí)間比較長(zhǎng),因此Suykens等[40]人修改了SVM的損失函數(shù)和約束條件,使訓(xùn)練轉(zhuǎn)換為線(xiàn)性問(wèn)題,由此構(gòu)建的最小二乘支持向量機(jī)(LSSVM, least squares support vector machine)不僅保持了標(biāo)準(zhǔn)SVM的泛化能力,而且可直接用于多分類(lèi)問(wèn)題。借鑒文獻(xiàn)[33]的方法,文獻(xiàn)[41]對(duì)LSSVM進(jìn)行了擴(kuò)展,將上下文添加到LSSVM中。目前,在移動(dòng)網(wǎng)絡(luò)中基于上下文最小二乘支持向量機(jī)(C-LSSVM)的移動(dòng)用戶(hù)偏好獲取技術(shù)的研究比較少,鑒于其在分類(lèi)精確度和響應(yīng)時(shí)間方面的優(yōu)勢(shì),在今后的研究中,可以嘗試通過(guò)C-LSSVM技術(shù)來(lái)獲取移動(dòng)用戶(hù)偏好。
6) 基于本體的移動(dòng)用戶(hù)偏好獲取技術(shù)
除了在概念表示方面的優(yōu)點(diǎn),本體還具有很強(qiáng)的推理計(jì)算能力,并被廣泛應(yīng)用于移動(dòng)用戶(hù)偏好獲取中。在移動(dòng)網(wǎng)絡(luò)服務(wù)環(huán)境下,大多數(shù)移動(dòng)用戶(hù)偏好獲取技術(shù)沒(méi)有考慮移動(dòng)用戶(hù)歷史行為的語(yǔ)義信息,為了解決這個(gè)問(wèn)題,研究人員對(duì)基于本體的移動(dòng)用戶(hù)偏好獲取技術(shù)進(jìn)行了廣泛研究[35~37]。與傳統(tǒng)互聯(lián)網(wǎng)相比,為了精確地定位移動(dòng)用戶(hù)偏好,移動(dòng)網(wǎng)絡(luò)中在構(gòu)建本體庫(kù)時(shí),除了服務(wù)本體庫(kù)、用戶(hù)本體庫(kù)外,還增加了上下文本體庫(kù)。其中用戶(hù)、服務(wù)以及上下文之間的聯(lián)系通過(guò)推導(dǎo)規(guī)則產(chǎn)生。文獻(xiàn)[37]提出了一個(gè)基于本體的框架用來(lái)發(fā)現(xiàn)大多數(shù)與用戶(hù)偏好以及設(shè)備能力相關(guān)的服務(wù),文中采用了W3C發(fā)布的本體,其豐富的數(shù)據(jù)信息可以完成個(gè)性化移動(dòng)服務(wù)的發(fā)現(xiàn)以及自適應(yīng)學(xué)習(xí)等。
在移動(dòng)網(wǎng)絡(luò)中,由于移動(dòng)用戶(hù)和移動(dòng)網(wǎng)絡(luò)服務(wù)數(shù)量比較大,因此采用4.1節(jié)提出的技術(shù)重新獲取移動(dòng)用戶(hù)偏好的響應(yīng)時(shí)間會(huì)隨時(shí)間的遷移,越來(lái)越大。借鑒文獻(xiàn)[42]中的方法,可以將移動(dòng)用戶(hù)行為數(shù)據(jù)存儲(chǔ)在不同的數(shù)據(jù)庫(kù)中,在修正時(shí)只需對(duì)臨時(shí)移動(dòng)用戶(hù)行為數(shù)據(jù)庫(kù)中的移動(dòng)用戶(hù)偏好進(jìn)行學(xué)習(xí)。移動(dòng)用戶(hù)偏好自適應(yīng)學(xué)習(xí)技術(shù)主要包括顯性自適應(yīng)學(xué)習(xí)技術(shù)和隱性自適應(yīng)學(xué)習(xí)技術(shù)2種。
4.2.1 移動(dòng)用戶(hù)偏好的顯性自適應(yīng)學(xué)習(xí)
顯性自適應(yīng)學(xué)習(xí)根據(jù)移動(dòng)用戶(hù)的顯性反饋信息更新移動(dòng)用戶(hù)偏好,例如移動(dòng)用戶(hù)對(duì)移動(dòng)網(wǎng)絡(luò)服務(wù)的評(píng)分[2,26,28,43,44]。但在移動(dòng)網(wǎng)絡(luò)中,由于移動(dòng)終端輸入能力的限制,顯性的反饋信息比較少,因此更新后得到的移動(dòng)用戶(hù)偏好的準(zhǔn)確性比較低。
4.2.2 移動(dòng)用戶(hù)偏好的隱性自適應(yīng)學(xué)習(xí)
隱性自適應(yīng)學(xué)習(xí)通過(guò)機(jī)器學(xué)習(xí)對(duì)移動(dòng)用戶(hù)的行為(使用服務(wù)時(shí)長(zhǎng)、頻率、上下文等)進(jìn)行學(xué)習(xí)來(lái)更新移動(dòng)用戶(hù)偏好[26,45]。隨時(shí)間遷移,移動(dòng)用戶(hù)偏好只有部分發(fā)生變化,因此在學(xué)習(xí)時(shí)只需對(duì)發(fā)生變化的移動(dòng)用戶(hù)偏好進(jìn)行學(xué)習(xí)。為了獲取實(shí)時(shí)、精確、無(wú)沖突的移動(dòng)用戶(hù)偏好,需要解決3個(gè)方面的問(wèn)題。
1) 檢測(cè)移動(dòng)用戶(hù)行為的變化
在移動(dòng)網(wǎng)絡(luò)中,由于移動(dòng)用戶(hù)偏好受上下文影響比較明顯,因此,在判斷移動(dòng)用戶(hù)行為是否發(fā)生變化時(shí),首先需要確定移動(dòng)用戶(hù)偏好受哪些上下文影響。文獻(xiàn)[46]根據(jù)上下文約束下用戶(hù)使用服務(wù)的波動(dòng)率來(lái)確定用戶(hù)行為受哪些上下文影響。在確定了上下文信息后,可以根據(jù)移動(dòng)用戶(hù)對(duì)服務(wù)使用的相對(duì)變化量來(lái)判斷移動(dòng)用戶(hù)對(duì)該服務(wù)的偏好是否發(fā)生變化。
2) 修正上下文約束下的移動(dòng)用戶(hù)偏好
當(dāng)移動(dòng)用戶(hù)偏好發(fā)生變化時(shí),需要對(duì)其進(jìn)行修正。當(dāng)對(duì)移動(dòng)用戶(hù)偏好進(jìn)行修正時(shí),可以根據(jù) 4.1節(jié)中介紹的偏好獲取技術(shù)對(duì)發(fā)生變化的移動(dòng)用戶(hù)偏好進(jìn)行重新學(xué)習(xí)
3) 解決上下文移動(dòng)用戶(hù)偏好沖突
修正后的移動(dòng)用戶(hù)偏好可能與原有移動(dòng)用戶(hù)偏好發(fā)生沖突,為了解決沖突問(wèn)題,可以借鑒文獻(xiàn)[43]的方法,為每個(gè)移動(dòng)用戶(hù)偏好設(shè)置一個(gè)可信度,當(dāng)移動(dòng)用戶(hù)偏好不發(fā)生變化時(shí),置信度增加,否則減小。當(dāng)置信度為0時(shí),將相應(yīng)的移動(dòng)用戶(hù)偏好刪除;對(duì)于新學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好賦予默認(rèn)的初始值。當(dāng)新學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好和原有移動(dòng)用戶(hù)偏好發(fā)生沖突時(shí),比較其可信度,選擇其中可信度最大的偏好作為移動(dòng)用戶(hù)偏好。
根據(jù)本節(jié)中提到的移動(dòng)用戶(hù)偏好學(xué)習(xí)技術(shù),移動(dòng)用戶(hù)偏好學(xué)習(xí)能夠回答類(lèi)似于下面的問(wèn)題,例如:1)根據(jù)用戶(hù)的通話(huà)習(xí)慣,可以獲取移動(dòng)用戶(hù)對(duì)移動(dòng)套餐的偏好;2)根據(jù)用戶(hù)當(dāng)前的位置信息,可以預(yù)測(cè)移動(dòng)用戶(hù)當(dāng)前需要的移動(dòng)網(wǎng)絡(luò)服務(wù)[2,10];3)根據(jù)與用戶(hù)使用網(wǎng)絡(luò)服務(wù)相似的其他用戶(hù)(即近似鄰居)的偏好,可以預(yù)測(cè)移動(dòng)用戶(hù)對(duì)未使用過(guò)的移動(dòng)網(wǎng)絡(luò)服務(wù)的偏好[10,25,26];4)根據(jù)移動(dòng)用戶(hù)的軌跡以及移動(dòng)用戶(hù)使用移動(dòng)網(wǎng)絡(luò)服務(wù)的歷史行為,可以預(yù)測(cè)出用戶(hù)在下一時(shí)刻可能使用的移動(dòng)網(wǎng)絡(luò)服務(wù)[47,48];5)根據(jù)用戶(hù)的好友關(guān)系和位置信息,可以挖掘用戶(hù)想知道附近有哪些好友的偏好[49,50];6)根據(jù)用戶(hù)使用移動(dòng)手機(jī)的行為,可以獲取移動(dòng)用戶(hù)對(duì)移動(dòng)終端軟硬件的偏好,例如拍照、聽(tīng)音樂(lè)、看電子書(shū)、鬧鐘等[5]。
為了確保移動(dòng)用戶(hù)偏好的準(zhǔn)確性,需要對(duì)學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好進(jìn)行評(píng)價(jià),目前通過(guò)實(shí)驗(yàn)的方法,根據(jù)平均絕對(duì)誤差(MAE, mean absolute error)、準(zhǔn)確率、召回率、F指標(biāo)等來(lái)評(píng)價(jià)學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好。
1) 平均絕對(duì)誤差
MAE是評(píng)價(jià)學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好的常用指標(biāo),用來(lái)度量學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好值與實(shí)際的移動(dòng)用戶(hù)偏好值的平均絕對(duì)誤差[24,27,51,52],其計(jì)算公式如下:
其中,ui表示實(shí)際的移動(dòng)用戶(hù)偏好值,表示學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好值。
2) 準(zhǔn)確率和召回率
準(zhǔn)確率和召回率是評(píng)價(jià)信息獲取系統(tǒng)常用的評(píng)價(jià)指標(biāo)[6,22,25,52]。準(zhǔn)確率的計(jì)算公式可表示為
其中,N1表示學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好正確的數(shù)量,N2表示學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好的總量。召回率表示學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好正確的數(shù)量與系統(tǒng)中實(shí)際的移動(dòng)用戶(hù)偏好的數(shù)量的比值,計(jì)算公式為
其中,N3表示系統(tǒng)中實(shí)際的移動(dòng)用戶(hù)偏好的數(shù)量。
3) F指標(biāo)
由于召回率經(jīng)常和準(zhǔn)確率一起使用,為了能同時(shí)準(zhǔn)確觀察召回率和準(zhǔn)確率,Pazzani M[43]等提出了F指標(biāo),其計(jì)算公式為
文獻(xiàn)[25,52]中使用F指標(biāo)來(lái)評(píng)價(jià)獲取的移動(dòng)用戶(hù)偏好,由于F指標(biāo)將準(zhǔn)確率和召回率綜合考慮,因此能更好地衡量系統(tǒng)的性能。
4) 響應(yīng)時(shí)間
本文的響應(yīng)時(shí)間不包括收集數(shù)據(jù)、數(shù)據(jù)傳輸、移動(dòng)用戶(hù)偏好傳輸?shù)人ㄙM(fèi)的時(shí)間。這里的響應(yīng)時(shí)間主要是指學(xué)習(xí)移動(dòng)用戶(hù)偏好所花費(fèi)的時(shí)間。由于移動(dòng)網(wǎng)絡(luò)的特點(diǎn),需要及時(shí)地為移動(dòng)用戶(hù)提供滿(mǎn)足其個(gè)性化需求的移動(dòng)網(wǎng)絡(luò)服務(wù)[10,13,22,28,31,32]。例如,當(dāng)移動(dòng)用戶(hù)在電影院附近時(shí),移動(dòng)用戶(hù)想知道新上映的電影信息,如果移動(dòng)用戶(hù)沒(méi)有及時(shí)收到信息,則可能選擇其他娛樂(lè)活動(dòng),這對(duì)服務(wù)提供商來(lái)說(shuō)是不利的。因此需要移動(dòng)用戶(hù)偏好學(xué)習(xí)的響應(yīng)時(shí)間要比較小。
5) 其他評(píng)價(jià)指標(biāo)
上述的評(píng)價(jià)方法主要是通過(guò)客觀的計(jì)算對(duì)學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好的準(zhǔn)確度進(jìn)行評(píng)價(jià)。但一個(gè)好的移動(dòng)用戶(hù)偏好學(xué)習(xí)技術(shù)不僅要有較高的準(zhǔn)確度,還需要好的移動(dòng)用戶(hù)滿(mǎn)意度。用戶(hù)對(duì)系統(tǒng)的滿(mǎn)意度不僅表現(xiàn)在系統(tǒng)獲取的偏好信息準(zhǔn)確度高,還表現(xiàn)在新鮮性、意外性、多樣性、用戶(hù)對(duì)系統(tǒng)的信任度等方面[52]。為了提高移動(dòng)用戶(hù)對(duì)偏好學(xué)習(xí)系統(tǒng)的信任度,可以給出獲取偏好的方法或原因。Amazon在向用戶(hù)推薦書(shū)籍時(shí)會(huì)給出為什么推薦這本書(shū),例如用戶(hù)買(mǎi)過(guò)同一個(gè)作者的書(shū),用戶(hù)的好友買(mǎi)過(guò)這本書(shū)等。移動(dòng)用戶(hù)偏好學(xué)習(xí)系統(tǒng)在給出移動(dòng)用戶(hù)偏好時(shí)也需要給出相應(yīng)的理由。但關(guān)于信任度、新鮮性以及意外性的研究比較少,沒(méi)有定量的計(jì)算標(biāo)準(zhǔn)。目前,移動(dòng)用戶(hù)滿(mǎn)意度主要通過(guò)用戶(hù)對(duì)偏好學(xué)習(xí)系統(tǒng)的顯性評(píng)分得到。
文獻(xiàn)[35]中將客觀評(píng)價(jià)與主觀評(píng)價(jià)結(jié)合起來(lái)使用。文獻(xiàn)[10]則通過(guò)志愿者的主觀評(píng)價(jià)來(lái)判斷系統(tǒng)提供的服務(wù)是否滿(mǎn)足移動(dòng)用戶(hù)的需求,測(cè)試時(shí)要求移動(dòng)用戶(hù)對(duì)學(xué)習(xí)得到的每項(xiàng)移動(dòng)用戶(hù)偏好進(jìn)行滿(mǎn)意度評(píng)價(jià),通過(guò)最終的滿(mǎn)意度來(lái)判斷系統(tǒng)是否能很好地滿(mǎn)足移動(dòng)用戶(hù)需求。
目前,移動(dòng)用戶(hù)偏好學(xué)習(xí)技術(shù)已經(jīng)在學(xué)術(shù)界得到了廣泛的研究。隨著 3G、4G的普及以及移動(dòng)終端設(shè)備的改進(jìn),移動(dòng)用戶(hù)可以更方便地獲取各種信息,因此移動(dòng)網(wǎng)絡(luò)服務(wù)中的移動(dòng)用戶(hù)偏好學(xué)習(xí)顯得越來(lái)越重要。盡管已經(jīng)存在很多學(xué)習(xí)移動(dòng)用戶(hù)偏好的技術(shù),但移動(dòng)用戶(hù)偏好學(xué)習(xí)仍有一些值得研究和探討的領(lǐng)域,歸納起來(lái)大概有以下幾個(gè)研究難點(diǎn)。
1) 數(shù)據(jù)集的獲取。目前公開(kāi)的數(shù)據(jù)集比較少,研究人員使用的真實(shí)數(shù)據(jù)集是志愿者或移動(dòng)運(yùn)營(yíng)商提供的。通過(guò)志愿者獲取數(shù)據(jù)集的成本比較大,例如智能手機(jī)的成本。移動(dòng)運(yùn)營(yíng)商一般只給與其合作的實(shí)驗(yàn)室提供數(shù)據(jù)集。因此希望本領(lǐng)域的研究人員能夠公開(kāi)已獲取的數(shù)據(jù)集以便為更多的研究人員提供研究的依據(jù)。
2) 移動(dòng)用戶(hù)偏好學(xué)習(xí)的形式化分析和驗(yàn)證。目前關(guān)于移動(dòng)用戶(hù)偏好學(xué)習(xí)的合理性主要是通過(guò)實(shí)驗(yàn)方法進(jìn)行驗(yàn)證的。偏好獲取技術(shù)受參數(shù)、閾值、數(shù)據(jù)集等的影響,而實(shí)驗(yàn)時(shí)參數(shù)、閾值的選擇方法主要根據(jù)經(jīng)驗(yàn)值、多次實(shí)驗(yàn)等方法選取,因此得出的實(shí)驗(yàn)結(jié)果的說(shuō)服力比較弱。為了提高移動(dòng)用戶(hù)偏好學(xué)習(xí)技術(shù)合理性驗(yàn)證的說(shuō)服力,需要對(duì)選取的用戶(hù)偏好獲取技術(shù)、相關(guān)參數(shù)、閾值給出合理的形式化分析。移動(dòng)用戶(hù)偏好獲取技術(shù)的合理性主要包括時(shí)間復(fù)雜度和準(zhǔn)確性分析;參數(shù)、閾值的合理性分析主要是指給出選擇參數(shù)或閾值時(shí)所遵循的定理、準(zhǔn)則或?qū)嶋H需要。
3) 隱私與安全問(wèn)題。隱私問(wèn)題一直是用戶(hù)最敏感的話(huà)題?,F(xiàn)有的方法是通過(guò)分析移動(dòng)用戶(hù)行為來(lái)學(xué)習(xí)移動(dòng)用戶(hù)偏好,在學(xué)習(xí)的過(guò)程中可能涉及移動(dòng)用戶(hù)自身的信息,例如移動(dòng)用戶(hù)的年齡、性別、周?chē)藛T以及活動(dòng)等。研究如何精確學(xué)習(xí)移動(dòng)用戶(hù)偏好的同時(shí)又能對(duì)移動(dòng)用戶(hù)信息進(jìn)行保密也是進(jìn)一步研究的方向。
研究熱點(diǎn)歸納起來(lái)有以下幾個(gè)。
1) 適合移動(dòng)網(wǎng)絡(luò)的移動(dòng)用戶(hù)偏好獲取技術(shù)。目前關(guān)于移動(dòng)用戶(hù)偏好獲取技術(shù)的方法主要是一些分類(lèi)算法,這些方法在互聯(lián)網(wǎng)中可以獲取令人滿(mǎn)意的結(jié)果。但由于移動(dòng)網(wǎng)絡(luò)的實(shí)時(shí)性以及移動(dòng)終端輸入輸出能力有限,對(duì)用戶(hù)偏好獲取技術(shù)提出了更高的要求,因此需要對(duì)原有方法進(jìn)行改進(jìn)或?qū)ふ腋m合移動(dòng)網(wǎng)絡(luò)需要的移動(dòng)用戶(hù)偏好獲取技術(shù)。
2) 對(duì)學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好的評(píng)價(jià)。現(xiàn)在對(duì)學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好的評(píng)價(jià)主要是針對(duì)其獲取的準(zhǔn)確性進(jìn)行評(píng)價(jià)。為了真正滿(mǎn)足移動(dòng)用戶(hù)的需求,還可以考慮根據(jù)移動(dòng)用戶(hù)的滿(mǎn)意度、移動(dòng)用戶(hù)偏好的新鮮性、覆蓋率、多樣性、意外性等更多的角度去評(píng)價(jià)學(xué)習(xí)得到的移動(dòng)用戶(hù)偏好。
3) 更細(xì)致地挖掘上下文之間的關(guān)聯(lián)。移動(dòng)用戶(hù)周?chē)奈锢砩舷挛摹⑸鐣?huì)上下文之間有著密切的關(guān)系,現(xiàn)有的移動(dòng)用戶(hù)偏好獲取技術(shù)將各種上下文假設(shè)為獨(dú)立或者簡(jiǎn)化了上下文之間的關(guān)系。如何更精確地確定各上下文之間的關(guān)系也是進(jìn)一步研究的方向。
移動(dòng)網(wǎng)絡(luò)以及移動(dòng)終端軟硬件的發(fā)展,可以使移動(dòng)用戶(hù)更便捷地訪(fǎng)問(wèn)信息,使用移動(dòng)網(wǎng)絡(luò)服務(wù)。但同時(shí)也為移動(dòng)用戶(hù)偏好學(xué)習(xí)帶來(lái)了新的挑戰(zhàn)。本文將移動(dòng)用戶(hù)偏好學(xué)習(xí)技術(shù)的研究進(jìn)展和趨勢(shì)進(jìn)行歸納、總結(jié)和預(yù)測(cè),并介紹給信息科學(xué)工作者,希望促進(jìn)此領(lǐng)域及其相關(guān)研究在我國(guó)的發(fā)展。
[1]KWOK R.Phoning in data[J].Nature, 2009, 458(7241):959-961.
[2]CHIU P H, KAO G Y M, LO C C.Personalized blog content recommender system for mobile phone users[J].Int’l Journal of Human-Computer Studies, 2010, 68(8):496-507.
[3]TUZHILIN A.Personalization:the State of the Art and Future Directions[M].Business Computing, Handbooks in Information System,2009.3-44.
[4]杜一, 田豐, 戴國(guó)忠等.一種移動(dòng)環(huán)境下的用戶(hù)模型[J].軟件學(xué)報(bào),2011, 22(2):120-128.DU Y, TIAN F, DAI G Z, et al.A user model based on mobile environment[J].Journal of Software, 22(2):120-128.
[5]DO T M T, DANIEL G P.By their apps you shall understand them:mining large-scale patterns of mobile phone usage[A].Proc of the 13th Int’l Conf on multimodal interfaces[C].Alicante, Spain, 2011.353-360.
[6]JEMBERE E, ADIGUN M O, XULU S S.Mining context-based user preferences for m-Services applications[A].Proc of the IEEE/WIC/ACM International Conference on Web Intelligence[C].Silicon Valley,USA, 2007.57-763.
[7]SHINTARO O.Exploring gender effects in a mobile advertising context:on the evaluation of trust, attitudes, and recall[J].Sex Roles, 2007,57:897-908.
[8]GOKUL C, JAN B, DANIEL G P.Mining large scale smartphone data for personality studies[J].Personal and Ubiquitous Computing, 2011.1-18.
[9]BRDAR S, ?ULIBRK D, CRNOJEVI? V.Demographic attributes prediction on the real-world mobile data[A].The Workshop on Mobile Data Challenge 2012 (by Nokia)[C].Newcastle, UK, 2012.
[10]LI X Y, MI Z C, ZHAN Z M.A location-aware recommender system for mobile shopping environments[A].Proc of the 2nd Int’l Conf on Information Science and Engineering (ICISE)[C].Hangzhou, China,2010.1709-1711.
[11]CHEN N, CHEN A.Integrating context-aware computing in decision support system[J].Lecture Notes in Engineering and Computer Sci-ence, 2010, 2180(1):359-364.
[12]QUSAY H M, EYHAB A M, WANG Z X.Design and implementation of a smart system for personalization and accurate selection of mobile services[J].Requirements Engineering, 2007, 12(4):221-230.
[13]YAO X L, SHU H Y.Study on value-added service in mobile telecom based on association rules[A].Proc of the 10th Int’l Conf on Software Engineering, Artificial Intelligences, Networking and Parallel/ Distributed Computing[C].Dezhou, China, 2009.116-119.
[14]EAGLE N, PENTLAND A, LAZER D.Inferring social network structure using mobile phone data[J].Proc of the National Academy of Sciences (PNAS), 2009, 106(36):15274-15278.
[15]NIKO K, JAN B, OLIVIER D.Towards rich mobile phone datasets:lausanne data collection campaign[A].Proc of the ACM Int Conf on Pervasive Services (ICPS)[C].Berlin, Germany, 2010.
[16]SHI Y C, MENG X W, ZHANG Y J.A trust calculating algorithm based on mobile phone data[A].Proc of the IEEE Global Telecommunications Conference, (GLOBECOM)[C].California, USA, 2012.2036-2041.
[17]CESAR A H, SICKERT C R.The dynamics of a mobile phone network[J].Physica A:Statistical Mechanics and Its Applications, 2008,387(12):3017-3024.
[18]王立才,孟祥武,張玉潔.移動(dòng)網(wǎng)絡(luò)服務(wù)中基于認(rèn)知心理學(xué)的用戶(hù)偏好提取方法[J].電子學(xué)報(bào), 2011, 39(11):2548-2553.WANG L C, MENG X W, ZHANG Y J.A cognitive psychology-based approach to user preferences elicitation for mobile network services[J].Acta Electronica Sinica, 2011, 39(11):2548-2553.
[19]EYHAB A M, QUSAY H M.A context-aware service discovery and selection mechanism using artificial neural networks[J].Int’l Journal of Intelligent Systems Technologies and Applications, 2009, 6(1):144-156.
[20]TOON D P, TOM D, LUC M.Extending the bayesian classifier to a context-aware recommender system for mobile devices[A].Proc of the 20105th International Conference on Internet and Web Applications and Services [C].Barcelona, 2010.242-247.
[21]MALLIKHARJUNA R N, NAIDU P M M, SEETHARAM P.An intelligent location management approaches in GSM mobile network[J].International Journal of Advanced Research in Artificial Intelligence, 2012, 1(1):30-37.
[22]YAN T X, CHU D, GANESAN D.Fast App launching for mobile devices using predictive user context[A].Proc of the 10th international conference on MobiSys[C].Lake District, UK, 2012.113-126.
[23]LAM D, COX D C, WIDOM J.Teletraffic modeling for personal communications services[J].IEEE Communications Magazine, 1997,53(2):79-87.
[24]KARATZOGLOU A, AMATRIAIN X, BALTRUNAS L.Multiverse recommendation:N-dimensional tensor factorization for contextaware collaborative filtering[A].Proc of the Recsys[C].Barcelona,Spain,2010.79-86.
[25]SU J, YEH H, YU P.Music recommendation using content and context information mining[J].IEEE Intelligent Systems, 2010, 25(1):16-26.
[26]LINAS B.Context-Aware Collaborative Filtering Recommender Systems[D].Italy:Free University of Bozen, 2011.
[27]王玉祥,喬秀全,李曉峰.上下文感知移動(dòng)社交網(wǎng)絡(luò)服務(wù)選擇機(jī)制研究[J].計(jì)算機(jī)學(xué)報(bào),2010, 33(11):2126-2135.WANG Y X, QIAO X Q, LI X F.Research on context awareness mobile SNS service selection mechanism[J].Chinese Journal of Computers, 2010, 33(11):2126-2135.
[28]HONG J Y, SUH E H, KIM J Y.Context-aware system for proactive personalized service based on context history[J].ACM:Expert Systems with Applications, 2009, 36(4):7448-7457.
[29]KUO M H, CHEN L C, LIANG C W.Building and evaluating a location-based service recommendation system with a preference adjustment mechanism[J].Expert Systems with Applications, 2009, 36(2):3543-3554.
[30]王立才,孟祥武,張玉潔.上下文感知推薦系統(tǒng)研究[J].軟件學(xué)報(bào),2012, 23(1):1-20.WANG L C, MENG X W, ZHANG Y J.Context-aware recommender systems:a survey of the state-of-the-art and possible extensions[J].Chinese Journal of Software, 2012, 23(1):1-20.
[31]STEFANIDIS K, PITOURA E, VASSILIADIS P.Adding context to preferences[A].Proc of the IEEE 23rd Int’l Conf on Data Engineering[C].Istanbul, Turkey, 2007.846-855.
[32]WU W, JU Y C, LI X.Paraphrase detection on SMS messages in automobiles[A].Proc of the IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP)[C].Dallas, TX, 2010.5326-5329.
[33]KENTA O, SHINSUKE N, JUN M.Context-aware SVM for context-dependent information recommendation[A].Proc of the Int’l Conf on Mobile Data Management[C].Nara, Japan, 2006.109-112.
[34]GUI F, MALEK A, NAPHTALI R.A contextualized and personalized approach for mobile search[A].Proc of the 2009 International Conference on Advanced Information Networking and Applications Workshops[C].Bradford, 2009.966-971.
[35]GOENKA K, ARPINAR I B, NURAL M.Mobile web search personalization using ontological user profile[A].Proc of the 48th Annual Southeast Regional Conference[C].Oxford:MS, USA, 2010.1-6.
[36]劉棟,孟祥武,陳俊亮.上下文感知系統(tǒng)中的規(guī)則生成與匹配算法[J].軟件學(xué)報(bào), 2009, 20(10):2655-2666.LIU D, MENG X W, CHEN J L.Algorithms for rule generation and matchmaking in context-aware system[J].Journal of Software, 2009,20(10):2655-2666.
[37]NIAZI R, QUSAY H M.An ontology-based framework for discovering mobile services[A].Proc of the 7th Annual Research Conf on Communication Networks and Services, CNSR'09[C].Moncton, NB,Canada, 2009.178-184.
[38]XU J J, LIAO S Y, LI Q D.Combining empirical experimentation and modeling techniques:a design research approach for personalized mobile advertising applications[J].Decision Support Systems, 2007,44(3):710-724.
[39]INDRANIL B, CHEN X.Hybrid models using unsupervised clustering for prediction of customer churn[J].Journal of Organizational Computing and Electronic Commerce, 2009, 19(2):133-151.
[40]SUYKENS J A K, VANDEWALLE J.Least squares support vector machine classifiers[J].Neural Processing Letters,1999.293-300.
[41]史艷翠,孟祥武,張玉潔等.一種上下文移動(dòng)用戶(hù)偏好自適應(yīng)學(xué)習(xí)方法[J].軟件學(xué)報(bào),2012,23(11):2533-2549.SHI Y C, MENG X W, ZHANG Y J.Adaptive learning approach of contextual mobile user preferences[J].Journal of Software, 2012,23(10):2533-2549.
[42]SARAH M, ELIZA P, NICK T.Adapting pervasive environments through machine learning and dynamic personalization[A].Proc of the International Symposium on Parallel and Distributed Processing with Applications[C].Sydney, NSW, 2008.395-402.
[43]PAZZANI M, BILLSUS D.Learning and revising user profiles:the identification of interesting web sites[J].Machine Learning, 1997, 27:313-331.
[44]OURDIA B, LYNDA T L, MOHAND B.Dynamically personalizing search results for mobile users[J].Lecture Notes in Computer Science,2009, (5822):99-110.
[45]SARAH M, ELIZABETH P, NICK T.Implicit adaptation of user preferences in pervasive systems[A].2009 Fourth International Conference on Systems[C].Gosier, Guadeloupe, 2009.56-62.
[46]WANG L C, MENG X W, ZHANG Y J.New approaches to mood-based hybrid collaborative filtering[A].ACM CAMRa’10[C].Barcelona, Spain, 2010.28-33.
[47]WANG J J, BHASKAR P.Periodicity based next place prediction[A].The Workshop on Mobile Data Challenge (by Nokia)[C].Newcastle,UK, 2012.
[48]GAO H J, TANG J L, LIU H.Mobile location prediction in spatio-temporal context[A].The Workshop on Mobile Data Challenge (by Nokia)[C].Newcastle, UK, 2012.
[49]SYMEONIDIS P, PAPADIMITRIOU A, MANOLOPOULOS Y.Geo-social recommendations based on incremental tensor reduction and local path traversal[A].Proc of the 3rd ACM SIGSPATIAL International Workshop on Location-Based Social Networks[C].Chicago,Illinois, USA, 2011.89-96.
[50]XU B, CHIN A, WANG H.Using physical context in a mobile social networking application for improving friend recommendations[A].IEEE Int’l Conf on Internet of Things, and Cyber, Physical and Social Computing[C].Dalian, China, 2011.602-609.
[51]SHI Y C, MENG X W, WANG L C.A heuristic approach to identifying the specific household member for a given rating[A].ACM CAMRa’11[C].Chicago, Illinois, USA, 2011.47-52.
[52]劉建國(guó),周濤,郭強(qiáng).個(gè)性化推薦系統(tǒng)評(píng)價(jià)方法綜述[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2009, 6(3):1-9.LIU J Q, ZHOU T, GUO Q.Overview of the evaluated algorithms for the personal recommendation systems[J].Complex Systems and Complexity Science, 2009, 6(3):1-9.