蔣亞博
(湘潭大學(xué)公共管理學(xué)院,湖南 湘潭 411100)
有關(guān)用戶畫像的研究最早起源于交互設(shè)計領(lǐng)域,由庫珀定義了關(guān)于用戶畫像的最初概念,同時強調(diào)了數(shù)據(jù)真實性在用戶畫像研方向的重要意。R.M.Quintana用下述定義來描述何為用戶畫像:“一個具體的、清晰的形象集合,需要從海量數(shù)據(jù)中來獲取數(shù)據(jù)基礎(chǔ),再由用戶信息層層構(gòu)成”,可以通過利用這個集合,便捷、快速的分析出用戶需求、個性化偏好以及用戶興趣等相關(guān)內(nèi)容。作為隨著技術(shù)進步發(fā)展越來越成熟的數(shù)據(jù)分析工具,用戶畫像可以從各個維度抽象出用戶的信息全貌,加以描繪并且記憶用戶需求變化并分析用戶需求變化的根本原因,從而進行精準(zhǔn)的廣告營銷等其他相關(guān)應(yīng)用范圍。余孟杰將用戶畫像定義為一種大數(shù)據(jù)環(huán)境下,對于用戶信息特征進行標(biāo)簽化的方法。即首先由大數(shù)據(jù)提供足夠的數(shù)據(jù)基礎(chǔ),隨后通過抽象提取出用戶信息特征,然后進行標(biāo)簽化處理以求完美地呈現(xiàn)出用戶全貌,最終形成一個虛擬的用戶全貌,即為用戶畫像。隨著大數(shù)據(jù)的發(fā)展,用戶畫像也隨之外延拓展到了互聯(lián)網(wǎng)應(yīng)用領(lǐng)域中,以海量的數(shù)據(jù)為基礎(chǔ)構(gòu)建虛擬用戶的思路在不同的領(lǐng)域都得以應(yīng)用。此外,企業(yè)“精準(zhǔn)營銷”和“需求導(dǎo)向”等目標(biāo)更是與用戶畫像的作用契合,促使越來越多的學(xué)者開始將研究點放在用戶畫像領(lǐng)域。用戶畫像可以被看作是基于用戶真實數(shù)據(jù)的虛擬代表,是具有相似行為、興趣、生活環(huán)境的用戶群體在使用某一產(chǎn)品或者服務(wù)時所呈現(xiàn)出的共同特征集合。用戶畫像最顯著的特征便是基于用戶群體構(gòu)建的概念模型,當(dāng)前國內(nèi)外對用戶畫像的研究內(nèi)容的側(cè)重點不同,總體而言分為三個部分:用戶屬性、用戶行為和用戶心理。
在國外IrisVilnai-Yavetz研究了facebook上用戶基礎(chǔ)數(shù)據(jù),根據(jù)照片將500個隨機選擇的Facebook用戶進行細(xì)分,不僅區(qū)分了五種不同類型的用戶,還將這些類型與受眾特征,品牌參與度和facebook的使用情況和動機相關(guān)聯(lián)。Lindsay R.Duncan通過創(chuàng)作非虛構(gòu)人物肖像來描繪導(dǎo)致興奮劑的因素,分析青少年運動員面臨著發(fā)起興奮劑的復(fù)雜的個人和社會壓力。Bruno Agard提出了一種用于用戶行為分析的通用數(shù)據(jù)挖掘方法,對來自加拿大運輸當(dāng)局的數(shù)據(jù)進行了實驗,結(jié)果表明可以得出主要涉及規(guī)律性和日常模式的用戶旅行行為指標(biāo)。
在國內(nèi),劉海利用衣服銷售數(shù)據(jù)中的身高這一細(xì)分因素進行挖掘,重構(gòu)消費者的需求。曾鴻以新浪微博數(shù)據(jù)為基礎(chǔ),運用大量數(shù)理統(tǒng)計的方法挖掘明星粉絲的用戶畫像,幫助企業(yè)全面了解自己的客戶。邱云飛針對傳統(tǒng)用戶建模難以處理復(fù)雜網(wǎng)絡(luò)關(guān)系,提出基于網(wǎng)絡(luò)結(jié)構(gòu)和文本內(nèi)容的群體畫像構(gòu)建方法。王娜設(shè)計了基于用戶畫像的信息后組織系統(tǒng),為提高用戶信息檢索的精度,為用戶提供更為精準(zhǔn)化和個性化的信息服務(wù)。熊偉通過采集用戶信息并對用戶群體進行分類,基于LDA模型,提出了一種基于用戶畫像和內(nèi)容的服務(wù)重定向方法。林燕霞使用主題模型文本挖掘出用戶感興趣的微博主題,構(gòu)建微博各類群體的用戶畫像,分析用戶行為、態(tài)度并提出相應(yīng)的網(wǎng)絡(luò)輿情治理建議、個性化服務(wù)、營銷策略。單曉紅以在線評論數(shù)據(jù)為基礎(chǔ),從用戶信息屬性、酒店信息屬性和用戶評價信息屬性三個維度構(gòu)建用戶畫像模型的概念模型,為酒店了解用戶需求,開展精準(zhǔn)營銷提供決策依據(jù)。何黎對微博用戶的信息和關(guān)系數(shù)據(jù)進行決策樹分析、相關(guān)性分析和關(guān)聯(lián)規(guī)則來挖掘用戶特征。莫君蘭提出科研團隊畫像的概念,以此為科研團隊信息的標(biāo)簽集。然后,以電子文獻庫、國家基金網(wǎng)、個人主頁等多個異構(gòu)數(shù)據(jù)源為基礎(chǔ),提出融合多源異構(gòu)數(shù)據(jù)的團隊畫像構(gòu)建方法,以D大學(xué)的某團隊為例,將科研團隊畫像可視化展現(xiàn)出來。董寧結(jié)合主題調(diào)查問卷和訪談,建立多維數(shù)據(jù)來源;關(guān)聯(lián)分析建立用戶標(biāo)簽體系,繪制群組用戶畫像,以此構(gòu)建圖書館實施精準(zhǔn)服務(wù)體系。
通過總結(jié)上述內(nèi)容,結(jié)合上述分析可以看出,用戶畫像技術(shù)可以十分深刻地應(yīng)用在描述用戶的群體行為特征、屬性特征方面,同時在網(wǎng)絡(luò)輿情治理、廣告營銷和個性化服務(wù)等諸多領(lǐng)域也可以發(fā)揮非常重要的作用。隨著用戶畫像技術(shù)的飛速發(fā)展,新時代各個行業(yè)的產(chǎn)品開發(fā)方向、精細(xì)化營銷方式和廣泛的應(yīng)用場景也會出現(xiàn)新的發(fā)展契機,同時加快消費者日常生活方式向著數(shù)字化轉(zhuǎn)變。無論是在日新月異的互聯(lián)網(wǎng)行業(yè),還是在傳統(tǒng)消費行業(yè),用戶畫像研究都展現(xiàn)出強大的滲透力和發(fā)展?jié)摿Α?/p>
目前國內(nèi)外與用戶畫像相關(guān)的研究與實踐活動日趨頻繁,涉及的應(yīng)用場景也日益廣泛。國內(nèi)外用戶畫像研究涉及多個學(xué)科領(lǐng)域,主要包括計算機、圖書情報、應(yīng)用心理學(xué)、智慧物流、管理科學(xué)與工程等領(lǐng)域,不同學(xué)科從不同角度進行了多維度的相關(guān)研究,提供了不同角度下的見解和豐富的成果以供學(xué)術(shù)界借鑒。國內(nèi)外用戶畫像研究的技術(shù)方法多種多樣,在數(shù)據(jù)收集方面既有問卷、訪談等社會調(diào)查方法、又有基于平臺的網(wǎng)絡(luò)數(shù)據(jù)采集方法;在數(shù)據(jù)分析和數(shù)據(jù)建模方面,也涉及統(tǒng)計建模、數(shù)據(jù)挖掘、機器學(xué)習(xí)等各種方法。
對于與用戶畫像質(zhì)量息息相關(guān)的數(shù)據(jù)質(zhì)量和數(shù)據(jù)大小問題,首要任務(wù)是要優(yōu)化獲取數(shù)據(jù)的方法,對數(shù)據(jù)挖掘方法加以拓展和改進。雖然利用現(xiàn)有方法已經(jīng)可以大體上實現(xiàn)用戶屬性、用戶行為特征、用戶心理描述與表示,但在實際研究中,內(nèi)容紛繁復(fù)雜和質(zhì)量參差不齊的海量數(shù)據(jù)對于用戶畫像的研究方法提出了更高的要求。一方面,如何通過更有效益的方法來獲取高質(zhì)量的數(shù)據(jù)是需要解決的問題,另一方面,如何更好地利用好海量的數(shù)據(jù)也是用戶畫像研究需關(guān)注的問題。另外,對于一些主題不易獲取數(shù)據(jù)的用戶畫像問題,常常面臨數(shù)據(jù)源數(shù)據(jù)的總量相對較小、數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)難以接觸等問題。對于此類研究主題在研究初始的獲取數(shù)據(jù)的方法選擇上面要做好準(zhǔn)備,才能保證研究方法適用性的基礎(chǔ)條件。數(shù)據(jù)是整個用戶畫像研究的基礎(chǔ),所有的用戶畫像維度都是從數(shù)據(jù)中衍生出來而來,所以數(shù)據(jù)的質(zhì)量至關(guān)重要。在當(dāng)前國內(nèi)外學(xué)術(shù)界的用戶畫像研究中,涉及數(shù)據(jù)獲取渠道和數(shù)據(jù)類型具有多樣性,數(shù)據(jù)獲取渠道包括調(diào)查數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、平臺數(shù)據(jù)等,數(shù)據(jù)類型包括用戶屬性數(shù)據(jù)、用戶行為數(shù)據(jù)、用戶生成數(shù)據(jù)等;獲取數(shù)據(jù)的方式有的通過以訪談、問卷、調(diào)研為代表的社會調(diào)查方法收集數(shù)據(jù),在數(shù)據(jù)獲取渠道和方式多元的情況下,不同類型的數(shù)據(jù)出現(xiàn)了獲取渠道大致相同的特征,相同類型的數(shù)據(jù)反而是獲取渠道不同的特征。我們需要將不同數(shù)據(jù)源、不同類型的數(shù)據(jù)進行整合之后再利用合適的技術(shù)方法提取標(biāo)簽構(gòu)建用戶畫像。實現(xiàn)數(shù)據(jù)融合與提升,就能夠構(gòu)建更加多元、精準(zhǔn)的用戶畫像。