申 彥,劉春華
(1.江蘇大學(xué) 信息管理與信息系統(tǒng)系,江蘇 鎮(zhèn)江 212013;2.江蘇大學(xué) 計(jì)算機(jī)科學(xué)與通信工程學(xué)院,江蘇 鎮(zhèn)江 212013)
隨著社會(huì)的快速發(fā)展與技術(shù)的不斷進(jìn)步,產(chǎn)品迭代更新周期越來越短,用戶需求也在快速發(fā)生變化。企業(yè)要想在不斷變化的市場(chǎng)中占據(jù)優(yōu)勢(shì),就必須深刻理解和把握用戶的需求,并將其作為產(chǎn)品改進(jìn)和提升的依據(jù),快速響應(yīng)動(dòng)態(tài)變化的用戶需求。
互聯(lián)網(wǎng)時(shí)代的到來,催生了大量的社交平臺(tái)。為了聚焦品牌,維護(hù)客戶關(guān)系管理,企業(yè)紛紛創(chuàng)建了自身品牌專屬的社交平臺(tái)即在線品牌社區(qū)。從在線品牌社區(qū)中的海量用戶及其評(píng)論信息中快速捕獲用戶關(guān)鍵需求成為了企業(yè)新的挑戰(zhàn)與機(jī)遇。
KANO模型是根據(jù)馬斯洛需求層次理論,研究需求與滿意度的經(jīng)典模型,然而其需求挖掘過程融入了過多調(diào)查人員的主觀性[1-2]。在線品牌社區(qū)中的海量評(píng)論是用戶關(guān)切的重要表達(dá),已成為用戶關(guān)鍵需求獲取的重要渠道,彌補(bǔ)了KANO模型主觀性強(qiáng)的不足。因此,該文從“雙關(guān)鍵性”即用戶的關(guān)鍵性和需求的關(guān)鍵性雙角度出發(fā),提出了一種基于在線品牌社區(qū)意見領(lǐng)袖的用戶關(guān)鍵需求挖掘方法(Users’ Key Demands Mining Based on the Opinion Leaders in Online Band Community),簡(jiǎn)稱KEY-DEMANDS-OL,快速捕獲用戶關(guān)鍵需求,其主要貢獻(xiàn)如下:
(1)克服KANO模型主觀性較強(qiáng)的不足,利用客觀評(píng)論大數(shù)據(jù)獲取用戶需求。
(2)構(gòu)建了在線品牌社區(qū)意見領(lǐng)袖識(shí)別指標(biāo)體系,通過意見領(lǐng)袖評(píng)論大數(shù)據(jù)獲取用戶關(guān)鍵需求。
(3)在貝葉斯情感極性分類時(shí)考慮了程度副詞的語義,進(jìn)一步精確了用戶評(píng)論情感極性的分類。
現(xiàn)有用戶需求挖掘方法可依據(jù)是否考慮了需求類別劃分為兩類[3]。
未考慮需求類別的用戶需求挖掘方法一般會(huì)將關(guān)注度高、情感程度低的產(chǎn)品特征直接作為用戶需求。李賀等[4]對(duì)在線手機(jī)評(píng)論進(jìn)行評(píng)論主題及產(chǎn)品特征挖掘,有效識(shí)別了用戶需求要素。吳東勝等[5]結(jié)合觀點(diǎn)值和關(guān)注值構(gòu)建了產(chǎn)品的需求挖掘模型。紀(jì)雪等[6]則根據(jù)產(chǎn)品屬性的平均滿意程度來輔助確定新產(chǎn)品的開發(fā)需求。鄧昭等[7]依據(jù)關(guān)鍵詞的權(quán)重排序來輔助汽車儀表盤的設(shè)計(jì)。此外,張國(guó)方等[8]使用BERT模型對(duì)汽車之家在線口碑進(jìn)行了情感分析,挖掘出了用戶的需求。
考慮了需求類別的用戶需求挖掘方法是將各產(chǎn)品特征的情感值與KANO模型中的各需求類型進(jìn)行匹配,分類別挖掘用戶需求。白濤等[9]提出了一種利用模糊KANO模型來進(jìn)行用戶需求分類和重要性統(tǒng)計(jì)的方法,并驗(yàn)證了方法有效性。Wu等[10]利用改進(jìn)的模糊KANO問卷對(duì)用戶需求進(jìn)行了優(yōu)先級(jí)排序。胡東方等[11]提出了基于KANO的工程特征映射模型和基于人工免疫系統(tǒng)的產(chǎn)品設(shè)計(jì)模型,設(shè)計(jì)滿足顧客需求的產(chǎn)品方案。徐海麗等[12]利用文本挖掘,建立屬性情感值與KANO模型的聯(lián)系,獲得用戶的需求類別。Shwetank等[13]將KANO模型和QFD方法整合,對(duì)用戶需求進(jìn)行了分類。
通過梳理可發(fā)現(xiàn),大多數(shù)研究仍采用的是主觀性較強(qiáng)的KANO問卷,亟需研究出一種能夠自動(dòng)整合用戶生成內(nèi)容和KANO模型進(jìn)行需求分類的高效用戶需求挖掘方法,為企業(yè)提供決策支持。
在數(shù)據(jù)源方面,KEY-DEMANDS-OL沒有使用主觀性較強(qiáng)的KANO問卷,而選擇了在線品牌社區(qū)的海量用戶評(píng)論;在初始改進(jìn)率方面,KEY-DEMANDS-OL在考慮情感極性的同時(shí),增加了情感程度,豐富了需求分類語義,具體步驟如下所示。
2.1.1 識(shí)別指標(biāo)體系構(gòu)建
借鑒原欣偉等[14]、Li Y Y等[15]、祝琳琳等[16]的研究,經(jīng)過對(duì)當(dāng)前在線品牌社區(qū)特征的分析,從用戶的行為特征和內(nèi)容特征兩個(gè)角度,KEY-DEMANDS-OL最終確立了5項(xiàng)一級(jí)指標(biāo)和14項(xiàng)二級(jí)指標(biāo),具體如表1所示。
表1 意見領(lǐng)袖識(shí)別指標(biāo)
2.1.2 意見領(lǐng)袖識(shí)別方法
(1)基于熵權(quán)法的指標(biāo)權(quán)重確定。
假設(shè)被評(píng)價(jià)對(duì)象如用戶共M個(gè),其中每個(gè)被評(píng)價(jià)對(duì)象的評(píng)價(jià)指標(biāo)共有N個(gè),則指標(biāo)數(shù)據(jù)集可以用矩陣L表示,其中L=(L1,L2,…,Lm,…,LM),每個(gè)被評(píng)價(jià)對(duì)象可以表示為L(zhǎng)m=(lm1,lm2,…,lmn,…,lmN)。其中m=1,2,…,M,n=1,2,…,N。
(a)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,如式1。
(1)
(b)分別對(duì)各指標(biāo)下各個(gè)被評(píng)價(jià)主體指標(biāo)值的占比pmn進(jìn)行計(jì)算,如式2所示。
(2)
利用式3和式4計(jì)算第n個(gè)指標(biāo)的熵值Hn。p表示指標(biāo)的信息熵系數(shù)。
(3)
(4)
(c)計(jì)算得出第n個(gè)指標(biāo)的熵權(quán)值,如式5。
(5)
其中,ω(n)表示第n個(gè)指標(biāo)的權(quán)重系數(shù)。n個(gè)指標(biāo)的權(quán)重滿足式6。
(6)
(2)基于灰色關(guān)聯(lián)分析的意見領(lǐng)袖影響力計(jì)算。
設(shè)X0表示意見領(lǐng)袖代表的理想指標(biāo)序列,為參考序列,Xi表示用戶的實(shí)際指標(biāo)數(shù)列:
(a)對(duì)參考序列X0和比較序列Xi進(jìn)行確定。設(shè)原始數(shù)據(jù)集合X如式7所示。
(7)
其中,m為用戶總數(shù),n為指標(biāo)總數(shù)。參考序列為X0=(X01,X02,…,X0j,…,X0n),比較序列為Xi=(Xi1,Xi2,…,Xij,…,Xin),i=1,2,…,m;j=1,2,…,n。
(b)原始數(shù)據(jù)集進(jìn)行無量綱標(biāo)準(zhǔn)化處理,如式1所示。得到的標(biāo)準(zhǔn)化后的數(shù)據(jù)集合X'如式8所示。
(8)
(c)根據(jù)標(biāo)準(zhǔn)化后的指標(biāo)集合和參考序列X0進(jìn)行絕對(duì)差值計(jì)算,如式9所示。
(9)
(d)對(duì)灰色關(guān)聯(lián)系數(shù)進(jìn)行計(jì)算,如式10所示。
(10)
(e)計(jì)算各個(gè)指標(biāo)的加權(quán)灰色關(guān)聯(lián)度。用到灰色關(guān)聯(lián)度將分散的灰色關(guān)聯(lián)系數(shù)ξij綜合到一個(gè)數(shù)值上以便比較。具體計(jì)算如式11所示。
(11)
(12)
其中,ω(j)表示第j個(gè)指標(biāo)的權(quán)重,指標(biāo)的權(quán)重和滿足式12。
根據(jù)熵權(quán)法和灰色關(guān)聯(lián)分析法計(jì)算每個(gè)用戶的灰色關(guān)聯(lián)度,確定用戶影響力,識(shí)別出意見領(lǐng)袖。
2.2.1 用戶需求特征提取
評(píng)論中詞語的詞性和詞語的頻率決定了該詞能否成為關(guān)鍵詞。此外,名詞和動(dòng)詞更能表達(dá)句子的核心含義,應(yīng)作為核心關(guān)鍵詞;副詞表示程度,可用于情感程度的計(jì)算。因此,詞頻統(tǒng)計(jì)以及詞性識(shí)別是根據(jù)用戶評(píng)論挖掘用戶需求的關(guān)鍵。
在識(shí)別在線品牌社區(qū)意見領(lǐng)袖的基礎(chǔ)上,對(duì)其發(fā)表的評(píng)論進(jìn)行詞頻的統(tǒng)計(jì)與詞性的識(shí)別。保留其中的名詞n、動(dòng)詞v以及副詞adv并且統(tǒng)計(jì)其詞頻,代表該評(píng)論的核心關(guān)鍵,作為意見領(lǐng)袖代表的需求特征。經(jīng)過處理的意見領(lǐng)袖的評(píng)論輸入情感分析模塊,進(jìn)行基于貝葉斯的需求滿足度計(jì)算。
2.2.2 基于貝葉斯的需求滿足度計(jì)算
用戶的評(píng)論實(shí)際上反映了用戶對(duì)產(chǎn)品需求的滿足程度,因此,用戶的實(shí)際需求可以通過對(duì)用戶評(píng)論的分析來挖掘,用戶的需求滿足度也可通過對(duì)評(píng)論的情感極性判斷和情感程度的計(jì)算獲得。詳細(xì)計(jì)算過程如下:
(1)基于貝葉斯的需求極性計(jì)算。
采用貝葉斯模型判斷極性,具體的計(jì)算方法如下:
根據(jù)全概率公式進(jìn)一步化簡(jiǎn)上式可得:
(13)
(2)情感程度計(jì)算。
采用哈工大的情感程度詞表,依據(jù)副詞表達(dá)的情感強(qiáng)烈程度,將情感程度劃分成5個(gè)等級(jí),詳細(xì)內(nèi)容如表2所示。在對(duì)意見領(lǐng)袖評(píng)論的情感程度進(jìn)行計(jì)算時(shí),依據(jù)其需求特征提取時(shí)保留的副詞所對(duì)應(yīng)的程度等級(jí)對(duì)滿足度進(jìn)行加權(quán),詳細(xì)計(jì)算過程如式14所示。
表2 情感程度量化
(14)
(15)
2.2.3 需求分類
KANO模型將需求分為了期望型、魅力型、基本型、無關(guān)型和反向型五類。當(dāng)前在實(shí)際的生產(chǎn)運(yùn)營(yíng)過程中通常只考慮用戶的期望型需求、魅力型需求、基本型需求和無關(guān)型需求四種[19-20]。
所提KEY-DEMANDS-OL方法在傳統(tǒng)用戶需求分類挖掘方法的基礎(chǔ)上進(jìn)行了改進(jìn),沒有利用主觀設(shè)計(jì)的調(diào)查問卷,而是利用在線品牌社區(qū)中海量的用戶評(píng)論數(shù)據(jù),識(shí)別代表性用戶即意見領(lǐng)袖,利用算法自動(dòng)整合意見領(lǐng)袖的評(píng)論和KANO模型。此外,修正了用戶需求的初始改進(jìn)率,增加考慮了情感程度,對(duì)用戶關(guān)鍵需求進(jìn)行自動(dòng)化的分類挖掘,詳細(xì)的計(jì)算過程如下:
(16)
(17)
(18)
(19)
(20)
(21)
(22)
最后,計(jì)算用戶需求特征fk的重要性Ifk,詳細(xì)的計(jì)算公式如下:
(23)
至此,可按計(jì)算所得的用戶需求特征的重要性排序Ifk獲得用戶關(guān)鍵需求。
采用八爪魚對(duì)華為在線品牌社區(qū)——花粉俱樂部中的華為Mate40板塊進(jìn)行數(shù)據(jù)采集。經(jīng)過去除無效信息、去除重復(fù)信息等預(yù)處理后,最終得到包含1 000個(gè)用戶的22 572條評(píng)論與討論信息。KEY-DEMANDS-OL算法采用Python實(shí)現(xiàn)。
3.2.1 意見領(lǐng)袖識(shí)別結(jié)果
指標(biāo)權(quán)重系數(shù)、關(guān)聯(lián)系數(shù)和意見領(lǐng)袖識(shí)別結(jié)果如表3~表5所示。實(shí)驗(yàn)中,參考文獻(xiàn)[19-20],并依據(jù)帕累托法則,將影響力排名前20%的用戶作為意見領(lǐng)袖。
表3 指標(biāo)權(quán)重系數(shù)
表4 指標(biāo)相關(guān)系數(shù)
表5 意見領(lǐng)袖識(shí)別結(jié)果(Top10)
3.2.2 用戶關(guān)鍵需求分析
該步驟的數(shù)據(jù)來自于意見領(lǐng)袖的評(píng)論和討論信息。經(jīng)過詞頻統(tǒng)計(jì)、詞性分析與詞語相似度檢驗(yàn),結(jié)合在線品牌社區(qū)評(píng)論組織結(jié)構(gòu)及分類得到的用戶需求特征如表6所示。
表6 用戶需求特征
通過對(duì)情感極性以及基于貝葉斯的需求滿足程度的計(jì)算,結(jié)合KANO模型確定的用戶需求類別和重要性排列順序如圖1和表7所示。
圖1 關(guān)鍵需求分類結(jié)果
表7 用戶關(guān)鍵需求排序結(jié)果
從表7可以看出,分析得到的需求排序結(jié)果為:“外觀”“價(jià)格”“娛樂”“內(nèi)存”“拍照”“電池”“屏幕”“系統(tǒng)”“安全”“配件”“網(wǎng)絡(luò)通訊”。結(jié)合KANO模型,從圖1可知,在11個(gè)用戶需求項(xiàng)中,魅力型需求一共有3個(gè),包括“外觀”“價(jià)格”“娛樂”;期望型需求2個(gè),包括“拍照”以及“內(nèi)存”;基本型需求一共有6個(gè),依次為“電池”“屏幕”“系統(tǒng)”“安全”“配件”和“網(wǎng)絡(luò)通訊”。根據(jù)表7中的用戶需求重要性排序及KANO模型可知,在進(jìn)行產(chǎn)品改進(jìn)時(shí)的先后順序依次應(yīng)為:“電池”“屏幕”“系統(tǒng)”“安全”“配件”“網(wǎng)絡(luò)通訊”“拍照” “內(nèi)存”“外觀”“價(jià)格”“娛樂”。
KEY-DEMANDS-OL捕獲的用戶關(guān)鍵需求對(duì)企業(yè)優(yōu)化產(chǎn)品具有重要的啟示與指導(dǎo)。華為在推出Mate40時(shí),提出了該款手機(jī)具有六大優(yōu)勢(shì)即非凡性能、非凡設(shè)計(jì)、非凡影像、非凡快充、非凡體驗(yàn)和非凡安全。針對(duì)此產(chǎn)品的基于在線品牌社區(qū)意見領(lǐng)袖的用戶關(guān)鍵需求挖掘結(jié)果的啟示及建議如下。
(1)魅力型需求包含了“外觀”“價(jià)格”和“娛樂”。這說明用戶對(duì)該款手機(jī)在這些方面的表現(xiàn)感到非常滿意,符合Mate40手機(jī)預(yù)設(shè)。魅力型需求是進(jìn)一步吸引用戶,提升用戶滿意度和忠誠(chéng)度的關(guān)鍵,企業(yè)在資源允許的條件下,應(yīng)全力滿足用戶的魅力型需求,提高品牌競(jìng)爭(zhēng)力。
(2)用戶的期望型需求包含了“拍照”和“內(nèi)存”。這說明了“拍照”盡管是該款手機(jī)的賣點(diǎn)之一,但很多用戶在拍照時(shí)對(duì)相應(yīng)的拍攝功能并不了解,沒有拍攝出應(yīng)有的出色效果,造成了很多用戶的滿意度較低,使得該特征成為了用戶的期望型需求。此外,用戶期待非凡的體驗(yàn),需要手機(jī)大容量?jī)?nèi)存的支持,但當(dāng)前產(chǎn)品內(nèi)存提供仍顯得不足,“內(nèi)存”亦是期望型需求之一。期望型需求是用戶需求的“癢處”,企業(yè)下一步急需對(duì)“拍照”這一功能加入新手指導(dǎo)模塊或者在拍攝過程中給與更多快捷方式的支持。同時(shí),相比競(jìng)品,進(jìn)一步增大手機(jī)內(nèi)存,促進(jìn)其轉(zhuǎn)化為魅力型需求,提升用戶的滿意度。
(3)用戶的基本型需求包含了“電池”“屏幕”“系統(tǒng)”“安全”“配件”和“網(wǎng)絡(luò)通訊”。這說明了對(duì)于該款手機(jī)提出的非凡安全和非凡快充兩大亮點(diǎn)所對(duì)應(yīng)的“安全”和“電池”兩個(gè)特征,并沒有讓用戶滿意,成為了基本型需求。其主要原因是該款手機(jī)的安全模式雖功能強(qiáng)大,但使用繁瑣。電池雖支持快充,性能優(yōu)異但充電時(shí)發(fā)熱嚴(yán)重。此外,該款手機(jī)雖然采用了好看的瀑布屏設(shè)計(jì)、啟用最新的EMUI系統(tǒng)、贈(zèng)品較多、支持5G信號(hào),但也存在著屏幕綠屏嚴(yán)重、系統(tǒng)更新慢、贈(zèng)品領(lǐng)取扣費(fèi)和WIFI信號(hào)不穩(wěn)定的問題,使得“屏幕”“系統(tǒng)”“配件”和“網(wǎng)絡(luò)通訊”四個(gè)特征成為了用戶的基本型需求。基本型需求是用戶需求的“痛點(diǎn)”,當(dāng)需求被滿足時(shí),用戶不會(huì)感到滿意,但當(dāng)不被滿足時(shí),用戶會(huì)很不滿意。因此,企業(yè)在追求極致功能的同時(shí),也要時(shí)刻關(guān)注用戶的基本型需求,針對(duì)其不滿意點(diǎn)不斷進(jìn)行產(chǎn)品優(yōu)化和改進(jìn),促使其向期望型需求進(jìn)行轉(zhuǎn)化。
對(duì)比KEY-DEMANDS-OL和挖掘所有用戶信息的傳統(tǒng)方法的運(yùn)行效率,記錄下兩種方法從載入數(shù)據(jù)到分析完成的時(shí)間,共10次,計(jì)算其平均值。因算法執(zhí)行的絕對(duì)時(shí)間受計(jì)算機(jī)CPU及內(nèi)存等性能參數(shù)影響,不同設(shè)備執(zhí)行時(shí)間并不一致,為了更好體現(xiàn)所提方法優(yōu)勢(shì),同時(shí)給出了本次實(shí)驗(yàn)不同方法運(yùn)行時(shí)間的相對(duì)比值以及絕對(duì)值,如圖2所示。
圖2 運(yùn)行時(shí)間對(duì)比
為驗(yàn)證基于在線品牌社區(qū)意見領(lǐng)袖的用戶關(guān)鍵需求挖掘方法(KEY-DEMANDS-OL)的有效性,與挖掘所有用戶評(píng)論信息的傳統(tǒng)方法進(jìn)行了對(duì)比分析,如表8所示。
表8 與傳統(tǒng)方法的對(duì)比分析
從表8中可以看出,在基于所有用戶評(píng)論挖掘的用戶需求重要性排名中,僅有“內(nèi)存”“拍照”“娛樂”和“價(jià)格”4個(gè)需求與基于意見領(lǐng)袖挖掘的用戶需求重要性排序有所差異,但相差不超過1。而其余7個(gè)需求的重要性排名與基于意見領(lǐng)袖挖掘的需求重要性排名相同。實(shí)例分析的結(jié)果再次驗(yàn)證了帕累托法則,即約20%的意見領(lǐng)袖代表了約80%的用戶關(guān)鍵需求,可通過意見領(lǐng)袖的識(shí)別,捕獲用戶關(guān)鍵需求。更為重要的是,KEY-DEMANDS-OL方法在進(jìn)行需求挖掘時(shí)所需處理的數(shù)據(jù)量大幅降低,提高了用戶需求挖掘的時(shí)效性,且可以幫助企業(yè)從紛繁復(fù)雜,無代表性的海量用戶需求中解脫出來,通過意見領(lǐng)袖的代表性,聚焦用戶的關(guān)鍵需求,以精準(zhǔn)優(yōu)化產(chǎn)品。例如,在挖掘所有用戶評(píng)論獲取的前50大需求中,有諸如“首發(fā)處理器”“多用戶”“奢華”等長(zhǎng)尾小眾需求。當(dāng)然,小眾需求并不是不重要,而是主流關(guān)鍵需求須首先滿足。在這個(gè)前提之下,再在后續(xù)產(chǎn)品或者特色產(chǎn)品中考慮小眾需求。而KEY-DEMANDS-OL方法僅挖掘獲取意見領(lǐng)袖代表的主流關(guān)鍵需求,是當(dāng)下產(chǎn)品要盡快解決的問題以及須改進(jìn)的地方,因此能更加聚焦,快速發(fā)現(xiàn)用戶關(guān)鍵需求。
由實(shí)驗(yàn)結(jié)果可知,KEY-DEMANDS-OL方法僅需分析約20%的意見領(lǐng)袖的信息,便可發(fā)現(xiàn)當(dāng)下用戶的主流需求,大幅提高了用戶關(guān)鍵需求挖掘的執(zhí)行效率,更加適合在當(dāng)前產(chǎn)品迭代更新飛快、用戶需求多變的情況下對(duì)用戶關(guān)鍵需求進(jìn)行快速追蹤。
從意見領(lǐng)袖和用戶關(guān)鍵需求著手,采用熵權(quán)法和灰色關(guān)聯(lián)分析法對(duì)意見領(lǐng)袖進(jìn)行了識(shí)別,進(jìn)而采用文本挖掘、情感分析以及KANO模型對(duì)用戶需求進(jìn)行分類和排序,挖掘出代表性用戶的關(guān)鍵需求。針對(duì)實(shí)際案例對(duì)提出的方法進(jìn)行了驗(yàn)證,表明了所提KEY-DEMANDS-OL方法的實(shí)用性與有效性。該文為相關(guān)研究提供了一個(gè)用戶關(guān)鍵需求快速挖掘的方法,對(duì)產(chǎn)品的研發(fā)與改進(jìn)提供了重要的定量參考與決策支持。此外,隨著在線品牌社區(qū)的更迭,在KEY-DEMANDS-OL方法的后續(xù)使用中,主體框架可保持不變,意見領(lǐng)袖識(shí)別指標(biāo)體系可以進(jìn)行調(diào)整,以適應(yīng)不同的業(yè)務(wù)領(lǐng)域。誠(chéng)然,KEY-DEMANDS-OL方法取得了一定的進(jìn)展,但仍存不足,如在進(jìn)行海量用戶評(píng)論處理時(shí)沒有很好地利用分布式計(jì)算框架,評(píng)論處理效率有待進(jìn)一步提升。此外,在進(jìn)行評(píng)論分析時(shí)上下文關(guān)聯(lián)語義考慮不足。筆者將在后續(xù)研究中持續(xù)關(guān)注,力求有新突破。