雷羽瀟,段玉聰
海南大學計算機與網(wǎng)絡空間安全學院,海南???70228
近年來互聯(lián)網(wǎng)社區(qū)飛躍發(fā)展,用戶數(shù)量呈幾何式增長.虛擬社區(qū)為用戶提供了可雙向交流的平臺,不僅可以進行生活經(jīng)驗和體會的分享,還可以作為傳統(tǒng)商業(yè)的延伸進行廣告宣傳、使用經(jīng)驗分享、商品售后服務等并形成虛擬品牌.虛擬品牌社區(qū)中的內(nèi)容可分為官方生成內(nèi)容(official-generated content,OGC)和用戶生成內(nèi)容(user-generated content,UGC).OGC 質量高但更新緩慢且成本高,UGC 更新快且成本低.對于用戶而言,UGC 除了可以提供信息或娛樂的潛力外,其吸引力還在于能讓用戶看到不受媒體影響真實數(shù)據(jù)[1].因此,許多社區(qū)用戶更愿意相信UGC 內(nèi)容中關于商品和服務的數(shù)據(jù)、信息評價等[2].UGC 內(nèi)容的展現(xiàn)形式多樣且用途廣泛,如圖像類UGC 包括圖像本身、用戶發(fā)布圖像的時間點、附帶文案等.同一個UGC 內(nèi)容可以從不同角度分析理解,用于自我演示和新聞傳播等不同途徑[3].Susarla等[4]發(fā)現(xiàn)虛擬社區(qū)的用戶的社交互動對YouTube 視頻內(nèi)容受歡迎程度產(chǎn)生顯著影響.Daugherty等[5]則通過分析證實了用戶動機和UGC 內(nèi)容產(chǎn)出之間存在因果關系,同時表示用戶態(tài)度是使用和創(chuàng)建UGC 時重要因素.已有研究表明虛擬社區(qū)中的自我防御等用戶態(tài)度對用戶創(chuàng)建UGC 產(chǎn)生了較大影響[6].
本文研究如何通過信息技術手段來影響虛擬社區(qū)中用戶的態(tài)度,將社區(qū)中潛在的UGC 生成用戶轉變?yōu)榛钴SUGC 生成用戶.在虛擬社區(qū)中,用戶的任何行為都將留下“電子痕跡”,“電子痕跡”具有反映用戶自身的性格與行為習慣的潛力,可將這些痕跡映射到數(shù)據(jù)、信息與知識(data information knowledge wisdom,DIKW)的多模態(tài)資源層面,本文使用類型化的DIKW 圖譜對虛擬品牌社區(qū)中的用戶痕跡內(nèi)容進行建模,進而依據(jù)不同用戶對不同DIKW 具體形態(tài)表達的相同內(nèi)容的偏好與使用習慣差異等蘊含了個體內(nèi)容儲備和處理效率的不對稱性差異將不同性格和行為習慣的用戶進行分類和性格引導.DIKW 圖譜是處理類型化的資源多層體系結構,分為數(shù)據(jù)圖譜、信息圖譜、知識圖譜、智慧圖譜4 個部分[8],可用于優(yōu)化存儲、傳輸與計算一體化的處理效率[9],也可用于隱私數(shù)據(jù)保護[10].本文借助DIKW 框架的元模型[11]對相關場景進行形式化表達,并結合自我建構理論[12]對用戶按獨立自我型用戶與互依型用戶進行劃分,按照自我決定理論[13]中自我的3 種心理需求,根據(jù)用戶的性格類型和個性偏好設計了不同的用戶性格類型轉換方法.
虛擬品牌社區(qū)用戶之間存在差異,因而針對具有不同個性的用戶應設計針對性的營銷策略,鼓勵用戶與他人互動并促進UGC 的產(chǎn)生.本文中引入類型化資源分類和自我建構理論和自我決定理論,根據(jù)不同個性用戶的不同需求對社區(qū)中的用戶進行分類,方便以不同的方式進行營銷.
虛擬社區(qū)是網(wǎng)絡用戶用于分享知識和信息,與有相同愛好或需求的人交流的平臺.而用戶在虛擬社區(qū)上留下的“痕跡內(nèi)容”能夠反映用戶自身性格和興趣偏好,這些“痕跡內(nèi)容”統(tǒng)稱為用戶類型資源(TRDIK).本文用以“Human”和“Existence”兩個概念為核心的數(shù)據(jù)、信息、知識和智慧框架UML 元模型[14],將TRDIK分類為DataDIK、InformationDIK、KnowledgeDIK三種類型并完成三者間的轉換,進而構建用戶的DIKW 圖譜.如圖1所示,用戶在虛擬社區(qū)中留下的“痕跡內(nèi)容”包括用戶的基本屬性和行為記錄,通過觀察“痕跡內(nèi)容”可得到用戶相關的類型資源(TRDIK),對TRDIK概念化評估處理,根據(jù)條件不同分為DataDIK和InformationDIK存儲到DIKW 圖譜中.同時DIKW 圖譜中的TRDIK可代入Transition 模塊中進行轉換,所得結果可補充存儲至DIKW 圖譜中.
圖1 用戶類型資源的分類與轉換Figure 1 Flow chart of personality classification and conversion method
1)Existence
虛擬社區(qū)中的確認與用戶相關聯(lián)的TRDIK內(nèi)容,可按客觀存在和概念存在兩種類型劃分.客觀存在可用邏輯語言“True/False”回答,概念存在則與人的主觀評價“Yes/No”相關,nonexistence 則為Existence 的否定語義項.
2)Nonexistence
Nonexistence 是以否定語義存在的TRDIK類資源,存在著幾種不同情況,包括空項“Null”和經(jīng)過在一段時間后消失或改變從而導致客觀上前后不一致的客觀存在Inconsistobjective,如式(2)所示.“Null”不僅包括空的概念,還包括未知但實際上存在的事物,如式(3)所示.
類型化資源TRDIK,可分為DataDIK、InformationDIK、KnowledgeDIK,在本文中以人類為主體核心展開.
1)DataDIK
由直接觀察得到的離散元素,在沒有上下文的情況下不具有任何意義,不與人類的某個特定目的相關聯(lián).DataDIK表達單個實體的屬性內(nèi)容,最簡單的表達形式為“is_a”.Ex(IS(a))表示實體X具有的屬性(a).
2)InformationDIK
記錄人類的行為,用于挖掘、分析、表達兩個實體之間的交互關系,實體既可以是另一個人,也可以是客觀存在的事物.InformationDIK與人類的某個特定目的相關,透過目的去推斷兩個實體之間的關系,InformationDIK最簡單的表達形式為“has_a”.用R(E1,E2)表示實體E1和E2之間的關系,如式(4)所示.
3)KnowledgeDIK
由DataDIK和InformationDIK經(jīng)過結構化形式化的推導演繹獲得,在InformationDIK的基礎上對實體關系的進一步的完善,InformationDIK表示個體層面,單個實體與單個實體之間的關系.KnowledgeDIK在InformationDIK的基礎上對實體關系進行了抽象化的歸納總結.如式(5)中,函數(shù)Type 將實體E類別化,函數(shù)ReverseType 將類型Class 實體化,Class1表示實體E1的所屬類別.KnowledgeDIK可表示單個實體與某一類型事物,或是兩種類型事物之間的語義關系.如式(6)所示,K1表示類別Class1和類別Class2之間的語義關系“A1”.K2表示類別Class1和實體E2之間的語義關系“A2”,K3表示類別Class1和實體E1之間存在從屬關系.
Class 由多個下屬類別viceClass 組成,viceClass 與Class 之間存在繼承關系.如式(7)所示,Class 為viceClass 的父類,viceClass 為Class 的子類,實體E既是viceClass 的子類,也是Class 的子類.一般情況下,子類繼承父類的屬性與關系,Classx(IS(a))同一類別Class 事物共同擁有的屬性a.
TRDIK的概念化是指將TRDIK映射到現(xiàn)有已知的概念.當觀察到一個新事物(Thingnew),首先將Thingnew與現(xiàn)存已知的具有具體標簽事物的DIKW 資源進行相同性評估,若相同性評估結果為肯定,則將Thingnew映射至現(xiàn)有概念Conceptexist;若評估結果為否定,則由函數(shù)CreateID 為Thingnew創(chuàng)建一個新的概念Conceptnew,并將Thingnew與Conceptnew聯(lián)系起來.如式(8)所示,Thingexist表示已存在的事物或概念.
在相同性評估中,若Thingnew與某一項Thingexist評估結果為否定,則Thingnew為該Thingexist的否定語義項,二者之間的關系R(Thingexist,Thingnew)屬于Thingexist的Nonexistence 類InformationDIK資源,如式(9)所示.
在特殊的情況下,實體E沒有完全繼承Class 的屬性和關系,但E仍屬于Class 的子類,是類別Class 中特殊的子類實體.如式(10)所示,ThingSpecial表示類別Class 中未繼承父類某一種屬性a 的子類實體.
數(shù)據(jù)、信息和知識三者之間可以相互轉換,生成新的數(shù)據(jù)、信息和知識.
1)DataDIK→DataDIK
DataDIK之間的轉換既可以在單個實體之間實現(xiàn)也可以跨實體實現(xiàn),且單個實體和多個實體結合均能夠轉換,如式(11)所示.
如式(12)中,從一個人的出生年月日可計算得到他的年齡,從一周中每天的數(shù)據(jù)可得到一周內(nèi)的平均數(shù)據(jù),從班級中每個人的成績可計算得到全班的平均成績.
2)DataDIK→InformationDIK
若DataDIK的產(chǎn)生與人類的行為目的相關,則DataDIK與一個或多個特定的目的之間存在聯(lián)系.DataDIK與人類目的聯(lián)系可反映出人類行為的動機或是人類與另一個實體之間的關系InformationDIK.該實體可以是一人或多人,也可以是物或物體的組合.InformationDIK并不僅僅與現(xiàn)有已存在DataDIK關聯(lián),Nonexistence 類DataDIK作為否定語義存在,與人類目的相聯(lián)系將表示實體之間的否定關系,生成Nonexistence 類InformationDIK.
例如,一名男子擁有一束玫瑰花,他將這朵玫瑰花遞給了一名女子.若不清楚這名男子行為背后的目的,將無法確定這名男子與該女子之間的關系.如式(14)所示,若這名男子的目的是求愛,則二者是男女之間的戀人關系;若該男子的目的是售賣,則二者是商家和顧客之間的商業(yè)交易關系.
Nonexistence 類DataDIK資源也可以轉換為InformationDIK,如式(15)所示,從病人前后不一致的體溫癥狀中可得知病人體溫已恢復正常狀態(tài)
3)DataDIK→KnowledgeDIK
通過統(tǒng)計學的原理,DataDIK可直接轉換為KnowledgeDIK.當DataDIK的規(guī)模達到一定程度時可推理生成KnowledgeDIK,表達事物的總體的發(fā)展或變化趨勢,預測實體下一步的行為表現(xiàn).例如,根據(jù)往年氣溫曲線能夠預測出今年夏天最高溫度出現(xiàn)的時間范圍,如式(16)所示.
3)InformationDIK→DataDIK
DataDIK與特定的目的結合可以得到InformationDIK,將InformationDIK與目的剝離則能夠生成與實體相關的屬性DataDIK,如式(17)所示.
InformationDIK中記錄了實體的行為,統(tǒng)計實體各個行為的頻率Bfreq可得到與實體有關新的DataDIK,如式(18)所示.
5)InformationDIK→InformationDIK
InformationDIK之間能夠互相轉換,可以由InformationDIK和DataDIK結合轉換生成InformationDIK,也可以由InformationDIK和InformationDIK結合轉換生成新的InformationDIK.
6)InformationDIK→KnowledgeDIK
將InformationDIK的內(nèi)容經(jīng)過抽象化的分析歸納,可得到KnowledgeDIK如下:
實體的行為能夠反映出其偏好,若僅從單一行為推理會產(chǎn)生很大的誤差,將表示行為的InformationDIK與表示行為頻率的DataDIK結合,可推理出實體的行為習慣和偏愛的事物.如式(21)所示,在一名女孩吃的蘋果、草莓、葡萄幾種水果中,葡萄出現(xiàn)的頻率最高,可知該女孩相比其他水果更偏愛葡萄.
7)KnowledgeDIK→DataDIK
從KnowledgeDIK轉換到DataDIK有兩種方法,一是從由DataDIK推導而來的KnowledgeDIK反推得到DataDIK;二是從現(xiàn)有已存在的KnowledgeDIK預測未來DataDIK.
例如式(23),根據(jù)某地區(qū)往年的降雨量、降雪量、溫度變化曲線等DataDIK資源可預測該地區(qū)今年的天氣情況.
8)KnowledgeDIK→InformationDIK
根據(jù)現(xiàn)存已知的實體間的抽象關系KnowledgeDIK可預測實體下一步的行為或選擇,如式(24)所示.
例如式(25),已知一個女孩在食物的選擇上更偏愛冰淇淋,則可以預測當一個面包和冰淇淋同時擺在她面前時,她更有可能選擇冰淇淋而不是面包.
KnowledgeDIK與InformationDIK相結合也能夠轉換為新的InformationDIK,甚至可能產(chǎn)生與上文中相反的觀點.例如式(26),若女孩在進行食物選擇前曾經(jīng)接受過牙醫(yī)的建議不吃冰冷的食物,那么女孩將更有可能選擇面包而不是冰淇淋.
9)KnowledgeDIK→KnowledgeDIK
當KnowledgeDIK的數(shù)量規(guī)模積累達到一定程度將由量變引起質變,通過邏輯推理或是與其他DataDIK、InformationDIK、KnowledgeDIK之間的結合產(chǎn)生新的KnowledgeDIK,如式(27)所示.
例如式(28),已知K1:老鼠有磨牙的習慣,K2:老鼠門齒能終生生長.研究人員通過將K1和K2結合,根據(jù)實驗觀察總結出K3:老鼠磨牙是為了求得生存,保證生長平衡.
以上9 種轉換為不完全轉換,DataDIK、InformationDIK、KnowledgeDIK三者都不會完全轉換為另一類型的資源,而是彼此之間達到了一個動態(tài)平衡,共同構成了一個以“Human”為核心的DIKW 圖譜,包括數(shù)據(jù)圖譜、信息圖譜、知識圖譜,如式(29)所示.
自我建構[15]是個體對自我的一種感知,對周圍的世界以及他人對自己的行為的理解,是一個人定義自己的過程,已被應用在心理醫(yī)學[16]、教育[17]、市場營銷[18]等各個方面.根據(jù)自我構建理論,虛擬社區(qū)中的用戶可分為獨立自我型用戶(Independent-self user)和互依自我型用戶(Interdependent-self user)兩種類型.獨立自我型用戶更關注自身的喜好和特質,互依自我型用戶則更關注與他人之間的關系[19].將自我構建理論映射到DIKW 圖譜上,如式(30)所示,獨立自我型用戶更關注與自我有關的屬性TRDIK(self),互依自我型用戶更關注自我與他人的關系R(self,other).
自我決定理論(self-determination theory,SDT)與人類行為的動機相關,研究人的內(nèi)在成長傾向和心理需要及人類個體在沒有外界影響和干擾下,如何根據(jù)自己的意愿做出自我選擇,以及自我選擇和自我決定的程度.
SDT 定義了個人的3 個普遍且與生俱來的心理需求[20],即能力需求、關系需求和自主需求,如式(24)所示,若滿足這三類需求便能夠最大限度的調動個人的行動積極性.在虛擬社區(qū)中,當用戶認為其他參與者喜歡他們的UGC 并信任社交媒體網(wǎng)站時,用戶的自主性將增強,對虛擬社區(qū)的依賴感增加,從而促進了用戶創(chuàng)作UGC 的動機[21].
1)能力需求(Competenceneed)
用戶知道自己有能力完成某項任務,任務的結果將在他的期望之內(nèi),這樣他會愿意做這件事.如式(32)中,C(input)=output 表示自我擁有的某種能力,將某種的輸入轉化為輸出的能力,其中input 表示輸入,output 表示輸出.Self(Cneed)表示自我個體所擁有的能力集合,滿足用戶自我的能力需求,將調動自我行動的積極性.
2)關系需求(Relatednessneed)
用戶可以在虛擬社區(qū)中找到志同道合的人,愿意與他人互動建立聯(lián)系并體驗關愛他人.用Rdegree(self,other)表示自我與他人之間的聯(lián)系,其中degree 表示自我與他人之間的關系程度,degree=1 表示自我與他人之間存在直接聯(lián)系,互為一級交流關系用戶,degree=2 表示自我與他人之間存在同一個一級交流關系用戶.如式(33)中,Rdegree=n(self,other)表示自我與他人具有n級交流關系.Gdegree=n(Ua)表示所有與用戶Ua具有n級交流關系的他人組成的群體.滿足用戶的關系需求Self(Rneed),需要滿足用戶對對一級交流關系群體Gdegree=n(Self)的需求,如式(34)所示.
3)自主需求(Autonomyneed)
用戶有更多選擇并且知道他的行為可以由他自己決定,掌握主動權.人們對事物的態(tài)度與自主需求有著很大的關聯(lián),但自主需求不代表獨立于身邊的任何一個人[22].自我的自主需求Self (Aneed)與能力需求Self (Cneed),關系需求Self (Rneed)相關.自我不同的目的將導致不同的自主需求,不同的自主需求導致不同的能力需求和關系需求,如式(35)所示.
如式(36)所示,用戶Ua目的P1為完成任務T1;但其能力不足導致完成任務的自主性不夠,因而在任務完成艱難的情況下用戶Ua有可能放棄該項任務.為使用戶Ua能順利完成任務而產(chǎn)生了自主需求Ua(A1),而為了滿足Ua(A1)需要用戶具有完成任務T1的能力,因此產(chǎn)生了能力需求Ua(C1).
此外,用戶Ub目的P2為完成一項科普任務T2;但其認識的人有限,無法將科普內(nèi)容傳播;同樣完成任務的自主性不夠而產(chǎn)生了自主需求Ub(A2),為完成任務T2而產(chǎn)生了用戶Ub的關系需求Ub(R1).
能力需求Self (Cneed)和關系需求Self (Rneed)之間也彼此關聯(lián),一般情況下,滿足一項自主需求需要滿足能力需求和關系需求,如式(37)所示.
在式(38)中,用戶Uc的目的P3為:結識某位有學識的教授;為了達到這個目的他既需要人脈Uc(R2),還需要提升自己知識儲備Uc(C2),才能提高其完成該任務的自主性,滿足自主需求Uc(A3)從而達到目的P3.
總而言之,自我的自主需求與能力需求和關系需求相關,一個人自我的能力越高,能解決的問題越多,自我的自主性就越大.同樣,如果自我與他人的關系越多,自我可尋求的幫助就越多,自我的自主性也就越大.三種需求之間相互聯(lián)系,可通過滿足能力需求和關系需求來滿足用戶的自主需求.這三種需求對個人的心理健康和幸福感影響至深,如果用戶的這三類需求得到了滿足,用戶對虛擬社區(qū)的好感度將得到提升,對用戶創(chuàng)作UGC 的動機產(chǎn)生積極影響,有利于虛擬社區(qū)的建設.
在本文中,用戶性格分類與轉換方法通過三步來完成,如圖1所示.首先根據(jù)用戶類型資源TRDIK建立用戶DIKW 圖譜模型,DIKW 圖譜中包括數(shù)據(jù)圖譜(DGraph)、信息圖譜(IGraph)、知識圖譜(KGraph),分別儲存著DDIK、IDIK、KDIK三種類型的資源.在Transistion模塊中,DDIK、IDIK、KDIK三類資源通過相互之間的結合轉換,將生成新的類型資源TRDIK.新的類型資源將被儲存在DIKW 上,最終達到在DIKW 圖譜上的動態(tài)平衡.其次從用戶的DIKW 圖譜中可提取得到用戶與他人的交互關系元組Inter(user),將Inter(user)帶入用戶親密度函數(shù)Intimacy 計算得到用戶的親密交流關系用戶Confidants.將Inter(user)和Confidants 帶入函數(shù)Personality 進行用戶性格指數(shù)計算,根據(jù)計算結果將用戶劃分獨立自我型和互依自我型用戶兩種性格類型.在用戶類型的基礎上根據(jù)用戶不同的自我需求,采取不同類型的用戶性格轉換方法.
將虛擬社區(qū)中確認與用戶相關的類型資源TRDIK進行初步分類,根據(jù)TRDIK自身的性質可分為客觀型TRDIK資源和主觀型TRDIK資源.二者之間的區(qū)分標準在于客觀型TRDIK資源可映射到邏輯語言“True/False”,不因為直接觀察者的變化而變化.而主觀型的TRDIK資源屬于概念類資源,屬性值取決于觀察者對事物的主觀評價“Yes/No”,評價結果因人而異.例如,在醫(yī)院資源庫的病人DIKW 模型上的TRDIK資源中,確診書、化驗報告、體檢報告、病人體溫數(shù)值等客觀存在的事實屬于客觀型TRDIK資源.而病人自己對自我身體健康狀況的主觀評價,例如頭疼、胃痛、眩暈等口述的癥狀則屬于主觀概念類TRDIK資源.病人DIKW 模型上同時還包括的Nonexitence 類的TRDIK資源,例如針對某一種病毒,病人中的未感染者和無癥狀感染者在TRDIK資源上的數(shù)值皆為“Null”.而當感染者治愈后癥狀消失,將構成前后不一致的Nonexitence 類的TRDIK資源Inconsist,如式(39)所示.值得一提的是,“Null”不包括直接觀察者沒有客觀保證情況下對事物的主觀否認,如某位患者對自己的身體沒有患病的主觀評價并不屬于Nonexitence 類的TRDIK資源.
圖2 用戶性格分類與轉換方法流程圖Figure 2 Flow chart of personality classification and conversion method
對TRDIK資源進行概念化,將其映射到現(xiàn)有已知概念中.例如,現(xiàn)在某一實驗室中檢測出了一種病毒基因序列(Virogenenew),將Virogenenew與現(xiàn)有已知的病毒基因序列Virogeneexist進行比較,若Virogenenew與一種現(xiàn)有病毒其中Virus(a)的基因序列匹配成功,則Virogenenew與Virus(a)相關聯(lián).若Virogenenew與所有病毒的基因序列匹配皆不成功,則該病毒屬于未曾命名的新型病毒,由CreateID 函數(shù)根據(jù)其特性為其命名,如式(40)所示.
若某一病毒Virus(X)與已知病毒Virus(T)經(jīng)過概念化相同性對比結果為否定,則Virus(X)與Virus(T)為否定關系R(Virus(X),Virus(T))::=“negative”.若Virus(X)的經(jīng)過基因序列比對,結果顯示它屬于已存在的S 型病毒Virus(S)Class的一種,但經(jīng)過時間和環(huán)境的變化導致病毒Virus(X)的屬性產(chǎn)生了變異,喪失了原本S 型病毒Virus(S)Class都具有的某種特性,例如毒性減弱或是失去了傳染性,此時Virus(X)是Virus(S)Class類別中的一個特例,用Virus(X)special表示,如式(41)所示.
1)DataGraphDIK(User)
使用虛擬社區(qū)中的用戶相關的DataDIK資源來構建用戶屬性庫,包括用戶屬性、屬性值和屬性權重.Attr(Ua)表示用戶Ua的屬性集,由一個個圍繞在中心節(jié)點用戶Ua之外的離散節(jié)點集合組成,共同定義了用戶的基本屬性.但這些節(jié)點彼此之間是離散無聯(lián)系的,節(jié)點的數(shù)值可通過數(shù)據(jù)訓練或是問卷調查的方式得到.如式(42)所示,Ex(IS(ai))(1< i < n)表示用戶Ua的某個屬性結點,共計有n個屬性節(jié)點用于定義用戶Ua.大量的DataDIK資源中存在一定比例的數(shù)據(jù)重復,統(tǒng)計DataDIK資源中各個屬性節(jié)點出現(xiàn)的頻率Attr(Ua)freq并將其儲存到用戶數(shù)據(jù)圖譜DataGraphDIK(Ua)上.
2)InformationGraphDIK(User)
用戶Ua的個體的屬性能夠反映出自我的一部分能力,將式(42)中的Attr(Ua)帶入式(32)中,EUa(IS(ai))作為輸入input,計算用戶Ua的自我能力需求Ua(Cneed),如式(43)所示.將計算得到Ua(Cneed)儲存到用戶Ua的信息圖譜InformationGraphDIK(Ua)上.
用戶Ua的InformationDIK資源中記錄了用戶Ua在虛擬社區(qū)中的行為記錄,包括上網(wǎng)記錄、交互記錄、購買記錄、在線記錄等,以及與其他用戶之間的關系.用戶Ua在虛擬社區(qū)中有五種基本的社交行為Inter(Ua),如式(44)所示,統(tǒng)計用戶不同交互方法各自的頻率Inter(Ua)freq,儲存到用戶數(shù)據(jù)圖譜DataGraphDIK(Ua)上.
除了發(fā)布UGC 的行為Post 之外,Inter(Ua)中的其余4 種社交行為都發(fā)生在用戶Ua與另一名用戶Ub之間.在式(45)中,R(Ua,Ub)表示用戶Ua與Ub之間的社交關系,并計算Ua與Ub之間的不同社交行為的頻率R(Ua,Ub)freq.在R(Ua,Ub)中,Send(Ua,Ub)、Reply(Ua,Ub)、Like(Ua,Ub)為用戶Ua的主動行為;Receive(Ua,Ub)、ReceiveReply(Ua,Ub)、ReceiveLike(Ua,Ub)則為用戶Ua的被動行為;Send(Ua,Ub)的值等于Receive(Ua,Ub)的值.將Inter(Ua)、R(Ua,Ub)存儲到InformationGraphDIK(Ua)中,計算R(Ua,Ub)freq儲存到DataGraphDIK(Ua)中.
根據(jù)R(Ua,Ub)和R(Ua,Ub)freq計算用戶Ua和用戶Ub之間的交流關系等級Rdegree(Ua,Ub),若用戶之間有直接交流,即R(Ua,Ub)不等于0,則用戶Ua與用戶Ub互為一級交流關系聯(lián)系人.若用戶Ua與用戶Ub彼此之間沒有聯(lián)系但都與用戶Uc之間存在聯(lián)系,則用戶Ua與用戶Ub屬于二級交流關系聯(lián)系人,如式(46)所示.根據(jù)式(46)計算用戶Ua的各個等級交流關系聯(lián)系人群體Gdegree(Ua)并儲存到InformationGraphDIK(Ua)上.
3)KnowledgeGraphDIK(User)
如式(47)所示,根據(jù)用戶Ua的信息圖譜InformationGraphDIK(Ua)上Inter(Ua)中的Post、Reply、Like 三項內(nèi)容,可推理出K1:K(Ua,content)::=“preference”;通過K1可得知用戶Ua在虛擬社區(qū)中所偏愛和感興趣的內(nèi)容.根據(jù)Inter(Ua)freq可推理出K2:K(Ua,behavior)::=“habit”;通過K2可得知用戶Ua所習慣的社交行為方式.將K1和K2和其他推理得到的KnowledgeDIK都儲存到KnowledgeGraphDIK(Ua).
2.2.1 用戶關系計算
根據(jù)InformationGraphDIK(Ua)上用戶Ua在虛擬社區(qū)中的社交行為記錄Inter(Ua),在用戶Ua的一級交流關系人群Gdegree=1(Ua)中篩選出用戶Ua的親密交流關系人群Confidants(Ua).如式(48)構造函數(shù)Intimacy,根據(jù)用戶Ua與其所有一級交流關系人群(Ub∈Gdegree=1(Ua))之間的社交關系R(Ua,Ub)和社交頻率R(Ua,Ub)freq,計算用戶Ua與Gdegree=1(Ua)中的每名用戶Ub之間的關系親密度I(Ua,Ub),當I(Ua,Ub)大于閥值Iw時,則用戶Ua與Ub互為對方的親密用戶Confidant.取Gdegree=1(Ua)中與用戶Ua的親密值I(Ua,others)大于Iw的用戶組成用戶Ua的親密交流關系人群Confidants(Ua),即用戶Ua的親密用戶Confidant 用戶的集合,用Cn(Ua)表示Confidants(Ua)中的用戶Ua親密交流關系人群的總人數(shù).
根據(jù)R(Ua,Ub)中各個社交方式所占比例,可將虛擬社區(qū)中用戶Ua的一級交流關系人群Gdegeree=1(Ua)分為主動聯(lián)系人(Initiator)、被動聯(lián)系人(Passives)、好友聯(lián)系人(Friend)三種類型.取用戶Ua與Gdegeree=1(Ua)中每名用戶Ub的R(Ua,Ub)中的Send(Ua,Ub)和Receive(Ua,Ub)兩項,計算Send(Ua,Ub)在Send(Ua,Ub)和Receive(Ua,Ub)兩項之和中所占的比例大小,若該計算值在區(qū)間UF內(nèi)則兩名用戶互為好友聯(lián)系人,如式(49)所示.在好友聯(lián)系人關系中,兩名用戶的社交關系在一定程度上達到了平衡.
Gdegeree=1(Ua)中除用戶Ua的好友聯(lián)系人之外其他用戶可分為主動聯(lián)系人群體(Initiator)和被動聯(lián)系人群體(Passives),分類標準是R(Ua,Ub)freq中主動行為和被動行為頻率的占比,若用戶Ua對用戶Ub的主動行為Send(Ua,Ub)freq,Reply(Ua,Ub)freq,Like(Ua,Ub)freq在R(Ua,Ub)freq中所占比值越高則用戶Ua對用戶Ub主動性(Initiative)越高;反之,若被動行為Receive(Ua,Ub)freq,ReceiveReply(Ua,Ub)freq,ReceiveLike(Ua,Ub)freq在R(Ua,Ub)freq中所占比值越高,則用戶Ua對用戶Ub被動性(Passivity)越高.設立閥值Pw,若主動性數(shù)值(Initiative)或被動性數(shù)值(Passivity)大于Pw,則用戶Ua屬于用戶Ub的主動聯(lián)系人或被動聯(lián)系人,如式(50)所示.
主動聯(lián)系人和被動聯(lián)系人之間存在聯(lián)系,若Ua是Ub的主動聯(lián)系人,則Ub是Ua的被動聯(lián)系人.遍歷R(Ua,Ub)中用戶Ua的除好友聯(lián)系人(Friend(Ua))之外的其他所有的聯(lián)系人,得到用戶Ua的主動聯(lián)系人集合Initiator(Ua)和被動聯(lián)系人集合Passives(Ua),如式(51)所示.
分析用戶Ua與主動聯(lián)系人集合Initiator(Ua)、被動聯(lián)系人集合Passives(Ua)的交集.交集的內(nèi)容反映了用戶的另外兩個屬性需求(N)和價值(V),即用戶Ua希望從別人那得到的和別人希望從用戶Ua這得到的,如式(52)所示.
2.2.2 用戶性格分類
計算用戶的性格指數(shù)有兩個指標,一是根據(jù)式(48)計算得到的用戶Ua的親密交流關系人群Confidants(Ua),Confidants(Ua)一共包含了Cn(Ua)名與用戶Ua親密值I(Ua,others)大于門檻值Iw的用戶.Confidants(Ua)可在一定程度上反映用戶的社交習慣與需求.若Confidants(Ua)中的兩個指標I(Ua,others)和Cn(Ua)數(shù)值都偏高,則用戶Ua更可能偏向于注重與他人關系的互依自我型用戶;若I(Ua,others)和Cn(Ua)數(shù)值都偏低,則用戶Ua更可能偏向于注重個人自我特質的獨立自我型用戶;若I(Ua,others)數(shù)值偏高而Cn(Ua)較低,則表示用戶Ua有自己固定的社交圈,與社交圈內(nèi)的人交流較多而與社交圈外的人交流較少.
二是InformationGraphDIK(Ua)中用戶Ua的社交行為頻率Inter(Ua)freq,用于分析用戶Ua的社交習慣.例如,若Inter(Ua)freq中Send(Ua)freq,Receive(Ua)freq數(shù)值所占比重較高,Post(Ua)freq,Reply(Ua)freq,Like(Ua)freq數(shù)值所占比重較低,則用戶Ua屬于偏向于與多人存在交流關系的互依自我型用戶;若Inter(Ua)freq中Send(Ua)freq,Receive(Ua)freq數(shù)值所占比重較低,Post(Ua)freq,Reply(Ua)freq,Like(Ua)freq數(shù)值所占比重較高,則用戶Ua偏向于以自我為中心的獨立自我型用戶.
構造函數(shù)Personality,根據(jù)用戶Ua的親密交流關系人群Confidants(Ua)和社交行為頻率Inter(Ua)freq來計算用戶Ua的性格類型指數(shù):
式中,z表示用戶的性格類型指數(shù),設定其取值范圍為[?1,1],以零點為界限.若z屬于[?1,0)區(qū)間內(nèi),則將該用戶歸類為獨立自我型用戶,若z屬于(0,1]區(qū)間內(nèi),則將用戶歸類為互依自我型用戶.
在虛擬社區(qū)中存在著大量不活躍的潛在UGC 創(chuàng)作用戶,能否成功將這部分用戶類型轉換是促成虛擬社區(qū)中UGC 內(nèi)容產(chǎn)出增長的關鍵.關于用戶類型轉換,Lee等[23]研究了語音韻律轉換方法;Paloutzian等[24]研究了宗教對個人情感、態(tài)度和行為變化產(chǎn)生的影響;但二者研究的都是外部向個體實施的性格轉換方法而忽視了用戶之間存在的個體差異,本文設計了不同的營銷方案,通過滿足不同用戶的不同的心理需求,調動個人的行動積極性和自主性[21],促進用戶創(chuàng)作UGC 的動機的產(chǎn)生.有研究表明,通過邊緣計算和云處理技術可使用戶在虛擬社區(qū)中創(chuàng)作UGC 的動機內(nèi)在化[25].
將虛擬社區(qū)內(nèi)的與用戶Ua相關的TRDIK資源語義形式化[26],對于獨立自我型用戶而言,他們更在意自我的特質如愿望、喜好、能力等,用戶的能力需求大于關系需求;對于互依自我型用戶來說,他們更注重于他人的關系,尤其是與親密交流者confidant 的關系,用戶的關系需求大于能力需求.
虛擬社區(qū)中的UGC 有不同的類型,包括有文本、圖片、視頻、音頻等多種表達形式,以及新聞、娛樂、八卦、研究等多方面內(nèi)容.從用戶Ua的KnowledgeGraphDIK(Ua)提取KnowledgeDIK資 源K1:K(Ua,content)::=“preference”和K3:K(Ua,CreateForm)::=“Comptence”.將K1和K3分別與UGC 的內(nèi)容和形式進行匹配,如式(54)所示.當函數(shù)Match計算得到的兩項結果都為真,可篩選出用戶Ua感興趣且在能力范圍之內(nèi)能夠完成的任務.面對這樣的任務,用戶Ua將感到自己的能力需求Ua(Cneed)得到了滿足,任務的內(nèi)容在他的能力范圍之內(nèi),相比無法完成的任務,他會更愿意去完成這項可完成的任務.
Comptence(Ua)表示用戶Ua的能力集合,將UGC 相關內(nèi)容UGCcontent以某種UGC 形式UGCform輸出的能力.CUGCform(Ua(i))(UGCcontent(Ua(j)))表示用戶Ua所具有的將某項UGCcontent(i)轉換為UGCform(j)的能力,其中,i,j ∈(0,n).在虛擬社區(qū)中,將CUGCform(Ua(i))(UGCcontent(Ua(j)))定向推送給特定用戶Ua,能夠提高UGC 產(chǎn)出的效率和質量.
將用戶Ua的關系親密群體Confidants(Ua)與用戶Ua的關系需求Ua(Rneed)進行比較,若是Confidants(Ua)的總人數(shù)Cn(Ua)不能滿足Ua(Rneed)的需求,則從用戶Ua的二級交流關系群體Gdegree=2(Ua)中選擇與用戶Ua興趣行為需求匹配的用戶,通過推薦機制補充至一級交流關系用戶中,如式(55)所示.
通過用戶DIKW 圖譜得出的用戶能力需求(Cneed)和關系需求(Rneed)存在一定誤差,針對誤差設計測試反饋機制“TestFeedback”,降低誤差對結果的影響.將“TestFeedback”機制結合式(5)中的Type 函數(shù),可將測試范圍拓展至實體E或子類vicecClass 中的父類Class,完善用戶的DIKW 圖譜.
如圖3所示,根據(jù)K1得到與用戶有偏好關系的實體E1.實體E1經(jīng)過式(5)中Type 函數(shù)計算得到父類Class1.代入測試反饋機制“TestFeedback”,“TestFeedback”分為負反饋和正反饋,實體E1的父類Class1實體推向目標用戶進行簡單的“Yes/No”測試,用戶反饋為“Yes”則生成用戶相關新的TRDIK資源,反饋為“No”則生成Nonexistence 類TRDIK資源,兩類資源補充進Transistion 模塊進行DIK 轉換,所得到的DDIK、IDIK、KDIK可補充至DGraph、IGraph、KGraph中,完善有關用戶的DIKW 圖譜.
圖3 用戶測試反饋機制示意圖Figure 3 Diagram of TestFeedback mechanism of user
虛擬社區(qū)和UGC 內(nèi)容與以往交流方式最大的優(yōu)勢就在于獲取資源的低成本和便捷性,若獲取資源所要付出的成本代價超過了一定的限度,用戶出于對自身利益的維護會產(chǎn)生“戰(zhàn)略性放棄”.在虛擬社區(qū)中,每名用戶有不同的DIKW 圖譜,每名用戶的目的不同,處理事情的能力效率也不同,所愿意付出的代價成本也存在差異.
2.4.1 UGC 內(nèi)容的生成成本(generate cost,GCost)
UGC 內(nèi)容的生成成本(GCost)主要取決于用戶的自我能力,如式(32)中的Self(Cneed),根據(jù)式(54)匹配各個用戶與之對應的UGC 主題內(nèi)容.在同一個主題Topic=CUGCform(UGCcontent)下,每位用戶的能力高低決定了UGC 創(chuàng)作的效率,如式(56)所示.
虛擬社區(qū)中,用戶創(chuàng)作UGC 需要時間來完成,每名用戶所擁有的能夠用于UGC 創(chuàng)作的空閑時間(LTime)之間存在差異.用戶Ua的LTime 可根據(jù)InformationGraphDIK(Ua)中用戶的上網(wǎng)時間記錄(Recordonline)計算得到.在一般情況下,虛擬社區(qū)中上網(wǎng)時間越長的用戶可用于UGC 創(chuàng)作的空閑時間LTime 越長,如式(57)所示.
UGC 內(nèi)容對虛擬社區(qū)的好處顯而易見,對用戶的好處卻并不明顯.因此,虛擬社區(qū)內(nèi)一般會設立獎勵機制(Award),如社區(qū)積分、排名、創(chuàng)作徽章等.若獎勵機制滿足了用戶的心理需求能夠影響用戶心中對UGC 創(chuàng)作成本的評估,用戶就會愿意花費更多的時間去完成UGC創(chuàng)作的任務.用戶Ua的TGCost 等于結合用戶創(chuàng)作效率Efficiency(Ua)和用戶空閑時間LTime(Ua)計算得到的成本減去獎勵Award所抵消的成本,如式(58)所示.
2.4.2 UGC 內(nèi)容的獲取成本(acquisition cost,ACost)
在虛擬社區(qū)中,UGC 內(nèi)容的創(chuàng)作者和閱讀者之間是一種雙向選擇的關系.UGC 所涵蓋的內(nèi)容和形式不同,存在資源精細度(Fineness)差異,UGC 內(nèi)容的精細度越高說明包含的資源量越多但精細度過高也同時提高了用戶的獲取成本,導致部分用戶的選擇性放棄.例如,用戶Ua想要了解某種食物是否好吃,他不需要知道該食物使用的是什么原料如何生產(chǎn)出來的,他只需要知道大部分人對這個食物的評價即可.如式(59)所示,用戶對UGC 內(nèi)容的獲取成本(ACost)既與UGC 內(nèi)容的精度有關,也與用戶自身所具有的能力有關.
在某虛擬社區(qū)中的隨機選取n名用戶組成集合Users={U1,U2,···,Un},統(tǒng)計用戶近半年內(nèi)的在虛擬社區(qū)中的社交行為記錄Inter(user)并計算用戶不同社交行為在總社交次數(shù)中所占的頻率Inter(user)freq,統(tǒng)計結果為表1用戶社交行為次數(shù)統(tǒng)計和表2用戶社交行為頻率統(tǒng)計.
根據(jù)表1和2,統(tǒng)計用戶與用戶之間的交互頻率,取表1中第1 名用戶U1作為示例用戶Ua.表3中統(tǒng)計了用戶Ua與一部分其他用戶各自的交流頻次,用戶群Uax={Ua1,Ua2,···,Ua1n}組成了用戶Ua的一級交流關系人群Gdegree=1(Ua).根據(jù)式(48)的Intimacy 函數(shù)計算用戶Ua與Uax親密值I(Ua,Uax),根據(jù)式(49)和(51)計算得到用戶的好友聯(lián)系人Friend(Ua),主動聯(lián)系人Initiative(Ua)和被動聯(lián)系人Passive(Ua).
表3中列出了與用戶Ua與親密值I(Ua,Uax)最高的11 名用戶Uax.在本實驗中,設定閥值Iw=1,區(qū)間UF=(0.35,0.65),可得用戶Ua的一級交流關系人群Gdegree=1(Ua)分類如下:親密交流關系人群Confidants(Ua)={Ua1,Ua2,···,Ua10},其中Cn(Ua)=10.好友聯(lián)系人Friend(Ua)={Ua1,Ua4,Ua5,Ua8,Ua9,···}主動聯(lián)系人Initiative(Ua)={Ua3,Ua7,Ua10,···}被動聯(lián)系人Passive(Ua)={Ua2,Ua6,Ua11,···}根據(jù)以上步驟求出的親密交流關系人群Confidants,根據(jù)Confidants 和用戶社交行為頻率Inter(user)freq,利用式(42)中的Personality 函數(shù)計算用戶的性格類型指數(shù)z,如表4所示.
根據(jù)表4內(nèi)容可得:獨立自我型用戶User(Independent-self)={U1,U3,U4,U6,U8,U9,···};互依自我型用戶User(Interdependent-self)={U2,U5,U7,U10,···}.
表1 用戶社交行為次數(shù)統(tǒng)計Table 1 Statistics of the number of social behaviors of users 次
表2 用戶社交行為頻率統(tǒng)計Table 2 Statistics of the frequency of social behaviors of users %
表3 用戶U1 與部分用戶之間的社交行為頻率統(tǒng)計Table 3 Statistics of social behavior frequency between U1 and other users
表4 用戶性格類型指數(shù)計算Table 4 Calculation of user personality type index
表5列出了用戶Ua在虛擬社區(qū)中關聯(lián)次數(shù)最高的20 個關鍵詞,分析這些關鍵詞并將其代入式(5)中的Type 函數(shù)計算,可得式(60)中關于用戶Ua基本屬性的定義Attr(Ua).將Attr(Ua)儲存到DataGraphDIK(Ua)上.
表5 用戶Ua 在虛擬社區(qū)中的關鍵詞Table 5 Keywords for Ua in virtual communities
將用戶Ua與其主動聯(lián)系人Initiative(Ua)和被動聯(lián)系人Passive(Ua)代入式(52)進行Ua(N)和Ua(V)的計算可得式(61),將結果儲存至KnowledgeGraphDIK(Ua)中
將DIKW 圖譜上與用戶Ua相關的DataDIK、InformationDIK、KnowledgeDIK之間進行“DI-K”轉換所得結果如式(62)所示.可知用戶Ua從事法律方面的工作,平時的愛好是音樂、電影、芭蕾舞蹈等,將所得結果儲存到KnowledgeGraphDIK(Ua)中:
根據(jù)KnowledgeGraphDIK(Ua),通過“TestFeedback”機制對用戶Ua進行“測試-結果反饋-策略調整”計劃.如式(63)所示,根據(jù)式(62)中的K(Ua,Ballet)::=“hobby”將其他芭蕾舞曲例如《Sleep Beauty》或《Quixote》代入“TestFeedback”機制推薦給用戶Ua,若用戶Ua回應為“Yes”,則表明用戶Ua對其感興趣,可生成新的TRDIK資源;若用戶Ua若用戶Ua回應為“No”,則生成新的Nonexistence 類TRDIK資源,將兩項資源都存儲至DIKWGraphDIK(Ua).
若用戶Ua屬于獨立自我型用戶,可根據(jù)式(62)中K(Ua,content)::=“hobby”中的內(nèi)容向用戶Ua進行定向邀請推送.根據(jù)式(58)計算用戶Ua的UGC 內(nèi)容的生成成本GCost,若GCost 較高則為用戶Ua設立獎勵機制,獎勵的豐厚程度與UGC 內(nèi)容的受歡迎程度掛鉤,鼓勵優(yōu)質UGC 內(nèi)容的產(chǎn)出.例如,獲得點贊數(shù)越高的UGC 內(nèi)容作者得到的獎勵將越豐厚.在UGC 創(chuàng)作中,可向用戶Ua發(fā)出有關音樂、芭蕾、電影類主題UGC 內(nèi)容的創(chuàng)作邀請,并為用戶Ua設定有吸引力的獎品,例如古典音樂會的門票、電影票等.除了為用戶匹配感興趣的內(nèi)容之外,用戶本身也是虛擬社區(qū)的一種資源,如根據(jù)式(60)中Ua(V)用戶Ua是一種法律資源,可解決有法律需求用戶的相關問題,比求助于虛擬社區(qū)的官方客服更快捷、比求助于其他無法律背景的用戶更安全.
若用戶Ua屬于互依自我型用戶,與他人的關系對用戶Ua行為的影響更大.可分析用戶Ua與Confidants(Ua)有交集的內(nèi)容,鼓勵多人合作完成UGC 創(chuàng)作,由Confidants(Ua)中的用戶向用戶Ua發(fā)出合作完成邀請,促進用戶Ua的創(chuàng)作激情.若用戶Ua的親密交流關系人群Confidants(Ud)的數(shù)量偏少,可根據(jù)Gdegree=2(Ua)的條件,從用戶Ua的二級交流關系用戶中選出與用戶Ua興趣行為相匹配的用戶向用戶Ua推薦為好友.必要時可添加類人機器人,模擬用戶的Confidants(Ua)的愛好和言行,通過邀請、合作等方式鼓勵用戶Ua進行UGC 內(nèi)容創(chuàng)作.
本文主要基于DIKW 圖譜,研究了虛擬社區(qū)中用戶類型的分類與性格轉換方法.通過對用戶類型資源進行DIKW 分類和完成“數(shù)據(jù)-信息-知識”三者間的轉換,生成用戶DIKW 圖譜并結合自我構建理論和自我決定理論,將社區(qū)中的用戶進行性格分類,對不同用戶采用不用的性格轉換方法,促進虛擬社區(qū)內(nèi)用戶生成內(nèi)容的產(chǎn)生,加強虛擬社區(qū)的內(nèi)容可控性建設并進行了相關仿真實驗.下一步將研究從內(nèi)容的存在語義本質出發(fā)進行虛擬社區(qū)的多模態(tài)內(nèi)容的性格綜合轉化優(yōu)化設計,以及兼顧內(nèi)容推廣傳播和隱私保護的多模態(tài)內(nèi)容傳播策略等.