• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      社交網(wǎng)絡(luò)中領(lǐng)域?qū)<野l(fā)現(xiàn)模型研究

      2018-09-26 11:30:48高曉波方獻(xiàn)梅
      軟件導(dǎo)刊 2018年7期
      關(guān)鍵詞:領(lǐng)域?qū)<?/a>用戶行為社交網(wǎng)絡(luò)

      高曉波 方獻(xiàn)梅

      摘要:隨著Web2.0和移動(dòng)終端設(shè)備的發(fā)展,社交網(wǎng)絡(luò)日益普及,尋找社交網(wǎng)絡(luò)中的領(lǐng)域?qū)<乙殉蔀檠芯繜狳c(diǎn)。微博是當(dāng)今流行的社交網(wǎng)絡(luò),以新浪微博數(shù)據(jù)為例,首先按用戶發(fā)布的微博主題將用戶劃分為各個(gè)領(lǐng)域,然后提出在各領(lǐng)域內(nèi)計(jì)算微博社交網(wǎng)絡(luò)用戶權(quán)威值的模型。模型充分考慮了用戶發(fā)布的微博數(shù)目、用戶粉絲數(shù)以及粉絲評(píng)論、轉(zhuǎn)發(fā)和提及用戶等行為對(duì)用戶權(quán)威值的影響,最終計(jì)算出用戶權(quán)威值。實(shí)驗(yàn)結(jié)果證實(shí)了該領(lǐng)域?qū)<野l(fā)現(xiàn)模型的合理性與可行性。

      關(guān)鍵詞:微博;社交網(wǎng)絡(luò);用戶行為;專家發(fā)現(xiàn);領(lǐng)域?qū)<?/p>

      DOI:10.11907/rjdk.181611

      中圖分類號(hào):TP301

      文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2018)007-0067-03

      Abstract:WiththedevelopmentofWeb2.0andmobileterminaldevices,socialnetworksarebecomingpopular.Howtolocatetheexpertsinaspecificfieldisaresearchfocusinthisarea.SinaWeiboisoneofthemostpopularon-linesocialisingtoolsinChina.ThispapertriestouseamathematicalmodeltodistinguishexpertsfromnormalusersofSinaWeibo.Firstofall,usersaredividedintodifferentfieldsaccordingtotheposts'theme.Andthenthemodel,whichtakesintofullaccountseveraluserbehaviors,includingtheamountofthepostsandcomments,numberoffansandforwardrates,willcalculatetheauthoritativevalueofeachuser.Theresultoftheexperimentverifiestheadvancementofthismodelintherealnetworkenvironment.

      KeyWords:microblog;socialnetworking;userbehavior;expertslocating;domainexperts

      0引言

      據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第41次全國(guó)互聯(lián)網(wǎng)發(fā)展統(tǒng)計(jì)報(bào)告,截至2017年12月,中國(guó)網(wǎng)民規(guī)模達(dá)7.72億,互聯(lián)網(wǎng)普及率為55.8%,微博用戶使用率已達(dá)到40.9%,知乎、豆瓣、天涯社區(qū)用戶使用率均有所提升,表明越來越多用戶通過各種社區(qū)平臺(tái)進(jìn)行互動(dòng),以獲取和表達(dá)觀點(diǎn),各種網(wǎng)絡(luò)社區(qū)已成為人們發(fā)表言論的重要場(chǎng)所。新浪微博作為我國(guó)主流的微博服務(wù)提供商之一,一條微博可以包含140字左右的文字,用戶可以在微博中添加URL短地址服務(wù)、圖片、音視頻及地理信息等。微博社交網(wǎng)絡(luò)的海量數(shù)據(jù)資源中不僅包含大眾普遍關(guān)注的社會(huì)信息,也包含了用戶行為特征及熱點(diǎn)事件。社交網(wǎng)絡(luò)中用戶的關(guān)注、發(fā)帖、轉(zhuǎn)帖、評(píng)論等行為蘊(yùn)含了用戶偏好、用戶權(quán)威性等信息。對(duì)社交網(wǎng)絡(luò)中的用戶行為進(jìn)行分析,可以評(píng)估用戶影響力。

      目前活躍在互聯(lián)網(wǎng)上的專家主要是通過互聯(lián)網(wǎng)平臺(tái)相互傳播而形成的具有影響力的意見領(lǐng)袖,他們?cè)诨ヂ?lián)網(wǎng)上發(fā)表對(duì)某個(gè)領(lǐng)域的觀點(diǎn),并得到大量普通網(wǎng)民的關(guān)注、支持、轉(zhuǎn)發(fā)、評(píng)論,從而形成對(duì)民眾的觀點(diǎn)引導(dǎo)和輿論影響。他們的話題之所以受到廣泛關(guān)注,主要在于其發(fā)表的觀點(diǎn)具有良好的指導(dǎo)性、前瞻性和可靠性,能為普通民眾提供有效的信息指導(dǎo)。社區(qū)專家發(fā)現(xiàn)已成為國(guó)內(nèi)外學(xué)者的研究熱點(diǎn)之一。

      近年來,專家發(fā)現(xiàn)得到了快速發(fā)展,主要集中在知識(shí)分享平臺(tái)(CQA)、學(xué)術(shù)文獻(xiàn)專家和信息管理系統(tǒng)中。問答平臺(tái)[1]具有明確的問與答關(guān)系,答題者具有較為明顯的專家特征,通過研究用戶歷史問答記錄領(lǐng)域知識(shí)的相關(guān)性,得到用戶的專業(yè)知識(shí)、聲譽(yù)和權(quán)威性。周光有等[2]基于用戶局部相似性,實(shí)現(xiàn)問答平臺(tái)中用戶的主題敏感概率模型進(jìn)行專家估計(jì);RiahiFatemeh等[3]使用集合概率模型和統(tǒng)計(jì)主題模型實(shí)現(xiàn)問答社區(qū)的專家發(fā)現(xiàn);FermeierRalphf等[4]在wiki中通過語義相似度補(bǔ)充專家本體,實(shí)現(xiàn)根據(jù)專業(yè)知識(shí)水平和同行評(píng)審協(xié)作的專家識(shí)別;WuChi-Jen等[5]通過構(gòu)造P指數(shù)評(píng)價(jià)專家,從而實(shí)現(xiàn)領(lǐng)域內(nèi)的專家發(fā)現(xiàn);NaqviMohsin等[6]提出基于時(shí)態(tài)關(guān)聯(lián)規(guī)則的專業(yè)知識(shí)挖掘算法實(shí)現(xiàn)學(xué)術(shù)專家發(fā)現(xiàn)。

      Web社區(qū)中的專家與普通用戶并沒有顯著區(qū)別,且零散地分布在互聯(lián)網(wǎng)中,這與知識(shí)分享平臺(tái)和學(xué)術(shù)專家平臺(tái)具有很大區(qū)別。目前已有學(xué)者研究Web社區(qū)中的專家發(fā)現(xiàn),但主要是將Web社區(qū)作為一個(gè)社交網(wǎng)絡(luò)進(jìn)行分析。SuHang等[7]研究在一個(gè)特定領(lǐng)域的社交平臺(tái)中進(jìn)行專家發(fā)現(xiàn),但并不適用于廣義的社區(qū)平臺(tái);YinHongzhi等[8]提出通過影響力對(duì)專家小組進(jìn)行識(shí)別,但是忽略了領(lǐng)域特征;SmirnovaElena[9]提出用貝葉斯層次概率模型綜合分析社會(huì)關(guān)系和文本主題,大大提高了專家發(fā)現(xiàn)效率,但沒有揭示交互關(guān)系與主題特征的邏輯關(guān)系,缺乏精確的概率函數(shù);JianJiao等[10]通過構(gòu)造空間向量模型計(jì)算文本相關(guān)性,通過改進(jìn)的PageRank算法計(jì)算用戶關(guān)注度,實(shí)現(xiàn)對(duì)專家的綜合排名;LiuYang等[11]研究基于語義知識(shí)網(wǎng)絡(luò)推理對(duì)查詢條件與專家特征進(jìn)行相關(guān)性度量的排序方法;CraigMacdonald等[12]研究專家文檔排名與專家排名的關(guān)系,提供基于文檔權(quán)重的排序方法;DavoodiE等[13]提出一種基于內(nèi)容和關(guān)系的混合推薦算法,運(yùn)用社會(huì)網(wǎng)絡(luò)分析,并考慮用戶經(jīng)驗(yàn)背景、知識(shí)水平、個(gè)人偏好等因素,匹配最合適的專家進(jìn)行推薦;PhamXH等[14]提出RecSys框架,在發(fā)現(xiàn)用戶偏好和判斷的基礎(chǔ)上,匹配知識(shí)的特征屬性和具有價(jià)值的相關(guān)專家。

      本文以新浪微博社交網(wǎng)絡(luò)為研究對(duì)象,判斷一個(gè)用戶是否是專家(意見領(lǐng)袖),通常需要綜合利用微博用戶多方面信息,如用戶活躍度、用戶標(biāo)簽、用戶評(píng)論及轉(zhuǎn)發(fā)微博、用戶關(guān)注的用戶群及關(guān)注該用戶的用戶群等。基于微博用戶之間的關(guān)注、轉(zhuǎn)發(fā)、評(píng)論等關(guān)系構(gòu)建微博社區(qū)的用戶行為交互關(guān)系網(wǎng)絡(luò),按照用戶發(fā)布微博所屬主題將用戶劃分到各個(gè)領(lǐng)域,從真實(shí)微博社區(qū)中提取各領(lǐng)域用戶的相應(yīng)數(shù)據(jù),根據(jù)模型計(jì)算用戶權(quán)威值,排名靠前的用戶即是篩選出的相應(yīng)領(lǐng)域?qū)<遥ㄒ庖婎I(lǐng)袖)。

      1社區(qū)用戶交互關(guān)系網(wǎng)絡(luò)圖

      社交網(wǎng)絡(luò)已成為網(wǎng)絡(luò)信息傳播的重要途徑,為廣大用戶提供了開放、自由的虛擬討論空間。在各社區(qū)平臺(tái)提供了不同主題類別,社區(qū)用戶可針對(duì)感興趣的主題發(fā)表微博,用戶間的交互方式有評(píng)論、轉(zhuǎn)發(fā)等關(guān)系,通過這些關(guān)系建立用戶之間的交互關(guān)系網(wǎng)絡(luò)圖G=(U,E)。其中U表示網(wǎng)絡(luò)中的節(jié)點(diǎn)集合,即社區(qū)用戶;E表示網(wǎng)絡(luò)中的邊集,etij∈E表示用戶Ui和Uj間存在關(guān)系t(t可以是評(píng)論、轉(zhuǎn)發(fā)、提及等)。

      圖1給出的是微博社區(qū)用戶交互關(guān)系的一部分。微博社區(qū)中每個(gè)用戶有檔案信息(包含用戶發(fā)布的微博數(shù)等信息)和社會(huì)關(guān)系信息,兩個(gè)用戶間的交互關(guān)系可以是單向的,也可以是雙向的。圖1中,用戶U5有1個(gè)單向交互關(guān)系(如所發(fā)微博被用戶U7評(píng)論過)和3個(gè)雙向交互關(guān)系(如U5和U4在所發(fā)微博中都提及到對(duì)方),U6和U7間既有單向交互關(guān)系(U7對(duì)U6的微博進(jìn)行評(píng)論),也有雙向交互關(guān)系(U6和U7相互轉(zhuǎn)發(fā)對(duì)方微博)。

      本文以新浪微博社交網(wǎng)絡(luò)為研究對(duì)象,通過網(wǎng)絡(luò)爬蟲抓取2016年9月10日-2017年5月12日的數(shù)據(jù),構(gòu)建社區(qū)用戶間的交互關(guān)系網(wǎng)絡(luò)。

      2Web社區(qū)領(lǐng)域?qū)<野l(fā)現(xiàn)模型

      本文提出的社區(qū)領(lǐng)域?qū)<野l(fā)現(xiàn)模型首先通過LDA主題模型[15],抽取用戶微博主題,將主題分配給各個(gè)類別,并通過微博主題分類將用戶分為不同類別,在各類別領(lǐng)域不僅考慮用戶所發(fā)微博數(shù)目和用戶社會(huì)關(guān)系(關(guān)注歷史),還考慮用戶間的交互行為(評(píng)論、轉(zhuǎn)發(fā)及提及)。模型提出的專家權(quán)威值包含兩部分:用戶初始權(quán)威值與粉絲影響力。

      2.1LDA主題模型

      LDA是一種文檔主題生成模型,也稱為一個(gè)三層貝葉斯概率模型,可用來識(shí)別文檔中的主題信息。LDA生成方法如下:

      Chooseparameterθ~p(θ);

      ForeachoftheNwordsw_n:

      Chooseatopicz_n~p(z|θ);

      Chooseawordw_n~p(w|z);

      其中θ是一個(gè)主題向量,向量的每一列表示每個(gè)主題在文檔中出現(xiàn)的概率;p(θ)是θ的分布;N表示要生成文檔的單詞個(gè)數(shù),w_n表示生成的第n個(gè)單詞w;z_n表示選擇的主題,p(z|θ)表示給定θ時(shí)主題z的概率分布;p(w|z)表示給定z時(shí)w的分布。其圖模型如圖2所示,其中D表示文檔總數(shù),Nd表示文檔d中的單詞總數(shù)。

      獲取用戶所發(fā)微博,按LDA模型找出微博主題。主題可能有多個(gè),通常一個(gè)人在擅長(zhǎng)領(lǐng)域會(huì)發(fā)布較多微博,因而本文選取其中出現(xiàn)概率最大的一個(gè)主題,也即取出一個(gè)用戶最擅長(zhǎng)的,并最終分配到對(duì)應(yīng)的8個(gè)類別:娛樂、科技、商業(yè)、運(yùn)動(dòng)、教育、新聞、生活、閑聊。

      2.2領(lǐng)域用戶權(quán)威值初始化

      利用LDA模型將用戶分配到相應(yīng)領(lǐng)域,然后可以分領(lǐng)域計(jì)算各領(lǐng)域內(nèi)的用戶權(quán)威值。一般而言,高權(quán)威用戶的粉絲較多,發(fā)布的微博也較多,因而對(duì)用戶權(quán)威值進(jìn)行初始化時(shí),需要充分考慮這兩方面信息。

      定義1(關(guān)注→)新浪微博中,如果用戶Ui關(guān)注了用戶Uj,記為Ui→Uj,則用戶Uj稱為用戶Ui的關(guān)注好友,用戶Ui稱為用戶Uj的粉絲。

      用戶的初始權(quán)威值使用公式(1)進(jìn)行計(jì)算。

      式(1)中,Auth(Ui)表示用戶Ui的初始權(quán)威值,F(xiàn)(G,Ui)表示微博社交網(wǎng)絡(luò)中用戶Ui的粉絲數(shù)目,max(F(G,.))和min(F(G,.))分別表示用戶的最大粉絲數(shù)和最小粉絲數(shù),N(G,Ui)表示用戶Ui發(fā)布微博數(shù)目,max(N(G,.))和min(N(G,.))分別表示用戶發(fā)布的最大和最小微博數(shù)目。α、β為調(diào)節(jié)系數(shù),且α+β=1。初始權(quán)威值越大,說明該用戶影響力越大,越有可能是需要尋找的專家。

      2.3粉絲用戶影響力

      在新浪微博中,一條微博受到關(guān)注,除微博內(nèi)容本身和發(fā)布微博的用戶影響力外,還與微博傳播網(wǎng)絡(luò)中粉絲用戶的影響力有關(guān)。

      定義2(用戶交互系數(shù)Ci,j)Ci,j為用戶Ui和該用戶粉絲Uj之間的交互系數(shù),表示用戶Uj對(duì)用戶Ui微博的評(píng)論頻率及用戶Uj在自身微博中轉(zhuǎn)發(fā)或@Ui(提及用戶Ui)的微博比例。Ci,j的值由公式(2)進(jìn)行計(jì)算。

      式(2)中,Ti和Tj分別表示用戶Ui和用戶Uj發(fā)布的微博數(shù)量。考慮到微博的時(shí)效性,Ti和Tj選取用戶最新發(fā)布的至多200條微博。Rj,i表示用戶Uj對(duì)用戶Ui微博的評(píng)論次數(shù),Rtj,i與Mj,i分別表示用戶Uj轉(zhuǎn)發(fā)與提及用戶Ui的微博次數(shù)。γ為正整數(shù),用來線性放大用戶間的行為交互影響。

      用戶的最終權(quán)威值由用戶初始權(quán)威值和粉絲權(quán)威值兩部分構(gòu)成。

      3實(shí)驗(yàn)

      3.1實(shí)驗(yàn)數(shù)據(jù)

      本文實(shí)驗(yàn)數(shù)據(jù)來自新浪微博2016年9月10日—2017年5月12日的數(shù)據(jù),去掉一些無效和空信息后,有191037個(gè)用戶的2753208條微博信息,以及微博評(píng)論信息、轉(zhuǎn)發(fā)信息和所有用戶的關(guān)注好友信息及粉絲信息。

      對(duì)用戶發(fā)布的微博使用LDA主題模型進(jìn)行分類,將微博用戶分為8個(gè)領(lǐng)域,考慮到粉絲數(shù)少的用戶影響力較小,因而本文只選取粉絲數(shù)在120個(gè)以上的用戶。

      3.2實(shí)驗(yàn)結(jié)果

      使用公式(1)計(jì)算各領(lǐng)域用戶的初始權(quán)威值,這里α取0.8,β取0.2,然后使用公式(3)計(jì)算每個(gè)用戶的最終權(quán)威值,本文使用P@10及MAP評(píng)估專家發(fā)現(xiàn)結(jié)果,結(jié)果如表1所示。

      4結(jié)語

      Web社區(qū)中各專家的專業(yè)程度、影響力等各不相同。本文以新浪微博數(shù)據(jù)為例,首先按用戶發(fā)布的微博主題將用戶劃分為各個(gè)領(lǐng)域,然后提出在各領(lǐng)域內(nèi)計(jì)算微博社交網(wǎng)絡(luò)用戶權(quán)威值的模型,模型提出用戶的最終權(quán)威值由用戶初始權(quán)威值和粉絲權(quán)威值共同決定。實(shí)驗(yàn)結(jié)果驗(yàn)證了算法的合理性與可行性。

      參考文獻(xiàn):

      [1]LIUDR,CHENYH,KAOWC,etal.Integratingexpertprofile,reputationandlinkanalysisforexpertfindinginquestion-answeringwebsites[J].InformationProcessing&ManagementAnInternationalJournal;,2013,49(1):312-329.

      [2]ZHOUG,LAIS,LIUK,etal.Topic-sensitiveprobabilisticmodelforexpertfindinginquestionanswercommunities[C].ACMInternationalConferenceonInformationandKnowledgeManagement.ACM,2012:1662-1666.

      [3]RIAHIF,ZOLAKTAFZ,SHAFIEIM,etal.Findingexpertusersincommunityquestionanswering[C].Proceedingsofthe21stInternationalConferenceCompaniononWorldWideWeb.ACM,2012:791-798.

      [4]SCHAFERMEIERR,PASCHKEA.UsingdomainontologiesforfindingexpertsincorporateWikis[C].Proceedingsofthe7thInternationalConferenceonSemanticSystems.ACM,2011:63-70.

      [5]WUCJ,CHUNGJM,LUCY,etal.Usingweb-miningforacademicmeasurementandscholarrecommendationinexpertfindingsystem[C].Proceedingsofthe2011IEEE/WIC/ACMInternationalConferencesonWebIntelligenceandIntelligentAgentTechnology,2011:288-291.

      [6]NAQVIM,USMANA,BATOOLS,etal.FindingscientificexpertsofACMcategoriesbasedontemporalassociationrulemining[C].ComputerNetworksandInformationTechnology(ICCNIT),2011InternationalConferenceon.IEEE,2011:273-277.

      [7]SUH,TANGJ,HONGW.LearningtoDiversifyExpertFindingwithSubtopics[M].AdvancesinKnowledgeDiscoveryandDataMining.SpringerBerlinHeidelberg,2012:330-341.

      [8]YINH,CUIB,HUANGY.FindingaWiseGroupofExpertsinSocialNetworks[C].InternationalConferenceonAdvancedDataMiningandApplications.Springer-Verlag,2011:381-394.

      [9]SMIRNOVAE.Amodelforexpertfindinginsocialnetworks[C].Proceedingsofthe34thInternationalACMSIGIRConferenceonResearchanddevelopmentinInformationRetrieval.ACM,2011:1191-1192.

      [10]JIAOJ,YANJ,ZHAOH,etal.Expertrank:anexpertuserrankingalgorithminonlinecommunities[C].NewTrendsinInformationandServiceScience,2009.NISS'09.InternationalConferenceon.IEEE,2009:674-679.

      [11]YANGL,HUZ,LONGJ.Serviceofsearchingandrankinginasemantic-basedexpertinformationsystem[C].ServicesComputingConference(APSCC),2010IEEEAsia-Pacific.IEEE,2010:609-614.

      [12]MACDONALDC,OUNISI.Theinfluenceofthedocumentrankinginexpertsearch[J].InformationProcessing&Management;,2011,47(3):376-390.

      [13]DAVOODIE,KIANMEHRK,AFSHARCHIM.Asemanticsocialnetwork-basedexpertrecommendersystem[J].AppliedIntelligence,2013,39(1):1-13.

      [14]PHAMXH,JUNGJJ,NGUYENNT.Integratingmultipleexpertsforcorrectionprocessininteractiverecommendationsystems[M].ComputationalCollectiveIntelligenceTechnologiesandApplications.Berlin:Springer,2012:31-40.

      [15]BLEIDM,NGAY,JORDANMI.Latentdirichletallocation[J].JournalofMachineLearningResearch,2003,3:993-1022.

      (責(zé)任編輯:黃?。?/p>

      猜你喜歡
      領(lǐng)域?qū)<?/a>用戶行為社交網(wǎng)絡(luò)
      良好睡眠,健康同行
      電力高校圖書館轉(zhuǎn)型智庫服務(wù)的研究
      社會(huì)化媒體用戶使用動(dòng)機(jī)與行為探析
      新媒體用戶行為模式分析
      基于圖片分享為核心的社交網(wǎng)絡(luò)應(yīng)用分析
      戲劇之家(2016年19期)2016-10-31 19:44:28
      社交網(wǎng)絡(luò)自拍文化的心理解讀
      新聞前哨(2016年10期)2016-10-31 17:46:44
      基于科技文獻(xiàn)庫的領(lǐng)域?qū)<胰喊l(fā)現(xiàn)及其推薦方法
      基于用戶行為分析的智能家居系統(tǒng)的研究與設(shè)計(jì)
      科技視界(2016年5期)2016-02-22 20:07:43
      “電子信息創(chuàng)新技術(shù)”研討會(huì)征文
      濮阳市| 高阳县| 垣曲县| 双流县| 灌云县| 娱乐| 绥棱县| 公安县| 兴和县| 乐业县| 威信县| 中卫市| 凯里市| 西和县| 兴海县| 抚松县| 彰武县| 柯坪县| 泗阳县| 革吉县| 凤凰县| 平顶山市| 米林县| 吉首市| 宁波市| 金川县| 定边县| 佛坪县| 皮山县| 穆棱市| 四平市| 庆城县| 阿克苏市| 吴忠市| 阿克陶县| 南宫市| 洪江市| 天峨县| 疏附县| 北辰区| 木里|