• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于粗糙集-AHM的新浪微博意見領(lǐng)袖挖掘

      2016-03-19 07:16:41雷園園中國計量學(xué)院杭州310018
      關(guān)鍵詞:意見領(lǐng)袖粗糙集

      □鈕 亮 高 旭 雷園園[中國計量學(xué)院 杭州 310018]

      ?

      基于粗糙集-AHM的新浪微博意見領(lǐng)袖挖掘

      □鈕亮高旭雷園園
      [中國計量學(xué)院杭州310018]

      [摘要]傳統(tǒng)上用來發(fā)掘意見領(lǐng)袖的方法主要有指標權(quán)重法和社會網(wǎng)絡(luò)結(jié)構(gòu)挖掘兩大類,但是單純靠指標權(quán)重法發(fā)現(xiàn)意見領(lǐng)袖受研究者的主觀影響較大,而社會網(wǎng)絡(luò)結(jié)構(gòu)法中用戶間關(guān)系較難挖掘且對用戶其他屬性的衡量有局限性,故而引入了基于粗糙集和AHM算法相結(jié)合的綜合指標權(quán)重算法,充分綜合主、客觀指標權(quán)重挖掘意見領(lǐng)袖,避免了使用單一方法的弊端。通過對新浪微博中熱點事件的實例驗證,比較了粗糙集-AHM、AHP、社會網(wǎng)絡(luò)挖掘三種算法的結(jié)果,并總結(jié)出了本方法計算簡單,對用戶關(guān)系數(shù)據(jù)依賴程度低、指標評價更加客觀的特點。

      [關(guān)鍵詞]意見領(lǐng)袖;粗糙集;AHM;指標評價

      引言

      微博是Web 3.0新興起的一類開放互聯(lián)網(wǎng)社交服務(wù),它以集成化和開放化為特點,任何人都可以通過手機等多種途徑向自己的微博客發(fā)布消息。微博以其發(fā)布內(nèi)容的簡明性、隨意性、多樣性和及時性為特點,領(lǐng)跑了真正的結(jié)構(gòu)扁平、“去中心化”的自媒體時代。而隨著微博時代的到來,意見領(lǐng)袖的也得到了越來越多人的重視。

      意見領(lǐng)袖來源于Paul. Lazarsfeld的“兩級傳播”理論,是指在人際傳播網(wǎng)絡(luò)中可對他人施加影響的“活躍分子”,他們是信息傳播的中介或過濾的環(huán)節(jié),將信息傳播給受眾,形成信息傳遞的二級傳播。隨著意見領(lǐng)袖被越來越多的人所重視,國內(nèi)外意見領(lǐng)袖的研究也在不斷地發(fā)展。

      常用的意見領(lǐng)袖發(fā)掘的方法主要可以分為指標打分法和社會網(wǎng)絡(luò)結(jié)構(gòu)挖掘兩大類。指標打分法是指選取意見領(lǐng)袖的主要特征作為判定意見領(lǐng)袖的指標,如劉志明、劉魯在研究新浪微博中意見領(lǐng)袖時以影響力、活躍度為一級指標,以被轉(zhuǎn)發(fā)數(shù)、被評論數(shù)、原創(chuàng)數(shù)等7個特征為二級指標建立了指標體系[1];丁漢青等人在發(fā)掘SNS中意見領(lǐng)袖時以中性、活躍度、吸聚力、傳染性為四個一級指標和是否為管理員、好友數(shù)、關(guān)注數(shù)、被關(guān)注數(shù)、發(fā)帖數(shù)等12個為二級指標[2]。在指標體系建立后,可以通過層次分析法、評分函數(shù)模型等方法獲得各指標的最終權(quán)重來發(fā)掘意見領(lǐng)袖。指標打分法包絡(luò)面更廣、可以根據(jù)側(cè)重點不同有針對性的選取指標、操作也相對較為方便,但是指標及權(quán)重的確定在一定程度上受到研究者的主觀影響。

      社會網(wǎng)絡(luò)結(jié)構(gòu)挖掘是通過發(fā)掘用戶間的相互關(guān)系來建立用戶社會網(wǎng)絡(luò),根據(jù)用戶在社區(qū)中的中心度及核心-邊緣模型、影響力系數(shù)[3]來確定一個用戶是否為意見領(lǐng)袖。Weng.J基于PageRank提出了Twitter-Rank方法以發(fā)現(xiàn)Twitter中有影響力的用戶[4];肖宇等人提出的LeaderRank算法在PageRank的基礎(chǔ)上加入了情感權(quán)重[5];薛可等人則借助于社會網(wǎng)絡(luò)的相關(guān)理論研究了“意見領(lǐng)袖”在危機傳播中的作用[6]。社會網(wǎng)絡(luò)結(jié)構(gòu)挖掘法在客觀性方面有更大的優(yōu)勢,但是在新浪微博等網(wǎng)絡(luò)社交平臺中,用戶間的相互關(guān)系較難挖掘,并且社會網(wǎng)絡(luò)結(jié)構(gòu)挖掘法對用戶活躍度等的衡量有一定的局限。故而本文引入了一種新的算法用于意見領(lǐng)袖的挖掘即粗糙集-AHM[7]算法。

      粗糙集-AHM算法是一種將粗糙集理論與AHM算法相結(jié)合的指標權(quán)重計算方法。粗糙集理論則作為一種能夠定量化處理不精確、不一致、不完整信息的理論,最初由Pawlak教授與1982年提出[8]。經(jīng)過三十多年的發(fā)展,而今的粗糙集理論被廣泛地應(yīng)用于機器學(xué)習(xí)[9]、數(shù)據(jù)挖掘[10]、決策支持[11]等眾多方面。AHM算法是我國學(xué)者程乾生基于AHP提出的一套分析方法[12]。他在屬性測度基礎(chǔ)上,提出了相對屬性測度和屬性判斷矩陣的概念,而相對權(quán)重和合成權(quán)重很容易從屬性判斷矩陣獲得,故而AHM相對于AHP更為行之有效。將粗糙集-AHM算法引入意見領(lǐng)袖的挖掘,一方面能夠充分綜合主客觀權(quán)重,避免了單單使用指標權(quán)重法主觀影響較大的不足,使計算結(jié)果更為準確;另一方面粗糙集-AHM算法的計算結(jié)果可以對微博用戶的基本屬性例如活躍度、影響力等有直觀的了解;更有效避免了社會網(wǎng)絡(luò)結(jié)構(gòu)法對數(shù)據(jù)要求較高的弊端。

      一、相關(guān)理論

      (一)粗糙集算法計算屬性客觀權(quán)重

      粗糙集的簡單定義[13]:設(shè)信息系統(tǒng),其中U是非空有限論域;A為屬性的有限集合,,C是條件屬性集,D是決策屬性集;,Va是屬性a的值域;是總函數(shù),使得,對于每一個,。

      則稱IND(r)是不可分辨關(guān)系,xi和xj是關(guān)于屬性R不可分辨的。

      對于論域U上任意一個子集X,X不一定能用知識庫中的知識來精確地描述,這時就用X關(guān)于A的上近似和下近似來“近似”的描述X:

      則稱集合X是論域U上關(guān)于等價關(guān)系R的粗糙集。

      (二)AHM計算屬性主觀權(quán)重

      AHM是一種無結(jié)構(gòu)的多準則決策方法,將定性分析和定量分析相結(jié)合,將人們原本不系統(tǒng)的思維過程層次化、數(shù)量化,從對待解決問題的不同影響角度出發(fā),將問題的影響因素一一列出并找出相應(yīng)的隸屬關(guān)系進而進行層次聚合,形成屬性層次結(jié)構(gòu)模型。AHM中的比較測度矩陣需要由AHP判斷矩陣轉(zhuǎn)化而來[14]。

      利用AHM進行分析時需要先對待解決的問題構(gòu)造階遞層次模型,包括目標層、準則層和方案層三個層級。設(shè)次準則層也即方案層有n個元素,分別將其記為。分別對準則層的準則比較兩個不同元素Ai和Aj(i≠j )的相對重要性,分別記做Lij和Lji。由屬性測度,Lij和Lji應(yīng)滿足如下要求:

      由于元素Ai無法和自身比較相對重要性,故而規(guī)定其中Wc為相對屬性權(quán)向量。Lij的計算可由如下公式獲得:其中k為大于2的正整數(shù)。元素Lij和Lji對準則C的比較可由層次分析法AHP中的相對比例標度aij給出,在準則C下,利用9標度法度量Ai和Aj的相對重要程度。

      方案層中各因素與系統(tǒng)目標的合成權(quán)重,可由如下公式計算得到:

      (三)綜合權(quán)重的計算

      本文利用粗糙集-AHM算法分別計算出了各屬性的主、客觀權(quán)重,為了進一步獲得更為合理和科學(xué)的指標權(quán)重,使挖掘出的意見領(lǐng)袖更為準確,本文采用綜合的權(quán)重計算函數(shù)來對兩組權(quán)重進行計算得出最終權(quán)重。通過研究分析,客觀的數(shù)據(jù)準確性較高,更遵從實際,并引進黃金分割定律[7]來構(gòu)建綜合權(quán)重計算函數(shù),綜合兩種權(quán)重,得到最終評價指標權(quán)重:其中,Wai表示客觀屬性權(quán)重,Wbi表示主觀屬性權(quán)重。本文計算意見領(lǐng)袖的屬性權(quán)重更偏向于客觀事實依據(jù),因此把黃金分割點的近似值0.68賦給,最后計算得到的W即為綜合權(quán)重。

      二、“馬航失聯(lián)”實例驗證

      (一)粗糙集計算客觀權(quán)重

      本文通過Rosetta軟件來計算馬航失聯(lián)事件中用戶的屬性重要程度的權(quán)重。我們爬取了馬航失聯(lián)事件中共10475個用戶的信息,作為驗證的樣本值,即樣本集合,選取他們的粉絲數(shù),關(guān)注數(shù),轉(zhuǎn)發(fā)、評論、認證、發(fā)博6個屬性評價指標作為條件屬性;是否為意見領(lǐng)袖作為決策屬性;即:是意見領(lǐng)袖,不是意見領(lǐng)袖}。

      經(jīng)過對于用戶條件屬性數(shù)據(jù)的分析,粉絲、關(guān)注、轉(zhuǎn)發(fā)、評論等數(shù)據(jù)都是連續(xù)性數(shù)據(jù),服從冪律分布,為了防止因樣本數(shù)量過多而出現(xiàn)多數(shù)條件屬性為0的情況,為了利用rosetta處理數(shù)據(jù),我們要對數(shù)據(jù)進行離散化。以10為底對變量取對數(shù),再對所得數(shù)據(jù)進行離散。粉絲數(shù)經(jīng)過取對數(shù)離散后的結(jié)果([0,1],1),([1,2],2),([2,3],3),([3,4],4),([4,5],5),([5,6],6),([ 6,7],7),([7,8],8);關(guān)注取對數(shù)離散的結(jié)果([0,1],1), ([1,2],2),([2,3],3),([3,4],4);評論取對數(shù)離散的結(jié)果是([0,1],1), ([1,2],2),([2,3],3),([3,4],4);發(fā)博離散結(jié)果是([0,50],1),([50,100],2),([100,150],3),([150,200],4),([20 0, 250),5)。將離散以后的數(shù)據(jù)建立決策判斷矩陣,如表1所示.

      表1決策判斷矩陣表

      1.計算屬性的等價類。利用粗糙集分別計算條件屬性和決策屬性的等價類通過Rosetta軟件的Other-Partition功能來實現(xiàn),結(jié)果如下:

      3.計算屬性的重要性程度

      按照公式(1)來計算屬性的重要性程度,并做歸一化處理得到各個屬性的客觀權(quán)重,結(jié)果如下:

      表2屬性客觀權(quán)重表

      (二)AHM算法計算屬性的主觀權(quán)重

      為了充分聽取專家意見,設(shè)計用戶屬性評價指標體系問卷,分別設(shè)立了2個一級指標和6個2級指標,一級指標的設(shè)定參照現(xiàn)有的研究分為用戶影響力和用戶活躍度兩個指標[3],二級指標則選定了以上6個屬性指標項,采用9標度法,由專家對兩兩屬性的比重進行打分。利用專家評分來分別計算屬性的主觀權(quán)重,并求取平均值作為屬性的主觀權(quán)重。根據(jù)以上兩級指標構(gòu)建屬性層次結(jié)構(gòu)矩陣,如下圖所示。

      圖1意見領(lǐng)袖層次模型

      1.確定一級指標權(quán)重

      通過專家的評分構(gòu)建準則層結(jié)構(gòu)矩陣來計算兩個一級指標權(quán)重;

      2.根據(jù)公式(3)計算所有決策層二級指標分別對用戶影響力和用戶活躍度兩個一級指標影響權(quán)重;

      3.根據(jù)公式(5)計算得出所有二級指標對于目標層的影響權(quán)重如下表:

      表3二級指標權(quán)重表

      (三)確定綜合權(quán)重

      按照公式(6)計算最終評價指標綜合權(quán)重:

      表4評價指標綜合權(quán)重表

      粉絲的權(quán)重最高,因此粉絲對于能否成為意見領(lǐng)袖具有決定性作用,普通用戶要想提升自己的影響力、成為意見領(lǐng)袖,首先應(yīng)增加自己的粉絲量。

      (四)計算意見領(lǐng)袖值

      利用計算得到的屬性指標綜合權(quán)重來計算馬航失聯(lián)事件中用戶的意見領(lǐng)袖值,為了精確計算,本文把認證屬性進行量化,算法如公式(7)所示。

      其中u1到u6分別代表用戶6個屬性的屬性值,最終計算出馬航失聯(lián)用戶的意見領(lǐng)袖值,并取前1‰作為意見領(lǐng)袖,得到馬航失聯(lián)用戶的意見領(lǐng)袖。

      為了驗證粗糙集-AHM算法在意見領(lǐng)袖尋找中的科學(xué)性和可靠性,本文同時利用AHP算法[3]和社會網(wǎng)絡(luò)分析法[5]分別對馬航意見領(lǐng)袖進行挖掘,并對3種方法的得到的意見領(lǐng)袖進行對比,如表5所示。

      表5利用3種方法得到的“馬航”事件意見領(lǐng)袖

      從表中可以看出,利用粗糙集-AHM算法和AHP算法挖掘得到的馬航意見領(lǐng)袖基本相同,而與利用社會網(wǎng)絡(luò)分析法得出的意見領(lǐng)袖相比也有較高的吻合度,因而可以確定利用粗糙集-AHM算法來挖掘意見領(lǐng)袖是切實可行的。

      三、總結(jié)

      本文引用粗糙集-AHM算法來減弱由單純AHM算法帶來的主觀性。用粗糙集算法對各指標求取客觀權(quán)重,用AHM算法求取主觀權(quán)重,再由所得的客觀、主觀權(quán)重求取指標的綜合權(quán)重值。利用綜合權(quán)重來挖掘意見領(lǐng)袖。

      本方法特點體現(xiàn)在兩方面,首先,在指標評價法的基礎(chǔ)上,通過引進粗糙集來代替以往的統(tǒng)計方法或?qū)<医?jīng)驗,去除一定的主觀因素,在對指標量化方面,AHM相較于AHP來說,有計算量小、模型簡單、無需進行一致性檢驗、決策效率高等特點;其次,一定程度上降低了對數(shù)據(jù)的要求,在微博用戶間關(guān)系的數(shù)據(jù)較難爬取的背景下提供了更為切實可行的意見領(lǐng)袖挖掘方法。

      本方法是對指標評價體系的一種改進,對于通過指標評價法來挖掘領(lǐng)袖的案例均具有普適性,而且不僅局限于新浪微博,還可移植到其他社交平臺。但由于粗糙集-AHM是在指標評價體系基礎(chǔ)上建立起來的,對于用戶的屬性信息具有一定的依賴性;其次,每次都要重新計算用戶屬性權(quán)重,具有一定的局限性。

      參考文獻

      [1]劉志明,劉魯.微博網(wǎng)絡(luò)輿情中的意見領(lǐng)袖識別及分析[J].系統(tǒng)工程, 2011(06):8-16.

      [2]丁漢青,王亞萍. SNS網(wǎng)絡(luò)空間中“意見領(lǐng)袖”特征之分析——以豆瓣網(wǎng)為例[J].新聞與傳播研究, 2010(03): 83-90,111.

      [3]李卓卓,丁子涵.基于社會網(wǎng)絡(luò)分析的網(wǎng)絡(luò)輿論意見領(lǐng)袖——以大學(xué)生就業(yè)輿情為例[J].情報雜志, 2011(11): 66-70.

      [4] WENG J S, LIN E P, JIANG J, et al. Twitterank: finding topic-sensitive influential twitterres[A] //Proceeding of the Third ACM International Conference on Web Search and Data Mining [C]. New York :2010, 261-270.

      [5]肖宇,許煒,夏霖.一種基于情感傾向分析的網(wǎng)絡(luò)團體意見領(lǐng)袖識別算法[J].計算機科學(xué), 2012, 39(2): 34-37.

      [6]薛可,陳晞,王韌.基于社會網(wǎng)絡(luò)的品牌危機傳播“意見領(lǐng)袖”研究[J].新聞界, 2009(08): 30-32.

      [7]張曉明.基于粗糙集-AHM的裝備制造業(yè)企業(yè)創(chuàng)新能力評價指標權(quán)重計算研究[J].中國軟科學(xué), 2014(6): 151-158.

      [8] PAWLAK Z. Rough sets[J]. .International Journal of Computer and Information Sciences, 1982, 11:341-356.

      [9] CHMIELEWSKI M R, GRZYMALA-BUSSE J W. Global discretization of continuous attributes as preprocessing for machine learning[J].International Journal of Approximate Reasoning,1996, 15: 319-331.

      [10] CHAN C C. A rough set approach to attribute generalization in data mining[J]. Journal of Information Sciences, 1998, 107: 169-176.

      [11] PAWLAK Z. Rough set approach to Know ledge-based decision support[J]. European Journal of Operational Research, 1997, 99: 48-57.

      [12]程乾生.層次分析法AHP和屬性層次分析模型AHM [J].系統(tǒng)工程理論與實踐, 1997(11): 56-59.

      [13]張文修,吳偉志.粗糙集理論介紹和研究綜述[J].模糊系統(tǒng)與數(shù)學(xué), 2000, 14(4): 1-12.

      [14]宿程遠,呂森,趙旭雍,等.屬性層次分析模型在小城鎮(zhèn)污水處理廠規(guī)劃中的應(yīng)用[J].廣東農(nóng)業(yè)科學(xué), 2011, 38(2): 163-165.

      編輯何婧

      Recognition of Opinion Leaders in Microblog Based on Rough Set and AHM

      NIU Liang GAO Xu LEI Yuan-yuan
      (China Jiliang University Hangzhou 310018 China)

      AbstractTraditionally, there are two general types of methods to seek for an opinion leader, which are index weighting method and digging of social network structure. But simply relying on index weighting method to find an opinion leader would be affected by the subjective idea of the opinion leaders, while the method of digging out social network structure is also limited due to the seeming invisible relationship among the users and the unreliable evaluation of the other quality of the users. The article brings up an integrated index weighting algorithm based on rough set and AHM algorithm judging from the goods and weakness of the methods mentioned above. In this way, it is possible to have an integrated index of both subjective and objective standard to judging on the potential opinion leaders in the meantime avoiding the disadvantages of using one single method. The article has some exemplification research on certain hot hits on Weibo. By comparing the output of the three methods, it is concluded that this methods is featured as simple and objective.

      Key wordsopinion leader; rough set; AHM; evaluation index

      [作者簡介]鈕亮(1975-)男,中國計量學(xué)院經(jīng)濟與管理學(xué)院教師;高旭(1994-)男,中國計量學(xué)院經(jīng)濟與管理學(xué)院本科生;雷園園(1993-)女,中國計量學(xué)院經(jīng)濟與管理學(xué)院本科生.

      [基金項目]浙江省高校人文社科重點研究基地基金(RWSKZD03-201207);浙江省哲社重點研究基地和浙江省人文社科基金(SIPM3222);浙江省社科聯(lián)(2014Z084);2014年度國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃立項:基于社交網(wǎng)絡(luò)的“杭州限牌”輿情分析模型構(gòu)建與實證(201410356019);2015年新苗人才計劃項目(2015R409005).

      [收稿日期]2014-12-17

      [中圖分類號]G206

      [文獻標識碼]A[DOI]10.14071/j.1008-8105(2016)01-0067-05

      猜你喜歡
      意見領(lǐng)袖粗糙集
      基于Pawlak粗糙集模型的集合運算關(guān)系
      基于二進制鏈表的粗糙集屬性約簡
      優(yōu)勢直覺模糊粗糙集決策方法及其應(yīng)用
      跨境電商平臺的社群形成機理及作用
      傳播學(xué)視角下應(yīng)用型專業(yè)思想政治教育有效性研究
      亞太教育(2016年34期)2016-12-26 21:02:15
      微博動員、維權(quán)倡議與記者的利益表達機制
      新聞界(2016年13期)2016-12-23 14:32:59
      新形勢下高校網(wǎng)絡(luò)文化建設(shè)管理機制研究
      微信營銷意見領(lǐng)袖培養(yǎng)現(xiàn)狀研究
      今傳媒(2016年10期)2016-11-22 11:38:32
      多?;植诩再|(zhì)的幾個充分條件
      雙論域粗糙集在故障診斷中的應(yīng)用
      古田县| 蒲城县| 西乡县| 砚山县| 土默特右旗| 吴川市| 湘西| 钦州市| 杭锦旗| 曲沃县| 南溪县| 迁西县| 基隆市| 宣汉县| 和顺县| 广饶县| 卓尼县| 洛宁县| 井陉县| 蓝田县| 丰顺县| 永新县| 平阳县| 临安市| 松阳县| 东阳市| 古浪县| 方山县| 乐平市| 洱源县| 顺昌县| 柳州市| 永善县| 阿拉善盟| 衡水市| 高密市| 奉化市| 瑞昌市| 霍邱县| 漾濞| 锡林郭勒盟|