• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于關(guān)聯(lián)規(guī)則的熱點(diǎn)事件時(shí)序分析方法

      2018-09-06 01:54:00王奕文
      關(guān)鍵詞:熱點(diǎn)關(guān)聯(lián)閾值

      王奕文,劉 昕,曹 帥,王 豐

      (中國(guó)石油大學(xué)(華東)計(jì)算機(jī)與通信工程學(xué)院,山東 青島 266580)

      0 引 言

      隨著Internet的廣泛普及與飛速發(fā)展,已經(jīng)從根本上改變了人們獲取信息和事件傳播的形式。由于越來(lái)越多的人傾向于利用網(wǎng)絡(luò)表達(dá)自己的態(tài)度和觀點(diǎn),催生出大量社會(huì)化媒體平臺(tái),如微博、微信、知乎等,促使數(shù)據(jù)中蘊(yùn)含的正面或負(fù)面的信息急劇膨脹形成輿情[1-2]熱點(diǎn)。熱點(diǎn)事件的內(nèi)容在增長(zhǎng)和擴(kuò)散的過程中會(huì)形成多個(gè)相關(guān)話題,因此發(fā)現(xiàn)話題之間潛在的關(guān)聯(lián)關(guān)系,進(jìn)而跟蹤熱點(diǎn)事件的演化趨勢(shì)和傳播路徑,從而把握熱點(diǎn)事件發(fā)展的來(lái)龍去脈和重要傳播節(jié)點(diǎn),對(duì)政府有關(guān)部門監(jiān)控和引導(dǎo)正向輿論具有十分重要的現(xiàn)實(shí)意義。

      大數(shù)據(jù)環(huán)境下的熱點(diǎn)跟蹤主要結(jié)合數(shù)據(jù)挖掘知識(shí),利用大數(shù)據(jù)相關(guān)處理技術(shù)從海量數(shù)據(jù)中提取有用的信息用于決策支持。其中,熱點(diǎn)評(píng)估與跟蹤[2]是根據(jù)熱點(diǎn)事件中公眾的情感和行為反應(yīng)對(duì)輿情進(jìn)行等級(jí)評(píng)估。熱點(diǎn)檢測(cè)與跟蹤[3-4]是將話題轉(zhuǎn)化成中心向量模型,然后對(duì)中心向量計(jì)算相似度,進(jìn)而實(shí)現(xiàn)輿情信息的分類,從而區(qū)分新話題與原來(lái)出現(xiàn)過的話題,達(dá)到熱點(diǎn)跟蹤的目的。

      基于社會(huì)化媒體的輿情傳播不同于傳統(tǒng)的信息傳播,其特點(diǎn)是在較短時(shí)間內(nèi)節(jié)點(diǎn)間的連接呈指數(shù)級(jí)增長(zhǎng),而新連接的產(chǎn)生與節(jié)點(diǎn)之間的相似性密切相關(guān)[5]。然而現(xiàn)有方法多數(shù)通過語(yǔ)義距離或語(yǔ)義相似度分析話題之間的相似性與差異性,來(lái)挖掘關(guān)鍵詞之間的潛在關(guān)聯(lián)關(guān)系。

      針對(duì)上述問題,本文提出一種基于關(guān)聯(lián)規(guī)則的熱點(diǎn)事件時(shí)序分析方法。通過引入時(shí)間片,將關(guān)聯(lián)規(guī)則算法并行實(shí)現(xiàn)并借助關(guān)鍵詞的時(shí)序信息直接獲取大規(guī)模頻繁關(guān)鍵詞集,在此基礎(chǔ)上獲取關(guān)聯(lián)規(guī)則集,進(jìn)而篩選和組合得到多個(gè)話題關(guān)鍵詞集合,從而跟蹤熱點(diǎn)事件的演化和傳播路徑。該方法不僅能夠發(fā)現(xiàn)關(guān)鍵詞之間隱藏的關(guān)聯(lián)關(guān)系,還能夠提升頻繁關(guān)鍵詞集的挖掘速度。

      1 相關(guān)工作

      熱點(diǎn)跟蹤方法主要是借鑒數(shù)據(jù)挖掘中的一些文本分類算法[6-8],如K-最近鄰(K-Nearest Neighbor,KNN)算法、樸素貝葉斯(Naive Bayes Classifier,NBC)算法、支持向量機(jī)(Support Vector Machine,SVM)等。但是該類方法只能區(qū)分多個(gè)話題,不能將話題合理有序地組織起來(lái),直觀清晰地跟蹤熱點(diǎn)事件的演化。另一類結(jié)合時(shí)序信息實(shí)時(shí)跟蹤熱點(diǎn)事件演化傳播的方法日益增多。比如:楚克明等[9]通過自動(dòng)抽取不同時(shí)間段的話題,計(jì)算相鄰時(shí)間段中任意2個(gè)話題的分布距離和話題的特征向量相似度跟蹤熱點(diǎn)事件的演化。崔凱等[10]利用Kullback Leibler(KL)相對(duì)熵來(lái)衡量話題之間的相似度,從而根據(jù)話題之間的相似性與差異性跟蹤熱點(diǎn)事件的演化。Alsumait等[11]提出的在線LDA(OLDA)模型先根據(jù)時(shí)間信息將文本集劃分到不同的時(shí)間片,之后使用LDA模型對(duì)每個(gè)時(shí)間片的文本集進(jìn)行建模,并且采用話題的歷史分布作為當(dāng)前時(shí)間片話題發(fā)現(xiàn)的先驗(yàn)知識(shí),進(jìn)而研究熱點(diǎn)內(nèi)容和強(qiáng)度的演化。

      熱點(diǎn)事件在社會(huì)化媒體中的傳播路徑包括以下4大類型[12-13]:

      1)線性傳播的萌芽期。該時(shí)期信息流動(dòng)直線且單一,信息的傳遞僅僅是知識(shí)獲取或行為認(rèn)知,通常只存在于特殊的用戶之中,所以該階段是最易有效引導(dǎo)和控制輿情方向的時(shí)期。

      2)裂變式傳播的醞釀期。該時(shí)期主要基于用戶的多級(jí)轉(zhuǎn)發(fā)行為,通過轉(zhuǎn)發(fā)、評(píng)論、點(diǎn)贊等方式加速信息的傳播速度,擴(kuò)大信息的受眾范圍,增大信息的影響力,所以該階段對(duì)政府維護(hù)社會(huì)安全穩(wěn)定、安撫用戶情緒是一個(gè)巨大的挑戰(zhàn)。

      3)交互性信息傳播的發(fā)酵期。該時(shí)期用戶將信息收集后整理、組織、加工,再次傳遞給其他用戶,從而在事件的多角度演化后進(jìn)入高潮期。

      4)高度融合傳播的爆發(fā)期。該時(shí)期最大化融合上述3種信息傳播模式,用戶既是信息接收者,又是信息發(fā)送者,從而形成事件傳播的網(wǎng)絡(luò)。

      總之,跟蹤話題的演化和傳播路徑是深度分析熱點(diǎn)事件的2個(gè)重要研究路線。本文對(duì)此進(jìn)行重點(diǎn)討論。

      2 基本定義

      定義1關(guān)聯(lián)規(guī)則a?b的支持度sup (a?b)是指數(shù)據(jù)集中出現(xiàn)關(guān)鍵詞集{a,b}的數(shù)據(jù)記錄占所有數(shù)據(jù)記錄的百分比。其中,num(a∪b)表示關(guān)鍵詞集{a,b}在數(shù)據(jù)集中出現(xiàn)的次數(shù);num(I)表示數(shù)據(jù)集的所有數(shù)據(jù)記錄的個(gè)數(shù)。

      sup (a?b)=num(a∪b)/num(I)

      (1)

      定義2置信度conf(a?b)是指數(shù)據(jù)集中出現(xiàn)關(guān)鍵詞集{a,b}的數(shù)據(jù)記錄與出現(xiàn)關(guān)鍵詞集{a}的數(shù)據(jù)記錄之比。

      conf(a?b)=num(a∪b)/num(a)

      (2)

      定義3由k個(gè)滿足支持度閾值的關(guān)鍵詞組成的集合為k_項(xiàng)頻繁關(guān)鍵詞集。若wx表示第x個(gè)關(guān)鍵詞,則k_項(xiàng)頻繁關(guān)鍵詞集為lk={w1,w2,…,wx,…,wk}。若lk[i]表示第i個(gè)k_項(xiàng)頻繁關(guān)鍵詞集,則k_項(xiàng)頻繁關(guān)鍵詞集組成的集合Lk={lk[1],lk[2],…,lk[i],…,lk[t]},t為k_項(xiàng)頻繁關(guān)鍵詞集的個(gè)數(shù)。

      3 時(shí)序分析方法

      通過引入時(shí)間片和關(guān)聯(lián)規(guī)則集的概念,將關(guān)聯(lián)規(guī)則算法并行實(shí)現(xiàn)獲取關(guān)聯(lián)規(guī)則,用于形成時(shí)序分析方法所需的關(guān)聯(lián)規(guī)則集,從而按時(shí)間順序組合所有關(guān)聯(lián)規(guī)則集得到多個(gè)話題關(guān)鍵詞集合,對(duì)熱點(diǎn)事件的演化過程和傳播路徑進(jìn)行跟蹤。

      3.1 關(guān)聯(lián)規(guī)則集獲取算法

      3.1.1 1_項(xiàng)頻繁關(guān)鍵詞集獲取

      TOP關(guān)鍵詞能夠表示熱點(diǎn)事件的絕大多數(shù)重要信息,則獲取1_項(xiàng)頻繁關(guān)鍵詞集包括以下2個(gè)步驟:

      1)根據(jù)社交網(wǎng)絡(luò)頁(yè)面獲取的數(shù)據(jù)集,計(jì)算不同時(shí)間片每個(gè)TOP關(guān)鍵詞的支持度sup _top[i]。若num(top[i])表示第i個(gè)TOP關(guān)鍵詞出現(xiàn)的次數(shù),由式(1)可知:

      sup _top[i]=num(top[i])/num(I)

      (3)

      2)根據(jù)支持度閾值sup _min 獲取1_項(xiàng)頻繁關(guān)鍵詞集。若sup _min ≤sup _top[i],則將sup _top[i]對(duì)應(yīng)的TOP關(guān)鍵詞保留,記為l1[j],反之舍棄。由此可得L1={l1[1],l1[2],…,l1[j],…,l1[t]},j≤i。

      3.1.2 k_項(xiàng)頻繁關(guān)鍵詞集獲取

      并行是將獲取頻繁關(guān)鍵詞集的一個(gè)計(jì)算任務(wù)分解成N個(gè)獨(dú)立的子任務(wù),每個(gè)子任務(wù)完成整個(gè)任務(wù)的1/N。獲取k_項(xiàng)頻繁關(guān)鍵詞集包括以下5個(gè)步驟:

      1)將Lk-1進(jìn)行數(shù)據(jù)分割和任務(wù)分配,將一個(gè)或者m個(gè)k-1_項(xiàng)頻繁關(guān)鍵詞集分配給一個(gè)子任務(wù),m的值由k-1_項(xiàng)頻繁關(guān)鍵詞集的數(shù)目確定。其中,N個(gè)子任務(wù)分配的k-1_項(xiàng)頻繁關(guān)鍵詞集互不重復(fù)。

      2)將每個(gè)子任務(wù)的k-1_項(xiàng)頻繁關(guān)鍵詞集和所有1_項(xiàng)頻繁關(guān)鍵詞集逐一合并,得到k_項(xiàng)關(guān)鍵詞集。

      3)掃描相應(yīng)時(shí)間片的數(shù)據(jù)集,計(jì)算每個(gè)k_項(xiàng)關(guān)鍵詞集的支持度sup _k_keywords[i]。若num(k_keywords[i])表示第i個(gè)k_項(xiàng)關(guān)鍵詞集出現(xiàn)的次數(shù),由式(1)可知:

      sup _k_keywords[i]=num(k_keywords[i])/num(I)

      (4)

      4)根據(jù)支持度閾值sup _min 獲取k_項(xiàng)頻繁關(guān)鍵詞集。若sup _min ≤sup _k_keywords[i],則將sup _k_keywords[i]對(duì)應(yīng)的k_項(xiàng)關(guān)鍵詞保留,記為lk[j],反之舍棄。由此在每個(gè)子任務(wù)上分別生成Lk={lk[1],lk[2],…,lk[j],…,lk[t]},j≤i。

      5)將N個(gè)子任務(wù)的所有k_項(xiàng)頻繁關(guān)鍵詞集合并后約簡(jiǎn)得到全局Lk。

      3.1.3 形成關(guān)聯(lián)規(guī)則集

      關(guān)聯(lián)規(guī)則集是由所有k_項(xiàng)頻繁關(guān)鍵詞集的滿足置信度閾值的關(guān)聯(lián)規(guī)則組成的集合。其形成包括以下4個(gè)步驟:

      1)獲取全局Lk中所有k_項(xiàng)頻繁關(guān)鍵詞集的關(guān)聯(lián)規(guī)則。由于lk[i]表示第i個(gè)k_項(xiàng)頻繁關(guān)鍵詞集,本文定義lk[i[s]]表示由lk[i]中s個(gè)關(guān)鍵詞組成的關(guān)鍵詞集,lk[i[k-s]]表示去掉lk[i]中s個(gè)關(guān)鍵詞后剩余的關(guān)鍵詞組成的關(guān)鍵詞集。則任何k_項(xiàng)頻繁關(guān)鍵詞集都可以產(chǎn)生多個(gè)關(guān)聯(lián)規(guī)則lk[i[s]]?lk[i[k-s]],其中1≤s≤k。

      2)計(jì)算每個(gè)關(guān)聯(lián)規(guī)則的置信度conf(lk[i[s]]?lk[i[k-s]])。若num(lk[i])表示lk[i]在數(shù)據(jù)集中的出現(xiàn)次數(shù),num(lk[i[s]])表示lk[i[s]]在數(shù)據(jù)集中的出現(xiàn)次數(shù)。由式(2)可知:

      (5)

      3)根據(jù)置信度閾值conf_min 篩選關(guān)聯(lián)規(guī)則。若conf_min ≤conf(lk[i[s]]?lk[i[k-s]]),則將對(duì)應(yīng)的關(guān)聯(lián)規(guī)則lk[i[s]]?lk[i[k-s]]保留,反之舍棄。

      4)將篩選后的所有關(guān)聯(lián)規(guī)則合并后約簡(jiǎn),形成關(guān)聯(lián)規(guī)則集。

      3.2 基于關(guān)聯(lián)規(guī)則的時(shí)序分析算法

      算法1基于關(guān)聯(lián)規(guī)則的時(shí)序分析算法

      輸入:獲取的社交網(wǎng)絡(luò)頁(yè)面的所有數(shù)據(jù)

      輸出:多個(gè)話題關(guān)鍵詞集合

      1)按照數(shù)據(jù)的時(shí)間序列,分割得到每個(gè)時(shí)間片對(duì)應(yīng)的數(shù)據(jù)集。

      2)掃描相應(yīng)時(shí)間片的數(shù)據(jù)集,得到滿足sup _min 的L1,此時(shí)k=1。

      3)令k=k+1,將所有k-1_項(xiàng)頻繁關(guān)鍵詞集進(jìn)行任務(wù)分割,在每個(gè)子任務(wù)上獨(dú)立得到滿足sup _min 的k_項(xiàng)頻繁關(guān)鍵詞集。

      4)將所有子任務(wù)的k_項(xiàng)頻繁關(guān)鍵詞集結(jié)果合并后刪除重復(fù)項(xiàng),得到全局Lk。

      5)重復(fù)步驟3和步驟4,直到得到的k+1_項(xiàng)頻繁關(guān)鍵詞集為空,將存在頻繁關(guān)鍵詞集的最大項(xiàng)數(shù)記為n。

      6)對(duì)k_項(xiàng)頻繁關(guān)鍵詞集(2≤k≤n)的所有滿足conf_min 的關(guān)聯(lián)規(guī)則合并后約簡(jiǎn)形成關(guān)聯(lián)規(guī)則集。

      7)按照時(shí)間序列將每個(gè)時(shí)間片的關(guān)聯(lián)規(guī)則集篩選和組合得到多個(gè)話題關(guān)鍵詞集合。

      4 實(shí) 驗(yàn)

      4.1 實(shí)驗(yàn)數(shù)據(jù)

      通過網(wǎng)絡(luò)爬蟲工具,使用20種關(guān)鍵詞組合,如:“中國(guó) 印度 對(duì)峙”“中國(guó) 印度 邊界”“印度 洞朗,對(duì)峙”等,集中收集2017-06-26~2017-08-28微信公眾號(hào)中關(guān)于“中印洞朗對(duì)峙事件”的新聞報(bào)道,每天報(bào)道個(gè)數(shù)約為300篇。

      根據(jù)新聞報(bào)道的篇幅長(zhǎng)度利用Ansj技術(shù)對(duì)每篇報(bào)道提取適當(dāng)個(gè)數(shù)互不重復(fù)的關(guān)鍵詞作為本文的實(shí)驗(yàn)數(shù)據(jù)集。

      4.2 實(shí)驗(yàn)環(huán)境和工具

      通過結(jié)合requests和etree庫(kù),根據(jù)頁(yè)面文本的URL,利用Python語(yǔ)言編寫爬蟲工具進(jìn)行數(shù)據(jù)采集,并將采集后的數(shù)據(jù)利用改進(jìn)的Ansj算法提取關(guān)鍵詞。

      提取關(guān)鍵詞后的實(shí)驗(yàn)數(shù)據(jù)存儲(chǔ)在文本文件中,每個(gè)文本文件存儲(chǔ)一天的數(shù)據(jù)。算法開始時(shí)需要設(shè)定支持度閾值和置信度閾值。

      多個(gè)線程并行處理,一個(gè)線程處理一個(gè)文本文件。計(jì)算每個(gè)詞的支持度以獲取頻繁關(guān)鍵詞集,計(jì)算關(guān)聯(lián)規(guī)則的置信度獲取關(guān)聯(lián)規(guī)則集。最后合并后篩選所有的關(guān)聯(lián)規(guī)則集獲取話題關(guān)鍵詞集合。

      4.3 閾值設(shè)置的實(shí)驗(yàn)及結(jié)果

      支持度閾值與置信度閾值的設(shè)置方法類似,實(shí)驗(yàn)以2017年6月27日數(shù)據(jù)的支持度閾值設(shè)置為例,不同支持度對(duì)應(yīng)的L1結(jié)果如表1所示。由于多個(gè)相同語(yǔ)義的關(guān)鍵詞導(dǎo)致結(jié)果過于冗長(zhǎng),只保留其中一個(gè)關(guān)鍵詞。如“中國(guó) 中方”只取“中方”。

      表1 不同支持度下的L1結(jié)果

      1)當(dāng)sup=12.6%~12.8%時(shí),L1能夠獲取當(dāng)前時(shí)間片的全部有價(jià)值的關(guān)鍵詞信息。

      2)當(dāng)sup =12.5%時(shí),L1不僅能夠獲取當(dāng)前時(shí)間片的全部有價(jià)值的關(guān)鍵詞信息,還包括“合作 工作 取消 文化 市場(chǎng)”與“中印洞朗對(duì)峙事件”無(wú)關(guān)的關(guān)鍵詞信息。

      3)當(dāng)sup =12.9%時(shí),當(dāng)前時(shí)間片的有價(jià)值的關(guān)鍵詞“和平 越界 國(guó)防部”被篩選掉,事件發(fā)生的重要原因以及國(guó)防部的態(tài)度信息不能體現(xiàn)。

      由上述可知,實(shí)驗(yàn)選取臨界值12.6%作為支持度閾值,且實(shí)驗(yàn)部分的所有支持度閾值和置信度閾值均采用上述方式進(jìn)行選取。

      4.4 事件演化的實(shí)驗(yàn)及分析

      熱點(diǎn)事件在社會(huì)化媒體中的話題演變包括以下3級(jí):

      1)話題傳播初期醞釀階段。由于社會(huì)化媒體是許多個(gè)體因興趣、認(rèn)同、知識(shí)等方面構(gòu)成的社會(huì)網(wǎng)絡(luò)集合。他們之間存在人與人、人與信息、信息與信息3種直接或間接的連接方式。事件在該階段開始萌芽并進(jìn)行醞釀,透過多個(gè)節(jié)點(diǎn)開始裂變傳播。

      2)社會(huì)網(wǎng)絡(luò)的關(guān)鍵傳播節(jié)點(diǎn)。由于社會(huì)化媒體中的傳播者并不具備同等地位,這就因社會(huì)地位、專業(yè)知識(shí)、傳播能力等因素形成少數(shù)關(guān)鍵節(jié)點(diǎn)。他們?cè)趦?nèi)容傳播、話題放大、輿論營(yíng)造、流量導(dǎo)向等方面具有決定作用。事件在該階段發(fā)酵并全面爆發(fā),形成時(shí)下多個(gè)熱點(diǎn)話題。

      3)網(wǎng)絡(luò)媒體傳播的協(xié)同階段。由于社會(huì)網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)的延伸使傳播面更廣,多種傳播形態(tài)相互協(xié)同。再加上話題的側(cè)重點(diǎn)不同,這就使話題向多個(gè)角度、多個(gè)層次進(jìn)行演化傳播,從而形成熱點(diǎn)事件的爆發(fā)階段。

      為了表示事件的演化過程,實(shí)驗(yàn)以1天為一個(gè)時(shí)間片分別獲取關(guān)聯(lián)規(guī)則集,按照時(shí)間序列篩選后,組合所有關(guān)聯(lián)規(guī)則集得到話題的關(guān)鍵詞集合,結(jié)果如表2所示。

      1)6/26-6/28:事件萌芽期。中方外交部披露印方邊防部隊(duì)越過中印錫金段邊界阻撓我方正?;顒?dòng),雙方形成對(duì)峙局面。

      2)6/29-7/2:事件發(fā)酵期。中方解放軍在西藏試驗(yàn),美國(guó)呼吁中印對(duì)話和平解決沖突。

      3)7/3-7/23:事件爆發(fā)期。中方外交部多次聲明,警告印方的邊界活動(dòng)。印方造勢(shì)中方入侵不丹領(lǐng)土。中印對(duì)峙局勢(shì)持續(xù)升溫。出現(xiàn)“增兵 作戰(zhàn) 挑釁 反擊 爆發(fā) 持續(xù)”等關(guān)鍵詞。

      4)7/24-8/11:事件高漲期。中方外交部態(tài)度強(qiáng)硬,發(fā)表文件多次說明印方越界背后的真實(shí)目的。印方表態(tài)隨時(shí)做好作戰(zhàn)準(zhǔn)備。

      5)8/12-8/26:事件高潮期。雙方士兵互擲石塊,印方民眾示威游行,美印雙方聯(lián)合軍演。出現(xiàn)“增兵 升級(jí) 緊張 大規(guī)模 反擊”等關(guān)鍵詞。

      6)8/27-8/28:事件衰退期。印度最終撤軍,中印洞朗對(duì)峙事件和平解決。

      表2 話題的關(guān)鍵詞集合的結(jié)果

      結(jié)合中印洞朗對(duì)峙事件,話題演化和發(fā)展趨勢(shì)如圖1所示。

      圖1 話題演化和發(fā)展趨勢(shì)圖

      4.5 事件中話題傳播路徑的實(shí)驗(yàn)及分析

      實(shí)驗(yàn)按照時(shí)間發(fā)展順序,以14個(gè)熱點(diǎn)話題為代表對(duì)事件的傳播路徑進(jìn)行跟蹤。每個(gè)話題的具體內(nèi)容如表3所示。事件的傳播路徑如圖2所示。每個(gè)話題與公眾號(hào)節(jié)點(diǎn)的傳播關(guān)系如圖3所示。

      圖2 事件的傳播路徑

      圖3 話題與公眾號(hào)節(jié)點(diǎn)傳播關(guān)系

      表3 熱點(diǎn)話題的具體內(nèi)容

      1)結(jié)合表3和圖2可知,事件發(fā)生初期的話題數(shù)量較少,但隨著事件的發(fā)展,話題數(shù)量成倍增長(zhǎng),話題內(nèi)容角度增多。

      2)結(jié)合表3和圖2可知,話題3是事件爆發(fā)前期出現(xiàn),由各公眾號(hào)陸續(xù)發(fā)布,持續(xù)時(shí)間最長(zhǎng)的話題。形成該傳播趨勢(shì)的主要原因是相對(duì)于其他尖銳話題,該話題初期未被引起。

      3)結(jié)合表3和圖2可知,話題8是整個(gè)事件發(fā)展的制高點(diǎn)。形成該傳播趨勢(shì)的主要原因與中方多次強(qiáng)硬表態(tài)導(dǎo)致對(duì)峙局面瀕臨失衡,引發(fā)國(guó)民高度關(guān)注有密切關(guān)聯(lián)關(guān)系,符合事件高漲期的傳播趨勢(shì)。

      4)從圖3可知,事件發(fā)生初期的傳播節(jié)點(diǎn)多數(shù)集中在軍政和新聞網(wǎng)站類的公眾號(hào);隨著事件的發(fā)展,話題傳播節(jié)點(diǎn)逐漸涉及生活和社會(huì)類的公眾號(hào)。此時(shí)的軍政類公眾號(hào)作為話題傳播的關(guān)鍵節(jié)點(diǎn)貫穿始終,如:全球軍事網(wǎng)、環(huán)球軍政秘聞、軍政熱點(diǎn)等。

      5)結(jié)合表3和圖3可知,由于話題角度的不同,不同類型的公眾號(hào)關(guān)注的側(cè)重點(diǎn)也不同。例如:話題5是關(guān)于真相分析的話題,其涉及的公眾號(hào)大多是揭秘分析類。

      4.6 對(duì)比實(shí)驗(yàn)及分析

      實(shí)驗(yàn)選取文獻(xiàn)[11]的OLDA算法做對(duì)比。實(shí)驗(yàn)結(jié)果如表4所示。

      表4 各時(shí)間片OLDA算法的結(jié)果

      比較表2和表4可以看出,2種方法得到的話題關(guān)鍵詞集合基本一致,但本文提出的方法獲得的話題關(guān)鍵詞集合更豐富,內(nèi)容更具體。如:7/3-7/23階段“挑釁 持續(xù) 爆發(fā) 阻止 活動(dòng) 作戰(zhàn)”等關(guān)鍵詞,7/24-8/11階段“背后 真相 驅(qū)逐 長(zhǎng)期 騷亂 挑釁”等關(guān)鍵詞,8/12-8/26階段“示威 游行 升級(jí) 矛盾 戰(zhàn)機(jī) 海軍 大規(guī)模 作戰(zhàn) 聯(lián)合 軍演 反擊 博弈”等關(guān)鍵詞。由此可知,本文方法能夠更全面完整地挖掘出與事件發(fā)展相關(guān)的關(guān)鍵詞,以及發(fā)現(xiàn)更多與事件相關(guān)的細(xì)節(jié),從而更準(zhǔn)確有效地跟蹤熱點(diǎn)事件多個(gè)話題的動(dòng)態(tài)演化趨勢(shì)。

      5 結(jié)束語(yǔ)

      本文結(jié)合時(shí)序信息應(yīng)用關(guān)聯(lián)規(guī)則算法得到熱點(diǎn)事件的多個(gè)話題的關(guān)鍵詞集合,從而跟蹤熱點(diǎn)事件的演化和傳播路徑,通過實(shí)驗(yàn)與其他方法的比較,表明了該方法在時(shí)序分析方面的有效性。

      本文從內(nèi)容和強(qiáng)度上分析熱點(diǎn)事件的演化和傳播路徑,未來(lái)研究工作將考慮民眾的情感傾向?qū)κ录l(fā)展的影響,增強(qiáng)對(duì)事件的情感分析。

      猜你喜歡
      熱點(diǎn)關(guān)聯(lián)閾值
      熱點(diǎn)
      小波閾值去噪在深小孔鉆削聲發(fā)射信號(hào)處理中的應(yīng)用
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      熱點(diǎn)
      車迷(2019年10期)2019-06-24 05:43:28
      基于自適應(yīng)閾值和連通域的隧道裂縫提取
      結(jié)合熱點(diǎn)做演講
      奇趣搭配
      比值遙感蝕變信息提取及閾值確定(插圖)
      河北遙感(2017年2期)2017-08-07 14:49:00
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      室內(nèi)表面平均氡析出率閾值探討
      南安市| 石楼县| 黄石市| 陇西县| 长泰县| 穆棱市| 蓬莱市| 甘孜县| 拜泉县| 碌曲县| 化隆| 黎川县| 万山特区| 项城市| 漳平市| 鸡东县| 凯里市| 奎屯市| 调兵山市| 南开区| 乐陵市| 克拉玛依市| 永仁县| 固安县| 漳平市| 红河县| 灌云县| 惠东县| 浦北县| 宜阳县| 定日县| 泊头市| 东山县| 浦城县| 仁寿县| 东乌珠穆沁旗| 富平县| 吴川市| 泊头市| 延川县| 兰溪市|