• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于復(fù)雜網(wǎng)絡(luò)可視化模型的專題新聞演化研究

      2012-04-29 05:59:59劉曉佳
      中國管理信息化 2012年24期
      關(guān)鍵詞:信息可視化演化

      劉曉佳

      [摘要] 本文是基于復(fù)雜網(wǎng)絡(luò)的思想,根據(jù)card(1999)提出的信息可視化參考模型構(gòu)建的專題新聞文本集信息可視化的概念模型和形式化模型,以溫州動(dòng)車事故專題新聞文本集為例,對(duì)專題新聞按照時(shí)間段分為三個(gè)時(shí)期,并對(duì)不同時(shí)期進(jìn)行信息可視化分析,分析總結(jié)新聞演化過程。分析得出,隨著時(shí)間的變化,新聞集中的關(guān)注點(diǎn)發(fā)生變化,而且關(guān)注點(diǎn)會(huì)逐漸變得分散,新聞的關(guān)注度也逐漸減少。

      [關(guān)鍵詞] 專題新聞; 信息可視化; 演化

      doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 24. 047

      [中圖分類號(hào)]G203[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673 - 0194(2012)24- 0077- 02

      1引言

      隨著計(jì)算機(jī)網(wǎng)絡(luò)的出現(xiàn),信息技術(shù)迅速發(fā)展,人類進(jìn)入了信息爆炸的時(shí)代。信息爆炸的一個(gè)重要表現(xiàn)就是新聞信息飛速增加。新聞傳播的更新速度和傳播效率不斷加快,這種加快導(dǎo)致新聞數(shù)量不斷增大,各種信息非常分散。為了能快捷地了解新聞的演化過程,直觀地觀察信息之間的復(fù)雜關(guān)系,需要一門結(jié)合科學(xué)可視化、數(shù)據(jù)挖掘、圖像技術(shù)、圖形學(xué)、人機(jī)交互和認(rèn)知科學(xué)等諸多學(xué)科理論或方法的新學(xué)科,這就是20世紀(jì)80年代末誕生的可視化技術(shù)。

      復(fù)雜網(wǎng)絡(luò)的主要思想是將真實(shí)系統(tǒng)中各部分之間的聯(lián)系看作一個(gè)復(fù)雜網(wǎng)絡(luò),以網(wǎng)絡(luò)的形式來抽象地描述真實(shí)系統(tǒng)中各部分之間的關(guān)系,強(qiáng)調(diào)系統(tǒng)結(jié)構(gòu)的拓?fù)涮卣?,從而使人們更好地了解現(xiàn)實(shí)世界系統(tǒng)的本質(zhì)特征。一個(gè)典型的網(wǎng)絡(luò)是由許多節(jié)點(diǎn)與連接節(jié)點(diǎn)之間的邊組成的。節(jié)點(diǎn)代表系統(tǒng)中的實(shí)體,邊則表示節(jié)點(diǎn)之間的作用關(guān)系。

      2復(fù)雜網(wǎng)絡(luò)可視化模型

      2.1信息實(shí)體的提取

      本文采用人工方式選擇及提取新聞文本信息實(shí)體,按照專題新聞文本信息實(shí)體的定義和選擇新聞文本信息實(shí)體的原則與方法可以將專題新聞文本中不同要素的信息實(shí)體按不同粒度提取出來,形成信息實(shí)體庫。新聞文本信息實(shí)體之間的存在的各種關(guān)系,即信息實(shí)體之間形成的有意義的系統(tǒng)的聯(lián)系,即為信息實(shí)體之間的聯(lián)系。本文中兩個(gè)信息實(shí)體出現(xiàn)在相同新聞文本中的新聞文本數(shù)量即為這兩個(gè)信息實(shí)體之間的關(guān)聯(lián)權(quán)重。

      2.2模型構(gòu)建

      可視化模型包含3個(gè)要素:信息實(shí)體、信息實(shí)體關(guān)聯(lián)和信息實(shí)體網(wǎng)絡(luò)。新聞文本信息實(shí)體的實(shí)質(zhì)就是能代表新聞文本內(nèi)容的基本信息單位。新聞文本信息實(shí)體關(guān)聯(lián)也就是新聞文本信息實(shí)體之間形成的有意義的系統(tǒng)的聯(lián)系。信息實(shí)體網(wǎng)絡(luò)是由用戶信息需求、信息實(shí)體和信息實(shí)體關(guān)聯(lián)構(gòu)成的。

      通過數(shù)據(jù)變換從專題新聞文本集中提取信息實(shí)體,經(jīng)過可視化映射過程,信息實(shí)體及信息實(shí)體關(guān)聯(lián)轉(zhuǎn)換為可視化的結(jié)構(gòu)。最后進(jìn)行視圖變換利用可視化顯示技術(shù)將所得的信息實(shí)體網(wǎng)絡(luò)用直觀的、易于理解的圖形方式顯示出來。

      2.3復(fù)雜網(wǎng)絡(luò)可視化模型的分析

      網(wǎng)絡(luò)度是描述網(wǎng)絡(luò)中某一節(jié)點(diǎn)連接其他節(jié)點(diǎn)程度的概念,定義文本網(wǎng)絡(luò)中的度是與某個(gè)節(jié)點(diǎn)有聯(lián)系的節(jié)點(diǎn)的總數(shù),通過可視化結(jié)果分析,度大的節(jié)點(diǎn)出現(xiàn)在句子中的次數(shù)越多,則該詞的重要程度越高,是文中的關(guān)鍵實(shí)體。

      最短路徑是用來測量網(wǎng)絡(luò)結(jié)構(gòu)中距離最好的方法,路徑是由從一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)的不重復(fù)邊構(gòu)成,與網(wǎng)絡(luò)度和網(wǎng)絡(luò)節(jié)點(diǎn)強(qiáng)度不同的是,它不僅考慮了節(jié)點(diǎn)的近鄰節(jié)點(diǎn),還考慮了間接節(jié)點(diǎn)。最短路徑是衡量實(shí)體連通性好壞的標(biāo)準(zhǔn),最短路徑越短,實(shí)體節(jié)點(diǎn)在文章中起到的作用越重要。

      聚類系數(shù)反映網(wǎng)絡(luò)的緊密程度,整個(gè)網(wǎng)絡(luò)的聚類系數(shù)是所有節(jié)點(diǎn)的聚類系數(shù)的平均值,聚類系數(shù)則反映文章內(nèi)容的緊密程度。這項(xiàng)特征值的分析主要是對(duì)文本的內(nèi)容進(jìn)行評(píng)價(jià),聚類系數(shù)越大,文本復(fù)雜網(wǎng)絡(luò)的緊密程度越好,也就是文本內(nèi)容在表述上更緊密與緊湊。

      3實(shí)證分析

      本次收集的新聞文本報(bào)道時(shí)間從2011年7月23日20:34分至2012年4月13日8:05。本文利用谷歌快訊推送含有“溫州”、“動(dòng)車”關(guān)鍵詞的新聞,共搜集到新聞總量為892條。由于樣本量太大,進(jìn)行了抽取。依照不同新聞時(shí)間抽取不同數(shù)量的新聞文本。本次抽取新聞共100條。

      3.1總體網(wǎng)絡(luò)分析

      利用UCINET將動(dòng)車事故新聞文本集信息實(shí)體網(wǎng)絡(luò)的關(guān)聯(lián)矩陣轉(zhuǎn)化為直觀的信息實(shí)體網(wǎng)絡(luò)圖,如圖1所示。災(zāi)后重建新聞文本集信息實(shí)體網(wǎng)絡(luò)圖直觀地展示了所收集的100個(gè)災(zāi)后重建新聞文本中的主要信息。

      在全局網(wǎng)中,度數(shù)排名前五的非時(shí)間關(guān)鍵詞為:“溫州”、“北京”、“國務(wù)院”、“溫家寶”、“召開記者會(huì)”。

      在全局網(wǎng)中,平均最短路徑為1.019。表明全局網(wǎng)各節(jié)點(diǎn)之間的連貫性和凝聚力較好。

      在全局網(wǎng)中,基于距離的聚類系數(shù)為0.990。聚類系數(shù)非常大,證明復(fù)雜網(wǎng)絡(luò)的緊密程度較好。

      3.2演化分析

      按照溫州動(dòng)車事故新聞文本數(shù)量的變化,把此事件分為3個(gè)部分,如圖2所示,可是分為爆發(fā)期、轉(zhuǎn)折期與平穩(wěn)期3個(gè)階段。

      第一階段新聞爆發(fā)時(shí)期,從2011年7月23日開始到7月28日,共抽取76條新聞,87個(gè)信息實(shí)體。爆發(fā)期網(wǎng)絡(luò)中,度數(shù)排名前五的非時(shí)間節(jié)點(diǎn)為“溫州”、“溫家寶”、“召開記者會(huì)”、“動(dòng)車”、“北京”。此網(wǎng)絡(luò)的平均最短路徑為1.033,基于距離的聚類系數(shù)為0.983。表明此網(wǎng)絡(luò)的連貫性和凝聚力較好,緊密程度較好。

      第二階段新聞轉(zhuǎn)折時(shí)期,從2011年7月29日開始到7月31日,共抽取11條新聞,22個(gè)信息實(shí)體。轉(zhuǎn)折期網(wǎng)絡(luò)中,度數(shù)排名前五的非時(shí)間節(jié)點(diǎn)為“溫州”、“北京”、“簽訂賠償協(xié)議”、“家屬”、“國務(wù)院”。此網(wǎng)絡(luò)的平均路徑為1.905,較爆發(fā)期網(wǎng)絡(luò)有所增長,表明網(wǎng)絡(luò)的連通性和凝聚力變?nèi)酢;诰嚯x的聚類系數(shù)為0.591,較網(wǎng)絡(luò)一減少,表明網(wǎng)絡(luò)變得比較分散。

      第三階段新聞平穩(wěn)期,從2011年8月1日開始到2012年4月13日,共抽取13條新聞,33個(gè)信息實(shí)體。平穩(wěn)期網(wǎng)絡(luò)中,度數(shù)排名前五的非時(shí)間節(jié)點(diǎn)為“北京”、“國務(wù)院”、“事故處理”、“安監(jiān)局”、“調(diào)查結(jié)束”。平穩(wěn)期網(wǎng)絡(luò)的平均最短路徑為2.313,基于距離的聚類系數(shù)為0.504。

      3.3結(jié)果與討論

      通過對(duì)新聞事件按時(shí)間分成不同時(shí)期,對(duì)不同時(shí)期的信息實(shí)體建立可視化模型,對(duì)不同時(shí)期的網(wǎng)絡(luò)圖進(jìn)行對(duì)比研究,可以從網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、節(jié)點(diǎn)的度、平均最短路徑以及基于距離的聚類系數(shù)方面分析出新聞演化的過程。

      專題新聞不同時(shí)期的關(guān)注點(diǎn)不同。通過對(duì)溫州動(dòng)車事故的實(shí)證研究可以看出,不同時(shí)期的節(jié)點(diǎn)度數(shù)排名有很大不同。爆發(fā)期關(guān)注點(diǎn)集中在“溫州”,即事件的發(fā)生地。平穩(wěn)期關(guān)注點(diǎn)集中在“北京”,即事件的處理中心。

      專題新聞不同時(shí)期的關(guān)注度不同。通過對(duì)溫州動(dòng)車事故的實(shí)證研究可以看出,不同時(shí)期的網(wǎng)絡(luò)平均最短路徑與聚類系數(shù)不同,由爆發(fā)期到轉(zhuǎn)折期再到平穩(wěn)期,網(wǎng)絡(luò)的平均最短路徑不斷增大,基于距離的聚類系數(shù)不斷減小。意味著網(wǎng)絡(luò)的凝聚性越來越小,網(wǎng)絡(luò)逐漸變得分散。這一方面是由于新聞的關(guān)注點(diǎn)逐漸變得分散,另一方面是由于新聞的數(shù)量逐漸變少,表明新聞的關(guān)注度逐漸變少。

      4結(jié)語

      新聞是人們獲取各種各樣信息的主要方式,也是最容易獲得的公共信息。通過信息可視化構(gòu)建專題新聞演化的信息實(shí)體網(wǎng)絡(luò),展示新聞演化過程,不僅能節(jié)省人們的大量的閱讀時(shí)間而且能提高人們的信息獲取能力,發(fā)現(xiàn)隱藏在新聞中的潛藏信息,有利于為管理決策提供依據(jù)。本文從網(wǎng)絡(luò)構(gòu)建的角度出發(fā),構(gòu)建了專題新聞演化信息可視化模型,并對(duì)溫州動(dòng)車事故專題新聞文本集進(jìn)行了實(shí)證研究,利用復(fù)雜網(wǎng)絡(luò)展示專題新聞演化過程。

      但是仍然存在以下不足需要進(jìn)一步研究:

      (1) 信息實(shí)體的選取方法。本文主要根據(jù)新聞要素說提出從時(shí)間、地點(diǎn)、主體、事件4個(gè)方面提取信息實(shí)體以代表專題新聞文本中的主要信息。但是這4個(gè)方面只是代表了新聞文本中的主要信息,而新聞文本中的其他信息則丟失了,無法在專題新聞文本集可視化視圖中展示出來。因此需要進(jìn)一步研究如何選擇信息實(shí)體以代表專題新聞文本集中的全部信息,減少信息的丟失。

      (2) 信息實(shí)體的提取方法。本文采取的手工提取信息實(shí)體的方法,由于不同信息處理者對(duì)信息的獲取、處理的能力不同,或者由于新聞文本寫作的不規(guī)范導(dǎo)致新聞要素的缺失,會(huì)造成對(duì)于同一篇新聞文本不同信息處理者提取的信息實(shí)體不同的結(jié)果,特別是對(duì)于語義描述性信息實(shí)體(事件)的影響更大。所以需要進(jìn)一步探討如何客觀地提取信息實(shí)體,使信息實(shí)體的提取結(jié)果更能準(zhǔn)確地表示新聞文本集中的信息。

      (3) 深入分析新聞演化可視化結(jié)果。本文只是對(duì)演化的結(jié)果進(jìn)行了簡單分析,沒有利用網(wǎng)絡(luò)分析方法深入研究所構(gòu)建的不同時(shí)期信息實(shí)體網(wǎng)絡(luò)的特性。有必要對(duì)專題新聞不同時(shí)期信息實(shí)體網(wǎng)絡(luò)的特性進(jìn)行深入研究以期發(fā)現(xiàn)新的不同時(shí)期網(wǎng)絡(luò)特性,進(jìn)一步分析新聞的演化過程。

      主要參考文獻(xiàn)

      [1] S H Strogatz. Exploring Complex Networks [J]. Nature, 2001(410): 268-276.

      [2] 劉紅紅,安海忠,高湘昀. 基于文本復(fù)雜網(wǎng)絡(luò)的內(nèi)容結(jié)構(gòu)特征分析[J]. 現(xiàn)代圖書情報(bào)技術(shù),2011(1):69-73.

      [3] 趙蓉英. 論知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)[J]. 圖書情報(bào)工作,2007,51(9):6-10.

      [4] S P Borgattl,M T Everett,etc. 社會(huì)網(wǎng)絡(luò)分析軟件UCINET[D]. 加州:加州大學(xué),2002.

      猜你喜歡
      信息可視化演化
      計(jì)算機(jī)網(wǎng)絡(luò)安全可視化研究平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)
      論信息可視化設(shè)計(jì)在個(gè)人簡歷中的應(yīng)用
      演化視角下的管理機(jī)制研究
      標(biāo)簽的可視化進(jìn)程初探
      科技傳播(2016年19期)2016-12-27 15:12:42
      《演化》
      淺談自媒體的生存與發(fā)展
      戲劇之家(2016年19期)2016-10-31 19:55:19
      論科技、社會(huì)快速發(fā)展下的“受眾”概念演化
      今傳媒(2016年7期)2016-09-07 23:50:10
      突發(fā)事件網(wǎng)絡(luò)輿情的演化規(guī)律與監(jiān)控
      耗散結(jié)構(gòu)視閾下的科技招商與科技服務(wù)網(wǎng)絡(luò)建設(shè)研究
      新媒體時(shí)代背景下的圖形動(dòng)畫設(shè)計(jì)與制作研究
      戲劇之家(2016年8期)2016-05-23 12:29:03
      中阳县| 宣汉县| 共和县| 柳江县| 鹿邑县| 芦溪县| 开鲁县| 肃宁县| 隆尧县| 白银市| 子长县| 双牌县| 萝北县| 永宁县| 广安市| 阳谷县| 迁安市| 龙川县| 沁源县| 蓬安县| 东至县| 巴青县| 武穴市| 浪卡子县| 邵阳市| 论坛| 彭州市| 新竹县| 青冈县| 凭祥市| 时尚| 吉首市| 武鸣县| 武安市| 宁津县| 鄂尔多斯市| 武陟县| 施甸县| 江川县| 阿坝县| 玛多县|