• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      微博輿情研究中的大數(shù)據(jù)風(fēng)險(xiǎn)與挑戰(zhàn)

      2020-09-10 07:19:30李靜遠(yuǎn)
      新聞研究導(dǎo)刊 2020年7期
      關(guān)鍵詞:風(fēng)險(xiǎn)挑戰(zhàn)大數(shù)據(jù)

      摘 要:互聯(lián)網(wǎng)技術(shù)的發(fā)展使大數(shù)據(jù)在微博輿情中的應(yīng)用越來越廣泛,當(dāng)前微博大數(shù)據(jù)的應(yīng)用集中體現(xiàn)在商業(yè)領(lǐng)域和輿情評(píng)測(cè)兩方面,以輿情評(píng)測(cè)應(yīng)用熱度最甚。因此,其成為了國內(nèi)學(xué)術(shù)界和業(yè)界普遍研究的熱點(diǎn)話題。本文著重從大數(shù)據(jù)應(yīng)用風(fēng)險(xiǎn)和應(yīng)用挑戰(zhàn)兩個(gè)角度分析闡述微博輿情研究,并提出建設(shè)性的意見。

      關(guān)鍵詞:微博輿情;大數(shù)據(jù);風(fēng)險(xiǎn);挑戰(zhàn)

      中圖分類號(hào):G206 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-8883(2020)07-0114-02

      微博大數(shù)據(jù)在展示社交關(guān)系中發(fā)揮著顯著的作用,已成為研究當(dāng)前人們社會(huì)行為的典范。從我國當(dāng)前研究所取得的成果來看,微博輿情研究已經(jīng)不再是單純的監(jiān)測(cè),而是逐步向預(yù)警和預(yù)測(cè)方向發(fā)展,開始涉及多個(gè)領(lǐng)域,可以預(yù)見,未來的微博輿情研究必然是以綜合信息服務(wù)為導(dǎo)向的數(shù)據(jù)鏈。但是,凡事有利必有弊,大數(shù)據(jù)在微博輿情研究中發(fā)揮技術(shù)優(yōu)勢(shì)和數(shù)據(jù)優(yōu)勢(shì)的同時(shí),也逐漸顯露出了一些負(fù)面的風(fēng)險(xiǎn)和挑戰(zhàn),使微博輿情研究開始出現(xiàn)質(zhì)疑和偏見,面對(duì)這突如其來的嚴(yán)峻形勢(shì),進(jìn)一步明確微博輿情研究中的大數(shù)據(jù)風(fēng)險(xiǎn)與挑戰(zhàn)顯得尤為重要。

      一、微博輿情研究中的大數(shù)據(jù)風(fēng)險(xiǎn)分析

      (一)大數(shù)據(jù)增加了“錯(cuò)誤發(fā)現(xiàn)”的風(fēng)險(xiǎn)

      大數(shù)據(jù)信息技術(shù)基于計(jì)算機(jī)網(wǎng)絡(luò),利用自身的數(shù)據(jù)集和細(xì)粒化優(yōu)勢(shì),增加了“錯(cuò)誤發(fā)現(xiàn)”的風(fēng)險(xiǎn)。比如用戶根據(jù)需求搜索一條信息時(shí),檢索窗口會(huì)出現(xiàn)多條與之相關(guān)的信息,在很大程度上會(huì)增加用戶尋求信息的難度,也就是“錯(cuò)誤發(fā)現(xiàn)”。另外,微博輿論中的帖子和用戶評(píng)論也會(huì)不同程度地增加“錯(cuò)誤發(fā)現(xiàn)”風(fēng)險(xiǎn),這是因?yàn)槲⒉┹浾撝懈鞣N帖子和評(píng)論均含有統(tǒng)一信息指標(biāo),當(dāng)這些信息指標(biāo)累積后,就會(huì)無限增加大數(shù)據(jù)信息,給輿情分析帶來更大的不確定性和難度。在對(duì)某一個(gè)社會(huì)熱點(diǎn)進(jìn)行輿情分析時(shí),必然會(huì)使用計(jì)算機(jī)和相關(guān)的數(shù)字模型,但是值得注意的一點(diǎn)是,計(jì)算機(jī)和數(shù)字模型是針對(duì)群體信息進(jìn)行系統(tǒng)分析,并從輿情群體用戶中找到相同點(diǎn)和相關(guān)性,而這種相關(guān)性是總體性分析,這往往使大數(shù)據(jù)下的輿情分析和評(píng)測(cè)失去了真實(shí)性。

      (二)大數(shù)據(jù)影響了輿情分析和預(yù)測(cè)的準(zhǔn)確性

      微博輿情需要借助大數(shù)據(jù)技術(shù)和數(shù)字模型對(duì)大數(shù)據(jù)信息進(jìn)行研究,但是同時(shí)輿情分析和預(yù)測(cè)的準(zhǔn)確性受到了影響。之所以產(chǎn)生這一現(xiàn)象,原因主要是:一方面,微博輿情代表廣泛民意,但卻不代表社會(huì)的全部民意;另一方面,通過微博進(jìn)行輿情分析和預(yù)測(cè),從大數(shù)據(jù)上看存在很多微博用戶,但大數(shù)據(jù)顯示下的微博用戶并不等于現(xiàn)實(shí)中的微博用戶,又或者有的用戶只是通過網(wǎng)頁訪問微博,并沒有微博賬號(hào),也就不存在言論發(fā)表。因此,眾多的因素表明,微博輿情采用大數(shù)據(jù)進(jìn)行分析,所獲得的結(jié)果只是反映了輿情的局部面貌,有很強(qiáng)的片面性。除此之外,微博輿情在進(jìn)行檢索時(shí),也存在大數(shù)據(jù)棄用的現(xiàn)象,大數(shù)據(jù)技術(shù)和數(shù)字模型在分析輿情時(shí)會(huì)首先以文本信息為主,并且會(huì)選擇容易解讀和處理的文本信息,很難對(duì)圖片和影像等資料進(jìn)行系統(tǒng)性的分析,而選擇性棄用的這些圖片和影像往往是輿情的集中體現(xiàn),這使得微博輿情研究所產(chǎn)生的數(shù)據(jù)資料存在誤差,在很大程度上影響了輿情分析和預(yù)測(cè)的準(zhǔn)確性。因此,只有解決微博輿情研究中的選擇性風(fēng)險(xiǎn),才可以確保微博輿情數(shù)據(jù)信息的準(zhǔn)確性。

      (三)大數(shù)據(jù)存在用戶隱私泄露的風(fēng)險(xiǎn)

      隱私泄露風(fēng)險(xiǎn)是大數(shù)據(jù)時(shí)代和互聯(lián)網(wǎng)時(shí)代普遍存在的問題之一,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,這種風(fēng)險(xiǎn)日益增加。微博大數(shù)據(jù)在存儲(chǔ)和管理方面的技術(shù)缺陷經(jīng)常會(huì)導(dǎo)致用戶隱私泄露,而如何進(jìn)一步加強(qiáng)隱私保護(hù)技術(shù),是大數(shù)據(jù)時(shí)代下微博輿情研究重點(diǎn)需要解決的問題之一。一旦技術(shù)方面的缺陷導(dǎo)致微博用戶個(gè)人信息泄露,就會(huì)產(chǎn)生侵犯他人隱私、輿論暴力等違法行為,作為違法行為的典型代表,“人肉搜索”就是個(gè)人信息泄露導(dǎo)致的。從近幾年微博上轟動(dòng)的幾起“人肉搜索”事件可以看出,雖然“人肉搜索”的對(duì)象均存在不同程度的負(fù)面形象,但是當(dāng)事人的隱私在“人肉搜索”下暴露無遺,在一定程度上對(duì)當(dāng)事人造成了傷害,輿論的正義甚至壓過了程序正義,這使得微博輿情變得不合法,應(yīng)該引起社會(huì)的理性認(rèn)識(shí)和警醒。

      (四)大數(shù)據(jù)有壟斷誤導(dǎo)輿情選擇的風(fēng)險(xiǎn)

      微博社交平臺(tái)在大數(shù)據(jù)時(shí)代下發(fā)展速度明顯加快,可以直接體現(xiàn)人們的日常行為,這也為微博輿情研究提供了大數(shù)據(jù)樣本。但是大數(shù)據(jù)可以為社會(huì)大眾謀福利,也可以變成壟斷和誤導(dǎo)人們認(rèn)知的工具,可以說,大數(shù)據(jù)的應(yīng)用會(huì)在很大程度上導(dǎo)致“算法的獨(dú)裁”。在微博輿情研究中,引入大數(shù)據(jù)可以使輿情資料變得更加充實(shí)和豐富,但是其壞處也很明顯,大數(shù)據(jù)壟斷會(huì)使一些信息壟斷者借機(jī)對(duì)輿論帖子進(jìn)行選擇性使用。比如微博某博主因?yàn)槌钟心骋粭l謠言信息,便趁機(jī)在網(wǎng)絡(luò)上發(fā)布,并借助大數(shù)據(jù)技術(shù)引導(dǎo)社會(huì)大眾進(jìn)行輿論傳播,制造假象,并將這些帖子和評(píng)論標(biāo)注為精選,這樣一來,用戶在瀏覽的過程中,就會(huì)出現(xiàn)大量類似的評(píng)論,使其他人誤以為這是一條真實(shí)的信息,然后進(jìn)行傳播,最終某博主從中獲取利益。由此可以看出,大數(shù)據(jù)技術(shù)在為人們帶來生活便利的同時(shí),也帶來了壟斷誤導(dǎo)輿情選擇的風(fēng)險(xiǎn),使互聯(lián)網(wǎng)時(shí)代多了一分“不安定”。[1]

      二、微博輿情研究中的大數(shù)據(jù)挑戰(zhàn)分析

      (一)微博輿情檢索工具缺乏

      從國內(nèi)外的微博輿情收集研究可以看出,當(dāng)前國外出現(xiàn)的Gnip機(jī)構(gòu),著重針對(duì)Twitter進(jìn)行大數(shù)據(jù)收集。分析國外微博輿情的搜索和分析工具可以發(fā)現(xiàn),多數(shù)檢索工具都是由研究者專門設(shè)計(jì)的,這些檢索工具具有很強(qiáng)的針對(duì)性,所采用的技術(shù)也是當(dāng)前較為先進(jìn)的技術(shù)。我國專門針對(duì)微博輿情的研究機(jī)構(gòu)目前還很少,系統(tǒng)工具以Scool和See為主。之所以我國微博輿情研究機(jī)構(gòu)或工具較少,主要是與微博輿情研究人員的專業(yè)性有關(guān),多數(shù)微博輿情研究者或從事媒體工作,或從事文學(xué)、社會(huì)等學(xué)科研究,缺少計(jì)算機(jī)技術(shù)和對(duì)微博輿情工具軟件的認(rèn)知,沒有足夠的能力進(jìn)行設(shè)計(jì)研究,這使微博輿情檢索工具缺乏問題越來越突出,也從側(cè)面表明當(dāng)前我國的微博輿情研究仍存在很大的局限性,制約因素較多,在大數(shù)據(jù)分析和檢索方面還不能真正做到“收放自如”。

      (二)大數(shù)據(jù)存儲(chǔ)面臨技術(shù)攻克挑戰(zhàn)

      存儲(chǔ)和檢索是微博輿情預(yù)測(cè)的重要基礎(chǔ),作為輿論行為的結(jié)構(gòu)化數(shù)據(jù),當(dāng)前的大數(shù)據(jù)存儲(chǔ)系統(tǒng)以半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、二維表等關(guān)系型數(shù)據(jù)等為主。博客帖子以及圖像視頻等均屬于非結(jié)構(gòu)化數(shù)據(jù),而博客的HTML文檔又屬于半結(jié)構(gòu)化數(shù)據(jù)。就當(dāng)前微博輿情存儲(chǔ)和檢索所應(yīng)用的系統(tǒng)來看,主要有No-SQL和Hadoop兩種。No-SQL是一種不同于傳統(tǒng)數(shù)據(jù)庫的系統(tǒng),因?yàn)榫哂袠O快的響應(yīng)速度和強(qiáng)大的后端處理能力,所以主要用來解決大規(guī)模數(shù)據(jù)集帶來的挑戰(zhàn),但是在多列查詢及數(shù)據(jù)統(tǒng)計(jì)分析方面存在很大的局限性。因此,在搜索微博輿情帖子時(shí),常常會(huì)有一種數(shù)據(jù)延遲的感覺。另外,當(dāng)前所應(yīng)用的No-SQL還沒有形成完整的系統(tǒng),在實(shí)際應(yīng)用中缺乏商業(yè)支持,使得大數(shù)據(jù)存儲(chǔ)面臨技術(shù)攻克的挑戰(zhàn)。Hadoop是另外一種大數(shù)據(jù)管理工具,基于MapReduce,可以有效實(shí)現(xiàn)數(shù)據(jù)檢索,國外常用Hadoop進(jìn)行巨量數(shù)據(jù)分析,通過應(yīng)用Hadoop可以將結(jié)構(gòu)化數(shù)據(jù)文件更好地展示出來,并優(yōu)化功能,最終實(shí)現(xiàn)數(shù)據(jù)查詢功能。[2]但是這種大數(shù)據(jù)管理工具在微博輿情研究中的表現(xiàn)卻顯得有點(diǎn)力有不逮,主要表現(xiàn)為Hadoop不能快速加載和查詢數(shù)據(jù),并且操作過程較為煩瑣,搜索效率低下,系統(tǒng)的穩(wěn)定性也需要進(jìn)一步加強(qiáng)。因此,當(dāng)前的微博輿情存儲(chǔ)技術(shù)還有很大的提升空間,這也是微博輿情研究中最為明顯的大數(shù)據(jù)挑戰(zhàn)。

      三、結(jié)語

      結(jié)合當(dāng)前形勢(shì)來看,微博輿情研究中的大數(shù)據(jù)風(fēng)險(xiǎn)與挑戰(zhàn)十分嚴(yán)峻。因此,在明確這些風(fēng)險(xiǎn)和挑戰(zhàn)的基礎(chǔ)上積極加以解決和優(yōu)化是相關(guān)研究者和工作者的使命,需要進(jìn)一步努力和積極探索。

      參考文獻(xiàn):

      [1] 張連峰,周紅磊,王丹,張海濤.基于超網(wǎng)絡(luò)理論的微博輿情關(guān)鍵節(jié)點(diǎn)挖掘[J].情報(bào)學(xué)報(bào),2019,38(12):1286-1296.

      [2] 李熠輝,李冠,趙衛(wèi)東.基于MUK-means算法的微博輿情意見領(lǐng)袖群識(shí)別[J].軟件導(dǎo)刊,2019,18(12):30-34.

      作者簡介:李靜遠(yuǎn)(1991—),女,河南鄭州人,研究生,碩士,講師,從事網(wǎng)絡(luò)輿情、新媒體研究。

      猜你喜歡
      風(fēng)險(xiǎn)挑戰(zhàn)大數(shù)據(jù)
      嘰咕樂挑戰(zhàn)
      嘰咕樂挑戰(zhàn)
      中國經(jīng)濟(jì)轉(zhuǎn)型的結(jié)構(gòu)性特征、風(fēng)險(xiǎn)與效率提升路徑
      商(2016年27期)2016-10-17 05:33:32
      互聯(lián)網(wǎng)金融的風(fēng)險(xiǎn)分析與管理
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      企業(yè)納稅籌劃風(fēng)險(xiǎn)及防范措施
      嘰咕樂挑戰(zhàn)
      第52Q 邁向新挑戰(zhàn)
      科技| 上虞市| 嘉鱼县| 吴堡县| 来宾市| 龙海市| 六安市| 福州市| 温州市| 东光县| 乌鲁木齐县| 襄汾县| 秀山| 罗甸县| 水城县| 汕头市| 高清| 富源县| 新兴县| 清水河县| 神池县| 莎车县| 平江县| 吉木乃县| 龙陵县| 南通市| 察隅县| 南京市| 定日县| 婺源县| 伊宁市| 仪陇县| 福清市| 永吉县| 鹤峰县| 阳信县| 桂东县| 广东省| 稷山县| 乐至县| 盐池县|