• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      論數(shù)據(jù)挖掘在涉警輿情監(jiān)測中的應用

      2019-12-14 05:40:09曹略耕
      森林公安 2019年5期
      關鍵詞:海量公安機關輿情

      曹略耕

      大數(shù)據(jù)時代,海量涉警輿情數(shù)據(jù)通過虛擬(網(wǎng)絡)等媒介進行傳播。雖然涉警輿情數(shù)據(jù)以超大規(guī)模的形式出現(xiàn),但信息量卻與數(shù)據(jù)量不成比例,出現(xiàn)了“數(shù)據(jù)海量,信息缺乏”的怪圈。為解決海量涉警輿情數(shù)據(jù)的監(jiān)測與處理,就需要能夠實時化、智能化、科學化的技術來支撐公安機關監(jiān)測涉警輿情數(shù)據(jù),在這種環(huán)境下,數(shù)據(jù)挖掘也就應運而生。

      一、數(shù)據(jù)挖掘在涉警輿情監(jiān)測中的應用內涵

      (一)數(shù)據(jù)挖掘的內涵

      1.數(shù)據(jù)挖掘的定義。數(shù)據(jù)挖掘,也稱作基于數(shù)據(jù)庫的知識發(fā)現(xiàn),不僅能對過去的數(shù)據(jù)進行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系。數(shù)據(jù)挖掘是在海量的、有噪聲、非結構化的數(shù)據(jù)中通過數(shù)據(jù)算法智能、自動地提取出隱含的、潛在的有價值的知識的過程。在涉警輿情監(jiān)測領域,數(shù)據(jù)挖掘就是對海量的互聯(lián)網(wǎng)的數(shù)據(jù)信息進行“描述”,抽取出涉警輿情數(shù)據(jù),運用算法進行實時、智能化預測預警的過程。

      2.數(shù)據(jù)挖掘的任務。數(shù)據(jù)挖掘的任務分為描述、建模、預測三部分?!懊枋觥笔侵笇Υ髷?shù)據(jù)進行數(shù)據(jù)總結,包括內容和結構上的特征總結,并以“支持度”“可信度”“作用度”為標準對總結數(shù)據(jù)進行初步的關聯(lián)分析,提高預測的準確度和科學性?!敖!笔侵父鶕?jù)數(shù)據(jù)總結選擇合適的算法,并建立相應的數(shù)據(jù)模型,以實現(xiàn)實時智能預測。在“描述”和“建?!比蝿胀瓿芍螅瑪?shù)據(jù)挖掘開始實施“預測”任務,這是數(shù)據(jù)挖掘的最終目的所在?!邦A測”是指根據(jù)數(shù)據(jù)“描述”的數(shù)據(jù)內容和結構上的特征,并以數(shù)據(jù)模型為基礎對未知信息進行智能化、實時性、科學性預測?!邦A測”的主要方法包括決策樹、神經(jīng)網(wǎng)絡、遺傳算法、最鄰近算法、貝葉斯分類技術等。

      3.數(shù)據(jù)挖掘的理論基礎。數(shù)據(jù)挖掘技術的理論基礎在于行為學理論和社會學習理論。任何涉警輿情的發(fā)生都是符合一定規(guī)律的。涉警輿情是個體行為的綜合反映,是個體所處的外在因素和內在因素的綜合作用之下發(fā)生的。外在因素是指社會和自然存在的,不以個體的意志為轉移的客觀環(huán)境;內在因素是個體內在的性格、價值觀等個性特征因素。通過警務大數(shù)據(jù)的分析,外在因素和內在因素的規(guī)律都是可以被發(fā)現(xiàn)的,是符合社會和個體的行為因素的。因此,涉警輿情事件的發(fā)生是可以通過數(shù)據(jù)挖掘發(fā)現(xiàn)其規(guī)律的,所以行為學理論涉警輿情的預測與預測的理論之一。

      任何涉警輿情的產生都需要個體的學習,不會憑空產生。個體通過網(wǎng)絡等媒介向社會學習大量的信息,這包括正面的積極信息,同樣也含有負面的反動的數(shù)據(jù),個體是容易受到正面的激勵,還是負面的反噬,是可以通過社會學習理論來發(fā)現(xiàn)其規(guī)律的。

      (二)涉警輿情的內涵

      1.涉警輿情的定義。涉警輿情是指與公安機關相關的輿情信息,這其中包括正向的輿情信息,即弘揚公安機關對黨忠誠、服務人民、執(zhí)法公正、紀律嚴明等正面輿情信息,同時也包括負向的輿情信息,即抹黑公安執(zhí)法,捏造事實,扭曲真相,意圖引起社會反感的不良信息。

      2.大數(shù)據(jù)時代涉警輿情的特征。大數(shù)據(jù)時代,超大規(guī)模的涉警輿情主要以分布式、非結構化的形式存在于網(wǎng)絡等媒介中。由于網(wǎng)絡的低門檻、無序性,使得網(wǎng)絡輿情的不確定性、交互性和動態(tài)性大大加強,加之個體對主流輿情的“疲勞”,使得社會個體極易將涉警輿情負面化,進行擴大解釋,將“論斷”搶在公安機關發(fā)布前傳播,引起涉警輿情的擴大化。

      二、數(shù)據(jù)挖掘在涉警輿情監(jiān)測與預警中的應用

      (一)數(shù)據(jù)挖掘在涉警輿情監(jiān)測與預警中的應用過程

      從我國公安機關性質來看,由于公安機關大多是追求社會效益,功效往往不能在短期內顯現(xiàn),加之社會效益表現(xiàn)力弱等特點,使涉警負面輿情層出不窮,影響力日益加大。因此,加大對涉警輿情監(jiān)測與預警,及早發(fā)現(xiàn),及時預警,是降低涉警負面信息重要手段之一。

      在涉警輿情數(shù)據(jù)準備階段,通過大數(shù)據(jù)采集技術智能化,實時采集涉警輿情數(shù)據(jù),傳輸?shù)焦参锫?lián)網(wǎng),儲存在相應的警務數(shù)據(jù)庫。在涉警輿情數(shù)據(jù)清理與集成階段,通過對涉警輿情數(shù)據(jù)內容和結構的“描述”,將“描述”后的數(shù)據(jù)進行“聚類”處理,即將具有較高相似度的數(shù)據(jù)“聚類”,不同類之間具有較高的相異性。將集成后的數(shù)據(jù)傳輸?shù)健皵?shù)據(jù)倉庫”中。在涉警輿情數(shù)據(jù)選擇與交換階段,對數(shù)據(jù)進行關聯(lián)分析,選擇與涉警負面輿情有關的數(shù)據(jù),并轉化成適合數(shù)據(jù)挖掘的數(shù)據(jù)類型。在數(shù)據(jù)挖掘階段,利用建立的數(shù)據(jù)模型,通過關聯(lián)分析、級別分析、聚類和傾向性分析,對數(shù)據(jù)潛在的、有價值的涉警輿情規(guī)律進行挖掘,智能分析提取涉警輿情數(shù)據(jù)模式,為進一步預測預警提供支撐。在評估與表示階段,一方面,將數(shù)據(jù)挖掘階段形成的數(shù)據(jù)模式進行“表示”形成“知識”,提供預測預警數(shù)據(jù);另一方面,對數(shù)據(jù)模式進行評估處理,將評估結果反饋到清理與集成、選擇與交換、數(shù)據(jù)挖掘階段,形成“閉環(huán)”,保障“知識”的科學性與智能化。涉警輿情的數(shù)據(jù)應用集成是數(shù)據(jù)挖掘的最后階段,也是最終目的,即在于提供預測結果及預警模型,為公安機關掌握涉警輿論主動性提供保障。

      數(shù)據(jù)挖掘并不是一蹴而就,而是一個反復的過程。在評估與表示階段,會將數(shù)據(jù)進行反饋,反饋之前的每一個階段。同時,如果某一個階段的數(shù)據(jù)處理沒有達到預期模式,就會返回到上一個階段,進行反復處理,保證數(shù)據(jù)的鮮活性與科學性。

      (二)數(shù)據(jù)挖掘在涉警輿情監(jiān)測與預警中的應用方法

      數(shù)據(jù)挖掘在涉警輿情監(jiān)測與預警中的應用方法主要是關聯(lián)分析、級別劃分、傾向性分析與可視化表示。

      1.關聯(lián)分析。通過“偏差分析”發(fā)現(xiàn)異常數(shù)據(jù),同時對涉警輿情的異常數(shù)據(jù)表征參數(shù)進行分析處理,發(fā)現(xiàn)涉警輿情中潛在的關聯(lián)規(guī)則,并以“支持度”“可信度”“作用度”為參數(shù)量化涉警輿情的關聯(lián)性。

      2.級別劃分。根據(jù)涉警輿情的影響力、性質等指標,以及“聚類”分析的“簇”的類別對涉警輿情事件進行級別劃分,針對不同的涉警輿情級別實施相對應的預警方案。

      3.傾向性分析與可視化表示。通過序列模式挖掘技術、情感分析、主題分析等數(shù)據(jù)挖掘技術深度挖掘涉警輿情的內在聯(lián)系和演變趨勢,得出傾向性分析意見,并以可視化界面的形式“表示”在公安機關視域下,為公安機關實時把握涉警輿情發(fā)展變化趨勢及預警提供支撐。

      三、數(shù)據(jù)挖掘在涉警輿情監(jiān)測中的應用優(yōu)勢

      傳統(tǒng)技術就像一艘老舊的航船,無法在大數(shù)據(jù)的海洋中高效挖掘捕撈有價值的物產,并隨時都有傾覆的危險。數(shù)據(jù)挖掘技術使涉警輿情數(shù)據(jù)分析處理環(huán)節(jié)更加智能化、實時化。傳統(tǒng)的數(shù)據(jù)分析往往依托人工輸入公安信息網(wǎng)進行比對分析處理,這不僅耗費大量的人力資源,而且也會使數(shù)據(jù)更新不及時,極大限制了公安機關處理涉警輿情事件的能力。在大數(shù)據(jù)時代,數(shù)據(jù)挖掘技術可以支持對海量涉警輿情潛在信息的發(fā)現(xiàn)與挖掘,找到涉警輿情信息間存在的關系或規(guī)律,根據(jù)現(xiàn)有的輿情預測未來的發(fā)展趨勢,這不僅在縱向上極大地挖掘了數(shù)據(jù),而且也緩解警力不足的壓力,保證數(shù)據(jù)的實時性與準確性,實現(xiàn)智能化預測預警。

      數(shù)據(jù)挖掘技術可以在縱向上挖掘“數(shù)據(jù)”,相較于傳統(tǒng)的數(shù)據(jù)分析技術,更能實現(xiàn)公安機關對涉警輿情的預測預警。大數(shù)據(jù)時代社會人流、物流、信息流的動態(tài)化,新型“網(wǎng)絡水軍”的產生,以及跨地區(qū)、跨國家的遠程操控等給公安機關打擊違法炒作“涉警輿情”增加難度。公安機關通過大數(shù)據(jù)采集技術采集海量的涉警輿情數(shù)據(jù),利用數(shù)據(jù)挖掘技術智能預測涉警負面輿情。數(shù)據(jù)挖掘技術提高了公安機關處理涉警輿情事件的效率,使公安機關處理涉警輿情事件由依靠傳統(tǒng)的人海數(shù)據(jù)分析處理轉變?yōu)閿?shù)據(jù)挖掘技術引領,實現(xiàn)及時預測預警涉警輿情,提高公安機關實戰(zhàn)化水平。相較于傳統(tǒng)的OLAP等在線分析處理技術而言,數(shù)據(jù)挖掘技術具有以下4個優(yōu)勢:

      (一)自動搜集信息

      傳統(tǒng)的數(shù)據(jù)分析處理技術無法實現(xiàn)對海量數(shù)據(jù)的實時分析,而數(shù)據(jù)挖掘技術可以實時、動態(tài)搜集信息,通過對數(shù)據(jù)內容和結構的數(shù)據(jù)“描述”,發(fā)現(xiàn)涉警輿情數(shù)據(jù)之間的關聯(lián)關系,從虛擬(網(wǎng)絡)上自動收集涉警輿情數(shù)據(jù)信息,并且隨著鏈接不斷向整個虛擬(網(wǎng)絡)擴展,不斷向更深層次挖掘數(shù)據(jù),實現(xiàn)在虛擬(網(wǎng)絡)上涉警輿情數(shù)據(jù)的自動搜集。

      (二)數(shù)據(jù)清理

      數(shù)據(jù)清理又可分為數(shù)據(jù)的預處理、篩選、有序化和量化處理。

      1.數(shù)據(jù)預處理。數(shù)據(jù)預處理是對海量的數(shù)據(jù)進行預先梳理,將數(shù)據(jù)進行“去噪”處理,濾除“冗余”數(shù)據(jù),提升下一環(huán)節(jié)的數(shù)據(jù)處理效率。

      2.數(shù)據(jù)篩選。數(shù)據(jù)篩選是對涉警輿情數(shù)據(jù)的“再處理”,將“去噪”后的數(shù)據(jù)進行“偏差分析”,識別數(shù)據(jù)特征明顯不同于其他的數(shù)據(jù),初步去除無價值的數(shù)據(jù),對有價值信息進行“再選擇”。

      3.數(shù)據(jù)的有序化處理。數(shù)據(jù)的有序化處理是對數(shù)據(jù)的“聚類”處理,通過數(shù)據(jù)“描述”,將具有較高相似度的數(shù)據(jù)歸為一類,不同類別之間的數(shù)據(jù)具有較高的相異度,即將物理或抽象的數(shù)據(jù)分成不同“簇”的過程。

      4.數(shù)據(jù)的量化處理。數(shù)據(jù)的量化處理是將不具有量化特征的數(shù)據(jù)進行量化處理,以便實現(xiàn)“量化”數(shù)據(jù)的“集體分析處理”,數(shù)據(jù)量化是數(shù)據(jù)“可視化”的基礎。

      (三)輿情分析

      輿情分析是數(shù)據(jù)挖掘技術的關鍵,分析的結果往往關系到涉警輿情準確度。輿情分析可以關鍵字、傾向性觀點等為類別進行“聚類”處理?;跀?shù)據(jù)挖掘技術的輿情分析主要有以下3點優(yōu)勢:

      1.自動分類和自動聚類。將涉警輿情分為不同的“簇”,將每一個涉警輿情“簇”看作一個輿情類,可以及時發(fā)現(xiàn)涉警敏感輿情,并“總結出”主流評論及輿情導向。

      2.偏差分析和深度追蹤。通過偏差分析,智能化識別數(shù)據(jù)特征顯著不同于其他的數(shù)據(jù),并對其進行追根溯源,深度追蹤數(shù)據(jù)鏈接、關鍵字等特征數(shù)據(jù)。

      3.傾向性分析和預測。根據(jù)現(xiàn)有涉警輿情的發(fā)展規(guī)律,對未來的發(fā)展趨勢進行科學化的實時預測,形成“知識表示”。

      (四)知識表示

      將數(shù)據(jù)挖掘的成果以可視化的“知識”展現(xiàn)在公安機關視域下,公安機關可以對涉警輿情事件的發(fā)展趨勢進行實時研判,掌握涉警輿情的發(fā)展規(guī)律,及時預警,降低負面影響。

      四、結語

      隨著大數(shù)據(jù)時代的不斷推進,涉警輿情數(shù)量不斷增多。在大數(shù)據(jù)時代,數(shù)據(jù)的產生和采集是基礎,數(shù)據(jù)挖掘技術是關鍵,換句話說,大數(shù)據(jù)是現(xiàn)象,核心是挖掘數(shù)據(jù)的潛在價值,數(shù)據(jù)挖掘在涉警輿情預測中具有描述、清理、評估、知識表示等優(yōu)勢,可以較好地滿足公安機關實戰(zhàn)化需求,是公安機關及時掌握涉警輿情發(fā)展規(guī)律,實現(xiàn)智能化、科學性、實時性預測預警的重要手段。

      盡管數(shù)據(jù)挖掘給涉警輿情的預測預警帶來了巨大的變革,可以基本滿足公安機關的實戰(zhàn)化需求,但在具體應用過程中,數(shù)據(jù)挖掘同樣會出現(xiàn)隱私安全、預測誤判等風險問題。隨著警務大數(shù)據(jù)和數(shù)據(jù)挖掘的不斷成熟,這些風險問題會不斷得到克服,可以預言,數(shù)據(jù)挖掘在涉警輿情的監(jiān)測上必將扮演越來越重要的角色。

      猜你喜歡
      海量公安機關輿情
      一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
      海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
      當代陜西(2019年14期)2019-08-26 09:42:00
      衡陽市公安機關黨員風采剪影
      公安機關處置家庭暴力案件的實證研究
      一個圖形所蘊含的“海量”巧題
      對已經(jīng)移送公安機關案件的當事人做出罰款的行為是否涉嫌瀆職犯罪?
      輿情
      中國民政(2016年16期)2016-09-19 02:16:48
      公安機關刑事案件偵查中的假說、推理和證據(jù)
      輿情
      中國民政(2016年10期)2016-06-05 09:04:16
      輿情
      中國民政(2016年24期)2016-02-11 03:34:38
      宁武县| 佛冈县| 白水县| 二手房| 金堂县| 剑河县| 大新县| 府谷县| 蒙自县| 田阳县| 丁青县| 巴楚县| 丰台区| 澄城县| 阳新县| 同心县| 平顺县| 宝应县| 丁青县| 庆云县| 牟定县| 沂源县| 四会市| 巴彦县| 当涂县| 唐海县| 三门峡市| 石狮市| 武定县| 晋城| 婺源县| 射洪县| 澳门| 枣庄市| 四子王旗| 陈巴尔虎旗| 扶绥县| 蒙自县| 九龙城区| 龙泉市| 北碚区|