• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術(shù)在公安行業(yè)的應(yīng)用

      2013-04-07 04:17:15吳有旭
      時(shí)代農(nóng)機(jī) 2013年1期
      關(guān)鍵詞:數(shù)據(jù)倉庫公安數(shù)據(jù)挖掘

      吳有旭

      (福州大學(xué) 空間信息工程研究中心,福建 福州 350001)

      1 決策支持系統(tǒng)

      決策支持系統(tǒng)(Decision Support System)是以日常業(yè)務(wù)處理系統(tǒng)的數(shù)據(jù)為基礎(chǔ),利用數(shù)學(xué)或智能的方法,對(duì)數(shù)據(jù)進(jìn)行分析、綜合、預(yù)測未來業(yè)務(wù)的變化趨勢。所謂“決策”,就其本質(zhì)來說,就是決策者根據(jù)所掌握的信息為對(duì)象選擇行為的思維過程。而“支持”,顧名思義,就是作為輔助手段,為決策人員提供決策幫助,讓決策人員更容易地作出正確的決策。

      自70年代決策支持系統(tǒng)(DSS)被人們提出以來,DSS已經(jīng)得到了很大發(fā)展。DSS通過分析數(shù)據(jù),能夠直觀的為決策者提供分析結(jié)果,為決策者制訂下一階段的工作重點(diǎn)及方向提供幫助。實(shí)現(xiàn)DSS的關(guān)鍵不在信息收集與更新的過程,而在于信息的有效提取并加以分析。決策分析通常都需要從不同角度觀察分析數(shù)據(jù),即DSS需要為決策者提供多側(cè)面、全方位信息。在DSS系統(tǒng)中,分析數(shù)據(jù)這一重要功能是由數(shù)據(jù)挖掘所實(shí)現(xiàn)的,數(shù)據(jù)挖掘幫助決策者一步步地進(jìn)行數(shù)據(jù)分析,從而找出事物的內(nèi)在規(guī)律,為決策服務(wù),因此在DSS系統(tǒng)中,數(shù)據(jù)挖掘的實(shí)現(xiàn)過程是非常重要的。

      2 數(shù)據(jù)挖掘技術(shù)介紹

      數(shù)據(jù)挖掘(DM)的概念可以被簡單地描述為:按既定的目標(biāo),對(duì)大量的數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的規(guī)律性,并將其模型化。數(shù)據(jù)挖掘也可以稱為數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)。一般在科研領(lǐng)域中稱為KDD,而在工程應(yīng)用領(lǐng)域則稱為DM。

      數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的原始數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。它可以從各類數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱藏的預(yù)測性信息;它能開采出潛在的模式,找出最有價(jià)值的信息,指導(dǎo)業(yè)務(wù)行為或決策。數(shù)據(jù)挖掘主要有以下4個(gè)功能。

      (1)自動(dòng)預(yù)測趨勢和行為。數(shù)據(jù)挖掘能自動(dòng)在各型數(shù)據(jù)庫中尋找預(yù)測性信息,分析出發(fā)展趨勢。原先需要進(jìn)行大量人工分析的問題,如今在數(shù)據(jù)挖掘工具的幫助下,可以迅速直接由數(shù)據(jù)本身得出結(jié)論。

      (2)聚類。數(shù)據(jù)挖掘過程中,將數(shù)據(jù)庫中的記錄可劃分為一系列有意義的子集,即聚類。聚類增強(qiáng)了人們對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描述和偏差分析的先決條件。

      (3)關(guān)聯(lián)分析。若兩個(gè)或多個(gè)字段的取值之問存在某種規(guī)律性,就被稱為關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中各類數(shù)據(jù)隱藏的關(guān)系網(wǎng)。典型的例子就是人員的各類信息通過姓名或身份證號(hào)等字段關(guān)聯(lián)。

      (4)概念描述。概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征。概念描述主要分為特征性描述和區(qū)別性描述,特征性描述的是某類對(duì)象的共同特征,區(qū)別性描述的是小同類對(duì)象之間的區(qū)別。生成一個(gè)類的特征性描述只涉及該類對(duì)象中所有對(duì)象的共性。

      在一個(gè)關(guān)系型查詢處理能用不同的處理途徑對(duì)同一查詢生成相同的答案,但對(duì)于一個(gè)數(shù)據(jù)倉庫或數(shù)據(jù)集合,采用不同的數(shù)據(jù)挖掘工具可能會(huì)生成顯著不同的挖掘結(jié)果,因此采用何種的數(shù)據(jù)挖掘工具是非常重要的。數(shù)據(jù)挖掘的具體實(shí)現(xiàn)過程,是有很多方法,遺傳算法、歸納法、決策樹方法、神經(jīng)網(wǎng)絡(luò)、相關(guān)分析、模糊邏輯、統(tǒng)計(jì)分析和可視化技術(shù)等等都能應(yīng)用在數(shù)據(jù)挖掘的實(shí)現(xiàn)過程中。而在解決實(shí)際問題時(shí),下面幾種數(shù)據(jù)挖掘手段是使用較多的,在某一具體應(yīng)用中選定合適的數(shù)據(jù)挖掘手段是必須熟悉應(yīng)用問題、數(shù)據(jù)特征以及數(shù)據(jù)挖掘功能,必要時(shí)需要執(zhí)行交互探索式分析來選擇合適的功能,所以這些手段往往交替使用以挖掘更多的信息:預(yù)測模型、數(shù)據(jù)庫分析、鏈元分析和編差檢測。

      (1)預(yù)測模型。在決策分析系統(tǒng)中往往使用演繹推理,而在數(shù)據(jù)挖掘過程中使用歸納推理。

      (2)數(shù)據(jù)庫分析。把數(shù)據(jù)庫自動(dòng)劃分為聚類(簇),實(shí)現(xiàn)數(shù)據(jù)挖掘的聚類功能。

      (3)鏈元分析。基于對(duì)橫向關(guān)聯(lián)和順序關(guān)聯(lián)的發(fā)現(xiàn),對(duì)記錄間聯(lián)接進(jìn)行確證,實(shí)現(xiàn)其數(shù)據(jù)關(guān)聯(lián)的功能。

      (4)偏差檢測。對(duì)記錄不能被歸入到特定格元現(xiàn)象的解釋。

      3 數(shù)據(jù)挖掘在公安行業(yè)中的特點(diǎn)

      (1)數(shù)據(jù)挖掘通常都進(jìn)行數(shù)據(jù)的長期趨勢分析。公安部門開展信息化建設(shè)時(shí)間相對(duì)較早,因此在過去若干年的時(shí)間里積累了海量的、以不同形式儲(chǔ)存的業(yè)務(wù)資料,例如戶籍資料,機(jī)動(dòng)車資料等。傳統(tǒng)的公安數(shù)據(jù)庫系統(tǒng)為了獲得更大的工作效率,在每項(xiàng)業(yè)務(wù)上存儲(chǔ)的數(shù)據(jù)量并不會(huì)很多,但為了保證數(shù)據(jù)的有效,通常都進(jìn)行長時(shí)間的歷史數(shù)據(jù)存儲(chǔ),這使得我們?cè)跀?shù)據(jù)挖掘時(shí)可以進(jìn)行數(shù)據(jù)長期趨勢的分析。

      (2)數(shù)據(jù)挖掘通常是基于公安數(shù)據(jù)倉庫。由于公安信息化建設(shè)程度較高,在很多地方都建成有綜合性的數(shù)據(jù)倉庫。各類信息源由原始數(shù)據(jù)庫經(jīng)過各種方式,實(shí)時(shí)或定期的集成到公安數(shù)據(jù)倉庫;數(shù)據(jù)挖掘過程中一般是以公安數(shù)據(jù)倉庫為中心,通過模型庫和方法庫的協(xié)助,對(duì)公安數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)挖掘,從而獲得分析預(yù)測結(jié)果和決策支持的。

      (3)數(shù)據(jù)挖掘過程更專注于核心的處理分析階段?,F(xiàn)有的公安信息化建設(shè)水平數(shù)據(jù)大大降低了公安數(shù)據(jù)挖掘的障礙。一般進(jìn)行數(shù)據(jù)挖掘要花大量的力量在數(shù)據(jù)準(zhǔn)備階段,而在公安行業(yè)中,由于大多都已建有數(shù)據(jù)倉庫,各類數(shù)據(jù)已經(jīng)被充分收集起來了,進(jìn)行了整理、合并,有些還進(jìn)行了初步的分析處理。這樣,數(shù)據(jù)挖掘的注意力更集中于公安數(shù)據(jù)挖掘的核心處理階段。

      (4)數(shù)據(jù)挖掘關(guān)聯(lián)分析準(zhǔn)確度高。數(shù)據(jù)挖掘一個(gè)重要的方式就是通過鏈元分析的手段實(shí)現(xiàn)數(shù)據(jù)關(guān)聯(lián)的功能,在公安的各類業(yè)務(wù)數(shù)據(jù)中,因?yàn)楣矘I(yè)務(wù)的特殊性,在辦理業(yè)務(wù)時(shí),業(yè)務(wù)辦理人員通常都需要提供能唯一確定業(yè)務(wù)的重要字段信息,此類重要字段在人員業(yè)務(wù)中,通常都是身份證號(hào)。因此當(dāng)采用此類重要字段信息來尋找各種記錄間的規(guī)律性時(shí),那么各類數(shù)據(jù)間的聯(lián)系程度通常比較緊密,關(guān)聯(lián)分析的準(zhǔn)確度也比較高。

      4 在公安行業(yè)中的應(yīng)用

      對(duì)公安部門而言,其中一項(xiàng)重要的職能是打擊犯罪。如何準(zhǔn)確地了解轄區(qū)內(nèi)犯罪特點(diǎn),如何合理地部署警力以遏制各類案件發(fā)生,這些問題是公安部門在實(shí)際工作所關(guān)注的。因此在實(shí)際工作中,數(shù)據(jù)挖掘的應(yīng)用場景就包含:通過數(shù)據(jù)挖掘工具對(duì)案事件類的業(yè)務(wù)數(shù)據(jù),進(jìn)行案發(fā)時(shí)間、地點(diǎn)、作案手段等多個(gè)維度的分析,發(fā)現(xiàn)其中潛在的特點(diǎn),為下一階段的工作安排提供決策支持,更好地發(fā)揮公安部門打擊犯罪的職能作用。

      總之,數(shù)據(jù)挖掘工具及方法的多樣性需要決策者謹(jǐn)慎地選擇模型和流程類型。這些工具或方法并不會(huì)制作數(shù)據(jù)流程或者系統(tǒng),它們僅僅是綜合關(guān)系技術(shù)和流程中的一部分。數(shù)據(jù)挖掘作用的發(fā)揮也要依賴于各類數(shù)據(jù)的采集及其準(zhǔn)確性,以及完整的數(shù)據(jù)決策系統(tǒng)的建立,特別是數(shù)據(jù)倉庫系統(tǒng)的建立。對(duì)于應(yīng)用挖掘工具處理數(shù)據(jù)后所產(chǎn)生的結(jié)論,也要得到業(yè)務(wù)專家的確認(rèn)。相信正確地運(yùn)用數(shù)據(jù)挖掘技術(shù)會(huì)使公安的各類信息數(shù)據(jù)發(fā)揮更大的作用,實(shí)現(xiàn)信息指導(dǎo)警務(wù)的工作模式,真正提高公安信息化應(yīng)用水平。

      猜你喜歡
      數(shù)據(jù)倉庫公安數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      “老公安”的斂財(cái)“利器”
      基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
      “10歲當(dāng)公安”為何能暢通無阻
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計(jì)
      電子制作(2016年15期)2017-01-15 13:39:15
      探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
      公安報(bào)道要有度
      新聞傳播(2016年20期)2016-07-10 09:33:31
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實(shí)踐
      中卫市| 玛曲县| 张家界市| 恩平市| 抚顺县| 满城县| 凤阳县| 崇文区| 宁海县| 福泉市| 沂水县| 晴隆县| 榆林市| 台湾省| 隆德县| 汽车| 阿拉尔市| 宁夏| 慈溪市| 稷山县| 永修县| 邵武市| 贺州市| 剑阁县| 西林县| 礼泉县| 会理县| 当阳市| 咸宁市| 莆田市| 启东市| 石景山区| 临朐县| 泗洪县| 女性| 桐梓县| 普安县| 邢台县| 滁州市| 沙雅县| 湖州市|