• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      離群動態(tài)性數(shù)據(jù)情報偵查方法研究

      2021-08-24 07:08:30薛亞龍劉如意
      山東警察學(xué)院學(xué)報 2021年2期
      關(guān)鍵詞:動態(tài)性離群偵查人員

      薛亞龍,劉如意

      (1.寧夏警官職業(yè)學(xué)院現(xiàn)代偵查技戰(zhàn)法研究中心,寧夏 銀川 750021)(2.寧夏警官職業(yè)學(xué)院成人培訓(xùn)處,寧夏 銀川 750021)

      離群動態(tài)性數(shù)據(jù)挖掘是數(shù)據(jù)領(lǐng)域的一個研究熱點(diǎn)。在動態(tài)性數(shù)據(jù)頻繁項目集合中,離群動態(tài)性數(shù)據(jù)往往被認(rèn)為是與其他動態(tài)性數(shù)據(jù)的加權(quán)閾值、集合屬性以及相鄰系數(shù)等常規(guī)特征存在顯著差異的數(shù)據(jù),主要目標(biāo)是從各種具有動態(tài)性、開放性、系統(tǒng)性特點(diǎn)的海量復(fù)雜動態(tài)性數(shù)據(jù)中尋找和發(fā)現(xiàn)存在于少量離群動態(tài)性數(shù)據(jù)中與其常規(guī)特征存在明顯區(qū)別的不同數(shù)據(jù)屬性和模式,從而幫助人們能夠在各種離群動態(tài)性數(shù)據(jù)中挖掘與分析出具有潛在價值的有用數(shù)據(jù)。離群動態(tài)性數(shù)據(jù)挖掘與分析理論和應(yīng)用技術(shù)的不斷發(fā)展,促使離群動態(tài)性數(shù)據(jù)被廣泛應(yīng)用于數(shù)據(jù)診斷、數(shù)據(jù)挖掘、數(shù)據(jù)入侵檢測等領(lǐng)域。針對傳統(tǒng)情報偵查中情報價值挖掘容量低、數(shù)據(jù)收斂耗時較長且復(fù)雜以及情報整體作用性孤立和分散等突出問題,需要引入離群動態(tài)性數(shù)據(jù)情報偵查方法研究范式。這不僅可以促使偵查人員及時掌握和優(yōu)化離群動態(tài)性數(shù)據(jù)排序的生存發(fā)展態(tài)勢,而且能夠幫助其建立有效離群動態(tài)性數(shù)據(jù)節(jié)點(diǎn)的權(quán)值集群,提升挖掘與利用算法的精確度,從而實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)然價值和實(shí)然效果。

      一、離群動態(tài)性數(shù)據(jù)情報偵查的內(nèi)涵與屬性

      隨著對動態(tài)性數(shù)據(jù)的挖掘與分析,那些潛在包含重要價值的離群動態(tài)性數(shù)據(jù)越來越引起人們的重視。在動態(tài)性數(shù)據(jù)在各領(lǐng)域被廣泛應(yīng)用的過程中,與常規(guī)的動態(tài)性數(shù)據(jù)比較而言,人們會更加關(guān)注那些具有差異性、例外性、不一致性的離群動態(tài)性數(shù)據(jù)。[1]在離群動態(tài)性數(shù)據(jù)挖掘與分析過程中,核心工作是在全部動態(tài)性數(shù)據(jù)中尋找和搜集不符合常規(guī)特征且具有異常屬性的各種離群動態(tài)性數(shù)據(jù),利用離群動態(tài)性數(shù)據(jù)算法挖掘與分析隱藏在其背后的各種具有內(nèi)在關(guān)聯(lián)的數(shù)理關(guān)系。這些離群動態(tài)性數(shù)據(jù)在全部動態(tài)性數(shù)據(jù)中既有可能屬于“孤立數(shù)據(jù)”,也有可能屬于“臟數(shù)據(jù)”。在實(shí)踐應(yīng)用過程中,盡管離群動態(tài)性數(shù)據(jù)總是被人們忽視或遺棄,但是其也往往能夠給行為預(yù)測和決策提供至關(guān)重要的價值依據(jù)。顯然,將離群動態(tài)性數(shù)據(jù)與傳統(tǒng)情報偵查融合而形成新的情報偵查模式,即離群動態(tài)性數(shù)據(jù)情報偵查方法,不僅是離群動態(tài)性數(shù)據(jù)在各行業(yè)應(yīng)用發(fā)展的必然趨勢,而且是傳統(tǒng)情報偵查進(jìn)行內(nèi)在變革和創(chuàng)新的本質(zhì)動力需求,更是應(yīng)對犯罪數(shù)據(jù)化生存發(fā)展趨勢的應(yīng)然選擇。因此,在智慧驅(qū)動時代,應(yīng)該賦予離群動態(tài)性數(shù)據(jù)情報偵查新的內(nèi)涵和屬性。

      (一)離群動態(tài)性數(shù)據(jù)情報偵查的內(nèi)涵

      離群動態(tài)性數(shù)據(jù)的挖掘與分析最早被應(yīng)用于統(tǒng)計學(xué)領(lǐng)域,然后逐漸開始被引入與應(yīng)用到醫(yī)療衛(wèi)生、金融、商業(yè)等領(lǐng)域。[2]隨著人們對離群動態(tài)性數(shù)據(jù)內(nèi)涵的研究越來越多,由于不同學(xué)者對其內(nèi)涵往往是基于自身學(xué)科背景而展開研究的,從而造成人們對離群動態(tài)性數(shù)據(jù)的內(nèi)涵研究存在一定的差異。就目前對離群動態(tài)性數(shù)據(jù)內(nèi)涵的研究而言,最具有代表性的是學(xué)者V.Barnette在統(tǒng)計學(xué)領(lǐng)域中給出的定義。V.Barnette將離群動態(tài)性數(shù)據(jù)定義為:給定一個N個動態(tài)性數(shù)據(jù)點(diǎn)或?qū)ο蟮募弦约邦A(yù)期離群動態(tài)性數(shù)據(jù)的數(shù)目K,任務(wù)目標(biāo)是發(fā)現(xiàn)與剩余的動態(tài)性數(shù)據(jù)相比是顯著相異的、異常的或者不一致的頭K個對象。[3]顯然,離群動態(tài)性數(shù)據(jù)挖掘與分析的主要任務(wù)包括預(yù)設(shè)離群動態(tài)性數(shù)據(jù)在整個動態(tài)性數(shù)據(jù)頻繁項目集合中的數(shù)量閾值和采取高效的算法挖掘各種不同的離群動態(tài)性數(shù)據(jù)兩個方面。從離群動態(tài)性數(shù)據(jù)挖掘的研究背景而言,其產(chǎn)生的原因主要包括三個方面:第一,由動態(tài)性數(shù)據(jù)自身固有變量引起。整體動態(tài)性數(shù)據(jù)在觀測值預(yù)置算法過程中有時由于自身固有變量的變化而產(chǎn)生離群動態(tài)性數(shù)據(jù)。這種離群動態(tài)性數(shù)據(jù)的產(chǎn)生不僅具有自然性和不可控性,而且能夠從側(cè)面反映和體現(xiàn)整體動態(tài)性數(shù)據(jù)的加權(quán)閾值、相鄰系數(shù)等常規(guī)特征屬性。第二,由算法挖掘方法錯誤引起。不同類型和格式的動態(tài)性數(shù)據(jù)應(yīng)該采取與之相適應(yīng)的挖掘算法,如果采取與其不相匹配的算法進(jìn)行挖掘,那么就會造成部分所得的算法挖掘結(jié)果閾值衍變成為離群動態(tài)性數(shù)據(jù)。第三,由分析執(zhí)行錯誤引起。在對各種動態(tài)性數(shù)據(jù)經(jīng)過算法挖掘而準(zhǔn)備分析執(zhí)行的時候,亦可能受到分析執(zhí)行規(guī)則、流程模型、指標(biāo)體系評估等復(fù)雜動態(tài)情勢的影響和制約。如果在這些復(fù)雜動態(tài)情勢中存在不規(guī)范、不合理、不科學(xué)等錯誤的分析執(zhí)行時,也會導(dǎo)致部分離群動態(tài)性數(shù)據(jù)的產(chǎn)生。結(jié)合離群動態(tài)性數(shù)據(jù)挖掘的屬性和情報偵查的內(nèi)在價值需求,筆者認(rèn)為,離群動態(tài)性數(shù)據(jù)情報偵查的內(nèi)涵為:偵查人員在海量復(fù)雜的動態(tài)性數(shù)據(jù)庫或頻繁項目數(shù)據(jù)集合中提前預(yù)設(shè)各種離群動態(tài)性數(shù)據(jù)的數(shù)目加權(quán)閾值,然后采取霍金斯離群動態(tài)性數(shù)據(jù)算法、LOF離群動態(tài)性數(shù)據(jù)算法、時空維度離群動態(tài)性算法等離群動態(tài)性數(shù)據(jù)算法尋找和發(fā)現(xiàn)隱藏在其中具有差異性、例外性、不一致性等特征的各種離群動態(tài)性數(shù)據(jù),進(jìn)而幫助偵查人員深入挖掘分析出其與案件偵查情勢之間內(nèi)在相關(guān)的數(shù)理關(guān)系和情報價值,從而能夠揭露犯罪和證實(shí)犯罪的一種新型動態(tài)性數(shù)據(jù)情報偵查方法。

      根據(jù)離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用價值的差異性,可以將離群動態(tài)性數(shù)據(jù)分為以下三種主要類型:第一,應(yīng)剔除的離群動態(tài)性數(shù)據(jù)。偵查人員在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,可能由于非科學(xué)合理構(gòu)建犯罪行為與非犯罪行為數(shù)據(jù)庫或離群動態(tài)性數(shù)據(jù)情報偵查流程模型等執(zhí)行錯誤而產(chǎn)生離群動態(tài)性數(shù)據(jù)。各種結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及異構(gòu)化數(shù)據(jù)等動態(tài)性數(shù)據(jù)源的猛增,必然給離群動態(tài)性數(shù)據(jù)情報的挖掘與分析帶來難度,應(yīng)用不當(dāng)就會導(dǎo)致出現(xiàn)偵查錯誤或偵查僵局。如果出現(xiàn)諸如冗余數(shù)據(jù)等離群動態(tài)性數(shù)據(jù),那么就應(yīng)該立即將其剔除,否則勢必影響和制約離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用的實(shí)際效果。第二,應(yīng)特別處理的離群動態(tài)性數(shù)據(jù)。有些離群動態(tài)性數(shù)據(jù)并不是由偵查人員的執(zhí)行錯誤而導(dǎo)致出現(xiàn),而是由動態(tài)性數(shù)據(jù)內(nèi)在本質(zhì)的變異性所產(chǎn)生的結(jié)果。對于該類離群動態(tài)性數(shù)據(jù),不能機(jī)械地予以直接剔除,否則可能會導(dǎo)致一些重要的偵查情報數(shù)據(jù)被遺漏或被過濾??茖W(xué)、合理的方法是根據(jù)不同離群動態(tài)性數(shù)據(jù)出現(xiàn)的概率或頻率對其閾值進(jìn)行加權(quán),最大限度降低對離群動態(tài)性數(shù)據(jù)情報挖掘與分析應(yīng)用的不利影響。第三,應(yīng)重視的離群動態(tài)性數(shù)據(jù)。在離群動態(tài)性數(shù)據(jù)情報挖掘、應(yīng)用過程中,部分離群動態(tài)性數(shù)據(jù)具有重要價值和稀有的加權(quán)屬性。例如,在案件情報挖掘過程中發(fā)現(xiàn)的涉嫌犯罪的聚類數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、鏈路數(shù)據(jù)以及區(qū)塊鏈數(shù)據(jù)等離群動態(tài)性數(shù)據(jù),都屬于應(yīng)重視的離群動態(tài)性數(shù)據(jù)范疇。[4]此外,依據(jù)不同的標(biāo)準(zhǔn)還可以對離群動態(tài)性數(shù)據(jù)進(jìn)行不同的分類。如依據(jù)數(shù)據(jù)范圍的不同,可以分為局部性離群動態(tài)性數(shù)據(jù)和全局性離群動態(tài)性數(shù)據(jù);依據(jù)數(shù)據(jù)變量的不同,可以分為多變量的離群動態(tài)性數(shù)據(jù)和單變量的離群動態(tài)性數(shù)據(jù)等。[5]

      誠然,根據(jù)犯罪情勢數(shù)據(jù)化產(chǎn)生和發(fā)展的不同變化態(tài)勢,偵查人員應(yīng)該作出與偵查情勢相符合或具有一致性的離群動態(tài)性數(shù)據(jù)分類,從而為實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報挖掘與分析應(yīng)用奠定良好的基礎(chǔ)。

      (二)離群動態(tài)性數(shù)據(jù)情報偵查的屬性

      離群動態(tài)性數(shù)據(jù)貫穿于情報偵查的全過程,是離群動態(tài)性數(shù)據(jù)情報挖掘與分析應(yīng)用最為顯著的特征。離群動態(tài)性數(shù)據(jù)與情報偵查過程的互相融合和銜接,不僅涵蓋了數(shù)據(jù)網(wǎng)絡(luò)節(jié)點(diǎn)分析、數(shù)據(jù)錨點(diǎn)預(yù)測、數(shù)據(jù)熱點(diǎn)矩陣以及數(shù)據(jù)時空風(fēng)險與預(yù)測等傳統(tǒng)情報偵查方法,還包含了霍金斯離群動態(tài)性群數(shù)據(jù)算法、LOF離群動態(tài)性數(shù)據(jù)算法、時空維度離群動態(tài)性算法等典型離群動態(tài)性數(shù)據(jù)算法。所以,與傳統(tǒng)實(shí)體空間的情報偵查相比,智慧驅(qū)動時代的離群動態(tài)性數(shù)據(jù)情報偵查有其顯著的獨(dú)特屬性。

      1.離群動態(tài)性數(shù)據(jù)情報偵查的分布序列屬性

      為了實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)然價值,首先,需要構(gòu)建離群動態(tài)性數(shù)據(jù)情報偵查的分布式數(shù)據(jù)存儲倉庫模型,采用不同離群動態(tài)性數(shù)據(jù)算法對結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化以及異構(gòu)化等類型的離群動態(tài)性數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和預(yù)處理。其次,構(gòu)建離群動態(tài)性數(shù)據(jù)情報偵查的加權(quán)優(yōu)化閾值和離群特征預(yù)設(shè)閾值模型,進(jìn)行離群動態(tài)性數(shù)據(jù)情報偵查的自適應(yīng)離群算法應(yīng)用檢測;同時,進(jìn)一步分析離群動態(tài)性數(shù)據(jù)情報偵查的離群空間調(diào)度設(shè)計流程模型,采取分布式網(wǎng)絡(luò)動態(tài)性數(shù)據(jù)挖掘等離群動態(tài)性數(shù)據(jù)算法促使各種不同的離群動態(tài)性數(shù)據(jù)能夠有效地互相融合,從而得到離群動態(tài)性數(shù)據(jù)情報偵查分布序列的加權(quán)閾值系數(shù)。最后,通過對離群動態(tài)性數(shù)據(jù)情報偵查分布序列的特征分析,構(gòu)建離群動態(tài)性數(shù)據(jù)情報偵查中犯罪行為與非犯罪行為的離群規(guī)則,從而為采取各種離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)用算法提供可行的不同離群特征匹配模型。這樣,一方面,分布序列數(shù)據(jù)模型貫穿于離群動態(tài)性數(shù)據(jù)情報偵查的全過程;另一方面,離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)然價值和實(shí)然效果便有了分布序列數(shù)據(jù)模型的基礎(chǔ)和前提。因此,離群動態(tài)性數(shù)據(jù)情報偵查具有典型的分布序列屬性。

      2.離群動態(tài)性數(shù)據(jù)情報偵查的混沌屬性

      離群動態(tài)性數(shù)據(jù)情報偵查源不僅包括算數(shù)離群數(shù)據(jù)、數(shù)組離群數(shù)據(jù)、索引離群數(shù)據(jù)等常規(guī)的離群數(shù)據(jù),還包括參數(shù)離群數(shù)據(jù)、匹配離群數(shù)據(jù)以及轉(zhuǎn)換離群數(shù)據(jù)等非常規(guī)離群數(shù)據(jù)。顯然,離群數(shù)據(jù)類型或格式方式的多樣性和復(fù)雜性使其必然具有混沌屬性。[6]混沌屬性作為離群動態(tài)性數(shù)據(jù)情報偵查的屬性之一,能夠滿足離群動態(tài)性數(shù)據(jù)加權(quán)閾值與情報偵查應(yīng)用價值之間的關(guān)聯(lián)性和聚類性,且對離群動態(tài)性數(shù)據(jù)情報的挖掘與分析應(yīng)用具有數(shù)據(jù)收斂速度快、情報價值挖掘度高以及漏檢誤檢率低等突出作用。偵查人員依次采取數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理、數(shù)據(jù)倉庫構(gòu)建等技術(shù)方法,尋找和發(fā)現(xiàn)具有混沌屬性的離群動態(tài)性數(shù)據(jù)情報偵查源,從而挖掘與分析隱藏在其內(nèi)部的、與犯罪情勢具有關(guān)聯(lián)性的各種數(shù)理關(guān)系。同時,偵查人員通過對離群動態(tài)性數(shù)據(jù)情報偵查中離群動態(tài)性數(shù)據(jù)產(chǎn)生概率和頻率的分析,構(gòu)建離群動態(tài)性數(shù)據(jù)情報偵查的隨機(jī)離群動態(tài)性數(shù)據(jù)序列模型,然后對具有明顯混沌屬性的不同離群動態(tài)性數(shù)據(jù)進(jìn)行搜集和分類,促使偵查人員能夠及時對涉案離群動態(tài)性數(shù)據(jù)中的數(shù)據(jù)節(jié)點(diǎn)、數(shù)據(jù)路徑、數(shù)據(jù)距離等展開鏈路分析和預(yù)測。所以,在離群動態(tài)性數(shù)據(jù)情報偵查過程中,偵查人員能夠利用其混沌屬性提升離群動態(tài)性數(shù)據(jù)挖掘與分析的效能,從而全面提升離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用的客觀性和準(zhǔn)確性。

      3.離群動態(tài)性數(shù)據(jù)情報偵查的異常屬性

      離群動態(tài)性數(shù)據(jù)貫穿于離群動態(tài)性數(shù)據(jù)情報偵查的全過程,情報挖掘與分析的關(guān)鍵是掌握和應(yīng)用其中的模型構(gòu)建、關(guān)聯(lián)算法和數(shù)據(jù)變化趨勢,其主要任務(wù)包括對涉案離群動態(tài)性數(shù)據(jù)的關(guān)聯(lián)性分析、特征提取、模式識別以及異常檢測等。然而,偵查人員在對離群動態(tài)性數(shù)據(jù)的加權(quán)閾值進(jìn)行預(yù)設(shè)和識別時,往往會遇到正常的數(shù)據(jù)被模仿,離群動態(tài)性數(shù)據(jù)的閾值不斷變化,標(biāo)記性離群動態(tài)性數(shù)據(jù)難以獲取,離群動態(tài)性數(shù)據(jù)與正常數(shù)據(jù)存在高度相似性等突出問題,從而致使離群動態(tài)性數(shù)據(jù)情報偵查具有顯著的異常屬性。就離群動態(tài)性數(shù)據(jù)情報偵查異常屬性的構(gòu)成要素而言,可以將其分為拓?fù)洚惓傩院突旌袭惓傩詢深悺?/p>

      第一,離群動態(tài)性數(shù)據(jù)情報偵查的拓?fù)洚惓傩浴T陔x群動態(tài)性數(shù)據(jù)情報偵查的離群動態(tài)性數(shù)據(jù)源中,存在諸如原始動態(tài)性數(shù)據(jù)拓?fù)浣Y(jié)構(gòu)、抽象型動態(tài)性數(shù)據(jù)拓?fù)浣Y(jié)構(gòu)以及時空動態(tài)性數(shù)據(jù)拓?fù)浣Y(jié)構(gòu)等。這些不同類型或格式的拓?fù)洚惓=Y(jié)構(gòu)屬性可以用不同顏色對離群動態(tài)性數(shù)據(jù)中的數(shù)據(jù)節(jié)點(diǎn)、數(shù)據(jù)路徑、數(shù)據(jù)距離等進(jìn)行標(biāo)識,將其客觀、真實(shí)地反映在離群動態(tài)性數(shù)據(jù)情報偵查的指標(biāo)體系和流程模型構(gòu)建之中,從而有利于偵查人員根據(jù)不同類型或格式的拓?fù)洚惓kx群動態(tài)性數(shù)據(jù)而采取與之相對應(yīng)的離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法。

      第二,離群動態(tài)性數(shù)據(jù)情報偵查的混合異常屬性。偵查人員在對各種離群動態(tài)性數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理、數(shù)據(jù)解釋等過程中,不僅結(jié)合了霍金斯離群動態(tài)性數(shù)據(jù)算法、LOF離群動態(tài)性數(shù)據(jù)算法、時空維度離群動態(tài)性算法等多種離群動態(tài)性數(shù)據(jù)算法來挖掘各種具有潛在情報價值的關(guān)聯(lián)數(shù)理關(guān)系,還利用OCCRF模型來解析不同離群動態(tài)性數(shù)據(jù)拓?fù)浣Y(jié)構(gòu)的特征和屬性。誠然,不管是離群動態(tài)性數(shù)據(jù)情報偵查中離群動態(tài)性數(shù)據(jù)類型或格式的多樣性,還是各種離群動態(tài)性數(shù)據(jù)算法或模型的動態(tài)性和開放性,都突出了離群動態(tài)性數(shù)據(jù)情報偵查過程的混合異常屬性。因此,就離群動態(tài)性數(shù)據(jù)情報偵查的異常屬性而言,一方面,有利于偵查人員快速、準(zhǔn)確地尋找和發(fā)現(xiàn)具有拓?fù)洚惓;蚧旌袭惓傩缘牟煌x群動態(tài)性數(shù)據(jù);另一方面,有利于其構(gòu)建與數(shù)據(jù)化犯罪情勢發(fā)展態(tài)勢相適應(yīng)的離群動態(tài)性數(shù)據(jù)情報偵查指標(biāo)體系和流程模型,從而實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查決策和預(yù)測的高效性、準(zhǔn)確性。

      二、離群動態(tài)性數(shù)據(jù)情報偵查的指標(biāo)體系

      常規(guī)離群動態(tài)性數(shù)據(jù)挖掘與分析涉及評價指標(biāo)體系的兩個主要方面是如何度量離群動態(tài)性數(shù)據(jù)和如何有效發(fā)現(xiàn)離群動態(tài)性數(shù)據(jù)。[7]就離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用的應(yīng)然價值和實(shí)然效果而言,偵查人員的核心任務(wù)就是從結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、異構(gòu)化數(shù)據(jù)等不同動態(tài)性數(shù)據(jù)源中將與涉案犯罪情勢具有關(guān)聯(lián)性的各種離群動態(tài)性數(shù)據(jù)快速、準(zhǔn)確地挖掘出來,并加以分析。這需要首先解決如何度量離群動態(tài)性數(shù)據(jù)的前提問題,然后解決如何才能夠及時、有效地發(fā)現(xiàn)不同離群動態(tài)性數(shù)據(jù)的問題,最后才是考慮和選擇科學(xué)、合理的離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法的問題?;诖?,離群動態(tài)性數(shù)據(jù)情報偵查的指標(biāo)體系應(yīng)包括以下三個部分:確立離群動態(tài)性數(shù)據(jù)的度量標(biāo)準(zhǔn),建立監(jiān)督類型的離群動態(tài)性數(shù)據(jù),選擇符合離群動態(tài)性數(shù)據(jù)屬性的應(yīng)用算法。

      (一)確立離群動態(tài)性數(shù)據(jù)的度量標(biāo)準(zhǔn)

      離群動態(tài)性數(shù)據(jù)的度量標(biāo)準(zhǔn)要根據(jù)偵查人員的情報偵查經(jīng)驗和數(shù)據(jù)挖掘分析應(yīng)用而預(yù)設(shè)具體的度量指標(biāo)系數(shù)。由于離群動態(tài)性數(shù)據(jù)的產(chǎn)生具有明顯的不確定性,偵查人員通過不同數(shù)據(jù)算法所挖掘與分析出來的也僅僅是“疑似”的離群動態(tài)性數(shù)據(jù)。這些“疑似”的離群動態(tài)性數(shù)據(jù)是否與犯罪案件情勢的客觀實(shí)際相符合,應(yīng)該由負(fù)責(zé)情報偵查的具體偵查人員進(jìn)行驗證和決定,而不是依據(jù)各種離群動態(tài)性數(shù)據(jù)算法進(jìn)行解釋和說明。在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,采取常規(guī)離群動態(tài)性數(shù)據(jù)應(yīng)用算法尋找和發(fā)現(xiàn)的往往屬于少量、不規(guī)則的離群動態(tài)性數(shù)據(jù),這與離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用的應(yīng)然價值和實(shí)然效果不相符合。例如,偵查人員在確立離群動態(tài)性數(shù)據(jù)情報偵查的度量標(biāo)準(zhǔn)流程中,對具有共性特征的離群動態(tài)性數(shù)據(jù)可以采取合并同類項的度量標(biāo)準(zhǔn),對具有接近或相似特征的離群動態(tài)性數(shù)據(jù)可以采取相似度度量標(biāo)準(zhǔn),對具有連續(xù)加權(quán)閾值的離群動態(tài)性數(shù)據(jù)可以采取連續(xù)數(shù)值的度量標(biāo)準(zhǔn),對具有有序離群、二元離群屬性以及多元離群屬性的則可以采取混合離群的度量標(biāo)準(zhǔn)。因而,為了提高離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用的客觀性和準(zhǔn)確性,偵查人員應(yīng)該根據(jù)案件發(fā)展態(tài)勢而確立與之相適應(yīng)的離群動態(tài)性數(shù)據(jù)度量標(biāo)準(zhǔn)。

      (二)建立監(jiān)督類型的離群動態(tài)性數(shù)據(jù)

      在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,從涉案離群動態(tài)性數(shù)據(jù)是否具有正?;虍惓5念悩?biāo)號以及對類標(biāo)號的挖掘與分析程度而言,可以將離群動態(tài)性數(shù)據(jù)分為有監(jiān)督類型的離群動態(tài)性數(shù)據(jù)、無監(jiān)督類型的離群動態(tài)性數(shù)據(jù)以及半監(jiān)督類型的離群動態(tài)性數(shù)據(jù)。例如,針對涉案的犯罪主體數(shù)據(jù)、犯罪時空數(shù)據(jù)以及犯罪交易數(shù)據(jù)等具有類別化的離群動態(tài)性數(shù)據(jù),可以建立有監(jiān)督類型的離群動態(tài)性數(shù)據(jù);涉案沒有諸如上述類別化的離群動態(tài)性數(shù)據(jù),可以建立無監(jiān)督類型的離群動態(tài)性數(shù)據(jù);如果有常規(guī)的類別化離群動態(tài)性數(shù)據(jù),但與涉案犯罪情勢沒有內(nèi)在關(guān)聯(lián),則建立無監(jiān)督類型的離群動態(tài)性數(shù)據(jù)。就建立監(jiān)督類型的離群動態(tài)性數(shù)據(jù)的應(yīng)然目的而言,監(jiān)督類型的離群動態(tài)性數(shù)據(jù)本質(zhì)上是建立在對各種離群動態(tài)性數(shù)據(jù)的分類模型之上,然后對該類離群動態(tài)性數(shù)據(jù)進(jìn)行算法模型構(gòu)建,進(jìn)而挖掘、分析出其與案件情勢之間存在關(guān)聯(lián)性的潛在數(shù)理關(guān)系。無監(jiān)督類型和半監(jiān)督類型的離群動態(tài)性數(shù)據(jù),則屬于沒有類別化或即使有但無關(guān)聯(lián)性的不同離群動態(tài)性數(shù)據(jù)模型。誠然,偵查人員應(yīng)該在構(gòu)建離群動態(tài)性數(shù)據(jù)挖掘規(guī)則和數(shù)據(jù)倉庫模型之前根據(jù)不同類別的離群動態(tài)性數(shù)據(jù)而建立不同監(jiān)督類型的離群動態(tài)性數(shù)據(jù)。這不僅是進(jìn)行離群動態(tài)性數(shù)據(jù)情報偵查的基礎(chǔ)和前提條件,而且是采取離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法的內(nèi)在本質(zhì)需求。

      (三)選擇符合離群動態(tài)性數(shù)據(jù)屬性的應(yīng)用算法

      選擇科學(xué)、合理、有效的離群動態(tài)性數(shù)據(jù)應(yīng)用算法,不僅要有利于偵查人員實(shí)現(xiàn)情報偵查的應(yīng)然價值,而且要符合離群動態(tài)性數(shù)據(jù)內(nèi)在屬性的本質(zhì)要求。涉案犯罪情勢的離群動態(tài)性數(shù)據(jù)屬性既包括具有類別化分類屬性的離群動態(tài)性屬性,又包括具有加權(quán)閾值連續(xù)屬性的離群動態(tài)性數(shù)據(jù),具有鮮明的混合屬性特征。從離群動態(tài)性數(shù)據(jù)情報偵查所采取的技術(shù)算法而言,典型的離群動態(tài)性數(shù)據(jù)算法主要包括基于數(shù)據(jù)聚類、數(shù)據(jù)密度、數(shù)據(jù)距離、數(shù)據(jù)統(tǒng)計等方法。例如,基于數(shù)據(jù)聚類的離群動態(tài)性數(shù)據(jù)情報偵查算法主要是先將各種離群動態(tài)性數(shù)據(jù)進(jìn)行數(shù)據(jù)分簇預(yù)處理,讓各分簇內(nèi)不同離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)節(jié)點(diǎn)、數(shù)據(jù)路徑、數(shù)據(jù)距離等加權(quán)閾值系數(shù)能夠更加相似或接近,然后對數(shù)據(jù)聚類后不同簇類內(nèi)的離群動態(tài)性數(shù)據(jù)進(jìn)行挖掘與分析。顯然,在基于數(shù)據(jù)聚類的離群動態(tài)性數(shù)據(jù)情報偵查算法應(yīng)用中,有部分適用于具有類別化分類屬性的離群動態(tài)性數(shù)據(jù),也有部分適用于涉及犯罪交易、犯罪嫌疑人、犯罪行為等加權(quán)閾值連續(xù)屬性的離群動態(tài)性數(shù)據(jù)。而基于數(shù)據(jù)密度和數(shù)據(jù)距離的離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法都比較適合于大部分?jǐn)?shù)據(jù)加權(quán)閾值具有連續(xù)屬性的離群動態(tài)性數(shù)據(jù)。這兩種應(yīng)用算法具有數(shù)據(jù)收斂速度快、數(shù)據(jù)挖掘準(zhǔn)確度高等優(yōu)勢,但是其應(yīng)用算法的過程則具有耗時較長、關(guān)聯(lián)性不高、復(fù)雜性較強(qiáng)等特點(diǎn)。另外,基于數(shù)據(jù)統(tǒng)計的離群動態(tài)性數(shù)據(jù)應(yīng)用算法主要適用于具有類別化分類屬性的離群動態(tài)性數(shù)據(jù),如涉案離群動態(tài)性數(shù)據(jù)具有泊松分布、正態(tài)分布等類別化分類屬性,該應(yīng)用算法以統(tǒng)計學(xué)為建模核心且具有很強(qiáng)的普遍性和實(shí)用性。所以,離群動態(tài)性數(shù)據(jù)情報偵查的指標(biāo)體系在確立離群動態(tài)性數(shù)據(jù)的度量標(biāo)準(zhǔn)和建立監(jiān)督類型的離群動態(tài)性數(shù)據(jù)之后,偵查人員應(yīng)該根據(jù)涉案犯罪情勢屬性不同的離群動態(tài)性數(shù)據(jù)的情況選擇與之相符合的不同離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)用算法。

      三、離群動態(tài)性數(shù)據(jù)情報偵查的流程模型構(gòu)建

      在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,偵查人員會面對各種結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及異構(gòu)化數(shù)據(jù)等離群動態(tài)性數(shù)據(jù)。這些不同類型的數(shù)據(jù)構(gòu)成了離群動態(tài)性數(shù)據(jù)情報偵查源,從而為偵查人員開展離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策提供了客觀、準(zhǔn)確的數(shù)據(jù)支撐。如果這些涉案離群動態(tài)性數(shù)據(jù)不能夠及時、有效地被偵查人員所挖掘與分析,就有可能出現(xiàn)不利于案件情報偵查活動展開的“數(shù)據(jù)恐慌”,導(dǎo)致發(fā)生情報偵查錯誤,甚至陷入情報偵查僵局?;诖?,需要提出離群動態(tài)性數(shù)據(jù)情報偵查的流程模型構(gòu)建。結(jié)合離群動態(tài)性數(shù)據(jù)的屬性范疇和情報偵查價值實(shí)現(xiàn)的途徑范式,筆者認(rèn)為,應(yīng)該將離群動態(tài)性數(shù)據(jù)情報偵查的流程模型構(gòu)建分為離群動態(tài)性數(shù)據(jù)采集預(yù)處理模塊、離群動態(tài)性數(shù)據(jù)挖掘分析模塊、離群動態(tài)性數(shù)據(jù)模式更新模塊以及離群動態(tài)性數(shù)據(jù)情報偵查決策模塊四部分(見圖1)。

      圖1 離群動態(tài)性數(shù)據(jù)情報偵查的流程模型圖

      (一)離群動態(tài)性數(shù)據(jù)采集預(yù)處理模塊

      離群動態(tài)性數(shù)據(jù)采集預(yù)處理模塊的主要任務(wù)是完成對不同離群動態(tài)性數(shù)據(jù)情報偵查源的處理。在對各種離群動態(tài)性數(shù)據(jù)情報偵查源進(jìn)行有效的數(shù)據(jù)采集、數(shù)據(jù)分類、數(shù)據(jù)清洗等數(shù)據(jù)技術(shù)處理之后,該程序就會及時對被采集預(yù)處理后的部分離群動態(tài)性數(shù)據(jù)進(jìn)行數(shù)據(jù)倉庫構(gòu)建和關(guān)聯(lián)規(guī)則的平臺設(shè)計。然后,偵查人員根據(jù)數(shù)據(jù)節(jié)點(diǎn)、數(shù)據(jù)路徑、數(shù)據(jù)距離等對數(shù)據(jù)倉庫構(gòu)建后的離群動態(tài)性數(shù)據(jù)進(jìn)行加權(quán)閾值系數(shù)的契合度排序處理,使其在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法中成為關(guān)鍵性組成部分。同時,在離群動態(tài)性數(shù)據(jù)采集預(yù)處理模塊的流程中,偵查人員還可以采取Bro數(shù)據(jù)檢測技術(shù)方法對該模塊中的離群動態(tài)性數(shù)據(jù)進(jìn)行預(yù)處理。這不僅有利于在離群動態(tài)性數(shù)據(jù)采集預(yù)處理模塊流程中實(shí)現(xiàn)對各種離群動態(tài)性數(shù)據(jù)流的過濾和重組,而且有利于產(chǎn)生和形成與涉案犯罪情勢具有特定內(nèi)在數(shù)理關(guān)系的關(guān)聯(lián)規(guī)則,從而幫助偵查人員全面實(shí)現(xiàn)提升離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用流程的質(zhì)效。

      (二)離群動態(tài)性數(shù)據(jù)挖掘分析模塊

      離群動態(tài)性數(shù)據(jù)挖掘分析模塊的主要任務(wù)就是采取不同的離群動態(tài)性數(shù)據(jù)情報偵查算法,對經(jīng)過采集預(yù)處理的各種離群動態(tài)性數(shù)據(jù)倉庫進(jìn)行深入搜索和挖掘。數(shù)據(jù)倉庫中不僅存儲著海量復(fù)雜的離群動態(tài)性數(shù)據(jù),而且各個離群動態(tài)性數(shù)據(jù)之間的數(shù)據(jù)節(jié)點(diǎn)、數(shù)據(jù)距離、數(shù)據(jù)路徑等加權(quán)閾值屬性等互不相同且差異性較大。如果偵查人員采用傳統(tǒng)常規(guī)的離群動態(tài)性數(shù)據(jù)算法對其進(jìn)行挖掘與分析,那么所挖掘與分析出來的各種內(nèi)在數(shù)理關(guān)系的關(guān)聯(lián)性則屬于弱相關(guān),嚴(yán)重制約或影響了離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策的準(zhǔn)確性。誠然,為了實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)挖掘分析模塊的應(yīng)然流程價值,就必須變革傳統(tǒng)常規(guī)離群動態(tài)性數(shù)據(jù)挖掘分析技術(shù)方法。例如,在離群動態(tài)性數(shù)據(jù)挖掘分析模塊應(yīng)用中,偵查人員可以采取具有軸屬性和頻繁數(shù)據(jù)模式的IREP算法。IREP算法不僅能夠?qū)Σ煌瑢傩缘碾x群動態(tài)性數(shù)據(jù)進(jìn)行有效的類別化分類處理,而且能夠通過構(gòu)建數(shù)據(jù)規(guī)則而挖掘與分析出各個離群動態(tài)性數(shù)據(jù)在涉案犯罪情勢中的關(guān)聯(lián)價值大小。

      在離群動態(tài)性數(shù)據(jù)挖掘分析模塊流程中最為關(guān)鍵性的問題就是對不同離群動態(tài)性數(shù)據(jù)的特征屬性進(jìn)行選擇,偵查人員在對其選擇時可以依據(jù)已構(gòu)建的數(shù)據(jù)倉庫和形成的關(guān)聯(lián)規(guī)則進(jìn)行挖掘與分析。根據(jù)離群動態(tài)性數(shù)據(jù)之間的不同屬性特征,偵查人員可以采取以下具有典型代表性的挖掘分析算法:第一,關(guān)聯(lián)挖掘分析算法。該算法主要是根據(jù)偵查人員在已構(gòu)建的數(shù)據(jù)倉庫中存儲的不同離群動態(tài)性數(shù)據(jù)屬性的差異性,利用各個離群動態(tài)性數(shù)據(jù)與涉嫌犯罪情勢之間存在的內(nèi)在關(guān)聯(lián)數(shù)理關(guān)系進(jìn)行挖掘分析。第二,分類挖掘分析算法。偵查人員首先將經(jīng)過采集預(yù)處理后的所有離群動態(tài)性數(shù)據(jù)依據(jù)不同類別進(jìn)行分類映射,然后采取數(shù)據(jù)分類器的模式使其形成輸出結(jié)果,最后建立離群動態(tài)性數(shù)據(jù)的分類規(guī)則庫和分類決策樹,從而實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)挖掘分析模塊流程的價值目的。第三,序列挖掘分析算法。偵查人員采取該算法能夠?qū)ι嫦臃缸锴閯葜蓄l繁出現(xiàn)且具有序列性的犯罪時空數(shù)據(jù)、犯罪情節(jié)數(shù)據(jù)等離群動態(tài)性數(shù)據(jù)進(jìn)行檢索和統(tǒng)計,然后將其作為偵查人員進(jìn)行離群動態(tài)性數(shù)據(jù)挖掘分析時的模型和規(guī)則。

      (三)離群動態(tài)性數(shù)據(jù)模式更新模塊

      該模塊流程應(yīng)用的核心功能是,偵查人員根據(jù)涉案犯罪情勢發(fā)展變化的不同態(tài)勢而對離群動態(tài)性數(shù)據(jù)挖掘與分析應(yīng)用算法給予及時的修正和更新,從而確保離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策的高效性、精確性。就離群動態(tài)性數(shù)據(jù)情報偵查中的不同離群動態(tài)性數(shù)據(jù)源而言,其具有動態(tài)性、開放性、系統(tǒng)性、離散性等混沌特征,造成所搜集和獲取的各種離群動態(tài)性數(shù)據(jù)在不同流程應(yīng)用階段也呈現(xiàn)出不同的屬性。誠然,現(xiàn)有的各種離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法也并不是完全合適或一成不變的,這就需要偵查人員隨時根據(jù)數(shù)據(jù)化犯罪情勢變化發(fā)展的不同態(tài)勢而發(fā)現(xiàn)和尋找新的離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法,進(jìn)而保障離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法的新穎性和適應(yīng)性。所以,在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,偵查人員除了需要對不同離群動態(tài)性數(shù)據(jù)進(jìn)行挖掘與分析之外,還需要時刻對離群動態(tài)性數(shù)據(jù)的模式進(jìn)行修正和更新。這也是實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)然價值和實(shí)際效果的內(nèi)在本質(zhì)要求。

      (四)離群動態(tài)性數(shù)據(jù)情報偵查決策模塊

      離群動態(tài)性數(shù)據(jù)情報偵查決策模塊的主要任務(wù)是將當(dāng)前已統(tǒng)計和存儲的各種犯罪行為和非犯罪行為規(guī)則與數(shù)據(jù)倉庫中數(shù)據(jù)化生存的犯罪情勢進(jìn)行比對和分析,并對與涉案犯罪情勢具有內(nèi)在關(guān)聯(lián)數(shù)理關(guān)系的不同離群動態(tài)性數(shù)據(jù)進(jìn)行挖掘與判斷,從而為離群動態(tài)性數(shù)據(jù)情報偵查的預(yù)測和決策提供數(shù)據(jù)情報的支持和保障。在離群動態(tài)性數(shù)據(jù)情報偵查決策模塊應(yīng)用中,偵查人員可以根據(jù)離群動態(tài)性數(shù)據(jù)挖掘分析模塊中類別化分類結(jié)果對其進(jìn)行偵查決策的相似度匹配檢驗。一般而言,在離群動態(tài)性數(shù)據(jù)情報偵查決策模塊流程中,往往采取0-1之間的數(shù)據(jù)加權(quán)閾值系數(shù)來表示其決策準(zhǔn)確性和高效性的檢測匹配度。如果離群動態(tài)性數(shù)據(jù)情報偵查決策的相似度匹配檢測系數(shù)越高,就說明離群動態(tài)性數(shù)據(jù)情報偵查決策越準(zhǔn)確和高效;反之,則說明離群動態(tài)性數(shù)據(jù)情報偵查決策的準(zhǔn)確性和高效性越低。

      四、離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)用算法

      在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,各種不同類型和屬性的離群動態(tài)性數(shù)據(jù)通過有線或無線形式進(jìn)行傳輸與控制,其與涉嫌犯罪情勢之間內(nèi)在的關(guān)聯(lián)數(shù)理關(guān)系越來越受到偵查人員的關(guān)注和重視。對離群動態(tài)性數(shù)據(jù)進(jìn)行準(zhǔn)確挖掘和分析,確定其關(guān)聯(lián)規(guī)則的數(shù)據(jù)閾值屬性,是實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)然價值和實(shí)然效果的必然要求。離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用算法通過對涉案離群動態(tài)性數(shù)據(jù)進(jìn)行數(shù)據(jù)時序的統(tǒng)計與分析,結(jié)合各離群動態(tài)性數(shù)據(jù)的屬性特征和情報偵查的價值需求,采取霍金斯離群動態(tài)性數(shù)據(jù)算法、LOF離群動態(tài)性數(shù)據(jù)算法、時空維度離群動態(tài)性算法等離群動態(tài)性數(shù)據(jù)算法挖掘與分析其與涉案犯罪情勢之間內(nèi)在的各種關(guān)聯(lián)數(shù)理關(guān)系,從而幫助偵查人員提高離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策的高效性、準(zhǔn)確性。因此,在智慧驅(qū)動時代,應(yīng)該賦予離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用新的方法。這不僅是將離群動態(tài)性數(shù)據(jù)與情報偵查進(jìn)行結(jié)合和融合的應(yīng)然要求,還是打擊和預(yù)防數(shù)據(jù)化犯罪的實(shí)然需求。

      (一)霍金斯離群動態(tài)性數(shù)據(jù)算法

      霍金斯離群動態(tài)性數(shù)據(jù)算法是一種基于神經(jīng)網(wǎng)絡(luò)的BP神經(jīng)網(wǎng)絡(luò)的算法。其算法的原理是,挖掘分析離群動態(tài)性數(shù)據(jù)最優(yōu)的連接加權(quán)閾值集群,得到涉案關(guān)聯(lián)數(shù)理關(guān)系的挖掘結(jié)果后將其直接存儲到預(yù)設(shè)的離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)聚類區(qū)域之中,從而為離群動態(tài)性數(shù)據(jù)情報偵查的預(yù)測和決策提供數(shù)據(jù)支持和保障。在霍金斯離群動態(tài)性數(shù)據(jù)算法應(yīng)用過程中,偵查人員需要提前設(shè)置涉案離群動態(tài)性數(shù)據(jù)加權(quán)閾值集群的數(shù)據(jù)點(diǎn),該數(shù)據(jù)點(diǎn)的閾值范圍可設(shè)在(-1-1)區(qū)間,可以通過修正加權(quán)閾值的區(qū)間梯度來統(tǒng)計分析涉案不同離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)節(jié)點(diǎn)、數(shù)據(jù)路徑等數(shù)據(jù)結(jié)構(gòu),從而實(shí)現(xiàn)降低離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策誤差率、漏檢率等應(yīng)用效果。同時,預(yù)設(shè)涉案離群動態(tài)性數(shù)據(jù)的維度閾值為M,霍金斯離群動態(tài)性數(shù)據(jù)算法潛在隱含的關(guān)聯(lián)數(shù)據(jù)節(jié)點(diǎn)為K個,而該算法中離群動態(tài)性數(shù)據(jù)的關(guān)聯(lián)聚類區(qū)間閾值為C,那么霍金斯離群動態(tài)性數(shù)據(jù)算法在離群動態(tài)性數(shù)據(jù)情報偵查中的應(yīng)用即可表示為:C1,C2,C3,...,CK。根據(jù)涉案離群動態(tài)性數(shù)據(jù)的不同屬性特征,一方面,偵查人員可以對處于離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)聚類區(qū)的各種離群動態(tài)性數(shù)據(jù)進(jìn)行統(tǒng)計和訓(xùn)練,促使其算法中輸入層和輸出層的離群動態(tài)性數(shù)據(jù)能夠與挖掘分析的結(jié)果形成數(shù)據(jù)的互相映射關(guān)系;另一方面,對霍金斯離群動態(tài)性數(shù)據(jù)算法模型中處于“休眠”狀態(tài)、隱含的離群動態(tài)性數(shù)據(jù)進(jìn)行激活,使其將輸入層離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)連接加強(qiáng)閾值系數(shù)自動轉(zhuǎn)換為一個非線性的離群動態(tài)性數(shù)據(jù)驅(qū)動函數(shù)。顯然,霍金斯離群動態(tài)性數(shù)據(jù)算法對傳統(tǒng)實(shí)體的離群動態(tài)性數(shù)據(jù)算法在數(shù)據(jù)序列挖掘方面給予了優(yōu)化和重構(gòu),使得離群動態(tài)性數(shù)據(jù)情報偵查所得到的關(guān)聯(lián)數(shù)理關(guān)系更加精確化(見圖2)。

      圖2 霍金斯離群動態(tài)性數(shù)據(jù)算法原理

      根據(jù)離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策的應(yīng)用要求,偵查人員可以將所獲得的挖掘分析結(jié)果作數(shù)據(jù)降維、剔除無用屬性與全局歸一化等數(shù)據(jù)處理,將霍金斯離群動態(tài)性數(shù)據(jù)算法處理后輸出與涉案犯罪情勢內(nèi)在關(guān)聯(lián)的數(shù)理關(guān)系關(guān)聯(lián)度數(shù)據(jù),作為離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策的依據(jù)。偵查人員按照所獲不同關(guān)聯(lián)數(shù)理關(guān)系的關(guān)聯(lián)度順序系數(shù),及時、有效激活霍金斯離群動態(tài)性數(shù)據(jù)算法中輸出層和隱藏層的離群動態(tài)性數(shù)據(jù)連接節(jié)點(diǎn),使霍金斯離群動態(tài)性數(shù)據(jù)算法的輸入層更加快速和準(zhǔn)確,從而最大限度地獲取離群動態(tài)性數(shù)據(jù)的最優(yōu)連接加權(quán)閾值集群,最終幫助偵查人員全面提升離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用的分類效能和挖掘精度。

      (二)LOF離群動態(tài)性數(shù)據(jù)算法

      LOF算法通過計算數(shù)據(jù)對象的局部偏離因子(LOF)來評估一個對象可能是離群點(diǎn)的程度,即評介該對象相對于周圍領(lǐng)域的孤立程度。[8]LOF離群動態(tài)性數(shù)據(jù)算法屬于一種基于數(shù)據(jù)密度離群點(diǎn)的應(yīng)用算法,主要任務(wù)是統(tǒng)計與歸納各種離群動態(tài)性數(shù)據(jù)的局部離群加權(quán)系數(shù),從而實(shí)現(xiàn)對不同離群動態(tài)性數(shù)據(jù)中關(guān)聯(lián)數(shù)理關(guān)系偏離相似度的挖掘與分析。在LOF離群動態(tài)性數(shù)據(jù)算法運(yùn)用過程中,偵查人員根據(jù)涉案各種離群動態(tài)性數(shù)據(jù)情報偵查源而預(yù)設(shè)離群動態(tài)性數(shù)據(jù)的最少離群相鄰數(shù)K和最近相鄰數(shù)據(jù)距離來確定離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)領(lǐng)域,通過對數(shù)據(jù)倉庫中離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)K距離、可達(dá)數(shù)據(jù)密度以及可達(dá)數(shù)據(jù)距離等的運(yùn)算,采用不同離群動態(tài)性數(shù)據(jù)的平均可達(dá)密度和其自身可達(dá)數(shù)據(jù)密度之間的對比系數(shù)來表示LOF,然后依據(jù)LOF運(yùn)算所得符合預(yù)設(shè)閾值的N個動態(tài)性數(shù)據(jù)即為離群動態(tài)性數(shù)據(jù)對象。顯然,LOF離群動態(tài)性數(shù)據(jù)算法具有對離群動態(tài)性數(shù)據(jù)收斂速度快和數(shù)據(jù)密度離群點(diǎn)聚類速度快等顯著的高效性特征。

      為了實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)然價值,提高其實(shí)際應(yīng)用效果,根據(jù)涉案離群動態(tài)性數(shù)據(jù)不同數(shù)據(jù)密度離群點(diǎn)的可達(dá)距離范疇,LOF離群動態(tài)性數(shù)據(jù)算法的具體步驟如下:

      第一步,檢查離群動態(tài)性數(shù)據(jù)的訪問對象。偵查人員首先要檢查涉案離群動態(tài)性數(shù)據(jù)情報偵查源中有沒有被訪問的離群動態(tài)性數(shù)據(jù)對象P,目的是排查其是否已被歸入某個數(shù)據(jù)關(guān)聯(lián)聚類區(qū)域或被標(biāo)識為離群動態(tài)性數(shù)據(jù)。重點(diǎn)檢查該離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)領(lǐng)域Nε(P),如果Nε(P)內(nèi)包含的離群動態(tài)性數(shù)據(jù)數(shù)目等于或大于Minpts,那么就需要建立新的離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)聚類區(qū)域C,并將離群動態(tài)性數(shù)據(jù)對象P和其相鄰的離群動態(tài)性數(shù)據(jù)都并入到該關(guān)聯(lián)聚類區(qū)域C中。

      第二步,分析離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)領(lǐng)域Nε(P)。在經(jīng)過第一步檢查離群動態(tài)性數(shù)據(jù)的訪問對象之后,偵查人員需要進(jìn)一步尋找和發(fā)現(xiàn)在離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)聚類區(qū)域C內(nèi)是否沒有被LOF離群動態(tài)性數(shù)據(jù)算法所應(yīng)用的離群動態(tài)性數(shù)據(jù)對象Q。如果數(shù)據(jù)領(lǐng)域Nε(P)內(nèi)的離群動態(tài)性數(shù)據(jù)Q沒有被LOF離群動態(tài)性數(shù)據(jù)算法所挖掘與分析,那么就需要將該數(shù)據(jù)領(lǐng)域Nε(P)內(nèi)的所有離群動態(tài)性數(shù)據(jù)Q重新進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)倉庫構(gòu)建,使其能夠快速、有效地進(jìn)入到LOF離群動態(tài)性數(shù)據(jù)算法的流程之中。

      第三步,離群動態(tài)性數(shù)據(jù)檢驗。為了全面提升LOF離群動態(tài)性數(shù)據(jù)算法的高效性和關(guān)聯(lián)聚類性,偵查人員需要重復(fù)第一步到第二步的算法流程,直到所有關(guān)聯(lián)聚類區(qū)域C內(nèi)的離群動態(tài)性數(shù)據(jù)均被挖掘與分析為止。

      第四步,應(yīng)用被標(biāo)識的離群動態(tài)性數(shù)據(jù)。使用該算法對離群動態(tài)性數(shù)據(jù)進(jìn)行檢驗的主要目的是,讓所有的涉案離群動態(tài)性數(shù)據(jù)都能夠被無漏缺地訪問過,促使與涉案犯罪情勢具有內(nèi)在關(guān)聯(lián)數(shù)理關(guān)系的各種離群動態(tài)性數(shù)據(jù)能夠被準(zhǔn)確、高效地標(biāo)識和挖掘分析。誠然,在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,LOF離群動態(tài)性數(shù)據(jù)算法的實(shí)際效果主要受到離群動態(tài)性數(shù)據(jù)參數(shù)ε和離群動態(tài)性數(shù)據(jù)的數(shù)目Minpts兩者的影響和制約。在離群動態(tài)性數(shù)據(jù)數(shù)目Minpts相同的情況下,選擇的離群動態(tài)性數(shù)據(jù)參數(shù)ε越小,那么離群動態(tài)性數(shù)據(jù)的關(guān)聯(lián)聚類密度就越高。但是,如果選擇的離群動態(tài)性數(shù)據(jù)參數(shù)ε過小,就會導(dǎo)致大量動態(tài)性數(shù)據(jù)被誤訪問和標(biāo)識為離群動態(tài)性數(shù)據(jù);如果選擇的離群動態(tài)性數(shù)據(jù)參數(shù)ε過大,則會造成部分離群動態(tài)性數(shù)據(jù)被分類劃歸于其他離群動態(tài)性數(shù)據(jù)的關(guān)聯(lián)聚類區(qū)域內(nèi)。[9]同理,在離群動態(tài)性數(shù)據(jù)參數(shù)ε相同的情況下,選擇的離群動態(tài)性數(shù)據(jù)數(shù)目Minpts越大,離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)聚類的密度就越高,但過大的離群動態(tài)性數(shù)據(jù)數(shù)目Minpts會導(dǎo)致部分含有離群動態(tài)性數(shù)據(jù)的關(guān)聯(lián)聚類區(qū)域被漏檢,容易將正常的各種動態(tài)性數(shù)據(jù)被誤認(rèn)為屬于離群動態(tài)性數(shù)據(jù);反之,會造成將某些離群動態(tài)性數(shù)據(jù)分類劃歸于不同的離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)區(qū)域。所以,在LOF離群動態(tài)性數(shù)據(jù)算法應(yīng)用的具體過程中,偵查人員應(yīng)該根據(jù)涉案犯罪情勢變化發(fā)展的不同態(tài)勢而選擇科學(xué)、合理的離群動態(tài)性數(shù)據(jù)參數(shù)ε和離群動態(tài)性數(shù)據(jù)的數(shù)目Minpts,以避免出現(xiàn)選擇數(shù)據(jù)過大或過小現(xiàn)象的出現(xiàn)。這不僅有利于降低LOF離群動態(tài)性數(shù)據(jù)算法的漏檢率和誤檢率,還有利于全面提高離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用結(jié)果的準(zhǔn)確性和客觀性。

      (三)時空維度離群動態(tài)性數(shù)據(jù)算法

      空間離群值是指非時空值與其加權(quán)相鄰存在明顯異常的閾值,這表明與其存在異常的閾值是個體范疇而不是總體范疇。顯然,從空間離群值的概念可以拓展出時空離群值的內(nèi)涵,即是指時空個體與加權(quán)相鄰的時間和空間存在顯著異常的非時空閾值。[10]在時空維度離群動態(tài)性數(shù)據(jù)算法應(yīng)用過程中,偵查人員先通過對涉案離群動態(tài)性數(shù)據(jù)中各個數(shù)據(jù)節(jié)點(diǎn)、數(shù)據(jù)路徑、數(shù)據(jù)距離以及其與加權(quán)相鄰數(shù)據(jù)之間的關(guān)系進(jìn)行預(yù)設(shè)閾值,利用該預(yù)設(shè)閾值對非時空閾值的離群動態(tài)性數(shù)據(jù)從時空維度給予限制。從時空維度范疇而言,由于涉案時空離群動態(tài)性數(shù)據(jù)大部分主要以面板數(shù)據(jù)的格式存在,面板數(shù)據(jù)即是在涉嫌犯罪時空離群動態(tài)性數(shù)據(jù)序列上獲取多個截面,而在這些截面上所尋找和選擇的樣本離群動態(tài)性數(shù)據(jù)檢測值就會自動完成離群動態(tài)性數(shù)據(jù)情報偵查的數(shù)據(jù)倉庫構(gòu)建。雖然偵查人員所獲取的面板數(shù)據(jù)頻繁項目集可能存在離群動態(tài)性數(shù)據(jù)個體之間的差異性,但是單一的時間維度或空間維度的離群動態(tài)性數(shù)據(jù)并不能準(zhǔn)確、客觀地反映其內(nèi)在本質(zhì)的差異閾值。偵查人員通過對面板數(shù)據(jù)的深入挖掘與分析,能夠獲取與涉案犯罪情勢之間具有更多共性、動態(tài)性、雙層性的情報價值。

      在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,結(jié)合時空維度離群動態(tài)性數(shù)據(jù)的數(shù)據(jù)流屬性和涉案犯罪情勢發(fā)展變化的不同態(tài)勢,可以將時空維度離群動態(tài)性數(shù)據(jù)算法具體分為以下幾個步驟:

      第一步,挖掘獲取滑動窗口的離群動態(tài)性數(shù)據(jù)閾值。根據(jù)涉案離群動態(tài)性數(shù)據(jù)時空維度的屬性,偵查人員可以采用具有時空維度特征的類別化分類聚類技術(shù)方法,通過對其與加權(quán)相鄰數(shù)據(jù)之間關(guān)系閾值的預(yù)設(shè)與挖掘,統(tǒng)計并獲取該涉案面板數(shù)據(jù)頻繁項目集的數(shù)據(jù)聚類?;诖耍瑐刹槿藛T依據(jù)本次數(shù)據(jù)聚類結(jié)果可以挖掘獲取滑動窗口的離群動態(tài)性數(shù)據(jù)閾值。

      第二步,利用一次指數(shù)平滑算法進(jìn)行離群動態(tài)性數(shù)據(jù)的遞推。根據(jù)時空維度離群動態(tài)性數(shù)據(jù)算法的價值優(yōu)勢和實(shí)現(xiàn)要求,可以將一次指數(shù)平滑算法的遞推關(guān)系表示為:Si=AXi+(1-A)Si-1。其中,A表示數(shù)據(jù)倉庫中離群動態(tài)性數(shù)據(jù)的平滑系數(shù),Si表示之前i個離群動態(tài)性數(shù)據(jù)的平滑閾值,且取值區(qū)域為[0,1]。A越接近1,說明平滑后的離群動態(tài)性數(shù)據(jù)閾值越接近當(dāng)前的離群動態(tài)性數(shù)據(jù)平滑閾值,表明該離群動態(tài)性數(shù)據(jù)呈現(xiàn)出不平滑的狀態(tài);反之,A越接近0,說明平滑后的離群動態(tài)性數(shù)據(jù)閾值越接近前i個離群動態(tài)性數(shù)據(jù)平滑閾值,該離群動態(tài)性數(shù)據(jù)呈現(xiàn)出平滑的狀態(tài)。為了提升時空維度離群動態(tài)性數(shù)據(jù)算法的準(zhǔn)確性和精確度,偵查人員可以反復(fù)利用該一次指數(shù)平滑算法對涉案的不同離群動態(tài)性數(shù)據(jù)進(jìn)行遞推預(yù)測。

      第三步,利用二次指數(shù)平滑算法進(jìn)行趨勢預(yù)測。偵查人員運(yùn)用一次指數(shù)平滑算法雖然能夠記錄和存儲當(dāng)前最后一個離群動態(tài)性數(shù)據(jù)i的數(shù)據(jù)坐標(biāo),但是并不能反映和揭示該離群動態(tài)性數(shù)據(jù)變化發(fā)展的時空維度生存態(tài)勢。然而,二次指數(shù)平滑算法不僅包含了一次指數(shù)平滑算法對離群動態(tài)性數(shù)據(jù)的遞推函數(shù)關(guān)系,而且能夠幫助偵查人員通過添加新的函數(shù)變量T來對涉案離群動態(tài)性數(shù)據(jù)進(jìn)行趨勢預(yù)測。其中,二次指數(shù)平滑算法表示為Si=AXi+(1-A)(Si-1+Ti-1),而二次指數(shù)平滑算法的趨勢預(yù)測公式則為Xi+H=Si+HTi。顯然,二次指數(shù)平滑算法對涉案離群動態(tài)性數(shù)據(jù)的趨勢預(yù)測呈現(xiàn)為傾斜的一條直線。

      第四步,通過三次指數(shù)平滑算法實(shí)現(xiàn)情報偵查預(yù)測和決策。三次指數(shù)平滑算法在經(jīng)過二次指數(shù)平滑算法之后保留了涉案離群動態(tài)性數(shù)據(jù)的季節(jié)性情報信息,使其具有對離群動態(tài)性數(shù)據(jù)進(jìn)行時空維度的季節(jié)性預(yù)測的功能。偵查人員采取累加或累乘的三次指數(shù)平滑算法之后,就會挖掘和獲取到與涉案犯罪情勢有關(guān)的各種關(guān)聯(lián)數(shù)理關(guān)系,直接將其應(yīng)用到離群動態(tài)性數(shù)據(jù)情報偵查的預(yù)測和決策過程中即可。因此,在時空維度離群動態(tài)性數(shù)據(jù)算法的應(yīng)用過程中,偵查人員不僅能夠通過滑動窗口模型快速、有效地對涉案離群動態(tài)性數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)倉庫構(gòu)建,而且能夠?qū)ζ湔归_時空維度的季節(jié)性趨勢預(yù)測,為離群動態(tài)性數(shù)據(jù)情報偵查的預(yù)測和決策提供高效、客觀的數(shù)據(jù)支持和保障。

      (四)模糊孤立森林離群動態(tài)性數(shù)據(jù)算法

      根據(jù)涉案離群動態(tài)性數(shù)據(jù)異常屬性的差異性,引入模糊孤立森林的離群動態(tài)性數(shù)據(jù)算法。偵查人員可以在傳統(tǒng)孤立森林算法的基礎(chǔ)上引入離群動態(tài)性數(shù)據(jù)的隸屬度權(quán)重系數(shù),從而利用模糊綜合評價的方法對涉案不同離群動態(tài)性數(shù)據(jù)進(jìn)行綜合的挖掘與分析應(yīng)用,即形成具有隸屬度權(quán)重系數(shù)和模糊屬性的模糊孤立森林離群動態(tài)性數(shù)據(jù)算法。簡言之,模糊孤立森林離群動態(tài)性數(shù)據(jù)算法主要是通過數(shù)據(jù)集成、數(shù)據(jù)倉庫存儲部分具有典型代表性的離群動態(tài)性數(shù)據(jù)并對其分別進(jìn)行建樹和構(gòu)建孤立森林模型,對每個離群動態(tài)性數(shù)據(jù)的挖掘與分析結(jié)果采取隸屬度權(quán)重系數(shù)的審查和判斷,再利用模糊矩陣對審查判斷后的離群動態(tài)性數(shù)據(jù)進(jìn)行模糊運(yùn)算并獲取最終的應(yīng)用檢驗結(jié)果。[11]結(jié)合離群動態(tài)性數(shù)據(jù)情報偵查的指標(biāo)體系和流程模型構(gòu)建,模糊孤立森林離群動態(tài)性數(shù)據(jù)算法可采取以下具體步驟:

      第一步,發(fā)現(xiàn)和確定離群動態(tài)性數(shù)據(jù)情報偵查的頻繁項目集合U。其中,Ui表示涉案離群動態(tài)性數(shù)據(jù)的簇類,m表示離群動態(tài)性數(shù)據(jù)的項目個數(shù),即離群動態(tài)性數(shù)據(jù)情報偵查的頻繁項目集合為U=(U1,U2,U3,...,Um)。

      第二步,確定離群動態(tài)性數(shù)據(jù)情報偵查的關(guān)聯(lián)規(guī)則集合V。Vi表示可能存在與涉案犯罪情勢具有各種數(shù)理關(guān)系的關(guān)聯(lián)規(guī)則,n表示離群動態(tài)性數(shù)據(jù)情報偵查構(gòu)建關(guān)聯(lián)規(guī)則的數(shù)目,而離群動態(tài)性數(shù)據(jù)情報偵查的關(guān)聯(lián)規(guī)則集合則表示為V=(V1,V2,V3,...,Vn)。

      第三步,單個離群動態(tài)性數(shù)據(jù)的挖掘分析。為了提升離群動態(tài)性數(shù)據(jù)情報偵查價值挖掘的高容量目標(biāo),偵查人員在構(gòu)建離群動態(tài)性數(shù)據(jù)情報偵查頻繁項目數(shù)據(jù)集倉庫之后,就需要對其倉庫中每個離群動態(tài)性數(shù)據(jù)采取Ui的定量關(guān)聯(lián)挖掘分析,從而幫助偵查人員研判其在全部離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)規(guī)則集合中的隸屬度關(guān)系和作用。

      第四步,分析離群動態(tài)性數(shù)據(jù)的模糊數(shù)據(jù)隸屬度加權(quán)系數(shù)。由于不同的離群動態(tài)性數(shù)據(jù)在離群動態(tài)性數(shù)據(jù)情報偵查中的價值作用是互不相同的,故需要偵查人員對每個離群動態(tài)性數(shù)據(jù)均進(jìn)行數(shù)據(jù)隸屬度加權(quán)系數(shù)的分析和歸納。同時,形成一個客觀、準(zhǔn)確的模糊離群動態(tài)性數(shù)據(jù)隸屬度集合,從而通過孤立森林離群動態(tài)性數(shù)據(jù)算法運(yùn)算和挖掘不同離群動態(tài)性數(shù)據(jù)的離群閾值。

      第五步,離群動態(tài)性數(shù)據(jù)情報偵查的價值指向分析。利用離群動態(tài)性數(shù)據(jù)的量子算法將上述離群動態(tài)性數(shù)據(jù)情報偵查的頻繁項目集合和其構(gòu)建的關(guān)聯(lián)規(guī)則集合進(jìn)行數(shù)據(jù)矩陣的聚類計算,從而獲取不同離群動態(tài)性數(shù)據(jù)在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用中的不同價值指向。

      第六步,模糊孤立森林離群動態(tài)性數(shù)據(jù)算法應(yīng)用結(jié)果的評價。在離群動態(tài)性數(shù)據(jù)情報偵查挖掘與分析應(yīng)用過程中,偵查人員可以用數(shù)據(jù)秩(1,2,3,...,p)來表示不同離群動態(tài)性數(shù)據(jù)在其所屬頻繁項目集合中的相對等級位置,促使不同離群動態(tài)性數(shù)據(jù)的價值作用在離群動態(tài)性數(shù)據(jù)情報偵查中呈現(xiàn)出連續(xù)化發(fā)展態(tài)勢,然后利用已挖掘獲取的離群動態(tài)性數(shù)據(jù)關(guān)聯(lián)數(shù)理關(guān)系的向量屬性與其在離群動態(tài)性數(shù)據(jù)情報偵查中的數(shù)據(jù)秩的相對等級位置進(jìn)行互相求和,即可獲取到該模糊孤立森林離群動態(tài)性數(shù)據(jù)算法的應(yīng)用結(jié)果評價。

      可見,模糊孤立森林離群動態(tài)性數(shù)據(jù)算法能夠幫助偵查人員從多維度對涉案離群動態(tài)性數(shù)據(jù)展開挖掘與分析,不僅使對涉案離群動態(tài)性數(shù)據(jù)的挖掘分析廣度與深度更加全面和合理,而且能夠促使離群動態(tài)性數(shù)據(jù)情報偵查的預(yù)測和決策更加客觀和準(zhǔn)確。

      (五)分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法

      離群動態(tài)性數(shù)據(jù)已經(jīng)逐漸被應(yīng)用于社會的各個行業(yè)領(lǐng)域之中。同時,與離群動態(tài)性數(shù)據(jù)同步產(chǎn)生和發(fā)展的還有不同的離群動態(tài)性數(shù)據(jù)算法,而分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法就屬于其中比較典型的一種。由于涉案離群動態(tài)性數(shù)據(jù)具有穩(wěn)定性差、波動頻繁、異常性強(qiáng)等動態(tài)性特征,這就給分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法提供了應(yīng)用空間。

      分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法的應(yīng)用原理為:偵查人員基于小波分析的技術(shù)方法對涉案離群動態(tài)性數(shù)據(jù)進(jìn)行平滑濾波處理和多尺度數(shù)據(jù)分解,消除有冗余干擾或影響的離群動態(tài)性數(shù)據(jù),融合二進(jìn)制數(shù)據(jù)序列算法和二元正態(tài)數(shù)據(jù)密度函數(shù)算法對涉案離群動態(tài)性數(shù)據(jù)自身以及與其他相鄰離群動態(tài)性數(shù)據(jù)之間的活動周期規(guī)律進(jìn)行挖掘分析,從而實(shí)現(xiàn)分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法的應(yīng)用價值。[12]為達(dá)到離群動態(tài)性數(shù)據(jù)情報偵查最佳的應(yīng)用實(shí)踐效果,筆者認(rèn)為,可以將分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法分為以下幾個步驟:

      第一步,利用小波分析技術(shù)方法進(jìn)行預(yù)處理。偵查人員可以利用小波分析技術(shù)方法尋找和挖掘涉案離群動態(tài)性數(shù)據(jù)中的動態(tài)時序離群動態(tài)性數(shù)據(jù)閾值。其在快速傅里葉運(yùn)算轉(zhuǎn)換中具有充當(dāng)余弦函數(shù)和正弦函數(shù)的橋梁作用,而需要的小波系數(shù)主要是依據(jù)對涉案離群動態(tài)性數(shù)據(jù)采取的數(shù)據(jù)伸縮、數(shù)據(jù)逼近、數(shù)據(jù)單調(diào)等轉(zhuǎn)換措施所得。

      第二步,劃分分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)的活動空間。偵查人員在完成分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)預(yù)處理的基礎(chǔ)上,對分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)給予網(wǎng)格化劃分,即采取數(shù)據(jù)緯度和數(shù)據(jù)經(jīng)度的網(wǎng)格化劃分方式將涉案各種離群動態(tài)性數(shù)據(jù)劃分為若干大小不等的網(wǎng)格。然后將網(wǎng)格中涉案不同離群動態(tài)性數(shù)據(jù)的坐標(biāo)位置一一映射到與其相對應(yīng)的數(shù)據(jù)單元格中,從而為偵查人員對該單元格中離群動態(tài)性數(shù)據(jù)與涉案犯罪情勢之間的關(guān)聯(lián)軌跡進(jìn)行挖掘分析提供數(shù)據(jù)緯度和數(shù)據(jù)經(jīng)度上的坐標(biāo)值。

      第三步,挖掘分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)。在完成對分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)活動空間的劃分之后,偵查人員可以采取二進(jìn)制數(shù)據(jù)序列算法和二元正態(tài)數(shù)據(jù)密度函數(shù)算法對任意數(shù)據(jù)單元格中的離群動態(tài)性數(shù)據(jù)展開數(shù)據(jù)密度閾值的計算。如果計算所得相鄰離群動態(tài)性數(shù)據(jù)之間的數(shù)據(jù)密度閾值出現(xiàn)相同或相似現(xiàn)象,那么該相鄰離群動態(tài)性數(shù)據(jù)所屬的數(shù)據(jù)單元格即可視為異常離群動態(tài)性數(shù)據(jù)區(qū)域。為了避免或降低離群動態(tài)性數(shù)據(jù)情報偵查預(yù)測和決策的誤檢、漏檢等偵查錯誤現(xiàn)象的發(fā)生,偵查人員還可以采用自相關(guān)離群動態(tài)性數(shù)據(jù)函數(shù)檢驗方法,確定該異常離群動態(tài)性數(shù)據(jù)區(qū)域內(nèi)不同離群動態(tài)性數(shù)據(jù)的活動周期變化規(guī)律,從而提高分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法的準(zhǔn)確性。

      (六)優(yōu)化遺傳離群動態(tài)性數(shù)據(jù)算法

      就離群動態(tài)性數(shù)據(jù)挖掘分析的本質(zhì)而言,其屬于對離群動態(tài)性數(shù)據(jù)的關(guān)聯(lián)聚類挖掘分析問題。利用傳統(tǒng)離群動態(tài)性數(shù)據(jù)算法對其進(jìn)行挖掘與分析容易出現(xiàn)難以適應(yīng)離群動態(tài)性數(shù)據(jù)動態(tài)性發(fā)展態(tài)勢的問題,引入優(yōu)化遺傳離群動態(tài)性數(shù)據(jù)算法可以提高離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用的準(zhǔn)確率。優(yōu)化遺傳離群動態(tài)性數(shù)據(jù)算法的主要原理為:首先,偵查人員對涉案全部離群動態(tài)性數(shù)據(jù)采取抽樣的方式組建離群動態(tài)性數(shù)據(jù)的樣本頻繁項目集;其次,利用聚類算法獲取離群動態(tài)性數(shù)據(jù)的聚類中心,并構(gòu)建離群動態(tài)性數(shù)據(jù)的初始種群;最后,對離群動態(tài)性數(shù)據(jù)的初始種群采取優(yōu)化遺傳操作,并對離群動態(tài)性數(shù)據(jù)的聚類中心和其聚類項目數(shù)量進(jìn)行互相調(diào)整,從而完成對涉案離群動態(tài)性數(shù)據(jù)的挖掘與分析。[13]

      依據(jù)優(yōu)化遺傳離群動態(tài)性數(shù)據(jù)算法的應(yīng)用原理,其在離群動態(tài)性數(shù)據(jù)情報偵查中的具體應(yīng)用可以分為以下步驟:

      第一步,離群動態(tài)性數(shù)據(jù)的初始種群挖掘生成。偵查人員在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,需要對涉案離群動態(tài)性數(shù)據(jù)進(jìn)行抽樣分析統(tǒng)計,通過獲取離群動態(tài)性數(shù)據(jù)的聚類中心而構(gòu)建其初始種群。具體步驟為:(1)從海量復(fù)雜的涉案離群動態(tài)性數(shù)據(jù)中任意選取數(shù)個離群動態(tài)性數(shù)據(jù),形成離群動態(tài)性數(shù)據(jù)的樣本頻繁項目集;(2)從該樣本頻繁項目集中選取一個離群動態(tài)性數(shù)據(jù),作為其第一個離群動態(tài)性數(shù)據(jù)的聚類中心,然后選擇距離第一個離群動態(tài)性數(shù)據(jù)距離最大的離群動態(tài)性數(shù)據(jù)作為第二個離群動態(tài)性數(shù)據(jù)聚類中心;(3)計算剩余的離群動態(tài)性數(shù)據(jù)與已獲取的第一個和第二個離群動態(tài)性數(shù)據(jù)聚類中心的數(shù)據(jù)路徑距離閾值,將與上述兩者之間最近的數(shù)據(jù)路徑距離閾值設(shè)為第三個離群動態(tài)性數(shù)據(jù)的聚類中心;(4)不斷重復(fù)上述挖掘過程,直到得到全部離群動態(tài)性數(shù)據(jù)聚類中心,從而形成包含離群動態(tài)性數(shù)據(jù)類型特征和頻繁項目集數(shù)目的離群動態(tài)性數(shù)據(jù)的初始種群。

      第二步,優(yōu)化遺傳操作應(yīng)用離群動態(tài)性數(shù)據(jù)方法的選取。為了得到對離群動態(tài)性數(shù)據(jù)挖掘分析最優(yōu)的關(guān)聯(lián)聚類結(jié)果,必然需要采取優(yōu)化遺傳的操作方法對離群動態(tài)性數(shù)據(jù)的初始種群展開運(yùn)算,還需要進(jìn)一步對離群動態(tài)性數(shù)據(jù)的聚類頻繁項目數(shù)和聚類中心進(jìn)行適應(yīng)性調(diào)整,促使每個離群動態(tài)性數(shù)據(jù)的關(guān)聯(lián)聚類分析都能夠達(dá)到最優(yōu)化。例如,偵查人員先將初始種群中的不同離群動態(tài)性數(shù)據(jù)進(jìn)行數(shù)據(jù)編碼,促使相同初始種群內(nèi)的離群動態(tài)性數(shù)據(jù)能夠?qū)崿F(xiàn)類型內(nèi)相似度最高但類間的相似度最低。如果獲取的離群動態(tài)性數(shù)據(jù)比原來的適應(yīng)度更高,那么新的離群動態(tài)性數(shù)據(jù)就取代原來的離群動態(tài)性數(shù)據(jù);反之,則繼續(xù)保留原來的離群動態(tài)性數(shù)據(jù),從而完成對涉案離群動態(tài)性數(shù)據(jù)的優(yōu)化遺傳操作。

      第三步,離群動態(tài)性數(shù)據(jù)聚類中心和其聚類頻繁項目數(shù)的自適應(yīng)調(diào)整。在離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用過程中,所涉及的離群動態(tài)性數(shù)據(jù)具有種類、數(shù)目等海量、復(fù)雜且動態(tài)變化的顯著特征,這就必然需要對不同離群動態(tài)性數(shù)據(jù)的類型、數(shù)目等展開自適應(yīng)調(diào)整,以便能夠幫助偵查人員提升離群動態(tài)性數(shù)據(jù)情報偵查應(yīng)用效果的優(yōu)質(zhì)性和準(zhǔn)確性,從而實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)然價值和實(shí)然效果。

      綜上所述,離群動態(tài)性數(shù)據(jù)情報偵查方法是一種新型動態(tài)性數(shù)據(jù)情報偵查方法,包括霍金斯離群動態(tài)性數(shù)據(jù)算法、LOF離群動態(tài)性數(shù)據(jù)算法、時空維度離群動態(tài)性數(shù)據(jù)算法、模糊孤立森林離群動態(tài)性數(shù)據(jù)算法、分布式區(qū)域時序離群動態(tài)性數(shù)據(jù)算法、優(yōu)化遺傳離群動態(tài)性數(shù)據(jù)算法等多種離群動態(tài)性數(shù)據(jù)情報偵查方法,且不同的離群動態(tài)性數(shù)據(jù)情報偵查方法都有著不同的算法優(yōu)勢?;诖?,引入離群動態(tài)性數(shù)據(jù)情報偵查方法研究范式,以離群動態(tài)性數(shù)據(jù)情報偵查的內(nèi)涵與屬性為研究邏輯起點(diǎn),提出離群動態(tài)性數(shù)據(jù)情報偵查的指標(biāo)體系,構(gòu)建離群動態(tài)性數(shù)據(jù)情報偵查的流程模型,并對離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)用方法展開探討。這不僅能夠促使偵查人員及時掌握和優(yōu)化離群動態(tài)性數(shù)據(jù)排序的生存發(fā)展態(tài)勢,而且能夠幫助其建立有效的離群動態(tài)性數(shù)據(jù)節(jié)點(diǎn)的權(quán)值集群,提升挖掘與利用算法的精確度,從而實(shí)現(xiàn)離群動態(tài)性數(shù)據(jù)情報偵查的應(yīng)然價值和實(shí)然效果。

      猜你喜歡
      動態(tài)性離群偵查人員
      管理者認(rèn)知視角的環(huán)境動態(tài)性與組織戰(zhàn)略變革關(guān)系研究
      交際中模糊語言的動態(tài)性闡釋
      偵查人員出庭作證問題研究
      法制博覽(2018年19期)2018-01-23 02:10:52
      國土資源績效管理指標(biāo)體系的動態(tài)性探討
      我國偵查人員出庭作證制度的構(gòu)建
      離群數(shù)據(jù)挖掘在發(fā)現(xiàn)房產(chǎn)銷售潛在客戶中的應(yīng)用
      基于CDM系統(tǒng)的航班動態(tài)性調(diào)度研究
      離群的小雞
      應(yīng)用相似度測量的圖離群點(diǎn)檢測方法
      一種基于核空間局部離群因子的離群點(diǎn)挖掘方法
      司法| 新野县| 嘉峪关市| 沈丘县| 晋中市| 晴隆县| 河北区| 灵丘县| 望城县| 北宁市| 曲周县| 如皋市| 文山县| 华阴市| 临沧市| 内乡县| 平凉市| 八宿县| 雷州市| 敦化市| 红桥区| 河间市| 萍乡市| 临湘市| 盐城市| 军事| 闻喜县| 宁乡县| 吴江市| 嘉峪关市| 桃源县| 修文县| 临高县| 札达县| 绵阳市| 宝丰县| 揭阳市| 江孜县| 龙山县| 麻城市| 古田县|