• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數據挖掘技術的應用

      2021-11-20 12:54:49楊雁瑩
      電子技術與軟件工程 2021年9期

      楊雁瑩

      (南京森林警察學院 江蘇省南京市 210023)

      1 數據挖掘的技術方法

      對數據挖掘的技術方法進行分類,主要可以分為兩個類別,首先是統(tǒng)計型,統(tǒng)計型類別里的技術主要有概率分析、相關性以及判別分析等等,其二是人工智能當中的機器學習型,這種技術主要是經過發(fā)亮的訓練和學習,在樣品當中得出相應的參數或者是模式[1]。在數據挖掘技術應用的過程當中,需要不斷對具有價值的信息進行挖掘,不同的數據挖掘技術基本都秉持著相同的思路和步驟,但是實際操作起來也有一定的區(qū)別。不同的數據挖掘技術都有著突出性的功能特點,并且應用的領域范圍也是并不相同的,在對相應的數據進行挖掘的時候,需要針對數據的類型對數據挖掘技術進行合理的選擇,選擇不同的數據挖掘技術會直接影響到最后數據得出的效果,但是在實際進行數據挖掘的過程中,往往會采用多種技術結合的方式對數據進行挖掘,這樣多種技術之間可以進行優(yōu)勢的互補。文章以下將針對數據挖掘當中常用的集中技術進行分析,并對其中的優(yōu)缺點,以及主要的應用領域進行分析[2]。

      1.1 關聯(lián)分析

      關聯(lián)分析是一種常用的數據挖掘技術,并且具有著非常強的實用性。關聯(lián)分析主要是從大量的數據當中依照一定的基本思路,發(fā)現其中具有關聯(lián)性或者是依賴性的知識。關聯(lián)分析的基板思路就是:由W 到B,其中W 表示為屬性集,而B 表示為性個體,對此進行簡單的解釋就是,在一個數據庫當中,W 屬性集是具有真值的,但是個體B 是具有真值的可能性以及一定趨勢的。關聯(lián)分析當中常常會使用到貨籃分析這種形式,也是最常用的一種形式,其中會使用到兩種屬性值進行度量,也就是支持度以及置信度,這樣以來就構建出了一個“支持度-置信度”的框架結構。比如將這種模型放在零售業(yè)當中,分析客戶在購買完電腦之后,再購買打印機的概率是多少,這對于零售業(yè)之后產品的布局以及產品的管理具有著非常重要的現實意義[3]。將這種模型用于制造業(yè)當中,就可以分析事件A與事件B 發(fā)生之后,在發(fā)生事件C 的概率是多少,這樣的計算具有著非常大的作用,并且這種關聯(lián)分析技術常常會用于事故的檢修和檢測工作當中。關聯(lián)規(guī)則可以對大量的數據,尤其是關系數據進行分析,對大量數據當中的信息和知識進行分析,這樣可以對相應事件的概率進行估計,這在零售業(yè)、制造業(yè)以及通訊行業(yè)當中都得到了較為廣泛的應用。

      1.2 決策樹

      決策樹這種數據挖掘方法,主要是根據大量數據的屬性值分別進行分類,最常用的分類方式就是“If-then”模式。決策樹這種方式具有著極強的可理解性,可以比較直觀的理解數據之間的聯(lián)系,決策樹和神經網絡是有一定的區(qū)別的,決策樹可以對得出結論的整個過程進行解釋,但是也存在一定的缺點,也就是在處理一些相對復雜的數據的時候,決策樹具有著較大的分支,在實際進行管理的過程中具有著較大的管理難度,不僅如此決策樹還存在著數據缺值的問題。決策樹具有著CART、CHAID 等多種算法,但是目前還出現了SLIQ 以及SPRINT 這兩種新的算法,可以使用到很大的訓練集對整個決策樹進行歸納,同時處理分類屬性以及連續(xù)性屬性[4]。

      1.3 遺傳算法

      遺傳算法是基于生物進化而得出的一種組合優(yōu)化的方式,也是計算機科學和生物學結合得出的一種數據挖掘技術。遺傳算法是智能計算技術當中非常重要的一種,遺傳算法最早是從生物進化論當中引出的,遺傳算法具有隨機搜索以及優(yōu)化處理的作用。在1975年美國的密西根大學D.J.Holland教授,根據自然界的適者生存原則,并結合生命進化的機制,逐漸形成了由當前群體中最適合的規(guī)則組成的新的群體,以及這些這些規(guī)則的后代[5]。根據這個思路,得出了遺傳算法這個新的概念,并獲取了相應的模型,并在后續(xù)的實驗當中對這個數據模型進一步進行了優(yōu)化。遺傳算法從根本上來看是一種弱方法,并且對信息數據并沒有過高的要求,所以遺傳算法具有著極強的靈活性,實際使用起來具有極強的高效性。并且在進行數據挖掘的過程中,遺傳算法也可以用于評估其他算法的適合度。遺傳算法擅長于數據聚類,并且可以從時間和空間兩個方面對數據進行類比,這樣可以將大量的信息數據進行系統(tǒng)化的處理,梳理數據之間的內在聯(lián)系并建立相應的概念。在進行數據挖掘模型的過程中,需要將遺傳算法和神經網絡兩種方式有效的結合到一起,這樣可以提升數據模型的可理解性。首先,遺傳算法在進行計算的時候會形成串集的數字,并且秉持著問題分析的原理,對其中的串集進行搜索,在進行分析的時候時刻注重對計算整體進行處理,并不是對其中單一的問題進行解釋。所以這也是遺傳算法非常明顯的優(yōu)勢,和傳統(tǒng)算法當中對單個初始值計算的方式不同,遺傳算法注重整體的計算分析,并且遺傳算法的搜索范圍涉及面極廣,可以覆蓋到整個問題的體系,針對全局對問題進行解答和分析。其次,遺傳算法的搜索往往都是以整體作為出發(fā)點,和傳統(tǒng)單點搜索的搜索算法相比,遺傳算法的運作更加節(jié)省搜索的時間,并且搜索的范圍從局部逐漸擴展到整體當中,所以遺傳算法在進行計算的過程當中,往往是依靠處理群體為主要的基礎,并隨整個問題的空間進行逐個的搜索和計算,并隨整體進行分析,所以可以從根本上降低處理問題的風險,由此實現問題計算化的處理[6]。

      2 數據挖掘技術的實際應用

      數據挖掘技術近幾年來得到較為廣泛的應用,各行各業(yè)也開始對數據挖掘技術引起一定的重視。數據挖掘技術最早應用于商業(yè)領域當中,數據挖掘技術的應用可以幫助企業(yè)提升自身的競爭優(yōu)勢,并且盡可能的縮短自身的銷售周期,從而降低企業(yè)生產過程當中的成本,對于企業(yè)未來的規(guī)劃以及戰(zhàn)略方針的制定起到了非常重要的作用。當前,數據挖掘技術已經成為了電子商務當中非常重要的核心技術,數據挖掘技術在開發(fā)信息資源領域當中具有著較強的優(yōu)越性,隨著數據挖掘技術的不斷發(fā)展,數據挖掘技術已經被逐漸應用于制造業(yè)、保險領域以及醫(yī)療領域等行業(yè)當中。

      2.1 數據挖掘技術在零售業(yè)當中的應用

      目前零售業(yè)對數據挖掘技術的應用相對活躍,并且借助數據挖掘技術可以更加清楚的了解到客戶的喜好,以及購買的趨向,這對于零售行業(yè)未來銷售策略的制定起到了非常重要的作用。往往會采用關聯(lián)規(guī)則對客戶數據進行挖掘,并針對客戶對郵件的回應效率分析出客戶的特征,以此針對性的開展后續(xù)的銷售業(yè)務,并對廣告工作的開展起到了指導性的作用。除此之外,借助數據挖掘技術還可以對顧客的忠誠度進行有效的分析,根據分析得出的結果實時的調整相應的數據,以及產品的類型,后續(xù)根據顧客的喜好調整銷售服務。這樣的過程不僅可以最大程度上保留現有的客戶,并不斷挖掘潛在的客戶。所以數據挖掘技術在零售行業(yè)的應用,可以進一步擴大自身的銷售規(guī)模以及銷售范圍,并從根本上增加銷售量,線上銷售得出的數據,可以通過數據挖掘技術得出產品的相關信息,并且得出客戶的購買習慣,這樣可以實時調整后續(xù)的銷售策略。

      2.2 數據挖掘技術在保險行業(yè)的應用

      隨著我國經濟的不斷發(fā)展,社會保障體系也在不斷的完善當中,在這樣的背景之下保險業(yè)得到了進一步的發(fā)展,并且發(fā)揮出越來越重要的作用。保險行業(yè)目前面臨最重要的問題,就是如何盡可能的維系現有的客戶,并盡可能挖掘到潛在的客戶,并及時識別到可能存在的詐騙行為。數據挖掘技術可以有效的解決這些問題,數據挖掘技術可以對保險行業(yè)當中的業(yè)務數據以及客戶數據等多個類別的數據進行分析,綜合性的分析可以對保險公司后續(xù)的發(fā)展給予一定的幫助,可以對保險公司的市場進行分析,并進行風險評估、財務預算等多種工作,所以數據挖掘技術的運用極大程度上提升了保險企業(yè)的抗經營風險的能力和水平,這也為保險企業(yè)開展科學決策提供合理、科學的評判依據。基于此,保險企業(yè)可以建立相應的預測模型,并對投保人根據一定的類別和層次進行歸類,并對索賠投保人的特征進行總結,建立相應的模型之后對索賠的相關信息和次數進行統(tǒng)計,這樣可以更加科學合理的了解到客戶行為。除此之外,數據挖掘技術的應用,可以有效分析欺詐案件內部的線索以及特征,這樣可以從根本上預防欺詐案件的發(fā)生,盡可能的減少保險公司的資金損失?;诖耍枰獙ν侗H说母鞣矫娴臓顩r進行有效的記錄,這樣可以從內在因素找出索賠的關聯(lián)性。

      2.3 數據挖掘技術在金融行業(yè)當中的應用

      金融行業(yè)的數據相對是完整的,并且數據的質量是非常高的,數據挖掘技術最早應用于商業(yè)領域,也因此數據挖掘在金融領域當中的應用相對成熟,數據挖掘技術的應用取得了較好的社會效益以及經濟效益。數據挖掘技術可以有效分析金融行業(yè)市場波動的主要因素,并基于此建立相應的預測模型,并根據模型進行相應的投資分析以及預測,這樣可以盡可能的避免由于市場波動而造成的不良影響,為后續(xù)的投資和相關決策提供合理且科學的依據。預測模型需要綜合客戶端額教育水平、工資收入以及個人信譽等各種因素,最終分析得出影響信貸的主要原因,這樣可以更加針對性的調整相應的貸款開放政策。不僅如此,可以根據信用欺詐等各類信息,建立相應的預測模型,這樣可以極大程度上幫助銀行預防具有潛在欺詐性的事件,并且可以極大程度上預防銀行資金的非法流失。除此之外,預測模型的建立還可以幫助銀行盡可能的挖掘潛在的、有價值的客戶,并開展跨區(qū)域銷售業(yè)務,并最大程度上加強用戶和銀行之間的關系。在進行證券交易的過程當中,可以科學的對股票進行預測,并盡早的發(fā)現賬務造價以及利潤超重等問題,這樣可以極大程度上避免嚴重的經濟損失。

      2.4 數據挖掘技術在醫(yī)療行業(yè)當中的應用

      在醫(yī)療保健行業(yè)當中,醫(yī)學以及生物工藝學在對基因進行分析的過程當中,需要對大量的基因數據進行處理,數據挖掘技術的應用可以極大程度上挖掘基因數據當中潛在的價值,有助于對數據的研究和理解。在醫(yī)學領域當中,在針對一些疑難雜癥進行研究的過程中,也可以使用到數據挖掘技術,并基于此建立相應的醫(yī)療數據模型,根據模型進行分析,找出醫(yī)療數據內在一些聯(lián)系,得出線索之后可以針對性的進行研究,這對于推動醫(yī)學研究的發(fā)展起到了非常重要的作用。不僅如此,數據挖掘技術還可以應用于醫(yī)學歷史數據的處理當中,這樣可以盡快的找到疾病產生的原因,并且根據數據的分析,更加合理的搭配藥物,并針對病人的狀況制定相應的治療方案。

      3 結束語

      數據挖掘技術的誕生順應了這個時代的發(fā)展,目前數據挖掘技術在金融領域、醫(yī)療領域以及電信等領域都得到了較為廣泛的應用,數據挖掘成為挖掘信息資源非常有效的一種方式,也因此數據挖掘具有著非常廣闊的市場發(fā)展前景。但是目前數據挖掘技術還存在著很多的問題,并且數據挖掘技術存在著很大的潛在應用市場以及應用領域,所以數據挖掘技術應當盡可能減少其盲目性,并在不斷完善該項技術過程中,找到數據挖掘技術的核心的價值,這對于數據挖掘技術實際的應用具有十分重要的指導意義。

      河池市| 浦江县| 泸西县| 崇文区| 三江| 古蔺县| 胶州市| 德惠市| 兰溪市| 柯坪县| 吉林市| 兴宁市| 和硕县| 滦南县| 苍山县| 天等县| 罗甸县| 通道| 双桥区| 迭部县| 治多县| 科尔| 探索| 沧源| 深水埗区| 凤山市| 林周县| 双桥区| 闸北区| 南通市| 山西省| 漠河县| 海淀区| 招远市| 公主岭市| 洞头县| 牙克石市| 台中市| 大姚县| 滨州市| 香河县|