【摘要】:大數據時代是信息社會高度發(fā)達的的階段,隨著云技術、互聯(lián)網等高科技技術的快速發(fā)展,為人們進入大數據時代奠定了堅實的基礎。人們已經可以實現(xiàn)對海量的數據信息進行存儲以及分析,并將所獲取的信息應用到實際生產當中,而在此過程中最重要的就是數據挖掘技術??茖W合理的利用數據挖掘技術可以通過對數據信息的挖掘,從中找到有利用價值的信息資源,從而為各個領域的發(fā)展提供相應的參考。本文首先將對數據挖掘技術進行簡單闡述;其次主要分析當前數據挖掘技術的主要方法,并具體闡述數據挖掘技術在各個領域的應用;最后簡單談談數據的安全和保密。
【關鍵詞】:大數據時代 數據挖掘技術 概述 方法 應用 數據安全
在各個領域的發(fā)展過程中,信息資源是最為重要的生產管理因素之一,可以為各領域的發(fā)展提供有效的參考和依據。云技術以及互聯(lián)網技術的發(fā)展為信息資源的存儲和分析提供了堅實有力的技術基礎,因此,各行業(yè)想要獲得更大的發(fā)展,就需要注重對隱藏的數據進行深入挖掘,將其進行有效整合,從中獲取有效的信息。在此過程中,數據挖掘技術就顯的尤為重要,科學合理的運用數據挖掘技術可以實現(xiàn)對數據信息的最大化利用,利用對數據信息挖掘分析的結果來指導行業(yè)的發(fā)展。與此同時,也要注重數據信息的安全和保密,完善各項數據保密技術,有效保護各項數據信息。
1.數據挖掘技術概述
數據挖掘技術顧名思義就是對數據信息的深入挖掘,尋找其中有價值的數據信息,具體來講就是利用統(tǒng)計學、云技術、大數據技術以及人工智能技術等高科技技術,在龐大的數據庫中發(fā)掘其中隱藏的數據信息,以此來為相關決策提供支持【1】。之所以被稱之為數據挖掘技術,主要是這項技術所要尋找的信息是之前尚未明確的,但是其具有潛在的價值,因此需要在龐大的數據庫中進行挖掘。這項技術需要以多項高科技技術為基礎,從龐大的數據信息中識別具有價值的信息,從而為決策人員進行決策提供一定的參考和指導,以規(guī)避風險,做出合理的判斷。
數據挖掘的基礎是需要龐大的數據信息,且數據信息的來源必須真實有效,這樣才能在其中發(fā)掘出一些之前尚未明確的,且具有相應的利用價值的信息。被挖掘的數據庫中的數據可以是多種多樣的,包括未識別的數據、隨機的數據、缺損數據、不完整數據等,但是數據量必須要大,只有以龐大的數據為基礎,才有可能從其中挖掘出有價值的信息。
數據挖掘技術并不是一項簡單的技術,而是多種技術的有機結合,數據挖掘技術可以在挖掘數據的過程中實現(xiàn)對數據的歸納和整理,使這些數據信息得到最大化的利用。數據挖掘技術可以從對數據的簡單分析到復雜演繹,從表面深入到隱藏的部分,通過一個極其復雜的過程從原始數據中尋找出具有利用價值的信息。同時其挖掘數據的過程中,其所歸納和整理的數據也可以對其加以利用,譬如信息檢索、查詢等。
2.數據挖掘技術的主要方法
2.1聚類
聚類的分析方法主要是針對一組數據信息,將其按照數據信息的類別以及其相似度將其分為不同的層級,制定出科學的、覆蓋范圍廣的、詳盡的判斷模型,使這部分數據信息中,同類別數據具備較高的相似性,不同類別數據具備較低的相似性,以此為決策人員的決策提供參考。這種方法一般在市場營銷中使用的比較多,譬如對客戶的分類、尋找潛在客戶、預測銷售狀況、分析商品的周期等【2】。
2.2關聯(lián)
關聯(lián)主要指的是原始數據中各部分數據信息之間所存在的聯(lián)系或者關系,具體來說就是原始數據中的這部分數據信息很可能與另一部分數據信息之間存在一些隱藏的聯(lián)系,通過對兩部分數據信息的分析可以發(fā)現(xiàn)其中隱藏的關聯(lián)性。例如,當你在維護和客戶的關系的時候,就可以在該企業(yè)的客戶數據源中挖掘有效信息,在大量的關系交流的記錄中挖掘有效信息,挖掘有價值的線索,挖掘出不明顯的影響市場的關鍵節(jié)點,這對商品價格預判、銷售走勢、客戶類群分辨、銷售整體方向的規(guī)劃等具有重要的參考價值。
2.3回歸分析
回歸分析主要是利用原始數據時間上的分布特征,構建一個可以把數據信息回歸到預測變量中的函數關系,然后利用相應的數學理論,分析變量與變量之間的關系。關于回歸分析的要點主要有以下幾項,一是數據信息之間關系的分析,二是預判走向的分析,三是數據變量的趨勢分析。
2.4分類
分類的方法主要就是在原始數據中選擇一組具有相同特點的數據,依照事先確定的標準對其進行相應的分類,將原始數據中的部分數據信息歸入到某種既定的類別中。把數據源中的數據對象聯(lián)結到某種特殊的類別當中【3】。例如可以把某一組數據對象聯(lián)結到顧客的分類中,然后對顧客的屬性進行分析,對顧客的特點進行分析,做滿意度調查、然后評判顧客的購買意向以及購買力.以某一個汽車廠商為例,如果這個汽車廠商把數據源中的顧客依據對汽車的愛好分門別類,這樣一線的銷售人員便可以把握主動,直接向這類顧客銷售相應的產品,投其所好,大大提高了效率。
2.5變化和偏差分析
原始數據中存在諸多存在偏差的數據信息,這其中隱藏著一些有利用價值的信息,譬如模式中的反?,F(xiàn)象,數據分類當中的反?,F(xiàn)象,現(xiàn)實和期望之間的偏差等,對于這些存在偏差的數據信息進行分析,主要是研究現(xiàn)實中的結果和參照物之間的差別。在一些大型企業(yè)中,管理人員應該對危機預警系統(tǒng)中的反?,F(xiàn)象和信息重點關注,對其進行深入挖掘分析,可以有效幫助管理人員挖掘出潛在的危機,從而提前做出應對,規(guī)避風險,降低危機造成的損失。
2.6特征
數據源也可以根據特征進行數據分類,從中提取關于這些特征的特征式,這類公式可以提現(xiàn)該數據源的整體特點【4】。例如在一線的銷售人員在預防顧客流失的時候就可以先將顧客按照特征進行分類,然后再從中提取出顧客流失特征的特征式,就可以很快分找出造成顧客流失的很多原因以及特征了,然后再從特征中找出主要特征和次要特征,通過對這些顧客流失的特征分析就可以提前預防顧客流失的情況了。
2.7Web網頁
隨著互聯(lián)網技術的飛速發(fā)展,網絡已經實現(xiàn)了大范圍的普及,人們在生活和工作大量的利用網絡進行交互,這就使得網絡中留存了大量的信息?;ヂ?lián)網中的數據包羅萬象,包括金融信息、企業(yè)信息、人力資源信息以及潛在的用戶群體信息等等,通過對互聯(lián)網數據的挖掘可以找出諸多有利用價值的信息。對于這部分數據挖掘的重點在于預期可能會對企業(yè)的發(fā)展造成的影響因素,包括內因和外因,或者說是潛在的內因和外因,通過對這些影響因素進行分析,從而指導企業(yè)的發(fā)展方向,促使管理人員進行科學的決策。
3.數據挖掘技術的應用
3.1教育領域
在教育領域運用數據挖掘及時,可以讓老師對學生產生更深入的認識和了解,通過對學生的基礎信息、興趣愛好、各學科的學習狀況等數據信息的挖掘分析,可以從中了解到學生優(yōu)勢、不足以及在學習中存在的薄弱環(huán)節(jié),便于老師進行針對性的指導和幫助,從而有效提升教學質量和教學效率。此外,數據挖掘技術的運用可以使各項教育資源配置進一步優(yōu)化,從而更好的開展教學。
3.2科研領域
數據挖掘技術在科研領域也有廣泛的應用,科研領域所取得的各項科研成果往往依賴于各種實驗以及對于實驗數據的整理、歸納和分析,找出實驗數據所表明的關系或者規(guī)律,并對其加以概括和引申。由于一項科研成果的出現(xiàn)往往需要大量的實驗,因此就會產生大量的實驗數據,如果采用人工對其進行整理、歸納和分析,其難度相對較大,工作量也極大,而利用數據挖掘技術可以很輕易的完成,只要構建相應的數據模型,然后依次對實驗數據進行深入分析,可以更高效的找出其中所隱含的信息,從而對科研方向提高相應的參考。
3.3電信領域
電信行業(yè)在人們的生活和工作中發(fā)揮著重要作用,可以讓人們便捷的實現(xiàn)交流和溝通,時間和空間上的限制極小。由于電信行業(yè)的用戶群體極為龐大,各個用戶群體之間往往所需要的服務也不盡相同,所以就需要有針對性的為用戶提供相應的服務【5】。這就需要通過挖掘用戶信息,分析用戶的偏好以及所需要的服務類型,從而為用戶提供更優(yōu)質的服務。數據挖掘技術的運用可以使電信企業(yè)在對龐大的用戶信息的分析中,明確各個用戶群體的偏好,有根據的預判其所需要的服務,并有針對性的為用戶提供其可能需要的服務,從而提升電信企業(yè)的服務水平。在電信領域用戶的需求就是潛在的、具有利用價值的信息,企業(yè)需要對用戶日常的使用習慣進行分析,挖掘用戶潛在的需求,并最大程度的滿足用戶的需求,這樣才能使電信企業(yè)獲得更大的發(fā)展。
3.4市場營銷領域
數據挖掘技術最初就是在市場營銷當中所使用的,主要是該領域需要記錄龐大的客戶信息,并通過對客戶信息的挖掘和分析,找出客戶的潛在需求,并為其提供相應的產品。同時,還需要為客戶推薦其可能感興趣或者需要的產品,從而達到提升銷售業(yè)績的效果【6】。數據挖掘技術在市場營銷領域的使用,一定程度上降低了市場營銷的難度,同時也最大限度的使客戶的需求得到了滿足,形成了一種雙贏的局面。無論是對于銷售人員還是對于客戶,雙方都達成了各自的目的,各自的需求都得到了極大的滿足。
3.5制造業(yè)領域
近年來,隨著人們物質生活水平的不斷提升,人們對于市場上提供的各項產品的要求也逐漸變高。對于制造業(yè)領域而言,如何根據用戶的喜好拉優(yōu)化自身的產品是一個極為重要的問題。數據挖掘技術在制造業(yè)領域的應用,可以用客戶的需求信息中發(fā)掘客戶所需要的產品,或者客戶對于產品某一方面的喜好。同時,將這些信息運用到產品的升級和研發(fā)當中,從而使產品更加符合客戶的需求和喜好,是產品在市場上具備一定的競爭力,從而為企業(yè)創(chuàng)造更大的效益。
4.數據安全
當前,在大數據的背景下,各個領域對于數據信息的重視和利用都達到了一個前所未有的高度,對于數據信息的發(fā)掘和利用一方面促進了各個領域更好的發(fā)展,另一方面也最大程度的滿足了人們的需求,產生了極高的經濟效益和社會效益。但是我們在享受大數據給我們帶來便利的同時,也要認識到其中所存在的安全隱患,比如數據安全【7】。數據的泄露會對人們的生活和工作帶來極大的影響,尤其是關于個人隱私信息的泄露,不僅侵犯了人們的隱私權,同時對于人們也造成了一些潛在的威脅。
此外,部分別有用心之人可能通過對數據的分析,得出某些信息,從而進行一些危害社會的活動。譬如,通過對人口健康數據、基因測序數據的挖掘,可以預判國民身體健康走向;通過對移動消費的數據挖掘,可以得出國民消費的金融數據;通過對社會文化的分析可以得出國民的文娛喜好和思想文化偏好,這些分析結果很可能會被不法分子利用,從事某些破壞活動,進而影響到國家和人們的安全。
部分人員受利益的驅使,從事倒賣信息的活動,目前,甚至已經形成了一個龐大的利益鏈條,其中尤其是個人隱私信息的倒賣,使得人們已無隱私可言,對人們的生活是極大的威脅。而目前,我國在這方面的法律機制尚不完善,加之網絡追責的難度較大,使得這種情況很難得到有效治理【8】。
因此,我們要以辯證的眼光看待大數據,不僅要積極的利用其優(yōu)勢,從而促進社會各個行業(yè)的發(fā)展。與此同時,我們也要認識到其中所存在的隱患,并逐步完善相應的保護機制,確保對于數據信息的利用在合理合法的范圍之內,從而促進其良性發(fā)展。
結語
綜上所述,數據挖掘技術在各個領域的發(fā)展都發(fā)揮了極大的作用,不僅促進了各個領域的發(fā)展,同時也滿足了人們的需求。但是目前我國對于數據挖掘技術的運用還有極大的提升空間,因此,仍要進一步探究數據挖掘技術的價值,使其發(fā)揮更大的作用
【參考文獻】
【1】邵燕, 陳守森, 賈春樸,等. 探究大數據時代的數據挖掘技術及應用[J]. 信息與電腦(理論版), 2016(10):118-119.
【2】田志民, 梁品超, 任艷紅,等. 大數據時代下數據挖掘技術與應用[J]. 當代教育實踐與教學研究, 2017(10):10.
【3】周凌. 淺析大數據時代的數據挖掘技術與應用[J]. 中小企業(yè)管理與科技(下旬刊), 2018, (5):194-195.
【4】劉毅娟, 雷鳴, 何旸,等. 大數據時代數據挖掘技術淺析[J]. 數字技術與應用, 2015(4):222-222.
【5】唐雅璇, 李麗娟, 吳芬琳. 大數據時代的數據挖掘技術與應用[J]. 電子技術與軟件工程, 2017(21):169.
【6】李翼, 孟莉. 大數據條件下的數據挖掘技術及應用[J]. 電子技術與軟件工程, 2017(18):198-198.
【7】許凡, 孫勤紅. 大數據時代的數據挖掘技術探討[J]. 電子技術與軟件工程, 2015(16):208-208.
【8】肖明. 大數據時代下數據挖掘技術在企業(yè)中的應用[J]. 中國管理信息化, 2015, 18(2):58-58.
作者簡介:姓名:盧文亮,性別:男,出生年月: 1989.06.04,民族:漢,籍貫:內蒙古,最高學歷:碩士在讀 職稱: 研究方向:計算機應用技術