遼寧石化職業(yè)技術(shù)學(xué)院 張靜波
計算機數(shù)據(jù)挖掘的原理和技術(shù)及其對提高數(shù)據(jù)庫處理能力的作用
遼寧石化職業(yè)技術(shù)學(xué)院 張靜波
當(dāng)前社會已經(jīng)進入到信息化時代,計算機技術(shù)被廣泛應(yīng)用于各個行業(yè)和領(lǐng)域中,改變了傳統(tǒng)生活生產(chǎn)模式,為人們提供了更多的便利。隨著計算機技術(shù)應(yīng)用范圍的不斷擴大,以及人們需求的提高,所產(chǎn)生的信息數(shù)據(jù)量也變得越來越多,為了提高信息數(shù)據(jù)庫的處理能力,保證數(shù)據(jù)處理的高效性和準確性,充分發(fā)揮計算機技術(shù)的應(yīng)用優(yōu)勢,就需要將計算機挖掘技術(shù)加以科學(xué)利用。文章分析了計算機挖掘技術(shù)的原理及不同類型,并對其在數(shù)據(jù)庫的具體應(yīng)用進行了討論,指出了該項技術(shù)的重要作用,以提高數(shù)據(jù)庫處理能力。
計算機數(shù)據(jù)挖掘技術(shù);數(shù)據(jù)庫;處理能力;應(yīng)用
計算機數(shù)據(jù)挖掘技術(shù)是指借助于計算機技術(shù),通過統(tǒng)計、分析、檢索、檢驗、識別等方法,找出數(shù)據(jù)中的隱藏信息,將其轉(zhuǎn)化為可以利用的信息,充分發(fā)揮出數(shù)據(jù)潛在價值的一種技術(shù)。數(shù)據(jù)庫是以數(shù)據(jù)結(jié)構(gòu)為原則,對所采集的數(shù)據(jù)進行整理、存儲、歸納、分類,以便人們可以從中搜索所需數(shù)據(jù)的倉庫。面對迅速發(fā)展的計算機技術(shù),數(shù)據(jù)庫的信息存儲量呈爆照性增長,數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)庫中的應(yīng)用,滿足了新時期對數(shù)據(jù)庫處理能力的需求,是數(shù)據(jù)處理的必然發(fā)展趨勢。
數(shù)據(jù)挖掘技術(shù)與數(shù)據(jù)庫之間存在著緊密關(guān)系,數(shù)據(jù)挖掘技術(shù)是提高數(shù)據(jù)庫處理能力的重要途徑,而數(shù)據(jù)庫是應(yīng)用計算機挖掘技術(shù)的前提條件。為了充分發(fā)揮出數(shù)據(jù)挖掘技術(shù)在提高數(shù)據(jù)庫處理能力方面的作用,就需要先了解數(shù)據(jù)挖掘的技術(shù)原理。
1.1 確定數(shù)據(jù)挖掘目的
為了充分發(fā)揮出計算機數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,在應(yīng)用之前,首先要確定數(shù)據(jù)挖掘目的,以實現(xiàn)最終目的為首要任務(wù),選擇合適的數(shù)據(jù)庫。計算機數(shù)據(jù)挖掘技術(shù)種類眾多,不同類型挖掘技術(shù)的具體功能以及使用方法是由一定區(qū)別的,要想保證數(shù)據(jù)隱藏信息的充分挖掘,實現(xiàn)預(yù)期目的,就需要保證挖掘方法的正確性。所以,在應(yīng)用計算機數(shù)據(jù)挖掘技術(shù)的時候,首先要確定數(shù)據(jù)挖掘目的,以此為核心,選合適的數(shù)據(jù)庫和挖掘方法[1]。
1.2 數(shù)據(jù)選擇和預(yù)處理
在確定數(shù)據(jù)挖掘目的和合適的數(shù)據(jù)庫之后,為了保證數(shù)據(jù)處理結(jié)果的準確性,提高處理效率,就需要在數(shù)據(jù)庫中縮小數(shù)據(jù)處理范圍,此時,便需要進行數(shù)據(jù)選擇,緊緊圍繞數(shù)據(jù)挖掘目的,從眾多數(shù)據(jù)中篩選出與之相關(guān)的所有數(shù)據(jù),確保挖掘目的的順利實現(xiàn)。因為選擇的與目標數(shù)據(jù)相關(guān)的信息中,會存在大量的重復(fù)、錯誤信息等無價值信息,會對數(shù)據(jù)挖掘造成干擾,還會降低數(shù)據(jù)處理效率,所以,便需要對選擇數(shù)據(jù)進行預(yù)處理,剔除無用信息,精簡目標數(shù)據(jù)。
1.3 數(shù)據(jù)挖掘
要想實現(xiàn)數(shù)據(jù)挖掘目的,正確選擇數(shù)據(jù)挖掘技術(shù)類型以及算法是非常重要的,所以在完成目標數(shù)據(jù)的預(yù)處理之后,便需要根據(jù)數(shù)據(jù)挖掘目的,確定數(shù)據(jù)挖掘技術(shù)的類型以及算法,對數(shù)據(jù)進行正式挖掘,保證數(shù)據(jù)處理過程的高效性和處理結(jié)果的準確性,得出所需信息。需要注意的是,在正式挖掘過程中,需要構(gòu)建與所用算法相對應(yīng)的數(shù)據(jù)模型,方便對數(shù)據(jù)進行更加深刻的分析,實現(xiàn)對數(shù)據(jù)隱藏信息的全面開發(fā),得出更多的有價值信息[2]。
1.4 評估結(jié)果
完成數(shù)據(jù)正式挖掘之后,并不意味著數(shù)據(jù)挖掘的結(jié)束,還需要對數(shù)據(jù)處理結(jié)果的準確性進行檢驗,所以在經(jīng)過計算、處理得出數(shù)據(jù)挖掘結(jié)果之后,需要對結(jié)果進行科學(xué)評估,判斷是否滿足實際需求。如果滿足實際需求,實現(xiàn)了數(shù)據(jù)挖掘目的,則可以對所得到的信息加以利用,解決實際問題;如果不滿足實際需求,沒有達到數(shù)據(jù)挖掘目的,則需要重新選擇算法、構(gòu)建數(shù)學(xué)模型,直到實現(xiàn)數(shù)據(jù)挖掘目的為止。
經(jīng)過不斷的研究、開發(fā),計算機數(shù)據(jù)挖掘技術(shù)變得越來越完善、成熟,出現(xiàn)了功能各不相同的多種類型,為其廣泛應(yīng)用創(chuàng)造了可行條件。常用的計算機數(shù)據(jù)挖掘技術(shù)主要有傳統(tǒng)統(tǒng)計方法、可視化技術(shù)、聯(lián)機分析處理、決策樹、計算機神經(jīng)網(wǎng)絡(luò)、遺傳算法等多種,需要對不同類型的數(shù)據(jù)挖掘技術(shù)功能進行具體分析[3]。
傳統(tǒng)統(tǒng)計方法的核心為統(tǒng)計學(xué)理論,抽樣統(tǒng)計、多元統(tǒng)計以及統(tǒng)計預(yù)測是經(jīng)常用到的幾種統(tǒng)計方法,抽樣統(tǒng)計是以少數(shù)信息為處理對象,多元統(tǒng)計主要應(yīng)用對象為結(jié)構(gòu)復(fù)雜的數(shù)據(jù),統(tǒng)計預(yù)測是對數(shù)據(jù)走勢進行演算、推測,包括序列分析和回歸分析兩種方法??梢暬夹g(shù)是將借助于圖形、表格等,將數(shù)據(jù)隱藏信息的特征更加直觀的呈現(xiàn)出來,與其他信息區(qū)分開來。聯(lián)機分析處理是利用多個計算機,對同一個數(shù)據(jù)集合進行分析。決策樹是指以一定的規(guī)則為依據(jù),將數(shù)據(jù)分為不同類型,并進行預(yù)測分析。計算機神經(jīng)網(wǎng)絡(luò)是將計算機數(shù)據(jù)挖掘技術(shù)分為輸入層、輸出層以及處理層三部分,完成對數(shù)據(jù)挖掘與處理。遺傳算法是以自然界遺傳原理為基礎(chǔ)形成的,將數(shù)據(jù)模型按照一定的規(guī)則進行重新組合,對數(shù)據(jù)進行優(yōu)化選擇,得出最為合適、準確的數(shù)據(jù)組合。
3.1 在金融投資中的作用
對于金融投資行業(yè)來說,其數(shù)據(jù)庫所包含的信息量是非常龐大的,數(shù)據(jù)模型是數(shù)據(jù)分析時必不可少的輔助性工具,但是僅僅通過數(shù)據(jù)模型,是很難對未來市場形勢作出較為準確的預(yù)測的,投資行為存在較大的風(fēng)險性[4]。將數(shù)據(jù)挖掘技術(shù)應(yīng)用與金融投資中,在對數(shù)據(jù)庫進行處理時,可以對數(shù)據(jù)之間的內(nèi)在關(guān)系進行更加深入的分析,找出數(shù)據(jù)之間所存在的相互影響,以此作為依據(jù),結(jié)合數(shù)據(jù)模型,對金融市場的未來走勢進行預(yù)測,發(fā)現(xiàn)可能出現(xiàn)的金融風(fēng)險,并制定針對性的防范措施,實現(xiàn)理性投資,能夠有效預(yù)防金融詐騙行為。
3.2 在市場營銷中的作用
隨著用戶需要的不斷增多,市場營銷過程中所涉及到的數(shù)據(jù)信息越來越多,傳統(tǒng)數(shù)據(jù)處理方法已經(jīng)無法滿足當(dāng)前市場營銷行業(yè)數(shù)據(jù)庫處理需求,所以必須應(yīng)用計算機數(shù)據(jù)挖掘技術(shù)來提高數(shù)據(jù)處理效率。通過利用數(shù)據(jù)挖掘技術(shù),可以對不同客戶的購物行為及購物習(xí)慣進行分析,了解客戶的實際購物需求及消費觀念,然后對數(shù)據(jù)特征進行總結(jié),并按照不同的標準將其進行分類,為企業(yè)制定科學(xué)、可行的營銷策略提供可靠資料,增強企業(yè)營銷能力[5]。
3.3 在教育教學(xué)中的作用
數(shù)據(jù)挖掘技術(shù)在教育教學(xué)中也能發(fā)揮巨大作用。首先,老師可以依據(jù)月考成績,利用數(shù)據(jù)挖掘技術(shù)對學(xué)生的期末成績進行預(yù)測,做到對學(xué)生學(xué)習(xí)情況的全面了解,找出學(xué)生學(xué)習(xí)上的薄弱環(huán)節(jié),提醒學(xué)生進行重點復(fù)習(xí)。同時,還能將學(xué)習(xí)資料進行整合、分類,依托網(wǎng)絡(luò)構(gòu)建學(xué)習(xí)資料庫,為學(xué)生提供更加豐富的學(xué)習(xí)資源,使學(xué)生可以根據(jù)自己需求自由選擇學(xué)習(xí)資料,對于提高教學(xué)質(zhì)量是非常重要的。
3.4 在其他領(lǐng)域中的作用
數(shù)據(jù)挖據(jù)技術(shù)的應(yīng)用范圍是比較廣泛的,除了上述三個行業(yè)及領(lǐng)域之外,還被應(yīng)用于軍事、稅務(wù)等領(lǐng)域中。在軍事領(lǐng)域中,通過應(yīng)用數(shù)據(jù)挖掘技術(shù),可以快速完成數(shù)據(jù)的收集、整理以及分析等工作,做到對我國軍事實力的全面了解,同時還能時刻掌控國外敵對勢力的動向。在稅務(wù)工作中,可以通過數(shù)據(jù)挖掘技術(shù)對那些偷稅、漏稅的企業(yè)進行及時追蹤,找出納稅行為規(guī)律,制定有效的工作策略,減少偷稅漏稅現(xiàn)象,除此之外,數(shù)據(jù)挖掘技術(shù)還在煤礦開采、半導(dǎo)體制造領(lǐng)域中發(fā)揮著巨大作用。
在數(shù)據(jù)處理過程中,應(yīng)用計算機數(shù)據(jù)挖掘技術(shù),能夠有效提高數(shù)據(jù)處理效率和準確性,充分發(fā)揮出數(shù)據(jù)潛在信息價值,對于提高數(shù)據(jù)庫搜索效率以及處理能力具有重要作用。基于數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)處理中的巨大應(yīng)用優(yōu)勢,該項技術(shù)已經(jīng)被廣泛應(yīng)用于金融投資、市場營銷、教育教學(xué)等眾多行業(yè)很領(lǐng)域中。并且隨著研究和開發(fā)力度的提高,計算機數(shù)據(jù)挖掘技術(shù)將會變得更加完善、成熟,擁有更加廣闊的應(yīng)用空間和發(fā)展前景,對加快社會發(fā)展具有重要意義。
[1]夏天維。計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[J]。決策與信息旬刊,2016(3):234-234.
[2]章萬威。計算機數(shù)據(jù)挖掘技術(shù)的應(yīng)用探討[J]。計算機光盤軟件與應(yīng)用,2014(9):136-136.
[3]劉世勇,羅美淑。數(shù)據(jù)挖掘技術(shù)在計算機教學(xué)中的應(yīng)用[J]。中國新通信,2012(21):59-60.
[4]林進。數(shù)據(jù)挖掘技術(shù)在計算機考試數(shù)據(jù)中的應(yīng)用分析[J]。考試周刊,2015(39):1-1.
[5]宋金城。計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[J]。計算機光盤軟件與應(yīng)用,2013(23):130-130.
張靜波(1979-),女, 遼寧錦州人,講師,主要研究方向:計算機科學(xué)與技術(shù)。