王煒
【摘要】 改革開放以來,我國的綜合國力在不斷的壯大,經(jīng)濟社會也在不斷的發(fā)展,各行各業(yè)隨著經(jīng)濟的積累也在不斷發(fā)展。計算機技術和信息技術的發(fā)展也突飛猛進。信息的總數(shù)在不斷的上升,為了更好的對數(shù)據(jù)進行統(tǒng)計,一些新的數(shù)據(jù)統(tǒng)計的方式應勢而生。為能更方便提取有效數(shù)據(jù)的工作起了推進的作用。本文將對遺傳算法在數(shù)據(jù)中的應用進行全面的分析和研究。希望可以對數(shù)據(jù)的統(tǒng)計和提取有效數(shù)據(jù)的工作在日后的工作中起到借鑒性的作用。
【關鍵詞】 遺傳算法 數(shù)據(jù)挖掘 應用 研究
引言
計算機技術的不斷發(fā)展,信息技術的不斷進步,使得數(shù)據(jù)庫中的數(shù)據(jù)越來越多,越來越細,也越來越雜亂。想要在這么多繁雜的數(shù)據(jù)中,快速有效的提取出有用的數(shù)據(jù)信息。傳統(tǒng)的數(shù)據(jù)的提取方式已經(jīng)不能再適應科學技術的進步和發(fā)展,數(shù)據(jù)挖掘的出現(xiàn),正好彌補了數(shù)據(jù)在提取過程中的這一缺點[1]。數(shù)據(jù)挖掘可以從大量繁雜的數(shù)據(jù)中,提取出一些有用的數(shù)據(jù),大大減少了在數(shù)據(jù)提取工作中的時間消耗。提高了工作效率的同時,節(jié)約的工作時間。
一、數(shù)據(jù)挖掘的現(xiàn)狀研究
近幾年來對數(shù)據(jù)挖掘的研究主要集中在幾個問題上。一是研究專門用于挖掘知識方面的數(shù)據(jù)的形式化語言。二是對不同類型的數(shù)據(jù)進行處理工作,主要是對相互關聯(lián)的數(shù)據(jù)和一些較為復雜的數(shù)據(jù)進行挖掘時的研究工作。三是對此題目研究興趣的分析研究。四是對數(shù)據(jù)庫中不同類型的數(shù)據(jù)的挖掘工作的研究。五是對不同數(shù)據(jù)算法的研究,目前主要且常用的數(shù)據(jù)算法有:并行式的算法、分布式的算法和增量的挖掘研究。六是對數(shù)據(jù)挖掘結果的研究。
二、遺傳算法的現(xiàn)狀研究
目前在對遺傳算法的研究主要集中在四個大問題上。其一是研究有關于遺傳算法的理論,遺傳算法理論的主要內容包括:影響算法的有關設置,有關的專業(yè)數(shù)學統(tǒng)計解釋等。其二是遺傳算法的改進,在不斷發(fā)展的技術進步的影響下,遺傳算法的方式也需要不斷的隨之改進,能更好的在龐大數(shù)據(jù)中進行計算分析[2]。其三是研究,并行化的遺傳算法,這一問題的研究對遺傳算法的發(fā)展有具有重要意義。其四是研究遺傳算法與其他技術能否混合使用,這一研究的目的是為了提高其工作的速度,節(jié)省工作時間。
三、遺傳算法與數(shù)據(jù)研究之間的關系
數(shù)據(jù)挖掘與遺傳算法之間是相互包含的關心,數(shù)據(jù)挖掘包含遺傳算法,遺產算法是數(shù)據(jù)挖掘中眾多算法中的一種,但是是最主要的一種。由于遺傳算法的重要性和在數(shù)據(jù)挖掘中所占有的重要地位,遺傳算法適應的范圍越來越廣,有關技術部門對其的重視程度也隨之增加。遺傳算法在諸多方面得到應用,逐漸成為了數(shù)據(jù)挖掘領域中,新的具有重要意義的研究性課題。
四、數(shù)據(jù)挖掘的應用
數(shù)據(jù)挖掘已經(jīng)運用到越來越多的行業(yè)當中,數(shù)據(jù)挖掘應用的工作也得到了很好的落實。但是在數(shù)據(jù)挖掘實際應用的過程中還是存在著一些問題。數(shù)據(jù)挖掘應用的領域越廣泛,受到的挑戰(zhàn)就越大。這些挑戰(zhàn)分別體現(xiàn)在不同領域的運用中。例如生物學領域的數(shù)據(jù)挖掘,金融領域的數(shù)據(jù)挖掘,電信領域的數(shù)據(jù)挖掘等諸多方面。由于這些領域的數(shù)據(jù)都比較繁雜,所以挖掘的工作就會不同程度的存在一些難度問題。
五、遺傳算法中存在的不足
遺傳算法雖然是數(shù)據(jù)挖掘中最主要的算法之一,但是遺傳算法本身還是存在著一定的不足方面。在遺傳算法進行工作中,如果算法的工作目標不確定,就會影響遺傳算法的工作進行,減低遺傳算法的工作效率[3]。遺傳算法由于受到一定模式的影響,在對較多相似的數(shù)據(jù)進行提取時可能會影響遺傳算法的工作速度,遺傳算法的靈活能力較低。在對參考數(shù)據(jù)的設置過程中理論依據(jù)不完善,容易造成在進行數(shù)據(jù)的運算過程中不能較快、較好的找到可以參考的數(shù)值,延誤數(shù)據(jù)運算的工作。
六、遺傳算法在數(shù)據(jù)挖掘中的應用分析
數(shù)據(jù)挖掘主要是對一些數(shù)據(jù)量大,且種類多,相似度高數(shù)據(jù)進行的提取有效數(shù)據(jù)的過程和對有效數(shù)據(jù)的計算過程,為了更好的達到這個目的。就要對數(shù)據(jù)挖掘中最主要的計算方式,遺傳算法進行完善和創(chuàng)新,只有不斷的完善,總結出最科學的算術系統(tǒng),才能更好的完成大量數(shù)據(jù)運算的工作。
七、結語
通過上文的分析,可以看出,數(shù)據(jù)挖掘在對數(shù)據(jù)進行提起的工作中的運用越來越廣泛。數(shù)據(jù)挖掘較傳統(tǒng)的數(shù)據(jù)提取方式來說,具有許多優(yōu)勢。數(shù)據(jù)挖掘的工作時間更短、提取數(shù)據(jù)的速度更快、工作效率更高等這些是數(shù)據(jù)挖掘的優(yōu)勢之處。
為了更好的利用數(shù)據(jù)挖掘,就要求相關人員在以后的工作中能更加注重數(shù)據(jù)挖掘這方面的研究。希望本文的分析能對以后的研究工作起到借鑒作用,為以后的研究工作打下良好的數(shù)據(jù)基礎。
參 考 文 獻
[1]劉建華,王勇,洪月好.遺傳算法編碼設計及其在數(shù)據(jù)挖掘中的應用[J].上海電力學院學報,2005,(03):244-248.
[2]王淑靜,賈兆紅,王亮等.遺傳算法在決策支持系統(tǒng)和數(shù)據(jù)挖掘中的應用[J].計算機技術與發(fā)展,2006,(08):35-37.
[3]李智玲,張亦軍,胡彧.基于粗糙集的遺傳算法在數(shù)據(jù)挖掘中的應用[J].科技情報開發(fā)與經(jīng)濟,2009,3(09):127-129