孫云鵬
【摘要】 筆者在對前人研究成果進行匯總研究分析后,采用分層分析法對數(shù)據(jù)挖掘技術在軟件工程中的應用進行層層剖析,首先論述了在軟件工程中的數(shù)據(jù)挖掘技術應用發(fā)展歷史,然后對該技術在軟件工程中的應用進行了深入剖析,以其為數(shù)據(jù)挖掘技術在軟件工程中的應用打下良好的理論基礎,起到一定的促進幫助作用。
【關鍵詞】 數(shù)據(jù)挖掘 軟件工程 應用
前言:隨著現(xiàn)代化進程的不斷發(fā)展。我國針對于數(shù)據(jù)挖掘技術的研究深度已經(jīng)逐漸的加大,越來越多的學者參加到數(shù)據(jù)挖掘技術的研究過程當中,并且獲得了相當多的研究理論與研究結(jié)果,盡管如此,但是由于我國在數(shù)據(jù)挖掘技術研究時間還比較短,因此與其它國家先進的數(shù)據(jù)挖掘技術研究還存在著一定的差距,目前我國已經(jīng)將說句挖掘技術列入了重點的研究項目當中,隨著研究的不斷深入,相信我國的數(shù)字挖掘技術,也將越來越成熟,越來越趨完善。
一、在軟件工程中的數(shù)據(jù)挖掘技術應用發(fā)展歷史
所謂的數(shù)據(jù)挖掘技術還有一個比較常用的稱呼,就是數(shù)據(jù)庫中的信息資源提取,該技術與數(shù)據(jù)庫相互依存,不可割舍。從剛開始的提出,到最后的實踐應用,該技術漸漸地走向更為多向化和多功能化,并且在該項技術中融入了相當多的重要領域技術。而對于軟件工程來說,其最原始的意義起源于一九六七年,該項工程自提出以后就一直受到重點研究和關注,就其功能將其進行定義為采用工程化的途徑或者是方法對具有實用意義的并且高質(zhì)量的和存在一定功能效用的軟件內(nèi)容進行構(gòu)造和創(chuàng)建,這樣的軟件構(gòu)建預期的目標是在一定的背景條件下以及成本基礎上,所研究開發(fā)出的軟件產(chǎn)品能夠滿足使用者的大部分需求[1]。在20世紀末期,研究者們逐漸的將數(shù)據(jù)挖掘技術與工程軟件相互結(jié)合,令數(shù)據(jù)挖掘技術應用在工程軟件當中,這樣的理論受到了著名學者Allen 以及其他學者的一致認可,主要是通過數(shù)據(jù)挖掘技術對軟件工程中的代碼之間存在的關系進行查找,從起源到今天,這樣的二者結(jié)合應用形式,已經(jīng)逐漸變得更為完善[2]。
二、數(shù)據(jù)挖掘技術在軟件工程中的應用剖析
2.1對克隆代碼的數(shù)據(jù)挖掘
在軟件工程領域中,對克隆代碼的檢查與測試是最為原始的數(shù)據(jù)挖掘需求之一,直到目前已經(jīng)逐漸演變出了很多的方式,其主要可以分為以下幾種:
2.1.1將文本對比作為基礎的方式
采用計算機軟件系統(tǒng)中的對比程序代碼中所包含的語句行展開進一步的判斷過程,這種方法在進行后期的改進過程中針對的是對字符串的匹配效率進行提升,提升的辦法有很多,最為主要的就是通過Hash函數(shù)技術進行匹配效率優(yōu)化,在這個過程中最為常用的工具為Duploc。
2.1.2將標識符對比作為基礎的方式
將標識符對比作為基礎的方式,最具代表性的方式是對由分詞所組成的標識符序列構(gòu)造前綴樹,并將其作為依據(jù)然后進行對比,將標識符對比作為基礎的方式的工具主要有CCFinder、Dup等[3]。
2.2計算機軟件數(shù)據(jù)檢索挖掘
數(shù)據(jù)檢索挖掘與克隆代碼一樣,同樣是計算機軟件工程中最為原始的數(shù)據(jù)挖掘需求之一,對于計算機軟件數(shù)據(jù)檢索挖掘來說其主要分為以下三步:
第一步,為數(shù)據(jù)信息的錄入。所謂的數(shù)據(jù)信息錄入實際上指的是對于要檢索的信息進行錄入的過程,針對使用者的需求將使用者所需要的數(shù)據(jù)信息輸入到檢索信息錄入框中進行數(shù)據(jù)的查找。
第二步,為數(shù)據(jù)信息的查找過程。當客戶所需要的信息進入到數(shù)據(jù)檢索錄入框中時,進行確認后數(shù)據(jù)挖掘系統(tǒng)將會根據(jù)數(shù)據(jù)信息中所涵蓋的數(shù)據(jù)信息內(nèi)容進行數(shù)據(jù)庫中的查找,并且根據(jù)不同的分類,對查找信息的數(shù)據(jù)信息資料進行羅列[4]。
第三步,為數(shù)據(jù)信息資料內(nèi)容的導出和查看,在查找到相關的客戶需要數(shù)據(jù)內(nèi)容時,客戶可以根據(jù)自己本身的實際需要,進行數(shù)據(jù)信息的導出或者是在線查看,在數(shù)據(jù)信息資料導出后,需要應用相關的數(shù)據(jù)信息查看軟件進行查看。并且客戶在導出數(shù)據(jù)信息時,會在中形成一定的歷史記錄,對客戶及時查找的數(shù)據(jù)信息進行記錄與保存,當客戶想要再次進行查找時能夠更為方便與快捷的找到其所需要的數(shù)據(jù)信息內(nèi)容。
三、結(jié)語
綜上所述,面對現(xiàn)今的發(fā)展形勢來說,軟件工程技術已經(jīng)逐漸滲入到各領域當中,并且得到了相當廣泛的應用,作為該工程當中的一項重要技術,數(shù)據(jù)挖掘技術也將發(fā)揮其最大的功用,充分體現(xiàn)其巨大的應用價值,并且隨著更多的軟件工程技術的發(fā)掘,數(shù)據(jù)發(fā)掘技術已經(jīng)不再是“獨立作戰(zhàn)”,綦江與其它的軟件工程技術共同融合滲透,進而保證軟件工程技術的完善性,相信在未來的發(fā)展過程當中,更加具有優(yōu)勢的數(shù)據(jù)發(fā)掘技術能夠為我國整體的技術人員發(fā)展打下良好的基礎進而促進我國整體的國民性進步。
參 考 文 獻
[1]毛澄映,盧炎生,胡小華.數(shù)據(jù)挖掘技術在軟件工程中的應用綜述[J].計算機科學,2012,05:1-6+26.
[2]徐建敏,區(qū)木華,熊金志.數(shù)據(jù)挖掘技術在體育訓練中的應用綜述與分析[J].電腦知識與技術,2012,22:5492-5495.
[3]張志榮,黃杰,孫偉宏,韓曉東,蘇先名.數(shù)據(jù)挖掘在軟件工程領域中的應用淺析[J].電子測試,2013,09:246-247+271.