童凌
【摘要】 就軟件工程項(xiàng)目當(dāng)中數(shù)據(jù)挖掘技術(shù)應(yīng)用的實(shí)際情況來看,信息規(guī)則挖掘技術(shù)已經(jīng)逐漸被應(yīng)用到了很多行業(yè)領(lǐng)域當(dāng)中,成功地完成了對龐大數(shù)據(jù)的分析和整理,并且將提取到有用信息展現(xiàn)在人們面前,基于此,本文將針對軟件工程當(dāng)中的數(shù)據(jù)挖掘技術(shù)的研究進(jìn)展展開分析,研究數(shù)據(jù)挖掘技術(shù)之所以被得到廣泛應(yīng)用的原因以及開發(fā)過程當(dāng)中所面臨的挑戰(zhàn),旨在能夠進(jìn)一步加深對該項(xiàng)技術(shù)的理解。
【關(guān)鍵詞】 軟件工程 數(shù)據(jù)挖掘 研究進(jìn)展
前言:隨著計(jì)算機(jī)技術(shù)不斷發(fā)展,軟件工程項(xiàng)目當(dāng)中的數(shù)據(jù)挖掘技術(shù)水平也不斷地得到提高,現(xiàn)代化的數(shù)據(jù)挖掘技術(shù)將繼續(xù)致力于智能技術(shù)以及自動化技術(shù)的開發(fā)中,不斷創(chuàng)新挖掘潛力,使之能夠處理更為龐大的數(shù)據(jù)系統(tǒng),并且不斷地完善技術(shù)分析工具,從而使得數(shù)據(jù)挖掘技術(shù)能夠更好地被應(yīng)用到軟件工程的研究中。
一、數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘這一概念主要與軟件工程以及計(jì)算機(jī)應(yīng)用技術(shù)有密切的關(guān)系,它采用了一種新的計(jì)算方式在龐大的數(shù)據(jù)基礎(chǔ)中找到想要的數(shù)據(jù)信息,因此被稱之為數(shù)據(jù)挖掘,事實(shí)上,這是一種新型的數(shù)據(jù)分析方式,現(xiàn)代化軟件工程項(xiàng)目的研究任務(wù)非常龐大,軟件代碼量的急劇增長導(dǎo)致數(shù)據(jù)量的快速增加,傳統(tǒng)的數(shù)據(jù)計(jì)算方式已經(jīng)無法滿足當(dāng)代的數(shù)據(jù)分析要求,人們急切盼望能夠發(fā)展出一種新的數(shù)據(jù)分析模式,來實(shí)現(xiàn)對有效信息數(shù)據(jù)的整理工作。[1]
二、數(shù)據(jù)挖掘技術(shù)在軟件工程項(xiàng)目中的應(yīng)用現(xiàn)狀
2.1數(shù)據(jù)挖掘技術(shù)得到廣泛應(yīng)用的原因
數(shù)據(jù)挖掘技術(shù)得到廣泛應(yīng)用,主要基于兩個原因。一方面,由于計(jì)算機(jī)存儲器容量的快速增長,網(wǎng)絡(luò)傳輸帶寬的增加,應(yīng)用軟件能夠存儲大量可供分析的數(shù)據(jù)信息,;另一方面,由于現(xiàn)代化信息技術(shù)不斷發(fā)展,軟件開發(fā)水平也得到進(jìn)步,大量數(shù)據(jù)挖掘算法得到徹底的研究,因此這些算法得以深入到前所未有的特定領(lǐng)域,挖掘出用戶的隱性需求。不僅如此,此種技術(shù)還有著儲存方便、簡單的優(yōu)點(diǎn),具有應(yīng)用成本低的優(yōu)勢。數(shù)據(jù)挖掘技術(shù)不需要依附于其他特定的技術(shù)平臺,僅需對現(xiàn)有的數(shù)據(jù)平臺進(jìn)行詳細(xì)分析,減少了相關(guān)硬件成本。因此,數(shù)據(jù)挖掘技術(shù)在軟件項(xiàng)目開發(fā)中越來越受到人們的重視。
2.2面對的挑戰(zhàn)
一般工程項(xiàng)目本身的數(shù)據(jù)量非常龐大,因而這些數(shù)據(jù)具有一定的復(fù)雜度,在針對這些軟件工程中的數(shù)據(jù)進(jìn)行分析時,還要同時解決一些代碼問題和注釋問題,這在無形之中增加了技術(shù)分析的復(fù)雜度。除此以外,在現(xiàn)代化的軟件工程項(xiàng)目當(dāng)中,對于分析結(jié)果展示要求非常高,因此在數(shù)據(jù)挖掘技術(shù)的開發(fā)和應(yīng)用過程中,還要綜合性地研究技術(shù)的使用功能,進(jìn)而實(shí)現(xiàn)技術(shù)應(yīng)用領(lǐng)域的開拓研究[2],即數(shù)據(jù)可視化技術(shù)。不過一部分技術(shù)分析的結(jié)果并不是非常徹底,對于數(shù)據(jù)挖掘分析的結(jié)果評價不是非常完善,而且也沒有統(tǒng)一出定量的評價方式,這就使得數(shù)據(jù)分析時所使用的方法不同,分析出的結(jié)果也不同,因此不能夠很好地對分析結(jié)果進(jìn)行總結(jié)。
2.3開發(fā)出更高性能的數(shù)據(jù)挖掘技術(shù)
在創(chuàng)新數(shù)據(jù)挖掘技術(shù)開發(fā)的過程中,現(xiàn)代化的軟件工程項(xiàng)目更加注重關(guān)于重用分析規(guī)則的發(fā)現(xiàn)以及檢索項(xiàng)目。通過樹狀的網(wǎng)絡(luò)結(jié)構(gòu)與靜態(tài)動態(tài)網(wǎng)絡(luò)規(guī)則的鏈表結(jié)構(gòu)來進(jìn)行規(guī)則研究,從規(guī)則的角度上來挖掘軟件工程內(nèi)部當(dāng)中的整體性,規(guī)則索引手段更得到了進(jìn)一步的創(chuàng)新發(fā)展,使得檢索的規(guī)則形式變得更加地多樣化,提高了檢索的效率[3]。
另外,數(shù)據(jù)挖掘技術(shù)最終需要面向應(yīng)用才能體現(xiàn)它的價值,而深入研究的各類數(shù)據(jù)挖掘算法擁有各自不同的特定應(yīng)用領(lǐng)域。比如,在市場營銷中,可以使用Apriori算法,它不僅能夠基于現(xiàn)有的數(shù)據(jù)進(jìn)行分析,還能夠做出準(zhǔn)確度很高的相關(guān)預(yù)測。
傳統(tǒng)的缺陷定位技術(shù)并不能夠完全找到軟件工程的缺陷,而融合創(chuàng)新了數(shù)據(jù)挖掘技術(shù)以后,使得缺陷定位系統(tǒng)變得更加健全,而且擁有了更為強(qiáng)大的規(guī)則表達(dá)行為,將軟件工程構(gòu)造成為一種模型,在模型當(dāng)中,更好地表達(dá)出了序列以及樹的行為,并且實(shí)現(xiàn)了自動化的評價功能,同時也完成了一些關(guān)于反向研究工程以及文檔的自動生成項(xiàng)目,還加深了對一些惡意軟件檢索功能。運(yùn)用更高性能的數(shù)據(jù)挖掘技術(shù),能夠很快地就找到病毒所在,對病毒進(jìn)行全方位的數(shù)據(jù)分析評估,進(jìn)而可以有效地提高數(shù)據(jù)分析的可行性,提高了軟件工程開發(fā)的安全性能,將對軟件工程的研究轉(zhuǎn)變成為一種動態(tài)發(fā)展的過程。
三、結(jié)論
綜上所述,隨著軟件工程項(xiàng)目當(dāng)中數(shù)據(jù)挖掘技術(shù)的不斷應(yīng)用和發(fā)展,相信在不久的將來,一定會取得更為優(yōu)秀的成績,使得軟件工程項(xiàng)目的發(fā)展變得更加地智能化與自動化,根據(jù)研究進(jìn)展的情況來看,軟件工程項(xiàng)目以及數(shù)據(jù)挖掘技術(shù)將有著更為廣闊的發(fā)展空間,今后的技術(shù)工具研究一定會更加完善,從而創(chuàng)造出更大的價值。
參 考 文 獻(xiàn)
[1]賀瑋.軟件工程數(shù)據(jù)挖掘技術(shù)的研究進(jìn)展[J].科技風(fēng),2014,17:141+145.
[2]馬保平.關(guān)于對軟件工程中的數(shù)據(jù)挖掘技術(shù)的探討[J].電子技術(shù)與軟件工程,2015,19:196-197.
[3]黃世云.軟件工程數(shù)據(jù)挖掘研究進(jìn)展概述[J].電子技術(shù)與軟件工程,2014,21:89.