劉知云
摘要:近年來(lái),信息技術(shù)的快速發(fā)展使得數(shù)據(jù)挖掘技術(shù)也在各個(gè)行業(yè)中獲得了廣泛的應(yīng)用,并且數(shù)據(jù)挖掘技術(shù)也充分展現(xiàn)出了顯著優(yōu)勢(shì),推助許多行業(yè)的快速發(fā)展。計(jì)算機(jī)技術(shù)也已經(jīng)成為人們生產(chǎn)生活中不可或缺的工具,而數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)軟件工程中的運(yùn)用則具有現(xiàn)實(shí)意義。信息化時(shí)代下,以往的信息處理技術(shù)難以滿足海量信息的處理和存儲(chǔ)要求,數(shù)據(jù)挖掘技術(shù)的應(yīng)用則很好地解決了這些問(wèn)題,在軟件工程中的運(yùn)用能夠?qū)?shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì)全面發(fā)揮,在改善軟件工程研發(fā)效率的同時(shí)也降低了管理成本。本文主要圍繞軟件工程中數(shù)據(jù)挖掘技術(shù)的運(yùn)用展開(kāi)論述,探討了有關(guān)的應(yīng)用策略。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);軟件工程;應(yīng)用對(duì)策
在大數(shù)據(jù)分析領(lǐng)域中,數(shù)據(jù)挖掘是一項(xiàng)新興的概念,數(shù)據(jù)挖掘的關(guān)鍵便是針對(duì)數(shù)據(jù)量大且價(jià)值密度低的數(shù)據(jù)進(jìn)行高效分析,從中提取出具有應(yīng)用價(jià)值和研究?jī)r(jià)值的信息數(shù)據(jù),從而進(jìn)一步提高數(shù)據(jù)的應(yīng)用率。軟件工程經(jīng)歷了多年的發(fā)展,在軟件開(kāi)發(fā)與項(xiàng)目管理等方面也面臨著數(shù)據(jù)分析的問(wèn)題,如漏洞分析和源代碼管理等。軟件在長(zhǎng)時(shí)間運(yùn)作之下不斷累積數(shù)據(jù),但數(shù)據(jù)量越來(lái)越大的同時(shí)傳統(tǒng)的處理手段無(wú)法實(shí)現(xiàn)全面處理,所以數(shù)據(jù)挖掘技術(shù)在軟件工程中的有效應(yīng)用成為當(dāng)下研究的重點(diǎn)方向。
1 數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介
數(shù)據(jù)挖掘技術(shù)屬于現(xiàn)代化的信息處理技術(shù),與傳統(tǒng)的信息處理技術(shù)對(duì)比之下具有非常明顯的功能性優(yōu)勢(shì),因此也在許多行業(yè)中獲得了普遍運(yùn)用。目前在軟件工程領(lǐng)域中,對(duì)于數(shù)據(jù)挖掘技術(shù)應(yīng)用價(jià)值的研究仍然較少,很多軟件工程都在沿用傳統(tǒng)的數(shù)據(jù)處理技術(shù),導(dǎo)致數(shù)據(jù)處理效率難以提升。而數(shù)據(jù)挖掘技術(shù)則包含了多種功能,不同功能之間也有著明顯的聯(lián)系性,可以實(shí)現(xiàn)全面評(píng)估,對(duì)于部分軟件工程來(lái)說(shuō),數(shù)據(jù)挖掘技術(shù)的應(yīng)用最明顯的優(yōu)勢(shì)便在于數(shù)據(jù)處理效率獲得了顯著提升,同時(shí)數(shù)據(jù)丟失等問(wèn)題也得到了很好的解決,對(duì)企業(yè)的發(fā)展帶來(lái)了有效保障。
2 數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件工程的關(guān)鍵意義
2.1 有助于信息的獲取
數(shù)據(jù)挖掘技術(shù)也包括傳統(tǒng)信息處理中的各項(xiàng)重要功能,在完成信息采集工作后,可以按照數(shù)據(jù)信息的具體類型進(jìn)行分類處理。在這一處理機(jī)制下,數(shù)據(jù)挖掘技術(shù)所涉及的業(yè)務(wù)范圍也有了進(jìn)一步的拓展,可以結(jié)合數(shù)據(jù)的具體特征進(jìn)行分析,在海量數(shù)據(jù)資源中建立一個(gè)功能性完備的信息管理系統(tǒng),可以幫助人們快速檢索到需要的數(shù)據(jù)資源。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件工程中,也可以將許多信息進(jìn)行整合處理,幫助企業(yè)快速掌握各方面數(shù)據(jù)信息。
2.2 信息的正確錄入
數(shù)據(jù)挖掘技術(shù)的運(yùn)算水平非常高,常規(guī)數(shù)據(jù)信息系統(tǒng)在運(yùn)算過(guò)程中往往會(huì)需要較高的時(shí)間成本,并且部分情況下也可能由于數(shù)據(jù)處理量過(guò)高導(dǎo)致運(yùn)算系統(tǒng)崩潰等問(wèn)題。而數(shù)據(jù)挖掘技術(shù)的應(yīng)用則可以有效避免這一問(wèn)題,運(yùn)算效率更高的同時(shí)在運(yùn)算期間也能夠進(jìn)一步規(guī)避數(shù)據(jù)丟失或運(yùn)算混亂等問(wèn)題,加強(qiáng)數(shù)據(jù)處理的整體效果。對(duì)于大規(guī)模數(shù)據(jù)的運(yùn)算來(lái)說(shuō),一些垃圾數(shù)據(jù)并沒(méi)有利用價(jià)值,但可能會(huì)存儲(chǔ)于數(shù)據(jù)處理系統(tǒng)中影響系統(tǒng)運(yùn)作效率,數(shù)據(jù)挖掘技術(shù)的應(yīng)用也可以將這些垃圾數(shù)據(jù)進(jìn)行處理,將具有價(jià)值的信息錄入到系統(tǒng)中。
2.3 提高數(shù)據(jù)處理效率
對(duì)于數(shù)據(jù)挖掘技術(shù)來(lái)說(shuō),數(shù)據(jù)轉(zhuǎn)換也是最主要的優(yōu)勢(shì)之一,能夠?qū)⒒靵y的數(shù)據(jù)信息進(jìn)行整合處理,成為使用形式,而這些混亂的信息也可以在整合之后進(jìn)行合理利用。雜數(shù)據(jù)挖掘過(guò)程中,可以自動(dòng)選擇合理的分析模式,針對(duì)模糊數(shù)據(jù)進(jìn)行及時(shí)處理,使最后的數(shù)據(jù)結(jié)果能夠全面利用。結(jié)合獲取到的數(shù)據(jù),從不同方向著手考查數(shù)據(jù)的真實(shí)性和價(jià)值,將真實(shí)地?cái)?shù)據(jù)進(jìn)行整合,讓數(shù)據(jù)可讀化,也就是將分析結(jié)果作為全新的知識(shí)以供參考。數(shù)據(jù)分析過(guò)程一般較為煩瑣,需要對(duì)不同過(guò)程進(jìn)行多次驗(yàn)證,才能獲取真實(shí)的運(yùn)算結(jié)果,而數(shù)據(jù)挖掘技術(shù)在軟件工程中的有效應(yīng)用則可以全面改善數(shù)據(jù)運(yùn)算的效率與質(zhì)量[1]。
3 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用策略
3.1 信息挖掘
軟件工程可以實(shí)現(xiàn)信息數(shù)據(jù)的全方位管控,而且軟件工程的應(yīng)用范圍也非常廣闊,在軟件開(kāi)發(fā)過(guò)程中需要涉及的信息類型多種多樣,而軟件工程的版本則可以對(duì)這些信息數(shù)據(jù)進(jìn)行統(tǒng)一控制,確保軟件在開(kāi)發(fā)期間的各種數(shù)據(jù)資源都能進(jìn)行同步更新,進(jìn)一步確保軟件開(kāi)發(fā)的質(zhì)量以及開(kāi)發(fā)過(guò)程的效率性,讓開(kāi)發(fā)項(xiàng)目的目標(biāo)能夠順利實(shí)現(xiàn)。在數(shù)據(jù)挖掘過(guò)程中,包括軟件開(kāi)發(fā)更替的數(shù)據(jù),技術(shù)人員可以快速區(qū)別軟件的內(nèi)部結(jié)構(gòu),并且還可以充分應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì),在后續(xù)的工作中能夠迅速找出軟件內(nèi)部問(wèn)題并解決,完成軟件開(kāi)發(fā)任務(wù)。
3.2 軟件漏洞檢測(cè)
在軟件工程中,漏洞檢測(cè)作為其中不可或缺的工作內(nèi)容,可以確保軟件開(kāi)發(fā)質(zhì)量和系統(tǒng)的安全運(yùn)作,及時(shí)發(fā)現(xiàn)隱患并及時(shí)排除隱患。軟件漏洞的快速修復(fù)可以為用戶提供更加穩(wěn)定的保障。在數(shù)據(jù)挖掘技術(shù)的應(yīng)用方面,漏洞檢測(cè)中不但要針對(duì)軟件進(jìn)行基本的測(cè)試內(nèi)容,而且也應(yīng)當(dāng)進(jìn)行相關(guān)性檢測(cè),與軟件漏洞有關(guān)的項(xiàng)目?jī)?nèi)容也應(yīng)該進(jìn)行全面檢測(cè),才能滿足軟件開(kāi)發(fā)的現(xiàn)實(shí)要求。數(shù)據(jù)挖掘技術(shù)可以結(jié)合所記錄的內(nèi)容來(lái)分析數(shù)據(jù),針對(duì)分析結(jié)果進(jìn)行改進(jìn),之后再?zèng)Q定選擇哪種測(cè)試模式完成測(cè)試工作,確保測(cè)試模式的選擇更加符合軟件工程的現(xiàn)實(shí)需求。在漏洞數(shù)據(jù)的處理方面,數(shù)據(jù)挖掘技術(shù)需要先清理掉數(shù)據(jù),之后利用相關(guān)的數(shù)據(jù)進(jìn)行分析和提取,清除掉沒(méi)有應(yīng)用價(jià)值的數(shù)據(jù),再對(duì)缺失的部分內(nèi)容進(jìn)行補(bǔ)充,以數(shù)據(jù)的方式呈現(xiàn)出來(lái)。除此之外,數(shù)據(jù)挖掘技術(shù)在軟件漏洞中的運(yùn)用需要選擇合理有效的數(shù)據(jù)模型來(lái)完成分析與驗(yàn)證工作,盡量選擇可行的挖掘模式,使其成為測(cè)試集。具有關(guān)聯(lián)的系統(tǒng)也需要針對(duì)運(yùn)算結(jié)果進(jìn)行類比,選擇最為合理的結(jié)果。在漏洞檢測(cè)中,還要對(duì)軟件漏洞進(jìn)行分類與描述,在數(shù)據(jù)庫(kù)中及時(shí)更新軟件漏洞數(shù)據(jù),如此一來(lái)但凡其他的相關(guān)軟件或系統(tǒng)在遭遇相似問(wèn)題時(shí)便可以及時(shí)從數(shù)據(jù)庫(kù)中調(diào)取數(shù)據(jù),從而進(jìn)行快速操作,降低漏洞檢測(cè)所需時(shí)間的同時(shí)也為漏洞的檢測(cè)與解決提供參考依據(jù),因此在漏洞數(shù)據(jù)更新方面也要保證數(shù)據(jù)分類的合理性[2]。
3.3 開(kāi)源軟件的數(shù)據(jù)挖掘