阮弘毅
隨著時(shí)代的發(fā)展與社會(huì)的變遷,科技已經(jīng)不斷的走進(jìn)我們身邊。計(jì)算機(jī)行業(yè)的不斷發(fā)展促進(jìn)了我國(guó)經(jīng)濟(jì)社會(huì)的繁榮建設(shè),同時(shí)軟件工程作為計(jì)算機(jī)時(shí)代的一個(gè)標(biāo)志也在不斷的應(yīng)用到各行各業(yè)當(dāng)中。但是在軟件開(kāi)發(fā)的過(guò)程中對(duì)于一些數(shù)據(jù)與信息的需求量正在不斷增加,如何更好地在眾多信息中快速找出有用信息成為困擾軟件開(kāi)發(fā)過(guò)程中的一個(gè)重大問(wèn)題,因此,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到軟件工程中便具有了重要的意義。
現(xiàn)階段隨著科技社會(huì)的不斷發(fā)展,計(jì)算機(jī)已經(jīng)逐漸普及到各個(gè)領(lǐng)域當(dāng)中,并且在各個(gè)領(lǐng)域中都作出了杰出的貢獻(xiàn)。在過(guò)去的一段時(shí)間當(dāng)中,尤其是60年代以來(lái),計(jì)算機(jī)普及的趨勢(shì)已經(jīng)越來(lái)越明顯。隨著計(jì)算機(jī)技術(shù)的不斷普及,一些與其對(duì)應(yīng)的問(wèn)題以及矛盾便逐漸體現(xiàn)出來(lái)。同時(shí)也導(dǎo)致我們傳統(tǒng)產(chǎn)業(yè)中的軟件開(kāi)發(fā)面臨著嚴(yán)峻的挑戰(zhàn),傳統(tǒng)的軟件開(kāi)發(fā)主要是依靠技術(shù)人員自身的開(kāi)發(fā)技術(shù)與技能,并且對(duì)于數(shù)據(jù)篩選的能力也相對(duì)較弱,通過(guò)這種軟件開(kāi)發(fā)技術(shù)使得在軟件應(yīng)用后所出現(xiàn)的一些問(wèn)題很難被挖掘出來(lái)。因此數(shù)據(jù)挖掘技術(shù)便起到了至關(guān)重要的作用,數(shù)據(jù)挖掘技術(shù)的挖掘過(guò)程主要分以下四步,首先是對(duì)軟件庫(kù)里的數(shù)據(jù)進(jìn)行篩選、其次對(duì)于所選擇的數(shù)據(jù)進(jìn)行處理,形成相應(yīng)的格式化數(shù)據(jù)、挖掘格式化數(shù)據(jù)中的信息、最終吸收其中有用的知識(shí)。同時(shí)在軟件工程中數(shù)據(jù)挖掘工作一般可分為交互式可視數(shù)據(jù)探查、自動(dòng)模式提取以及建構(gòu)模型等三個(gè)方面,同時(shí)這三個(gè)方面也是相互關(guān)聯(lián)、相互作用的。其中可視數(shù)據(jù)探查為提取模式及模型的建構(gòu)提供基礎(chǔ),同時(shí)模型的建構(gòu)又為可視數(shù)據(jù)探查和模式提取提供了指導(dǎo)。軟件工程中常用的數(shù)據(jù)挖掘技術(shù)主要是通過(guò)分析、統(tǒng)計(jì)與預(yù)測(cè)等多種技術(shù)在眾多數(shù)據(jù)資源中找到人們所需要的信息,并且反饋給軟件系統(tǒng),進(jìn)而不斷為人們提供幫助。
隨著科技社會(huì)的不斷發(fā)展與進(jìn)步,我國(guó)在軟件工程領(lǐng)域已經(jīng)取得了一定程度上的進(jìn)展,同時(shí),數(shù)據(jù)挖掘技術(shù)已經(jīng)在軟件工程中應(yīng)用了20多年,并且也越來(lái)越廣泛。在促進(jìn)了各行各業(yè)發(fā)展的同時(shí),也為人們提供了便利。數(shù)據(jù)挖掘技術(shù)在軟件工程中的具體應(yīng)用主要表現(xiàn)為幾個(gè)方面,首先是開(kāi)源軟件開(kāi)發(fā)中的數(shù)據(jù)挖掘,所謂開(kāi)源軟件主要是指源代碼較為開(kāi)放的軟件,這種軟件面向全體大眾,并且不會(huì)收取相應(yīng)的費(fèi)用,因此這種軟件在控制與管理方面就相對(duì)來(lái)說(shuō)比較困難,因此引進(jìn)數(shù)據(jù)挖掘技術(shù)便具有了至關(guān)重要的作用,可以有效的提高開(kāi)源軟件的質(zhì)量以及使用率。
數(shù)據(jù)挖掘技術(shù)在軟件工程中的另一處應(yīng)用便是在軟件項(xiàng)目管理中,同時(shí)軟件項(xiàng)目管理中的數(shù)據(jù)挖掘主要表現(xiàn)為兩個(gè)方面,其中首先便是對(duì)組織關(guān)系的挖掘,其次是對(duì)版本控制信息的挖掘,這兩者都在軟件項(xiàng)目管理的信息挖掘中起到了決定性的作用。其中,軟件項(xiàng)目的管理是一個(gè)相對(duì)來(lái)說(shuō)比較復(fù)雜的工程,對(duì)于人員的分配與調(diào)度便是其中較為重要的一項(xiàng),因此對(duì)于人員組織關(guān)系的挖掘也就變得尤為重要。例如,一個(gè)軟件工程項(xiàng)目的參與人數(shù)相對(duì)較多,有的甚至達(dá)到了上千人,因此在參與過(guò)程中往往會(huì)出現(xiàn)人員之間的電子郵件、文檔交互的現(xiàn)象,同時(shí)交互中的秩序也極易混亂,因此將數(shù)據(jù)挖掘技術(shù)應(yīng)用其中可以更好的劃分工作人員的組織關(guān)系,合理的調(diào)度相應(yīng)的工作人員,進(jìn)而確保項(xiàng)目管理的順利進(jìn)行。
數(shù)據(jù)挖掘技術(shù)在軟件故障檢測(cè)中的應(yīng)用也較為廣泛,傳統(tǒng)的軟件故障檢大多數(shù)是采取程序切片的技術(shù),但是由于這種技術(shù)相對(duì)來(lái)說(shuō)較為復(fù)雜,進(jìn)而導(dǎo)致軟件故障的定位不夠準(zhǔn)確。但是現(xiàn)階段隨著數(shù)據(jù)挖掘技術(shù)的不斷應(yīng)用,傳統(tǒng)的故障檢測(cè)定位也正在不斷改進(jìn),目前較為成功的是通過(guò)程序譜抽象進(jìn)而將程序的執(zhí)行軌跡更好的表現(xiàn)出來(lái),并將故障與成功運(yùn)行進(jìn)行比較,通過(guò)比較其中的差異進(jìn)而對(duì)故障進(jìn)行準(zhǔn)確的定位,進(jìn)而確定故障來(lái)源。
綜上所述,數(shù)據(jù)挖掘技術(shù)在開(kāi)源軟件開(kāi)發(fā)、軟件項(xiàng)目管理以及軟件故障檢測(cè)等方面都有著廣泛的應(yīng)用,只有將數(shù)據(jù)挖掘技術(shù)更好的應(yīng)用到軟件工程當(dāng)中,才能更好的促進(jìn)軟件的開(kāi)發(fā)和管理。
[1]李楨.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].通訊世界,2017(12):47-48.
[2]皮煒杰.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].電子技術(shù)與軟件工程,2017(02):160.
[3]孫曉迎.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2016(10):72.
[4]姚文濤.試論軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].河南科技,2015(23):67.