• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術在軟件工程中的應用

      2020-11-26 06:06:44楊品軍
      電子技術與軟件工程 2020年1期
      關鍵詞:數(shù)據(jù)挖掘軟件檢測

      文/楊品軍

      (云南師范大學實驗中學 云南省昆明市 650031)

      當今社會已經進入了信息化時代,互聯(lián)網與計算機技術的持續(xù)發(fā)展,帶動了數(shù)據(jù)挖掘技術的全面提升,尤其是軟件工程中此項技術已經得到了廣泛應用。在如今數(shù)據(jù)挖掘技術中,有關部門正致力于智能化、自動化技術的研發(fā)和應用領域中,以便使相關技術潛力被挖掘出來,有效處理龐大的信息系統(tǒng)。

      1 軟件工程中數(shù)據(jù)挖掘概述

      1.1 數(shù)據(jù)挖掘定義

      所謂數(shù)據(jù)挖掘,即從相應大數(shù)據(jù)庫當中將可以為人理解、具備很大可利用性、正確性以及新穎性模式的一類高等處理流程,其屬于發(fā)現(xiàn)知識的新形式,重點依靠計算機來檢索數(shù)據(jù),進而發(fā)現(xiàn)新趨勢以及新模式。在此過程中,應當多次提取相關知識,隨后把有關數(shù)據(jù)全面篩選出來,以最科學的方式加以處理,使學習效率得到全面提升。而挖掘數(shù)據(jù)的主要任務便是獲得更加實用、優(yōu)秀的邏輯思維,并且有效拓展、驗證現(xiàn)有知識。

      1.2 軟件工程中數(shù)據(jù)挖掘定義

      在大規(guī)模數(shù)據(jù)當中將所需數(shù)據(jù)信息充分挖掘出來,即傳統(tǒng)數(shù)據(jù)挖掘。而在當前的軟件工程當中,借助自動搜尋功能取得想要得到的信息數(shù)據(jù),也就是軟件工程中的數(shù)據(jù)挖掘。

      1.3 軟件工程中數(shù)據(jù)挖掘特征

      與傳統(tǒng)數(shù)據(jù)挖掘相比,軟件工程中的數(shù)據(jù)挖掘特色較為明顯。在傳統(tǒng)數(shù)據(jù)挖掘技術當中,主要包括了版本信息以及軟件報告等有關的結構數(shù)據(jù);而在軟件工程中的數(shù)據(jù)挖掘技術對應系統(tǒng)信息數(shù)據(jù)當中,包括了極多注釋、代碼等非結構化的信息數(shù)據(jù),二者算法并不相同,然而卻具備較為緊密的關聯(lián),所以,軟件工程中數(shù)據(jù)挖掘技術最大特征,便是數(shù)據(jù)復雜性。在傳統(tǒng)數(shù)據(jù)挖掘技術應用過程中,其主要功能便是將報表系統(tǒng)處理結果提供給相應用戶;而在軟件工程中數(shù)據(jù)挖掘技術應用過程中,并不需要此類結果,其重點需要的便是將推翻或者符合結果的軟件缺陷、實例等的定位信息。

      2 數(shù)據(jù)挖掘技術常用方式

      2.1 神經網絡方式

      此類方式主要是對人腦神經元加以模擬,并且將Hebb 的學習規(guī)則以及MP 模型當作重要基礎,同時以神經網絡的連接權值對知識加以表示,有關學習主要體現(xiàn)在逐步計算相應權值的過程中。在此方式中,最常用到的模型包含了自組織網絡、前饋式網絡以及反饋式網絡,而各類模型又會分別被用在聚類、預測以及聯(lián)想記憶等。

      2.2 遺傳算法應用

      此類方式主要是以生物自然的篩選以及遺傳激勵隨機搜索的算法為基礎,屬于數(shù)據(jù)挖掘技術當中最常見的操作模式之一。在遺傳算法的應用過程中,其最大的優(yōu)勢便在于能夠促使許多表面聯(lián)系不大的各類事物,可以在各個模型之間構建有關聯(lián)系,確保各事物得以協(xié)同、全面發(fā)展。與此同時,由于生物界對遺傳基因越發(fā)重視,也使得此方法得以被更有效的應用。

      2.3 可視化技術應用

      此項技術主要是借助某些圖表來表現(xiàn)出相應數(shù)據(jù),例如,借助簡單的圖形將數(shù)據(jù)庫各項數(shù)據(jù)展示出來,能夠很直觀地呈現(xiàn)給研究人員,形象化單調數(shù)據(jù),使得研究人員可以更加容易地對相關數(shù)據(jù)信息加以全面掌握。

      2.4 統(tǒng)計分析法運用

      在此方法的應用過程中,技術人員通常會借助主成分分析以及回歸分析等方式來對大數(shù)據(jù)庫各個字段間關系加以全面分析,其中的關系主要涵蓋了多重關系,可函數(shù)關系屬于極為重要的一種關系,各類函數(shù)關系往往能夠以公式的方式加以表示,但是相關的關系卻難以借助某些特定公式進行表示,而應用統(tǒng)計分析法便可以合理利用此類關系。

      2.5 決策樹技術應用

      此項技術通常會被應用到分類、整合各類信息數(shù)據(jù),特別是在處理大量數(shù)據(jù)信息時,不僅可以幫助研究人員在較短時間中將關鍵信息找出來,更能夠簡單化、快速化信息分類,同時確保信息分類更加精準。然而此項技術也有一些缺陷,主要體現(xiàn)在其抗噪性能相對較差,且無法全方位對更復雜理念加以表述。

      3 數(shù)據(jù)挖掘技術在軟件工程中的應用途徑

      3.1 信息數(shù)據(jù)軟件的建立

      3.1.1 大數(shù)據(jù)庫系統(tǒng)

      所謂大數(shù)據(jù)倉庫,主要是面向穩(wěn)定的、主體的以及集成的一類數(shù)據(jù)信息集合,經由構建倉庫的方式來對經營管理制定決策的過程予以全力支持。從本質上來看,此過程重點包含了以下階段:

      (1)源數(shù)據(jù)階段:在此階段當中,重點需要收集綜合數(shù)據(jù)、歷史數(shù)據(jù)以及當前數(shù)據(jù)。

      (2)預處理源數(shù)據(jù)階段:此階段主要包含了軟件數(shù)據(jù)文檔以及關系數(shù)據(jù)庫等。

      (3)倉庫管理階段:重點包含了數(shù)據(jù)信息倉庫管理的工具、數(shù)據(jù)建模工具、抽取、元數(shù)據(jù)庫、裝載以及轉換等。

      (4)知識DM 分析工具,主要包含了序列分析工具、分類分析工具、關聯(lián)分析工具以及聚類分析工具等。

      (5)可視化軟件領域專業(yè)知識,將能夠對軟件質量產生影響的關鍵因素揭示出來。

      以上五點便全面組成了整體大數(shù)據(jù)倉庫的管理體系。

      3.1.2 大數(shù)據(jù)庫建模

      此項工作的主要任務便是把現(xiàn)有數(shù)據(jù)信息全面歸納到一起,從而構建出科學的大數(shù)據(jù)資源信息庫。信息庫當中重點包含的信息有可行性研究報告、客戶需求信息、軟件系統(tǒng)信息以及客戶評估信息等:

      (1)可行性研究報告:研究技術應用是否具備運行可行性,以及法律、經濟、使用與技術等能否達到預期效果。

      (2)客戶需求信息:技術人員應當把客戶需求信息及時進行整理、歸納,以便確定系統(tǒng)數(shù)據(jù)、功能以及界面等。

      (3)軟件系統(tǒng)信息:此類信息屬于應用軟件的重要基礎,重點包含了系統(tǒng)總體需求、支撐環(huán)境、規(guī)模和范圍等。

      (4)客戶評估信息:此類信息重點會被應用到軟件測試工作中,這些測試包括了形式化測試、動態(tài)測試以及靜態(tài)測試等,從而收獲對應信息,進而把客戶需求信息和客戶評估信息全面匯總,以便在應用軟件的質量加以合理權衡,將各種存在錯誤及時發(fā)現(xiàn)出來,并且進行合理修改。

      3.2 應用于開發(fā)開源軟件

      此類軟件主要屬于開放源代碼的一類應用軟件。當前此類軟件對于廣大用戶而言都屬于免費應用的,因此導致軟件的管控工作很難順利進行下去。但是在軟件工程當中應用數(shù)據(jù)挖掘技術,能夠使開源軟件整體質量得到有效提升。比如在某大學所設計的信息數(shù)據(jù)挖掘平臺當中,便可以確保跟蹤管理平臺的使用者以及開發(fā)者,這能夠在很大程度上使開源軟件整體質量得到全面提升,進而使相應損失率被降低。

      3.3 應用于對程序代碼與結構的挖掘

      在對程序結構、代碼等進行挖掘的過程中,克隆代碼檢測法屬于一類較為常用的數(shù)據(jù)挖掘技術,其又會被細分成以下四種方法,即標識符對比、度量、程序結構以及文本對比。上述方法各自具備不同特征,在實際應用過程中,一般都需要對現(xiàn)實狀況加以確定,從而篩選出最合理挖掘技術。在克隆代碼的檢測過程中,往往會對某個主要代碼進行復制和粘貼,而在特殊需求之下,會按照實際需求對一部分代碼進行改正,對這部分代碼進行檢測,重點是避免出現(xiàn)大面積的故障,以便對系統(tǒng)安全進行有效維護,將可靠環(huán)境提供給軟件的日常工作。

      除此之外,Aspect 技術也屬于當今世界上較為常見挖掘技術之一,此項技術屬于日常研究過程中提到的“橫切關注點”挖掘技術。在軟件工程當中,對于改造面向軟件的工作,重點便是將Aspect挖掘技術相關問題解決好。在解決過程中,技術人員雖然擁有許多解決方式,然而度量分析法才是最核心的解決方式。

      3.4 應用到軟件項目管理

      在實際工作過程中,對軟件項目的日常管理工作,一般擁有系統(tǒng)化、復雜化的特征。因此,在軟件項目管理工作當中應用數(shù)據(jù)挖掘技術,主要的任務包括了:

      (1)挖掘組織關系:例如某公司在舉辦年會活動的過程中,一旦沒有妥善處理好人員分配問題,便極易引發(fā)諸多混亂局面。所以,為了科學配置公司的人力資源,一般都會借助數(shù)據(jù)挖掘技術對全體職員職責進行科學區(qū)分,以便使項目實現(xiàn)有序化的管理,進而使其辦事效率得到全面提升。

      (2)對版本的控制信息進行有效挖掘:在系統(tǒng)面對外部系統(tǒng)侵入的時候,數(shù)據(jù)挖掘技術會提出相應的警告;與此同時,此項技術還能夠對系統(tǒng)修復狀況進行全面檢測。而版本控制信息最重要的作用,便是使民眾能夠更加順利地查看軟件的版本信息,將數(shù)據(jù)挖掘技術應用其中,便能夠有效確保系統(tǒng)得以安全工作,最終提升軟件項目管理整體水準。

      3.5 記錄傳輸信息的路徑

      數(shù)據(jù)挖掘技術對于傳輸信息的路徑而言,可以對其進行更有效的記錄,并且以之為基礎,保證信息與軟件間得以良好互動,從而防止時間被浪費,也更加便于實際操作。在尋找數(shù)據(jù)信息的過程中,重點是借助分析程序執(zhí)行途徑來完成的,隨后將探尋到的信息傳輸途徑當作重要基礎,從而展開持續(xù)跟蹤,有效整合信息數(shù)據(jù),建立健全信息數(shù)據(jù)系統(tǒng),促使信息數(shù)據(jù)得以被高效傳輸?shù)墓δ茉趯到y(tǒng)內部被充分實現(xiàn)。

      3.6 應用于對版本信息的檢測

      對于軟件運行信息數(shù)據(jù)來說,每代軟件都各有區(qū)別,一旦新版本問世,老一代版本內部便會存在難以兼容的狀況。雖然從整體上來看,軟件版本的迭代更新往往會使軟件的使用功能趨于完善,然而也會常常出現(xiàn)丟失用戶個人數(shù)據(jù)信息的問題。截止到目前,能夠對上述狀況有效規(guī)避的關鍵方式,便是應用數(shù)據(jù)挖掘技術,此技術除了可以在第一時間檢測到軟件版本的更新信息,還可以及時對用戶個人數(shù)據(jù)信息進行備份,同時把采集到的有效數(shù)據(jù)信息備份到云端,也不會加大軟件負荷,進而確保數(shù)據(jù)信息保持完整性以及精準性。

      3.7 運用到檢測漏洞

      在日常開發(fā)軟件的過程中,時常會出現(xiàn)各種各樣的漏洞,此現(xiàn)象十分常見。在通常狀況中,以傳統(tǒng)檢測技術展開漏洞檢測工作,雖然能夠在檢測時發(fā)現(xiàn)大多數(shù)的系統(tǒng)漏洞,然而依然很難檢測出那些小漏洞,從而致使檢測并不徹底、全面,最終對整體系統(tǒng)產生不良影響。在實踐過程中得知,數(shù)據(jù)挖掘技術在應用于對上述系統(tǒng)漏洞進行檢測的時候,能夠使檢測更加有效、精準,這主要是由于,數(shù)據(jù)挖掘技術在系統(tǒng)全面管控系統(tǒng)數(shù)據(jù)信息時,可以充分掌握運輸數(shù)據(jù)信息的主要路徑。一旦數(shù)據(jù)異常,此項技術便可以在第一時間有所察覺,走動記錄發(fā)現(xiàn)的異常數(shù)據(jù)信息,并且檢測數(shù)據(jù)信息自身問題,對多余信息數(shù)據(jù)以及缺少的信息數(shù)據(jù)加以及時處理,隨后重新排列被整理之后的信息數(shù)據(jù),并且將數(shù)據(jù)位置記下來。在此條件之下,軟件系統(tǒng)便不會再存在系統(tǒng)漏洞。

      4 數(shù)據(jù)挖掘技術在軟件工程中的未來應用趨勢

      在研究部門詳細劃分數(shù)據(jù)挖掘技術的各個方向之后,相應的研發(fā)工作進展較為順利,研究人員的熱情處于高漲狀態(tài),而各領域研發(fā)成果也比較大,這些成果會極大影響到軟件工程開發(fā)的整體質量以及效率。當前部分軟件工程所應用的數(shù)據(jù)挖掘技術較為陳舊,亟需技術人員及時轉變傳統(tǒng)發(fā)展觀念,學習掌握更新穎、更先進以及更合理的計算方法(如主動學習以及流行學習)。除此之外,相應檢索方式改變也很大,在過去,檢索往往需要輸入精準關鍵詞,得到的反饋也多為簡單語句,而在應用數(shù)據(jù)挖掘技術之后,可幫人們使用自然語言展開檢索操作,最終獲得完整文檔。

      5 結論

      總體而言,在軟件工程當中應用數(shù)據(jù)挖掘技術,其應用價值很大。因此,對數(shù)據(jù)挖掘技術強化研究,對于軟件工程的全面發(fā)展意義深遠。所以,有關部門需要全面擴大研究范圍,加大研究深度,確保數(shù)據(jù)挖掘技術可以更可靠、成熟地被應用到軟件工程當中,促使其應用效果得到全面強化。

      猜你喜歡
      數(shù)據(jù)挖掘軟件檢測
      禪宗軟件
      英語文摘(2021年10期)2021-11-22 08:02:26
      “不等式”檢測題
      “一元一次不等式”檢測題
      “一元一次不等式組”檢測題
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      軟件對對碰
      基于并行計算的大數(shù)據(jù)挖掘在電網中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      小波變換在PCB缺陷檢測中的應用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      談軟件的破解與保護
      精品(2015年9期)2015-01-23 01:36:01
      屯昌县| 新野县| 且末县| 呈贡县| 邮箱| 论坛| 隆昌县| 苗栗市| 武川县| 将乐县| 平邑县| 开阳县| 岳池县| 吉木乃县| 广水市| 西吉县| 兴安盟| 资中县| 任丘市| 吉安县| 华安县| 四平市| 思茅市| 隆回县| 乌拉特前旗| 广东省| 石楼县| 青浦区| 建平县| 福建省| 内丘县| 石棉县| 闸北区| 涟源市| 闽侯县| 襄汾县| 延庆县| 田阳县| 阜新市| 图木舒克市| 木兰县|