摘 要:在弱關聯(lián)冗余環(huán)境下,開展的挖掘算法應用需要考慮關聯(lián)屬性,本文主要從模糊神經(jīng)元網(wǎng)絡學習算法與弱關聯(lián)規(guī)則模型,建立兩方面內容展開探討,整理出算法應用所產生的數(shù)據(jù)信息,對大數(shù)據(jù)環(huán)境挖掘算法進行深入研究,為網(wǎng)絡環(huán)境性信息處理任務的高效開展,建立一個穩(wěn)定基礎環(huán)境。
關鍵詞:弱關聯(lián);冗余環(huán)境;挖掘算法
中圖分類號: TP3-0 文獻標識碼:A
Abstract:In the week correlation redundant environment,the correlation attributes need to be taken into consideration in the application of mining algorithm.On the basis of the fuzzy neural network learning algorithm and the weak correlation rule model,the paper discusses the two aspects,sorts out the data generated through the algorithm,further studies the mining algorithm of big data environmental information,and establishes a stable fundamental environment in order to efficient process the network environment information.
Keywords:weak correlation;redundant environment;mining algorithm
1 引言(Introduction)
本文主要從模糊神經(jīng)元網(wǎng)絡學習算法與弱關聯(lián)規(guī)則模型建立兩方面內容展開探討,整理出算法應用所產生的數(shù)據(jù)信息,對大數(shù)據(jù)環(huán)境挖掘算法進行深入研究,為網(wǎng)絡環(huán)境性信息處理任務高效開展建立一個穩(wěn)定基礎環(huán)境。本文提出了一種基于弱聚類算法的云計算環(huán)境下海量數(shù)據(jù)中弱關聯(lián)挖掘方法,針對弱關聯(lián)冗余環(huán)境進行,通過數(shù)據(jù)的描述特征對數(shù)據(jù)特征進行分解,依據(jù)數(shù)據(jù)特征,對全部數(shù)據(jù)進行融合?;陉P聯(lián)決策概率將云計算環(huán)境下海量數(shù)據(jù)進行有效劃分,完成所有數(shù)據(jù)特征關聯(lián)概率的計算,通過弱聚類方法對屬性元素進行分類,將數(shù)量型元素轉換成類別型,通過弱化關聯(lián)規(guī)則方法,對經(jīng)聚類處理后的數(shù)據(jù)進行挖掘。
2 弱關聯(lián)冗余環(huán)境下的挖掘算法綜述(Summarize
on mining algorithm in weak correlation
redundant environment)
2.1 模糊學習算法
模糊神經(jīng)學習算法是當前數(shù)據(jù)挖掘的主流技術,采用弱關聯(lián)思想設計原則中,系統(tǒng)之間關聯(lián)會盡可能減少,模擬學習算法應用后系統(tǒng)運算速度提升有明顯幫助。弱關聯(lián)環(huán)境下對信息數(shù)據(jù)處理使用效率都有極高的要求,如果不能解決所遇到的問題,在建立系統(tǒng)管理控制環(huán)境期間,應用模糊數(shù)據(jù)運算分析學習方法,能夠幫助節(jié)省大量數(shù)據(jù)運算所用時間,并在最終的控制計劃山模糊學習算法中模擬神經(jīng)元原理,能夠根據(jù)弱關聯(lián)環(huán)境下的系統(tǒng)聯(lián)系選擇運輸,基于云計算環(huán)境下不斷學習數(shù)據(jù)更新,達到記憶效果。模糊學習運算能夠實現(xiàn)同步數(shù)據(jù)挖掘,減少數(shù)據(jù)分析中不必要的時間。建立在弱關聯(lián)環(huán)境中的各項學習控制計劃中,通過分析運算控制方法,最終問題解決能力也不會因此受到影響。模糊學習算法是針對系統(tǒng)運行中控制能力提升進行的,弱關聯(lián)冗余系統(tǒng)部分在控制運算中通過學習算法可以將不必要的部分選擇刪除,節(jié)省挖掘算法運行所用時間。模糊學習算法中會涉及隱藏數(shù)據(jù),模擬神經(jīng)元來快速判斷這部分信息[1]。
2.2 挖掘算法中的決策樹算法
應用該種算法,需要選擇屬性用信息增益變化數(shù)據(jù)子集,建立符合運行模式的信息獲取環(huán)境,從而實現(xiàn)對信息傳輸數(shù)據(jù)決策范圍判斷,也就是熵的變化值,而C4.5用的是信息增益率,也就是多了個率嘛。一般來說,率就是用來取平衡用的,就像方差起的作用差不多,比如有兩個跑步的人,一個起點是100m/s的人、其1s后為110m/s;另一個人起速是1m/s、其1s后為11m/s。在這里,其克服了用信息增益選擇屬性時偏向選擇取值多的屬性的不足。在樹構造過程中進行剪枝,我在構造決策樹的時候好討厭那些掛著幾個元素的節(jié)點。對于這種節(jié)點,干脆不考慮最好,不然很容易導致overfitting。對非離散數(shù)據(jù)都能處理,這個其實就是一個個式,看對于連續(xù)型的值在哪里分裂好。也就是把連續(xù)性的數(shù)據(jù)轉化為離散的值進行處理。能夠對不完整數(shù)據(jù)進行處理,這個重要也重要,其實也沒那么重要,缺失數(shù)據(jù)采用一些方法補上去就是了。
2.3 基于模糊神經(jīng)網(wǎng)絡的弱關聯(lián)挖掘方法
(1)數(shù)據(jù)選擇
基于云計算網(wǎng)絡環(huán)境下自主選擇數(shù)據(jù),觀察數(shù)據(jù)信息是否與弱關聯(lián)挖掘算法保持一致。數(shù)據(jù)選擇不僅考慮所處環(huán)境,更要從多個角度展開研究,觀察是否存在可能影響信息結果使用效率的干擾因素。建立在安全環(huán)境下的數(shù)據(jù)選擇與數(shù)據(jù)控制之間存在聯(lián)系體系,明確這一聯(lián)系體系也是開展后續(xù)挖掘任務中所必須要達到的,只有達到這一效果在信息傳輸中才不會受到影響。數(shù)據(jù)運行環(huán)境中所存在的各項控制問題中,數(shù)據(jù)選擇也是一個良好篩選過程,通過建立相互聯(lián)系來促進最終的數(shù)據(jù)結果穩(wěn)定性程度與實際使用需求保持一致。數(shù)據(jù)選擇是接下來運算任務開展的第一個基礎步驟,確保數(shù)據(jù)準確程度進入到下一階段的挖掘計算,數(shù)據(jù)挖掘需要結合計算機控制系統(tǒng)進行,選取不同風險環(huán)境下的典型參數(shù)作為接下來的運算依據(jù),弱關聯(lián)挖掘得到的結果才能準確反映真實情況。
(2)數(shù)據(jù)預處理endprint
將所選擇的數(shù)據(jù)初步處理后建立起數(shù)據(jù)庫,將數(shù)據(jù)庫參與到挖掘算法中,幫助節(jié)省時間,同時促進管理效率不斷提升完善。數(shù)據(jù)處理與使用需求在功能方向上保持一致,功能確定后對信息的處理也能觀察到其中是否存在影響功能進行的因素,風險信息參數(shù)在預處理模式下便得到解決,接下來開展各項控制管理計劃也能得到充分幫助。數(shù)據(jù)挖掘處理要建立在多個控制模式下,發(fā)現(xiàn)影響功能正常進行的因素后,配合控制解決措施開展挖掘。預處理屬于模糊處理,數(shù)據(jù)庫系統(tǒng)中可能還會存在一些多余信息,在接下來的處理中會繼續(xù)篩選,直到信息全部為關聯(lián)部分。預處理中信息干擾要排除,并通過數(shù)據(jù)庫建立來提升系統(tǒng)的使用安全性,降噪、平滑處理后所得到的信息才能繼續(xù)存入到數(shù)據(jù)庫系統(tǒng)中,為信息使用打下安全基礎[2]。
(3)塑造訓練數(shù)據(jù)
訓練數(shù)據(jù)塑造需要結合信息集合進行,將原信息特征與預處理后的信息特征進行比較,具有相同點的部分劃分為特征集合中,用{A1,A2,…,Am}表示。集合塑造完成后對信息進行塑造訓練,用具體的數(shù)值表現(xiàn)出特征屬性值域范圍。對于可能會產生的值域使用安全問題,建立出長期運行控制模塊,用C表示集合,根據(jù)數(shù)據(jù)塑造挖掘算法來進行劃分,共分為C1,C2,…,Cn,將數(shù)據(jù)引入到塑造訓練模塊中,進行綜合性描述分析,從而實現(xiàn)對數(shù)據(jù)運行使用效果的觀察作用,根據(jù)假設的數(shù)據(jù)集合來建立一個m+1元組訓練集合目標,塑造描述為(a1,a2,…,am,Ci),根據(jù)挖掘算法描述公式可以知aj∈val(Aj)(1≤j≤n); Ci∈C(1≤i≤n)。可以將不同需求環(huán)境下的數(shù)據(jù)進行劃分,得出檢測對照組與數(shù)據(jù)訓練組,兩組數(shù)據(jù)之間結合對比,所得到的結果能夠準確反映出數(shù)據(jù)庫運行環(huán)境,并為所開展的各項數(shù)據(jù)體系建立同等穩(wěn)定運行環(huán)境。
3 弱關聯(lián)挖掘算法環(huán)境下冗余數(shù)據(jù)的產生(The
generation of redundant data in the environment
of weak correlation mining algorithm)
基于云計算模擬下,信息獲取渠道變得更加豐富,信息獲取數(shù)量增多后,同時也產生了大量冗余信息,對于這部分信息如果不能合理計算,接下來的控制計劃也會因此受到影響。由此可見,冗余數(shù)據(jù)產生與數(shù)據(jù)挖掘環(huán)境有直接關系,風險評估系統(tǒng)的篩選甄別能力也是造成這一隱患問題的具體原因,在當前模式下,如果不能合理控制隱患因素,云計算技術應用效率會因此受到影響,冗余數(shù)據(jù)還會造成系統(tǒng)錯誤識別,導致弱關聯(lián)挖掘不能正常進行。冗余數(shù)據(jù)產生會對常規(guī)狀態(tài)下的信息傳輸造成不良影響,導致最終的控制能力出現(xiàn)問題,建立一個解決控制方案,對冗余數(shù)據(jù)進行劃分隔離來保障有用信息的正常傳輸,也是解決當前問題有效措施。研究解決控制方案要從多個角度進行,觀察開展期間的影響因素,以及可能造成最終數(shù)據(jù)安全使用的因素,通過這種方法來建立起長期工作環(huán)境,從而達到最佳設計控制目標。目前解決方案研究中,已經(jīng)有技術人員提出在弱關聯(lián)環(huán)境下建立一個弱小集合關聯(lián)系統(tǒng),將數(shù)據(jù)挖掘定位在有效信息中,從而必滿冗余信息計算造成最終運算速度降低,在實現(xiàn)技術層面上仍然需要繼續(xù)深入研究。
4 建立弱聚類算法的弱關聯(lián)規(guī)則挖掘模型(A weak
correlation rule mining model for weak clustering
algorithm is established)
4.1 數(shù)據(jù)關系匹配實現(xiàn)原理
實現(xiàn)數(shù)據(jù)之間的匹配關系,可以從云計算環(huán)境中建立數(shù)據(jù)集合矩陣。數(shù)據(jù)匹配是自動進行的,捕捉表達信息,深入挖掘其中與其他數(shù)據(jù)具有關聯(lián)的部分。通過建立基層數(shù)據(jù)關系來探討最終的數(shù)據(jù)匹配關系,對提升數(shù)據(jù)結果運行穩(wěn)定性也有很大幫助。數(shù)據(jù)關系匹配需要在云計算環(huán)境下找到相同的數(shù)據(jù)參與運算,實現(xiàn)數(shù)據(jù)之間相互聯(lián)系,并在聯(lián)系基礎上篩選出冗余部分參數(shù),根據(jù)產生頻率來計算出具體矩陣,觀察矩陣判斷不同風險隱患發(fā)生概率,并在接下來的各項控制計劃中建立起具有實際意義的工作環(huán)境。本文所研究方法與傳統(tǒng)方法在數(shù)據(jù)挖掘數(shù)量上的比較圖,如圖1所示。
采用弱聚類算法是在信息挖掘數(shù)量上有明顯提升,各個節(jié)點處的信息采集數(shù)量均已經(jīng)超過傳統(tǒng)算法,通過算法之間的相互比較可以發(fā)現(xiàn),不同模式下開展信息分析,是幫助提升控制效果的有效方法,使用過程中所發(fā)現(xiàn)的各類信息比較問題,建立長期穩(wěn)定運行環(huán)境對提升信息挖掘效率也有很大幫助。當前數(shù)據(jù)運算模式下所遇到的問題大部分是由于環(huán)境因素導致,如果不能協(xié)調好環(huán)境問題,數(shù)據(jù)運算模式下開展各類數(shù)據(jù)挖掘算法也會受到阻礙。
4.2 關聯(lián)數(shù)據(jù)弱聚類處理
匹配任務完成后進入到數(shù)據(jù)處理階段,通過建立基層工作聯(lián)系體系來實現(xiàn)系統(tǒng)之間配合運行,對關聯(lián)數(shù)據(jù)進行弱聚類處理同樣基于云計算環(huán)境下開展。根據(jù)匹配所得到的數(shù)據(jù)結果信息來進行,觀察到數(shù)據(jù)中存在問題時及時探討解決方案,對于使用過程中可能會產生的問題,充分探討解決規(guī)劃方案,對提升最終任務完成效率也有很大幫助,關聯(lián)模式下觀察數(shù)據(jù)運行所處環(huán)境,弱聚類方法處理信息對提升關聯(lián)數(shù)據(jù)也有很大的幫助,弱關聯(lián)是針對少量關聯(lián)模式來進行的,當前環(huán)境下所遇到的各類問題均由信息風險因素導致,采用弱聚類處理方法提升了最終結果準確程度,對于提升最終的計算效率也有很大幫助。不同類型弱聚類環(huán)境中,數(shù)據(jù)庫運行所面對的風險因素有很大差異性[3]。模擬信息處理模式需要對使用情況做出模擬,嘗試在不同運行環(huán)境中所遇到的風險隱患問題,確保所提取的信息結果與實際情況之間不存在出入,弱關聯(lián)環(huán)境中數(shù)據(jù)之間聯(lián)系本身較少,冗余信息環(huán)境帶來的阻礙影響更嚴重,只有解決這部分問題,接下來進行的信息對接檢測才更加高效。
4.3 小區(qū)域關聯(lián)劃分
劃分小區(qū)域關聯(lián)是實現(xiàn)接下來挖掘算法的基礎部分,劃分要從多個角度進行,首先建立一個整體性的挖掘體系,觀察是否具有可行性,掌握故障隱患因素后從數(shù)據(jù)關聯(lián)劃分角度建立一個矩陣研究體系,并觀察數(shù)據(jù)運行是否處于合理的狀態(tài)范圍內。小區(qū)域關聯(lián)信息劃分完成后進入到整合階段,按照這一劃分結果對比其他方向數(shù)據(jù)庫,建立起長期工作環(huán)境。大數(shù)據(jù)處理是由中多個小環(huán)境組成,因此數(shù)據(jù)劃分與挖掘任務也是從各個小范圍開展,冗余環(huán)境中信息有效篩選才能進入到更深層次的信息觀察處理中,實現(xiàn)弱關聯(lián)項目更深層次研究。云計算環(huán)境下信息處理速度雖然有明顯提升,但在處理能力上卻因此受到影響,建立這一聯(lián)系體系是解決現(xiàn)存問題的有效方法。各個控制計劃之間聯(lián)系體系也需要通過方案完善不斷提升運行使用效率。endprint
4.4 弱關聯(lián)環(huán)境下的挖掘過程
數(shù)據(jù)弱關聯(lián)環(huán)境下,信息獲取會建立獨立的信道,在信道控制作用下進行其他層面數(shù)據(jù)傳輸,實現(xiàn)云計算環(huán)境下信息最穩(wěn)定的獲取形式。數(shù)據(jù)庫中全部信息數(shù)量統(tǒng)計需要浪費大量時間,可以對其進行假象擬定,例如將其假設為1000,這樣在運算分析中也能避免信息獲取數(shù)量與實際需求不符合。信息挖掘獲取需要在同步運算環(huán)境下開展,通過這種方法來幫助提升最終結果穩(wěn)定程度。挖掘過程嚴重要首先從信息獲取層面開展,統(tǒng)計信息數(shù)量與傳輸方法,挖掘過程中觀察數(shù)據(jù)信息之間的關聯(lián)情況,建立起具有長期控制能力的風險評估體系。信息數(shù)據(jù)傳輸中彼此之間具有關聯(lián)性,關聯(lián)性情況了解后,進入到更深層次的數(shù)據(jù)保護階段,采用數(shù)據(jù)挖掘試探方法檢驗數(shù)據(jù)庫使用穩(wěn)定性情況,能夠幫助建立起長期工作體系,并觀察在系統(tǒng)中是否存在需要更新完善的部分。弱關聯(lián)環(huán)境下數(shù)據(jù)信息之間的聯(lián)系線索非常少,要確保捕捉的精準程度,信息有效利用后進入到控制層面,協(xié)調好數(shù)據(jù)之間的交流模式并建立具有保護意義的數(shù)據(jù)檢索環(huán)境,結束數(shù)據(jù)挖掘檢索后可以進入到更深層次的控制內容中。
5 弱關聯(lián)冗余環(huán)境下的挖掘算法仿真實驗(Simulation
experiment of mining algorithm in weak
correlation redundant environment)
確定挖掘算法開展模式后進入到仿真實驗解讀,檢驗挖掘算法是否具有可行性,建立長期工作體系來促進最終工作穩(wěn)定性提升,也是解決當前矛盾沖突問題的主要原因。實驗進行是對算法有效性的一次檢驗,觀察在系統(tǒng)結構中是否存在可能會造成風險隱患因素的問題,將風險隔離排除。仿真實驗檢測弱關聯(lián)冗余環(huán)境下的挖掘計算時,首先針對數(shù)據(jù)庫部分的控制能力進行檢驗,雖然弱關聯(lián)環(huán)境下數(shù)據(jù)之間聯(lián)系較小,但通過這種控制挖掘方法也能幫助捕捉數(shù)據(jù)信息傳輸動向,確定信息之間的聯(lián)系關系,從而實現(xiàn)對數(shù)據(jù)庫運行情況的模擬檢驗。該種方法在數(shù)據(jù)穩(wěn)定性控制能力上較強,通過分析現(xiàn)場工作模式來建立一個長期工作環(huán)境,能夠達到最佳控制效果。弱關聯(lián)冗余環(huán)境是在云計算模式下展開數(shù)據(jù)挖掘的,需要在短時間內建立長期工作模式,云計算模式數(shù)據(jù)信息的數(shù)量龐大,文章方法能夠幫助快速明確工作開展方法,掌握數(shù)據(jù)信息彼此之間的聯(lián)系性,節(jié)省數(shù)據(jù)分類使用時間。仿真實驗開展在大數(shù)據(jù)云計算環(huán)境下,實驗結果顯示通過建立弱關聯(lián)環(huán)境中的弱聚類挖掘算法應用后效果明顯,弱關聯(lián)問題得到解決,并且在這一環(huán)境下所開展的各項數(shù)據(jù)運算計劃也逐漸開展完善,最終進入到理想的控制環(huán)境。仿真實驗分別模擬不同環(huán)境下系統(tǒng)運行所能遇到的問題。實驗所針對的數(shù)據(jù)內容具有代表性,但并不完全表示真實運行過程,對運行情況進行分析時還需要綜合考慮問題,應用該種挖掘算法開展控制效果明顯,能夠幫助有效提升大數(shù)據(jù)環(huán)境中的分析速度。
6 結論(Conclusion)
對于弱關聯(lián)冗余環(huán)境下的挖掘算法研究,當前技術方法已經(jīng)十分先進,未來發(fā)展中還要達到綜合控制效果,云計算環(huán)境下提升數(shù)據(jù)處理運行效率,對最終數(shù)據(jù)處理效果提升也有很大幫助。本文提出了一種基于弱聚類算法的云計算環(huán)境下海量數(shù)據(jù)中弱關聯(lián)挖掘方法,針對弱關聯(lián)冗余環(huán)境進行,通過數(shù)據(jù)的描述特征對數(shù)據(jù)特征進行分解,依據(jù)數(shù)據(jù)特征,對全部數(shù)據(jù)進行融合?;陉P聯(lián)決策概率將云計算環(huán)境下海量數(shù)據(jù)進行有效劃分,完成所有數(shù)據(jù)特征關聯(lián)概率的計算,通過弱聚類方法對屬性元素進行分類,將數(shù)量型元素轉換成類別型,通過弱化關聯(lián)規(guī)則方法,對經(jīng)聚類處理后的數(shù)據(jù)進行挖掘。實驗結果表明,所提方法具有很高的高效性及有效性。
參考文獻(References)
[1] 黃潮.云計算環(huán)境下的海量光纖通信故障數(shù)據(jù)挖掘算法研究[J].激光雜志,2017(1):96-100.
[2] 張忠林,田苗鳳,劉宗成.大數(shù)據(jù)環(huán)境下關聯(lián)規(guī)則并行分層挖掘算法研究[J].計算機科學,2016,43(1):286-289.
[3] 童釗,等.分布式系統(tǒng)中多用戶網(wǎng)絡應用的概率型調度算法研究[J].電子學報,2016,44(7):1679-1688.
作者簡介:
蔡柳萍(1981-),女,碩士,講師.研究領域:大數(shù)據(jù),數(shù)據(jù)挖掘.endprint