孫前進
摘 要:由于進行電子信息資源整合的過程中,沒有進行資源轉換降維處理,導致資源整合效率低,為此提出基于模糊聚類的電子信息資源整合方法。通過模糊ORM技術抽取電子信息資源,采用等效轉換降維的方法對抽取的電子信息資源進行轉換降維處理,根據(jù)處理結果,結合模糊聚類分析,構建EAD電子信息資源整合模型,采用模糊聚類分析的方式,將所屬的信息資源依據(jù)特征或者屬性劃分為不同額定整合區(qū)域,計算整合隸屬度,布設信息資源的整合層級。最終的測試結果表明:與傳統(tǒng)的LAM信息資源整合測試組及傳統(tǒng)改進ORM信息資源整合測試組相對比,所設計的模糊聚類信息資源整合測試組最終得出的響應時間相對較短,電子信息資源整合效率較高,所提方法具有實際的應用價值。
關鍵詞:模糊聚類;電子信息;信息匯總;資源整合;數(shù)據(jù)控制;
電子信息資源是以數(shù)字化形式( 即二進制代碼0,1)把文字、圖象、聲音、動畫等多種形式的信息存儲在光、磁等非印刷型介質上,并以光信號、電信號的形式傳輸,通過響應的計算機和其他外部設備再現(xiàn)出來的信息資源。電子信息資源整合主要是針對于龐大的數(shù)據(jù)信息群,構建的一種特殊的數(shù)據(jù)匯總方法[1]。近年來,隨著計算機以及網(wǎng)絡技術的成熟普及,數(shù)據(jù)資源急劇增長,逐漸成為資源處理的主流。通常情況下,數(shù)字資源自身具有復雜性、異構性、海量性以及多元性等特征,這在一定程度上也增加了信息資源整合的速度以及效率,增加元數(shù)據(jù)的可靠性,給未來信息發(fā)展奠定更為堅實的基礎[2]。
模糊聚類,實際上指的是一種按模糊界限以及基本要求對事物進行分類的數(shù)學方法[3]。本質上是客觀的劃分,并采用數(shù)理統(tǒng)計的方式,獲取最終處理結果。模糊聚類為信息整合處理提供了極大的便利條件,進一步確保數(shù)據(jù)計算的精準度,同時,關聯(lián)系統(tǒng)聚類法和逐步聚類法等方法,形成一個可無限延伸與擴展的資源整合體系,優(yōu)化需要整合的信息資源,避免出現(xiàn)信息孤島這一類問題,推動信息整合相關企業(yè)邁入一個新的發(fā)展階段。
因此,本文提出一種基于模糊聚類的電子信息資源整合方法??紤]到最終測試結果的精準性與可靠性,本文會在較為真實的背景下進行實驗測試,并驗證本文方法能夠安全、高效的進行信息資源整合。
1 模糊聚類下電子信息資源整合方法
1.1 基于模糊ORM技術的電子信息資源抽取
在對模糊聚類下電子信息資源整合方法設計之前,需要先采用模糊ORM 技術對電子信息資源抽取。通常情況下,針對于不同的整合范圍,所導出的資源以及定向整合目標也是不同的,這也使得內部執(zhí)行程序存在差異[4-6]??梢圆捎秒p向處理模式,在平臺中構建多層級的模糊ORM 資源整合程序,與數(shù)據(jù)庫相關聯(lián)的同時,獲取數(shù)據(jù)集,在聚類中心,對信息劃歸分類,計算出聚類質心數(shù),具體如式(1)所示。
1.2 電子信息資源轉換降維處理
在通過模糊ORM 技術對信息資源進行抽取后,對電子信息資源進行轉換降維處理。所謂轉換降維處理,主要指的是在對信息資源抽取的過程中,信息資源通常處于集合的狀態(tài),資源維數(shù)也存在較大的差異,而維數(shù)的存在并不利于數(shù)據(jù)的整合、匯總,嚴重的甚至會造成數(shù)據(jù)誤差等,因此,需將高維信息資源轉換為低維信息資源??梢圆捎玫刃мD換降維的方法,按照統(tǒng)一的元數(shù)據(jù)標準或者降維格式進行周期性轉換,計算出轉換降維比率,具體如式(3)所示。
式(4)中: U 表示信息資源處理單元速度; x 表示縱向整合距離; q 表示傳輸路徑; t 表示動態(tài)平均值。通過上述計算,最終可以得出實際的信息資源處理單元速度。在中心元數(shù)據(jù)庫中,依據(jù)降維映射規(guī)則將統(tǒng)一元數(shù)據(jù)標準分化為幾個轉換降維層級。不同降維層級的轉換格式也是不同的,可以根據(jù)所設定的整合目標,作出更改調整,舉例來說:可以賦予定義XML、RDF 等輸出格式,一定程度上擴大整體的信息整合降維范圍,以此來適應用戶的不同需求。
1.3 EAD模糊聚類整合模型構建
在完成電子信息資源轉換降維處理后,構建EAD模糊聚類整合模型。將上述轉換降維處理后的電子信息資源輸入到模型之中,將模型調整為可共享的形式化概念模型,關聯(lián)局域網(wǎng)以及聚類數(shù)據(jù)中心,調整數(shù)據(jù)組織形式為單向。將不同元數(shù)據(jù)指令應用到本體集成框架中,設定具體的集成速度和資源整合映射比,具體如表1 所示。
根據(jù)表1,可以完成對集成速度、資源整合映射比的測定。隨后,遵循標定的整合目標,結合模糊聚類分析,構建EAD 信息資源整合結構,具體如圖1 所示。
根據(jù)圖1,可以完成對EAD 信息資源整合模型結構的建立。此時以本體為中心的,調整定向映射標準,使用多層級的映射描述框架,綜合EAD 模型執(zhí)行基準,完成對EAD 模糊聚類整合模型的構建,細化信息資源的整合效果。
1.4 分布式自適應處理實現(xiàn)信息資源整合
在完成對EAD 模糊聚類整合模型的構建之后,接下來,需要采用分布式自適應處理,實現(xiàn)信息資源整合。
首先,采用模糊聚類分析的方式,將所屬的信息資源依據(jù)特征或者屬性劃分為不同額定整合區(qū)域,設定整合目標為動態(tài),依據(jù)虛擬整合的范圍,對定向目標作出更改和調整,計算出信息資源整合的隸屬度,具體如式(5)所示。
K = 3.5T +(7 y ?1) (5)
式(5)中: K 表示隸屬度; T 表示質心聚類系數(shù); y表示歐氏距離。通過上述計算,最終可以得出實際的隸屬度。與此同時,利用所得的隸屬度,布設自適應模糊整合區(qū)域,細化引導的指令,采用EAD 模糊聚類整合模型測定出此時電子信息的自適應程度,具體如式(6)所示。
F = 5W ?1.5 + 6G (6)
式(6)中: F 表示自適應程度; W表示定向資源分析速度; G 表示特征向量。通過上述計算,最終可以得出實際的自適應程度,依據(jù)得出的自適應程度,布設信息資源的整合層級,采用分布式的整合方式,對信息資源定向分類,結合模糊聚類法實現(xiàn)最終的整合分析。構建對應的信息資源整合環(huán)節(jié),具體如圖2 所示。
2 方法測試
為了驗證本文提出的基于模糊聚類的電子信息資源整合方法在實際應用中的效果,選取A 數(shù)據(jù)庫作為測試的主要目標,通過在Matlab 軟件進行測試分析。分別設定傳統(tǒng)LAM 信息資源整合測試組、傳統(tǒng)改進ORM信息資源整合測試組以及本文所設計的模糊聚類信息資源整合測試組。采用對比的方式,確保3 種方法在相同的環(huán)境之下同時測試,最終得出的結果以對比的方式展開分析,接下來,進行測試環(huán)境的搭建。
2.1 測試準備
在對模糊聚類下電子信息資源整合方法的實際應用效果進行分析與研究,需要先搭建相關的測試環(huán)境。根據(jù)測定的實際需求以及執(zhí)行標準,先對測試基礎指標參數(shù)進行預設,具體如下表2 所示。
根據(jù)表2,可以完成對基礎指標參數(shù)的預設。實驗數(shù)據(jù)主要針對RBI、AWS、UCI、KDD Cup、MovieLens相關數(shù)據(jù)。
隨后,利用測定的設備,營造相應的信息整合環(huán)境。為進一步確保信息資源整合的穩(wěn)定性,采用無線局域網(wǎng)的通信模式,結合模糊聚類框架,對數(shù)據(jù)資源的基礎整合情況作出分析,具體如圖3 所示。
根據(jù)圖3,可以完成對信息資源整合程度的對比分析。調整信息資源的單元處理速度,調整整合處理標準,完成對測試環(huán)境的搭建。核定測試的設備與網(wǎng)絡是否處于穩(wěn)定的運行狀態(tài),同時確保不存在影響最終測試結果的外部因素,核定無誤后,開始具體的測定分析。
2.2 測試過程及結果分析
在完成對上述測試環(huán)境的搭建之后,接下來,需要進行具體的測試。首先,為了提升信息資源整合的速度,本文選擇使用指令引導的方式,關聯(lián)對應的局域網(wǎng)和數(shù)據(jù)庫,在網(wǎng)絡中尋找所需要的信息資源,并采用特殊的格式,按照指令的歸納順序,分批次導入數(shù)據(jù)庫的對應位置中,結合數(shù)據(jù)的種類,劃定對應的處理階層,獲取基礎指標數(shù)值。計算信息資源的整合定向范圍,具體如式(7)所示。
式7 中: Y 表示整合定向范圍; V 表示單向引導距離。
通過上述計算,最終可以得出實際的整合定向范圍。在標定的范圍之內,結合模糊聚類方式,將所屬的信息資源整合,劃歸至對應的整合層級之中。在模糊聚類分析背景下,構建批量信息資源的整合環(huán)節(jié),具體如圖4所示。
根據(jù)圖4,可以完成對信息資源模糊聚類整合環(huán)節(jié)的設計。與此同時,關聯(lián)無線局域網(wǎng)絡,構建定向的信息整合程序,賦予每一個層級對應的聚類指令,營造穩(wěn)定的信息處理整合環(huán)境。隨后,將測試數(shù)據(jù)庫與XML數(shù)據(jù)中心相關聯(lián),可以更好地完成局部數(shù)據(jù)模式向全局數(shù)據(jù)模式的定向轉化,實現(xiàn)信息資源的適配處理之后,對數(shù)據(jù)庫中的元數(shù)據(jù)定義,將所選擇的數(shù)據(jù)劃定為4 個小組,每一個小組的數(shù)據(jù)量均不同,利用模糊聚類分析法,對電子信息資源整合的響應時間計算,具體如式(8)所示。
式8 中:M表示響應時間; b 表示定向測定距離; g 表示虛擬迭代次數(shù)。通過上述計算,最終可以得出實際的響應時間。對得出的結果對比分析,如表3 所示。
根據(jù)表3,可以完成對測試結果的對比分析:與傳統(tǒng)的LAM 信息資源整合測試組及傳統(tǒng)改進ORM 信息資源整合測試組相對比,本文所設計的模糊聚類信息資源整合測試組最終得出的響應時間相對較為迅速,表明在對電子信息資源整合的處理上,效率較高,誤差較小,整合環(huán)節(jié)得到了更好地處理,具有實際的應用價值。
3 結束語
綜上所述,便是對基于模糊聚類的電子信息資源整合方法的分析和研究。對比于傳統(tǒng)的信息資源整合方法,本文在模糊聚類分析的輔助之下,構建更為靈活、多變的信息整合模式,在復雜的背景環(huán)境之下,可以更為迅速、清晰地完成目標任務的處理,最大程度降低信息整合誤差的發(fā)生概率,與網(wǎng)絡相關聯(lián),形成動態(tài)的信息處理程序,通過指令引導,營造一個穩(wěn)定、安全的處理環(huán)境,更加符合現(xiàn)代化發(fā)展的需求,促使信息資源整合配置更為高效,通信效率大幅提升,發(fā)展前景廣闊。