宋小芹 王東亞
摘要:提出一種基于結(jié)構(gòu)相似度定位的數(shù)據(jù)庫存儲軟件調(diào)度算法,首先構(gòu)建大規(guī)模集成軟件的數(shù)據(jù)庫存儲空間結(jié)構(gòu)模型,對存儲軟件調(diào)度信息進(jìn)行矢量重構(gòu)和信息流模型構(gòu)建,采用結(jié)構(gòu)相似度定位方法進(jìn)行數(shù)據(jù)庫存儲資源的特征提取和融合處理,以提高調(diào)度效率。仿真結(jié)果表明,采用該方法進(jìn)行大規(guī)模集成軟件數(shù)據(jù)庫存儲資源調(diào)度,效率與收斂性較高,吞吐性能較好,展示了較高的應(yīng)用價值。
關(guān)鍵詞關(guān)鍵詞:結(jié)構(gòu)相似度定位;數(shù)據(jù)庫存儲;存儲軟件
DOIDOI:10.11907/rjdk.161331
中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A文章編號文章編號:16727800(2016)007015203
0引言
隨著計算機技術(shù)、信息技術(shù)的快速發(fā)展,產(chǎn)生了越來越多的數(shù)據(jù)信息資源。如何將這些大規(guī)模集成軟件的數(shù)據(jù)庫存儲資源利用起來,放在一個公共訪問區(qū)域,方便所有用戶和科技工作者訪問,從而提高大規(guī)模集成軟件的使用率是下一代計算機信息技術(shù)發(fā)展需要解決的首要問題。現(xiàn)代集成軟件調(diào)度和資源分布的弊端主要體現(xiàn)在資源分布地區(qū)差異大,不同地區(qū)資源持有程度嚴(yán)重不同,成為制約集成軟件信息技術(shù)發(fā)展均衡的首要因素。另外,資源成本高、使用率低下、共享技術(shù)落后也是影響信息現(xiàn)代化發(fā)展的瓶頸。因此,需要研究一種高效的大規(guī)模集成軟件的數(shù)據(jù)庫存儲資源優(yōu)化調(diào)度算法,以提高集成軟件的運行和開發(fā)效率\[13\]。
1大規(guī)模集成軟件的數(shù)據(jù)庫存儲空間結(jié)構(gòu)模型與信息流分析1.1大規(guī)模集成軟件的數(shù)據(jù)庫存儲空間結(jié)構(gòu)模型基礎(chǔ)
為了實現(xiàn)對大規(guī)模集成軟件的數(shù)據(jù)庫存儲資源優(yōu)化調(diào)度,首先采用遺傳算法構(gòu)建大規(guī)模集成軟件的數(shù)據(jù)庫存儲模型,進(jìn)行數(shù)據(jù)存儲結(jié)構(gòu)編碼。遺傳算法通常用最簡單的編碼方式來表示一個相對復(fù)雜的問題,編碼是變量集合,并對該編碼集進(jìn)行運算處理,最后再通過一組編碼來表示遺傳算法以及優(yōu)勝劣汰的選擇,同時對后面的搜索進(jìn)行學(xué)習(xí)指導(dǎo)并確定一個搜索方向。
遺傳算法在執(zhí)行數(shù)據(jù)庫大規(guī)模集成軟件數(shù)據(jù)庫存儲空間結(jié)構(gòu)的過程表述為:①首先隨機產(chǎn)生一個任意種群,即所需求解問題一個解的集合;② 每個初始種群中的個體都應(yīng)有一個解,每個個體攜帶基因的不同性質(zhì)決定了每個個體特征不同,遺傳算法通過一個適應(yīng)度函數(shù)對每個個體特征進(jìn)行辨別打分;③通過數(shù)據(jù)編碼計算后,算法會根據(jù)每個個體的適應(yīng)度配合不同的辨別選擇方案,挑選出部分個體進(jìn)入下一代,選擇個體的策略應(yīng)要讓高適應(yīng)度個體比低適應(yīng)度個體更容易進(jìn)入下一代,即高適應(yīng)度個體進(jìn)入下一代的概率要高于低適應(yīng)度個體;④ 對選擇出來的個體通過交叉和變異操作產(chǎn)生適應(yīng)度更高個體,經(jīng)過這樣反復(fù)操作,種群多樣性得到提高。通過上述分析,得到大規(guī)模集成軟件的數(shù)據(jù)庫存儲空間結(jié)構(gòu)模型如圖1所示。
在大規(guī)模集成軟件的數(shù)據(jù)庫存儲空間中,進(jìn)行數(shù)據(jù)存儲子空間的多維矢量特征重構(gòu)。設(shè)在大規(guī)模集成軟件的數(shù)據(jù)庫存儲空間進(jìn)行軟件分布式調(diào)度的概念格結(jié)點G1=(Mα1,Mβ1,Y1),G2=(Mα2,Mβ2,Y2),自適應(yīng)網(wǎng)格分布的適應(yīng)加權(quán)函數(shù)為:θ(t)=2π∫t/a-T/2(Kt0-t′)dt′=-2πKln(1-tat0)+θ0(1)其中,θ0=-2πKln(1+T2t0)為子代基因的中心矢量,用輸入數(shù)據(jù)包傳輸和監(jiān)測信息x(k)減去輸出y(k),可以得到M個大規(guī)模集成軟件數(shù)據(jù)庫存儲空間的節(jié)點采樣,并得到大規(guī)模集成軟件數(shù)據(jù)庫存儲空間的瞬時特征頻率為:fia(t)=12πdθdt=Kat0-t=Kt0-t+(a-1)t0(2)其中,t0為初始采樣時間檢測,a為自然選擇機制的軟件特征信息的幅值,數(shù)據(jù)的聚類中心滿足G1G2Y1Y2。將v插入有序集R1(u)中,由此實現(xiàn)數(shù)據(jù)庫的結(jié)構(gòu)分析和編碼特征優(yōu)化。
1.2數(shù)據(jù)庫存儲資源信息流模型構(gòu)建
在上述數(shù)據(jù)結(jié)構(gòu)和存儲空間分析的基礎(chǔ)上,構(gòu)建數(shù)據(jù)庫存儲資源信息流,在C/S構(gòu)架下的隱通道中進(jìn)行數(shù)據(jù)采樣,在數(shù)據(jù)庫資源信息采樣時刻t和t+τ進(jìn)行信息特征提取,得到關(guān)聯(lián)的初始化大數(shù)據(jù)資源子集為x(k-1),….,x(k-M)。假設(shè)信息流為數(shù)據(jù)序列{xn},通過選擇適當(dāng)?shù)南辔沪?(k),在時間片Δ內(nèi)令自適應(yīng)權(quán)值(0)=0,通過子代基因逆轉(zhuǎn)技術(shù),對遺傳算法進(jìn)行變異處理,使得子代基因有更強的自適應(yīng)能力。結(jié)合后續(xù)的子代基因逆轉(zhuǎn),設(shè)S為支配點u的環(huán)形區(qū)域,令A(yù)={a1,a2,...,an}為大規(guī)模集成軟件數(shù)據(jù)庫中特征矢量的模糊聚類中心,基于Internet的Web架構(gòu)模式得到軟件資源流數(shù)據(jù)庫。簡化用戶操作數(shù)據(jù)庫,擴展數(shù)據(jù)庫應(yīng)用范圍,在軟件調(diào)度子空間中的特征分解中心頻率輸出的矢量模型為:x1(t)
nM(t)(3)其中,根據(jù)方向矢量在時頻域內(nèi)的特征采樣,以特征值降值排列,進(jìn)行解析濾波處理,得到大規(guī)模集成軟件數(shù)據(jù)庫存儲空間的指向性增益。采用波束形成方法進(jìn)行冗余數(shù)據(jù)濾波,濾波函數(shù)為:x1(t)
nM(t)(4)若冗余數(shù)據(jù)的子空間均為窄帶的,數(shù)據(jù)庫存儲軟件調(diào)度的計算性能通過訓(xùn)練集進(jìn)行特征分類,構(gòu)建資源分類屬性集。B={b1,b2,...,bm}為數(shù)據(jù)庫存儲軟件調(diào)度特征挖掘的屬性類別集,得到數(shù)據(jù)庫存儲軟件調(diào)度的加權(quán)特征參量迭代式為:θ1(k+1)=θ1(k)-μRe[y(k)φ*(k)](5)其中,μ是大數(shù)據(jù)分布的收斂步長,ia表示數(shù)據(jù)庫存儲軟件映射與調(diào)度尺度a的有限數(shù)據(jù)集屬性。通過在矢量空間中進(jìn)行特征信息流分析,為進(jìn)行調(diào)度算法優(yōu)化設(shè)計提供準(zhǔn)確的數(shù)據(jù)基礎(chǔ)。
2算法改進(jìn)設(shè)計與實現(xiàn)
在上述進(jìn)行了存儲空間結(jié)構(gòu)分析和數(shù)據(jù)信息流模型構(gòu)建的基礎(chǔ)上,進(jìn)行數(shù)據(jù)庫存儲調(diào)度算法改進(jìn)設(shè)計。傳統(tǒng)方法采用DctAF框架式云緩存調(diào)度方法,當(dāng)軟件集成深度和數(shù)據(jù)庫的差異信息特征較大時,云緩存調(diào)度的計算開銷過大,效率不高。為了克服傳統(tǒng)方法的弊端,本文提出一種基于結(jié)構(gòu)相似度定位的數(shù)據(jù)庫存儲軟件調(diào)度算法,首先構(gòu)建大規(guī)模集成軟件的數(shù)據(jù)庫存儲空間結(jié)構(gòu)模型,對存儲軟件調(diào)度信息進(jìn)行矢量重構(gòu)和信息流模型構(gòu)建,采用結(jié)構(gòu)相似度定位方法進(jìn)行數(shù)據(jù)庫存儲資源的特征提取和融合處理,得到數(shù)據(jù)庫中大數(shù)據(jù)采樣的支配節(jié)點信息融合采樣代價函數(shù)為:HB(z)=(1+sinθ2)cosθ2cosθ1(k)cosθ2z-11+sinθ1(k)(1+sinθ2)z-1+sinθ2z-2G(z)(6)其中:G(z)=1-sinθ221-z-21+sinθ1(k)(1+sinθ2)z-1+sinθ2z-2(7)輸入的數(shù)據(jù)庫存儲軟件大數(shù)據(jù)時間序列u(k)經(jīng)過自適應(yīng)平滑濾波和自適應(yīng)子空間加權(quán)處理,把有限數(shù)據(jù)集合X分為c類,提取數(shù)據(jù)庫存儲軟件大數(shù)據(jù)信息流的時間序列為{x(t0+iΔt)},i=0,1,...,N-1。通過結(jié)構(gòu)相似度特征提取,得到相似度定義為:fY(y;λ0)=2yλ0e-y2λ0(8)其中,λ0表示各數(shù)據(jù)庫存儲軟件節(jié)點與資源整合聚類中心的目標(biāo)函數(shù)值。此時,大數(shù)據(jù)系統(tǒng)中分布空間的聚類中心特征分量為CF,記為CF=[F,Q,n,RT1,RT2,RW],對于數(shù)據(jù)庫存儲軟件的實體AU,取αj=minΨj,相似性特征測度v(A)>0。當(dāng)滿足約束目標(biāo)函數(shù),數(shù)據(jù)庫存儲軟件尺度整合信息的初始聚類中心矢量收斂值為V1j=(v1j1,v1j2,…,v1jn)。在ASP.NET中,由于數(shù)據(jù)庫系統(tǒng)本身的多樣性,為了使O/R Mapping能訪問各種數(shù)據(jù)庫系統(tǒng),設(shè)X和Y為類判別屬性集合,在軟件嵌入式的網(wǎng)絡(luò)系統(tǒng)中,設(shè)數(shù)據(jù)調(diào)度的資源方位時刻t內(nèi)的有效性調(diào)度的檢測閾值ε滿足2-λt<ε,λ>0。基于Z變換,結(jié)合變換式xi=2εi-1,構(gòu)造出特征分解的軟件屬性分類種類序列Χ=x1,x2,...,xn。
使用多個不同權(quán)限的用戶頻繁訪問系統(tǒng),得到數(shù)據(jù)庫存儲軟件資源業(yè)務(wù)量,用參量X的二項式表示為Sn=x1+x2+...+xn。進(jìn)一步采用尺度整合方法進(jìn)行自適應(yīng)尺度修正,得到穩(wěn)態(tài)調(diào)度的收斂尺度滿足正態(tài)分布函數(shù),即滿足limn→∞PSnn≤z=z=12π∫z-∞e-u2/2du,進(jìn)行軟件關(guān)聯(lián)博弈線性規(guī)劃。通過對數(shù)據(jù)庫存儲軟件資源業(yè)務(wù)量的優(yōu)化約束,得到可靠度統(tǒng)計量Sobs=Snn。根據(jù)正態(tài)分布特性,得到基于結(jié)構(gòu)相似度定位的大規(guī)模集成軟件的數(shù)據(jù)庫存儲調(diào)度博弈函數(shù)滿足:limn→∞PSobs=Snn≤z
(9)根據(jù)上述描述,得到本文設(shè)計的數(shù)據(jù)庫存儲軟件調(diào)度流程如圖2所示。
為了測試本文算法在進(jìn)行大規(guī)模集成軟件數(shù)據(jù)庫存儲資源優(yōu)化調(diào)度中的性能,進(jìn)行仿真實驗。實驗建立在Matlab仿真軟件基礎(chǔ)上,試驗平臺為通用PC機,CPU為Intel CoreTM i7-2600,仿真模型包括:關(guān)系副本選擇、網(wǎng)絡(luò)站點選擇、通信傳輸能力以及網(wǎng)絡(luò)節(jié)點處理等。構(gòu)建全局?jǐn)?shù)據(jù)狀態(tài)和動態(tài)數(shù)據(jù)狀態(tài),實現(xiàn)大規(guī)模集成軟件的數(shù)據(jù)庫存儲調(diào)度。首先進(jìn)行數(shù)據(jù)庫中的資源信息特征采樣,采樣時間間隔為T=2.3s,采樣頻率為15Hz,得到數(shù)據(jù)庫存儲資源的時間序列波形如圖3所示。
以上述采樣數(shù)據(jù)為研究對象,進(jìn)行數(shù)據(jù)庫存儲軟件調(diào)度仿真實驗,將數(shù)據(jù)調(diào)度的執(zhí)行時間作為測試指標(biāo),得到仿真結(jié)果如圖4所示。
可以看出,采用本文算法,通過數(shù)據(jù)庫存儲軟件調(diào)度,數(shù)據(jù)查詢特征相關(guān)匹配度達(dá)到97.3%,比傳統(tǒng)算法提高了25.6%。大幅縮短了迭代時間。特別在查詢關(guān)系數(shù)較大時,尋優(yōu)時間較傳統(tǒng)算法大幅縮短。采用該方法進(jìn)行大規(guī)模集成軟件數(shù)據(jù)庫存儲資源調(diào)度,效率與收斂性較高,吞吐性能較好,展示了較好的應(yīng)用性能。
參考文獻(xiàn):
劉經(jīng)南,方媛,郭遲,等.位置大數(shù)據(jù)的分析處理研究進(jìn)展[J].武漢大學(xué)學(xué)報:信息科學(xué)版,2014,39(4):379385.
吳鴻華,穆勇,屈忠鋒,等.基于面板數(shù)據(jù)的接近性和相似性關(guān)聯(lián)度模型[J].控制與決策,2016,31(3):555558.
張博,郝杰,馬剛,等.混合概率典型相關(guān)性分析[J].計算機研究與發(fā)展,2015,52(7):14631476.
吳濤,陳黎飛,郭躬德.優(yōu)化子空間的高維聚類算法[J].計算機應(yīng)用,2014,34(8):22792284.
余曉東,雷英杰,岳韶華,等.基于粒子群優(yōu)化的直覺模糊核聚類算法研究[J].通信學(xué)報,2015(5):7480.
孫超,楊春曦,范莎,等.能量高效的無線傳感器網(wǎng)絡(luò)分布式分簇一致性濾波算法[J].信息與控制,2015,44(3):379384.
責(zé)任編輯(責(zé)任編輯:黃健)