田冠博
(邳州市人民醫(yī)院, 邳州 221300)
電子文件遷移由于巨大狀態(tài)空間,計(jì)算復(fù)雜性高,對(duì)服務(wù)器、磁盤(pán)、CPU等資源的要求高,需要借助兼容性強(qiáng)的模型來(lái)調(diào)節(jié)動(dòng)態(tài)負(fù)載平衡,減少遷移代價(jià),提高執(zhí)行率。云計(jì)算下電子文件遷移,綜合文件、資源方面的因素,平衡存儲(chǔ)單元負(fù)載,保證計(jì)算性能的重復(fù)發(fā)揮[1]。
負(fù)載平衡調(diào)整電子文件訪問(wèn)的負(fù)載差異,訪問(wèn)頻率、大小敏感的遷徙模型,采用占用量概念對(duì)云端資源的負(fù)載壓力進(jìn)行描述,其受以下因素影響:
(1) 訪問(wèn)次數(shù)與占用量值成正比;
(2) 并發(fā)數(shù),特別是平均并發(fā)數(shù)的增加,遷移文件的占用量值隨之增加;
(3) 電子文件越大,遷移占用量值越高。
(1) 在第i次訪問(wèn)前,云端存儲(chǔ)文件fk未被訪問(wèn),則e(fk,i)=0
(2) 在第i次訪問(wèn)時(shí),云端存儲(chǔ)文件fk占用量為式(1)。
(1)
其中,i—代表第i次訪問(wèn)前,屬于極限值;λk代表云端系統(tǒng)第i次訪問(wèn)時(shí),文件fk的并發(fā)訪問(wèn)數(shù);λ表示云端系統(tǒng)第i次訪問(wèn)時(shí),平均并發(fā)數(shù);lk表示遷移文件fk的長(zhǎng)度。
(3) 云端系統(tǒng)在in、im時(shí)間內(nèi),為對(duì)文件fk訪問(wèn),那么e(fk,in)=e(fk,im)?im-in;
(4) 云端系統(tǒng)在發(fā)生第im訪問(wèn)時(shí),對(duì)文件fk訪問(wèn),且上一次訪問(wèn)時(shí)間為in,說(shuō)明如式(2)。
(2)
云端存儲(chǔ)單元依據(jù)文件大小,或者分塊方式占用不同存儲(chǔ)空間,但由于云端存儲(chǔ)單元異構(gòu),各單元存儲(chǔ)空間、訪問(wèn)帶寬不同,占用量高低不能全面反映云端資源負(fù)載。為了準(zhǔn)確、清楚描述文件遷移,引入相對(duì)占用量概念[3]。
假設(shè)e(nk,i)表示相對(duì)占用量,那么i時(shí)刻云端資源存儲(chǔ)單元nk的相對(duì)占用量如式(3)。
(3)
其中,χj=∑φ是云端存儲(chǔ)單元nk上存儲(chǔ)的電子文件和,或者文件塊的占有量和;Lj是j存儲(chǔ)單元擁有的存儲(chǔ)空間;L是云端平均存儲(chǔ)空間;Sj是j存儲(chǔ)單元的云傳輸帶寬。
電子文件超過(guò)閾值,就會(huì)激發(fā)遷移操作。但,閾值設(shè)定存在不足,對(duì)文件訪問(wèn)請(qǐng)求的傾斜性大。遷移觸發(fā)函數(shù)激發(fā)后,后續(xù)文件訪問(wèn)請(qǐng)求增加,云端存儲(chǔ)資源快速占用,存儲(chǔ)單元負(fù)載增加,云計(jì)算性能驟降。REM函數(shù)基于概率計(jì)算,適用于云端存儲(chǔ)系統(tǒng),依據(jù)條件限制電子文件訪問(wèn)。設(shè)置最大、最低負(fù)載,即Lmax、Lmin,依據(jù)兩者關(guān)系,衡量云端存儲(chǔ)單元的負(fù)載情況,如式(4)。
(4)
其中,p遷代表電子文件遷移概率,S下為云端存儲(chǔ)單元的下行帶寬,S存為云端第i個(gè)存儲(chǔ)單元的負(fù)載情況。
遷移對(duì)象要基于文件訪問(wèn)請(qǐng)求,結(jié)合云端資源情況,實(shí)現(xiàn)負(fù)載平衡,否則將加重云端設(shè)備負(fù)載。文件遷移需要兼顧幾方面:
(1) 以數(shù)據(jù)塊為單元遷移。數(shù)據(jù)塊劃分有效避免大文件、大數(shù)據(jù)遷移耗時(shí)長(zhǎng)問(wèn)題,節(jié)約帶寬資源,突破云端存儲(chǔ)單元性能限制,對(duì)固定大小數(shù)據(jù)塊進(jìn)行遷移[4]。
(2) 遷移文件選擇與用戶請(qǐng)求結(jié)合,假設(shè)正在被訪問(wèn),且占用量高的文件fk,用ξi表示,那么文件占用量密度為式(5)
ξi=ei/li
(5)
其中,文件i的長(zhǎng)度為li,第i的文件具有的占用量為ei。
假設(shè)定義云端存儲(chǔ)單元為遷移單元,接受遷出數(shù)據(jù)塊的存儲(chǔ)單元為接受單元,在接受單元的云端下行帶寬許可情況下,則有:
(1) 所有訪問(wèn)數(shù)據(jù)塊bi的用戶請(qǐng)求為d合,則∪d合,d合?bi被發(fā)送到接收云端。
(2) 充分利用閑置帶寬,讀入bi的尾部數(shù)據(jù)bi-∪d合發(fā)送至接受單元;
(3) 出現(xiàn)新訪問(wèn)文件fk的請(qǐng)求d新,或者未訪問(wèn)數(shù)據(jù)塊bi的用戶,已經(jīng)完成一個(gè)數(shù)據(jù)塊的訪問(wèn),則用戶請(qǐng)求將轉(zhuǎn)到bj,以此類(lèi)推,相繼訪問(wèn)其他數(shù)據(jù)塊,實(shí)現(xiàn)文件遷移的用戶請(qǐng)求復(fù)合。
(4) 遷移過(guò)程中,無(wú)論是否出現(xiàn)新用戶訪問(wèn),或者用戶請(qǐng)求超過(guò)bj,都要對(duì)數(shù)據(jù)塊bj遷移,原則為閑置帶寬分配固定帶寬S固,保證文件順利遷移。
其中,v是云端為用戶請(qǐng)求訪問(wèn)fk分配帶寬,li為云端數(shù)據(jù)的單位長(zhǎng)度?,F(xiàn)有帶寬不能滿足實(shí)際需求,遷移單元附近用戶請(qǐng)求撤銷(xiāo),釋放帶寬滿足遷徙需求。
(5) 文件遷移擁有充足帶寬,則要保持帶寬到遷移工作完成,或者新的數(shù)據(jù)塊用戶訪問(wèn)文件。
復(fù)合用戶范圍可以對(duì)云端資源負(fù)載進(jìn)行優(yōu)化,并行用戶請(qǐng)求,又提高閑置帶寬利用率,減少文件遷移對(duì)資源的占用量。
在消除存儲(chǔ)單元負(fù)載閑置的情況下,文件遷移給云端存儲(chǔ)帶來(lái)附加荷載,形成新的資源瓶頸,陷入“迭代”循環(huán),導(dǎo)致云端資源占用量持續(xù)增加。為避免上述問(wèn)題,要求目的存儲(chǔ)單元i具有低占用量Q低,并實(shí)現(xiàn)在接收數(shù)據(jù)塊bj后的相對(duì)占用量最小,如式(6)。
(6)
輸入:云端存儲(chǔ)單元數(shù)為m,遷移文件數(shù)量為n;
云端系統(tǒng):D={D1,D2…,D3},Dj=(Lj,Sj,Qj);其中,Qj為第j個(gè)存儲(chǔ)單元具有的相對(duì)占用量,
存儲(chǔ)文件:F={F1,F(xiàn)2…,F(xiàn)3},F(xiàn)i=(li,Qi);
訪問(wèn)文件:fk為第k次訪問(wèn)時(shí)所訪問(wèn)文件;
輸出:云端負(fù)載平衡的所有操作;
步驟1:依據(jù)存儲(chǔ)單元(Dj,Sj),判斷第j個(gè)存儲(chǔ)單元是否達(dá)到閾值,并觸發(fā)文件遷移操作;
步驟2:所有已觸發(fā)云端文件遷移的操作Dj,遷移訪問(wèn)占有量密度最高的數(shù)據(jù)塊文件;
步驟3:選擇占有量適合的接受單元,進(jìn)行文件遷移操作。
通過(guò)仿真實(shí)驗(yàn)驗(yàn)證基于云計(jì)算環(huán)境的電子文件遷移模型的時(shí)間優(yōu)化下過(guò),訪問(wèn)請(qǐng)求為合成負(fù)載方式。以傳統(tǒng)磁盤(pán)冷卻法為比較對(duì)象,驗(yàn)證試驗(yàn)效果。
表1 初始值設(shè)置
訪問(wèn)量對(duì)模型分析非常重要,但不能全面反映訪問(wèn)有效率,所以采用x/y分布方式產(chǎn)生訪問(wèn)序列,實(shí)現(xiàn)x%請(qǐng)求訪問(wèn)y%文件[6]。假設(shè)文件ID為1-50,對(duì)于任意x/y參數(shù)請(qǐng)求,可以依據(jù)公式3,計(jì)算每個(gè)文件的訪問(wèn)概率。本文通過(guò)改變文獻(xiàn)ID實(shí)現(xiàn)負(fù)載動(dòng)態(tài)分析,以每100次訪問(wèn)為周期ζ,對(duì)i文件訪問(wèn),則其動(dòng)態(tài)負(fù)載為i=(i+ζ)/50%。
連續(xù)對(duì)云端存儲(chǔ)進(jìn)行10組模擬試驗(yàn),每組試驗(yàn)符合3.1節(jié)的測(cè)試環(huán)境,隨機(jī)生成存儲(chǔ)單元和文件,按照3.2節(jié)的負(fù)載計(jì)算,生成文件訪問(wèn)序列。對(duì)比傳統(tǒng)磁盤(pán)冷卻算法和無(wú)負(fù)載情況下的云端電子文件遷移,按照1 s、3 s、6 s、9 s的時(shí)間間隔的100次云端文件訪問(wèn)請(qǐng)求,計(jì)算出平均處理時(shí)間和吞吐量。相對(duì)于冷卻算法的相對(duì)負(fù)載說(shuō),無(wú)平衡策略以初始云端存儲(chǔ)單元的5個(gè)文件為依托,云端存儲(chǔ)單元在任何條件下均不進(jìn)行負(fù)載平衡。平均請(qǐng)求處理時(shí)間=請(qǐng)求運(yùn)行總時(shí)間/訪問(wèn)請(qǐng)求總數(shù),比值越大云端處理能力越弱。平均吞吐量=單位時(shí)間內(nèi)處理訪問(wèn)次數(shù)/處理時(shí)間,比值越大云端占用量越低。不同時(shí)間間隔下的平均處理時(shí)間、平均等待時(shí)間的比值,如圖1所示。
圖1 不同模型下文件遷移處理時(shí)間
在不同負(fù)載情況下,云計(jì)算下的電子遷移模型優(yōu)于傳統(tǒng)磁盤(pán)冷卻模型效果,不會(huì)增加云端負(fù)載量,節(jié)省資源占用量。
本文提出體現(xiàn)文件訪問(wèn)對(duì)云計(jì)算負(fù)載的文件遷移模型,給出適合云端存儲(chǔ)結(jié)構(gòu)的遷移觸發(fā)函數(shù),復(fù)合用戶訪問(wèn)的遷移文件選擇、遷移過(guò)程實(shí)現(xiàn)。最后,構(gòu)建符合上述要求模型,并進(jìn)行模擬仿真實(shí)驗(yàn)。相對(duì)于磁盤(pán)冷卻模型來(lái)說(shuō),云計(jì)算環(huán)境下負(fù)載平衡文件遷移模型,在處理時(shí)間、吞吐量、資源占用量方面更優(yōu),提高云端系統(tǒng)的相應(yīng)性能。然而,在云計(jì)算處理速度、云端資源優(yōu)化方面研究尚存在不足,有待于進(jìn)一步研究和分析。