• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于檢驗點的移動云資源調(diào)度策略研究

      2019-02-25 06:33:00曹啟彥
      關(guān)鍵詞:調(diào)度檢驗故障

      何 利,曹啟彥

      (重慶郵電大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,重慶 400065)

      0 引 言

      云計算正在成為引人注目的提供可靠彈性服務(wù)和按需服務(wù)的范例,它使用不同的模型和抽象層次在互聯(lián)網(wǎng)上提供服務(wù)。云平臺將應(yīng)用程序當(dāng)作服務(wù)提供給用戶,其將整個IT基礎(chǔ)架構(gòu)外包給外部數(shù)據(jù)中心,并允許用戶在互聯(lián)網(wǎng)上托管他們的個人文檔。得益于云計算和移動互聯(lián)網(wǎng)的不斷融合發(fā)展,催生了移動云計算這一新興業(yè)務(wù)模式,尤其是移動終端的廣泛普及應(yīng)用。這種新生的信息服務(wù)和應(yīng)用模式已經(jīng)得到了各界的廣泛關(guān)注及研究。由于云資源調(diào)度過程中任務(wù)發(fā)生故障是不可避免的,使得容錯問題成為云服務(wù)關(guān)注的焦點。一方面,越來越多的移動應(yīng)用程序在云平臺上開發(fā),導(dǎo)致了云系統(tǒng)面臨或多或少的容錯問題;另一方面,以物理資源過載來實現(xiàn)高資源利用率的情況在云系統(tǒng)中非常普遍。根據(jù)Google Trace對數(shù)萬用戶的跟蹤記錄[1]表明,用戶對資源的需求量通常大于谷歌數(shù)據(jù)中心的總?cè)萘?。這種過載可能會導(dǎo)致物理資源枯竭,最終可能導(dǎo)致低優(yōu)先級任務(wù)被中斷或不能執(zhí)行。容錯資源調(diào)度建立在冗余技術(shù)基礎(chǔ)之上,通過有效管理云平臺中的軟、硬件,利用故障檢測、診斷和恢復(fù)等方法,使得在云任務(wù)執(zhí)行過程中發(fā)生故障的情況下仍能提供有效服務(wù)。利用檢驗點技術(shù)對故障進行恢復(fù),是云計算容錯資源調(diào)度對系統(tǒng)故障恢復(fù)的主要手段之一。

      檢驗點技術(shù)是指在云任務(wù)執(zhí)行過程中選取一個點,并在此處保存系統(tǒng)最新狀態(tài),它是任務(wù)發(fā)生故障前的一個穩(wěn)定(正確)狀態(tài)。在容錯資源調(diào)度系統(tǒng)中采用某種策略部署檢驗點,把資源調(diào)度過程中正確狀態(tài)保存到穩(wěn)定存儲器中,如果在隨后的任務(wù)執(zhí)行過程中檢測到故障事件,系統(tǒng)就向后回卷到之前最近一個檢驗點處,恢復(fù)故障后重新繼續(xù)執(zhí)行直至任務(wù)完成。但云計算中的檢驗點需要處理巨量虛擬機鏡像的保存和恢復(fù)工作,檢驗點的部署和調(diào)度需要很大開銷,這在采用虛擬技術(shù)的云服務(wù)系統(tǒng)中尤其明顯。因此,本文針對不同云計算系統(tǒng)中檢驗點的部署和優(yōu)化調(diào)度策略問題進行了深入研究。

      1 檢驗點技術(shù)原理

      檢驗點技術(shù)是提高云服務(wù)可靠性的常用手段,它是一種基于時間創(chuàng)建正確系統(tǒng)狀態(tài)副本的容錯資源調(diào)度策略??紤]到云平臺中的節(jié)點可能會發(fā)生故障,這個時候某些云任務(wù)可能執(zhí)行到一半但沒有提交。當(dāng)該節(jié)點重啟時,需要恢復(fù)到一致的狀態(tài),即要么提交整個任務(wù),要么回滾。為了保證云系統(tǒng)的一致性,其中的某些操作需要持久化到磁盤,如果每次操作都隨機更新磁盤的某個數(shù)據(jù)塊,系統(tǒng)性能將會很差。因此,通過云系統(tǒng)采用日志記錄每個任務(wù)的操作并在內(nèi)存中執(zhí)行這些操作,內(nèi)存中的數(shù)據(jù)定期刷新到磁盤,實現(xiàn)將隨機寫請求轉(zhuǎn)化為順序?qū)懻埱?。但是,如果所有的?shù)據(jù)都保存在內(nèi)存中,那么可能會出現(xiàn)2個問題:①故障恢復(fù)時需要回放所有的日志,效率較低。如果日志較多,故障恢復(fù)時間是無法接受的;②內(nèi)存不足。即使內(nèi)存足夠大,存儲系統(tǒng)往往也只能夠緩存最近較長一段時間的更新操作,很難緩存所有數(shù)據(jù)。

      因此,需要將內(nèi)存中的數(shù)據(jù)定期轉(zhuǎn)儲到磁盤,這種技術(shù)稱為檢驗點技術(shù)。為最小化因任務(wù)故障造成的損失,其在安全設(shè)備中周期性地將內(nèi)存中的操作以某種易于加載的形式(檢驗點文件)轉(zhuǎn)儲到磁盤中,并記錄檢驗點時刻的日志回放點。倘若發(fā)生故障,則只需要回滾到最近的檢驗點恢復(fù)任務(wù),從而避免了任務(wù)從頭開始執(zhí)行。檢驗點技術(shù)原理如圖1所示,其中,Ckpt表示檢查點。

      圖1 檢驗點技術(shù)原理圖Fig.1 Principles of checkpoint technical

      由于采用檢驗點技術(shù)對故障進行恢復(fù),不需要考慮故障的產(chǎn)生原因等因素,無論是硬件故障還是軟件故障都可恢復(fù),因此得到了廣泛應(yīng)用?;跈z驗點技術(shù)的容錯資源調(diào)度能夠?qū)⒐收蠈υ破脚_造成的影響降到盡可能低,使云任務(wù)自動恢復(fù)到正常工作狀態(tài)繼續(xù)運行下去直至任務(wù)完成。該技術(shù)雖然可以有效減少資源的浪費,但與此同時也受到了相應(yīng)的開銷限制,例如:將檢驗點寫入穩(wěn)定存儲的時間開銷、對云任務(wù)進行回卷恢復(fù)的時間開銷以及最后一個檢驗點與任務(wù)故障點之間的時間開銷等。因此,在云平臺中使用檢驗點技術(shù)進行容錯資源調(diào)度是必要的,其中根據(jù)不同的故障概率分布設(shè)置相應(yīng)的檢驗點布局成為研究焦點。

      2 基于檢驗點技術(shù)的容錯資源調(diào)度

      近幾年,學(xué)者們針對云計算中基于檢驗點技術(shù)的容錯資源調(diào)度問題進行了較多研究。檢驗點技術(shù)根據(jù)不同的故障概率可以分為以下2類:假設(shè)故障發(fā)生概率服從泊松分布的檢驗點技術(shù)和無預(yù)設(shè)故障概率分布的檢驗點技術(shù)。

      2.1 檢驗點技術(shù)的分類

      2.1.1 故障概率服從泊松分布的檢驗點技術(shù)

      近年來,研究人員研究了一系列云計算環(huán)境下的最優(yōu)檢驗點/重新啟動模型。在一些實際系統(tǒng)中常常通過假設(shè)故障發(fā)生的概率服從泊松分布來設(shè)計檢驗點部署策略,如圖2所示。

      假設(shè)每隔t時間單位設(shè)置一個檢驗點,每個檢驗點的成本為ε。當(dāng)故障發(fā)生時,系統(tǒng)通過卷回到最近一個檢驗點狀態(tài)進行恢復(fù),預(yù)計恢復(fù)時間為r。在系統(tǒng)恢復(fù)正常后繼續(xù)執(zhí)行任務(wù),直至任務(wù)完成為止。雖然大部分時間系統(tǒng)的運行是穩(wěn)定的,但任務(wù)發(fā)生故障是不可預(yù)測的,經(jīng)眾多云資源調(diào)度故障事件發(fā)生的數(shù)據(jù)分析可以發(fā)現(xiàn),故障發(fā)生的概率大多服從泊松分布,以及在某些小時內(nèi)系統(tǒng)中故障事件發(fā)生的概率明顯高于其他時候。因此,為提供優(yōu)化的檢驗點放置策略,研究人員們把節(jié)點發(fā)生故障的概率設(shè)置為一個服從泊松分布的問題,并且將檢驗點間隔根據(jù)經(jīng)驗或者慣例設(shè)置為固定值(如每小時一次)等一系列合理的假設(shè),確定了不同云計算系統(tǒng)中的檢驗點容錯模型。

      經(jīng)典的楊氏檢驗點策略為最小化因發(fā)生故障而導(dǎo)致的額外時間開銷,首先假設(shè)系統(tǒng)發(fā)生故障的概率服從泊松分布;然后根據(jù)平均故障時間和自上一個正確檢驗點以來直到故障發(fā)生的時間,計算出檢驗點的最佳間隔。然而,建立檢驗點并對故障進行恢復(fù)是需要額外成本的,為了確保云任務(wù)發(fā)生故障時能夠以相對較低的容錯開銷對任務(wù)進行恢復(fù),文獻[2-4]提出將發(fā)生故障的概率假設(shè)為服從泊松分布,通過求解Markov模型中進程狀態(tài)轉(zhuǎn)移概率和權(quán)重來對信息進行預(yù)測,并據(jù)此得出期望的檢驗點間隔時間。此類方案能夠以最小容錯開銷計算出檢驗點回卷恢復(fù)策略中的最佳檢驗點間隔。

      在云任務(wù)執(zhí)行過程中發(fā)生故障不僅會產(chǎn)生額外開銷,系統(tǒng)的可靠性也將受到影響。為了兼顧成本開銷和系統(tǒng)可靠性這2個因素,Dimitriou[5]提出在任務(wù)發(fā)生故障、退化和修復(fù)的情況下,利用不可靠的重試隊列進行性能分析,嘗試用最小的成本開銷為用戶提供高可靠性的服務(wù)。但當(dāng)時作者并沒有選擇采用檢驗點技術(shù)進行研究,后來Dimitriou[6]開始考慮使用重試隊列構(gòu)建容錯系統(tǒng)與檢驗點模型,并提出采用檢驗點技術(shù)來實現(xiàn)云平臺中成本及可靠性優(yōu)化的策略。首先假設(shè)故障發(fā)生的概率服從泊松分布;然后將每個云任務(wù)的服務(wù)時間分解為N個模塊,并在每個模塊的結(jié)尾處建立一個檢驗點。此外,該方案還在云服務(wù)中添加了定時器,以保證在服務(wù)空閑期停止其組件來節(jié)省電力成本。

      隨著云計算的蓬勃發(fā)展,云服務(wù)提供商們逐漸意識到他們不僅需要滿足用戶多樣化的需求,還被要求為用戶提供高度可靠的云服務(wù)。為此,Zhao等[7]提出一種可提供彈性可靠性優(yōu)化的方法,該方法假設(shè)主機(節(jié)點)的故障服從泊松分布。但與其他方法不同的是,作者采用點對點技術(shù)在云中邊緣節(jié)點設(shè)置檢驗點。利用對用戶個人需求的評估和數(shù)據(jù)中心的總可用資源,使用雙分解的分布式算法[8]進行聯(lián)合優(yōu)化提高服務(wù)的可靠性水平,該文獻提出的方法在提高資源利用率的同時還增加了運營商的收入。

      還有一些基于檢驗點的容錯機制研究,例如文獻[9]中把檢驗點的設(shè)置作為全局參數(shù)。但這樣做忽略了檢驗點的設(shè)置應(yīng)該與系統(tǒng)資源的動態(tài)變化相結(jié)合,檢驗點的設(shè)置和布局應(yīng)該是一個動態(tài)變化的過程。

      2.1.2 無預(yù)設(shè)概率分布的檢驗點技術(shù)

      通過將故障概率假定為服從泊松分布的方式來設(shè)置檢驗點間隔的檢驗點技術(shù),是對所有服務(wù)請求利用資源冗余實現(xiàn)了相同的“預(yù)設(shè)”可靠性。這些研究內(nèi)容中冗余資源的布局是靜態(tài)且有預(yù)設(shè)條件的,如果任務(wù)執(zhí)行過程中的內(nèi)存占用量發(fā)生變化或者網(wǎng)絡(luò)可達性變化,均會導(dǎo)致故障的概率分布發(fā)生變化,檢驗點成本也可能會在執(zhí)行期間發(fā)生變化。因此,這些檢驗點布局不能隨著服務(wù)的增加而動態(tài)調(diào)整,當(dāng)服務(wù)需求數(shù)量激增時,冗余資源的數(shù)量將呈現(xiàn)指數(shù)增長的趨勢,造成資源的浪費和服務(wù)供應(yīng)商的成本增加。

      為了動態(tài)滿足用戶需求并同時提供高可靠性服務(wù),文獻[10-11]使用基于節(jié)點而不是服務(wù)器的點對點技術(shù),并綜合考慮建立檢驗點的成本、系統(tǒng)可靠性以及歷史數(shù)據(jù)等因素來進行無預(yù)設(shè)概率的模型優(yōu)化。這種設(shè)置檢驗點的方案能夠減少任務(wù)執(zhí)行時間并提高系統(tǒng)性能。

      考慮到云計算的性質(zhì),假如云任務(wù)發(fā)生故障時云中已沒有空閑虛擬機,則該任務(wù)必須等待有空閑虛擬機或者某些資源可用時才能利用檢驗點技術(shù)進行卷回恢復(fù)。Di[12]試圖在不預(yù)設(shè)故障概率分布概率情況下設(shè)置檢驗點,并對檢驗點的間隔進行了深入研究,設(shè)Te表示系統(tǒng)中執(zhí)行完一個作業(yè)中的所有任務(wù)所需時間,C表示檢驗點成本,E(Y)表示執(zhí)行任務(wù)期間發(fā)生的故障事件。從而推導(dǎo)出適用于云任務(wù)中具有不同故障概率分布的最佳檢驗點間隔x*表示為

      (1)

      由于任務(wù)的故障概率分布還取決于其優(yōu)先級,即當(dāng)且僅當(dāng)在先前的最后一個檢驗點間隔期間改變了任務(wù)平均故障數(shù)(mean number of failures, MNOF)才需要重新計算下一個檢驗點位置。因此,該策略中還使用歷史數(shù)據(jù)來統(tǒng)計平均故障數(shù)MNOF,以此來實現(xiàn)對云任務(wù)不作任何故障概率預(yù)設(shè)。

      根據(jù)研究[13]表明,故障在局端規(guī)模系統(tǒng)上具有時間局部性。由此,Wan等[14]利用故障的時間局部性來識別檢驗點間隔,通過刻畫檢驗點時間曲線并增加檢驗點的間隔時間使其曲線與故障曲線具有相同斜率來確定最佳檢驗點間隔。并利用突發(fā)緩沖區(qū)和并行文件系統(tǒng)來存放檢驗點數(shù)據(jù),不僅可以得出了最優(yōu)檢驗點間隔,還可以減少由系統(tǒng)故障引起的計算時間浪費,使其不會超過突發(fā)緩沖區(qū)的寫入限制。Meroufel等[15]還在此基礎(chǔ)上提出了一種基于時間的自適應(yīng)協(xié)調(diào)檢驗點技術(shù),解決了云任務(wù)在不同的虛擬機(virtual machine, VM)之間通過消息傳遞接口通信的問題。該技術(shù)根據(jù)估計的孤兒消息和轉(zhuǎn)接消息出現(xiàn)時間間隔,選擇一個VM作為啟動器。在這段估計的時間間隔內(nèi),該技術(shù)可以得到最佳檢驗點間隔,從而減少了任務(wù)執(zhí)行總時間。

      針對具有動態(tài)保存和檢索時間不固定的檢驗點模型[16-17],Levitin等[18]進行研究提出了一種動態(tài)檢驗點策略,自上一個檢驗點完成以來,系統(tǒng)進行再執(zhí)行πj=(n(j,k)+1)個操作后設(shè)置一個新的檢驗點,其中,x表示故障發(fā)生后還需執(zhí)行的操作數(shù),(n(j,k)+1)表示直到任務(wù)完成需要執(zhí)行的檢驗點數(shù)。該策略仍然是動態(tài)地確定檢驗點設(shè)置頻率,可靠性優(yōu)于檢驗點間隔服從固定概率的布局策略。

      尋求成本和可靠性折中的機制或工具來降低成本同時保持高可靠性,對用戶來說非常重要。為此,Yi等[19]提出了一種在亞馬遜彈性云(elastic compute cloud,EC2)中使用檢驗點并遷移資源的機制來最小化資源配置的成本和波動。在此基礎(chǔ)上,Mehta等[20]根據(jù)云環(huán)境下資源的動態(tài)變化特性,設(shè)置了一個檢測器來檢測任務(wù)故障,當(dāng)檢測到某節(jié)點發(fā)生故障時立即保存狀態(tài),然后將任務(wù)卷回到尚未發(fā)生故障的云系統(tǒng)中的另一個節(jié)點。這種方法降低了任務(wù)發(fā)生故障后的開銷和執(zhí)行時間。

      2.2 不同檢驗點策略的比較和分析

      本文將基于檢驗點技術(shù)的容錯資源調(diào)度方法歸為2類:將故障概率假定為服從泊松分布來設(shè)置檢驗點的容錯資源調(diào)度方法和不作故障概率預(yù)設(shè)設(shè)置檢驗點的容錯資源調(diào)度方法?,F(xiàn)將這些方法作比較和分析,如表1所示。

      表1 基于不同檢驗點技術(shù)的容錯資源調(diào)度策略的比較Tab.1 Comparisons of fault-tolerant resource scheduling strategies based on different checkpoint technology

      續(xù)表1

      3 移動云中的容錯資源調(diào)度

      3.1 移動云

      移動云計算是云計算與移動互聯(lián)網(wǎng)不斷融合的產(chǎn)物,近年來其得以飛速的發(fā)展。它繼承了云計算的應(yīng)用動態(tài)部署、資源可擴展、多用戶共享以及多服務(wù)整合等優(yōu)勢,許多新服務(wù)和應(yīng)用模式也因它而生[21]。為滿足用戶日益復(fù)雜的需求,種類繁多的移動應(yīng)用在移動云平臺中被開發(fā)。但與此同時,移動云計算也有底層設(shè)備電池容量、計算能力、存儲容量有限,依賴關(guān)系不固定以及網(wǎng)絡(luò)不可靠等問題。這些問題導(dǎo)致了移動云平臺中應(yīng)用程序容易發(fā)生故障。因此,移動云為用戶提供云服務(wù)時,需要考慮以下問題。

      1)移動設(shè)備對資源的獲取。云資源遍布全世界并為用戶提供各種不同的服務(wù)。但移動云需要在移動設(shè)備所在區(qū)域或臨近區(qū)域為用戶提供可靠云服務(wù)。這將要求移動云能夠管理海量位置信息,并提供精準(zhǔn)的定位服務(wù)。特別是對室內(nèi)地圖進行現(xiàn)場調(diào)查并構(gòu)圖需要耗費大量資源。目前,Dong等[22]嘗試了收集移動用戶拍攝的照片建立3D點云,并由此在云端服務(wù)器上構(gòu)建室內(nèi)地圖模型。此后,Dong等[23]進一步利用基于密度的沖突檢測技術(shù)對室內(nèi)地圖模型進行改進,提高了其中障礙物位置的信息完善,并且采用群智建立初始階段的定位。

      2)移動設(shè)備與移動云平臺的連接。移動云計算允許將計算密集型應(yīng)用程序的執(zhí)行從資源約束的移動設(shè)備卸載到更強大的計算資源,即遠(yuǎn)程云端服務(wù)器或云端。但移動設(shè)備無法檢測到遠(yuǎn)程云端服務(wù)器或云端是否出現(xiàn)故障,并且遠(yuǎn)程云計算資源的連接也可能因為移動設(shè)備電池能量不足或網(wǎng)絡(luò)斷開而突然丟失。此外,移動設(shè)備的網(wǎng)絡(luò)地址也可能隨時間推移而改變。這些因素均會導(dǎo)致用戶與移動云平臺的連接出現(xiàn)故障,也就是說,會出現(xiàn)網(wǎng)絡(luò)不可靠以及依賴關(guān)系不固定問題。目前,Chen等[24]結(jié)合移動云計算和情感計算提供個性化的情感感知服務(wù),提出了一種針對于資源密集型移動應(yīng)用的感知管理新模型。這種模型能夠在動態(tài)的網(wǎng)絡(luò)環(huán)境下,通過實現(xiàn)移動設(shè)備與云端服務(wù)器之間資源的穩(wěn)定連接來優(yōu)化用戶體驗。Saad等[25]針對在網(wǎng)絡(luò)和移動云平臺2個層次上,始終保持移動用戶擁有良好的網(wǎng)絡(luò)連接以及應(yīng)用程序能夠高性能執(zhí)行的問題進行了深入調(diào)查和研究。他們提出采用預(yù)測用戶需求,盡量減少不必要的切換和服務(wù)遷移,以保證移動設(shè)備與移動云平臺的穩(wěn)定連接。

      3)移動云提供遠(yuǎn)程資源的特性。移動云計算通過在遠(yuǎn)程云服務(wù)器上執(zhí)行移動應(yīng)用程序的方式來最大限度地減少執(zhí)行時間。當(dāng)移動云提供遠(yuǎn)程資源時,需要并行化處理;在應(yīng)用程序部件遠(yuǎn)程執(zhí)行之前,還需要將這些部件先遷移到云平臺中。這種資源遷移對于交互式和實時應(yīng)用程序來說是非常有效的減少響應(yīng)時間的手段。然而,這些操作將產(chǎn)生遷移的開銷。并且在處理應(yīng)用程序卸載或節(jié)能問題時,也需要考慮遷移的開銷。為此,Islam等[26]提出了一種用于異構(gòu)移動云計算系統(tǒng)的遺傳遷移算法。結(jié)合云服務(wù)器的負(fù)載均衡和用戶移動性因素為移動虛擬機選擇最佳云服務(wù)器。這種算法能夠最大限度地減少虛擬機遷移開銷,以此達到減少任務(wù)執(zhí)行時間的目的。

      4)移動終端設(shè)備的電池能耗。由于移動終端設(shè)備的電池容量有限,移動應(yīng)用與移動終端設(shè)備電量的矛盾愈發(fā)明顯。移動應(yīng)用的耗電量已成為良好用戶體驗的阻礙。雖然研究者們不斷地研發(fā)更大容量的電池,但采用控制技術(shù)節(jié)省應(yīng)用的能量消耗,減少因電池不足而造成的故障,才是用戶和服務(wù)提供商更加期望的雙贏局面。當(dāng)前,Tang等[27]提出了一種適用于移動設(shè)備功耗調(diào)度的實時閉環(huán)控制系統(tǒng)的方案,其能夠在不需要任何特定的功率傳感器的情況下,使處于穩(wěn)定狀態(tài)下的多媒體系統(tǒng)的能耗盡可能低。此外,Zhang等[28]將協(xié)同任務(wù)執(zhí)行制定為約束最短路徑問題,針對具有線性拓?fù)浣Y(jié)構(gòu)的移動應(yīng)用在移動云中遷移的情況,他們提出采用動態(tài)規(guī)劃的方式進行任務(wù)遷移,這種方案根據(jù)通信信道的狀態(tài)以及任務(wù)的計算量和數(shù)據(jù)量來協(xié)同制定遷移方式,不僅能夠保障應(yīng)用執(zhí)行時間限制,而且可以最小化移動終端的電池能耗,延長電池壽命。

      5)移動云資源的安全性與用戶隱私。移動云為用戶提供遠(yuǎn)程服務(wù)時,需要保證資源的安全性。并且這些遠(yuǎn)程資源可能同時被多個用戶使用,移動云還需要提供用戶的隱私保護,例如用戶身份信息、興趣愛好、地理位置等。近年來,Thayananthan等[29]提出了在安全大數(shù)據(jù)環(huán)境中通過量子加密技術(shù)對數(shù)據(jù)進行加密的方案;Fujiwara等[30]用量子密鑰對以太網(wǎng)的數(shù)據(jù)流進行了加密,并提出量子密鑰應(yīng)該存儲在智能卡中以實現(xiàn)移動用戶采用量子加密技術(shù)進行通信;Han等[31]提出基于量子鍵和距離HKQ的安全認(rèn)證協(xié)議,通過近場通信技術(shù)將量子密鑰傳輸?shù)娇煽康囊苿佑脩舭踩鎯^(qū)域,使得移動用戶可以通過量子密鑰訪問移動云平臺中的數(shù)據(jù),以實現(xiàn)對移動用戶數(shù)據(jù)和隱私的保護。

      由此可見,普通Web云與移動云的服務(wù)質(zhì)量(quality of service,QoS)度量指標(biāo)有所差異,如圖3所示。

      圖3 QoS度量指標(biāo)圖Fig.3 Metrics of QoS

      由于普通Web云與移動云的服務(wù)質(zhì)量評價指標(biāo)不同,移動云中的容錯資源調(diào)度策略也所區(qū)別于普通Web云。其不僅需要有效管理云系統(tǒng)中的軟、硬件,還需要考慮異構(gòu)數(shù)據(jù)中心之間服務(wù)資源的相互調(diào)度協(xié)調(diào)問題。因此,移動云中的容錯問題值得廣泛關(guān)注。

      3.2 移動云中的容錯資源調(diào)度

      隨著移動互聯(lián)網(wǎng)和便攜式設(shè)備如智能手機,平板電腦以及可穿戴式智能設(shè)備的飛速發(fā)展,越來越多的云服務(wù)開始由移動云計算系統(tǒng)提供給用戶[32-33]。移動應(yīng)用也開始向醫(yī)療、教育、市政建設(shè)等領(lǐng)域發(fā)展。但移動云服務(wù)中故障仍是客觀存在的,容錯問題不容小覷。而移動云計算中存在多種故障類型,大致可以分為網(wǎng)絡(luò)故障,物理故障,任務(wù)執(zhí)行過程中的故障以及移動云服務(wù)到期故障等[34-35]。

      如今,移動云計算的資源調(diào)度主要研究領(lǐng)域是通過更好的應(yīng)用程序分析和基于多個因素的更準(zhǔn)確的卸載決策,以減少移動設(shè)備的能耗和改善用戶體驗。但在大多數(shù)情況下,均未充分考慮云端資源使用問題。EMCO[36]是一個移動云計算(mobile cloud computing, MCC)框架,F(xiàn)lores等在設(shè)計它的時候考慮到了云資源的使用,使之能夠從系統(tǒng)用戶收集有關(guān)卸載過程的詳細(xì)信息。EMCC框架還包含云中的自動縮放機制,可以監(jiān)視系統(tǒng)狀態(tài)并在必要時水平放大。它還提供了一個能存儲先前計算結(jié)果的緩存空間,并可以減少執(zhí)行時間和提供容錯能力。EMCO是移動云中考慮了可擴展性和多租戶的第一個資源調(diào)度解決方案,其能夠確保占用較低資源以及獲得高QoS。但是,本文沒有詳細(xì)討論資源使用優(yōu)化問題。而Nawrocki[37]提出的一種移動云環(huán)境中的新架構(gòu),即多用戶共享一個虛擬機。這種策略是通過啟用多租戶來減少對資源的需求以及保證較低的成本。

      由于移動云的各類接入網(wǎng)絡(luò)并不能保證其完全安全。因此,在非安全環(huán)境中服務(wù)的應(yīng)用,極其容易發(fā)生大規(guī)模的故障或損害。這將導(dǎo)致網(wǎng)絡(luò)中多個節(jié)點同時發(fā)生故障且會將網(wǎng)絡(luò)劃分為不相交的分區(qū)。針對于整體網(wǎng)絡(luò)的連通性問題,Lee等[38]通過建立雙連接的節(jié)點分區(qū)拓?fù)?,并采用具有確定容錯能力的連通性恢復(fù)(CRAFT)算法,計算出在故障發(fā)生節(jié)點的附近形成最大的內(nèi)部簡單循環(huán)。然后再部署中繼節(jié)點通過2個非重疊路徑將每個外部節(jié)點連接到循環(huán)中。這種方案不僅能夠最小化分區(qū)間距及使用最少數(shù)量的中繼節(jié)點,而且解決了網(wǎng)絡(luò)的連通性問題。

      在移動網(wǎng)絡(luò)環(huán)境中存在拓?fù)浣Y(jié)構(gòu)具動態(tài)性、穩(wěn)定存儲空間有限性及缺少固定基礎(chǔ)設(shè)施等問題,為了解決這些問題,Mansouri等[39]采用一種自適應(yīng),協(xié)調(diào)和非阻塞的檢驗點策略,通過保持進程間的確切依賴關(guān)系和對正常消息捎帶檢驗點序列號的方式,將無用檢驗點的數(shù)量減少到最低,并且能夠減少控制信息所需的開銷。

      由于移動設(shè)備的狀態(tài)信息是動態(tài)變化的,倘若將移動設(shè)備視作移動云中的資源,則這種資源被認(rèn)定為不穩(wěn)定的。因此,Park等[40]提出了一種基于馬爾科夫鏈模型的監(jiān)測模型,該模型分析和預(yù)測了資源狀態(tài)。隨著提出的監(jiān)控技術(shù)和狀態(tài)預(yù)測,移動云系統(tǒng)將能夠更好地抵御由移動設(shè)備的波動引起的故障問題。該技術(shù)通過對過去的狀態(tài)模式進行建模,從而對移動設(shè)備的未來狀態(tài)進行預(yù)測來減少移動設(shè)備的波動性,有效提高了系統(tǒng)的可靠性。

      移動云計算的廣泛應(yīng)用使得許多敏感數(shù)據(jù)需要通過移動互聯(lián)網(wǎng)傳輸,重要數(shù)據(jù)的加密和移動用戶的隱私問題已經(jīng)成為移動互聯(lián)網(wǎng)應(yīng)用中的重要挑戰(zhàn)。然而,在移動云服務(wù)中不僅會遭受普通Web云中的安全威脅,還會因為安全軟件功能不完備等原因面臨諸多專門針對移動終端的安全威脅,比如惡意代碼會造成信息被竊取、使用不安全的接入點接入互聯(lián)網(wǎng)等。特別是在Android平臺上,移動惡意軟件嚴(yán)重威脅網(wǎng)絡(luò)安全和隱私。據(jù)此,Yuan等[41]設(shè)計了Android系統(tǒng)中基于機器學(xué)習(xí)的惡意軟件檢測方法,利用從Android應(yīng)用程序的靜態(tài)分析和動態(tài)分析中提取的超過200個特征來進行惡意軟件檢測,精確度高達96%。但對于數(shù)據(jù)傳輸中的安全和隱私的認(rèn)證問題,傳統(tǒng)模式是采用第三方安全監(jiān)控機制。這些機制依賴與復(fù)雜且資源密集的機制來確保其安全性,它們不適用于移動云計算,移動云環(huán)境下需要更輕量級的認(rèn)證方法。為此,Khan等[42]通過對現(xiàn)有的端口敲入認(rèn)證方法進行分類評估發(fā)現(xiàn),端口敲入方式為解決移動云中的安全問題提供了輕量級的應(yīng)用層解決方案。并且得益于它提供的一個合適的安全層,確保了SMD和MCC之間的真實通信。但由于端口敲擊過程的短距離分配容易受到中間人攻擊,遠(yuǎn)程分配涉及服務(wù)器節(jié)點上緩沖區(qū)管理的開銷。Khan等還提出可以采用MCC的虛擬化來解決這個問題。

      為了支持用戶移動性,提高用戶QoS以及共享云服務(wù),Choi等[43]提出在移動云計算中使用CAN進行容錯。該調(diào)度算法由惡意用戶過濾、云服務(wù)傳遞、QoS配置、設(shè)置副本和均衡負(fù)載組成,并以此對移動設(shè)備產(chǎn)生的故障進行容錯。不僅考慮了用戶QoS需求,而且還允許云環(huán)境中的各友好用戶之間共享云服務(wù),無需進一步認(rèn)證。此策略優(yōu)化了任務(wù)執(zhí)行時間和可靠性。

      移動應(yīng)用已經(jīng)向醫(yī)療領(lǐng)域邁開步伐,遠(yuǎn)程醫(yī)療保健系統(tǒng)(remote healthcare system, RHS)也正在被開發(fā)。醫(yī)療系統(tǒng)中的數(shù)據(jù)文件等資源常由多個醫(yī)護人員、病患以及政府機構(gòu)有權(quán)限的共享,這就發(fā)生了多個用戶同時訪問相同資源的情況。文獻[44-45]中提出使用基于檢驗點的多版本并發(fā)控制策略,以在應(yīng)用程序域中實現(xiàn)非阻塞進程同步。該策略能保證病患?xì)v史數(shù)據(jù)的一致有效性,以及在病患數(shù)據(jù)并發(fā)更新時創(chuàng)建新的檢驗點。這種策略不僅使得從檢驗點訪問數(shù)據(jù)時有較小的時間開銷,而且還有效提高了遠(yuǎn)程醫(yī)療保健系統(tǒng)的吞吐量及資源利用率。

      可穿戴式設(shè)備也已經(jīng)可用于監(jiān)控大眾的健康狀況,并將收集的健康數(shù)據(jù)上傳到云服務(wù)器進行共享,從而有助于電子醫(yī)療記錄(electronic healthcare records, EHR)系統(tǒng)的開發(fā)。然而,在廣泛應(yīng)用EHR系統(tǒng)之前,必須解決隱私和效率問題?;颊咦铌P(guān)心的是電子病歷的保密問題,但與此同時,可穿戴式設(shè)備通常在一定程度上受資源限制。據(jù)此,Liu等[46]提出了一種細(xì)粒度的EHR訪問控制方案。該方案允許EHR所有者可以在知道EHR數(shù)據(jù)和訪問策略之前生成離線密碼,以執(zhí)行大多數(shù)計算任務(wù)。此外,當(dāng)EHR數(shù)據(jù)和訪問策略變?yōu)橐阎獣r,在線階段可以快速組合最終密文。該方案還允許以線性秘密共享方案編碼的訪問策略,并通過廣泛的性能比較和仿真結(jié)果表明,Liu的解決方案非常適合移動云計算。

      3.3 未來可用于移動云中的檢驗點技術(shù)

      移動云計算系統(tǒng)資源管理是移動云計算技術(shù)領(lǐng)域的重要研究內(nèi)容。由于移動云中資源故障是客觀存在的,而有效的容錯資源管理不僅能提升資源的利用率,也能夠有效地保障系統(tǒng)的可靠性。因此,采用經(jīng)典的檢驗點技術(shù)對移動云進行容錯資源調(diào)度具有重要的理論意義和應(yīng)用價值。鑒于移動云環(huán)境受到移動設(shè)備存儲容量、通信帶寬、訪問延遲、服務(wù)可靠性及性價比等因素的限制,使得大多數(shù)用戶選擇同時使用多個云服務(wù)供應(yīng)商提供的服務(wù)。而當(dāng)前的多云協(xié)作體系架構(gòu),使得移動終端必須要維護多份數(shù)據(jù)副本,不但增加了移動終端的計算量和通信帶寬的成本,而且無法滿足多用戶數(shù)據(jù)在多云中同步和共享。

      移動云中基于檢驗點的容錯資源調(diào)度與普通Web云中的容錯資源調(diào)度有所不同。普通Web云計算中檢驗點技術(shù)大都采用虛擬機監(jiān)控器統(tǒng)一協(xié)調(diào)檢驗點之間的虛擬鏡像傳輸和檢驗點的恢復(fù)策略,對核心交換設(shè)備和虛擬機監(jiān)控器提出了巨大的通信瓶頸挑戰(zhàn)。而移動云計算環(huán)境下還需要考慮移動終端性能缺陷,以及在滿足用戶需求的同時還需提升云服務(wù)的可靠性水平和盡可能的節(jié)省能耗。據(jù)此,本文通過深入調(diào)查和分析移動云中容錯資源調(diào)度策略,提出了以下基于檢驗點技術(shù)未來可能的研究方法。

      1)采用人工勢場方法為基礎(chǔ)的布局定位模型表示方法。通過建立不同影響因素下的引力勢場和斥力勢場以及總勢場疊加模型,把檢驗點布局定位問題轉(zhuǎn)化為在人工勢場中搜索勢能極值位置問題。采用柵格模型對布局檢驗點的環(huán)境信息進行描述,得到布局檢驗點的狀態(tài)數(shù)字勢場模型,并設(shè)計基于改進連續(xù)智能算法的檢驗點布局定位算法。

      2)采用排隊論理論構(gòu)建適用于云計算容錯需要的檢驗點布局法,通過把云計算節(jié)點抽象為某一個特定的圖論結(jié)構(gòu),采用圖嵌入方法研究檢驗點虛擬鏡像傳輸?shù)耐ㄐ牌款i,并以此為基礎(chǔ)建立旨在優(yōu)化虛擬鏡像傳輸延時性能的目標(biāo)函數(shù),提出一種基于模擬退火算法的檢驗點布局算法。

      3)考慮到通信帶寬的影響,還可以采用端到端的虛擬機鏡像傳輸存儲,對檢驗點進行局部調(diào)度,減小訪問延遲。并通過對擁塞度、傳輸時延等參數(shù)的權(quán)重調(diào)整,實現(xiàn)基于檢驗點技術(shù)的彈性可靠服務(wù)。

      4 結(jié) 論

      在當(dāng)今的學(xué)術(shù)界和工業(yè)界中,已有不少國內(nèi)外專家針對基于檢驗點的移動云容錯資源調(diào)度問題進行研究并取得了大量研究成果。本文中,首先針對云環(huán)境下任務(wù)執(zhí)行過程中發(fā)生故障的不可避免性和不可預(yù)測性,重點討論了基于不同檢驗點技術(shù)的容錯資源調(diào)度方法。假設(shè)故障概率服從泊松分布的檢驗點部署方法,雖有一定的動態(tài)適應(yīng)能力,但并不能很好地應(yīng)用在實時動態(tài)系統(tǒng)中。無預(yù)設(shè)故障概率分布情況下的檢驗點部署方法是針對不同的系統(tǒng)資源,自適應(yīng)地進行檢驗點部署,這類檢驗點布局方法,能夠有效提高資源利用率和減少任務(wù)執(zhí)行時間。由于在移動云環(huán)境中需要考慮底層設(shè)備的局限性、智能均衡負(fù)載以及降低管理成本問題。因此,本文在最后指出了未來可能的研究方法:可以采用人工勢場方法為基礎(chǔ)并結(jié)合柵格模型對檢驗點部署方式進行改進;可以采用排隊理論為基礎(chǔ)結(jié)合模擬退火算法進行檢驗點布局;還可以采用端到端的虛擬機鏡像存儲方式對檢驗點進行局部調(diào)度,以實現(xiàn)基于檢驗點技術(shù)的彈性可靠服務(wù)。

      猜你喜歡
      調(diào)度檢驗故障
      序貫Lq似然比型檢驗
      2021年《理化檢驗-化學(xué)分冊》征訂啟事
      《調(diào)度集中系統(tǒng)(CTC)/列車調(diào)度指揮系統(tǒng)(TDCS)維護手冊》正式出版
      故障一點通
      一種基于負(fù)載均衡的Kubernetes調(diào)度改進算法
      虛擬機實時遷移調(diào)度算法
      對起重機“制動下滑量”相關(guān)檢驗要求的探討
      關(guān)于鍋爐檢驗的探討
      奔馳R320車ABS、ESP故障燈異常點亮
      故障一點通
      新巴尔虎左旗| 十堰市| 临西县| 剑阁县| 肥城市| 明溪县| 高安市| 儋州市| 泌阳县| 天气| 涿州市| 来凤县| 定南县| 长沙县| 嘉鱼县| 望江县| 长丰县| 宜阳县| 文成县| 临沭县| 玛纳斯县| 睢宁县| 湘西| 永仁县| 德化县| 宁波市| 乌鲁木齐县| 大连市| 措美县| 商河县| 息烽县| 松原市| 东山县| 盐津县| 陕西省| 佛学| 子长县| 江阴市| 嘉峪关市| 吉木乃县| 舞钢市|