林 慧
湛江港(集團(tuán))股份有限公司,廣東 湛江 524019
?
云存儲(chǔ)技術(shù)在網(wǎng)盤聚合系統(tǒng)中的應(yīng)用研究
林 慧*
湛江港(集團(tuán))股份有限公司,廣東 湛江 524019
本文的創(chuàng)新點(diǎn)在于對(duì)傳統(tǒng)IDA算法作了改進(jìn),并將其成功的應(yīng)用于網(wǎng)盤聚合系統(tǒng)中。該系統(tǒng)對(duì)于提高網(wǎng)盤的服務(wù)質(zhì)量具有效果顯著。實(shí)際上企業(yè)同樣存在網(wǎng)盤用戶的問題,并且更加注重?cái)?shù)據(jù)的安全性和可用性。隨著互聯(lián)網(wǎng)的快速發(fā)展,傳統(tǒng)的網(wǎng)盤技術(shù)漸漸不能滿足用戶的需求,云存儲(chǔ)技術(shù)加入到網(wǎng)盤服務(wù)中來為網(wǎng)盤行業(yè)帶來了新的革命。
云存儲(chǔ)技術(shù);IDA算法;網(wǎng)盤聚合系統(tǒng)
企業(yè)存儲(chǔ)系統(tǒng)的集成將增加企業(yè)使用云存儲(chǔ)的便利性,可用性和安全性,加快企業(yè)接受、使用云存儲(chǔ)的趨勢(shì),通過調(diào)查發(fā)現(xiàn),在網(wǎng)盤的使用過程中往往存在著威脅數(shù)據(jù)安全性和可用性的種種隱患。首先是用戶無法防止提供商泄漏數(shù)據(jù)。其次,所有的網(wǎng)盤提供商都無法保證完全滿足7X24的數(shù)據(jù)訪問要求,一旦網(wǎng)盤提供商因?yàn)槟撤N原因?qū)е聲簳r(shí)無法提供服務(wù),用戶就無法進(jìn)行數(shù)據(jù)訪問。再次,一旦網(wǎng)盤提供商因?yàn)槟撤N原因?qū)е聰?shù)據(jù)丟失而無法全部恢復(fù)時(shí),用戶就永久失去了自己的部分?jǐn)?shù)據(jù)。最后,網(wǎng)盤使用過程中往往還出現(xiàn)網(wǎng)盤提供商綁架用戶的情況。一旦用戶的數(shù)據(jù)大到一定的程度,因?yàn)閿?shù)據(jù)遷移的成本高昂,用戶很難再換用其它的網(wǎng)盤。此時(shí)網(wǎng)盤提供商就有可能會(huì)提出一些苛刻的要求,如收費(fèi)或漲價(jià)。
隨著云時(shí)代的到來,云技術(shù)迅猛發(fā)展,云服務(wù)快速崛起。我們要先了解云服務(wù)的三個(gè)要素。一是成本較低的客戶端。在云的網(wǎng)絡(luò)中,客戶端可以去掉了運(yùn)算單元、存儲(chǔ)單元等主要部件,更極端的客戶端可以只剩下一套輸入、輸出設(shè)備和網(wǎng)絡(luò)接口。這樣,客戶端的成本自然就小得多了。二是可信任并且功能強(qiáng)大的云端,它也是云服務(wù)的核心。云端一般擁有強(qiáng)大的服務(wù)器群,能同時(shí)為每個(gè)客戶端提供個(gè)性化的軟件平臺(tái)、運(yùn)算處理和存儲(chǔ)單元,并將最終的輸出結(jié)果發(fā)送到客戶端。三是高效、可靠的互聯(lián)網(wǎng)?;ヂ?lián)網(wǎng)是云服務(wù)的基礎(chǔ),離開了網(wǎng)絡(luò),也就沒有了云,更沒有云服務(wù)了。云服務(wù)的各種概念都是在這個(gè)基礎(chǔ)上,提供各種軟件服務(wù)、平臺(tái)服務(wù)或應(yīng)用服務(wù)。
云服務(wù)應(yīng)用云計(jì)算技術(shù),將客戶日常所需的各個(gè)行業(yè)的服務(wù)資源聚合起來,形成能全面覆蓋客戶各種需要的“云服務(wù)池”,使其可以通過各種渠道方便地訪問服務(wù)池中資源的服務(wù)。云服務(wù)實(shí)現(xiàn)了將簡單化的應(yīng)用終端和在服務(wù)器端提供的可靠服務(wù)結(jié)合起來,使我們能夠?qū)⒃驹赑C機(jī)上運(yùn)行的軟件、計(jì)算、存儲(chǔ)統(tǒng)統(tǒng)都搬移到服務(wù)器端(也就是云端)。
針對(duì)當(dāng)前網(wǎng)絡(luò)上網(wǎng)盤使用的種種弊端,一些公司研發(fā)了網(wǎng)盤聚合系統(tǒng)。網(wǎng)盤聚合系統(tǒng)實(shí)現(xiàn)了用“網(wǎng)盤聚合”軟件的客戶端替代各式各樣的網(wǎng)盤客戶端,起到統(tǒng)一入口的作用,對(duì)于用戶來說非常方便。企業(yè)用戶可以通過只允許“網(wǎng)盤聚合”軟件,不允許其它網(wǎng)盤客戶端的方法保證原始數(shù)據(jù)不會(huì)泄漏?!熬W(wǎng)盤聚合”服務(wù)器端提供用戶帳號(hào)申請(qǐng),用此帳號(hào)可以綁定多個(gè)網(wǎng)盤的用戶名/密碼,并可以指定用哪幾個(gè)網(wǎng)盤進(jìn)行數(shù)據(jù)同步?!熬W(wǎng)盤聚合”客戶端在上傳數(shù)據(jù)到指定的網(wǎng)盤之前,在本地對(duì)數(shù)據(jù)進(jìn)行加密分片,以保證數(shù)據(jù)本身已被加密,他人無法獲知加密算法及密鑰?!熬W(wǎng)盤聚合”即使有加密算法,因?yàn)槊荑€由用戶生成及保管,上傳的加密數(shù)據(jù)也不在“網(wǎng)盤聚合”的服務(wù)器端,從而無法獲取原始數(shù)據(jù)。只要進(jìn)行數(shù)據(jù)同步的幾個(gè)網(wǎng)盤中有一個(gè)網(wǎng)盤是可以訪問的,用戶就可以在任何時(shí)候進(jìn)行數(shù)據(jù)訪問。當(dāng)用戶需要把某個(gè)網(wǎng)盤的數(shù)據(jù)遷移到其它的網(wǎng)盤時(shí),用戶只需要在“網(wǎng)盤聚合”服務(wù)器端設(shè)置其它的網(wǎng)盤和這個(gè)網(wǎng)盤進(jìn)行數(shù)據(jù)同步,服務(wù)器端就會(huì)幫助用戶進(jìn)行離線數(shù)據(jù)同步,無需用戶自己在線遷移。
此外,用戶訪問云存儲(chǔ)資源時(shí)一般都需要輸入用戶名和密碼,在使用RestfulAPI時(shí)同樣如此。而這種方法一方面對(duì)用戶造成麻煩,另一方面不安全。OAuth是一個(gè)開放標(biāo)準(zhǔn),它允許用戶提供一個(gè)令牌,而不是用戶名和密碼來訪問他們存放在特定服務(wù)提供者那里的數(shù)據(jù)。每一個(gè)令牌授權(quán)某個(gè)網(wǎng)站在特定的時(shí)段內(nèi)訪問特定的資源。這樣,就實(shí)現(xiàn)了用戶授權(quán)第三方網(wǎng)站訪問他們存儲(chǔ)在另外的服務(wù)提供者上的信息,而不需要分享他們的訪問許可或他們數(shù)據(jù)的所有內(nèi)容。網(wǎng)盤聚合系統(tǒng)中API通過獲得用戶授權(quán)然后訪問資源,實(shí)現(xiàn)了密碼管理和傳輸?shù)陌踩浴.?dāng)前的主流云存儲(chǔ)提供商都提供OAuth支持,網(wǎng)盤聚合系統(tǒng)中進(jìn)行了OAuth集成并管理用戶授權(quán)信息。
(一)數(shù)據(jù)分片、存儲(chǔ)
為了提高分布式系統(tǒng)中信息傳輸?shù)陌踩院涂煽啃?,網(wǎng)盤聚合系統(tǒng)中使用了IDA算法對(duì)文件進(jìn)行處理后再傳輸、存儲(chǔ)。文件在傳輸前在客戶端通過IDA算法對(duì)文件進(jìn)行分片處理,對(duì)分片后的數(shù)據(jù)加密處理后發(fā)送到不同地理位置的網(wǎng)盤上。通過對(duì)數(shù)據(jù)的分片和加密傳輸,避免了因?yàn)閱蝹€(gè)的網(wǎng)盤服務(wù)商服務(wù)的中斷而導(dǎo)致用戶數(shù)據(jù)的丟失。即使單個(gè)網(wǎng)盤服務(wù)商的密碼被攻破,也不會(huì)導(dǎo)致數(shù)據(jù)的泄漏。
(二)數(shù)據(jù)聚合
用戶要取回原始文件時(shí),首先通過網(wǎng)盤聚合的客戶端軟件向網(wǎng)盤聚合云服務(wù)發(fā)出文件讀取請(qǐng)求,云端返回?cái)?shù)據(jù)分片的保存位置??蛻舳塑浖俑鶕?jù)云端返回的文件保存位置,從多個(gè)網(wǎng)盤中提取數(shù)據(jù)塊,返回給客戶端。最后,客戶端應(yīng)用IDA算法把數(shù)據(jù)重新恢復(fù)成原始文件。在數(shù)據(jù)提取的過程中,即使有部分?jǐn)?shù)據(jù)丟失,由于IDA算法對(duì)數(shù)據(jù)進(jìn)行了冗余分片,只要n個(gè)數(shù)據(jù)分片中能有m個(gè)正確取回,就可以恢復(fù)原始數(shù)據(jù)了。此系統(tǒng)的使用大大提高了數(shù)據(jù)存儲(chǔ)在互聯(lián)網(wǎng)上的安全性。由于選取n,m時(shí)可以使n/m接近于1,所以根據(jù)IDA算法分片后的數(shù)據(jù)較之分片前數(shù)據(jù)容量比率不大,比主從雙備份節(jié)省空間。
在網(wǎng)盤使用過程中為防止出現(xiàn)數(shù)據(jù)泄露、時(shí)常無法提供服務(wù)以及網(wǎng)盤服務(wù)商綁架用戶等問題,設(shè)計(jì)了網(wǎng)盤聚合系統(tǒng)。該系統(tǒng)采用了IDA算法實(shí)現(xiàn)用戶文件的冗余分片,分片后的數(shù)據(jù)加密后傳輸至多個(gè)網(wǎng)盤上存儲(chǔ),用戶取數(shù)據(jù)的時(shí)候通過該系統(tǒng)就可找到相應(yīng)的網(wǎng)盤取回?cái)?shù)據(jù)分片。只要取回分片的個(gè)數(shù)滿足IDA算法的要求,即可重組數(shù)據(jù)。文章分析與研究了IDA算法,并對(duì)傳統(tǒng)的IDA算法做了改進(jìn),將其成功的應(yīng)用于網(wǎng)盤聚合系統(tǒng)中。實(shí)踐表明,該系統(tǒng)可明顯提高網(wǎng)盤使用過程中用戶數(shù)據(jù)的安全性和可用性。
[1]許麗婷,李建林,謝文偉.IDA算法在網(wǎng)盤聚合系統(tǒng)中的應(yīng)用研究[D].南京信息職業(yè)技術(shù)學(xué)院,2013.
[2]辛欣.一體化網(wǎng)絡(luò)問政平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2013.
林慧(1987-),女,廣東湛江人,本科,湛江港(集團(tuán))股份有限公司,硬件維護(hù)員,研究方向:計(jì)算機(jī)信息化。
TP
A
1006-0049-(2017)15-0265-01