王偉
摘要:隨著現(xiàn)代的計(jì)算機(jī)技術(shù)越來(lái)越先進(jìn),云盤(pán)的技術(shù)已經(jīng)滲透到很多人的工作中,本篇文章主要來(lái)探討云盤(pán)技術(shù)、云盤(pán)的儲(chǔ)存原理以及云盤(pán)存儲(chǔ)空間劃分原理。
關(guān)鍵詞:云盤(pán);存儲(chǔ)容量;MD5;算法
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)10-0218-01
現(xiàn)代的教育手段越來(lái)越先進(jìn),云盤(pán)的技術(shù)已經(jīng)滲透到我的教學(xué)模式中,突然發(fā)現(xiàn),我只是一個(gè)普通用戶,云盤(pán)空間竟然達(dá)到了37.4TB(如圖1所示)。
截止2014年1月,官方統(tǒng)計(jì)此類云盤(pán)的用戶數(shù)量就達(dá)到1.6億,平均每人分配30TB的空間,所有的存儲(chǔ)空間將為48億TB的容量,這就是一個(gè)天文數(shù)字。
實(shí)際上,云盤(pán)是否真的給了用戶這么大的空間呢?我覺(jué)得空間存儲(chǔ)問(wèn)題上存在著一定的貓膩。
1)假如一個(gè)服務(wù)器有100T的存儲(chǔ)空間,每個(gè)用戶許諾分配10G的存儲(chǔ)空間,可以分配10000個(gè)人使用,但是實(shí)際上并不是每個(gè)人都可以用完這10G的存儲(chǔ)空間,有些人只用了不到1G,所以云盤(pán)供應(yīng)商可以將存儲(chǔ)空間分配給100000個(gè)人使用,每人只分配1G,這樣就可以多分配10倍或者更多倍的用戶使用。
2)如果有人使用超過(guò)1G空間怎么辦呢,很簡(jiǎn)單,云盤(pán)供應(yīng)商就可以只分配99000個(gè)用戶使用,1人1G的存儲(chǔ)空間,剩下的1000G空間作為應(yīng)急存儲(chǔ)空間,可以同時(shí)保證超過(guò)一百人使用到10G存儲(chǔ)空間。
3)如果每個(gè)服務(wù)器都預(yù)留出1000G的空間,如果有超過(guò)10000個(gè)服務(wù)器,也將浪費(fèi)10000T的存儲(chǔ)空間,實(shí)際上并不是這樣,可以利用現(xiàn)在的磁盤(pán)陣列技術(shù),讓服務(wù)器之間實(shí)現(xiàn)存儲(chǔ)空間共享(也就是現(xiàn)在的集群存儲(chǔ)技術(shù));雖然我的云盤(pán)存儲(chǔ)空間為37.4TB,我經(jīng)常使用云盤(pán),實(shí)際上我才用了58.1GB(見(jiàn)圖一),使用率僅為0.1%;而更多的人可能只用了10G左右,這樣推算,存儲(chǔ)空間只需要160萬(wàn)TB的容量,空間分配只需要之前數(shù)量的1/3000。云盤(pán)供應(yīng)商就可以隨意給你使用空間的數(shù)值,那個(gè)數(shù)字只是一個(gè)數(shù)字(虛數(shù)值),你實(shí)際使用的空間是多少,服務(wù)器會(huì)給你畫(huà)出相應(yīng)的使用空間,其余的大部分未使用的空間,都是大家(1.6億)的共享空間。
4)如果到了后期,大多數(shù)的用戶都將利用云存儲(chǔ)提供的存儲(chǔ)空間,都將分配給自己的空間使用完全,以上的方法就不可用了,云盤(pán)供應(yīng)商就采取了另一個(gè)新技術(shù)——數(shù)據(jù)存儲(chǔ)索引。很多網(wǎng)絡(luò)上的文件,特別是大型文件,比如電影、游戲,基本上是重復(fù)使用的,張三上傳了電影《霍比特人3》,李四也在云盤(pán)上上傳了《霍比特人3》,還有很多人也同時(shí)上傳了《霍比特人3》。本文件占用空間5G,10000個(gè)人上傳,就占用了50TB的空間,其實(shí)這些文件都是相同的。云盤(pán)供應(yīng)商利用了這一特點(diǎn),就做了一個(gè)文件索引,直接鏈接到某一服務(wù)器的文件上即可,類似于WINDOWS操作系統(tǒng)中的快捷方式,這樣就可以節(jié)省了49995GB的空間。
5)有的用戶喜歡更改一下文件名稱,同樣還是一部電影
《霍比特人3》,張三文件名叫《指環(huán)王續(xù)集》,李四文件名叫《3D大電影》等等,怎么辦?云盤(pán)供應(yīng)商就采取了另一個(gè)新技術(shù)—MD5校檢。MD5 是Message Digest Algorithm的第五個(gè)版本,由麻省理工學(xué)院的計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室和RSA數(shù)據(jù)安全有限公司發(fā)明,MD5的作用是對(duì)一段字節(jié)串產(chǎn)生指紋,可以防止被“篡改”。這個(gè)碼有128位那么長(zhǎng),包括了26個(gè)英文字母和10個(gè)數(shù)字的任意組合,遇到重復(fù)的概率為36128分之一,大約為1.61 * 10 199分之一,通常被認(rèn)為是唯一的。對(duì)MD5算法簡(jiǎn)要的敘述為:以512位來(lái)分組處理信息,且每一個(gè)組又被分為16個(gè)32位的子分組,經(jīng)過(guò)處理后,算法輸出是四個(gè)32位的分組組成,將這四個(gè)32位的分組級(jí)聯(lián)后才會(huì)生成一個(gè)128位的散列值。
算法流程如圖2所示。
所以無(wú)論文件名是否相同,只要MD5返回值相同,就可以斷定是相同文件,就可以采取數(shù)據(jù)存儲(chǔ)索引的辦法,而且,云盤(pán)供應(yīng)商還為此提出了一個(gè)新的技術(shù)——秒傳!
想必大家看過(guò)這些,就了解了云盤(pán)的存儲(chǔ)空間使用原理和云盤(pán)供應(yīng)商為什么敢給你分配那么多存儲(chǔ)空間了吧。
參考文獻(xiàn):
[1] 百度百科[EB/OL].http://baike.baidu.com/ .
[2] How To Find Weak Input Differences For MD5 Collision Attacks International Association for Cryptologic Research 2009年 [引用日期2012-10-28][Z].
[3] 韓同欣,丁建元. 基于云盤(pán)技術(shù)的文檔數(shù)據(jù)共享系統(tǒng)設(shè)計(jì) [J].中國(guó)科技信息, 2014(21).
[4] 邵珠光. 社區(qū)電子病歷關(guān)鍵加密技術(shù)的研究[D]. 天津:天津醫(yī)科大學(xué),2012.