趙旭
摘要:云存儲:一種大數(shù)據(jù)時代下的產(chǎn)物,為海量數(shù)據(jù)提供了有效存儲和計算能力。隨著云存儲技術(shù)的不斷發(fā)展和成熟,在校園內(nèi)部部署云存儲成為各高校的一項建設(shè)任務(wù)。從實際需求出發(fā),針對私有云的特點,從硬件規(guī)劃部署到軟件平臺開發(fā)層進行整體規(guī)劃,提供一個開放、安全、高效、穩(wěn)定和界面新穎美觀的數(shù)字化教學(xué)資源管理平臺。同時,對所涉及的相關(guān)應(yīng)用技術(shù)進行介紹和研究。
關(guān)鍵詞:云存儲;云內(nèi)部通信;雙機熱備;教學(xué)資源管理
中圖分類號:TP333 文獻標(biāo)識碼:A 文章編號:1007-9416(2017)09-0032-03
1 緒論
近些年隨著云計算技術(shù)的興起,部分高校率先進行了云計算方面的建設(shè)嘗試,提出在云計算項目上將云主機部署、云操作桌面平臺開發(fā)以及云存儲架構(gòu)設(shè)計三種技術(shù)結(jié)合,力求解決學(xué)校在傳統(tǒng)的集中式管理與集中式存儲的資源組織模式下信息基礎(chǔ)設(shè)施建設(shè)滯后、優(yōu)質(zhì)數(shù)字化資源短缺、服務(wù)器資源短缺等問題。
1.1 背景與意義
隨著高等院校教學(xué)信息化與數(shù)字化建設(shè)的完善與發(fā)展,高等院校的信息化與數(shù)字化建設(shè)一般以數(shù)字化的資源管理為主要目的,而信息化的服務(wù)保障為輔助手段,同時,由于數(shù)字化和信息化建設(shè)是需要不斷的管理與完善,其建設(shè)周期較為漫長,只有通過長時間的積累與沉淀,才能逐漸形成一個具有數(shù)據(jù)資源量大、內(nèi)容豐富的教學(xué)資源庫。
目前,高等院校數(shù)字化教學(xué)資源的種類與來源較為繁瑣與復(fù)雜,其資源文件類型包括文本、圖形圖像、動畫、聲音和視頻等類型;而資源內(nèi)容更為繁雜,有學(xué)生的學(xué)習(xí)資料和教師的教學(xué)資料,還有校管理和行政人員的辦公資料等,還涉及到社會所需要的一些公眾資源以及大量的圖書館藏書所轉(zhuǎn)換而成的數(shù)字化圖書資源等。如何能有效的將這些數(shù)字化教學(xué)資源收集、存儲、管理并應(yīng)用,實現(xiàn)教學(xué)資源的共享,提高精品課程、示范特色專業(yè)等優(yōu)秀教學(xué)成果的輻射作用,這是在學(xué)校內(nèi)部信息化建設(shè)中首要且又艱巨的任務(wù)。 因此,需要架設(shè)一個開放式共享、數(shù)字化教學(xué)資源管理清晰易用且安全等級高;同時,還能提高數(shù)字化教學(xué)資源的錄用量和使用率。
1.2 國內(nèi)外研究現(xiàn)狀
云計算(Cloud Computing)作為一個全新的概念被明確提出,而云存儲則是在云計算發(fā)展的過程成中所必須解決的一個核心問題——存儲問題,可以說云存儲是在云計算的基礎(chǔ)上發(fā)展而來的。
云存儲技術(shù)得到飛速發(fā)展,目前在國外有一些較為成熟的云存儲產(chǎn)品為用戶開放,如: Dropbox作為一家創(chuàng)業(yè)公司,在2007年就開始提供網(wǎng)絡(luò)云存儲同步服務(wù),到目前已經(jīng)有1.75億用戶;Google Drive是谷歌公司推出的一項在線云存儲服務(wù),Google Drive目前的活躍用戶已經(jīng)達(dá)到了2.5億人;較為典型的還有:Amazon 公司的 Amazon Cloud Drive,提供廉價且大容量的存儲空間,還具備有很強的安全性及可靠性。
國外云存儲成功的同時也帶動了國內(nèi)網(wǎng)絡(luò)公司對云存儲的關(guān)注以及建設(shè),華為云服務(wù)作為中國網(wǎng)絡(luò)公司領(lǐng)路人,雄厚的資金實力和完備的硬件支持是其挺近云存儲領(lǐng)域的根本,在云存儲技術(shù)領(lǐng)域中華為具備先天優(yōu)勢;360云盤以“安全”和“免費”為核心,市場占有量不斷在提升;還有在國內(nèi)比較知名的百度云盤,百度雖然做云存儲時間較短,但是其憑借著強大的經(jīng)濟實力也在不斷的完善和改進。阿里云存儲服務(wù)對外提供的海量的云存儲服務(wù)。
但是,對于在高等院校在教育領(lǐng)域中運用云計算和云存儲的案例還非常有限,目前,國內(nèi)高等院校運用云計算和云存儲建設(shè)的項目中較為典型的案例:
(1)中國科技大學(xué)的“瀚海星云”校園云服務(wù)平臺:由4臺2路PC服務(wù)器和48TB存儲服務(wù)器組成,主要用于定制科學(xué)計算平臺和平行計算等。同時,也在逐步對校內(nèi)師生提供云存儲等相關(guān)服務(wù)。
(2)臺灣大學(xué)的臺大“筋斗云”:整個平臺由大型計算機和高級網(wǎng)絡(luò)基礎(chǔ)設(shè)施組成,以 IBM BladerCenter服務(wù)器為基礎(chǔ)運作平臺,以普樺科技的容錯磁盤陣列產(chǎn)品為存儲服務(wù)節(jié)點,到目前為止項目已經(jīng)完成第一期的基礎(chǔ)環(huán)境建設(shè)與部署,后期會逐步對校內(nèi)師生提供桌面服務(wù)、存儲資源共享平臺等。
經(jīng)過調(diào)查和分析,高等院校在教育領(lǐng)域中運用云計算和云存儲的案例比較有限,相關(guān)文獻資料占據(jù)比例也比較少,說明教育領(lǐng)域運用云計算和云存儲還處于起步和探索階段。
1.3 研究的主要內(nèi)容
具體的研究工作主要有以下幾方面內(nèi)容:
(1)從云計算技術(shù)到云存儲架構(gòu)的領(lǐng)域入手,通過對國內(nèi)外關(guān)于云計算技術(shù)以及云存儲技術(shù)的相關(guān)文獻和書籍進行詳細(xì)的調(diào)查和研究,分析在國內(nèi)外高等院校中采用云存儲技術(shù)架設(shè)數(shù)字化教學(xué)資源管理平臺的應(yīng)用現(xiàn)狀和取得的成果;總結(jié)出云計算技術(shù)與云存儲系統(tǒng)的特性與特征,同時,還對課題所涉及到的一些相關(guān)技術(shù)進行研究。
(2)針對校園內(nèi)部用戶的實際需求,設(shè)計出了數(shù)字化教學(xué)資源平臺的主要功能模塊,為校內(nèi)用戶提供個人存儲、應(yīng)用和管理空間,同時,對群組共享和管理空間的權(quán)限功能進行設(shè)計和完善,使各功能間的邏輯更加合理。
(3)對校園內(nèi)部私有云存儲的架構(gòu)進行詳細(xì)的分析與設(shè)計,從技術(shù)上結(jié)合并利用云內(nèi)部通信簡單安全通信模型(SSCMIC)、雙機熱備全冗余技術(shù)等相關(guān)技術(shù)對云系統(tǒng)架構(gòu)進行改造,形成一種具有特色的云通信安全模型和級聯(lián)與備用雙向復(fù)制模式,解決資源管理平臺底層云存儲系統(tǒng)的可靠性、可擴展性以及并發(fā)性等架構(gòu)問題,從架構(gòu)的角度解決大規(guī)模數(shù)據(jù)的彈性存儲、海量多元數(shù)據(jù)的高效管理以及云存儲系統(tǒng)的安全等問題,提高云存儲系統(tǒng)的可靠性與安全性,建立一個高性能HDFS云存儲系統(tǒng),為數(shù)字化教學(xué)資源管理平臺的基礎(chǔ)設(shè)施提供服務(wù)。
(4)結(jié)合PHP、jQuery、HTML5等技術(shù)開發(fā)和實現(xiàn)數(shù)字化教學(xué)資源管理平臺的界面操作系統(tǒng)桌面化,提供一個在網(wǎng)頁上實現(xiàn)類似操作系統(tǒng)桌面和資源管理器界面的數(shù)字化教學(xué)資源管理平臺的WEB門戶網(wǎng)站。endprint
2 相關(guān)理論及技術(shù)
2.1 云計算與云存儲
(1)云計算:一種大數(shù)據(jù)時代下的產(chǎn)物,為海量數(shù)據(jù)提供了有效存儲和計算能力。云的特征主要有超大規(guī)模、虛擬化、提高設(shè)備計算能力、高可靠性、減少設(shè)備依賴性、高可擴展性、彈性服務(wù)和極其廉價等特性?!霸啤本哂邢喈?dāng)?shù)囊?guī)模,理論上可無限延伸與擴展,這些設(shè)備可以是高級的服務(wù)器,也可以是廉價的計算機,甚至可以是性能早已經(jīng)過時被淘汰的計算機或服務(wù)器,當(dāng)這些大量的服務(wù)器、計算機等計算設(shè)備被集中在一個虛擬資源池中,用戶可以在不同時間和地點隨時隨地就可以接入云端。
(2)云存儲:是在云計算基礎(chǔ)上延伸和發(fā)展出來的分布式文件存儲系統(tǒng), 云存儲某種角度上來說與云計算是有共性的,云存儲也具備“云”的超大規(guī)模、虛擬化、提高設(shè)備計算能力、高可靠性、減少設(shè)備依賴性、高可擴展性、彈性服務(wù)和極其廉價等特性;在規(guī)模劃分上也依然使用云計算相同的劃分方式;就連標(biāo)準(zhǔn)定義也和云計算一樣,到目前為止依然也沒有明確的標(biāo)準(zhǔn)定義。有人認(rèn)為云存儲是云計算的一個分支,但云存儲與云計算依然還是有所差異的,云存儲的服務(wù)模式改變了云計算服務(wù)模式對各層的單獨定義,而是將PaaS、IaaS和IaaS融合成一個有機的整體,形成一種新型的服務(wù)模式。同時,云計算側(cè)重計算處理,而云存儲則側(cè)重存儲,某種角度上來說,云存儲的發(fā)展將更好的為云計算提供服務(wù),云存儲幫助云計算解決了一個重要的核心問題——大容量資源存儲和處理的問題。
2.2 分布式文件系統(tǒng)
分布式文件系統(tǒng)是支撐云計算海量存儲環(huán)境的重要技術(shù)之一,分布式文件系統(tǒng)從20 世紀(jì)70 年代發(fā)展至今,其技術(shù)依然還在不斷被改進與完善。分布式文件系統(tǒng)通過協(xié)同多個節(jié)點消除單點故障和性能瓶頸,并在設(shè)計上滿足高可用、高性能、高負(fù)載等基本特性。
通過服務(wù)端搭建根目錄、分支節(jié)點等,客戶端依據(jù)約定的存取協(xié)議,獲取相對應(yīng)的操作權(quán)限,對相對應(yīng)的文件和目錄進行操作,其操作模式就像操作本地磁盤上文件和目錄一樣。
HDFS(Hadoop Distributed File System),是Hadoop的核心子項目,是整個Hadoop平臺數(shù)據(jù)存儲與訪問的基礎(chǔ)。
HDFS架構(gòu)采用主從模式,由名字節(jié)點(Namenode)和數(shù)據(jù)節(jié)點(Datanode)組成。名字節(jié)點為主點(Master),數(shù)據(jù)節(jié)點為從節(jié)點(Slave),在架構(gòu)上,名字節(jié)點是整個HDFS的核心,為了安全考慮通常名字節(jié)點有兩個,一個主名字節(jié)點和一個備用名字節(jié)點組成。而數(shù)據(jù)節(jié)點的規(guī)模理論上可無限擴展,并無特殊限制。
通過研究分布式文件云存儲系統(tǒng),以全面整合校內(nèi)數(shù)字化建設(shè)中整合的多種應(yīng)用服務(wù)器與計算機上的軟件與硬件資源,實現(xiàn)各應(yīng)用服務(wù)器與計算機上的優(yōu)質(zhì)資源共享為目標(biāo),將分布式文件系統(tǒng)儲存中的HDFS架構(gòu)進行修改,使其更適用于高等院校內(nèi)部云存儲資源管理平臺的建設(shè),為確立云存儲架構(gòu)和數(shù)字化教學(xué)資源管理平臺的建設(shè)與實現(xiàn)提供可靠且完善的架構(gòu)設(shè)計思路。由于數(shù)字化教學(xué)資源平臺的建設(shè)需要考慮較為長期建設(shè)周期,因此,數(shù)字化教學(xué)資源管理平臺擬采用HDFS作為底層系統(tǒng)架構(gòu)。
2.3 云內(nèi)部簡單安全通信模型(SSCMIC)
云內(nèi)部通信簡單安全通信模型(SSCMIC)是一種簡單而又輕型云內(nèi)部通信安全協(xié)議,部署在中小型云存儲系統(tǒng)上,無需特殊硬件支持,只需要將云內(nèi)部通信協(xié)議分別安裝在云存儲內(nèi)部的元數(shù)據(jù)服務(wù)器、應(yīng)用服務(wù)器和服務(wù)/存儲節(jié)點上就能實現(xiàn)云存儲內(nèi)部的安全通信。目前,國內(nèi)外對云內(nèi)部通信安全問題的解決方案走入兩個極端化,大型云存儲系統(tǒng)對云內(nèi)部的通信安全一般十分重視,其中,安全協(xié)議種類也異常繁雜,安全協(xié)議內(nèi)部構(gòu)造也較為復(fù)雜;而中小型云存儲則一般直接忽略了云內(nèi)部通信安全,因為中小型云存儲的安全協(xié)議無法使用大型云存儲的安全協(xié)議,但重新開發(fā)一種輕型的安全協(xié)議又是一個很大的課題,所以,目前中小型云存儲內(nèi)部通信安全還較為薄弱。
通過研究云內(nèi)部簡單安全通信模型(SSCMIC),并將其應(yīng)用和部署在云存儲系統(tǒng)上的各個云存儲節(jié)點與云存儲應(yīng)用服務(wù)器上,并與數(shù)字證書認(rèn)證技術(shù)相結(jié)合,從而保護用戶敏感信息和其他數(shù)據(jù),保障和提高數(shù)字化教學(xué)資源管理平臺的信息安全。
2.4 開發(fā)工具及語言
HTML5的本地存儲特性是讓基于HTML5開發(fā)的網(wǎng)頁APP擁有更短的啟動時間,更快的聯(lián)網(wǎng)速度。PHP(超文本預(yù)處理器)是一種通用開源腳本語言,源代碼完全公開,促進了PHP的快速發(fā)展。JQuery是繼Prototype之后又一個優(yōu)秀的JavaScript庫,jQuery也是開放源代碼并免費提供服務(wù)的, JQuery的語法設(shè)計可以使開發(fā)更加便捷。ExtJs開發(fā)工具最開始基于YUI技術(shù),并為開發(fā)者屏蔽了大量跨瀏覽器方面的處理, 是一個前端AJAX框架并與后臺技術(shù)無關(guān)的開發(fā)工具軟件。
通過研究將HTML5、PHP、JQuery等技術(shù)并與ExtJs開發(fā)工具結(jié)合使用,利用這些技術(shù)使數(shù)字化教學(xué)資源管理平臺的界面實現(xiàn)操作系統(tǒng)化(類似Windows、Linux的桌面和資源管理器界面)成為可能。實現(xiàn)數(shù)字化教學(xué)資源管理平臺的各種操作(包括文檔的存儲,編輯,媒體播放等)能夠像操作系統(tǒng)一樣簡潔方便,打造一個簡潔且美觀的WEB操作平臺界面。
2.5 雙機熱備全冗余技術(shù)
受早期技術(shù)和理念的影響,還無法實現(xiàn)存儲的計劃性停機與非計劃性宕機帶來的服務(wù)器停機,后來,隨著科學(xué)技術(shù)的不斷進步,特別是云計算和云存儲技術(shù)的發(fā)展,為了解決單服務(wù)器有計劃或非計劃停機的問題,提出了全冗余方式就是雙機雙存儲,存儲設(shè)備之間使用重復(fù)數(shù)據(jù)刪除技術(shù),完成增量同步工作,就是雙機熱備全冗余技術(shù)。
通過研究雙機熱備全冗余技術(shù),并對雙機熱備全冗余技術(shù)進行改造,形成一種新型的級聯(lián)與備用雙向復(fù)制技術(shù),并在云存儲架構(gòu)底層利用級聯(lián)與備用雙向復(fù)制技術(shù)來解決HDFS架構(gòu)中的伸縮性差以及單點依賴等缺陷。利用首尾相連并成部分對等關(guān)系的多個數(shù)據(jù)服務(wù)器改變了集中式架構(gòu)中的單點依賴,克服了HDFS中當(dāng)數(shù)據(jù)服務(wù)器失效時,整個系統(tǒng)將陷入癱瘓狀態(tài)的情況。
本文的研究內(nèi)容在資源管理平臺設(shè)計與實現(xiàn)過程中屬于前期的準(zhǔn)備工作,后續(xù)還將對資源管理平臺進行系統(tǒng)需求分析、系統(tǒng)架構(gòu)設(shè)計、系統(tǒng)功能性設(shè)計、系統(tǒng)測試與總結(jié)等工作,最終實現(xiàn)對基于云存儲的數(shù)字化教學(xué)資源管理平臺的設(shè)計及部署。
參考文獻
[1]蔡斌,陳湘萍.Hadoop技術(shù)內(nèi)幕[M].北京:機械工業(yè)出版社,2013.
[2]劉麗,米振強,熊曾剛.深入理解云計算[M].北京:機械工業(yè)出版社,2015.
[3]王鵬.云計算的關(guān)鍵技術(shù)與應(yīng)用實例[M].北京:人民郵電出版社,2010.
[4]The Age of Big Data. The New York Times,2012.
[5]Kapil Bakshi.Considerations for Big Data:Architecture and Approach. 2012IEEE Aerospace Conference,2012.endprint