魯學(xué)亮 陳金燾
摘? ?要:隨著云計算的廣泛應(yīng)用,云存儲成為一種流行的存儲手段。無論是對個人用戶還是對企業(yè)用戶,云存儲都可以實(shí)現(xiàn)用戶文件的存儲和備份。高校師生在教學(xué)科研中累積了大量的各類非結(jié)構(gòu)化數(shù)據(jù),海量有價值的數(shù)據(jù)散落在教師和學(xué)生電腦里,資源得不到有效沉淀且存在隨時丟失和泄露的風(fēng)險。云存儲的出現(xiàn)很好地解決了高校用戶間數(shù)據(jù)傳輸、共享、協(xié)同、交互的問題。云存儲是將儲存數(shù)據(jù)放到云端供用戶存取的一種解決方案,使用者不受時間和空間的限制,通過任何可連網(wǎng)的終端設(shè)備都可以連接到云上,方便地存取數(shù)據(jù)。
關(guān)鍵詞:云存儲;云盤;協(xié)同;私有云
中圖分類號:TP393 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2019)09-0061-04
一、云存儲建設(shè)形態(tài)
從云盤功能上來看,目前的云盤服務(wù)主要包括文件的上傳下載、用戶的身份認(rèn)證、用戶文件的共享、添加好友、文件管理、文件提取、用戶及文件的搜索功能以及回收站功能。因?yàn)樵票P服務(wù)是一種基于Web的服務(wù)形式,所以功能的實(shí)現(xiàn)也支持以HTTP語言來實(shí)現(xiàn),包括HTML、RESTAPI、SOAP等等。目前主流云盤均依賴于標(biāo)準(zhǔn)的REST API進(jìn)行編寫。
從架構(gòu)上來看,云盤的實(shí)現(xiàn)主要分為兩種大的分支:一種是基于傳統(tǒng)NAS設(shè)備構(gòu)建的云盤系統(tǒng);另外一種是基于對象存儲系統(tǒng)搭建的云盤系統(tǒng)。傳統(tǒng)NAS設(shè)備搭建的系統(tǒng),雖然從某種程度上彌補(bǔ)了使用SAN網(wǎng)絡(luò)的缺點(diǎn),如提高了可擴(kuò)展性,但是自身對帶寬的消耗太大無法彌補(bǔ),同時性能上較SAN網(wǎng)絡(luò)也存在著明顯的不足。并且NAS依賴于底層的文件系統(tǒng),而一旦NAS設(shè)備提供給外網(wǎng)服務(wù),勢必存在NAS依賴的文件系統(tǒng)也完全暴露在外網(wǎng),從而帶來了很大的隱患。而越來越多的廠商和用戶將目光投向基于對象的云盤系統(tǒng),特別是云盤的應(yīng)用,基于對象的云盤系統(tǒng)有著自己獨(dú)特的地方。從云盤的底層架構(gòu)上看,越來越多的用戶和企業(yè)轉(zhuǎn)向了分布式特點(diǎn)明顯的架構(gòu)建設(shè)上。這些云盤服務(wù)的提供商不再采用集中存儲,而是在多個站點(diǎn)之間構(gòu)建多個存儲空間,通過云盤的統(tǒng)一命名空間對所有資源進(jìn)行整合,應(yīng)用不需要關(guān)心數(shù)據(jù)存儲到哪一個地方、存了多少份、怎么存的過程等等,只需要關(guān)心需要多大空間,文件需要什么樣的保護(hù)級別即可。
私有云在云存儲中是最為傳統(tǒng)的方式,需要搭建一系列服務(wù)器集群,搭建服務(wù)器云環(huán)境,軟件系統(tǒng)、存儲內(nèi)容均搭載于本地機(jī)房。學(xué)校作為萬人級使用單位,時時都會產(chǎn)生大量數(shù)據(jù),隨著數(shù)據(jù)的不斷增加,服務(wù)器的運(yùn)行壓力會不斷增大。另一方面,私有云建設(shè)中的軟件存儲系統(tǒng)升級、后續(xù)維護(hù)、服務(wù)由于本地化部署有明顯的限制,造成了升級難、維護(hù)難、服務(wù)難的現(xiàn)象。但在數(shù)據(jù)安全和訪問便利方面,私有云則有更大的優(yōu)勢,國內(nèi)高校中的上海交通大學(xué)、中央財經(jīng)大學(xué)、中國公安大學(xué)均采用私有云方式[1]。浙江師范大學(xué)采用公有云方式,浙江大學(xué)在校園云盤建設(shè)中采用混合云方式。
二、“師大云盤”建設(shè)目標(biāo)
北京師范大學(xué)“師大云盤”系統(tǒng)一期建于2011年,滿足了校內(nèi)教學(xué)、科研、個人文件的存儲共享等需求。云盤系統(tǒng)部署在6臺服務(wù)器中,后端接8臺NAS集中式存儲設(shè)備。提供的可用總空間為220TB,總用戶數(shù)為26399,日均活躍用戶數(shù)為1000 左右。2018年“師大云盤”二期啟動建設(shè)。“師大云盤”部署拓?fù)鋱D如圖1所示。“師大云盤”架構(gòu)設(shè)計原則如下:
(1)高容量:支持海量數(shù)據(jù),滿足客戶目前及未來發(fā)展的需求,提供十萬級用戶訪問能力,這是傳統(tǒng)NAS的架構(gòu)難以實(shí)現(xiàn)的。
(2)高可用:可以做到磁盤和服務(wù)器故障,而業(yè)務(wù)不中斷,無縫動態(tài)升級擴(kuò)容,多站點(diǎn)異地容災(zāi)無縫切換,24小時在線。
(3)低運(yùn)營成本:采用傳統(tǒng)的x86服務(wù)器構(gòu)建集群,大大減少硬件設(shè)備的成本。
(4)可管理性好:統(tǒng)一管理界面,豐富的系統(tǒng)狀態(tài)檢測和告警功能。
(5)豐富的客戶端體驗(yàn):支持 Windows、Android、iOS系統(tǒng)的PC和移動設(shè)備在本地客戶端訪問。
(6)完善的數(shù)據(jù)管理、同步機(jī)制:支持桌面數(shù)據(jù)同步、備份,以及跨本地桌面系統(tǒng)、虛擬化桌面系統(tǒng)、移動終端系統(tǒng)的數(shù)據(jù)統(tǒng)一管理。
云存儲系統(tǒng)支持通過部署OWA在線預(yù)覽服務(wù)器(Office Web Apps),實(shí)現(xiàn)不借助本地軟件的Office文檔在線預(yù)覽。通過部署DOCS模塊,實(shí)現(xiàn)文檔協(xié)同在線多人同時編輯。通過部署殺毒模塊,實(shí)現(xiàn)文件的防病毒過濾引擎。
云存儲系統(tǒng)所有模塊均可獨(dú)立部署,且每個模塊均可負(fù)載均衡至多節(jié)點(diǎn),實(shí)現(xiàn)完全高可用架構(gòu)。節(jié)點(diǎn)可橫向無縫擴(kuò)展,節(jié)點(diǎn)數(shù)量可根據(jù)需求進(jìn)行動態(tài)增減,當(dāng)出現(xiàn)應(yīng)用訪問或存儲容量無法滿足應(yīng)用需求的情況下,云存儲系統(tǒng)只需橫向增加應(yīng)用或存儲節(jié)點(diǎn)即可滿足擴(kuò)展的需求?!拔迮_”部署方案為生產(chǎn)環(huán)境標(biāo)準(zhǔn)高可用方案,提供“訪問層-業(yè)務(wù)層-數(shù)據(jù)層”整體高可用方案,負(fù)載均衡、應(yīng)用服務(wù)、數(shù)據(jù)庫均提供多活架構(gòu),并提供兩副本存儲,保證數(shù)據(jù)可靠性和線上業(yè)務(wù)連續(xù)性。模塊部署如圖2所示。
數(shù)據(jù)庫模塊分布式部署在節(jié)點(diǎn)1至節(jié)點(diǎn)3上,提供專屬數(shù)據(jù)庫高可用集群能力。應(yīng)用服務(wù)模塊部署在節(jié)點(diǎn)2和節(jié)點(diǎn)3上,提供完全負(fù)載均衡的應(yīng)用訪問服務(wù)支撐。負(fù)載均衡模塊部署在節(jié)點(diǎn)2和節(jié)點(diǎn)3上,利用主從模式實(shí)現(xiàn)故障自動切換的HA冗余能力。存儲模塊部署在所有節(jié)點(diǎn)上,提供數(shù)據(jù)存儲服務(wù)。此部署集群架構(gòu)可完全滿足高并發(fā)量、高存儲量、高可用性的云存儲應(yīng)用需求。這樣的集群架構(gòu)可完全滿足50000用戶量的高并發(fā)云存儲應(yīng)用需求。
三、“師大云盤”典型應(yīng)用場景設(shè)計
1.校園文件共享,資料在線學(xué)習(xí)
“師大云盤”為師生提供了一個文件協(xié)同辦公的共享空間,為學(xué)校內(nèi)部各部門、各團(tuán)隊(duì)進(jìn)行文件資料匯總,減免文件傳輸帶來的時間成本。“師大云盤”提供消息通知功能,當(dāng)云端重要文件發(fā)生更新時,自身文件權(quán)限發(fā)生變動時,系統(tǒng)發(fā)送公告時,會第一時間通過消息提醒、郵件等方式告知相關(guān)用戶?!皫煷笤票P”提供基于文件內(nèi)容的全文檢索能力,并同時提供文件標(biāo)簽插入及檢索功能,幫助用戶最快速定位文件,提高辦公效率。
2.團(tuán)隊(duì)協(xié)作
“師大云盤”支持根據(jù)不同使用場景、不同組織架構(gòu)設(shè)置靈活的文件管理權(quán)限,系統(tǒng)默認(rèn)為每位用戶分配個人空間和單位空間,個人空間為僅限用戶使用,單位空間由系統(tǒng)根據(jù)用戶所屬部門進(jìn)行劃分,同部門用戶共享單位空間。另外,學(xué)校可以根據(jù)行政班級、選修課班級、教師教研組等組織架構(gòu),為師生配置不同場景下的文件夾,科學(xué)有效地滿足高校使用場景。教師可針對相應(yīng)文件靈活設(shè)置權(quán)限,例如學(xué)生只可上傳不可修改或刪除,導(dǎo)師可設(shè)置修改、刪除文件權(quán)限,這樣就可以輕松應(yīng)對學(xué)生誤刪、替換等常見問題。
3.教學(xué)科研
在絕大多數(shù)高校,學(xué)生在完成課后作業(yè)或論文后,不僅要發(fā)送電子版到教師郵箱里,還得再上交一份紙質(zhì)版論文作為備份,以免電子版損壞。這樣繁瑣的流程讓老師和學(xué)生都感到頭疼。對學(xué)生來說,發(fā)送電子版論文后,學(xué)生們不知道老師是不是真的看到了郵件,更不知道是不是成功發(fā)送了附件。對于老師來說,在論文收集截止的前幾天,他們的信箱或者郵箱都會收到大量的紙質(zhì)版或者電子版論文,少則幾十、多則幾百封,混淆、投錯、投漏、投丟甚至被偷,都會造成學(xué)術(shù)成果的泄漏或被竊,隱患重重。云盤系統(tǒng)可通過班級內(nèi)共享文件目錄或外鏈的形成完成作業(yè)收集。共享文件目錄和外鏈支持上傳數(shù)量和加密功能,確保文件安全,如圖4所示。
4.在線協(xié)同
云盤系統(tǒng)支持多人在線編輯功能,用戶無需打開本地Office軟件更不用下載客戶端,只要打開網(wǎng)頁版師大云盤即可在線編輯并實(shí)時保存。同時,“師大云盤”多人同時在線編輯功能還支持包括Word、Excel、PPT等20多種格式文件的多人實(shí)時在線編輯,項(xiàng)目成員能同時完成各自負(fù)責(zé)的模塊,教師也可以在線實(shí)時指導(dǎo)點(diǎn)評并及時在線保存,效率大幅提升還不用擔(dān)心文件意外損壞。協(xié)同編輯場景如圖5所示。
5.數(shù)據(jù)傳承,一鍵交接
學(xué)生離校、教師離崗等情況下,師生曾經(jīng)管理的團(tuán)隊(duì)公共數(shù)據(jù)需要快速地交接給接任者,“師大云盤”可方便地實(shí)現(xiàn)“一鍵傳承”,保證數(shù)據(jù)資產(chǎn)不外泄流失。一鍵交接場景如圖6所示。
6.促進(jìn)無紙化辦公
“師大云盤”的宗旨是實(shí)現(xiàn)“讓你的文件跟你走”,無論在什么位置,只要能聯(lián)網(wǎng)就可以通過終端設(shè)備獲取文件,徹底減少了大量文件的打印,并減少移動存儲的使用?!皫煷笤票P”支持二維碼掃碼文件分發(fā),會議開始前參會人員掃一下二維碼即可獲取會議資料,不用再大量打印會議材料,如圖7所示。
四、“師大云盤”安全性措施
“師大云盤”支持通過Web、手機(jī)瀏覽器、PC客戶端、MAC客戶端、IOS客戶端、Android客戶端、學(xué)校微信號等多種方式登錄使用,多重安全加密備份,確保用戶數(shù)據(jù)安全。
(1)傳輸通道安全:“師大云盤”所有數(shù)據(jù)均存放于北京師范大學(xué)校內(nèi)數(shù)據(jù)中心機(jī)房,數(shù)據(jù)存儲服務(wù)器不與校外網(wǎng)絡(luò)互聯(lián)。用戶與服務(wù)器間數(shù)據(jù)傳輸通過https協(xié)議,數(shù)據(jù)在用戶端加密后傳輸?shù)椒?wù)器端,確保傳輸過程中不被竊取和篡改。
(2)存儲架構(gòu)先進(jìn):“師大云盤”采用先進(jìn)的分布式存儲架構(gòu),并行處理存儲文件,能夠?yàn)閹熒峁└咝阅?、穩(wěn)定傳輸數(shù)據(jù)的存儲平臺,分布式架構(gòu)將系統(tǒng)所有的硬盤性能聚集到一起,可以將存儲系統(tǒng)的性能擴(kuò)展到TB/s的傳輸速度。
(3)數(shù)據(jù)存儲安全:“師大云盤”在服務(wù)器底層采用先進(jìn)的切片加密存儲機(jī)制,文件進(jìn)入服務(wù)器后可以防止病毒文件在服務(wù)器擴(kuò)散,并且“師大云盤”擁有先進(jìn)的文件歷史版本管理體系,可以實(shí)現(xiàn)文件感染病毒后,在歷史版本中將感染前的“最新”文件找回,實(shí)現(xiàn)對文件數(shù)據(jù)的安全保護(hù),防止病毒感染造成數(shù)據(jù)丟失。
(4)數(shù)據(jù)備份機(jī)制:“師大云盤”分布式存儲系統(tǒng)采用多副本安全機(jī)制,可保證硬件與軟件出現(xiàn)故障時,數(shù)據(jù)不丟失,服務(wù)不中斷,能夠有效地避免數(shù)據(jù)丟失和數(shù)據(jù)異常。未來的擴(kuò)展中,分布式存儲系統(tǒng)可實(shí)現(xiàn)在線擴(kuò)展與動態(tài)卷擴(kuò)容,真正實(shí)現(xiàn)服務(wù)不中斷、不遷移。數(shù)據(jù)的存儲系統(tǒng)擴(kuò)容上限可達(dá)到ZB級別,滿足未來學(xué)校其他信息化系統(tǒng)的存儲使用要求。
(5)勒索病毒防范:數(shù)據(jù)備份是對抗包括勒索病毒在內(nèi)的所有病毒最有效的途徑,不要等到病毒爆發(fā)后再后悔。在這個問題上,所有用戶都不應(yīng)該偷懶,不要心存僥幸,只有做好備份才能在病毒侵襲中做到有備無患。
五、展望
為滿足未來學(xué)?!耙惑w兩翼”的辦學(xué)格局,系統(tǒng)建設(shè)之初就考慮到多地部署的架構(gòu),在北京師范大學(xué)總校部署一套云存儲系統(tǒng)作為主數(shù)據(jù)中心,為全局元數(shù)據(jù)管理服務(wù),分校區(qū)部署一套應(yīng)用云存儲平臺,作為分?jǐn)?shù)據(jù)中心,提供分校區(qū)及外部用戶就近訪問。主數(shù)據(jù)中心提供元數(shù)據(jù)管理服務(wù)(同時也提供存儲服務(wù)),分站點(diǎn)只提供存儲服務(wù)。每個站點(diǎn)分別是一套集群系統(tǒng),所有站點(diǎn)都由主數(shù)據(jù)中心統(tǒng)一控制和管理。元數(shù)據(jù)集中存放在主數(shù)據(jù)中心,文件數(shù)據(jù)分散存放在各個站點(diǎn)(具體位置根據(jù)歸屬關(guān)系而定)。當(dāng)用戶第一次訪問異地站點(diǎn)數(shù)據(jù)時,會將訪問的數(shù)據(jù)緩存到本地站點(diǎn)上,提供第二次的數(shù)據(jù)就近訪問。云盤部署架構(gòu)如圖8所示。
升級后的“師大云盤”可以方便地進(jìn)行文件集中存儲、分享、分發(fā),為教師提高教學(xué)水平、學(xué)生主動學(xué)習(xí)提供更大便利。
參考文獻(xiàn):
[1]黃保青等.上海交通大學(xué)個人云存儲這些年走過的那些“坑”[J].中國教育網(wǎng)絡(luò),2017(8):54-55.
(編輯:王曉明)