文/饒東
服務(wù)器集群指的是將不同的服務(wù)器通過群集軟件和群集操作,以節(jié)點連接的方式集中起來,提供同一種集群服務(wù)。因為將不同臺計算機連接起來,所以計算速度較快,且可以利用多臺計算機做備份存儲,當(dāng)一臺機器出現(xiàn)故障后還能保證整個系統(tǒng)正常運作。在集群系統(tǒng)中,每一個集群節(jié)點都有自己的資源,對自己的用戶端負(fù)責(zé),但同時又能實現(xiàn)資源的共享,擁有比單獨工作的服務(wù)器更高的可用性和可擴充性。
服務(wù)器集群有以下特點:
(1)所創(chuàng)建的集群系統(tǒng)能解決服務(wù)器硬件故障,也就是當(dāng)一臺服務(wù)器出現(xiàn)硬盤、內(nèi)存或電源等故障時,其他服務(wù)器依然正常運作,這樣就可以將這臺故障服務(wù)器上的應(yīng)用自動切換到其他無故障的服務(wù)器上,保證整個服務(wù)器集群系統(tǒng)依然可以正常運行。
(2)集群系統(tǒng)還能解決軟件系統(tǒng)方面的問題。在計算機系統(tǒng)中,軟件包括應(yīng)用程序和數(shù)據(jù),當(dāng)應(yīng)用軟件系統(tǒng)和操作系統(tǒng)以及服務(wù)器三者之間任何一個出現(xiàn)故障問題后,系統(tǒng)便會停止向客戶端提供服務(wù),這時就會出現(xiàn)死機現(xiàn)象。但是在集群系統(tǒng)中,當(dāng)一個服務(wù)器出現(xiàn)故障后其他服務(wù)器會將該服務(wù)器上的應(yīng)用系統(tǒng)轉(zhuǎn)接過去,這樣就能繼續(xù)向客戶端提供服務(wù)。
(3)集群系統(tǒng)可以解決人為操作失誤引起的問題,當(dāng)管理員因為操作不當(dāng)而引起某臺服務(wù)器陷入停機問題后,通過集群系統(tǒng)監(jiān)控可以及時用其他某臺服務(wù)器去接管該故障服務(wù)器上的應(yīng)用系統(tǒng),避免人為操作不當(dāng)而產(chǎn)生嚴(yán)重的故障問題。
根據(jù)集群系統(tǒng)特征的不同可以分成三種集群系統(tǒng)。第一種是高可用性集群,這一類服務(wù)器集群的目標(biāo)是為客戶端提供高度可靠的服務(wù),也就是利用集群系統(tǒng)的容錯性向客戶端提供不間斷連續(xù)且可靠的服務(wù),比如高可用文件服務(wù)器、數(shù)據(jù)庫服務(wù)等應(yīng)用。第二類是負(fù)載均衡集群,也就是通過集群系統(tǒng)將任務(wù)平均分配給不同的計算機處理,充分發(fā)揮集群系統(tǒng)的處理能力,提高工作效率。在具體應(yīng)用時可以將高可用集群和負(fù)載均衡集群混合應(yīng)用,這樣向客戶端提供的服務(wù)將更加高效和穩(wěn)定。第三類是性能計算集群,這類集群系統(tǒng)運行的是專門開發(fā)的并行應(yīng)用程序也就是將同一個任務(wù)或問題相關(guān)數(shù)據(jù)分發(fā)到不同的計算機上,這些計算機之間進行的是并行計算,同時可利用共享的資源實現(xiàn)計算。計算速度較快且計算精確度高,能解決單獨運行時無法解決的問題,被廣泛應(yīng)用在天氣預(yù)報、石油勘探和生物計算中。
本文以高可用性集群為例,簡要談?wù)勗诰唧w應(yīng)用時常見的部署模式,分析技術(shù)應(yīng)用特點和應(yīng)用的原則。一般高可用性集群技術(shù)在設(shè)計部署時可以分成功能節(jié)點部署、服務(wù)接口部署、心跳系統(tǒng)和集群邏輯部署以及文件數(shù)據(jù)數(shù)據(jù)系統(tǒng)部署。
3.2.1 功能節(jié)點部署
高可用性集群技術(shù)應(yīng)用的核心是功能節(jié)點部署,通過功能節(jié)點部署使服務(wù)器集群向客戶端提供各種應(yīng)用和服務(wù)。在設(shè)計時主要包括主節(jié)點的設(shè)計,和多個冗余輔節(jié)點的設(shè)計。其中冗余節(jié)點的設(shè)計可以提高服務(wù)器集群技術(shù)應(yīng)用的高可用性和可擴充性,在實際應(yīng)用時通過服務(wù)器表達這些功能單元。
首先,在服務(wù)器主機部署方面,主機是由處理器、主內(nèi)存和相關(guān)外圍線路構(gòu)成,主機可以以計算模塊方式接入到集群中。另外,可以利用虛擬機技術(shù),以計算機硬件為基礎(chǔ)虛擬多個不同的主機單元,這樣就實現(xiàn)了軟件和硬件的分離。其次,在操作系統(tǒng)部署時,UNIX操作系統(tǒng)具有技術(shù)成熟、高效安全和質(zhì)量指標(biāo)高的優(yōu)勢,部署起來簡便且人性化程度高,管理員可結(jié)合實際工作環(huán)境快速安裝和部署該操作系統(tǒng)。此外,在網(wǎng)絡(luò)接口部署時根據(jù)集群系統(tǒng)實際工作環(huán)境選擇,如果節(jié)點使用的是高速通信線路,則網(wǎng)絡(luò)接入在集群服務(wù)器接口處部署。如果集群節(jié)點部署較為分散,注意網(wǎng)絡(luò)節(jié)點作為集群系統(tǒng)的一部分,應(yīng)將節(jié)點包含在集群邏輯內(nèi)。通過網(wǎng)絡(luò)線路實現(xiàn)各個節(jié)點的連接??傊诠δ芄?jié)點部署時要保證節(jié)點的高可用性,同時要綜合考慮硬軟件設(shè)施,做好操作系統(tǒng)。應(yīng)用系統(tǒng)和網(wǎng)絡(luò)接口的選擇與部署工作,保證每一個單一節(jié)點的可用性,保證服務(wù)效率。
3.2.2 服務(wù)接口部署
在服務(wù)器集群的應(yīng)用中,用戶是通過集群服務(wù)器接口實現(xiàn)對集群應(yīng)用和服務(wù)的使用的,所以服務(wù)接口的設(shè)計和部署也非常重要。首先,在集群設(shè)計時要保證服務(wù)器接口的可用性,避免發(fā)生接口宕機問題,將接口容錯設(shè)計放在設(shè)計首位。此外,值得注意的是服務(wù)網(wǎng)關(guān)只作為服務(wù)傳輸通道,而集群服務(wù)代理模式下則是直接通過代理服務(wù)器處理用戶請求,并轉(zhuǎn)為集群內(nèi)部邏輯,實現(xiàn)統(tǒng)一調(diào)度。
3.2.3 心跳系統(tǒng)和集群邏輯部署
心跳系統(tǒng)是集群各個節(jié)點的通信通道,也是實現(xiàn)集群高可用性的根本保證。通過心跳系統(tǒng)實現(xiàn)集群各個功能節(jié)點的連接,并發(fā)送和共享節(jié)點資源,同時通過對心跳系統(tǒng)傳輸過來的信息的分析做出決策。在設(shè)計時要注意通過多條線路對傳遞信息加以驗證,不能只使用單一的線路系統(tǒng),必須保證服務(wù)器集群中各個功能節(jié)點可以實現(xiàn)同步更新。在集群邏輯部署中,則應(yīng)盡可能選擇單獨部署模式,避免服務(wù)接口失效或功能節(jié)點故障問題,從而保證整個系統(tǒng)可以正常運行。
3.2.4 文件數(shù)據(jù)系統(tǒng)部署
關(guān)于文件數(shù)據(jù)存儲部署技術(shù),常見的有網(wǎng)絡(luò)附著存儲技術(shù)和存儲區(qū)域網(wǎng)絡(luò)技術(shù)兩種,其中網(wǎng)絡(luò)附著技術(shù)應(yīng)用簡單,且維護難度較低,主要是幫助用戶解決存儲容量擴容的問題,而存儲區(qū)域網(wǎng)絡(luò)數(shù)據(jù)文件存儲技術(shù)在傳輸數(shù)據(jù)方面的可靠性較高,且性能良好。在服務(wù)器集群技術(shù)中,文件數(shù)據(jù)存儲是在集群節(jié)點外部署的,該部署方式的優(yōu)勢是可以保證各個節(jié)點在數(shù)據(jù)訪問時保持一致,從而提高數(shù)據(jù)文件訪問存儲的可靠性。
服務(wù)器集群技術(shù)可提高客戶端服務(wù)的可靠性,同時可降低運行維護的成本。本文對高可用性集群系統(tǒng)的應(yīng)用原理、特征和原則等進行了分析,在未來在數(shù)據(jù)業(yè)務(wù)中將經(jīng)常會用到集群技術(shù),可滿足系統(tǒng)對連續(xù)服務(wù)的需求,獲得良好的應(yīng)用效果。