趙春元++丁松峰
摘 要:隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,工業(yè)控制系統(tǒng)計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)得到廣泛應(yīng)用。工業(yè)制造、控制系統(tǒng)對(duì)信息的依賴性越來越高,但基于工業(yè)控制系統(tǒng)的數(shù)據(jù)防災(zāi)系統(tǒng)應(yīng)用不多。本文針對(duì)煙草工業(yè)企業(yè)制絲生產(chǎn)線集控系統(tǒng)特點(diǎn),對(duì)制絲集控系統(tǒng)數(shù)據(jù)防災(zāi)備份進(jìn)行了探索和嘗試,實(shí)現(xiàn)了工業(yè)控制系統(tǒng)服務(wù)器、數(shù)據(jù)庫的容災(zāi)備份和快速恢復(fù)機(jī)制。
關(guān)鍵詞:制絲集控;數(shù)據(jù)容災(zāi);自動(dòng)備份;SQL;Oracle
0 引言
目前生產(chǎn)制造企業(yè)數(shù)據(jù)向著集中存儲(chǔ)、集中管理的方向發(fā)展,隨著工業(yè)企業(yè)自動(dòng)控制系統(tǒng)的不斷完善,工業(yè)制造控制系統(tǒng)對(duì)信息技術(shù)的依賴性也就越來越強(qiáng),控制系統(tǒng)數(shù)據(jù)集中的同時(shí)也意味著數(shù)據(jù)風(fēng)險(xiǎn)的集中,進(jìn)而引出一個(gè)重要的問題——數(shù)據(jù)災(zāi)難備份。
目前煙草制絲線集控系統(tǒng)現(xiàn)場(chǎng)設(shè)備電控系統(tǒng)觸摸屏操作終端機(jī)均采用工控機(jī),安裝windows7操作系統(tǒng),控制系統(tǒng)無UPS不間斷電源,設(shè)備異常斷電或跳閘已出現(xiàn)多次系統(tǒng)文件損壞或監(jiān)控畫面文件損壞,修復(fù)時(shí)間較長(zhǎng)。同時(shí),制絲線工控機(jī)、服務(wù)器上都安裝、部署有集控系統(tǒng)專用監(jiān)控軟件、數(shù)據(jù)庫軟件。一旦工控機(jī)或服務(wù)器系統(tǒng)故障,除造成數(shù)據(jù)丟失外,對(duì)一臺(tái)服務(wù)器操作系統(tǒng)、應(yīng)用軟件的安裝不少于10小時(shí),同時(shí)還要對(duì)應(yīng)用軟件、數(shù)據(jù)庫軟件進(jìn)行配置。如生產(chǎn)過程中出現(xiàn)系統(tǒng)崩潰的問題,必然造成制絲長(zhǎng)時(shí)間停機(jī),影響制絲生產(chǎn)運(yùn)行。
針對(duì)以上問題,煙草制絲線集控系統(tǒng)需一套完整的數(shù)據(jù)備份恢復(fù)系統(tǒng)。統(tǒng)一通過網(wǎng)絡(luò)對(duì)制絲集控系統(tǒng)數(shù)據(jù)進(jìn)行備份恢復(fù)和集中管理,從而實(shí)現(xiàn)自動(dòng)化的備份、文件歸檔、數(shù)據(jù)分級(jí)存儲(chǔ)及數(shù)據(jù)災(zāi)難性問題的恢復(fù)等。
1 制絲集控系統(tǒng)需求分析
1.1 制絲集控系統(tǒng)現(xiàn)狀分析
黃金葉生產(chǎn)制造中心制絲集控系統(tǒng)網(wǎng)絡(luò)基礎(chǔ)工業(yè)以太網(wǎng)及西門子profiNET網(wǎng)絡(luò)平臺(tái),現(xiàn)在已經(jīng)擁有9臺(tái)服務(wù)器,包括生產(chǎn)過程監(jiān)控系統(tǒng)、生產(chǎn)管理系統(tǒng)、數(shù)據(jù)存儲(chǔ)系統(tǒng),為煙草制絲生產(chǎn)線過程管理與控制提供強(qiáng)有力的信息化支持。主要數(shù)據(jù)庫包括了Microsoft SQLS、Oracle、INSQL等。
1.2 制絲集控系統(tǒng)備份需求分析
黃金葉生產(chǎn)制造中心制絲集控系統(tǒng)數(shù)據(jù)中心的數(shù)據(jù)超過300GB,且大量為過程控制實(shí)時(shí)數(shù)據(jù),根據(jù)制絲集控系統(tǒng)配置,需要一套數(shù)據(jù)容災(zāi)備份管理系統(tǒng),對(duì)數(shù)據(jù)進(jìn)行集中、快速和自動(dòng)化的數(shù)據(jù)備份與管理;并且支持基于Windows平臺(tái)的SQL數(shù)據(jù)庫、Oracle數(shù)據(jù)庫的網(wǎng)絡(luò)邏輯備份及整盤數(shù)據(jù)備份,同時(shí)能夠支持頻繁的數(shù)據(jù)庫日志備份,保障制絲集控系統(tǒng)的可靠運(yùn)行。
2 制絲集控容災(zāi)備份系統(tǒng)設(shè)計(jì)
2.1 容災(zāi)備份系統(tǒng)構(gòu)成
搭建制絲集控系統(tǒng)容災(zāi)備份恢復(fù)系統(tǒng)既要做到滿足集控系統(tǒng)數(shù)據(jù)量不斷增加的要求,又需要備份恢復(fù)軟件能夠支持當(dāng)前制絲集控系統(tǒng)操作平臺(tái)要求?;诖四繕?biāo),充分利用當(dāng)前制絲集控系統(tǒng)工業(yè)以太網(wǎng)網(wǎng)絡(luò),使用基于網(wǎng)絡(luò)的數(shù)據(jù)備份存儲(chǔ)管理系統(tǒng),在分布式的制絲集控網(wǎng)絡(luò)下通過專業(yè)的數(shù)據(jù)存儲(chǔ)管理軟件,對(duì)網(wǎng)絡(luò)上各應(yīng)用服務(wù)器及數(shù)據(jù)庫進(jìn)行集中備份與管理,從而實(shí)現(xiàn)自動(dòng)化的數(shù)據(jù)備份、文件數(shù)據(jù)歸檔、數(shù)據(jù)庫數(shù)據(jù)的分級(jí)存儲(chǔ)及災(zāi)難恢復(fù)管理。
2.1.1 容災(zāi)備份存儲(chǔ)方案
容災(zāi)備份的數(shù)據(jù)存儲(chǔ)硬件的可靠性與穩(wěn)定性是整個(gè)備份過程中重要的指標(biāo),是容災(zāi)系統(tǒng)能否實(shí)現(xiàn)高質(zhì)量、高可靠性備份的關(guān)鍵。黃金葉生產(chǎn)制造中心制絲集控系統(tǒng)選用磁盤陣列作為備份存儲(chǔ)設(shè)備。
2.1.2 容災(zāi)備份軟件方案
當(dāng)前容災(zāi)備份系統(tǒng)通常能夠滿足數(shù)據(jù)備份的基本功能,但是為了更好的支持和滿足制絲集控系統(tǒng)容災(zāi)備份需求,減少備份過程對(duì)各應(yīng)用服務(wù)器工作的影響,容災(zāi)備份軟件系統(tǒng)應(yīng)可實(shí)現(xiàn)加速數(shù)據(jù)備份、自動(dòng)備份操作、災(zāi)難恢復(fù)操作快捷等特殊功能需求。本方案選用Symantec(賽門鐵克)數(shù)據(jù)備份系統(tǒng)軟件(Backup Exec)。
Backup Exec是賽門鐵克專為中小企業(yè)打造的基于Windows的數(shù)據(jù)保護(hù)金牌標(biāo)準(zhǔn),具有豐富的擴(kuò)展性能,能夠從一臺(tái)服務(wù)器擴(kuò)展到多服務(wù)器的數(shù)據(jù)存儲(chǔ)區(qū)域網(wǎng)絡(luò)系統(tǒng)。并能夠使用較少的投入、在短時(shí)間內(nèi)完成更多的備份,并能對(duì)數(shù)據(jù)備份進(jìn)行集中管理。
2.1.3 備份策略
備份策略是指確定需要備份數(shù)據(jù)的內(nèi)容、備份的時(shí)間以及其備份方式。制絲集控系統(tǒng)數(shù)據(jù)容災(zāi)備份根據(jù)制絲集控系統(tǒng)現(xiàn)狀,將完全備份、增量備份、差異備份三種類型混合應(yīng)用。在每個(gè)應(yīng)用系統(tǒng)保證一個(gè)完全備份的基礎(chǔ)上,進(jìn)行基于周期的增量備份和基于數(shù)據(jù)的差異備份,能夠?qū)崿F(xiàn)7*24的數(shù)據(jù)備份,并能夠保證毫秒級(jí)的數(shù)據(jù)備份,確保制絲集控系統(tǒng)關(guān)鍵數(shù)據(jù)萬無一失。
2.1.4 災(zāi)難恢復(fù)計(jì)劃
數(shù)據(jù)備份是數(shù)據(jù)恢復(fù)的基礎(chǔ)和前提,數(shù)據(jù)備份的目的是防止數(shù)據(jù)丟失,沒有備份就無從恢復(fù),數(shù)據(jù)災(zāi)難恢復(fù)是在數(shù)據(jù)備份基礎(chǔ)上的具體應(yīng)用。數(shù)據(jù)災(zāi)難恢復(fù)策略就是要在數(shù)據(jù)災(zāi)難發(fā)生時(shí),確保將數(shù)據(jù)損失控制在最小范圍內(nèi),即如何使各應(yīng)用系統(tǒng)出現(xiàn)數(shù)據(jù)災(zāi)難時(shí)快速將數(shù)據(jù)恢復(fù)并重新啟動(dòng)各應(yīng)用系統(tǒng)。
2.2 備份系統(tǒng)網(wǎng)絡(luò)架構(gòu)
以制絲線控制骨干網(wǎng)絡(luò)為平臺(tái),將備份服務(wù)器添加到骨干網(wǎng)絡(luò)中,打通備份服務(wù)器網(wǎng)絡(luò)。
為了盡可能減少數(shù)據(jù)災(zāi)難系統(tǒng)對(duì)制絲集控現(xiàn)有系統(tǒng)及網(wǎng)絡(luò)的影響,制絲集控?cái)?shù)據(jù)容災(zāi)備份系統(tǒng)在盡量不改變現(xiàn)有集控系統(tǒng)網(wǎng)絡(luò)架構(gòu)及應(yīng)用的前提下,對(duì)制絲集控系統(tǒng)各應(yīng)用服務(wù)器采用網(wǎng)絡(luò)備份工作方式,通過集控系統(tǒng)工業(yè)以太網(wǎng)對(duì)應(yīng)用服務(wù)器的數(shù)據(jù)進(jìn)行備份,同時(shí)將數(shù)據(jù)通過容災(zāi)備份服務(wù)器寫入到磁盤陣列中。制絲集控專用容災(zāi)備份服務(wù)器部署Symantec Backup Exec,采用該模式可以將數(shù)據(jù)容災(zāi)備份服務(wù)器與制絲集控各業(yè)務(wù)主機(jī)和英語服務(wù)器分離開來,方便管理,且提高了數(shù)據(jù)備份的安全性。再次,在基于制絲集控網(wǎng)絡(luò)備份的基礎(chǔ)上,服務(wù)器配置雙網(wǎng)卡。一個(gè)網(wǎng)絡(luò)用于數(shù)據(jù)備份,另一個(gè)網(wǎng)絡(luò)連接到制絲線集控管理網(wǎng)絡(luò)中,實(shí)現(xiàn)對(duì)數(shù)據(jù)容災(zāi)備份系統(tǒng)的遠(yuǎn)程管理。既減輕了制絲集控系統(tǒng)各應(yīng)用平臺(tái)的網(wǎng)絡(luò)壓力,也有利于提高網(wǎng)絡(luò)備份速度。
3 數(shù)據(jù)備份配置
3.1 服務(wù)器系統(tǒng)備份
通過部署B(yǎng)ackup Exec 2012 for Windows Servers,為Windows服務(wù)器系統(tǒng)提供可靠、迅速而且高效的持續(xù)數(shù)據(jù)保護(hù)。該備份數(shù)據(jù)由一個(gè)基準(zhǔn)備份(全備份)和增量備份、差異備份而組合成完整的全備份數(shù)據(jù)。同時(shí),該備份方法可以將組合后的備份數(shù)據(jù)快速恢復(fù)于各應(yīng)用服務(wù)器及客戶端。由于所有文件、數(shù)據(jù)只需備份一次,所以整個(gè)備份過程只會(huì)消耗較少的網(wǎng)絡(luò)帶寬,并能有效降低備份過程對(duì)各應(yīng)用服務(wù)影響。
3.2 SQL數(shù)據(jù)庫備份
在需要備份的SQL數(shù)據(jù)庫服務(wù)器上部署Symantec Backup Exec SQL Agent,通過備份管理服務(wù)器Backup Exec把所有SQL資源整合在一個(gè)備份作業(yè)里,提高備份管理的靈活性,簡(jiǎn)化SQL數(shù)據(jù)的恢復(fù)。在提交 SQL數(shù)據(jù)庫備份作業(yè)計(jì)劃時(shí), Backup Exec通過其獨(dú)有的MicrosoftSQL API獲取數(shù)據(jù)庫的備份。同時(shí)將SQL數(shù)據(jù)庫日志事務(wù)自動(dòng)保護(hù)在備份文件中,并存儲(chǔ)在SQL數(shù)據(jù)庫備份集內(nèi)作為一個(gè)單獨(dú)的備份存在。
3.3 Oracle數(shù)據(jù)庫備份
在制絲集控系統(tǒng),大量的歸檔周期較短的數(shù)據(jù)存儲(chǔ)在Oracle數(shù)據(jù)庫中,因此在制絲集控?cái)?shù)據(jù)容災(zāi)備份中必須進(jìn)行Oracle數(shù)據(jù)庫的備份,目前很多企業(yè)仍采用腳本或手工的方式進(jìn)行Oracle數(shù)據(jù)備份,腳本或手工方式備份Oracle數(shù)據(jù)庫無法避免的存在著數(shù)據(jù)丟失和恢復(fù)延誤。
通過在Oracle數(shù)據(jù)庫服務(wù)器上部署B(yǎng)ackup Exec Oracle Agent,制絲集控?cái)?shù)據(jù)容災(zāi)備份系統(tǒng)能夠?qū)W(wǎng)絡(luò)上的任何Oracle數(shù)據(jù)庫進(jìn)行數(shù)據(jù)備份和恢復(fù)操作。基于Backup Exec Oracle Agen的Oracle數(shù)據(jù)庫備份能夠與網(wǎng)絡(luò)備份集成,當(dāng)Oracle數(shù)據(jù)庫發(fā)生故障或服務(wù)器被關(guān)閉,仍可將備份的數(shù)據(jù)庫聯(lián)機(jī)。甚至原應(yīng)用服務(wù)器宕機(jī),用戶也能夠繼續(xù)訪問數(shù)據(jù)庫數(shù)據(jù)。
4 災(zāi)難恢復(fù)配置
當(dāng)制絲集控系統(tǒng)應(yīng)用程序出現(xiàn)故障、配置被改變、應(yīng)用程序遭受病毒攻擊、應(yīng)用平臺(tái)硬件故障都能夠使制絲集控系統(tǒng)服務(wù)器癱瘓。如何在制絲集控各應(yīng)用系統(tǒng)受到影響之前有多少時(shí)間來恢復(fù)過程數(shù)據(jù)及各應(yīng)用系統(tǒng)。傳統(tǒng)的數(shù)據(jù)恢復(fù)通常需要幾個(gè)小時(shí)甚至幾天。以恢復(fù)一臺(tái)制絲集控系統(tǒng)監(jiān)控操作站為例,最快需要20分鐘(常規(guī)Ghost備份恢復(fù)),最長(zhǎng)需要4小時(shí)(安裝操作系統(tǒng)、安裝集控應(yīng)用軟件、配置監(jiān)控軟件)。恢復(fù)一臺(tái)服務(wù)器需要更長(zhǎng)的時(shí)間。該過程還是假設(shè)恢復(fù)過程沒有其它異常發(fā)生,因此非常有必要進(jìn)一步優(yōu)化這種高度復(fù)雜的數(shù)據(jù)恢復(fù)過程。
制絲集控?cái)?shù)據(jù)容災(zāi)備份系統(tǒng)選用Symantec Backup Exec System Recovery作為災(zāi)難恢復(fù)方案,能夠在極短的時(shí)間內(nèi)執(zhí)行應(yīng)用服務(wù)器系統(tǒng)裸機(jī)恢復(fù)(Bare Metal Restore),快速的將崩潰的各應(yīng)用系統(tǒng)恢復(fù)到指定時(shí)間點(diǎn)。甚至還可以將備份的系統(tǒng)數(shù)據(jù)迅速恢復(fù)至不同的硬件平臺(tái)上。
5 結(jié)論
將Symantec Backup Exec System數(shù)據(jù)災(zāi)難備份系統(tǒng)應(yīng)用于煙草制絲線集控系統(tǒng),充分考慮了當(dāng)前煙草行業(yè)制絲線控制系統(tǒng)現(xiàn)狀,既能保證制絲集控系統(tǒng)數(shù)據(jù)備份和災(zāi)難恢復(fù)的基本需求,又能滿足制絲集控系統(tǒng)功能擴(kuò)展后數(shù)據(jù)量激增的情況。并且基于ymantec Backup Exec System數(shù)據(jù)災(zāi)難備份系統(tǒng)應(yīng)用于Windows 操作系統(tǒng)平臺(tái),與制絲集控系統(tǒng)各應(yīng)用服務(wù)器操作系統(tǒng)相同,有效降低了容災(zāi)備份系統(tǒng)管理和操作的復(fù)雜程度。避免了人工備份的數(shù)據(jù)遺漏及效率低下的問題,確保備份數(shù)據(jù)按照備份策略有效執(zhí)行。實(shí)現(xiàn)了7*24的數(shù)據(jù)庫備份和快速恢復(fù)機(jī)制,將系統(tǒng)恢復(fù)時(shí)間縮短到數(shù)分鐘,使業(yè)務(wù)的連續(xù)性得到最大保障。