黃奕海
摘 要:在當(dāng)前時(shí)代背景下,信息化網(wǎng)絡(luò)的普及也讓計(jì)算機(jī)成為了目前很多企業(yè)辦公、管理的首選輔助工具,也是企業(yè)自動(dòng)化辦公必不可少的工具。此外,相比傳統(tǒng)辦公以及管理流程,運(yùn)用計(jì)算機(jī)進(jìn)行辦公與管理可以有效提升辦公、管理的效率,可以靈活準(zhǔn)確獲取相關(guān)信息,從而更加有效率、及時(shí)地處理信息,提高企業(yè)辦公、管理的運(yùn)轉(zhuǎn)。可以看出,計(jì)算機(jī)運(yùn)作流程的順利將直接關(guān)系到整個(gè)企業(yè)的正常運(yùn)作,因而具有重要的意義和價(jià)值。
關(guān)鍵詞:企業(yè)計(jì)算機(jī);應(yīng)用系統(tǒng);可靠性;可靠性測(cè)試;分析研究
中圖分類號(hào):TP311.53 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8937(2016)33-0091-02
就目前而言,計(jì)算機(jī)系統(tǒng)的構(gòu)成可以包含硬件、軟件以及一些應(yīng)用,而企業(yè)計(jì)算機(jī)的應(yīng)用系統(tǒng)也應(yīng)當(dāng)包含這些內(nèi)容。而且相比傳統(tǒng)計(jì)算機(jī)應(yīng)用系統(tǒng)而言,企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)具有更高的專業(yè)性、實(shí)時(shí)性,將涉及到更多數(shù)據(jù),簡(jiǎn)單來說,其就是傳統(tǒng)計(jì)算機(jī)應(yīng)用系統(tǒng)的升級(jí)。本文中的可靠性測(cè)試技術(shù)開始主要基于黑盒測(cè)試。而筆者將通過本文,就企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)可靠性測(cè)試技術(shù)方面,展開具體的研究與分析。
1 保證企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)可靠性的因素
1.1 固定的環(huán)境因素
環(huán)境因素主要是指應(yīng)用系統(tǒng)運(yùn)作的環(huán)境支持因素,即如硬件、軟件、操控以及其他環(huán)境因素,而且環(huán)境因素本身是固定的,即在系統(tǒng)運(yùn)作過程中,各個(gè)軟硬件以及操作環(huán)境都是必備的,同時(shí)要求數(shù)據(jù)輸入達(dá)到一定標(biāo)準(zhǔn),而且需要將其他條件列為理想狀態(tài)。
1.2 固定的時(shí)間因素
固定的時(shí)間因素主要體現(xiàn)在系統(tǒng)的運(yùn)作階段,而且需要將系統(tǒng)工作時(shí)間作為規(guī)定的標(biāo)準(zhǔn),簡(jiǎn)單而言,系統(tǒng)的工作時(shí)間就是工作及待機(jī)時(shí)間的總和。
1.3 固定的功能因素
應(yīng)用系統(tǒng)的可靠性還需要與制定的功能具有一定的關(guān)聯(lián),而且任務(wù)目標(biāo)存在差異,導(dǎo)致需要調(diào)用的子模塊也不盡相同,因而要精確判定系統(tǒng)是否可靠,就需要優(yōu)先了解其任務(wù)目標(biāo)以及功能特征[1]。
2 企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)可靠性測(cè)試目標(biāo)
2.1 找出影響系統(tǒng)正常運(yùn)作的隱患
一般而言,要影響系統(tǒng)可靠性,則需要同時(shí)具備不變條件以及可變條件。
其中對(duì)于前者而言,主要是指一些固定的硬件與基本軟件;而對(duì)于后者,主要是輸入的分布。通過對(duì)可靠性測(cè)試中使用到的有效和失效數(shù)據(jù)進(jìn)行分析,進(jìn)而評(píng)估當(dāng)前軟件可靠性的水平,并預(yù)測(cè)軟件未來可能達(dá)到的水平。而測(cè)試系統(tǒng)可靠性時(shí)則往往會(huì)優(yōu)先顯示高概率的缺陷問題,而通過妥善處理這些缺陷,即可保證應(yīng)用系統(tǒng)可靠運(yùn)行。
2.2 研究系統(tǒng)可靠性是否達(dá)到用戶標(biāo)準(zhǔn)
對(duì)于企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)的可靠性測(cè)試而言,第二個(gè)目標(biāo)則是在測(cè)試階段或者是投產(chǎn)前找出系統(tǒng)失效問題進(jìn)行研究分析,同時(shí)研究系統(tǒng)可靠性是否能夠達(dá)到用戶標(biāo)準(zhǔn),進(jìn)而保證系統(tǒng)更好為用戶服務(wù)。
2.3 預(yù)估系統(tǒng)可靠性的狀況
采用有效的可靠性測(cè)試,即可以根據(jù)獲取的測(cè)試信息進(jìn)行研究,然后針對(duì)當(dāng)前應(yīng)用系統(tǒng)的可靠性狀況進(jìn)行評(píng)估,評(píng)估系統(tǒng)是否達(dá)到預(yù)定的指標(biāo)情況,并且針對(duì)未來可靠性發(fā)展進(jìn)行評(píng)估,為今后系統(tǒng)改進(jìn)與拓展提供相應(yīng)的數(shù)據(jù)資料基礎(chǔ)[2]。
3 各類系統(tǒng)可靠性測(cè)試分類
3.1 雙機(jī)熱備可靠性測(cè)試
雙機(jī)熱備應(yīng)用系統(tǒng)構(gòu)成可以包含兩臺(tái)服務(wù)器與一個(gè)外接共享磁盤陣列柜,此外還包含與之對(duì)應(yīng)的雙機(jī)熱備專用軟件,而且一般會(huì)選擇“心跳”的特殊方法來強(qiáng)化子機(jī)與主機(jī)的關(guān)聯(lián)性,即如圖1所示,而“心跳”簡(jiǎn)單來說可以概括為主機(jī)與子機(jī)周期聯(lián)系的信息信號(hào),同時(shí)也表現(xiàn)出系統(tǒng)運(yùn)作正處于穩(wěn)定情況。若信號(hào)消失,則代表主機(jī)產(chǎn)生故障,則需要及時(shí)將主機(jī)資源移動(dòng)至子機(jī)中,暫時(shí)取代主機(jī)繼續(xù)工作。而該系統(tǒng)的測(cè)試則可以在檢驗(yàn)日常交易量的過程中,即雙機(jī)模式下系統(tǒng)故障的自我修復(fù)能力,測(cè)試流程主要包含一般切換、宕機(jī)、網(wǎng)絡(luò)故障等三種狀況的模擬:
①一般切換:即根據(jù)日常交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5 min左右,然后在主機(jī)運(yùn)行Take Over,同樣保持運(yùn)行在5 min左右。此時(shí)可以檢測(cè)子機(jī)是否會(huì)代替主機(jī)進(jìn)行交易,是否存在業(yè)務(wù)中止的問題,當(dāng)子機(jī)也運(yùn)行Take Over時(shí),則可以檢測(cè)回切的效果。
②宕機(jī):同樣根據(jù)交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5min左右,在主機(jī)上運(yùn)行Halt-q,保持運(yùn)行5 min,此時(shí)可以檢測(cè)子機(jī)是否會(huì)代替主機(jī)進(jìn)行交易,是否存在業(yè)務(wù)中止的問題,啟動(dòng)主機(jī)時(shí),則可以檢測(cè)回切的效果。
③根據(jù)交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5 min左右,在主機(jī)上采用宕網(wǎng)卡處理,保持運(yùn)行5 min,此時(shí)可以檢測(cè)子機(jī)是否會(huì)代替主機(jī)進(jìn)行交易,是否存在業(yè)務(wù)中止的問題?;謴?fù)主機(jī)網(wǎng)絡(luò)時(shí),則可以檢測(cè)回切的效果。
3.2 真正應(yīng)用集群可靠性測(cè)試
真正應(yīng)用集群(Oracle RAC)則一般是由兩臺(tái)或多臺(tái)計(jì)算機(jī)以及共享儲(chǔ)存器組成,具有更強(qiáng)的數(shù)據(jù)庫處理水平,而且該系統(tǒng)一般會(huì)選擇IP漂移、VIP移動(dòng)以及TAF透明故障切換技術(shù)以解決各類軟硬件問題(如SQL語句錯(cuò)誤,進(jìn)程問題等等)。即如出現(xiàn)故障時(shí),真正應(yīng)用集群系統(tǒng)則可以采用虛擬地址與IP漂移以達(dá)到故障切換效果,進(jìn)而保證數(shù)據(jù)庫的安全性。而測(cè)試流程同樣也可涵蓋實(shí)例關(guān)閉、宕機(jī)、網(wǎng)絡(luò)故障等三種狀況的模擬(其中默認(rèn)運(yùn)作節(jié)點(diǎn)為DB1上,DB2為備用),如圖2所示。
①實(shí)例關(guān)閉:即根據(jù)日常交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5 min左右,然后DB1則運(yùn)用shutdown !Abort,也保持運(yùn)行在
5 min左右,檢測(cè)DB2是否接替DB1的服務(wù)管理,是否產(chǎn)生IP地址漂移問題。
②宕機(jī):即根據(jù)日常交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在
5 min左右,然后DB1則運(yùn)用運(yùn)行Halt-q,保持運(yùn)行在5 min左右,檢測(cè)DB2是否接替DB1的服務(wù)管理,是否產(chǎn)生IP漂移問題。
③網(wǎng)絡(luò)故障:即根據(jù)日常交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5 min左右,然后拔除連接DB1的網(wǎng)線,保持運(yùn)行在5 min左右,檢測(cè)DB2是否接替DB1的服務(wù)管理,是否產(chǎn)生IP漂移問題[3]。
3.3 高可用性集群可靠性測(cè)試
高可用性集群,簡(jiǎn)單來說,就是一種集群技術(shù),其目標(biāo)就是最大程度降低服務(wù)故障的時(shí)間。
其中集群就是多個(gè)服務(wù)于用戶群體的計(jì)算機(jī),而單一的計(jì)算機(jī)智能作為單一節(jié)點(diǎn)。而且高可用集群則不能對(duì)業(yè)務(wù)資料提供防護(hù),而防護(hù)的側(cè)重點(diǎn)主要是用戶的程序在不停止對(duì)外的服務(wù)的基礎(chǔ)上,最大程度減少各類故障導(dǎo)致正常業(yè)務(wù)停滯狀況的產(chǎn)生。而且一般高可用性集群可以涵蓋以下兩類:①兩個(gè)主節(jié)點(diǎn),即各個(gè)節(jié)點(diǎn)都能保證為客戶計(jì)算機(jī)提供服務(wù),而且性能最穩(wěn)定,即便是故障產(chǎn)生,另一節(jié)點(diǎn)都可以代替故障節(jié)點(diǎn)進(jìn)行工作,即保證服務(wù)不會(huì)受到故障影響,不過不可忽視的是故障問題會(huì)直接影響到整個(gè)服務(wù)器的性能;②一個(gè)主節(jié)點(diǎn)與一個(gè)子節(jié)點(diǎn),主節(jié)點(diǎn)主要用于接收與處理客戶反饋的需求信息,而子節(jié)點(diǎn)則處于閑置,一旦主節(jié)點(diǎn)產(chǎn)生故障問題,子節(jié)點(diǎn)則可以代替其進(jìn)行工作,同時(shí)為用戶提供相應(yīng)的服務(wù),而且故障問題不會(huì)影響整個(gè)服務(wù)器的性能,但是整體結(jié)構(gòu)較為復(fù)雜。而具體的測(cè)試流程可以包含服務(wù)常規(guī)停止、進(jìn)程異常停止、網(wǎng)絡(luò)故障等三種狀況的模擬,如圖3所示。
①服務(wù)常規(guī)停止:即根據(jù)日常交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5 min左右,以常規(guī)方式停止子機(jī)的應(yīng)用服務(wù),同時(shí)檢測(cè)交易情況是否改變,保持運(yùn)行在5 min左右,則再次啟動(dòng)子機(jī)上的應(yīng)用服務(wù),主要是檢測(cè)子機(jī)是否恢復(fù)交易服務(wù),各項(xiàng)參數(shù)是否能夠達(dá)到正常指標(biāo)。
②進(jìn)程異常停止:即根據(jù)日常交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5 min左右,并且采用Kill-9消除子機(jī)應(yīng)用服務(wù)進(jìn)程,檢測(cè)交易情況是否改變,保持運(yùn)行在5 min左右,則再次重啟子機(jī)的應(yīng)用服務(wù),主要是檢測(cè)子機(jī)是否恢復(fù)交易服務(wù),各項(xiàng)參數(shù)是否能夠達(dá)到正常指標(biāo)。
③網(wǎng)絡(luò)故障:即根據(jù)日常交易量進(jìn)行系統(tǒng)加壓,保持運(yùn)行在5 min左右,中斷子機(jī)的網(wǎng)線,檢測(cè)交易情況是否改變,保持運(yùn)行在5 min左右,再次連接子機(jī)的網(wǎng)線,檢測(cè)子機(jī)是否恢復(fù)處理能力,各項(xiàng)參數(shù)是否能夠達(dá)到正常指標(biāo)。
4 結(jié) 語
可靠性的測(cè)試主要是針對(duì)故障一類問題進(jìn)行處理,同時(shí)以模擬的方式檢測(cè)系統(tǒng)故障問題后的恢復(fù)情況,同時(shí)還能根據(jù)客戶的可靠性指標(biāo)定義相應(yīng)的測(cè)定方法,同時(shí)構(gòu)成測(cè)定例子,進(jìn)而進(jìn)行可靠性檢測(cè),最后還可以針對(duì)系統(tǒng)今后運(yùn)作的可靠性情況進(jìn)行預(yù)估,在系統(tǒng)正式部署之前盡量找出并解決一些不確定因素而造成的問題,通過組合模擬方式進(jìn)行檢測(cè),進(jìn)而為后期系統(tǒng)的拓展以及軟件開發(fā)奠定基礎(chǔ)。
參考文獻(xiàn):
[1] 李霄,郭彤,王常洲.企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)可靠性測(cè)試技術(shù)研究[J].中國 科技信息,2013,07(07):87-89.
[2] 呂麥絲.企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)可靠性測(cè)試技術(shù)研究[J].計(jì)算機(jī)光盤軟 件與應(yīng)用,2014,11(11):198-200.
[3] 蔡仲博.企業(yè)計(jì)算機(jī)應(yīng)用系統(tǒng)可靠性測(cè)試技術(shù)研究[J].電子技術(shù)與軟 件工程,2015,04 (04): 187-189.