本刊記者|舒文瓊
at&t大中華區(qū)總經(jīng)理吳英才
2005年8月末,來自加勒比海的5級颶風卡特里娜在美國登陸,給路易斯安那、密西西比等州造成了巨大破壞,一時間,通信服務幾乎完全中斷。災害發(fā)生后,at&t迅速響應,派出4輛緊急通信車和一個便攜式衛(wèi)星接收器,為救援提供通信服務。出于對at&t應對災難能力的充分信任,密西西比州政府甚至把災難控制部門設在了at&t控制中心大樓。在at&t的幫助下,災害發(fā)生地的通信服務迅速恢復,救災工作得以順利進行。
目前,洪澇災害在我國南方地區(qū)頻繁發(fā)生。分析at&t的應急通信之道,或許能為我國運營商提供一些有益啟示。
在at&t有這樣一個特殊的群體,他們的工作內(nèi)容是設計網(wǎng)絡災難管理架構、監(jiān)測網(wǎng)絡異常情況、模擬災害現(xiàn)場進行網(wǎng)絡恢復演練,以及在災害發(fā)生后第一時間奔赴現(xiàn)場,他們所屬的部門就是網(wǎng)絡及業(yè)務持續(xù)部。所謂“養(yǎng)兵千日,用兵一時”,這樣的部門或許一年只有為數(shù)不多的幾次機會能派上用場,不過,這絲毫不影響他們平日里專心致志地緊張備戰(zhàn)。
at&t為什么會高度重視網(wǎng)絡災備和應急通信?at&t大中華區(qū)總經(jīng)理吳英才告訴記者,at&t在全球155個市場運營著3800多個服務節(jié)點,擁有38個全球互聯(lián)網(wǎng)數(shù)據(jù)中心,服務全球99%的經(jīng)濟實體。由于業(yè)務遍布全球,不同地方發(fā)生意外情況的幾率就相應增加,此外,企業(yè)客戶的數(shù)量越來越多,對服務安全性的要求越來越高,因此,長期以來重視服務質(zhì)量的at&t就將網(wǎng)絡災難復原提高到了戰(zhàn)略地位。
除了設置專門的部門外,還有一個數(shù)字足以說明at&t的重視程度。據(jù)了解,盡管政府對于運營商在網(wǎng)絡災難恢復方面的投資沒有作出任何要求,然而截至目前at&t已經(jīng)自發(fā)地投入了將近5億美元。at&t商業(yè)服務部歐洲、中東和非洲地區(qū)網(wǎng)絡及業(yè)務持續(xù)部門的經(jīng)理Justin Williams直言,at&t之所以大手筆投入,是因為“希望能夠成為災難恢復方面的‘典范’。”
>>at&t的全球網(wǎng)絡運營中心時刻監(jiān)控著網(wǎng)絡狀況。
Williams認為,對災難的緊急響應離不開平日的充分準備,以及災害發(fā)生之后的第一時間反應,“準備+反應”成為了災難復原的兩大要素。
準備分多個層面進行,首先是物質(zhì)上的準備,即保證災難發(fā)生后有充足的通信設施可供及時調(diào)用。at&t認為,如果等到災難發(fā)生之后再從設備商那里購買設備,那么會大大增加救災風險,為此,at&t投入大量資金用于購買災備設施,所有設備預裝完好,隨時待命。同時,at&t還會與設備商簽約,保證在緊急情況下及時補充供貨。而為了保證災難發(fā)生時不會有意外情況發(fā)生,at&t嚴格規(guī)定這些應急設備不能挪作他用。
at&t在全球設立了6個倉庫用于存放這些設備,其中5個在美國,1個子英國,為了能迅速響應全球任何角落的災難,at&t甚至自己購置了波音747飛機,一旦發(fā)生災害就能立刻裝機運往現(xiàn)場。
網(wǎng)絡層面的準備也必不可少。比如,設計兩條路由線路保證數(shù)據(jù)可靠傳輸,將網(wǎng)絡設計成網(wǎng)格狀,以確保有迂回路由可用。如果所有的保障措施都失效,那么at&t會通過移動方式建立新的數(shù)據(jù)節(jié)點,盡快恢復通信正常。
在網(wǎng)絡和設備準備停當后,at&t會堅持7×24小時地監(jiān)督網(wǎng)上所有的信息,以提前識別可能發(fā)生的災難。因為時刻保持警界狀態(tài),所以有的突發(fā)事件客戶還沒意識到at&t就已經(jīng)監(jiān)測出了,從而能在第一時間作出反應,解決問題。
link
網(wǎng)絡復原的三大原則
● 當網(wǎng)絡重建的效果優(yōu)于網(wǎng)絡災難復原的效果時,網(wǎng)絡災難復原的方案不會被采用。
● 當對資產(chǎn)和人員安全存在高威脅時,網(wǎng)絡災難復原的決定不會被應用,員工的生命安全最為重要。
● 地區(qū)政治不穩(wěn)定可能會阻撓網(wǎng)絡災難復原的進行,at&t會在事前減少這些影響因素,但仍會做出警示。
除了物質(zhì)上的準備,流程上的設計也至關重要,因為只有流程清晰,人們在遇到緊急情況時才不會慌亂。
Williams介紹,at&t經(jīng)過反復摸索,總結(jié)出來了一套應對網(wǎng)絡災難的6步驟流程:第一,分析現(xiàn)場配置,比對集裝箱設備,以了解存在哪些缺口;第二,在倉庫內(nèi)完成通信設施的組建;第三,選擇提供應急通信的主要地點;第四,與有關部門協(xié)商該地點;第五,網(wǎng)絡復原小組運送設備;第六,提供通信服務以及安排線路遷移。六個步驟環(huán)環(huán)緊扣,確保救災萬無一失。
不過,如果脫離實際的操作,僅僅將這六個流程爛熟于心,那么也只能說是紙上談兵。為了提高實戰(zhàn)能力,at&t特別模擬災難現(xiàn)場,屆時會把應急通信車調(diào)出倉庫,進行實際演練,從而提高災備技能。據(jù)了解,這樣的災備演練at&t一年要進行4次,涵蓋山洪、地震、臺風、恐怖事件等各種場景。當然演練的作用不止是為了讓工作人員熟悉業(yè)務,“災難恢復非常復雜,會有很多意想不到的情況發(fā)生,通過演練我們可以提前預知可能發(fā)生的問題,提高解決問題的能力。”Williams表示。