趙 佳
(廣西通信規(guī)劃設計咨詢有限公司,廣西 南寧 530000)
隨著新時代數字經濟快速發(fā)展,數據中心建設規(guī)模不斷擴大。原有數據中心用電負荷小,供配電系統接線單一,結構簡單?,F行主要數據中心建設規(guī)模均超過了3 000個機架,甚至達到萬架級別,其供配電系統建設容量超過10 MVA,配置變壓器數量大、系統接線復雜。供配電系統在數據中心運行中具有舉足輕重的地位,提升運維水平對供配電系統安全可靠運行至關重要。采用人工運維方式已無法滿足大型數據中心運行需求,引入新技術對供配電系統實施智能化運維管理模式將逐漸替代原有傳統模式。
在信息產業(yè)發(fā)展初期,技術不夠先進,數據機房規(guī)模較小,通常僅需布置于一棟建筑的某層,與辦公、動力等建筑電氣負載共用1套變配電系統,機房不間斷電源只需從大樓0.4 kV配電裝置引接,日常只需通過人工方式簡易運維。數據機房電源投入或切斷只涉及少量低壓斷路器、隔離開關的分合閘操作,日常巡查內容主要為主配電柜、不間斷電源、蓄電池的運行工況,運維人員也只需要具備簡單的低壓配電知識。
隨著時代發(fā)展,機房需求急速增長,獨棟數據中心甚至數據園區(qū)建設成為常態(tài),高功率機柜也逐漸成為機房標配,用電負荷快速增長,電源系統電壓等級提升到10 kV專線甚至是110 kV專線。數據中心供配電系統所包含的高壓配電裝置、變壓器、低壓配電裝置、不間斷電源或高壓直流電源等設備容量不斷擴大、數量不斷增多,系統也越來越復雜。對于不斷發(fā)展的數據中心供配電系統,傳統人工運維方式無法適應,弊端逐漸顯現。人工成本高,各環(huán)節(jié)供配電設備間也存在數據互聯互通難、無法實時控制、智能化水平低、安全可靠性差等問題。數據中心供配電系統運維在空間維度上也無法做到監(jiān)管的面面俱到,存在維護人員誤報、漏報、瞞報等現象;在時間維度上運維更是滯后,對于風險、故障的處置往往由于數據滯后導致不準確、不及時。特別是在疫情防控期間,在使用人工和傳統管理手段的數據中心,由于運維人員不能如期復工,數據中心的運行受到極大影響。
當今,智能監(jiān)測、物聯網、大數據等先進技術日漸成熟,為數據中心供配電系統建立科學的智慧運維模式創(chuàng)造了條件。在數據中心供配電系統各環(huán)節(jié)、各節(jié)點設置監(jiān)測點,采集電力參數信息并上傳后臺,運維人員在監(jiān)控室即可查看各設備運行工況,減少了現場巡檢次數,大大降低了人工成本。
數據中心供配電系統先進智慧運維技術的運用,有機融合技術、數據、流程等,不僅提高了整體工作效率,而且有利于保障工作效果。智慧運維通過遠程遙測、后臺分析判斷、遠程遙控等技術,在某個供配電系統設備發(fā)生異常事件情況下,可以立即執(zhí)行標準管理流程,順利完成工作任務[1],提升了運維管理流程的水平。智慧運維技術對設備運行數據長期保存,并通過科學建模及大數據分析,對系統可能出現的故障做出預警,對故障點定位并做出預判,極大地提高了供配電系統運行的安全性。因此,供配電系統智慧運維提高了數據中心運維的智能化水平,有效解決了數據中心規(guī)模擴大后帶來的一系列運維問題。
數據中心IT設備運行具有連續(xù)性特征,用電持續(xù)高負荷,在其供配電系統設計過程中應綜合分析電能負荷性質和周圍區(qū)域電量供應[2]。同時,數據中心對電源各電力參數指標、供電可靠性有很高的要求,供配電各環(huán)節(jié)配置應有利于系統運行的穩(wěn)定性、電能輸配工作的有序性,保障數據中心正常運行。
大型數據中心負荷高,從經濟性方面考慮,后備電源系統一般采用中壓發(fā)電機并機復用方案,中壓發(fā)電機、中壓并機系統均統一布置于獨立動力中心。中壓配電裝置、變壓器、低壓配電裝置、不間斷電源或高壓直流電源布置于數據中心機房各樓層中部,近負荷中心布置,設變配電室、電力室、電池室等。數據中心機房主要布置于各樓層兩側,配電設備主要有微模塊柜頂雙母線配電單元、末端空調配電箱等;數據中心一層還布置有冷凍機房配電間,以及常規(guī)建筑電氣配電箱。數據中心供配電系統具有設備多、分布廣等特征,日常維護管理內容多。
云計算、大數據金融科技等數字產業(yè)均對數據中心的運行有很高的要求,數據中心建設主要按《數據中心設計規(guī)范》中A級數據中心建設要求實施,其中供配電系統應具備容錯能力,從前端到末端全程雙回路供電;變壓器、不間斷電源、高壓直流電源、發(fā)電機等設備配置冗余容量,互為備用運行;同時,考慮數據中心建設投資的經濟性,不間斷電源、發(fā)電機等設備采用多模塊并接方式,節(jié)省投資也便于后期局部更換。因此,數據中心供配電系統還具有子系統多、接線復雜等特征,出現人為失誤或判斷錯誤均有可能造成數據中心運行事故,造成重大經濟損失。因此,各供電方式切換、故障運維處理需經過大量邏輯分析、流程管理,最后才能實施操作、維修,這給運維人員帶來了極大的壓力。
數據中心供配電系統智慧運維應用應建立在安全基礎之上,注重安全管理機制建設,落實數據分類分級、重要數據保護、數據管理成熟度評估,積極組織做好各子系統數據安全共享、協同處置、算法規(guī)制、流程科學建模,時時加強數據安全關鍵技術創(chuàng)新突破,及時消減數據安全、運行安全重大隱患。
數據中心供配電系統智慧運維使用先進智能化技術,實現降低運維成本、規(guī)避人為因素造成運維風險的目的。智慧運維系統應優(yōu)化縮減人工巡檢梳理工作內容,實時監(jiān)測設備運行工況,提示設備運行潛在風險,及時發(fā)現并處理故障,并且建立規(guī)范流程,有序落實自動化電源控制模式,合理可靠使用電力資源[3]。
數據中心運行耗電量大,屬社會碳排放較高的產業(yè),在“雙碳”背景下國家對數據中心能源效率指標(PUE)要求不斷提升,數據中心綠色發(fā)展任重道遠。數據中心供配電系統智慧運維應堅持綠色發(fā)展,著力創(chuàng)新引領。智慧運維系統應注重各子系統、各供電環(huán)節(jié)能耗分析,確定機房最經濟運行形態(tài),提出微模塊IT設備布置方案、功耗控制區(qū)間等;智慧感應外界自然條件,通過配電開關合理控制空調系統運行組數,或直接投入新風系統利用自然冷源制冷;根據波峰波谷電價智慧蓄能蓄冷,落實錯峰調節(jié)數據中心基礎設施運行模式,有利于顯著節(jié)省電力能源;智慧控制照明系統,運用先進感應技術關停非必要輔助功能設備用電。
智慧運維系統應采用開放式的信息體系架構,使用標準通信協議,以滿足系統數字化升級需要,進一步優(yōu)化整體系統的功能,適應數據中心發(fā)展需求[4]。
數據中心供配電系統包含高壓開關柜、變壓器、低壓配電柜、不間斷電源或高壓直流電源,以及末端配電箱等,設備多,且分布于數據中心不同功能間,日常運維難度大。①日常巡檢周期比較長,這是因為數據中心供配電系統容量大,且擁有大量設備,主要采用多層配置方式,設備具有分散性特征,如采用人工巡檢會產生大量維護預算。②大型數據中心供配電系統中包含較多的子系統,而且各個系統之間的聯系較弱。③預警難度大,很難及時發(fā)現安全隱患。數據中心投產之后,運維人員若再采用傳統手段判斷系統狀態(tài),就無法發(fā)揮預警作用,供配電系統的可靠性得不到保障。④發(fā)生故障之后不能及時診斷故障,對恢復到正常的工作狀態(tài)有影響。利用傳統的供配電系統,因為設備數據監(jiān)測采集監(jiān)控系統不夠完善,如果發(fā)生故障需要利用人工調試方式,需要耗費較多的時間排除故障,數據中心運行因此受到影響。
數據中心供配電系統智慧運維,需要在供配電各節(jié)點嵌入各種傳感器、感應設備,并配置帶通信功能智能化儀表,實現設備運行電壓、電流、有功功率、無功功率、諧波等參數采集及記錄;同時在數據中心監(jiān)控室建設統一平臺集成智慧監(jiān)控系統,利用嵌入式人工智能技術,融合不同的智能組件和數字化功能,不僅可以提供供配電系統的基礎功能,還可以發(fā)揮遠程調度、故障診斷以及設備管理等作用[5]。運行期間,各節(jié)點實時采集設備數據,并通過485線或光纖傳送至后臺,由監(jiān)控系統緊密聯系各鏈路設備運行參數,通過對比分析確定是否對應,判斷某個節(jié)點是否存在故障;監(jiān)控系統還可以通過對比分析數據庫的歷史參數,提早發(fā)現設備存在的隱患;同時供配電系統智慧運維系統還能記錄分析數據中心供配電系統、空調系統各運行方式下能耗,綜合考慮電網波峰波谷電價情況,為數據中心提出科學的節(jié)能運行方案,并通過對末端配電開關控制實現空調系統的合理運行,最終實現數據中心降低碳排放的目標。
當前大型數據中心的外市電主要采用中壓多電源供電,中壓系統運行要求如下:①10 kV采用單母線分段接線,正常運行狀態(tài)兩路外市電電源同時供電。②如果其中一路市電電源失電,需要斷開故障電源的進線開關,并且閉合分段開關,利用另一路市電電源供本系統全部負荷。③如果兩路市電同時失電,需要同時斷開電源進線開關、分段開關及所有負載側開關,閉合兩路發(fā)電機電源開關,發(fā)電機啟動穩(wěn)定后,逐步閉合各負載側開關。④恢復一路市電供電之后,市電/發(fā)電機切換開關斷開發(fā)電機電源,轉而投入市電電源,其次閉合分段開關,實現市電電源供電,并向發(fā)電機發(fā)出停機信號。⑤恢復兩路市電供電之后,即可恢復正常運行模式[6]。
中壓配電常規(guī)微機綜合保護裝置可實現雙電源互為備投功能,但大型數據中心供配電系統增加了中壓發(fā)電機啟動及切換功能,切換前還需提前關停數據中心大容量負載,避免發(fā)電機宕機損壞。如繼續(xù)采用微機綜合保護裝置驅動各開關投切,需增加大量中間繼電器組件各種運行邏輯關系,二次接線復雜,且會增加很多故障點,可靠性差。如出現故障導致多電源并入情況,可能會造成上級電網事故,運維人員的工作難度、工作壓力也會因此增加。
在大型數據中心供配電系統運行過程中,需要中壓系統具備及時投入后備電源能力,也要避免各回路電源出現并接事故,確保整個系統運行的穩(wěn)定性和安全性。中壓智慧負載控制系統采用可編程邏輯控制器,增強了中壓系統二次設備的開放性、邏輯性、安全性,大大提升了數據中心智慧運維技術水平。中壓智慧負載控制系統在接收中壓系統市電電源狀態(tài)、發(fā)電機并機系統狀態(tài)信息并接入開關輔助觸點信號后,由系統自動分析故障,利用流程化的模型手段,有效判斷中壓系統各點運行情況等,最后快速輸出所需信號,驅動相應中壓開關分合閘,滿足數據中心供配電系統運行需求。
隨著信息技術不斷發(fā)展,需要進一步提升硬件設備智慧化和數據模型智慧化水平,進一步提高數據中心供配電系統智慧運維效率,同時降低整體成本,為無人化、自動化發(fā)展奠定基礎。■