張永梅++賈輝++唐軼軒++姚振++王麗
摘 要:隨著國網(wǎng)安徽省電力公司設(shè)備(資產(chǎn))運(yùn)維精益管理系統(tǒng)的上線,實(shí)現(xiàn)了橫向、縱向多系統(tǒng)數(shù)據(jù)共享和業(yè)務(wù)融合,推動了生產(chǎn)管理信息化水平再上新臺階。文章針對系統(tǒng)建設(shè)過程中出現(xiàn)的數(shù)據(jù)訪問反應(yīng)慢、圖形卡頓和接口穩(wěn)定性差等問題做的系統(tǒng)調(diào)優(yōu)進(jìn)行了介紹,并闡述了PMS2.0系統(tǒng)深化應(yīng)用的管理方法和相應(yīng)措施。
關(guān)鍵詞:系統(tǒng)架構(gòu);性能調(diào)優(yōu);“126”管控;深化應(yīng)用
國網(wǎng)安徽省電力公司(以下簡稱“安徽公司”)為適應(yīng)“三集五大”體系建設(shè)要求,支撐運(yùn)維檢修全過程精益化管理和電網(wǎng)資產(chǎn)的全壽命周期管理,更大范圍地實(shí)現(xiàn)數(shù)據(jù)共享和業(yè)務(wù)融合,推動公司生產(chǎn)管理信息化水平再上新臺階,啟動了設(shè)備(資產(chǎn))運(yùn)維精益管理系統(tǒng)(以下簡稱“PMS2.0”)建設(shè)工作。
PMS2.0圍繞生產(chǎn)管理的全過程,以設(shè)備管理為中心,計劃任務(wù)為主線進(jìn)行設(shè)計,是生產(chǎn)精益化管理的重要支撐平臺。系統(tǒng)包含標(biāo)準(zhǔn)中心、電網(wǎng)資源中心、計劃中心、運(yùn)維檢修中心、監(jiān)督評價中心和決策支持中心六大中心,系統(tǒng)用戶覆蓋了省電力公司本部、電科院、省檢修公司、送變電公司、16家地市公司及其所轄72家縣公司。
隨著系統(tǒng)的建成及推廣應(yīng)用,逐漸暴露出系統(tǒng)架構(gòu)不夠優(yōu)化、圖形客戶端運(yùn)行緩慢、配搶工單頻繁超時等問題。
1 系統(tǒng)架構(gòu)介紹
安徽公司遵照國網(wǎng)統(tǒng)一發(fā)放的《SG-PMS2.0省公司系統(tǒng)安裝配置手冊》開展系統(tǒng)部署工作,系統(tǒng)總體架構(gòu)如圖1所示。
其中,省公司側(cè)部署3臺數(shù)據(jù)庫服務(wù)器采用ORACLE11gRAC的集群方式對外提供服務(wù),34臺應(yīng)用服務(wù)器分布在不同資源池、不同區(qū)域,分別按不同的程序功能部署了PMS2.0系統(tǒng)的各類應(yīng)用程序,所有應(yīng)用服務(wù)器均接入radware做負(fù)載均衡對外提供服務(wù)。
應(yīng)用服務(wù)器按其部署服務(wù)劃分為拓?fù)鋿鸥穹?wù)14臺,PMS主服務(wù)9臺,接口服務(wù)6臺,GIS服務(wù)4臺,配網(wǎng)管控計算服務(wù)1臺。部署拓?fù)鋿鸥穹謪^(qū)服務(wù)的14臺服務(wù)器呈兩兩互備方式,避免單點(diǎn)故障;復(fù)用其中4臺配置高的服務(wù)器并部署了數(shù)據(jù)代理和柵格前置服務(wù),呈兩兩互備方式,避免單點(diǎn)故障。部署PMS主服務(wù)的9臺服務(wù)器,復(fù)用其中4臺機(jī)器額外部署了SGUAP服務(wù)、空間信息服務(wù)和配搶消息服務(wù),呈相同服務(wù)多節(jié)點(diǎn)方式,避免單點(diǎn)故障。6臺接口服務(wù)器中兩臺單獨(dú)部署為配搶專用接口服務(wù),呈兩兩互備方式,避免單點(diǎn)故障。另外4臺部署對外接口、任務(wù)調(diào)度服務(wù),同時還部署了PMS主服務(wù)以作備用。
2 性能優(yōu)化
針對系統(tǒng)存在的性能問題,國網(wǎng)安徽省信通公司(以下簡稱“信通公司”)開展了數(shù)據(jù)庫、圖形和接口的相關(guān)優(yōu)化工作,提升了PMS2.0運(yùn)行穩(wěn)定性及用戶體驗。
2.1 數(shù)據(jù)庫優(yōu)化
為解決系統(tǒng)運(yùn)行緩慢、數(shù)據(jù)庫服務(wù)器宕機(jī)問題,信通公司在國網(wǎng)典設(shè)的三節(jié)點(diǎn)ORACLE11g的RAC基礎(chǔ)上,又額外異地部署了一套三節(jié)點(diǎn)的ADG備庫,實(shí)現(xiàn)數(shù)據(jù)庫快速切換、災(zāi)難性恢復(fù)及數(shù)據(jù)保護(hù),當(dāng)主庫出現(xiàn)故障時,備庫可以自動切換為主庫,并對外提供服務(wù)。同時,將應(yīng)用程序的JDBC連接串由常規(guī)的IP∶PORT改為URL∶PORT方式,通過域名系統(tǒng)(Domain Name System,DNS)進(jìn)行域名解析,當(dāng)數(shù)據(jù)庫出現(xiàn)故障時主備庫切換后,應(yīng)用在不需要任何干預(yù)的情況下實(shí)現(xiàn)自動重連當(dāng)前可用數(shù)據(jù)庫;對最能體現(xiàn)數(shù)據(jù)庫運(yùn)行安全及運(yùn)行質(zhì)量的DBtime,事務(wù)響應(yīng)時間,數(shù)據(jù)庫等待事件數(shù)、活動會話走勢、物理讀寫、CPU負(fù)載率、文件系統(tǒng)及表空間使用率等關(guān)鍵指標(biāo)部署了監(jiān)控措施,設(shè)置指標(biāo)告警閾值;同時按日將執(zhí)行時間較長的結(jié)構(gòu)化查詢語言(Structured Query Language,SQL)語句提取出來,數(shù)據(jù)庫與應(yīng)用系統(tǒng)專業(yè)人員聯(lián)合分析,提出優(yōu)化建議,部分SQL語句也同步報送國網(wǎng)總部開發(fā)分析,預(yù)先進(jìn)行系統(tǒng)性能薄弱點(diǎn)的控制,避免因性能問題影響系統(tǒng)安全穩(wěn)定運(yùn)行。
2.2 圖形架構(gòu)優(yōu)化
針對PMS2.0出現(xiàn)的圖形編輯卡頓現(xiàn)象,信通公司通過對I6000監(jiān)控系統(tǒng)主機(jī)運(yùn)行關(guān)鍵數(shù)據(jù)的分析,發(fā)現(xiàn)該問題的主要影響因素為主機(jī)資源不足。系統(tǒng)使用24核CPU的虛擬機(jī)加載全省數(shù)據(jù)時,虛擬機(jī)CPU使用率指標(biāo)長期居高不下,系統(tǒng)存在嚴(yán)重超負(fù)荷運(yùn)轉(zhuǎn)現(xiàn)象,導(dǎo)致用戶前端操作卡頓現(xiàn)象頻現(xiàn)。對此,信通公司協(xié)調(diào)硬件資源進(jìn)行優(yōu)化,及時擴(kuò)容低配置虛擬機(jī)CPU至48核,并新增4臺物理機(jī)(配置為80C/128G)同步投入運(yùn)行。
在提升硬件資源、降低SQL響應(yīng)時長后,PMS2.0系統(tǒng)響應(yīng)速度有所提升,但圖形編輯卡頓現(xiàn)象仍然存在,重要功能模塊運(yùn)行性能指標(biāo)仍不理想。信通公司從監(jiān)控指標(biāo)的運(yùn)行表象,分析發(fā)現(xiàn)在系統(tǒng)架構(gòu)及程序設(shè)計上系統(tǒng)也需要進(jìn)行進(jìn)一步的優(yōu)化處理,經(jīng)過充分調(diào)研、比對、分析并測試后,決定從系統(tǒng)架構(gòu)及數(shù)據(jù)分區(qū)方面開展優(yōu)化調(diào)整,采用更改柵格拓?fù)浞?wù)數(shù)據(jù)加載機(jī)制,由加載全省數(shù)據(jù)改為加載地市數(shù)據(jù),即“圖形分區(qū)方案”。將各地市按照電網(wǎng)數(shù)據(jù)量大小、地市行政區(qū)域界限劃分為6個區(qū)域,每個區(qū)域使用兩臺機(jī)器進(jìn)行集群部署柵格拓?fù)浞?wù),避免單點(diǎn)故障并負(fù)載均衡,從源頭解決圖形編輯卡頓問題,為開展各項業(yè)務(wù)應(yīng)用提供了最大保障。
2.3 接口優(yōu)化
針對PMS2.0與CMS營銷業(yè)務(wù)應(yīng)用系統(tǒng)接口穩(wěn)定性較差,導(dǎo)致配搶工單超時率高達(dá)9.35‰的問題,信通公司創(chuàng)新提出營銷側(cè)接口獨(dú)立部署的方案,將營銷接口服務(wù)剝離出來,單獨(dú)部署在4臺新的服務(wù)器上,并作F5負(fù)載均衡,大幅提升了接口性能;同時在所有接口都增加了監(jiān)控“握手”記錄的機(jī)制,每次接口調(diào)用時,都會產(chǎn)生一條日志記錄“握手”結(jié)果,極大地方便了問題定位與分析。
3 深化應(yīng)用
3.1 管理方法
3.1.1 管理目標(biāo)
安徽公司在項目建設(shè)中建立里程碑節(jié)點(diǎn)清晰的項目工作計劃,在總體進(jìn)度嚴(yán)格要求下依據(jù)任務(wù)緊迫性、實(shí)際開發(fā)及實(shí)施進(jìn)度合理調(diào)整計劃細(xì)節(jié),以確保達(dá)到“細(xì)節(jié)可操作、節(jié)點(diǎn)可控制、整體可完成”的目標(biāo)。endprint
3.1.2 管理細(xì)則
為確保工程的順利實(shí)施,安徽公司嚴(yán)格按照國家對系統(tǒng)集成項目管理的有關(guān)規(guī)定和系統(tǒng)實(shí)施方案,對項目實(shí)施過程中的進(jìn)度、質(zhì)量和資源的使用進(jìn)行全過程的管理。按照“統(tǒng)一規(guī)劃、統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一平臺、統(tǒng)一建設(shè)”的原則,PMS2.0系統(tǒng)實(shí)施工作成立項目領(lǐng)導(dǎo)小組、項目管控組、項目工作組、實(shí)施組、技術(shù)支持組,為項目推進(jìn)提供組織保障。
同時,安徽公司積極推行“126”管控模式,即圍繞“一個計劃”—里程碑計劃,執(zhí)行“兩個方案”—工作方案、單軌上線方案,推行“六項機(jī)制”—分級負(fù)責(zé)制、周月例會機(jī)制、關(guān)鍵指標(biāo)通報考核機(jī)制、進(jìn)度節(jié)點(diǎn)管控機(jī)制、問題管控機(jī)制、部門間橫向協(xié)同機(jī)制,細(xì)致分解工作任務(wù)項,落實(shí)各項工作責(zé)任方及時間節(jié)點(diǎn)。同時,要求各單位在嚴(yán)格執(zhí)行省公司“126”管控模式及機(jī)制的基礎(chǔ)上,要比照建立自己的管控機(jī)制,為項目進(jìn)度及質(zhì)量提供了保障。
3.2 用戶培訓(xùn)
為保障系統(tǒng)應(yīng)用效果,省公司組織16家地市公司的輸變配專家關(guān)鍵用戶進(jìn)行集中培訓(xùn),從中選拔出優(yōu)秀學(xué)員作為培訓(xùn)老師,與項目組專家一起組成培訓(xùn)團(tuán)隊,赴地市公司開展駐地培訓(xùn)。同時,根據(jù)培訓(xùn)效果,組織人員對教材進(jìn)行優(yōu)化,以實(shí)用為主,突出差異,重點(diǎn)培訓(xùn)PMS2.0和PMS1.0在業(yè)務(wù)和流程上的差異,縮短培訓(xùn)時間,使基層人員能夠盡快掌握。系統(tǒng)建設(shè)期間,累計培訓(xùn)12 854人次,培訓(xùn)范圍覆蓋管理人員及各個班組成員,培訓(xùn)覆蓋率100%,為各單位業(yè)務(wù)正常開展打下堅實(shí)基礎(chǔ)。
3.3 工具研發(fā)
隨著PMS2.0系統(tǒng)上線運(yùn)行,系統(tǒng)“應(yīng)用情況指標(biāo)”查詢模塊存在考核細(xì)度低于現(xiàn)場要求,功能完善進(jìn)度慢等問題,影響了實(shí)際指標(biāo)管控、分析工作。為此,安徽公司結(jié)合PMS2.0系統(tǒng)指標(biāo)體系與本地基層實(shí)際業(yè)務(wù)應(yīng)用情況,研發(fā)了“PMS智能管控分析平臺”,以精益化管理為主線,以推進(jìn)PMS2.0系統(tǒng)實(shí)用化應(yīng)用為重點(diǎn),統(tǒng)計查詢各業(yè)務(wù)指標(biāo),提升各地市公司專業(yè)人員業(yè)務(wù)應(yīng)用系統(tǒng)能力,建立統(tǒng)一、高效、集約的運(yùn)維檢修管理信息化平臺,滿足執(zhí)行層、管理層和決策層需要,提升電網(wǎng)運(yùn)檢管理精益化水平。
“PMS智能管控分析平臺”針對基礎(chǔ)設(shè)備臺賬、生產(chǎn)業(yè)務(wù)數(shù)據(jù)、系統(tǒng)運(yùn)行數(shù)據(jù)的各類指標(biāo)進(jìn)行分析、預(yù)警,秉承“以指標(biāo)促應(yīng)用,以應(yīng)用促管理”理念,從月度、季度、年度3個維度對指標(biāo)進(jìn)行科學(xué)組合,強(qiáng)化指標(biāo)評價對生產(chǎn)信息化專業(yè)管理的支撐作用,合理設(shè)置發(fā)布周期,科學(xué)指導(dǎo)各單位系統(tǒng)實(shí)用化推進(jìn),加大各單位管理改進(jìn)和自我提升的關(guān)注度。
4 結(jié)語
PMS2.0是“三集五大”體系建設(shè)中的“大檢修”體系內(nèi)容,支撐了運(yùn)維檢修全過程精益化管理和電網(wǎng)資產(chǎn)的全壽命周期管理,安徽公司通過以上技術(shù)上、管理上的一系列措施,有效地提升了系統(tǒng)性能,提高了用戶體驗。目前,該系統(tǒng)已在安徽公司全面應(yīng)用推廣,系統(tǒng)運(yùn)行穩(wěn)定,功能應(yīng)用可靠,有效支撐了安徽公司現(xiàn)有設(shè)備資產(chǎn)的運(yùn)維檢修、全壽命周期管理。
Optimization and application of equipment (asset)
operation and maintenance lean management system
Zhang Yongmei, Jia Hui, Tang Yixuan, Yao Zhen, Wang Li
(State Grid AnHui Information &Telecommunication Company, Hefei 230061, China)
Abstract: With the equipment (asset) operation and maintenance lean management system of State Grid Anhui Electric Power Company on the line, achieved a horizontal, vertical multi-system data sharing and business integration, and promoted the level of production management information to a new level. This paper introduces the system tuning in the process of system construction, such as slow data access, graphics caton and poor interface stability, and elaborated the deepen application management methods and the corresponding measures of the PMS2.0 system.
Key words: system structure; performance tuning; “126” management and control; deepen applicationendprint