楊帆 程杰
【摘要】? ? 本文針對結(jié)合警用地理信息系統(tǒng)的實際情況以及遇到的問題,詳細設(shè)計了警用地理信息系統(tǒng)的運維監(jiān)控管理系統(tǒng)的功能模塊和功能組成,探索在運維實際監(jiān)測中對監(jiān)測對象集中統(tǒng)一,采用精細化監(jiān)測及管控方法,對具體問題進行處理與優(yōu)化。將該管理設(shè)計的時效性、科學(xué)性進行彰顯,為下一步工作開展提供參考。
【關(guān)鍵詞】? ? 警用地理信息系統(tǒng)? ? 運維監(jiān)控管理? ? PGIS
引言
警用地理信息系統(tǒng)(PGIS平臺)是公安信息化重要的基礎(chǔ)性、綜合性應(yīng)用支撐平臺,也是“金盾工程”二期三大高端應(yīng)用平臺之一。在“金盾工程”二期及《全國公安裝備建設(shè)“十二五”規(guī)劃》的推動下,公安部、32個省級、300多個地市公安機關(guān)基本建成了覆蓋全國的PGIS平臺,警用地理信息系統(tǒng)技術(shù)給公安業(yè)務(wù)提供GIS服務(wù),在公安業(yè)務(wù)中得到了快速普及和應(yīng)用,在各地公安機關(guān)打防管控、服務(wù)社會等工作中發(fā)揮了、基礎(chǔ)支撐作用,對各警種開展可視化實戰(zhàn)應(yīng)用起到了積極的促進作用,取得顯著應(yīng)用成效。隨著系統(tǒng)接入的數(shù)據(jù)量越來越大,應(yīng)用越來越多,系統(tǒng)的運行環(huán)境也變得更加復(fù)雜,運行維護工作困難。雖然各個部分有各自的監(jiān)控管理手段,但缺乏一個集中、統(tǒng)一的監(jiān)控管理,及時發(fā)現(xiàn)虛擬機、GIS站點、地理信息服務(wù)等資源可能出現(xiàn)的風(fēng)險弊端與漏洞問題。通過研究后發(fā)現(xiàn),當(dāng)下使用軟件缺乏規(guī)范性,且服務(wù)主體以特點不同及需求差異也會導(dǎo)致相繼問題發(fā)生。因此,對上述兩點進行側(cè)重分析。以一種更為先進集約的管控方式,進行高效統(tǒng)一化監(jiān)控,以立體化形式呈現(xiàn)出來,具有較大的理論意義。
一、設(shè)計目標(biāo)
通過運維體系的建設(shè),結(jié)合構(gòu)建集中式的運維流程、系統(tǒng)監(jiān)控和綜合展示系統(tǒng),通過系統(tǒng)聯(lián)動,及時、準確、全面反映與掌握平臺的運行狀態(tài),保障各業(yè)務(wù)系統(tǒng)的正常運行,應(yīng)達成如下目標(biāo):
(1)實行集中管理,主動監(jiān)控。以平臺資源的訪問監(jiān)控為主線,構(gòu)建統(tǒng)一集成的資源服務(wù)監(jiān)控平臺,能夠及時、主動、的發(fā)現(xiàn)問題,并調(diào)度資源解決問題,形成警用地理信息平臺的運維管理主動服務(wù)的新局面。
(2)快速定位故障,快速恢復(fù)系統(tǒng)。建立集中的預(yù)警分析機制和自動化的事件處理能力。一旦發(fā)生故障問題該系統(tǒng)會根據(jù)發(fā)生故障的節(jié)點,對其進行及時反饋。系統(tǒng)會對其故障進行及時判斷。如發(fā)現(xiàn)風(fēng)險故障則對其明確。包括如何處理故障、評估故障燈。同時,該系統(tǒng)在完成故障修復(fù)后,會自動進行平臺復(fù)建。通過分析后在該系統(tǒng)可在較短時間內(nèi)進行故障排查、消除。對整體維修成本投入及快速維修起到積極推動作用。
(3)提高運行質(zhì)量與效率,合理利用系統(tǒng)資源。建立運維監(jiān)控管理系統(tǒng)后,可以實時了解整個系統(tǒng)資源的負載與使用情況,根據(jù)需要從整體角度考慮資源的合理使用,同時根據(jù)業(yè)務(wù)高峰期的不同來調(diào)劑業(yè)務(wù)系統(tǒng)對資源,如內(nèi)存和CPU的使用。
(4)規(guī)范系統(tǒng)運行管理,有序開展系統(tǒng)維護工作。參照相關(guān)IT行業(yè)運維規(guī)范,對運維管理工作進行優(yōu)化,對服務(wù)管理進行改善,并建立相關(guān)制度,將系統(tǒng)管理電子化,過程管理規(guī)范化。將管理制度與機制進行逐漸完善,對內(nèi)部流程中涉及的具體事宜進行彌補完善。落實責(zé)任管理機制與倒查機制。強化服務(wù)理念與服務(wù)質(zhì)量。
(5)共享運維經(jīng)驗,完善預(yù)案管理。不斷深化系統(tǒng)維護研究,對具體事項與經(jīng)驗等進行總結(jié)累計,發(fā)現(xiàn)其中的特點性。并根據(jù)實際情況進行檔案記錄,并通過網(wǎng)絡(luò)信息技術(shù)進行數(shù)據(jù)共享。將工作人員工作量及效率提高作為主要工作方向。
二、總體設(shè)計
運維監(jiān)控管理系統(tǒng)由五大功能模塊組成,分別是首頁、實時監(jiān)控、統(tǒng)計分析、系統(tǒng)管理、系統(tǒng)配置,系統(tǒng)功能設(shè)計結(jié)構(gòu)圖如下所示:
三、詳細設(shè)計
3.1首頁
首頁是運維監(jiān)控管理系統(tǒng)的入口,首頁展示系統(tǒng)的整體運行情況,以及運維監(jiān)控各部分最核心最重要的內(nèi)容。包括匯總統(tǒng)計、模塊配置、系統(tǒng)消息三個模塊。
3.2實時監(jiān)控
3.2.1服務(wù)器資源監(jiān)控
系統(tǒng)能監(jiān)控各個服務(wù)器的運行狀態(tài),相關(guān)資源使用率。包括CPU參數(shù)信息、內(nèi)存參數(shù)信息、網(wǎng)絡(luò)流量信息等,并能定時更新狀態(tài)信息。
GIS服務(wù)站點,一個GIS服務(wù)站點由若干個節(jié)點組成,可以監(jiān)控站點的CPU負載、內(nèi)存負載、事物量。通過對這些參數(shù)的監(jiān)控,了解掛載到站點的服務(wù)資源總體使用情況。
GIS服務(wù)器,監(jiān)控GIS Server狀態(tài)等。
應(yīng)用服務(wù)器,監(jiān)控Tomcat運行狀態(tài)情況。包括線程池信息、JVM信息、最大線程數(shù)和請求的統(tǒng)計信息等。
數(shù)據(jù)庫服務(wù)器,監(jiān)控數(shù)據(jù)庫的運行狀態(tài),包括數(shù)據(jù)庫的最大連接數(shù),當(dāng)前連接數(shù);數(shù)據(jù)庫最大Session數(shù)目,當(dāng)前Session數(shù)目;數(shù)據(jù)庫規(guī)劃表空間大小,表空間實際占用大小;數(shù)據(jù)庫I/0性能狀況采集等。
3.2.2服務(wù)監(jiān)控
服務(wù)監(jiān)控包括服務(wù)狀態(tài)監(jiān)控和服務(wù)方案監(jiān)控,服務(wù)狀態(tài)監(jiān)控能對服務(wù)的運行狀態(tài)進行定時監(jiān)控,當(dāng)某個服務(wù)發(fā)生異常時,能及時提醒管理員對該服務(wù)進行維護處理,保證平臺運行的穩(wěn)定;服務(wù)訪問監(jiān)控能對服務(wù)的訪問記錄進行監(jiān)控,當(dāng)用戶對注冊到平臺的服務(wù)進行調(diào)用、訪問時,監(jiān)控中心能及時的記錄到被訪問服務(wù)的基本信息。通過對服務(wù)訪問情況進行記錄,可為后續(xù)進行服務(wù)運行統(tǒng)計分析提供數(shù)據(jù)基礎(chǔ)。
3.2.3平臺運行監(jiān)控
用戶在訪問云GIS平臺時,系統(tǒng)能記錄用戶登錄基本信息,包括用戶名、登錄IP、登錄系統(tǒng)名稱、登錄時間等。通過對用戶訪問系統(tǒng)的情況進行監(jiān)控,一方面對平臺的安全性加強了一道保障,另一方面通過對平臺登錄用戶的大數(shù)據(jù)分析,進一步了解用戶的喜好,可以有針對性的優(yōu)化產(chǎn)品結(jié)構(gòu),提升平臺的可用性。
3.2.4異常報警
服務(wù)異常報警,在對服務(wù)進行監(jiān)控的過程中,服務(wù)如果發(fā)生異常情況,則會產(chǎn)生服務(wù)異常報警。服務(wù)異常報警可以實時推送給系統(tǒng)管理員,以讓系統(tǒng)管理員及時對異常服務(wù)進行恢復(fù),并解除報警信息。
服務(wù)器異常報警,在對服務(wù)器進行監(jiān)控的過程中,服務(wù)器如果發(fā)生異常情況,則會產(chǎn)生服務(wù)器異常報警,服務(wù)器異常報警信息可以實時推送給系統(tǒng)管理員,以讓系統(tǒng)管理員及時對異常服務(wù)器進行恢復(fù)處理,并解除報警信息。
3.3統(tǒng)計分析
3.3.1服務(wù)器統(tǒng)計
CPU利用率統(tǒng)計,能對服務(wù)器的CPU使用情況進行統(tǒng)計分析。包括CPU的平均使用率,CPU使用峰值,CPU使用超過閾值時間統(tǒng)計等。
內(nèi)存使用率統(tǒng)計,能對服務(wù)器的內(nèi)存使用情況進行統(tǒng)計分析。包括內(nèi)存的平均使用率,內(nèi)存使用峰值,內(nèi)存使用超過閾值時間統(tǒng)計等。
數(shù)據(jù)庫Session信息統(tǒng)計,能對服務(wù)器(特指數(shù)據(jù)庫服務(wù)器)的數(shù)據(jù)庫使用情況進行統(tǒng)計分析。
3.3.2服務(wù)統(tǒng)計
服務(wù)統(tǒng)計概覽,服務(wù)統(tǒng)計概覽主要顯示服務(wù)統(tǒng)計相關(guān)的幾個關(guān)鍵指標(biāo),比如平均響應(yīng)時間、服務(wù)訪問量Top10、響應(yīng)最慢服務(wù)Top10、服務(wù)運行狀態(tài)統(tǒng)計等。服務(wù)統(tǒng)計概覽頁面上的各項指標(biāo)支持自定義配置。
服務(wù)訪問量統(tǒng)計,服務(wù)訪問量統(tǒng)計是指統(tǒng)計在一個時間段內(nèi),各個服務(wù)被訪問的次數(shù)匯總。并可以列表的形式顯示服務(wù)訪問次數(shù)匯總情況。
用戶訪問量統(tǒng)計,用戶訪問量統(tǒng)計是指統(tǒng)計在過去的一個時間段內(nèi),各個用戶訪問服務(wù)的次數(shù)匯總。并可以列表的形式顯示用戶訪問次數(shù)匯總情況。
IP流量統(tǒng)計,IP流量統(tǒng)計是指統(tǒng)計在過去的一個時間段內(nèi),各個IP地址訪問服務(wù)的次數(shù)匯總。并可以列表的形式顯示用戶IP訪問次數(shù)匯總情況。
成功率統(tǒng)計,服務(wù)成功率統(tǒng)計是指統(tǒng)計在過去的一個時間段內(nèi),服務(wù)訪問成功率的總體情況。并可以列表的形式顯示每天的用戶訪問成功率匯總情況。
響應(yīng)時間統(tǒng)計,響應(yīng)時間統(tǒng)計是指統(tǒng)計在過去的一個時間段內(nèi),服務(wù)訪問響應(yīng)時間的總體情況。并可以列表的形式顯示每天的用戶訪問平均響應(yīng)時間匯總情況。
運行狀態(tài)統(tǒng)計,運行狀態(tài)統(tǒng)計是指統(tǒng)計在過去的一個時間段內(nèi),服務(wù)運行狀態(tài)的總體情況。并可以列表的形式顯示異常服務(wù)的具體異常信息,如發(fā)現(xiàn)異常時間、異常持續(xù)時間、異?;謴?fù)時間等。
3.3.3平臺運行統(tǒng)計
是指對平臺的運行狀況進行統(tǒng)計分析,如針對用戶的訪問情況進行統(tǒng)計分析,對系統(tǒng)產(chǎn)生的異常日志進行統(tǒng)計分析。通過對平臺運行狀況的分析,可以有針對性的對平臺進行優(yōu)化調(diào)整,提升平臺運行效率。
3.4系統(tǒng)管理
系統(tǒng)管理是指對運維監(jiān)控管理系統(tǒng)所監(jiān)控的對象進行管理。包括支撐云GIS平臺的資源池、虛擬機服務(wù)器、以及云GIS平臺擁有的各類服務(wù)資源。
1、服務(wù)器管理。服務(wù)器管理的對象是支撐云GIS平臺的各個虛擬機。包括數(shù)據(jù)庫服務(wù)器、GIS服務(wù)器和應(yīng)用服務(wù)器等。
2、服務(wù)管理。運維系統(tǒng)能對所監(jiān)控的地理信息相關(guān)服務(wù)進行管理,包括對服務(wù)的增刪改的操作。服務(wù)可以基于站點進行批量注冊,也可以進行單個服務(wù)注冊,服務(wù)不局限于ArcGIS Server服務(wù)。
3、用戶管理。運維監(jiān)控管理系統(tǒng)也有用戶體系、權(quán)限體系。運維監(jiān)控系統(tǒng)中不同的模塊可以對不同等級的人分權(quán)限進行開放。用戶管理模塊中,可以對用戶進行增刪改??梢远x系統(tǒng)角色,并對各個功能模塊進行角色劃分,根據(jù)角色給用戶進行分組。從而達到控制不同的用戶訪問不同權(quán)限等級的功能模塊及功能點。
3.5系統(tǒng)配置
1、服務(wù)引擎配置。服務(wù)引擎配置是指配置系統(tǒng)所監(jiān)控的GIS Server站點,可支持對多個站點進行配置,可對服務(wù)引擎進行增刪改查。
2、服務(wù)監(jiān)控配置。服務(wù)監(jiān)控配置是指對服務(wù)的運行狀態(tài)進行監(jiān)控所需的配置。如服務(wù)運行狀態(tài)監(jiān)控時間間隔設(shè)置、服務(wù)運行狀態(tài)類型設(shè)置等。
3、異常報警配置。異常報警配置是指對各類異常報警的規(guī)則進行設(shè)置,如設(shè)置報警的類型、報警的等級、報警信息的推送方式、報警信息推送目的地等。
4、日志收割配置。服務(wù)日志收割是指定時收割管理平臺的日志。主要包括日志存儲配置、日志收割管理。
四、結(jié)語
運維監(jiān)控管理是保障警用地理信息系統(tǒng)穩(wěn)定、安全運行的后臺支撐系統(tǒng),提供對PGIS服務(wù)的管理、用戶體系的管理,通過設(shè)備監(jiān)控、流量監(jiān)控、網(wǎng)絡(luò)監(jiān)控等技術(shù)手段保證PGIS平臺的安全與穩(wěn)定的運行,并對業(yè)務(wù)功能調(diào)用、信息資源訪問、系統(tǒng)運維管理等相關(guān)流程進行管控,為日后更好的高效管理與具體應(yīng)用奠定基礎(chǔ)。
參? 考? 文? 獻
[1]薛梅.推動地理空間信息應(yīng)用,服務(wù)公共安全——警用地理信息系統(tǒng)建設(shè)探索 [C],
[2]趙凱慧;夏春林.警用地理信息基礎(chǔ)平臺的設(shè)計[J];測繪與空間地理信息;
[3]易燕妮;吳曉佳;曾耀國.警用地理信息系統(tǒng)建設(shè)中地理信息的實用性探究[J];測繪與空間地理信息;