宋晶晶
摘要:針對(duì)通信站點(diǎn)分散、自然條件惡劣、不適宜派駐人員值守的狀況,提出了一種基于無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)模式。介紹了該系統(tǒng)的工作模式、軟件功能、軟件控制流程、軟件運(yùn)行的軟硬件環(huán)境及其性能。重點(diǎn)闡述了軟件的控制流程。實(shí)現(xiàn)了無人值守狀態(tài)下設(shè)備遠(yuǎn)程通信狀態(tài)監(jiān)控、故障診斷定位及故障修復(fù)工作,有效縮減了人力資源及交通等成本,提高了效率。系統(tǒng)測試驗(yàn)證了其在實(shí)際工作中的可行性。
關(guān)鍵詞:無人值守;綜合網(wǎng)絡(luò)管理系統(tǒng);自動(dòng)化;遠(yuǎn)程監(jiān)控
中圖分類號(hào):TP393文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2022)11-54-4
綜合網(wǎng)絡(luò)管理系統(tǒng)作為一個(gè)實(shí)用的、集成的、可普及的集成管理工具,已被各企業(yè)普遍使用。但實(shí)際情況中,部分站點(diǎn)分布廣且位于交通不發(fā)達(dá)地區(qū),有些站點(diǎn)自然條件非常惡劣,派駐人員值守管理有很大困難,且隨著企業(yè)通信崗位大幅縮減及勞動(dòng)力成本的不斷提高,很多站點(diǎn)處于無人或少人的狀態(tài)?;跓o人值守的綜合網(wǎng)絡(luò)管理系統(tǒng),在無人值守的情況下,對(duì)設(shè)備及環(huán)境進(jìn)行集中監(jiān)控,對(duì)數(shù)據(jù)進(jìn)行及時(shí)采集,以便及時(shí)了解現(xiàn)場的情況,并根據(jù)實(shí)際情況發(fā)送一些簡單的控制命令,實(shí)現(xiàn)遠(yuǎn)程通信狀態(tài)監(jiān)控、故障診斷定位及故障修復(fù)工作[1],有效縮減了人力資源及交通等成本,提高了效率。
無人值守遠(yuǎn)程控制系統(tǒng)由遠(yuǎn)端綜合站控軟件和本地綜合網(wǎng)管軟件組成。遠(yuǎn)端綜合站控軟件提供無人值守及自動(dòng)化管理能力[2],功能上等價(jià)于遠(yuǎn)端站智能代理;本地綜合網(wǎng)管軟件提供遠(yuǎn)程管控能力,功能上等價(jià)于管理員。無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)組成如圖1所示。
系統(tǒng)設(shè)計(jì)堅(jiān)持高可靠性、實(shí)時(shí)性、實(shí)用性、兼容性、模塊化、可維護(hù)性、可擴(kuò)展性和易升級(jí)的原則,兼顧經(jīng)濟(jì)性。
無人值守的遠(yuǎn)程控制網(wǎng)絡(luò)管理系統(tǒng)主要包括設(shè)備自檢、鏈路檢測、故障診斷、預(yù)案管理及系統(tǒng)維護(hù)五大功能模塊。各模塊之間協(xié)作完成各項(xiàng)功能;各個(gè)模塊作為多個(gè)可執(zhí)行程序在后臺(tái)自動(dòng)啟動(dòng)運(yùn)行[3]。當(dāng)終端首次登錄網(wǎng)管軟件,并且通過安全驗(yàn)證,該軟件會(huì)與自身各模塊進(jìn)行一次內(nèi)部通信,檢測模塊是否已經(jīng)正常啟動(dòng)并且運(yùn)行正常。如果存在某個(gè)模塊未正常啟動(dòng)或響應(yīng)異常,則通過后臺(tái)服務(wù)監(jiān)控程序?qū)υ撃K進(jìn)行重啟,并在事件欄打印相關(guān)信息,通告給操作人員。
遠(yuǎn)端綜合站控設(shè)備自檢模塊為本地綜合網(wǎng)管設(shè)備監(jiān)測提供實(shí)時(shí)數(shù)據(jù)支撐[4];遠(yuǎn)端綜合站控鏈路檢測模塊為本地綜合網(wǎng)管鏈路監(jiān)測提供實(shí)時(shí)鏈路質(zhì)量數(shù)據(jù);本地綜合網(wǎng)管故障診斷調(diào)用遠(yuǎn)端綜合站控故障診斷模塊執(zhí)行故障診斷;遠(yuǎn)端綜合站控執(zhí)行本地綜合網(wǎng)管下發(fā)的預(yù)案;遠(yuǎn)端綜合站控自動(dòng)巡檢為本地綜合網(wǎng)管遠(yuǎn)程維護(hù)上報(bào)巡檢結(jié)果。
2.1軟件功能
(1)設(shè)備自檢
設(shè)備自檢包括特征參數(shù)的檢測和診斷評(píng)估自身運(yùn)行狀態(tài),各類設(shè)備對(duì)外提供信息輸出接口,由綜合網(wǎng)絡(luò)管理系統(tǒng)軟件匯集并上報(bào)。通過自檢,可以獲悉各設(shè)備是否運(yùn)行正常,是否需要維護(hù)或技術(shù)支持。對(duì)于主備設(shè)備,可以進(jìn)行“或”的操作,即有一臺(tái)可以正常運(yùn)行即可保障系統(tǒng)正常運(yùn)行;對(duì)于上、下行串聯(lián)設(shè)備,則進(jìn)行“與”的操作,即有一臺(tái)(套)設(shè)備工作異常,則無法保障系統(tǒng)正常運(yùn)行。
(2)鏈路檢測
綜合網(wǎng)絡(luò)管理軟件定時(shí)檢測鏈路的連通性、時(shí)延、丟包率和收發(fā)速率等質(zhì)量信息,將鏈路測試結(jié)果收集,生成鏈路檢測報(bào)告,上報(bào)綜合網(wǎng)管鏈路監(jiān)測模塊,若有告警則上報(bào)綜合網(wǎng)管拓?fù)浔O(jiān)控模塊。任務(wù)執(zhí)行前,通信綜合網(wǎng)管將鏈路測試結(jié)果收集,生成鏈路狀態(tài)統(tǒng)計(jì)評(píng)估報(bào)告,評(píng)估通信鏈路對(duì)任務(wù)的支撐能力。當(dāng)鏈路建立成功后,綜合網(wǎng)管軟件會(huì)向遠(yuǎn)端軟件發(fā)送小包數(shù)據(jù)驗(yàn)證鏈路通信狀況,若收發(fā)延遲穩(wěn)定、無丟包情況,則判定通信正常;若收發(fā)延遲跳變或丟包率高,則判定通信鏈路不穩(wěn)定;若發(fā)包無響應(yīng),則判定通信異常。
(3)故障診斷
故障診斷是由網(wǎng)管系統(tǒng)軟件發(fā)起故障診斷命令,設(shè)備經(jīng)過查詢后將故障源信息上報(bào)網(wǎng)管系統(tǒng)。網(wǎng)管系統(tǒng)軟件監(jiān)控到設(shè)備故障或鏈路異常,向相關(guān)設(shè)備發(fā)起故障診斷指令,如果設(shè)備定位故障,則將故障源上報(bào)綜合網(wǎng)管系統(tǒng)。設(shè)備進(jìn)行故障判斷,首先,以設(shè)備通斷狀態(tài)為基礎(chǔ),設(shè)備中斷則判定設(shè)備不正常;其次,檢測設(shè)備狀態(tài)參數(shù),如溫度過高告警等,如果這些參數(shù)異常,則判定設(shè)備不正常,系統(tǒng)無法正常工作;最后,檢測設(shè)備的性能參數(shù),如累計(jì)加電時(shí)間,若累計(jì)加電時(shí)間超過了設(shè)備安全使用上限,則判定設(shè)備存在風(fēng)險(xiǎn)、系統(tǒng)運(yùn)行存在風(fēng)險(xiǎn)。
(4)預(yù)案管理
預(yù)案管理功能預(yù)先錄入需要修改的設(shè)備參數(shù)及參數(shù)值,通過執(zhí)行預(yù)案完成對(duì)多類設(shè)備參數(shù)的統(tǒng)一、有序修改,從而達(dá)到一鍵更換遠(yuǎn)端站點(diǎn)設(shè)備配置的目的。預(yù)案管理功能包括預(yù)案生成、預(yù)案編輯、預(yù)案傳輸、預(yù)案解析和預(yù)案執(zhí)行。預(yù)案管理功能的操作對(duì)象為預(yù)案文件,預(yù)案文件通過IP網(wǎng)傳輸,使用UDP協(xié)議。預(yù)案管理功能可以有效縮短遠(yuǎn)端站點(diǎn)執(zhí)行不同任務(wù)時(shí)任務(wù)轉(zhuǎn)換的時(shí)間,減少人員操作,提高系統(tǒng)容錯(cuò)率。
(5)系統(tǒng)維護(hù)
系統(tǒng)維護(hù)主要是針對(duì)系統(tǒng)內(nèi)各設(shè)備和鏈路的狀態(tài),進(jìn)行自動(dòng)巡檢,并生成巡檢報(bào)告,上報(bào)本地綜合網(wǎng)管軟件。通過自動(dòng)巡檢報(bào)告可評(píng)估當(dāng)前系統(tǒng)正常完成任務(wù)的可能性;可以預(yù)測設(shè)備失效率,提前進(jìn)行設(shè)備維修和更換。巡檢報(bào)告內(nèi)容包括記錄設(shè)備當(dāng)前狀態(tài),以及周期內(nèi)設(shè)備狀態(tài)統(tǒng)計(jì);記錄主要鏈路當(dāng)前狀態(tài),以及周期內(nèi)主要鏈路狀態(tài)統(tǒng)計(jì)。
2.2軟件控制流程
本地綜合網(wǎng)管軟件具備遠(yuǎn)程監(jiān)控能力,包括設(shè)備狀態(tài)信息監(jiān)控、拓?fù)錉顟B(tài)監(jiān)視及資源信息管理等。主要完成心跳監(jiān)測、資源管理、設(shè)備監(jiān)測、鏈路監(jiān)測、拓?fù)浔O(jiān)視、故障診斷、預(yù)案管理和遠(yuǎn)程維護(hù)幾大功能。
心跳監(jiān)測是為了確保實(shí)時(shí)監(jiān)測遠(yuǎn)端綜合站控軟件的入網(wǎng)狀態(tài),在本地綜合網(wǎng)管和遠(yuǎn)端綜合站控軟件之間定時(shí)進(jìn)行的一問一答式的動(dòng)作。
資源管理是本地綜合網(wǎng)管軟件,對(duì)遠(yuǎn)端綜合站控軟件的所有資源信息具備管理能力,包括查詢、添加、修改和刪除。數(shù)據(jù)處理過程由本地綜合網(wǎng)管軟件發(fā)起,遠(yuǎn)端綜合站控軟件進(jìn)行響應(yīng)處理和應(yīng)答。
設(shè)備監(jiān)測是遠(yuǎn)端綜合站控軟件實(shí)時(shí)將各變化的設(shè)備自檢參數(shù)上報(bào)。設(shè)備狀態(tài)信息監(jiān)視分為本地綜合網(wǎng)管軟件主動(dòng)查詢和遠(yuǎn)端綜合站控軟件主動(dòng)上報(bào)2種,主動(dòng)查詢由本地綜合網(wǎng)管軟件發(fā)起,遠(yuǎn)端綜合站控軟件將當(dāng)前設(shè)備狀態(tài)參數(shù)信息返回;主動(dòng)上報(bào)是指遠(yuǎn)端綜合站控軟件通過系統(tǒng)自檢或輪詢檢測到設(shè)備狀態(tài)變化后,主動(dòng)上報(bào)本地綜合網(wǎng)管軟件。
鏈路監(jiān)測是遠(yuǎn)端綜合站控軟件實(shí)時(shí)將鏈路質(zhì)量上報(bào)本地綜合網(wǎng)管。通信綜合網(wǎng)管支持對(duì)任務(wù)鏈路進(jìn)行自動(dòng)檢查及測試。通信綜合網(wǎng)管定時(shí)監(jiān)測鏈路的連通性和時(shí)延等質(zhì)量信息,任務(wù)執(zhí)行前,通信綜合網(wǎng)管將鏈路測試結(jié)果收集,生成鏈路狀態(tài)統(tǒng)計(jì)評(píng)估報(bào)告,評(píng)估通信鏈路對(duì)任務(wù)的支撐能力。
拓?fù)浔O(jiān)視提供遠(yuǎn)端綜合站控端站內(nèi)設(shè)備連接關(guān)系及連接狀態(tài)信息,若軟件監(jiān)測到設(shè)備狀態(tài)或網(wǎng)絡(luò)連接狀態(tài)變化,則主動(dòng)將拓?fù)鋽?shù)據(jù)打包壓縮處理后上報(bào)本地綜合網(wǎng)管。通過拓?fù)溥B接關(guān)系視圖,可以清晰顯示各設(shè)備及鏈路等的連接關(guān)系,及軟件與后臺(tái)服務(wù)的連接狀態(tài)和設(shè)備自檢狀態(tài)。
故障診斷提供故障的定位功能:本地綜合網(wǎng)管發(fā)現(xiàn)遠(yuǎn)端設(shè)備故障后向遠(yuǎn)端綜合站控軟件發(fā)起故障診斷請(qǐng)求,遠(yuǎn)端綜合站控軟件將查詢的故障源信息打包發(fā)送至本地綜合網(wǎng)管。
預(yù)案管理支持任務(wù)預(yù)案和應(yīng)急預(yù)案:本地綜合網(wǎng)管生成預(yù)案文件,下發(fā)至遠(yuǎn)端綜合站控,遠(yuǎn)端綜合站控解析預(yù)案文件,下發(fā)被管對(duì)象執(zhí)行(包括參數(shù)配置和鏈路切換等操作),被管對(duì)象將配置生效情況上報(bào)遠(yuǎn)端綜合站控,遠(yuǎn)端綜合站控生成預(yù)案執(zhí)行結(jié)果的回饋文件,將預(yù)案執(zhí)行結(jié)果上報(bào)本地綜合網(wǎng)管。預(yù)案管理功能的操作對(duì)象為預(yù)案文件。預(yù)案文件通過IP網(wǎng)傳輸,使用UDP協(xié)議。執(zhí)行任務(wù)前,本地綜合網(wǎng)管制定預(yù)案并下發(fā),若任務(wù)中監(jiān)控到網(wǎng)絡(luò)故障,本地綜合網(wǎng)管下發(fā)緊急預(yù)案,遠(yuǎn)端綜合站控執(zhí)行預(yù)案,解決通信故障問題。
遠(yuǎn)程維護(hù)主要是遠(yuǎn)端綜合站控軟件定期將各設(shè)備的服務(wù)參數(shù)及工作狀態(tài)進(jìn)行自檢,綜合生成自檢報(bào)告,并上報(bào)本地綜合網(wǎng)管。本地綜合網(wǎng)管與遠(yuǎn)端綜合站控軟件間的控制流程如圖2所示。
遠(yuǎn)端綜合站控軟件主要完成設(shè)備自檢、鏈路檢測、故障診斷、預(yù)案執(zhí)行和自動(dòng)巡檢功能。
遠(yuǎn)端綜合站控軟件通過向系統(tǒng)設(shè)備發(fā)送自檢命令,系統(tǒng)設(shè)備通過自檢本身健康狀態(tài),將自檢結(jié)果上報(bào)軟件設(shè)備監(jiān)測模塊,若有告警,上報(bào)軟件拓?fù)浔O(jiān)控模塊。
鏈路檢測是監(jiān)測通信鏈路的通斷及鏈路質(zhì)量,確定是否可以保障通信鏈路的建立及保持。遠(yuǎn)端綜合站控軟件通過向系統(tǒng)設(shè)備發(fā)送鏈路質(zhì)量監(jiān)測命令,將鏈路質(zhì)量數(shù)據(jù)上報(bào)軟件鏈路監(jiān)測模塊,若有告警則上報(bào)軟件拓?fù)浔O(jiān)控模塊。
故障診斷是由遠(yuǎn)端綜合站控軟件發(fā)起故障診斷命令,系統(tǒng)設(shè)備經(jīng)查詢后將故障源信息上報(bào)遠(yuǎn)端綜合站控軟件的過程。
預(yù)案執(zhí)行是指遠(yuǎn)端綜合站控收到下發(fā)的預(yù)案后,將預(yù)案轉(zhuǎn)化為配置工作流程,包括參數(shù)設(shè)置和設(shè)備標(biāo)校等,按照配置工作流程將配置信息分別下發(fā)各系統(tǒng)設(shè)備執(zhí)行,系統(tǒng)設(shè)備統(tǒng)計(jì)預(yù)案執(zhí)行結(jié)果,向遠(yuǎn)端綜合站控上報(bào)。
自動(dòng)巡檢是遠(yuǎn)端綜合站控軟件通過設(shè)置自動(dòng)輪詢命令[5],定時(shí)向系統(tǒng)設(shè)備發(fā)送巡檢命令,系統(tǒng)設(shè)備將生成的巡檢報(bào)告上報(bào)遠(yuǎn)端綜合站控軟件。
遠(yuǎn)端綜合站控軟件與系統(tǒng)設(shè)備間的流程如圖3所示。
2.3軟件運(yùn)行環(huán)境
基于無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)運(yùn)行所需硬件環(huán)境要求:CPU≥3.4 GHz;內(nèi)存≥8 GB;顯卡為獨(dú)立顯卡;硬盤≥1 TB;顯示器的分辨率為1 920×1 080;通信/網(wǎng)絡(luò)接口卡為千兆網(wǎng)卡;
基于無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)運(yùn)行所需軟件環(huán)境要求:操作系統(tǒng)為麒麟操作系統(tǒng);數(shù)據(jù)庫管理系統(tǒng)為達(dá)夢(mèng)數(shù)據(jù)庫;應(yīng)用支撐軟件為JDK;測試軟件為JTest。
2.4軟件性能
本地綜合網(wǎng)管與遠(yuǎn)端綜合站控信息傳輸交換采用文件傳輸和數(shù)據(jù)幀2種方式。文件傳輸用于非實(shí)時(shí)控制、評(píng)估報(bào)告和報(bào)表等;數(shù)據(jù)幀傳輸用于實(shí)施控制和實(shí)時(shí)狀態(tài)上報(bào)。
在軟件設(shè)計(jì)中,文件傳輸種類統(tǒng)一制定,文件名稱和信息格式統(tǒng)一定義。
文件傳輸信息種類包括:
①設(shè)備配置文件、參數(shù)宏文件和控制過程文件等。
②鏈路檢測報(bào)告、設(shè)備自檢報(bào)告和自動(dòng)巡檢報(bào)告等。
在軟件設(shè)計(jì)中,數(shù)據(jù)幀格式統(tǒng)一定義,數(shù)據(jù)幀傳輸種類包括控制幀和監(jiān)視幀。采用不同的傳輸方式,有利于降低監(jiān)控信息交換對(duì)通信帶寬占用,減少信道資源占用。
軟件中,本地綜合網(wǎng)管與遠(yuǎn)端綜合站控信息傳輸采用以下原則進(jìn)行信息傳輸:
①在網(wǎng)絡(luò)帶寬受限的條件下,窄帶數(shù)據(jù)壓縮傳輸服務(wù)考慮到傳輸實(shí)時(shí)性和可靠性,采用RUDP協(xié)議,RUDP協(xié)議在UDP協(xié)議基礎(chǔ)上增加確認(rèn)機(jī)制、重傳機(jī)制和滑動(dòng)窗口機(jī)制。
②數(shù)據(jù)壓縮傳輸,使用zlib數(shù)據(jù)壓縮函數(shù)庫,zlib使用deflate算法,deflate算法是無損數(shù)據(jù)壓縮算法,先使用LZ77算法壓縮,然后使用哈夫曼編碼算法壓縮。
針對(duì)該綜合網(wǎng)絡(luò)管理系統(tǒng)進(jìn)行功能測試,建立系統(tǒng)運(yùn)行的安裝環(huán)境后,安裝運(yùn)行軟件,系統(tǒng)內(nèi)各設(shè)備參數(shù)、狀態(tài)等信息通過相關(guān)軟件模擬,并對(duì)系統(tǒng)內(nèi)各功能模塊進(jìn)行用例測試,發(fā)現(xiàn)測試結(jié)果均與預(yù)期結(jié)果相符,符合軟件設(shè)計(jì)要求系統(tǒng)測試的本地綜合網(wǎng)管顯示遠(yuǎn)端綜合站控的拓?fù)淙鐖D4所示。
本系統(tǒng)的遠(yuǎn)端綜合站控軟件—本地綜合網(wǎng)管軟件管理模式借鑒智能代理的概念,智能代理是代表管理者完成特定任務(wù)的軟件實(shí)體,它通過本地或就近管理的資源,能夠感知網(wǎng)絡(luò)狀態(tài)的變化,并能夠利用管理的資源信息來相應(yīng)調(diào)整下一步的行為。遠(yuǎn)程綜合站控軟件就是一個(gè)具有智能代理功能的軟件實(shí)體。該系統(tǒng)借鑒國內(nèi)外無人值守站建設(shè)的先進(jìn)理念和工程應(yīng)用實(shí)踐[6],基于管理流程規(guī)范化、系統(tǒng)能力統(tǒng)一化和系統(tǒng)接口標(biāo)準(zhǔn)化的設(shè)計(jì)原則,分析設(shè)計(jì)了適合無人值守及自動(dòng)化運(yùn)行的綜合網(wǎng)絡(luò)管理系統(tǒng)的管理流程,解決了沒有常駐人員對(duì)設(shè)備進(jìn)行操作或維護(hù)、完全通過遠(yuǎn)程監(jiān)控和自動(dòng)化流程對(duì)系統(tǒng)進(jìn)行操作和運(yùn)行管理的運(yùn)維需求,具有顯著效果。
[1]席江月,郭威.中波臺(tái)機(jī)房遠(yuǎn)程監(jiān)控與無人值機(jī)項(xiàng)目的設(shè)計(jì)與實(shí)現(xiàn)[J].西部廣播電視,2019(3):229-230.
[2]陳志剛.遠(yuǎn)程監(jiān)控系統(tǒng)在CMMB無人值守機(jī)房日常維護(hù)中的應(yīng)用[J].廣播電視信息,2014(10):95-97.
[3]孔祥新,劉敬科,閆紹敏.無人值守機(jī)房遠(yuǎn)程智能監(jiān)控系統(tǒng)[J].電子技術(shù),2011,38(10):26-27.
[4]張榮升.無人值守機(jī)房遠(yuǎn)程監(jiān)控系統(tǒng)的設(shè)計(jì)分析[J].大眾科學(xué),2020(3):26-27.
[5]秦積偉.廣播電視無人值守機(jī)房的設(shè)計(jì)與實(shí)現(xiàn)[J].甘肅科技, 2018,34(22):26-27.
[6]宋玉龍.淺析無人值守機(jī)房遠(yuǎn)程監(jiān)控和安防系統(tǒng)的建設(shè)[J].中外企業(yè)家,2018(13):109.