朱曉潔
(1.中煤科工集團(tuán)常州研究院有限公司,江蘇 常州 213015;2.天地(常州)自動(dòng)化股份有限公司,江蘇 常州 213015)
監(jiān)測(cè)數(shù)據(jù)是煤礦安全監(jiān)控系統(tǒng)進(jìn)行分析、決策的基礎(chǔ),因此保證監(jiān)測(cè)數(shù)據(jù)的一致性和完整性,對(duì)于監(jiān)控系統(tǒng)的可靠運(yùn)行是至關(guān)重要的。
由于安全監(jiān)控系統(tǒng)架構(gòu)復(fù)雜,數(shù)據(jù)傳輸涉及多層節(jié)點(diǎn),包括傳感器、分站、網(wǎng)關(guān)、交換機(jī)和地面主機(jī)。在監(jiān)控系統(tǒng)運(yùn)行過(guò)程中,可能存在供電不穩(wěn)、網(wǎng)絡(luò)中斷、網(wǎng)絡(luò)阻塞或系統(tǒng)設(shè)備失效等故障,導(dǎo)致監(jiān)測(cè)數(shù)據(jù)無(wú)法上傳,影響系統(tǒng)有效決策。為了保證監(jiān)測(cè)數(shù)據(jù)的連續(xù)性,在故障修復(fù)后,需要將故障期間的監(jiān)測(cè)數(shù)據(jù)重新上傳。
近年來(lái),斷線續(xù)傳技術(shù)在各領(lǐng)域得到廣泛研究。李夏苗等[1]將斷線續(xù)傳應(yīng)用于中繼衛(wèi)星調(diào)度,提高了數(shù)傳任務(wù)完成率;陳令等[2]在四載波基站遠(yuǎn)程升級(jí)中采用斷線續(xù)傳技術(shù)提高了升級(jí)效率和穩(wěn)定性;朱宏志等[3]設(shè)計(jì)了異構(gòu)系統(tǒng)的跨節(jié)點(diǎn)斷線續(xù)傳;張震等[4]利用多任務(wù)斷線續(xù)傳實(shí)現(xiàn)了智能車載域控制器數(shù)據(jù)的高效傳輸和準(zhǔn)確提取。
由于上一代煤礦安全監(jiān)控系統(tǒng)采用時(shí)分制總線架構(gòu),巡檢周期長(zhǎng),若采用斷線續(xù)傳會(huì)影響正常巡檢周期內(nèi)的數(shù)據(jù)上傳與控制[5],因此基本不支持?jǐn)嗑€續(xù)傳功能。隨著工業(yè)環(huán)網(wǎng)在井下的普及應(yīng)用,為斷線續(xù)傳提供了高速網(wǎng)絡(luò)傳輸通道[6]。目前,煤礦安全監(jiān)控系統(tǒng)經(jīng)過(guò)升級(jí)改造,在數(shù)據(jù)智能采集、數(shù)據(jù)智能分析和智能控制等方面水平得到了很大提升[7],但是對(duì)斷線續(xù)傳的研究仍不多。有的監(jiān)控系統(tǒng)雖然支持?jǐn)嗑€續(xù)傳功能,但使用效果并不理想,存在操作復(fù)雜、數(shù)據(jù)漏傳、數(shù)值錯(cuò)誤和數(shù)據(jù)續(xù)傳耗時(shí)長(zhǎng)等諸多問(wèn)題?;诖?,針對(duì)現(xiàn)有煤礦安全監(jiān)控系統(tǒng)的架構(gòu),分析了數(shù)據(jù)傳輸故障類型及數(shù)據(jù)特點(diǎn),提出了一種基于礦用監(jiān)控分站的斷線續(xù)傳設(shè)計(jì)方案。
目前,主流安全監(jiān)控系統(tǒng)主要采用基于工業(yè)環(huán)網(wǎng)的分布式主從架構(gòu)[8-9],煤礦安全監(jiān)控系統(tǒng)架構(gòu)如圖1。
圖1 煤礦安全監(jiān)控系統(tǒng)架構(gòu)Fig.1 Architecture of coal mine safety monitoring system
地面主機(jī)作為系統(tǒng)大腦安裝在地面,網(wǎng)關(guān)和各種交換機(jī)構(gòu)成傳輸網(wǎng)絡(luò),監(jiān)控分站和傳感器根據(jù)實(shí)際需求在井下分布安裝。傳感器數(shù)據(jù)通過(guò)RS485 等現(xiàn)場(chǎng)總線上傳至分站,分站通過(guò)網(wǎng)關(guān)或直接采用網(wǎng)絡(luò)通信將數(shù)據(jù)傳輸至地面主機(jī)。分站與上位機(jī)之間的數(shù)據(jù)傳輸稱為主通信,根據(jù)主通信方式將分站分為總線型分站和網(wǎng)絡(luò)型分站。
從傳感器數(shù)據(jù)流向來(lái)看,監(jiān)測(cè)數(shù)據(jù)經(jīng)過(guò)傳感器、分站和網(wǎng)關(guān)上傳至主機(jī),在此過(guò)程中,主要可能出現(xiàn)以下幾種數(shù)據(jù)傳輸故障[10-11]:①傳感器與分站通信中斷;②分站與上位機(jī)通信中斷;③分站與網(wǎng)關(guān)通信中斷;④網(wǎng)關(guān)與主機(jī)通信中斷。由于第1 種情況中分站功能失效,只能通過(guò)傳感器實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)及續(xù)傳;第2 種和第3 種情況,可通過(guò)分站進(jìn)行斷線續(xù)傳;由于網(wǎng)關(guān)在系統(tǒng)中作為巡檢主站及數(shù)據(jù)透?jìng)髟O(shè)備,不具備數(shù)據(jù)存儲(chǔ)功能,因此第4 種情況同樣需由分站完成數(shù)據(jù)存儲(chǔ)及續(xù)傳。為此,針對(duì)后3 種故障類型,采用基于分站的斷線續(xù)傳設(shè)計(jì)方案。
分站斷線續(xù)傳主要實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)傳輸2 個(gè)功能。斷線續(xù)傳流程如圖2。
圖2 斷線續(xù)傳工作流程Fig.2 Workflow for continuous transmission after disconnection
首先分站監(jiān)測(cè)與網(wǎng)關(guān)或主機(jī)的通信狀態(tài),當(dāng)主通信中斷無(wú)法傳輸數(shù)據(jù)時(shí),觸發(fā)分站斷線存儲(chǔ)機(jī)制,對(duì)傳感器數(shù)據(jù)進(jìn)行預(yù)處理并保存。待主通信恢復(fù)正常后,分站讀取存儲(chǔ)器數(shù)據(jù),進(jìn)行續(xù)傳準(zhǔn)備,在與主機(jī)達(dá)成一致后,將續(xù)傳數(shù)據(jù)按照通信規(guī)約組織成數(shù)據(jù)包,發(fā)送至地面主機(jī)。
根據(jù)分站主通信方式分類,分別分析網(wǎng)絡(luò)型分站和總線型分站的數(shù)據(jù)傳輸故障檢測(cè)方法。
1)網(wǎng)絡(luò)型分站主通信故障檢測(cè)。網(wǎng)絡(luò)分站與主機(jī)間采用UDP 協(xié)議通信。由于UDP 為OSI 參考模型中1 種無(wú)連接的傳輸層協(xié)議,僅提供面向事務(wù)的簡(jiǎn)單不可靠信息傳送[12]。為解決不可靠問(wèn)題,主機(jī)與分站通信時(shí),建立握手機(jī)制,從而保證可靠的通信傳輸。分站與主機(jī)通信模型如圖3。分站通過(guò)監(jiān)聽主機(jī)心跳進(jìn)行故障判斷;監(jiān)控系統(tǒng)運(yùn)行時(shí),主機(jī)定時(shí)發(fā)送心跳,分站監(jiān)測(cè)到心跳表示通信成功,若超時(shí)未接收到心跳,則判定與主機(jī)通信中斷。
圖3 分站與主機(jī)通信模型Fig.3 Communication model between substation and host
2)總線型分站主通信故障檢測(cè)。網(wǎng)關(guān)與主機(jī)的通信機(jī)制與網(wǎng)絡(luò)分站一致,與分站之間通過(guò)下發(fā)巡檢或時(shí)隙命令建立通信。當(dāng)網(wǎng)關(guān)與主機(jī)通信中斷時(shí),停止發(fā)送巡檢命令。分站監(jiān)聽網(wǎng)關(guān)的巡檢命令,當(dāng)超時(shí)未收到巡檢時(shí),判定與網(wǎng)關(guān)通信中斷或網(wǎng)關(guān)與主機(jī)通信中斷。
為了實(shí)時(shí)監(jiān)測(cè)井下真實(shí)生產(chǎn)環(huán)境,要求感知層傳感器實(shí)時(shí)上傳過(guò)程數(shù)據(jù),因此分站對(duì)傳感器采樣頻率高,時(shí)間序列維度高,產(chǎn)生的數(shù)據(jù)量大[13]。在被測(cè)環(huán)境或參數(shù)穩(wěn)定條件下,采集數(shù)據(jù)一般不會(huì)出現(xiàn)大的波動(dòng),有時(shí)因探頭采集靈敏度問(wèn)題可能出現(xiàn)數(shù)據(jù)上下浮動(dòng)變化。頻繁采樣得到重復(fù)數(shù)據(jù)或小幅變化數(shù)據(jù),不僅浪費(fèi)存儲(chǔ)空間,還占用傳輸網(wǎng)絡(luò)帶寬,降低了監(jiān)控系統(tǒng)數(shù)據(jù)分析效率。
結(jié)合監(jiān)控系統(tǒng)功能及傳感器特點(diǎn),對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行篩選。井下傳感器主要分為模擬量和離散量。模擬量為連續(xù)變化量,離散量為非連續(xù)變化量。對(duì)于模擬量傳感器,主要包括變化、報(bào)警、斷電和故障4 種狀態(tài),其中報(bào)警、斷電和故障屬于重要數(shù)據(jù),需實(shí)時(shí)處理。對(duì)于離散量傳感器,包括0 值、1 值、故障3 種狀態(tài)。分站采樣得到傳感器數(shù)據(jù)后,以偏移時(shí)間作為數(shù)據(jù)時(shí)間標(biāo)識(shí),采用“不變不存”的原則篩選數(shù)據(jù),避免數(shù)據(jù)重復(fù)存儲(chǔ)和處理。
1)模擬量數(shù)據(jù)預(yù)處理方法。在模擬量傳感器量程范圍內(nèi)按照數(shù)據(jù)重要程度進(jìn)行分段,并設(shè)定存儲(chǔ)閾值。以掘進(jìn)工作面T1瓦斯傳感器量為例,分別設(shè)置報(bào)警的瓦斯體積分?jǐn)?shù)為1.0%、斷電的瓦斯體積分?jǐn)?shù)為1.5%。由于斷電門限高于報(bào)警門限,故采用報(bào)警的瓦斯體積分?jǐn)?shù)的70%作為分段依據(jù),將瓦斯體積分?jǐn)?shù)值分成2 個(gè)區(qū)間:[0%,0.7%]、(0.7%,4.0%]。當(dāng)瓦斯體積分?jǐn)?shù)值不大于0.7%時(shí),根據(jù)存儲(chǔ)閾值進(jìn)行篩選,當(dāng)瓦斯體積分?jǐn)?shù)值大于0.7%時(shí),數(shù)據(jù)一旦變化立即保存。瓦斯傳感器數(shù)據(jù)預(yù)處理結(jié)果見表1,其中瓦斯體積分?jǐn)?shù)存儲(chǔ)閾值為0.2%。
表1 瓦斯傳感器數(shù)據(jù)預(yù)處理Table 1 Gas data preprocessing
2)離散量數(shù)據(jù)預(yù)處理方法。由于離散量傳感器存在短時(shí)反復(fù)跳動(dòng),根據(jù)離散量數(shù)值持續(xù)時(shí)間,分成穩(wěn)態(tài)和暫態(tài)2 種狀態(tài)。穩(wěn)態(tài)數(shù)值用8bit表示,00000000b 表示0 值,11111111b 表示1 值,11110000b 表示故障態(tài)。暫態(tài)數(shù)值用1bit 表示。以開停傳感器為例,數(shù)值持續(xù)3 s 不變?yōu)榉€(wěn)態(tài),開停傳感器數(shù)據(jù)預(yù)處理結(jié)果見表2。
表2 開停傳感器數(shù)據(jù)預(yù)處理Table 2 Switch data preprocessing
監(jiān)控分站的數(shù)據(jù)存儲(chǔ)設(shè)計(jì)包括存儲(chǔ)格式、存儲(chǔ)容量和存儲(chǔ)策略3 個(gè)方面[14]。
1)存儲(chǔ)格式。存儲(chǔ)格式示例圖如圖4。為了便于存儲(chǔ)、檢索和傳輸,采用二級(jí)目錄方式進(jìn)行數(shù)據(jù)存儲(chǔ)。一級(jí)目錄為日期,二級(jí)目錄為時(shí)間。在二級(jí)目錄下為每個(gè)傳感器單獨(dú)開辟存儲(chǔ)空間,文件命名格式為:測(cè)點(diǎn)類型_測(cè)點(diǎn)編號(hào)。傳感器數(shù)據(jù)采用二進(jìn)制格式進(jìn)行存儲(chǔ),以秒為最小存儲(chǔ)時(shí)間單位,數(shù)據(jù)內(nèi)容為:時(shí)間偏移+傳感器數(shù)值。
圖4 存儲(chǔ)格式示例圖Fig.4 Sample storage format diagram
2)存儲(chǔ)器件。假設(shè)分站有4 個(gè)RS485 通信端口,與傳感器的通信速率為2 400 bps。結(jié)合巡檢時(shí)間、幀間隔和傳感器響應(yīng)時(shí)間計(jì)算,分站巡檢傳感器時(shí)間為20 ms,由此分站1 s 內(nèi)可接收20 個(gè)測(cè)點(diǎn)數(shù)據(jù)。按照上文中1 個(gè)測(cè)點(diǎn)信息最多占用4 Byte,存儲(chǔ)1 h 的數(shù)據(jù)需要280 kB。由于監(jiān)控系統(tǒng)出現(xiàn)故障后,礦上人員會(huì)及時(shí)采取措施處理,通常故障持續(xù)時(shí)間較短,因此按照7 d 的存儲(chǔ)需求設(shè)計(jì),需要50 MB 存儲(chǔ)空間,故選用128 MB 的FLASH存儲(chǔ)器??紤]到FLASH 采用塊擦方式且讀寫次數(shù)有限制,為了延長(zhǎng)器件使用壽命,采用二級(jí)存儲(chǔ)方式,鐵電存儲(chǔ)器作為第1 級(jí)存儲(chǔ)器,F(xiàn)LASH 作為第2 級(jí)存儲(chǔ)器。
3)存儲(chǔ)策略。按照二級(jí)存儲(chǔ)方式,先將數(shù)據(jù)緩存在鐵電存儲(chǔ)器中,當(dāng)超過(guò)規(guī)定文件大小時(shí),再將鐵電存儲(chǔ)器的數(shù)據(jù)重新寫入FLASH 中。在進(jìn)行FLASH 數(shù)據(jù)存儲(chǔ)時(shí),首先生成存儲(chǔ)路徑和文件名,判斷是否存在對(duì)應(yīng)文件,若文件存在則采用追加寫入的方式在文件尾進(jìn)行數(shù)據(jù)填充,否則創(chuàng)建新文件寫入數(shù)據(jù)。當(dāng)存儲(chǔ)數(shù)據(jù)超過(guò)規(guī)定容量時(shí),需刪除最早建立的文件,再創(chuàng)建新的文件。
1)網(wǎng)絡(luò)型分站數(shù)據(jù)續(xù)傳。當(dāng)分站存在待續(xù)傳數(shù)據(jù)時(shí),判斷文件名是否與主機(jī)配置一致,若配置一致,則讀取文件內(nèi)容,進(jìn)行數(shù)據(jù)校驗(yàn),并按照規(guī)定的格式組織報(bào)文上傳,報(bào)文格式為:剩余幀數(shù)+測(cè)點(diǎn)編號(hào)+數(shù)據(jù)內(nèi)容。分站收到主機(jī)的通信握手表示數(shù)據(jù)上傳成功,接著準(zhǔn)備下1 幀續(xù)傳數(shù)據(jù),否則持續(xù)上傳上1 幀數(shù)據(jù)。為了不影響實(shí)時(shí)數(shù)據(jù)傳輸,分站首先確認(rèn)是否存在實(shí)時(shí)數(shù)據(jù),在無(wú)實(shí)時(shí)數(shù)據(jù)需傳輸?shù)那闆r下方可進(jìn)行數(shù)據(jù)續(xù)傳。
2)總線型分站數(shù)據(jù)續(xù)傳??偩€型分站數(shù)據(jù)續(xù)傳框架如圖5??偩€型分站數(shù)據(jù)續(xù)傳分為2 個(gè)步驟:①由主機(jī)根據(jù)分站的故障情況,指定分站數(shù)據(jù)續(xù)傳時(shí)間,分站收到命令后,遍歷該時(shí)間目錄下所有的測(cè)點(diǎn),找出與當(dāng)前分站配置相一致的傳感器文件,加總計(jì)算得出總幀數(shù)告知主機(jī);②主機(jī)發(fā)送續(xù)傳數(shù)據(jù)幀序號(hào),分站根據(jù)幀序號(hào)讀取相應(yīng)傳感器數(shù)據(jù)進(jìn)行打包上傳。
圖5 總線型分站數(shù)據(jù)續(xù)傳框架Fig.5 Bus type substation data continuation framework
分站采用NXP 公司的i.mx6ull 芯片作為處理器,擴(kuò)展128 M 的NandFLASH 和4 M 鐵電存儲(chǔ)器用于數(shù)據(jù)存儲(chǔ)。為了測(cè)試滿載條件下分站斷線續(xù)傳性能,按照分站最大容量,接入31 臺(tái)模擬傳感器。在[0,100]區(qū)間內(nèi),傳感器每隔2 s 以0.01的變化頻率進(jìn)行自增或自減,模擬測(cè)點(diǎn)值變化上傳。
1)分站斷線續(xù)傳功能驗(yàn)證。開啟分站斷線續(xù)傳功能,并中斷分站主傳輸通信,7 d 后恢復(fù)主通信。測(cè)點(diǎn)密采曲線如圖6(每日的采樣日刻均為17:25)。查看主機(jī)上測(cè)點(diǎn)密采曲線,在分站故障期間,起初密采曲線是空白的,讀取斷線續(xù)傳數(shù)據(jù)后,空白區(qū)域被斷線續(xù)傳數(shù)據(jù)填充,斷線續(xù)傳數(shù)據(jù)用虛線表示。通過(guò)比對(duì)傳感器上傳數(shù)據(jù)和主機(jī)獲取的續(xù)傳數(shù)據(jù),數(shù)據(jù)完整率達(dá)到100%。在續(xù)傳過(guò)程中,分站實(shí)時(shí)數(shù)據(jù)上傳功能運(yùn)行正常。
圖6 測(cè)點(diǎn)密采曲線Fig.6 Dense sampling curves of measuring points
2)分站斷線續(xù)傳時(shí)間測(cè)試。根據(jù)分站主通信中斷1、5、12 h 3 種情況,分別測(cè)試總線型分站與網(wǎng)絡(luò)型分站的數(shù)據(jù)續(xù)傳時(shí)間,其中總線型分站傳輸速率為4 800 bps。網(wǎng)絡(luò)型分站數(shù)據(jù)續(xù)傳每幀平均耗時(shí)0.4 s,總線型分站數(shù)據(jù)續(xù)傳每幀平均耗時(shí)1 s。
基于分站的斷線續(xù)傳方案,在分站主通信或上級(jí)設(shè)備故障時(shí)可將數(shù)據(jù)緩存在分站中,并在故障修復(fù)時(shí)將數(shù)據(jù)傳輸至主機(jī),填補(bǔ)監(jiān)控系統(tǒng)歷史數(shù)據(jù)庫(kù),有效解決了分站上級(jí)設(shè)備故障或通信故障導(dǎo)致的數(shù)據(jù)缺失問(wèn)題,保證了數(shù)據(jù)的完整性,避免因數(shù)據(jù)缺失導(dǎo)致監(jiān)控系統(tǒng)控制決策受影響,或出現(xiàn)井下環(huán)境趨勢(shì)預(yù)測(cè)精度差的問(wèn)題。對(duì)于分站下行通信的故障,需進(jìn)一步研究基于傳感器的斷線續(xù)傳方案。