王玲玲,茍 偉
(1. 中國科學(xué)院上海天文臺(tái),上海 200030;2. 上海市空間導(dǎo)航與定位技術(shù)重點(diǎn)實(shí)驗(yàn)室,上海 200030)
時(shí)頻系統(tǒng)為甚長基線干涉測量站提供穩(wěn)定可靠的時(shí)間標(biāo)準(zhǔn),輸出信號(hào)的質(zhì)量直接影響觀測質(zhì)量。時(shí)頻系統(tǒng)包括氫原子鐘和其他時(shí)間比對(duì)設(shè)備,氫原子鐘作為其中最關(guān)鍵的設(shè)備,是一種高精度的頻率標(biāo)準(zhǔn),但由于微波諧振腔輸出頻率易受外界環(huán)境因素干擾,所以性能也容易受外界環(huán)境影響。針對(duì)整個(gè)時(shí)頻系統(tǒng)狀態(tài)和性能變化的研究目前主要集中在環(huán)境變化對(duì)氫原子鐘性能的影響,為此,國內(nèi)外的學(xué)者都做了若干工作[1-4]。研究結(jié)果表明,在環(huán)境控制較差的情況下,氫原子鐘的頻率穩(wěn)定度顯著下降。因此,對(duì)于環(huán)境狀態(tài)的有效控制是確保氫原子鐘乃至整個(gè)時(shí)頻系統(tǒng)可靠運(yùn)行的前提。
另一方面,作為用戶,針對(duì)氫原子鐘的運(yùn)行,除了提高設(shè)備本身的可靠性之外,對(duì)發(fā)生故障的預(yù)測是減少故障發(fā)生及盡早處理的有效方法。因?yàn)闅湓隅姷倪\(yùn)行是一個(gè)動(dòng)態(tài)過程,伴隨復(fù)雜的物理和化學(xué)狀態(tài)變化,其中一些變化最終導(dǎo)致氫原子鐘性能指標(biāo)變化甚至故障發(fā)生,觀察和分析這種變化之間的關(guān)系有助于實(shí)現(xiàn)故障預(yù)測。這首先需要對(duì)設(shè)備狀態(tài)進(jìn)行監(jiān)視,然后通過對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析處理,得出預(yù)測模型,從而達(dá)到精準(zhǔn)預(yù)測設(shè)備狀態(tài)的目的。
故障預(yù)測是一門多學(xué)科綜合信息處理技術(shù),是故障診斷技術(shù)的一種拓展和延伸[5],是在設(shè)備正常工作的前提下,利用歷史數(shù)據(jù)和相關(guān)技術(shù),結(jié)合當(dāng)前狀態(tài)對(duì)可能發(fā)生的故障趨勢進(jìn)行預(yù)測的一個(gè)過程[6]。預(yù)測方法大致可以分為3類:基于模型、基于數(shù)據(jù)驅(qū)動(dòng)和基于統(tǒng)計(jì)可靠性[5]。中國VLBI網(wǎng)建立已有十多年的歷史,運(yùn)行至今積累了大量的數(shù)據(jù),具有進(jìn)行相關(guān)研究的數(shù)據(jù)基礎(chǔ)。本文選用基于數(shù)據(jù)驅(qū)動(dòng)的故障預(yù)測技術(shù)進(jìn)行研究。該技術(shù)近年來廣受重視并快速發(fā)展,成為重要研究熱點(diǎn)[7]。
甚長基線干涉測量站時(shí)頻系統(tǒng)的主要設(shè)備包括氫原子鐘、分頻鐘/臺(tái)站鐘、時(shí)間間隔計(jì)數(shù)器、切換器、倍頻器、頻率/脈沖分配器、全球定位系統(tǒng)/北斗導(dǎo)航系統(tǒng)時(shí)間服務(wù)器等,另外還有提供周邊服務(wù)的設(shè)備,包括不間斷電源(Uninterruptible Power Supply, UPS)、恒溫恒濕空調(diào)、室內(nèi)數(shù)字溫度計(jì)、室外氣象站等。根據(jù) 《實(shí)用型氫原子鐘技術(shù)說明書》,甚長基線干涉測量站使用的主動(dòng)型氫原子鐘提供類似小型鐘的狀態(tài)監(jiān)控系統(tǒng)[8],用戶可以通過串口采集數(shù)據(jù),利用數(shù)據(jù)分析鐘的狀態(tài),其他設(shè)備的數(shù)據(jù)采集同樣可以通過設(shè)備自帶的串口或網(wǎng)絡(luò)通信協(xié)議接口并配合對(duì)應(yīng)的采集軟件完成,也可以根據(jù)需要通過專用串口/網(wǎng)口轉(zhuǎn)換設(shè)備將接口轉(zhuǎn)換后采集,數(shù)據(jù)采集頻率根據(jù)需求設(shè)定。
時(shí)頻系統(tǒng)的監(jiān)測數(shù)據(jù)包括氫原子鐘內(nèi)部各參數(shù)的狀態(tài)、鐘差、鐘房環(huán)境溫濕度、外部環(huán)境溫濕度、氣壓、風(fēng)向風(fēng)速等,不同的數(shù)據(jù)來自不同的設(shè)備,比如氫鐘狀態(tài)來自氫鐘,鐘房溫濕度來自鐘房溫濕度計(jì)等。這些數(shù)據(jù)為預(yù)測模型的研究提供了第一手資料,使得研究具有可行性。經(jīng)過多年建設(shè)及持續(xù)維護(hù)和改造,各時(shí)頻系統(tǒng)中運(yùn)行過或正在運(yùn)行的設(shè)備眾多,其中,氫原子鐘的型號(hào)包括MHM2010,VCH-1003M,SHOM-3,SHOM-4和SHOM-A等多種,具體的設(shè)備編號(hào)也有所變動(dòng)。數(shù)據(jù)存儲(chǔ)的內(nèi)容和格式有不同程度的差異,而且存儲(chǔ)方式及數(shù)據(jù)格式不完全相同,有的以數(shù)據(jù)庫的形式存儲(chǔ),有的以文件存儲(chǔ),想要進(jìn)行數(shù)據(jù)分析,第一步工作是對(duì)數(shù)據(jù)進(jìn)行整理,建成時(shí)頻系統(tǒng)數(shù)據(jù)倉庫。
典型的基于數(shù)據(jù)驅(qū)動(dòng)的故障預(yù)測方法有人工神經(jīng)網(wǎng)絡(luò)、模糊系統(tǒng)和其他的計(jì)算智能方法[5]。本文采用一種基于數(shù)據(jù)挖掘思想的預(yù)測算法展開研究。
時(shí)頻系統(tǒng)的主要設(shè)備如前所述,經(jīng)過業(yè)務(wù)分析,時(shí)頻系統(tǒng)數(shù)據(jù)倉庫的實(shí)體聯(lián)系圖如圖1。
接下來,根據(jù)數(shù)據(jù)倉庫建設(shè)的步驟,分別進(jìn)行邏輯建模和物理建模,邏輯模型如圖2,部分?jǐn)?shù)據(jù)表設(shè)計(jì)如表1~表6。
表2 鐘差數(shù)據(jù)
表3 氫鐘運(yùn)行狀態(tài)
表4 室外環(huán)境
表5 室內(nèi)環(huán)境
表6 系統(tǒng)運(yùn)行狀態(tài)
圖2 時(shí)頻數(shù)據(jù)倉庫的邏輯模型圖
由于數(shù)據(jù)的多樣性和復(fù)雜性,我們首先需要對(duì)數(shù)據(jù)進(jìn)行整理,整理的步驟包括數(shù)據(jù)清洗及數(shù)據(jù)格式轉(zhuǎn)換等。數(shù)據(jù)清洗即剔除原始數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)和無效數(shù)據(jù),經(jīng)格式轉(zhuǎn)換后統(tǒng)一入庫。
時(shí)頻系統(tǒng)的數(shù)據(jù)記錄有數(shù)據(jù)庫、文本文件兩種形式,清洗的過程中需要注意時(shí)間格式有北京時(shí)間和世界時(shí)的區(qū)別,為后續(xù)統(tǒng)一關(guān)系,這里全部換算成統(tǒng)一的世界時(shí)。臺(tái)站的設(shè)備時(shí)有更換,有型號(hào)升級(jí)或同型號(hào)更換,這些信息有的完整,有的錯(cuò)誤,有的缺失,缺失的補(bǔ)空,錯(cuò)誤的需要修正。數(shù)據(jù)記錄有混合,即同樣的數(shù)據(jù)表格里,可能混合了不同時(shí)期、不同型號(hào)或編號(hào)的設(shè)備數(shù)據(jù),這種情況需要根據(jù)當(dāng)時(shí)的日志文件對(duì)數(shù)據(jù)進(jìn)行拆分及重新補(bǔ)錄。另外,由于源數(shù)據(jù)量較大,為方便測試,本文對(duì)數(shù)據(jù)進(jìn)行了均勻縮減抽樣。
由于在所有數(shù)據(jù)中,能夠最直觀反映時(shí)頻系統(tǒng)狀態(tài)的是氫原子鐘的狀態(tài)數(shù)據(jù),所以本文以SHOM-4型氫原子鐘為例,重點(diǎn)分析有關(guān)氫原子鐘的狀態(tài)數(shù)據(jù)及當(dāng)時(shí)的環(huán)境溫度數(shù)據(jù)。根據(jù)氫原子鐘技術(shù)說明書,鐘的常規(guī)狀態(tài)參數(shù)有32個(gè),除去1個(gè)備用及8個(gè)隔離放大器的數(shù)據(jù),其他均可以實(shí)時(shí)反映運(yùn)行狀態(tài)。圖3是2019年編號(hào)為88#的氫鐘狀態(tài)及當(dāng)時(shí)的環(huán)境溫度信息,其中縱坐標(biāo)表示各參數(shù)的數(shù)值。
圖3 2019年數(shù)據(jù)(部分?jǐn)?shù)據(jù)有缺失)
氫鐘的這些狀態(tài)參數(shù)可以根據(jù)物理模塊分為電源、恒溫、離子泵、接收機(jī)、隔離放大器等幾部分,其中接收機(jī)中頻信號(hào)的數(shù)值代表鐘信號(hào),若小于1.5則表示鐘輸出信號(hào)消失,屬于嚴(yán)重故障,本文重點(diǎn)對(duì)該參數(shù)進(jìn)行分析。在對(duì)數(shù)據(jù)進(jìn)行細(xì)化之后,根據(jù)氫鐘技術(shù)手冊,結(jié)合以往的經(jīng)驗(yàn),可以得到11個(gè)參數(shù)與中頻信號(hào)密切相關(guān),具體如圖4。因?yàn)閿?shù)據(jù)值相差比較大,為了讓讀者看得更清晰,我們把數(shù)據(jù)分成兩幅圖顯示,上半部分顯示OSCI的值,下半部分顯示另外10個(gè)參數(shù)值。進(jìn)一步細(xì)化可以看到更多細(xì)節(jié),比如從圖5兩個(gè)數(shù)據(jù)曲線形狀判斷,兩者有很強(qiáng)的相關(guān)性,可以說,曲線的彎曲方向大致相反,也就是溫度升高時(shí)OVN1和OVN2值下降,溫度下降時(shí)OVN1和OVN2值升高,即OVN1,OVN2和溫度數(shù)據(jù)相關(guān)度最高,這是因?yàn)镺VN1和OVN2是鐘恒溫部分中外爐位置電壓值,直接受環(huán)境溫度變化的影響。
圖4 部分相關(guān)參數(shù)狀態(tài)
圖5 外爐電壓與溫度數(shù)據(jù)關(guān)系
信息化社會(huì)之下,日益增長的各類數(shù)據(jù)隱含著大量價(jià)值,數(shù)據(jù)挖掘技術(shù)是為了滿足獲取此價(jià)值的要求,從大量隨機(jī)數(shù)據(jù)中提取有用信息和知識(shí)的技術(shù)。在數(shù)據(jù)挖掘技術(shù)發(fā)展的過程中,大量算法應(yīng)運(yùn)而生,但同時(shí)各有各的局限,多種算法融合是解決具體事務(wù)的發(fā)展趨勢[9]。本文以2019年數(shù)據(jù)為例,采用幾種典型算法分別進(jìn)行分析處理,并比較其性能。
根據(jù)每種算法在傳統(tǒng)上的應(yīng)用,結(jié)合特定場景,本文選擇決策樹、聚類、關(guān)聯(lián)和時(shí)序等算法進(jìn)行測試研究。其中各算法的有關(guān)參數(shù)可以調(diào)整,比如在決策樹模型中,我們可以看到各參數(shù)的依賴關(guān)系網(wǎng)絡(luò)(圖6),選擇中頻信號(hào)節(jié)點(diǎn),顯示所有鏈接,IFL與OVN1,OVN2,F(xiàn)LUX,DIO及溫度數(shù)據(jù)有關(guān),而調(diào)整到顯示較強(qiáng)鏈接,與DIO的關(guān)系鏈斷開。關(guān)聯(lián)算法中多個(gè)參數(shù)由于是連續(xù)數(shù)據(jù)而被忽略,而時(shí)序算法需要連續(xù)的數(shù)據(jù),不允許出現(xiàn)空白,因?yàn)闇y試中選定的數(shù)據(jù)有缺失,所以需要指定用來填充空白的方法,這樣可以使用前面的值、平均值或特定的常量。由各挖掘算法創(chuàng)建的挖掘模型如圖7。
圖6 參數(shù)間依賴關(guān)系網(wǎng)絡(luò)
我們可以使用提升圖對(duì)各算法模型的準(zhǔn)確性進(jìn)行查看,如圖8,藍(lán)色線為理想模型,圖中x軸表示用于比較預(yù)測的測試數(shù)據(jù)集的百分比,y軸表示準(zhǔn)確預(yù)測的百分比。因此,理想線是一條對(duì)角線,用于顯示在50%的數(shù)據(jù)中,模型準(zhǔn)確預(yù)測50%的事例(即預(yù)計(jì)的最大值)。由圖8可知,各模型都接近理想模型,其中,決策樹模型表現(xiàn)最優(yōu)。
圖8 各模型挖掘準(zhǔn)確性提升圖
然而,我們仔細(xì)查看預(yù)測結(jié)果時(shí)發(fā)現(xiàn),雖然絕大部分值預(yù)測成功,但是數(shù)據(jù)中實(shí)際存在的一個(gè)異常值并沒有成功預(yù)測,即圖9中鼠標(biāo)選中的數(shù)值0.38,因?yàn)樾∮?.5,所以是實(shí)際的異常值,但是這個(gè)值3個(gè)模型都沒有預(yù)測到,可能原因是該異常值在15 130個(gè)數(shù)據(jù)中只出現(xiàn)了一次,即測試數(shù)據(jù)不夠典型,在實(shí)際預(yù)測中的效果不好。時(shí)序算法中的測試存在同樣的問題,所以接下來的測試對(duì)數(shù)據(jù)進(jìn)行重新選擇。
圖9 各模型的分類矩陣
新的測試數(shù)據(jù)選自2013年編號(hào)43#氫鐘,其中,中頻信號(hào)的數(shù)據(jù)如圖10,可以看出期間發(fā)生了多次信號(hào)消失現(xiàn)象,本文摘取這段數(shù)據(jù)進(jìn)行模型構(gòu)建展示。
圖10 2013年43號(hào)鐘的中頻信號(hào)數(shù)據(jù)
這次模型測試中,聚類模型的分?jǐn)?shù)高過決策樹,達(dá)到0.88(圖11),所以選用該模型對(duì)測試數(shù)據(jù)的后半段進(jìn)行預(yù)測,將預(yù)測數(shù)據(jù)中的預(yù)測值IFL置空(NULL)。從預(yù)測分類矩陣(圖12)可以看出,對(duì)于預(yù)測值IFL,其各類數(shù)據(jù)的預(yù)測結(jié)果都比較均勻,與實(shí)際數(shù)據(jù)相符,結(jié)果中預(yù)測到值為0.06(故障值)的數(shù)據(jù)15條,與實(shí)際數(shù)據(jù)的14條非常接近,預(yù)測概率從0.51提高到0.857,準(zhǔn)確率也很高。由此可知,此模型故障預(yù)測成功。
圖11 各模型準(zhǔn)確性提升圖
圖12 聚類模型分類矩陣
本文同時(shí)對(duì)時(shí)序算法進(jìn)行了測試。時(shí)序算法用于預(yù)測一系列連續(xù)數(shù)據(jù)點(diǎn)的未來值,要求必須包含時(shí)間鍵,而本文的數(shù)據(jù)正是以時(shí)間序列采集的,符合要求。實(shí)際的預(yù)測結(jié)果如圖13,可以看到左側(cè)實(shí)線是實(shí)際值,右側(cè)虛線是預(yù)測值,比對(duì)實(shí)際數(shù)據(jù),即從圖10中可以看到3月19日5:17:10之后附近的數(shù)據(jù)確實(shí)是在3左右,由此可知預(yù)測部分非常準(zhǔn)確。然而,重新選擇預(yù)測開始點(diǎn),預(yù)測結(jié)果如圖14,并不能令人滿意,因?yàn)閿?shù)據(jù)的周期性不明顯,因此使用的時(shí)序算法并不是最理想。這有待于后續(xù)繼續(xù)分析研究。
圖13 聚類模型預(yù)測結(jié)果
圖14 時(shí)序模型預(yù)測結(jié)果
本文針對(duì)時(shí)頻系統(tǒng)故障預(yù)測進(jìn)行了一些方法探索,利用數(shù)據(jù)挖掘技術(shù)對(duì)歷史數(shù)據(jù)進(jìn)行分析和測試。從測試結(jié)果可知,結(jié)合設(shè)備本身狀態(tài)數(shù)據(jù)及運(yùn)行環(huán)境數(shù)據(jù)可以分析預(yù)測設(shè)備狀態(tài)趨勢,從而對(duì)可能發(fā)生的故障進(jìn)行預(yù)警。
分析的難點(diǎn)在于算法的選擇和設(shè)計(jì),模型構(gòu)建過程是算法不斷優(yōu)化的過程。本文測試得知聚類模型可以很好地進(jìn)行預(yù)測,后續(xù)可以通過更多的數(shù)據(jù)進(jìn)行驗(yàn)證,同時(shí)下一步需將此預(yù)測模型集成到時(shí)頻系統(tǒng)軟件,從而實(shí)現(xiàn)系統(tǒng)實(shí)時(shí)故障預(yù)測。
另外,分析所用的預(yù)測模型需要有大量原始數(shù)據(jù)進(jìn)行訓(xùn)練,用于訓(xùn)練的數(shù)據(jù)越多越能覆蓋所有可能,模型越準(zhǔn)確越健壯,然而如何在有限的算力下高效處理這些數(shù)據(jù)成為難題,后續(xù)有必要進(jìn)行專門研究。