趙現(xiàn)綱 謝利子 衛(wèi)蘭 林曼筠(國(guó)家衛(wèi)星氣象中心,北京 100081)
?
風(fēng)云靜止氣象衛(wèi)星地面應(yīng)用工程計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)發(fā)展
趙現(xiàn)綱謝利子衛(wèi)蘭林曼筠
(國(guó)家衛(wèi)星氣象中心,北京 100081)
摘要:計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)是風(fēng)云系列靜止氣象衛(wèi)星地面應(yīng)用工程的重要組成部分,是衛(wèi)星在軌管理和衛(wèi)星觀測(cè)數(shù)據(jù)接收、處理、存檔、服務(wù)的重要支撐。自第一顆靜止氣象衛(wèi)星發(fā)射以來(lái),計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)規(guī)模不斷擴(kuò)大,其架構(gòu)經(jīng)歷了近二十年的滾動(dòng)發(fā)展和持續(xù)改進(jìn)。對(duì)該發(fā)展歷程和取得的成果進(jìn)行了回顧,并對(duì)未來(lái)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)建設(shè)所面臨的諸多機(jī)遇和挑戰(zhàn)進(jìn)行了分析。最后,基于靈活的作業(yè)和資源調(diào)度技術(shù),設(shè)計(jì)了具有良好可靠性和可擴(kuò)展性的我國(guó)新一代靜止氣象衛(wèi)星風(fēng)云四號(hào)地面應(yīng)用工程計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)架構(gòu)。
關(guān)鍵詞:風(fēng)云氣象衛(wèi)星,地面應(yīng)用系統(tǒng),云計(jì)算,資源調(diào)度
地面應(yīng)用工程作為風(fēng)云氣象衛(wèi)星五大系統(tǒng)之一,負(fù)責(zé)衛(wèi)星的日常運(yùn)行管理和衛(wèi)星的狀態(tài)監(jiān)視,實(shí)現(xiàn)衛(wèi)星數(shù)據(jù)的接收、實(shí)時(shí)處理和廣泛應(yīng)用[1]。其中,計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)(CNS,Computer Network and Storage)則是支撐地面應(yīng)用系統(tǒng)運(yùn)行的骨架和基石,負(fù)責(zé)計(jì)算環(huán)境支撐、資源分配、作業(yè)調(diào)度、數(shù)據(jù)傳輸以及產(chǎn)品分發(fā)。在風(fēng)云二號(hào)系列氣象衛(wèi)星地面應(yīng)用系統(tǒng)中,計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)不僅是地面應(yīng)用系統(tǒng)運(yùn)行的支撐,還是數(shù)據(jù)處理的指揮調(diào)度中心。計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的架構(gòu)設(shè)計(jì)直接影響到地面應(yīng)用系統(tǒng)的穩(wěn)定性、可靠性、時(shí)效性、安全性、可擴(kuò)展性和可維護(hù)性。
自1997年發(fā)射第一顆風(fēng)云靜止氣象衛(wèi)星FY-2A至今,我國(guó)共累計(jì)成功發(fā)射7顆風(fēng)云二號(hào)靜止氣象衛(wèi)星,其中FY-2A/B/C/D已離軌,目前在軌運(yùn)行的靜止氣象衛(wèi)星為FY-2E/F/G三顆?;仡櫸覈?guó)靜止氣象衛(wèi)星的發(fā)展歷程,其計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)架構(gòu)一直隨著信息技術(shù)浪潮的變革而持續(xù)改進(jìn)。靜止氣象衛(wèi)星計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的發(fā)展也經(jīng)歷了從大型機(jī)到小型機(jī),再到通用X86計(jì)算平臺(tái)的變革過(guò)程。其網(wǎng)絡(luò)互聯(lián)帶寬也由10Mb逐步提升至10Gb。所采用的存儲(chǔ)技術(shù)也由單一的磁帶、磁盤發(fā)展到目前磁盤陣列、網(wǎng)絡(luò)存儲(chǔ)以及分布式存儲(chǔ)等多種存儲(chǔ)技術(shù)共存的局面。地面應(yīng)用系統(tǒng)的業(yè)務(wù)能力也由單星觀測(cè)提升至目前的雙星加密觀測(cè)、高頻次區(qū)域掃描和多星統(tǒng)一管理,實(shí)現(xiàn)了國(guó)內(nèi)外多顆衛(wèi)星資料的統(tǒng)一接收和處理。風(fēng)云二號(hào)靜止氣象衛(wèi)星地面應(yīng)用系統(tǒng)體現(xiàn)了自主創(chuàng)新和集成創(chuàng)新,成果具有自主知識(shí)產(chǎn)權(quán),工程總體質(zhì)量和水平達(dá)到同期國(guó)際先進(jìn)水平,被譽(yù)為“天地一體化的典范、地面應(yīng)用系統(tǒng)的楷?!盵2]。風(fēng)云二號(hào)C星地面應(yīng)用系統(tǒng)獲得國(guó)家科技進(jìn)步一等獎(jiǎng),這也是國(guó)家對(duì)于地面應(yīng)用系統(tǒng)工程(包括計(jì)算機(jī)與網(wǎng)絡(luò)系統(tǒng))的具體肯定。
展望未來(lái),F(xiàn)Y-4A作為我國(guó)第二代靜止氣象衛(wèi)星的首顆衛(wèi)星,與FY-2系列衛(wèi)星相比,其衛(wèi)星平臺(tái)、工作模式、星載儀器、觀測(cè)密度和精度均有很大的變化和提高。表1列出了兩代衛(wèi)星儀器數(shù)、通道數(shù)、產(chǎn)品數(shù)量的對(duì)比。經(jīng)測(cè)算,F(xiàn)Y-4A衛(wèi)星原始數(shù)據(jù)量是風(fēng)云二號(hào)單星的160倍,經(jīng)過(guò)定位、定標(biāo)和光譜圖處理后形成的一級(jí)數(shù)據(jù)約為風(fēng)云二號(hào)單星的80倍。數(shù)據(jù)量百倍的增長(zhǎng)和近乎苛刻的服務(wù)質(zhì)量要求對(duì)地面應(yīng)用系統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)提出了新的挑戰(zhàn)。
表1 FY-2E、FY-4A衛(wèi)星儀器、通道及產(chǎn)品數(shù)量對(duì)比表Table 1 The comparison between FY-2E and FY-4A satellite on instruments,number of channels and product
FY-4A氣象衛(wèi)星地面應(yīng)用工程計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)在繼承FY-2系列氣象衛(wèi)星地面應(yīng)用系統(tǒng)建設(shè)成功經(jīng)驗(yàn)的同時(shí),需要結(jié)合當(dāng)前流行的云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)等新技術(shù),建設(shè)氣象衛(wèi)星數(shù)據(jù)處理與服務(wù)私有云,進(jìn)一步提升系統(tǒng)的可靠性、可擴(kuò)展能力、管理能力和服務(wù)能力。統(tǒng)籌考慮靜止、極軌兩個(gè)系列計(jì)算資源的共享使用,摒棄豎井式建設(shè)模式,規(guī)避信息孤島和單點(diǎn)故障。設(shè)計(jì)開發(fā)云平臺(tái)、自主資源調(diào)度軟件,實(shí)現(xiàn)對(duì)不同品牌、不同架構(gòu)計(jì)算資源的統(tǒng)一整合、管理與使用;通過(guò)計(jì)算虛擬化、網(wǎng)絡(luò)虛擬化、存儲(chǔ)虛擬化,實(shí)現(xiàn)更加靈活的計(jì)算環(huán)境規(guī)劃、部署和動(dòng)態(tài)遷移。未來(lái)的網(wǎng)絡(luò)將以40Gb、100Gb帶寬互聯(lián),存儲(chǔ)將以存儲(chǔ)虛擬化為媒介,對(duì)SAN、IPSAN進(jìn)行整合,輔以NAS、集群NAS等多種各具特點(diǎn)的存儲(chǔ)技術(shù)。基于衛(wèi)星需求,通過(guò)融合相關(guān)領(lǐng)域先進(jìn)技術(shù)和產(chǎn)品,F(xiàn)Y-4A氣象衛(wèi)星地面應(yīng)用系統(tǒng)將成為集氣象衛(wèi)星大數(shù)據(jù)處理、應(yīng)用、服務(wù)功能于一身的新一代氣象衛(wèi)星數(shù)據(jù)中心。
1.1初始創(chuàng)建
風(fēng)云系列靜止氣象衛(wèi)星的第一代計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)初建于20世紀(jì)80年代末—90年代初,在當(dāng)時(shí)是從無(wú)到有的創(chuàng)新工程,以FY-2A星地面應(yīng)用系統(tǒng)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)為代表。系統(tǒng)采用了集中式的架構(gòu),以大型機(jī)IBM4381、富士通M770為主要的處理服務(wù)器,輔以各類監(jiān)控管理終端,集中完成各類衛(wèi)星數(shù)據(jù)和任務(wù)的處理;同時(shí),采用自主研發(fā)的、定制的通信接口和專用網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)傳輸和交換。
FY-2A業(yè)務(wù)系統(tǒng)由指令和數(shù)據(jù)接收站,資料中心和運(yùn)行控制中心組成。在資料中心,對(duì)衛(wèi)星資料進(jìn)行處理的核心計(jì)算機(jī)選取了當(dāng)時(shí)性價(jià)比較高的富士通大型機(jī),配置了多臺(tái)終端用于數(shù)據(jù)交互和系統(tǒng)管理。前端的衛(wèi)星數(shù)據(jù)接收處理采用兩套工作站。設(shè)備之間的網(wǎng)絡(luò)互聯(lián)采用10Mbps以太網(wǎng)。目前來(lái)看,這些核心處理設(shè)備的配置和性能還不如現(xiàn)在一臺(tái)主流的PC機(jī),但在當(dāng)時(shí)的環(huán)境下,該套設(shè)備的處理能力和穩(wěn)定性在業(yè)界位列前茅。該套系統(tǒng)從立項(xiàng)到完成系統(tǒng)調(diào)試花費(fèi)了近6年的時(shí)間,自1991年設(shè)備安裝后,持續(xù)穩(wěn)定運(yùn)行超過(guò)10年,很好的承載了FY-2A星的在軌測(cè)試和試驗(yàn)運(yùn)行,以及后續(xù)系統(tǒng)的開發(fā)改進(jìn)。整個(gè)系統(tǒng)的建設(shè)是一個(gè)摸索學(xué)習(xí)的過(guò)程,培養(yǎng)了一大批衛(wèi)星數(shù)據(jù)處理以及大型機(jī)系統(tǒng)的專業(yè)人才。
在2000年初,為了滿足FY-2A/B星雙星共同運(yùn)行的需要,對(duì)上述FY-2A計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)進(jìn)行了改造與擴(kuò)建。資料中心增加了四臺(tái)UNIX服務(wù)器;設(shè)備之間的網(wǎng)絡(luò)互聯(lián)也由10Mbps以太網(wǎng)一躍升級(jí)為1000Mbps骨干互聯(lián)和100Mbps桌面接入。
“定制化”是第一代風(fēng)云衛(wèi)星計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)建設(shè)的特點(diǎn),從計(jì)算資源、存儲(chǔ)資源到網(wǎng)絡(luò)連接,都存在著相當(dāng)大比例的定制設(shè)備,這也是當(dāng)時(shí)IT設(shè)備百家爭(zhēng)鳴、通用性差的時(shí)代特征所導(dǎo)致的。該階段IT系統(tǒng)的建設(shè)和維護(hù)難度都很高,整個(gè)系統(tǒng)是一個(gè)封閉神秘的黑匣子。
1.2業(yè)務(wù)化運(yùn)行
FY-2A/B星同屬于風(fēng)云二號(hào)(01)批次衛(wèi)星,作為試驗(yàn)應(yīng)用衛(wèi)星,其在軌壽命較短。風(fēng)云二號(hào)(02)批次衛(wèi)星包含F(xiàn)Y-2C/D/E三顆衛(wèi)星,從FY-2C星開始,所有衛(wèi)星均為業(yè)務(wù)衛(wèi)星,業(yè)務(wù)化運(yùn)行對(duì)地面系統(tǒng)的性能和穩(wěn)定性提出了更高的要求。因此,計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)再次升級(jí)換代,建成了如圖1所示的風(fēng)云二號(hào)(02)批多星管理地面系統(tǒng)IT架構(gòu)。第二代計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)在主機(jī)方面以IBM power系列AIX小機(jī)雙機(jī)HA架構(gòu)為特點(diǎn);在網(wǎng)絡(luò)方面,采用標(biāo)準(zhǔn)以太網(wǎng)實(shí)現(xiàn)數(shù)據(jù)的傳輸與交換;在存儲(chǔ)方面,引入光纖存儲(chǔ)網(wǎng)絡(luò)SAN支撐實(shí)時(shí)業(yè)務(wù)處理,采用磁帶庫(kù)進(jìn)行數(shù)據(jù)近線存儲(chǔ),在線存儲(chǔ)容量達(dá)到TB級(jí);在數(shù)據(jù)處理和任務(wù)管理方面,引入任務(wù)級(jí)分布式處理的理念[3],對(duì)復(fù)雜的衛(wèi)星數(shù)據(jù)接收處理和管理流程進(jìn)行任務(wù)歸類,通過(guò)定制負(fù)載均衡調(diào)度軟件LSF實(shí)現(xiàn)復(fù)雜作業(yè)流的調(diào)度和管理[4]。從第二代計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)開始,我國(guó)靜止氣象衛(wèi)星地面系統(tǒng)開始進(jìn)入了業(yè)務(wù)化運(yùn)行,采用該架構(gòu)的計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)成功支撐了多顆衛(wèi)星業(yè)務(wù)(包括我國(guó)風(fēng)云衛(wèi)星以及如MTSAT等國(guó)外部分衛(wèi)星)的穩(wěn)定運(yùn)行,期間各項(xiàng)運(yùn)行指標(biāo)均滿足中國(guó)氣象局設(shè)定的業(yè)務(wù)考核要求。
圖1 風(fēng)云二號(hào)(02)批地面系統(tǒng)架構(gòu)圖示Fig.1 The ground segment architecture of FY-2(02)
風(fēng)云二號(hào)(03)批次包括F/G/H三顆衛(wèi)星,目前已經(jīng)發(fā)射FY-2F和FY-2G兩顆。H星計(jì)劃于2017年底發(fā)射。風(fēng)云二號(hào)(03)批次氣象衛(wèi)星地面系統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)部分架構(gòu)沿用了前期高端UNIX小機(jī)加高端SAN存儲(chǔ)的結(jié)構(gòu)。如處理主機(jī)采用IBM Power 780雙機(jī),存儲(chǔ)采用日立VSP高端SAN。在網(wǎng)絡(luò)部分使用了諸如IRF等虛擬化堆疊技術(shù)[5]以提高核心網(wǎng)絡(luò)的穩(wěn)定性,不同品牌網(wǎng)絡(luò)設(shè)備之間采用三層互聯(lián)。該架構(gòu)很好地承載了雙星加密以及高頻次區(qū)域觀測(cè)業(yè)務(wù)的穩(wěn)定運(yùn)行。
“雙路冗余”是第二代風(fēng)云衛(wèi)星計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)建設(shè)的主要特點(diǎn)。如計(jì)算節(jié)點(diǎn)的雙機(jī)HA,存儲(chǔ)雙活,網(wǎng)絡(luò)雙鏈路。通過(guò)雙路冗余的設(shè)計(jì)有效避免了單點(diǎn)故障,提升了業(yè)務(wù)運(yùn)行的可靠性。不過(guò),仍存在資源調(diào)度與業(yè)務(wù)邏輯強(qiáng)耦合,應(yīng)用與計(jì)算資源強(qiáng)耦合的問(wèn)題。維護(hù)工作的難度將隨著設(shè)備規(guī)模的增加而急劇上升。
2.1新一代IT支撐系統(tǒng)的設(shè)計(jì)理念
回顧風(fēng)云系列靜止氣象衛(wèi)星計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)多年的發(fā)展歷程,其IT支撐系統(tǒng)綜合性能有超過(guò)1萬(wàn)倍的增長(zhǎng),骨干網(wǎng)絡(luò)帶寬也從幾兆的專用通信接口發(fā)展到萬(wàn)兆。第一代IT支撐系統(tǒng)可稱之為大型機(jī)時(shí)代,其主要問(wèn)題是設(shè)備購(gòu)置成本高,使用維護(hù)難度大。系統(tǒng)間接口極其復(fù)雜且兼容性問(wèn)題導(dǎo)致系統(tǒng)故障率高,業(yè)務(wù)運(yùn)維壓力很大;第二代IT支撐系統(tǒng)可稱之為高可用服務(wù)器時(shí)代,其主要問(wèn)題是系統(tǒng)的通用性和擴(kuò)展性較差,主機(jī)和存儲(chǔ)設(shè)備可選擇余地不大,長(zhǎng)期在此架構(gòu)上開發(fā)的各類應(yīng)用,其遷移難度和工作量都很高,不利于系統(tǒng)的可持續(xù)性發(fā)展。
根據(jù)氣象衛(wèi)星發(fā)展規(guī)劃,至2020年,還將計(jì)劃發(fā)射近10顆氣象衛(wèi)星。隨著觀測(cè)儀器種類的增加、儀器觀測(cè)能力的大幅提升,氣象衛(wèi)星獲取的原始觀測(cè)數(shù)據(jù)信息量將呈爆炸性增長(zhǎng),而后續(xù)處理所產(chǎn)生的臨時(shí)數(shù)據(jù)以及產(chǎn)品數(shù)據(jù)量會(huì)以幾何級(jí)數(shù)膨脹;衛(wèi)星遙感反演技術(shù)的深入研究,將使得衛(wèi)星遙感產(chǎn)品的種類日益豐富,多儀器、多星融合產(chǎn)品也將不斷涌現(xiàn),通過(guò)IT支撐系統(tǒng)生成的數(shù)據(jù)信息量倍增;而衛(wèi)星觀測(cè)與地面觀測(cè)、數(shù)值預(yù)報(bào)聯(lián)動(dòng)等新的應(yīng)用方向,將進(jìn)一步提高對(duì)衛(wèi)星遙感產(chǎn)品的時(shí)效要求;這些因素都對(duì)IT支撐系統(tǒng)的綜合性能提出更高要求,現(xiàn)有的第二代計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)難以滿足需求,氣象衛(wèi)星業(yè)務(wù)的發(fā)展呼喚新一代IT支撐系統(tǒng)的到來(lái)。
近年業(yè)界流行的云計(jì)算[6]是一種嶄新的IT建設(shè)理念,提出了IT資源持續(xù)發(fā)展、異構(gòu)平臺(tái)整合以及跨系統(tǒng)互操作與協(xié)同管理的理想計(jì)算環(huán)境,目的是讓各類資源按需分配并隨需求和負(fù)載的變化而彈性伸縮。風(fēng)云靜止氣象衛(wèi)星的下一代IT支撐系統(tǒng)的建設(shè),將全方面借鑒和采納云計(jì)算的先進(jìn)理念和成熟技術(shù)。
在主機(jī)系統(tǒng)的設(shè)計(jì)方面,小型機(jī)憑借其穩(wěn)定可靠和單機(jī)綜合處理能力強(qiáng)大的特性,使得它在以往的IT支撐系統(tǒng)中得到廣泛應(yīng)用,在某些高可靠應(yīng)用環(huán)境以及單機(jī)計(jì)算能力有特殊要求的應(yīng)用場(chǎng)景應(yīng)該予以保留。與此同時(shí),通用X86機(jī)架服務(wù)器、刀片服務(wù)器不論從市場(chǎng)占有率還是設(shè)備可靠性方面都有了長(zhǎng)足的進(jìn)步[7]。新一代IT支撐系統(tǒng)內(nèi)部一定是異構(gòu)計(jì)算資源并存,需實(shí)現(xiàn)資源的統(tǒng)一管理調(diào)度。從長(zhǎng)遠(yuǎn)看,X86通用計(jì)算設(shè)備的可靠性不斷提高,RAS特性不斷完善,從理論上已經(jīng)具備取代小型機(jī)的可能。但從應(yīng)用遷移的角度而言,其在氣象衛(wèi)星地面應(yīng)用系統(tǒng)內(nèi)完全取代傳統(tǒng)UNIX服務(wù)器還需要一個(gè)過(guò)渡的過(guò)程。
在網(wǎng)絡(luò)系統(tǒng)的設(shè)計(jì)方面,新一代的IT支撐系統(tǒng)將繼續(xù)采用硬件廣域網(wǎng)加速設(shè)備和應(yīng)用軟件優(yōu)化并用的方法優(yōu)化廣域網(wǎng)傳輸[8]。骨干網(wǎng)絡(luò)帶寬將升級(jí)至40Gbps/100Gbps,多路萬(wàn)兆網(wǎng)卡聚合將成為高端服務(wù)器接入的普遍方式。為強(qiáng)化網(wǎng)絡(luò)的穩(wěn)定性,新一代的IT支撐系統(tǒng)除了提高單個(gè)設(shè)備的可靠性、設(shè)置冗余鏈路和節(jié)點(diǎn)等措施之外,還將優(yōu)先選用扁平化的網(wǎng)絡(luò)設(shè)計(jì)、采用IRF/VSS/vPC等虛擬化技術(shù)[9]簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)、提高網(wǎng)絡(luò)的可管理性。在集群計(jì)算網(wǎng)絡(luò)以及共享文件系統(tǒng)方面將采用IB互聯(lián),充分發(fā)揮IB網(wǎng)絡(luò)低延遲高帶寬的特性。
眾所周知,CPU不是數(shù)據(jù)處理能力的全部,對(duì)于氣象數(shù)據(jù)處理而言,數(shù)據(jù)IO能力更受關(guān)注,具體指標(biāo)包括數(shù)據(jù)讀寫帶寬、延遲以及IOPS。新一代IT支撐系統(tǒng)架構(gòu)開始由“以計(jì)算為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”,數(shù)據(jù)處理模式由單胖節(jié)點(diǎn)順序處理轉(zhuǎn)變?yōu)槎嗍莨?jié)點(diǎn)并行處理。由此,IO能力可并行擴(kuò)展的分布式存儲(chǔ)系統(tǒng)、本地計(jì)算技術(shù)[10]將成為優(yōu)選設(shè)備和策略。在海量數(shù)據(jù)歸檔方面,磁帶庫(kù)的性價(jià)比無(wú)可替代。采用自建近線存儲(chǔ)和公有云存儲(chǔ)服務(wù)相結(jié)合方式以滿足衛(wèi)星觀測(cè)數(shù)據(jù)存檔業(yè)務(wù)在容量和可靠性兩方面不斷提高的迫切需求。
2.2FY-4A計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
FY-4A計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)(FY-4A CNS)是FY-4A氣象衛(wèi)星地面應(yīng)用系統(tǒng)數(shù)據(jù)處理的基礎(chǔ)支撐平臺(tái),其結(jié)構(gòu)如圖2所示。FY-4A計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的設(shè)計(jì)充分考慮了資源統(tǒng)一管理和調(diào)度、業(yè)務(wù)邏輯與資源調(diào)度剝離、統(tǒng)一運(yùn)維管理、應(yīng)用評(píng)價(jià)與持續(xù)改進(jìn)以及未來(lái)多星IT系統(tǒng)資源共享等問(wèn)題。
圖2 FY-4A計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)示意圖Fig.2 The ground segment architecture of FY-4A
F Y- 4 A C N S將采用網(wǎng)絡(luò)虛擬化技術(shù)構(gòu)建40Gb/100Gb核心網(wǎng)絡(luò)互聯(lián);通過(guò)基于資源調(diào)度的私有云技術(shù)構(gòu)建計(jì)算資源池[11],實(shí)現(xiàn)異構(gòu)計(jì)算資源的統(tǒng)一池化,對(duì)外提供資源管理與作業(yè)調(diào)度標(biāo)準(zhǔn)接口,輕松支持與其他信息系統(tǒng)的統(tǒng)管共用通過(guò)存儲(chǔ)虛擬化[12]、分布式存儲(chǔ)等技術(shù)構(gòu)建10PB級(jí)存儲(chǔ)資源池;通過(guò)統(tǒng)一網(wǎng)管實(shí)現(xiàn)集中資源監(jiān)控;通過(guò)資源調(diào)度保證作業(yè)處理的高可靠和高時(shí)效,實(shí)現(xiàn)硬件計(jì)算資源和虛擬化計(jì)算資源的統(tǒng)一管理和調(diào)度;通過(guò)應(yīng)用運(yùn)行特征抓取分析平臺(tái),為各類應(yīng)用提供持續(xù)性的優(yōu)化支持。通過(guò)對(duì)資源的統(tǒng)一池化,將使IT系統(tǒng)從“雙路冗余”提升至“多路冗余”,通過(guò)容器、虛擬化技術(shù)實(shí)現(xiàn)應(yīng)用的封裝與漂移,將各類復(fù)雜應(yīng)用徹底與計(jì)算資源剝離,應(yīng)用服務(wù)在計(jì)算資源池內(nèi)無(wú)縫漂移,使系統(tǒng)整體達(dá)到可用性不低于99.99%的業(yè)務(wù)目標(biāo)。
2.3FY-4A計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用軟件
硬件是軀干,軟件是靈魂。FY-4A計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)通過(guò)自主開發(fā)資源調(diào)度軟件實(shí)現(xiàn)資源池化,實(shí)現(xiàn)對(duì)異構(gòu)物理主機(jī)和虛擬主機(jī)的統(tǒng)一管理和靈活調(diào)度;通過(guò)系統(tǒng)監(jiān)視管理軟件實(shí)現(xiàn)業(yè)務(wù)運(yùn)維現(xiàn)代化,通過(guò)典型應(yīng)用測(cè)試與優(yōu)化分析軟件實(shí)現(xiàn)各類應(yīng)用以及業(yè)務(wù)系統(tǒng)的持續(xù)性改進(jìn)。
系統(tǒng)監(jiān)視管理軟件負(fù)責(zé)統(tǒng)一管理風(fēng)云四號(hào)衛(wèi)星地面應(yīng)用系統(tǒng)計(jì)算機(jī)平臺(tái)的所有IT資產(chǎn),實(shí)現(xiàn)資產(chǎn)的注冊(cè)登記與集中管理;在此基礎(chǔ)上,通過(guò)設(shè)置各類配置參數(shù),采用多種手段統(tǒng)一采集系統(tǒng)運(yùn)行過(guò)程中的各類信息,實(shí)現(xiàn)對(duì)各類硬件資源、軟件資源、基礎(chǔ)設(shè)施環(huán)境狀態(tài)實(shí)時(shí)、準(zhǔn)實(shí)時(shí)監(jiān)視,并將監(jiān)視信息以可視化的方式統(tǒng)一展現(xiàn);系統(tǒng)通過(guò)結(jié)合運(yùn)維人員的工作經(jīng)驗(yàn),設(shè)置故障報(bào)警閾值,實(shí)現(xiàn)對(duì)各類故障的分級(jí)報(bào)警與及時(shí)上報(bào);系統(tǒng)還依據(jù)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘等技術(shù),生成各類運(yùn)維報(bào)表,降低運(yùn)維人員的工作強(qiáng)度,提高系統(tǒng)維護(hù)的便捷性,實(shí)現(xiàn)IT系統(tǒng)的量化運(yùn)維和精準(zhǔn)管理。
圖3 FY-4A地面應(yīng)用系統(tǒng)分級(jí)調(diào)度結(jié)構(gòu)圖Fig.3 The hierarchical scheduling architecture of FY-4A ground segment
資源調(diào)度軟件主要負(fù)責(zé)底層計(jì)算資源的調(diào)度,實(shí)現(xiàn)跨異構(gòu)負(fù)載均衡調(diào)度集群的統(tǒng)一計(jì)算資源調(diào)度。業(yè)務(wù)邏輯與資源調(diào)度剝離是目前云計(jì)算數(shù)據(jù)中心發(fā)展趨勢(shì),如元調(diào)度器MESOS被列為APACHE基金會(huì)的重點(diǎn)項(xiàng)目。如圖3所示,資源調(diào)度分系統(tǒng)從地面應(yīng)用系統(tǒng)各系統(tǒng)的二級(jí)業(yè)務(wù)調(diào)度接收其提交的單個(gè)作業(yè),根據(jù)作業(yè)的輸入、輸出和約束條件等生成可運(yùn)行的作業(yè)指令,并根據(jù)當(dāng)前資源實(shí)際負(fù)載、作業(yè)資源需求、資源池特性等情況分配作業(yè)到具體的資源池以及計(jì)算資源上運(yùn)行。在作業(yè)運(yùn)行過(guò)程中,監(jiān)視作業(yè)狀態(tài),并根據(jù)需要將作業(yè)狀態(tài)返回給各系統(tǒng)二級(jí)調(diào)度,對(duì)異常作業(yè)和調(diào)度故障能夠根據(jù)提前定義好的故障處理策略進(jìn)行自動(dòng)或半自動(dòng)處理。通過(guò)資源調(diào)度實(shí)現(xiàn)異構(gòu)資源的池化,實(shí)現(xiàn)對(duì)風(fēng)云衛(wèi)星地面應(yīng)用系統(tǒng)IT資源統(tǒng)一管理和統(tǒng)一調(diào)度,徹底拋棄豎井式架構(gòu),消滅信息孤島和單點(diǎn)故障。
典型應(yīng)用測(cè)試與優(yōu)化分析軟件負(fù)責(zé)評(píng)估和了解應(yīng)用系統(tǒng)資源使用及其合理性,對(duì)資源消耗最大的應(yīng)用提出優(yōu)化建議,力保資源使用率保持在合理范圍。CNS將建立典型應(yīng)用量化測(cè)量軟件,對(duì)各類典型應(yīng)用的資源需求與資源消耗實(shí)際狀況進(jìn)行收集與評(píng)估(評(píng)估指標(biāo)包括通用指標(biāo)和微架構(gòu)級(jí)指標(biāo)),對(duì)典型應(yīng)用本身和資源配置提出優(yōu)化建議,確保資源使用率保持在合理范圍。對(duì)業(yè)務(wù)系統(tǒng)內(nèi)各類應(yīng)用、算法進(jìn)行量化評(píng)價(jià),包括業(yè)務(wù)上線前對(duì)應(yīng)用進(jìn)行體檢、在業(yè)務(wù)運(yùn)行過(guò)程中對(duì)應(yīng)用和平臺(tái)進(jìn)行評(píng)估并提供優(yōu)化建議,從而支撐風(fēng)云四號(hào)科研試驗(yàn)衛(wèi)星業(yè)務(wù)系統(tǒng)的持續(xù)改進(jìn)。
風(fēng)云系列衛(wèi)星從立項(xiàng)至今已經(jīng)發(fā)展了四十多年,地面應(yīng)用工程計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)也經(jīng)歷了二十多年的滾動(dòng)發(fā)展。計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的架構(gòu)由兩方面因素決定:一是衛(wèi)星數(shù)據(jù)處理和服務(wù)的時(shí)效性、可靠性需求;二是信息技術(shù)、產(chǎn)品的發(fā)展變化。采納合適的產(chǎn)品、技術(shù),開發(fā)靈活的應(yīng)用軟件以構(gòu)建滿足風(fēng)云系列氣象衛(wèi)星業(yè)務(wù)運(yùn)行的IT支撐系統(tǒng)是地面系統(tǒng)建設(shè)的重要工作內(nèi)容。本文回顧了我國(guó)靜止氣象衛(wèi)星地面應(yīng)用工程計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)架構(gòu)的發(fā)展變化,對(duì)三代IT支撐系統(tǒng)進(jìn)行了詳細(xì)的介紹。展望未來(lái),自主研發(fā)基于資源調(diào)度的氣象衛(wèi)星數(shù)據(jù)處理云是氣象衛(wèi)星地面系統(tǒng)發(fā)展的方向和目標(biāo),新一代靜止氣象衛(wèi)星計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)將以氣象信息化中“集約化建設(shè)、資源充分共享”為指導(dǎo)原則,以云計(jì)算、資源調(diào)度、大數(shù)據(jù)等前沿技術(shù)為技術(shù)路線,構(gòu)建成為以自主創(chuàng)新、高可靠、易擴(kuò)展、可持續(xù)優(yōu)化、具備與其他系統(tǒng)統(tǒng)管共用為特點(diǎn)的新一代大氣衛(wèi)星觀測(cè)數(shù)據(jù)中心。
參考文獻(xiàn)
[1]董超華,許健民,張文建,等.風(fēng)云三十年——國(guó)家衛(wèi)星氣象中心成立三十周年紀(jì)念.國(guó)家衛(wèi)星氣象中心,2001.
[2]楊軍,許健民,董超華,等.氣象衛(wèi)星及其應(yīng)用.北京:氣象出版社,2012.
[3]胡華平,金士堯,王維.分布式系統(tǒng)高可用方案的選擇.系統(tǒng)工程與電子技術(shù),2000,22(3):65-67.
[4]賈樹澤,楊軍,施進(jìn)明,等.新一代氣象衛(wèi)星資料處理系統(tǒng)并行調(diào)度算法研究與應(yīng)用.氣象科技,2010,38(1):96-101.
[5]黃石平,謝健,闞宏宇.IRF虛擬化技術(shù)在網(wǎng)絡(luò)中的應(yīng)用研究.實(shí)驗(yàn)技術(shù)與管理,2014(11):124-126.
[6]陳康,鄭緯民.云計(jì)算:系統(tǒng)實(shí)例與研究現(xiàn)狀.軟件學(xué)報(bào),2009,20(5):1337-1348.
[7]黃昆.x86服務(wù)器市場(chǎng)如何提升數(shù)據(jù)、系統(tǒng)、應(yīng)用及業(yè)務(wù)的高可用性.中國(guó)金融電腦,2012(2):88.
[8]衛(wèi)蘭,林曼筠,趙現(xiàn)綱,等.廣域網(wǎng)加速在FY-3氣象衛(wèi)星數(shù)據(jù)傳輸中的應(yīng)用.應(yīng)用氣象學(xué)報(bào),2012,23(1):121-128.
[9]周燁,李勇,蘇厲,金德鵬,等.基于虛擬化的網(wǎng)絡(luò)創(chuàng)新實(shí)驗(yàn)環(huán)境研究.電子學(xué)報(bào),2012,40(11):2152-2157.
[10]崔杰,李陶深,蘭紅星.基于Hadoop的海量數(shù)據(jù)存儲(chǔ)平臺(tái)設(shè)計(jì)與開發(fā).計(jì)算機(jī)研究與發(fā)展,2012,49(S1):12-18.
[11]劉永金,黃科.運(yùn)營(yíng)商業(yè)務(wù)平臺(tái)云計(jì)算資源池建設(shè)方案探討.電信科學(xué),2013,29(9):201-206+211.
[12]呂小兵.存儲(chǔ)虛擬化整合技術(shù)研究.航空制造技術(shù),2015(6):83-85.
The Development of Computer Network and Storage System in Fengyun Geostationary Meteorological Satellite Ground Segment
Zhao Xiangang,Xie Lizi,Wei Lan,Lin Manyun
(National Satellite Meteorological Centre,Beijing 100081)
Abstract:Computer Network and Storage(CNS)system is an important component of the meteorological satellite engineering.CNS supplies resources and environments for the satellite in-orbit management,satellite observation data receiving,processing,archiving and service.Since the first geostationary meteorological satellite was launched,the scale of the computer network of the ground segment has been greatly expanded; its architecture has experienced nearly twenty years of rolling development and continuous improvement.In this paper,the development process and the results are reviewed.The opportunities and challenges of CNS construction are well analyzed.Finally,based on the flexible job and resource scheduling technology,a new structure with high scalability and reliability of CNS for FY-4Ageostationary meteorological satellite is raised up.
Keywords:Fengyun,ground segment,cloud computing,resource scheduling
通信作者:謝利子(1982—),Email:xielizi@cma.gov.cn
收稿日期:2015年10月22日;修回日期:2015年12月29日
DOI:10.3969/j.issn.2095-1973.2016.01.015
第一作者:趙現(xiàn)綱(1976—),Email:xgzhao@189.com
資助信息:國(guó)家高技術(shù)研究發(fā)展計(jì)劃(2011AA12A104)
Advances in Meteorological Science and Technology2016年1期