呂 爽,馬艷軍 ,劉一謙
(四川省氣象信息中心,四川 成都 610071)
國(guó)家氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)是采用網(wǎng)絡(luò)計(jì)算技術(shù)與網(wǎng)絡(luò)化遠(yuǎn)程應(yīng)用技術(shù),通過(guò)整合、集成氣象部門內(nèi)不同位置的10大高性能計(jì)算機(jī)系統(tǒng),建成的面向區(qū)域、省氣象部門以及國(guó)內(nèi)相關(guān)行業(yè)提供共享服務(wù)的高性能計(jì)算資源軟硬件平臺(tái)和網(wǎng)絡(luò)化應(yīng)用環(huán)境。該系統(tǒng)聚合的總節(jié)點(diǎn)數(shù)有416個(gè),采用了不同體系架構(gòu)和操作系統(tǒng)平臺(tái),總計(jì)算能力高達(dá)26.34 TFLOPS,總存儲(chǔ)能力 128.98TB[1]。為了將如此豐富的高性能計(jì)算資源和存儲(chǔ)資源進(jìn)行高效管理,使其充分利用,發(fā)揮最大的使用價(jià)值和共享效益,國(guó)家氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)建設(shè)項(xiàng)目組設(shè)計(jì)了有效的計(jì)算資源管理和共享方案,并已技術(shù)實(shí)現(xiàn),成功應(yīng)用到國(guó)家級(jí)氣象高性能計(jì)算機(jī)計(jì)算資源的業(yè)務(wù)管理和資源共享工作中。成都區(qū)域氣象中心的SGI高性能計(jì)算機(jī)系統(tǒng)是國(guó)家氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)中的一個(gè)分節(jié)點(diǎn),與其他節(jié)點(diǎn)相比,在體系結(jié)構(gòu)上存在較大差異、具有一定代表性的的異構(gòu)節(jié)點(diǎn),本文詳細(xì)敘述了國(guó)家氣象網(wǎng)絡(luò)計(jì)算資源管理和共享方案在成都分節(jié)點(diǎn)的應(yīng)用和實(shí)現(xiàn)過(guò)程。
國(guó)家氣象網(wǎng)絡(luò)計(jì)算資源管理技術(shù)方案主要包括三方面(圖1):
圖1 氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)計(jì)算資源管理技術(shù)方案
2.1.1 異構(gòu)節(jié)點(diǎn) 氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)計(jì)算資源管理范圍不僅限于單個(gè)高性能計(jì)算機(jī)系統(tǒng),而是將氣象部門內(nèi)不同架構(gòu)的高性能計(jì)算機(jī)系統(tǒng)作為分節(jié)點(diǎn)納入進(jìn)來(lái)作為一個(gè)整體、使用全局統(tǒng)一的策略管理。
2.1.2 抽象量化模型 設(shè)計(jì)一個(gè)高性能計(jì)算資源抽象量化模型,屏蔽氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)中各個(gè)節(jié)點(diǎn)之間的異構(gòu)性,以統(tǒng)一的形式刻畫高性能計(jì)算資源,以量化手段實(shí)現(xiàn)高性能計(jì)算機(jī)虛擬計(jì)算單元計(jì)算力GCUP(General Computing Unit Productivity),精確地記錄和控制用戶資源使用量。1個(gè)資源虛擬計(jì)算單元(GCU)相當(dāng)于目前一般高性能計(jì)算機(jī)系統(tǒng)1個(gè)CPU小時(shí)的計(jì)算能力[2]。
2.1.3 計(jì)算資源管理系統(tǒng) 在GCUP量化模型設(shè)計(jì)思想基礎(chǔ)上構(gòu)建計(jì)算資源實(shí)時(shí)管理系統(tǒng),該系統(tǒng)能夠?qū)崟r(shí)動(dòng)態(tài)地跟蹤、反映用戶對(duì)高性能計(jì)算機(jī)資源的使用情況,并能及時(shí)實(shí)施資源使用控制策略。系統(tǒng)利用GOLD+PostgreSQL技術(shù)實(shí)現(xiàn),GOLD是一個(gè)開源的資源分配管理器,由美國(guó)的太平洋西北國(guó)家實(shí)驗(yàn)室 PNNL 研發(fā)[3]。
由于氣象行業(yè)內(nèi)多個(gè)中西部省份缺乏數(shù)值天氣預(yù)報(bào)所必需的高性能計(jì)算機(jī)系統(tǒng),無(wú)法建立適合本地中小尺度的預(yù)報(bào)模式系統(tǒng)來(lái)支持當(dāng)?shù)氐念A(yù)報(bào)業(yè)務(wù)。針對(duì)資源匱乏地區(qū)用戶的實(shí)際需要,國(guó)家氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)為異地遠(yuǎn)程網(wǎng)絡(luò)用戶提供計(jì)算資源,建立區(qū)域模式預(yù)報(bào)應(yīng)用系統(tǒng),通過(guò)資源共享平臺(tái)的方式運(yùn)行氣象網(wǎng)絡(luò)應(yīng)用,經(jīng)廣域網(wǎng)提供氣象應(yīng)用產(chǎn)品,實(shí)現(xiàn)高性能計(jì)算資源的跨區(qū)域共享。
國(guó)家氣象網(wǎng)絡(luò)計(jì)算應(yīng)用系統(tǒng)成都分節(jié)點(diǎn)是SGI新一代Altix 4700高性能計(jì)算機(jī)系統(tǒng),該系統(tǒng)配置96顆英特爾安騰雙核處理器(192 Cores),主頻1.6GHz,384GB全局內(nèi)存,理論浮點(diǎn)峰值可達(dá)到1.228 8萬(wàn)億次/秒。
3.2.1 技術(shù)實(shí)現(xiàn) 將國(guó)家氣象網(wǎng)絡(luò)計(jì)算資源管理方案應(yīng)用于成都分節(jié)點(diǎn),對(duì)成都區(qū)域氣象中心高性能計(jì)算機(jī)系統(tǒng)上的高性能計(jì)算資源進(jìn)行管理,其管理架構(gòu)如圖2所示,具體實(shí)現(xiàn)過(guò)程如下所述。
圖2 成都分節(jié)點(diǎn)計(jì)算資源管理架構(gòu)
①作業(yè)日志文件獲取。在SGI高性能計(jì)算機(jī)系統(tǒng)上設(shè)置資源預(yù)留程序prologue與資源記賬程序epilogue,作業(yè)調(diào)度節(jié)點(diǎn)及計(jì)算節(jié)點(diǎn)均能直接調(diào)用這兩個(gè)文件,作業(yè)通過(guò)pbspro作業(yè)調(diào)度系統(tǒng)被提交到計(jì)算節(jié)點(diǎn)上,作業(yè)運(yùn)行之前和結(jié)束之后,分別調(diào)用prologue和epilogue程序,提取相關(guān)用戶作業(yè)信息,存入指定的日志文件中。作業(yè)日志文件包含隊(duì)列名、作業(yè)ID、用戶名、處理器個(gè)數(shù)、作業(yè)執(zhí)行時(shí)間等信息,AREM用戶提交作業(yè)后生成的日志文件信息如下:express;29346.SGI4700;AREM;1;5104;"SGI4700/2exec_vnode";1;2010-01-14 07";SGI4700;"SERIAL"
②GOLD管理系統(tǒng)構(gòu)建。用一臺(tái)linux服務(wù)器作為GOLD管理服務(wù)器(bccdgridsvr),在該服務(wù)器上搭建基于GOLD的成都區(qū)域中心高性能計(jì)算資源實(shí)時(shí)管理系統(tǒng),安裝GOLD和Postgre數(shù)據(jù)庫(kù),開發(fā)計(jì)算資源管理程序,實(shí)現(xiàn)按部門、用戶、機(jī)器等方面對(duì)資源使用情況進(jìn)行實(shí)時(shí)查詢和統(tǒng)計(jì)分析,并實(shí)現(xiàn)計(jì)算資源使用統(tǒng)計(jì)信息xml文件的準(zhǔn)實(shí)時(shí)上傳。
③計(jì)算資源預(yù)分配。根據(jù)GCUP模型的設(shè)計(jì)思想,對(duì)成都分節(jié)點(diǎn)SGI系統(tǒng)的計(jì)算資源進(jìn)行量化統(tǒng)計(jì),根據(jù)各個(gè)單位實(shí)際使用情況對(duì)計(jì)算資源以GCU為單位進(jìn)行預(yù)分配,表1所示是SGI系統(tǒng)上2012年各個(gè)單位預(yù)分配和實(shí)際使用的計(jì)算資源情況。
表1 2012年計(jì)算資源預(yù)分配和使用情況
④用戶信息與作業(yè)日志文件入庫(kù)。根據(jù)計(jì)算資源記帳的要求,需要的基本數(shù)據(jù)結(jié)構(gòu)包括用戶信息、單位組織信息、機(jī)器信息,因此設(shè)計(jì)數(shù)據(jù)庫(kù)來(lái)管理這些信息。在GOLD數(shù)據(jù)庫(kù)中有用戶和單位組織的相關(guān)信息,但不夠全面,在查詢時(shí)需要詳細(xì)的用戶和單位信息,因此在postgre數(shù)據(jù)庫(kù)中新建一個(gè)數(shù)據(jù)庫(kù)實(shí)例ui(userinfo),使用ui數(shù)據(jù)庫(kù)作為計(jì)算資源記帳基本信息庫(kù)。用戶信息編輯成txt文件,作為gadduser命令的參數(shù)進(jìn)行入庫(kù)處理;作業(yè)日志文件通過(guò)程序每隔30 min從SGI系統(tǒng)上傳送到bccdgridsvr服務(wù)器指定目錄下,同時(shí)定時(shí)掃描目錄啟動(dòng)計(jì)算資源記帳程序調(diào)用gcharge命令完成向GOLD數(shù)據(jù)庫(kù)的作業(yè)日志文件入庫(kù)記帳處理,每10 min刷新一次。
⑤資源統(tǒng)計(jì)信息xml文件的生成。利用計(jì)算管理程序?qū)τ?jì)算資源使用情況進(jìn)行查詢和統(tǒng)計(jì),定時(shí)運(yùn)行g(shù)enmonxmlfile程序?qū)⒔y(tǒng)計(jì)結(jié)果轉(zhuǎn)化為xml文件,經(jīng)解析后供web頁(yè)面顯示。2011年9月SGI系統(tǒng)計(jì)算資源使用統(tǒng)計(jì)的xml文件(resstat_sc.xml)如下所示,包含時(shí)間、cpu利用率、資源使用量等信息。
3.2.2 應(yīng)用效果分析及實(shí)例 成都區(qū)域氣象中心自從將國(guó)家氣象網(wǎng)絡(luò)計(jì)算資源管理方案成功應(yīng)用到SGI系統(tǒng)以來(lái),取得了較好的應(yīng)用效果,系統(tǒng)管理員能夠從不同角度對(duì)成都區(qū)域氣象中心高性能計(jì)算資源使用情況有全面的了解,能夠?qū)λ莆盏挠?jì)算資源進(jìn)行合理的調(diào)度與分配,更好的保證了系統(tǒng)的負(fù)載均衡以及資源的充分利用,進(jìn)一步為氣象模式用戶提供了一個(gè)模式運(yùn)算的更高效的計(jì)算平臺(tái),使其更好的滿足區(qū)域中心中尺度集合預(yù)報(bào)系統(tǒng)業(yè)務(wù)運(yùn)行需求,同時(shí)也為管理部門提供了決策支持的有力依據(jù)。
通過(guò)成都區(qū)域中心高性能計(jì)算資源管理系統(tǒng)查詢得到的關(guān)于2009年成都區(qū)域中心高性能計(jì)算機(jī)系統(tǒng)各個(gè)單位用戶計(jì)算資源使用統(tǒng)計(jì)情況可以看出,2009年所有用戶單位中,成都高原氣象研究所(SWCB_gys)計(jì)算資源使用量最多,占總資源使用量的69.86%,其次為其他測(cè)試單位,占總資源使用量的19.59%;同時(shí)四川省氣象臺(tái)(SWCB_qxt)計(jì)算資源使用量占總資源使用量的10.05%。根據(jù)統(tǒng)計(jì)結(jié)果的指導(dǎo),按資源使用比例合理的給各個(gè)單位預(yù)分配了2010年的計(jì)算資源,避免了出現(xiàn)資源不足、業(yè)務(wù)作業(yè)無(wú)法正常運(yùn)行的現(xiàn)象。
在國(guó)家氣象網(wǎng)絡(luò)計(jì)算資源共享方案設(shè)計(jì)思想基礎(chǔ)上,擴(kuò)展西南區(qū)域中心內(nèi)重慶、云南異地用戶作為成都分節(jié)點(diǎn)SGI系統(tǒng)的網(wǎng)絡(luò)資源特色用戶,基于資源共享平臺(tái)為其提供計(jì)算資源,異地用戶在MPLSVPN網(wǎng)絡(luò)中通過(guò)FTP方式對(duì)WRF和MM5中尺度數(shù)值預(yù)報(bào)模式結(jié)果數(shù)據(jù)以及預(yù)報(bào)產(chǎn)品等資料進(jìn)行定時(shí)接收和本地化應(yīng)用研究,進(jìn)一步豐富了異地用戶所在地區(qū)的氣象業(yè)務(wù)數(shù)值預(yù)報(bào)產(chǎn)品。
云南和重慶異地用戶借助成都分節(jié)點(diǎn)的計(jì)算資源,實(shí)現(xiàn)大量的WRF和MM5模式數(shù)值模擬試驗(yàn)。針對(duì)其在本地的預(yù)報(bào)結(jié)果進(jìn)行檢驗(yàn)分析,初步評(píng)價(jià)模式性能。根據(jù)模式的性能設(shè)計(jì)試驗(yàn)方案,進(jìn)行模式各種物理過(guò)程組合的優(yōu)選,為WRF和MM5模式在本地業(yè)務(wù)化方案定制提供各種客觀依據(jù)。
例如重慶異地用戶利用在成都分節(jié)點(diǎn)資源共享平臺(tái)運(yùn)行的WRF模式結(jié)果模擬了2009年8月2-5日的渝西大暴雨天氣過(guò)程(圖3)。
圖3 2009年8月2—5日的渝西大暴雨天氣過(guò)程
通過(guò)利用國(guó)家氣象網(wǎng)絡(luò)計(jì)算資源管理和共享方案,成都區(qū)域氣象中心的高性能計(jì)算資源管理水平和共享效益有了一定程度的提高,但是隨著天氣、氣候模式預(yù)報(bào)精度的提高、物理過(guò)程的復(fù)雜化,以及集合預(yù)報(bào)樣本的增加,導(dǎo)致模式計(jì)算規(guī)模越來(lái)越大,模式運(yùn)算所需的計(jì)算資源和存儲(chǔ)資源也將迅速增加,如何利用有限的資源為氣象用戶做到最優(yōu)、最好的服務(wù),是需要我們系統(tǒng)資源管理工作者認(rèn)真思考的問題。
[1]宗翔,王彬.國(guó)家級(jí)氣象高性能計(jì)算機(jī)管理與應(yīng)用網(wǎng)絡(luò)平臺(tái)設(shè)計(jì)[J].應(yīng)用氣象學(xué)報(bào),2006,17(5):629-634.
[2]王彬,宗翔,魏敏.一個(gè)精細(xì)粒度實(shí)時(shí)計(jì)算資源管理系統(tǒng)[J]. 應(yīng)用氣象學(xué)報(bào),2008,19(4):507 -511.
[3]呂爽,馬渝勇,劉一謙,等.基于Gold的氣象中心網(wǎng)格平臺(tái)資源管理系統(tǒng)構(gòu)建及應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,2010,5:79-80.