• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      虛擬天文臺(tái)
      ——天文學(xué)研究的科研信息化環(huán)境*

      2013-02-24 05:52:23崔辰州薛艷杰趙永恒
      中國(guó)科學(xué)院院刊 2013年4期
      關(guān)鍵詞:天文學(xué)天文臺(tái)信息學(xué)

      文/崔辰州 薛艷杰 李 建 趙永恒 劉 梁 陳 肖

      1中國(guó)科學(xué)院天文臺(tái)北京100012

      2中國(guó)科學(xué)院前沿科學(xué)與教育局北京100864

      3中國(guó)科學(xué)院紫金山天文臺(tái)南京210008

      4中國(guó)科學(xué)院上海天文臺(tái)上海210030

      虛擬天文臺(tái)
      ——天文學(xué)研究的科研信息化環(huán)境*

      文/崔辰州1薛艷杰2李建1趙永恒1劉梁3陳肖4

      1中國(guó)科學(xué)院天文臺(tái)北京100012

      2中國(guó)科學(xué)院前沿科學(xué)與教育局北京100864

      3中國(guó)科學(xué)院紫金山天文臺(tái)南京210008

      4中國(guó)科學(xué)院上海天文臺(tái)上海210030

      在過去的幾十年間,天文科學(xué)數(shù)據(jù)量已經(jīng)從GB量級(jí)進(jìn)入到了TB量級(jí)。如今,正在從TB量級(jí)向PB量級(jí)邁進(jìn)。天文學(xué)研究已經(jīng)進(jìn)入到了數(shù)據(jù)密集型時(shí)代。面對(duì)海量天文數(shù)據(jù)對(duì)存儲(chǔ)、計(jì)算、帶寬、軟件甚至工作模式等方面的需求,天文學(xué)家連同信息技術(shù)領(lǐng)域、計(jì)算機(jī)科學(xué)領(lǐng)域的專家正努力使基于天文數(shù)據(jù)的知識(shí)發(fā)現(xiàn)過程變得更加容易。旨在實(shí)現(xiàn)科學(xué)數(shù)據(jù)互操作的虛擬天文臺(tái)就是這方面的積極嘗試,它將為數(shù)據(jù)密集型時(shí)代的天文學(xué)研究和教育科普提供一個(gè)信息化環(huán)境。天文信息學(xué)則從天文學(xué)一個(gè)分支學(xué)科的高度去考慮天文學(xué)的長(zhǎng)遠(yuǎn)發(fā)展。文章論述了天文學(xué)研究在數(shù)據(jù)密集型時(shí)代所面臨的需求,介紹了天文學(xué)家為應(yīng)對(duì)數(shù)據(jù)密集型挑戰(zhàn)正在研究開發(fā)的虛擬天文臺(tái)技術(shù),探討天文信息學(xué)所包含的內(nèi)容和發(fā)展天文信息學(xué)的必要性,展望了中科院統(tǒng)籌規(guī)劃天文領(lǐng)域科研信息化工作,建設(shè)中國(guó)虛擬天文臺(tái)的前景。

      天文學(xué),科研信息化,虛擬天文臺(tái),天文信息學(xué),統(tǒng)籌規(guī)劃

      DOI 10.3969/j.issn.1000-3045.2013.04.012

      1 天文學(xué)研究數(shù)據(jù)密集型時(shí)代的來(lái)臨

      天文數(shù)據(jù)一直以來(lái)就被認(rèn)為是人類了解宇宙的直接證據(jù)。古代天體觀測(cè)技術(shù)不是很發(fā)達(dá)時(shí),通過各種手段得到的觀測(cè)數(shù)據(jù)來(lái)之不易,因此被十分珍貴地保存起來(lái)。事實(shí)證明,歷史上流傳下來(lái)的重要天文數(shù)據(jù),不僅為當(dāng)時(shí)創(chuàng)造了巨大價(jià)值,也為后世科研工作帶來(lái)了參考。在觀測(cè)手段日益強(qiáng)大、科研活動(dòng)極其活躍的今天,天文觀測(cè)數(shù)據(jù)仍被認(rèn)為是人類重要的成果而被精心地保存。

      每一次觀測(cè)技術(shù)的進(jìn)步,都會(huì)帶來(lái)天文學(xué)研究的突破。自19世紀(jì)初,意大利天文學(xué)家伽利略把自制的望遠(yuǎn)鏡指向天空,人們的視野大大拓寬了,天文學(xué)開始進(jìn)入了新的觀測(cè)時(shí)代。進(jìn)入20世紀(jì),望遠(yuǎn)鏡的數(shù)量逐漸增多,觀測(cè)能力進(jìn)一步加強(qiáng),尤其是各種大口徑、多用途的望遠(yuǎn)鏡應(yīng)用,使天文觀測(cè)深度和觀測(cè)廣度達(dá)到前所未有的水平。

      望遠(yuǎn)鏡的應(yīng)用所帶來(lái)的直接影響就是天文觀測(cè)數(shù)據(jù)的迅速增長(zhǎng)。天文數(shù)據(jù)大規(guī)模的產(chǎn)生應(yīng)該起源于天文數(shù)據(jù)的數(shù)字化過程。這得益于20世紀(jì)80年代后期,各種電子元器件尤其是CCD技術(shù)的成熟和廣泛應(yīng)用?,F(xiàn)代的天文觀測(cè)手段,可以使望遠(yuǎn)鏡所得到的觀測(cè)數(shù)據(jù)直接就生成電子文檔。這也為計(jì)算機(jī)管理天文數(shù)據(jù)提供了便利。天文數(shù)據(jù)進(jìn)一步的增多,使天文學(xué)家開始關(guān)注天文數(shù)據(jù)本身的保存、檢索、處理等問題。自90年代計(jì)算機(jī)技術(shù)、信息技術(shù)大規(guī)模普及以來(lái),天文數(shù)據(jù)也進(jìn)入了數(shù)據(jù)密集型時(shí)代。時(shí)至今日,基于數(shù)據(jù)的天文學(xué)研究手段已經(jīng)非常普遍。

      望遠(yuǎn)鏡設(shè)計(jì)制造、探測(cè)器、數(shù)據(jù)處理等技術(shù)的進(jìn)步使得天文觀測(cè)能力不斷增強(qiáng),靈敏度越來(lái)越高。天文學(xué)家開始規(guī)劃天區(qū)范圍更廣、深度更深、掃描速度更快的巡天項(xiàng)目。另外,一些新的天文研究領(lǐng)域如伽瑪暴、超新星爆發(fā)等,使得時(shí)域天文觀測(cè)的需求更加迫切。所有這些科學(xué)需求,都直接導(dǎo)致天文數(shù)據(jù)量成爆炸式的增長(zhǎng)。表1列出了當(dāng)前國(guó)際上4個(gè)天文觀測(cè)項(xiàng)目相對(duì)于高能物理學(xué)領(lǐng)域大型強(qiáng)子對(duì)撞機(jī)(LHC)的數(shù)據(jù)產(chǎn)生率[1]。在國(guó)內(nèi),地面廣角相機(jī)陣(GWAC)每天的觀測(cè)數(shù)據(jù)量可達(dá)7.4TB;“天籟計(jì)劃”大型射電干涉儀陣列一期96個(gè)天線的數(shù)據(jù)流量為4.8GB/s,二期1 000個(gè)天線的數(shù)據(jù)流量為3.2TB/s。天文學(xué)已經(jīng)實(shí)實(shí)在在地進(jìn)入了數(shù)據(jù)密集型時(shí)代并開始引領(lǐng)該領(lǐng)域的發(fā)展。多波段數(shù)據(jù)的融合、海量復(fù)雜數(shù)據(jù)的分析和挖掘成為新世紀(jì)天文學(xué)研究的主要方法。

      表1 巡天項(xiàng)目與LHC數(shù)據(jù)產(chǎn)生率對(duì)比

      2 當(dāng)代天文學(xué)研究對(duì)信息化環(huán)境的需求

      當(dāng)代天文學(xué)研究從一定程度上講已經(jīng)成為一項(xiàng)數(shù)據(jù)驅(qū)動(dòng)的工作。數(shù)據(jù)獲取、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)共享,每個(gè)環(huán)節(jié)都充滿著對(duì)信息化環(huán)境的需求。

      海量的天文數(shù)據(jù)帶來(lái)相應(yīng)的海量數(shù)據(jù)存儲(chǔ)的需求,需要高效的文件存儲(chǔ)系統(tǒng)和檢索系統(tǒng)?,F(xiàn)代的數(shù)據(jù)庫(kù)技術(shù)可以較好地解決這樣的文件記錄、整理問題。數(shù)據(jù)庫(kù)內(nèi)部的索引技術(shù)可以很方便地實(shí)現(xiàn)檢索的任務(wù)。但是隨著未來(lái)天文觀測(cè)設(shè)備能力的增強(qiáng),產(chǎn)生的數(shù)據(jù)越來(lái)越多,當(dāng)前的主流數(shù)據(jù)管理方法已經(jīng)不能完全滿足要求。

      天文數(shù)據(jù)量的增長(zhǎng)也給天文數(shù)據(jù)處理帶來(lái)挑戰(zhàn)。通常觀測(cè)的原始數(shù)據(jù)并不能直接用于科研活動(dòng),需要一套針對(duì)觀測(cè)設(shè)備和環(huán)境信息的數(shù)據(jù)處理程序——pipeline,對(duì)原始數(shù)據(jù)進(jìn)行加工處理后,才能對(duì)外發(fā)布使用。有時(shí)需要對(duì)觀測(cè)出的數(shù)據(jù)進(jìn)行實(shí)時(shí)或幾乎實(shí)時(shí)的處理。如瞬變?cè)矗ㄈ绯滦潜l(fā)、伽馬暴等)觀測(cè)的早期預(yù)警等工作。天文數(shù)據(jù)處理對(duì)計(jì)算資源的要求在射電望遠(yuǎn)鏡干涉陣列項(xiàng)目中表現(xiàn)的尤為明顯。目前國(guó)際上干涉儀的陣元個(gè)數(shù)動(dòng)輒成百上千,大多數(shù)已建成的天文干涉儀陣列,如美國(guó)的甚大陣列(Very Large Array, VLA),印度的巨型米波射電望遠(yuǎn)鏡(Giant Meter wave Radio Telescope,GMRT)等都由幾十個(gè)單元組成。隨著干涉儀技術(shù)的不斷成熟,人們開始籌劃或在建越來(lái)越大的陣列。例如,我國(guó)及國(guó)際上正積極籌劃的“天籟計(jì)劃”和1平方千米天線陣(Square Kilometer Array,SKA),預(yù)期都由數(shù)百乃至數(shù)千個(gè)單元組成;歐洲即將建成的低頻射電干涉陣列(Low Frequency Array,LOFAR)由2萬(wàn)個(gè)天線構(gòu)成的48個(gè)基站組成。如此大規(guī)模的天線陣列對(duì)數(shù)據(jù)采集、傳輸、處理等有極高的技術(shù)要求。如何應(yīng)對(duì)這些挑戰(zhàn),尤其是如何以可接受的成本來(lái)應(yīng)對(duì)目前萬(wàn)億次每秒甚至億億次每秒的實(shí)時(shí)處理需求是國(guó)際上非常關(guān)注的一個(gè)難題。

      天文數(shù)據(jù)在存儲(chǔ)和計(jì)算上的需求還體現(xiàn)在海量天文數(shù)據(jù)融合方面。兩個(gè)不同的星表之間,相同天體目標(biāo)各自具有不同ID標(biāo)識(shí)的現(xiàn)象普遍存在。在科研工作中,往往又是期望針對(duì)同一目標(biāo)在不同星表中獲得聯(lián)合搜索的信息。于是就產(chǎn)生了不同星表間交叉證認(rèn)操作的需求。通常,交叉證認(rèn)以目標(biāo)源的位置為紐帶,將不同數(shù)據(jù)庫(kù)中的數(shù)據(jù)聯(lián)系起來(lái),從而獲得多個(gè)數(shù)據(jù)庫(kù)中的參數(shù)信息或多波段的數(shù)據(jù)信息。對(duì)于兩個(gè)記錄數(shù)分別為M和N的星表而言,交叉證認(rèn)的計(jì)算復(fù)雜度是M×N。十幾年前,M和N的規(guī)模僅在數(shù)千到數(shù)萬(wàn)的量級(jí),而現(xiàn)在已經(jīng)增長(zhǎng)到了10億的級(jí)別。如果是多星表的交叉證認(rèn)和融合,所需的計(jì)算量可想而知。更精確的證認(rèn)還需要把天體的類型、亮度等物理特性考慮進(jìn)去。在科學(xué)技術(shù)快速發(fā)展的推動(dòng)下,天文學(xué)進(jìn)入了全波段巡天觀測(cè)階段,形成了多波段天文學(xué)。來(lái)自各波段的巡天和觀測(cè)數(shù)據(jù)都在急劇增長(zhǎng)。有了交叉證認(rèn)的工作后,這些星表就可以統(tǒng)一起來(lái),全方位地了解天體在各波段的特性。通過多波段的交叉證認(rèn)可以對(duì)天體的物理性質(zhì)、演化規(guī)律獲得更全面系統(tǒng)的認(rèn)識(shí),加深對(duì)認(rèn)證目標(biāo)源的新的天文理解,為統(tǒng)計(jì)分析和數(shù)據(jù)挖掘做好準(zhǔn)備。雖然已經(jīng)研究了很長(zhǎng)時(shí)間,大規(guī)模星表的交叉證認(rèn)問題依然是天文學(xué)界乃至科學(xué)數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)。

      進(jìn)入21世紀(jì),最新的信號(hào)探測(cè)技術(shù)和信息技術(shù)開啟了天文學(xué)研究的時(shí)域時(shí)代。下一代概要式巡天項(xiàng)目和程控自主天文臺(tái)激發(fā)了天文學(xué)家對(duì)時(shí)變過程的研究熱情。時(shí)域天文學(xué)的發(fā)展帶來(lái)了觀測(cè)數(shù)據(jù)的急增,同時(shí)也帶來(lái)了更多新的挑戰(zhàn)。概要式巡天項(xiàng)目,比如大口徑全天巡視望遠(yuǎn)鏡LSST和SKA,將每晚對(duì)大面積的天區(qū)進(jìn)行快速掃描以發(fā)現(xiàn)各種變化事件。程控自主天文臺(tái)則對(duì)有價(jià)值的暫現(xiàn)事件展開隨動(dòng)觀測(cè)以獲得進(jìn)一步的信息。程控望遠(yuǎn)鏡數(shù)據(jù)收集速度較傳統(tǒng)觀測(cè)模式有數(shù)百上千倍的提高,數(shù)據(jù)聯(lián)合使得數(shù)據(jù)復(fù)雜性大幅度增加,用于分類和決策的數(shù)據(jù)挖掘算法在這種情況下也必須全面革新。它帶來(lái)了新科學(xué)的機(jī)遇,同時(shí)也伴隨著全新的挑戰(zhàn)。這是一個(gè)典型的計(jì)算機(jī)應(yīng)用、信息技術(shù)和天文學(xué)交叉的領(lǐng)域。

      異構(gòu)數(shù)據(jù)再加上暫現(xiàn)天文事件為數(shù)據(jù)管理和分析帶來(lái)全新挑戰(zhàn)。時(shí)域天文學(xué)面臨的眾多挑戰(zhàn)中最核心的一個(gè)就是海量數(shù)據(jù)流的實(shí)時(shí)挖掘。科學(xué)產(chǎn)出不僅依賴于天文事件探測(cè)到與否,還需要及時(shí)而準(zhǔn)確地隨動(dòng)觀測(cè)和數(shù)據(jù)分析。這就需要對(duì)概要巡天產(chǎn)生的海量數(shù)據(jù)流快速處理,與以后的數(shù)據(jù)進(jìn)行比對(duì),找出各種變化的情況,對(duì)這些情況進(jìn)行分類和特征提取,并給出隨動(dòng)觀測(cè)的優(yōu)先級(jí)。很多科學(xué)領(lǐng)域也面臨著類似的情況。海量數(shù)據(jù)從科學(xué)儀器和傳感器網(wǎng)絡(luò)中不斷產(chǎn)生,異常事件和有價(jià)值的情況必須及時(shí)探測(cè)和發(fā)現(xiàn),并迅速觸發(fā)相應(yīng)的動(dòng)作。

      數(shù)據(jù)密集型時(shí)代天文數(shù)據(jù)的存儲(chǔ)和處理有了新的模式,研究的模式也在快速地發(fā)生著改變??蒲行畔⒒h(huán)境則是天文學(xué)研究的內(nèi)在需求。

      圖1 虛擬天文臺(tái)基本架構(gòu)

      3 虛擬天文臺(tái)和天文信息學(xué)

      天文學(xué)是一門既古老而又生機(jī)勃勃的基礎(chǔ)學(xué)科。她起源于數(shù)千年前,而時(shí)至今日還不斷地為我們帶來(lái)激動(dòng)人心的新發(fā)現(xiàn)。天文學(xué)源自觀測(cè),收集數(shù)據(jù)、處理數(shù)據(jù)、共享成果,是天文學(xué)家傳統(tǒng)的研究模式。隨著天文學(xué)領(lǐng)域數(shù)據(jù)量的不斷增大,科研協(xié)作越來(lái)越廣泛,這種傳統(tǒng)的研究模式也必須改變。早在世紀(jì)交替之際,天文學(xué)家就意識(shí)到有必要對(duì)天文數(shù)據(jù)訪問所有的過程進(jìn)行標(biāo)準(zhǔn)化。在這種背景下,一個(gè)跨天文學(xué)科、計(jì)算機(jī)學(xué)科、信息學(xué)科的概念——虛擬天文臺(tái)(Virtual Observatory,簡(jiǎn)稱VO)誕生了[2]。VO是通過先進(jìn)的信息技術(shù)將全球范圍內(nèi)的天文研究資源無(wú)縫透明連結(jié)在一起形成的數(shù)據(jù)密集型網(wǎng)絡(luò)化天文研究和科普教育環(huán)境。

      為了將各國(guó)在VO方面的努力聯(lián)合在一起,2002年6月在德國(guó)召開了“走向國(guó)際虛擬天文臺(tái)”的國(guó)際會(huì)議。會(huì)上成立了國(guó)際虛擬天文臺(tái)聯(lián)盟(IVOA)。IVOA成立了多個(gè)工作組,致力于為實(shí)現(xiàn)數(shù)據(jù)的互操作而制訂相關(guān)的標(biāo)準(zhǔn)和規(guī)范,使數(shù)據(jù)產(chǎn)品的生成、數(shù)據(jù)發(fā)布、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)訪問和獲取都在標(biāo)準(zhǔn)的VO框架下進(jìn)行。天文學(xué)家只需登陸到虛擬天文臺(tái)系統(tǒng)便可以享受其提供的豐富資源和強(qiáng)大的服務(wù),使自己從數(shù)據(jù)收集、數(shù)據(jù)處理這些繁瑣的事務(wù)中徹底擺脫出來(lái),而把精力集中在自己感興趣的科學(xué)研究問題上。

      VO的基本架構(gòu)如圖1所示。天文學(xué)領(lǐng)域中的海量數(shù)據(jù)通過大型的數(shù)據(jù)中心或者小型的研究團(tuán)隊(duì)來(lái)進(jìn)行管理,以互聯(lián)網(wǎng)為平臺(tái)把這些數(shù)據(jù)以及相關(guān)的計(jì)算等資源提供給天文學(xué)家等用戶使用。這就是IVOA架構(gòu)中的資源層。數(shù)據(jù)和計(jì)算資源的消費(fèi)者,或者是個(gè)體天文學(xué)家,或者是研究團(tuán)隊(duì),或者是計(jì)算機(jī)系統(tǒng),通過用戶層來(lái)和下面的資源進(jìn)行交互。VO則是這個(gè)架構(gòu)中連接資源層和用戶層的那個(gè)中間層,它以無(wú)縫透明的方式將兩者連接在一起。VO為資源提供者提供了技術(shù)框架,使得這些資源可以被共享(Sharing),用戶能夠找到(Finding),得到(Getting)并使用(Using)它們。IVOA制訂的一系列協(xié)議和規(guī)范就是要為這些功能的實(shí)現(xiàn)提供指導(dǎo)和約束。

      VO的誕生,消除了各數(shù)據(jù)庫(kù)系統(tǒng)訪問標(biāo)準(zhǔn)不統(tǒng)一的問題,使得數(shù)據(jù)交叉證認(rèn)、圖像光譜數(shù)據(jù)的分析等工作有了相應(yīng)的工具來(lái)完成。通過使用這些工具,天文學(xué)家可以避免一部分重復(fù)性工作,節(jié)省了寶貴的時(shí)間。經(jīng)過各國(guó)VO團(tuán)隊(duì)的努力,前面所述的一些服務(wù),已經(jīng)部分或全部在VO的框架下得到具體的實(shí)現(xiàn)。如VOspec、Aladin、SPLAT、VOSesame、VOplot、TOPCAT、Iris等都是VO的出色的應(yīng)用程序。目前,全世界已經(jīng)有上百家天文數(shù)據(jù)中心或天文項(xiàng)目宣稱支持VO的標(biāo)準(zhǔn),為VO提供標(biāo)準(zhǔn)接口的數(shù)據(jù)源。可以想象,如果未來(lái)的天文數(shù)據(jù)都在VO的標(biāo)準(zhǔn)下進(jìn)行統(tǒng)一管理,天文學(xué)家只需掌握VO的一些工具,即可應(yīng)用所有的天文數(shù)據(jù)來(lái)進(jìn)行科研工作。

      在過去的十幾年間,國(guó)際上多個(gè)巡天項(xiàng)目積累的數(shù)據(jù)已經(jīng)從GB量級(jí)跨越到了TB量級(jí)。很快,天文領(lǐng)域的數(shù)據(jù)量將從TB量級(jí)跨入PB量級(jí)。隨著數(shù)據(jù)和計(jì)算資源的增長(zhǎng),誕生了新的知識(shí)發(fā)現(xiàn)模式。數(shù)據(jù)已經(jīng)成為繼觀測(cè)與實(shí)驗(yàn)、理論、計(jì)算之后科學(xué)發(fā)現(xiàn)的第四范式[3]。數(shù)據(jù)密集型環(huán)境下,天文研究所需的資源不但包括數(shù)據(jù)庫(kù)、分布式數(shù)據(jù),還需要高性能計(jì)算、分布式計(jì)算(如網(wǎng)格與云計(jì)算等)、數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)工具、創(chuàng)新的可視化環(huán)境等。

      計(jì)算能力按照摩爾定律每18個(gè)月增長(zhǎng)1倍,I/O帶寬每年增長(zhǎng)10%,然而,數(shù)據(jù)量幾乎每年增長(zhǎng)1倍。因此,相對(duì)于數(shù)據(jù)量的急速增長(zhǎng),計(jì)算能力和I/O帶寬的增長(zhǎng)遠(yuǎn)遠(yuǎn)不能滿足需求。我們?cè)L問、分析數(shù)據(jù),從中提取和吸收知識(shí)的能力則越來(lái)越顯得落后,需要開發(fā)和應(yīng)用更強(qiáng)大的新算法、新方法。這就需要在數(shù)據(jù)驅(qū)動(dòng)的天文學(xué)研究時(shí)代培養(yǎng)新一代的科學(xué)家和技術(shù)專家。

      量變帶來(lái)質(zhì)變,在數(shù)據(jù)量從GB躍升到PB后,就需要全新方法和全新模式。目前為止,天文學(xué)界所采取的是一種非正式和臨時(shí)應(yīng)對(duì)的方式,結(jié)合e-Science和巡天領(lǐng)域的一些專家來(lái)共同推進(jìn)。天文學(xué)家逐漸認(rèn)識(shí)到這種方式的局限性。要全面應(yīng)對(duì)海量科學(xué)數(shù)據(jù)時(shí)代天文學(xué)研究的挑戰(zhàn),天文學(xué)家們需要更寬廣的視野和長(zhǎng)久的策略。為了使現(xiàn)有和未來(lái)大型巡天項(xiàng)目、觀測(cè)設(shè)施等數(shù)據(jù)生產(chǎn)項(xiàng)目科學(xué)產(chǎn)出最大化,天文學(xué)需要自身領(lǐng)域的信息科學(xué)專家。天文學(xué)需要正式創(chuàng)建、承認(rèn)和支持一個(gè)重要的新學(xué)科,即天文信息學(xué)(Astroinformatics)。

      傳統(tǒng)的,或者說(shuō)狹義的VO沒有完全解決天文學(xué)對(duì)天文信息學(xué)的需求。IVOA是一個(gè)非常有代表性的e-Science信息技術(shù)研究項(xiàng)目,核心目標(biāo)是制訂一套完整的標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn)對(duì)全球天文信息資源的發(fā)現(xiàn)、訪問和互操作。對(duì)于天文信息學(xué)而言,這只是邁出了最初的一步。還需要更多的、系統(tǒng)性的研究和開發(fā),把計(jì)算和分析的科學(xué)工具應(yīng)用到天文學(xué)領(lǐng)域,從海量的數(shù)據(jù)中甄別出新的模式和新的發(fā)現(xiàn)。天文信息學(xué)代表了數(shù)據(jù)密集型天文科學(xué)研究的一種新模式[4]。它將涵蓋一系列內(nèi)在相互關(guān)聯(lián)的領(lǐng)域,包括數(shù)據(jù)組織、數(shù)據(jù)描述、天文分類學(xué)、天文概念語(yǔ)義、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、可視化、天文統(tǒng)計(jì)學(xué)等等。研究的內(nèi)容包括:數(shù)據(jù)模型、數(shù)據(jù)轉(zhuǎn)換和歸一化方法、索引技術(shù)、信息提取和整合方法、知識(shí)發(fā)現(xiàn)方法、基于內(nèi)容和基于語(yǔ)境的信息呈現(xiàn)、一致化的語(yǔ)義描述、分類學(xué)、天文本體論等等。這些技術(shù)和方法為在海量數(shù)據(jù)環(huán)境下開展數(shù)據(jù)挖掘、信息提取和融合、知識(shí)發(fā)現(xiàn)提供了條件。

      2010年6月16—19日,國(guó)際上第一次天文信息學(xué)研討會(huì)在美國(guó)加州理工大學(xué)召開。大會(huì)的主旨是要為數(shù)據(jù)密集、計(jì)算使能的21世紀(jì)天文學(xué)定義一個(gè)新學(xué)科(Defining an emerging discipline for the data-rich,computationally enabled astronomy in the 21st century)。會(huì)議以邀請(qǐng)報(bào)告和自由討論的形式探討了VO、跨學(xué)科研究、計(jì)算技術(shù)發(fā)展趨勢(shì)、數(shù)據(jù)庫(kù)技術(shù)發(fā)展趨勢(shì)、知識(shí)發(fā)現(xiàn)和提取、機(jī)器學(xué)習(xí)和人工智能的應(yīng)用、高維復(fù)雜數(shù)據(jù)集的可視化、下一代科學(xué)軟件系統(tǒng)、數(shù)值密集型理論和數(shù)據(jù)密集型觀測(cè)條件下的科學(xué)、定量化的新科學(xué)、協(xié)同工作環(huán)境和工具、下一代面向天文信息學(xué)的科學(xué)家的培養(yǎng)、科普教育新技術(shù)、全民科學(xué)、科學(xué)出版和知識(shí)保護(hù)的新方法、實(shí)用天文語(yǔ)義技術(shù)等內(nèi)容。2011年9月,第二次天文信息學(xué)研討會(huì)在意大利召開。2012年9月第三次天文信息學(xué)研討會(huì)在微軟研究院總部召開。

      以國(guó)家天文臺(tái)為首的中國(guó)天文學(xué)界在2002年提出了中國(guó)虛擬天文臺(tái)(China-VO)的設(shè)想。2002年China-VO成為IVOA成員。China-VO的重點(diǎn)研發(fā)領(lǐng)域包括:系統(tǒng)平臺(tái)的開發(fā)、國(guó)內(nèi)外天文研究資源的統(tǒng)一訪問、支持VO的項(xiàng)目與觀測(cè)設(shè)施、基于VO的天文研究示范和基于VO的天文科普教育等方面。China-VO自提出就將其定位為一個(gè)應(yīng)用型研究計(jì)劃,目標(biāo)是成為天文學(xué)和信息技術(shù)之間的橋梁和紐帶,讓先進(jìn)的信息技術(shù)服務(wù)于天文學(xué)的研究。China-VO在其研究和應(yīng)用的同時(shí),一直是天文信息學(xué)的推動(dòng)者。2006年國(guó)家自然科學(xué)基金委員會(huì)與中科院開始共同設(shè)立天文聯(lián)合基金,把“海量天文數(shù)據(jù)存儲(chǔ)、計(jì)算、共享及虛擬天文臺(tái)技術(shù)”列為重點(diǎn)支持的5個(gè)研究領(lǐng)域之一,為國(guó)內(nèi)虛擬天文臺(tái)和天文信息學(xué)的穩(wěn)步發(fā)展提供了必要的支持?!?013年度國(guó)家自然科學(xué)基金項(xiàng)目指南》則更加明確地把這一資助方向陳述為“為解決重大天文項(xiàng)目所面臨的數(shù)據(jù)、計(jì)算和信息提取等問題而開展的應(yīng)用基礎(chǔ)性研究,包括海量天文數(shù)據(jù)存儲(chǔ)與共享、數(shù)據(jù)挖掘、高性能計(jì)算及虛擬天文臺(tái)技術(shù)等”。2011年,“天文信息技術(shù)”作為“天文技術(shù)與方法”專業(yè)的一個(gè)研究方向被列入到國(guó)家天文臺(tái)2011年碩士和博士招生專業(yè)目錄。我們有理由相信天文信息學(xué)不久將作為天體物理學(xué)的一個(gè)二級(jí)學(xué)科出現(xiàn)在科研院所和高校的科研、教學(xué)體系中。

      4 統(tǒng)籌規(guī)劃打造中國(guó)虛擬天文臺(tái)

      中科院天文領(lǐng)域各研究機(jī)構(gòu)在專項(xiàng)等基金的支持下,經(jīng)過多年的努力,已經(jīng)積累了較好的信息化基礎(chǔ)。

      國(guó)家天文臺(tái)的天文數(shù)據(jù)服務(wù)工作開始于20世紀(jì)80年代。2002年中國(guó)虛擬天文臺(tái)計(jì)劃提出后,以信息與計(jì)算中心為代表的國(guó)家天文臺(tái)天文信息技術(shù)研發(fā)團(tuán)隊(duì)在科學(xué)數(shù)據(jù)庫(kù)、數(shù)據(jù)互操作、天文應(yīng)用軟件、網(wǎng)格技術(shù)、科學(xué)工作流、超級(jí)計(jì)算、協(xié)同工作環(huán)境等領(lǐng)域完成了大量的工作,發(fā)表論文數(shù)十篇,取得軟件注冊(cè)權(quán)登記3項(xiàng),多套天文軟件和應(yīng)用系統(tǒng)投入使用,服務(wù)于LAMOST大科學(xué)工程等重大科技計(jì)劃和國(guó)內(nèi)外天文學(xué)家。

      紫金山天文臺(tái)現(xiàn)有的望遠(yuǎn)鏡數(shù)據(jù)獲取設(shè)施基礎(chǔ)有穩(wěn)定、高速的聯(lián)接各野外臺(tái)站的信息傳輸網(wǎng)絡(luò),并已成功實(shí)施IPv6。已建設(shè)資源豐富、架構(gòu)科學(xué)、效能高效的毫米波射電天文、行星科學(xué)數(shù)據(jù)庫(kù)等數(shù)據(jù)庫(kù)?!笆濉逼陂g,還將協(xié)同暗物質(zhì)衛(wèi)星項(xiàng)目著力建設(shè)暗物質(zhì)與空間天文數(shù)據(jù)庫(kù),配合空間碎片監(jiān)測(cè)網(wǎng)重點(diǎn)建設(shè)空間碎片數(shù)據(jù)庫(kù),并配合中國(guó)南極天文中心建設(shè)中國(guó)南極中心天文數(shù)據(jù)庫(kù)。已成功建設(shè)適應(yīng)現(xiàn)代天文學(xué)研究需求的超級(jí)計(jì)算環(huán)境。

      上海天文臺(tái)總部與佘山園區(qū)間已完成高速網(wǎng)絡(luò)互聯(lián),全面啟用下一代互聯(lián)網(wǎng)。高性能計(jì)算初具規(guī)模,擁有1PB的高速磁盤陣列、計(jì)算機(jī)集群平臺(tái)、分布式計(jì)算刀片平臺(tái)、3臺(tái)SGI Altix系列計(jì)算機(jī)、2套分布式計(jì)算機(jī)群,全部設(shè)備集中在公共機(jī)房,由信息計(jì)算中心負(fù)責(zé)運(yùn)行和管理。e-Science應(yīng)用示范項(xiàng)目、天文科學(xué)數(shù)據(jù)庫(kù)、野外臺(tái)站等項(xiàng)目順利通過中科院“十一五”信息化專項(xiàng)驗(yàn)收?!皯?yīng)用于深空探測(cè)和天文觀測(cè)的e-VLBI技術(shù)”與“超級(jí)計(jì)算中的星系和宇宙”入選中科院科研信息化應(yīng)用優(yōu)秀案例?!盎谙乱淮ヂ?lián)網(wǎng)的e-VLBI示范平臺(tái)”作為中科院5個(gè)示范項(xiàng)目之一入選國(guó)家發(fā)改委CNGI項(xiàng)目。

      2013年4月16日,中科院基礎(chǔ)局組織召開了“中科院天文領(lǐng)域科研信息化研討會(huì)”。這是國(guó)內(nèi)天文學(xué)領(lǐng)域首次高端科研信息化研討會(huì),國(guó)家自然科學(xué)基金委員會(huì)數(shù)理學(xué)部、中科院辦公廳、國(guó)家天文臺(tái)、紫金山天文臺(tái)、上海天文臺(tái)60多位代表參加了會(huì)議。

      會(huì)議旨在以組織實(shí)施中科院科研信息化“天文科技領(lǐng)域云”項(xiàng)目和國(guó)家發(fā)改委高技術(shù)服務(wù)業(yè)研發(fā)及產(chǎn)業(yè)化項(xiàng)目為契機(jī),主動(dòng)適應(yīng)信息化時(shí)代中國(guó)天文學(xué)中長(zhǎng)期發(fā)展的要求,建立中科院天文領(lǐng)域信息化工作統(tǒng)籌協(xié)調(diào)的工作機(jī)制,整合我國(guó)天文科技資源和天文信息技術(shù)研究開發(fā)力量,促進(jìn)科技資源的共建共享,推進(jìn)我國(guó)天文學(xué)科研信息化的進(jìn)程,通過信息化手段更好地支撐天文學(xué)研究和科學(xué)知識(shí)傳播。會(huì)議決定正式組建China-VO這樣一個(gè)群眾性學(xué)術(shù)研究和開發(fā)組織,統(tǒng)籌組織中科院天文領(lǐng)域科研信息化研究開發(fā)和服務(wù)工作。

      全新打造的China-VO將充分利用各臺(tái)站和中科院現(xiàn)有網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算等信息化基礎(chǔ)設(shè)施,借助先進(jìn)的信息技術(shù)和VO領(lǐng)域的研究成果,以國(guó)內(nèi)核心天文觀測(cè)設(shè)備的時(shí)間申請(qǐng)、審批,數(shù)據(jù)匯交、共享和使用為線索,融合天文觀測(cè)和科研活動(dòng)所需的科學(xué)數(shù)據(jù)、高性能計(jì)算、軟件和實(shí)用工具等資源,形成一個(gè)物理上分散、邏輯上統(tǒng)一的網(wǎng)絡(luò)化科學(xué)研究平臺(tái);服務(wù)從望遠(yuǎn)鏡時(shí)間申請(qǐng)一直到科學(xué)論文撰寫的整個(gè)科學(xué)研究過程,實(shí)現(xiàn)信息化基礎(chǔ)設(shè)施及資源與天文學(xué)研究活動(dòng)的直接融合;提升我國(guó)天文觀測(cè)設(shè)備的運(yùn)行水平,促進(jìn)設(shè)備和科學(xué)數(shù)據(jù)的開放共享。

      中國(guó)虛擬天文臺(tái)將主要提供4個(gè)方面的服務(wù):(1)望遠(yuǎn)鏡開放服務(wù)。為國(guó)內(nèi)核心天文觀測(cè)設(shè)備提供統(tǒng)一時(shí)間申請(qǐng)、審批和數(shù)據(jù)歸檔服務(wù),有條件地向愛好者和公眾開放專業(yè)設(shè)施;(2)數(shù)據(jù)開放共享服務(wù)。在尊重相關(guān)數(shù)據(jù)使用政策和知識(shí)產(chǎn)權(quán)的前提下提供對(duì)國(guó)內(nèi)、國(guó)際數(shù)據(jù)資源的快速訪問,支持海量異構(gòu)數(shù)據(jù)的過濾、融合等操作;(3)數(shù)據(jù)分析與挖掘環(huán)境。為科研用戶提供支持海量高維復(fù)雜數(shù)據(jù)的加工處理與挖掘分析環(huán)境,支持天文統(tǒng)計(jì)學(xué)課題的開展;(4)可視化及公共數(shù)據(jù)服務(wù)。面向科研人員和公眾提供海量數(shù)據(jù)的準(zhǔn)實(shí)時(shí)可視化,為教育、科普等非科研需求提供數(shù)據(jù)服務(wù)。

      China-VO將為觀測(cè)設(shè)備管理者提供觀測(cè)申請(qǐng)和審批、數(shù)據(jù)標(biāo)準(zhǔn)化歸檔與開放使用以及成果展示平臺(tái);為科學(xué)用戶、教育用戶、公眾用戶提供觀測(cè)申請(qǐng)、數(shù)據(jù)使用和成果共享平臺(tái);為相關(guān)管理部門提供天文觀測(cè)設(shè)備運(yùn)行情況以及數(shù)據(jù)產(chǎn)品使用情況的客觀統(tǒng)計(jì)數(shù)據(jù)。

      5 結(jié)語(yǔ)

      在科學(xué)技術(shù)日新月異的今天,學(xué)科之間相互交叉現(xiàn)象十分普遍。當(dāng)前信息技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)發(fā)展迅速,各種新概念、新技術(shù)層出不窮。這其中有很多天文領(lǐng)域值得吸收和借鑒的技術(shù)與方法。未來(lái)天文領(lǐng)域的發(fā)展必定和信息技術(shù)、計(jì)算機(jī)技術(shù)息息相關(guān)。我們正步入天文數(shù)據(jù)PB量級(jí)的時(shí)代,EB量級(jí)時(shí)代也不再是遙不可及。天文學(xué)研究從觀測(cè)到數(shù)據(jù)獲取,再到數(shù)據(jù)處理分析,一直到成果發(fā)表和共享,都越來(lái)越需要借助科研信息化的環(huán)境。

      虛擬天文臺(tái)概念的提出為e-Science的發(fā)展提供了應(yīng)用示范,促進(jìn)了天文學(xué)與計(jì)算機(jī)科學(xué)、信息技術(shù)的交叉與合作。隨著科學(xué)和技術(shù)的發(fā)展,數(shù)據(jù)密集型環(huán)境下的天文學(xué)研究對(duì)研究方法、研究手段、研究工具和各種支撐條件提出了新的挑戰(zhàn)。天文信息學(xué)作為數(shù)據(jù)密集型天文科學(xué)研究的一種新模式,正呈現(xiàn)出其勃勃的生機(jī)。

      1 Graham M J,Djorgovski S G,MahabalA et al.Data challenges of time domain astronomy,Distributed and Parallel Databases.2012,30(5-6)371-384.DOI:10.1007/ s10619-012-7101-7.

      2 Cui C Z,Zhao Y H.Worldwide R&D of Virtual Observatory.In:Jin W J,Platais I,Perryman MAC.(Eds.),AGiant Step:from Milli-to Micro-arcsecondAstrometry.Proceedings of the InternationalAstronomical Union(2007)Symposium S248.2008,3:563-564.

      3 Hey T,Tansley S,Tolle K.The Fourth-Paradigm:Data-Intensive Scientific Discovery.Second ed.Microsoft Research,Redmond,WA.2009.

      4 Kirk D.Borne,et al.Astroinformatics:A21st CenturyApproach toAstronomy.[2011-05-30].http://www8.nationalacademies.org/ astro2010/DetailFileDisplay.aspx?id=455.

      崔辰州中科院國(guó)家天文臺(tái)研究員,博士。主要研究方向?yàn)樘煳男畔W(xué)、虛擬天文臺(tái)。多年來(lái)致力于以虛擬天文臺(tái)為核心的天文信息學(xué)研究和開發(fā):完成中國(guó)天文數(shù)據(jù)中心、SkyMouse、VO-DAS等多套天文應(yīng)用平臺(tái)和系統(tǒng);發(fā)表學(xué)術(shù)論文30余篇,完成譯著1部、軟件著作權(quán)登記3項(xiàng);主持國(guó)家自然基金委、中科院、科技部等國(guó)家級(jí)科研項(xiàng)目16項(xiàng);2012年被中國(guó)天文學(xué)會(huì)授予“天文學(xué)突出貢獻(xiàn)獎(jiǎng)”。E-mail:ccz@bao.ac.cn

      Virtual Observatory,an e-Science Environment for Astronomy

      Cui Chenzhou1Xue Yanjie2Li Jian1Zhao Yongheng1Liu Liang3Chen Xiao4
      (1 NationalAstronomical Observatories,ChineseAcademy of Sciences,Beijing 100012,China 2 ChineseAcademy of Sciences,Beijing 100864,China 3 Purple MountainAstronomical Observatory,ChineseAcademy of Sciences,Nanjing 210008,China 4 ShanghaiAstronomical Observatory,ChineseAcademy of Sciences,Shanghai 200030,China)

      During the last decades,Astronomy has been stepped into a data intensive era.TB datasets have been in hands,and PB datasets are emerging.Big data in astronomy brings challenges on data management,computing,bandwidth,software,and even the way to do research.Astronomers are working together with experts in computer science and information technology to provide an easy way to discover knowledge from big data.Virtual Observatory(VO)is a data-intensively online astronomical research and education environment,taking advantages of advanced information technologies to achieve seamless,global access to astronomical information.To allow users and applications to access distributed and heterogeneous datasets and services in a consistent and uniform way(interoperability),International Virtual Observatory Alliance(IVOA)has been defined a set of standards and specifications.However,the VO,especially the IVOA,does not address all of the challenges faced to astronomical research and education in a data-driven and data-intensive science research era.Standing on a broader vision,Astroinformatics will act as a sub-discipline of Astronomy to enable data-intensive astronomical science.In the paper,backgrounds and current status of VO research and development are introduced,challenges faced to Astronomy and requirements for Astroinformatics are discussed,activities and achievements from CAS astronomical observatories on e-Science are reviewed,prospects for VO in China is described.

      astronomy,e-Science,virtual observatory,astroinformatics,roadmap

      *修改稿收到日期:2013年5月4日

      猜你喜歡
      天文學(xué)天文臺(tái)信息學(xué)
      20世紀(jì)60年代天文學(xué)四大發(fā)現(xiàn)
      軍事文摘(2021年18期)2021-12-02 01:28:46
      雞NRF1基因啟動(dòng)子區(qū)生物信息學(xué)分析
      圣斗士與古代天文學(xué)
      天文臺(tái)就該這么看
      海爾與望遠(yuǎn)鏡和天文臺(tái)的故事
      軍事文摘(2020年24期)2020-02-06 05:57:02
      初論博物館信息學(xué)的形成
      天文臺(tái)
      歐米茄超霸系列月相至臻天文臺(tái)表
      空中之家(2016年5期)2016-02-04 01:28:35
      現(xiàn)代天文學(xué)之傳奇
      miRNA-148a在膀胱癌組織中的表達(dá)及生物信息學(xué)分析
      莒南县| 溧阳市| 西充县| 潞西市| 民县| 乐亭县| 岢岚县| 昌吉市| 海林市| 和田市| 潮安县| 昆山市| 齐齐哈尔市| 玛沁县| 永康市| 习水县| 漠河县| 锦州市| 云浮市| 连城县| 山阳县| 双辽市| 林芝县| 武川县| 沅江市| 绥阳县| 诸城市| 开阳县| 康保县| 海伦市| 台湾省| 清水河县| 永泰县| 平江县| 三门峡市| 始兴县| 利川市| 安庆市| 霍山县| 青浦区| 福安市|