• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      氣象落區(qū)文本自動(dòng)生成研究

      2014-03-29 02:00:42吳煥萍呂終亮張華平羅兵高健李笑侃何國豪王永超
      關(guān)鍵詞:預(yù)報(bào)員落區(qū)氣象要素

      吳煥萍,呂終亮,張華平,羅兵,高健,李笑侃,何國豪,王永超

      1.國家氣候中心,北京100081

      2.國家氣象中心,北京100081

      3.北京理工大學(xué),北京100081

      4.中國地質(zhì)大學(xué),北京100083

      1 引言

      氣象服務(wù)產(chǎn)品具有直觀、形象、簡單易懂的特點(diǎn),但同時(shí)要求精細(xì)化、個(gè)性化、多樣性、時(shí)效性、主動(dòng)性。對(duì)于公眾來說,氣象數(shù)據(jù)或者相關(guān)圖表過于專業(yè)與復(fù)雜,需要領(lǐng)域?qū)<疫M(jìn)行解讀與提煉,最終形成自然語言表述的氣象服務(wù)文本信息,也是公眾最容易接受的氣象服務(wù)形式[1]。因此,中國氣象局日常發(fā)布的國內(nèi)外“天氣公報(bào)”、“海洋天氣公報(bào)”、“重要?dú)夂蛐畔?bào)”、“天氣服務(wù)公報(bào)”等諸多氣象服務(wù)產(chǎn)品中,均體現(xiàn)了文本語言(或者稱“文本”,下文將視為同一概念)描述為主,輔以圖形或者表格說明的基本行文原則。天氣預(yù)報(bào)與氣象服務(wù)產(chǎn)品注重“圖文并茂”,但從目前技術(shù)發(fā)展來看,圖形的自動(dòng)化生成方法在氣象信息科學(xué)可視化技術(shù)發(fā)展下相對(duì)成熟,如M ICAPS和MESIS均具有較強(qiáng)的圖形產(chǎn)品自動(dòng)生成能力[2],而文本的自動(dòng)化生成方法研究還遠(yuǎn)遠(yuǎn)不夠。目前業(yè)務(wù)上依然是預(yù)報(bào)員人工撰寫,甚至看圖說話來完成,這種人工編寫效率極其低下且常常滿足不了時(shí)效性要求,還會(huì)由于預(yù)報(bào)員知識(shí)背景差異等原因?qū)е挛谋緝?nèi)容出現(xiàn)偏差。因此,面向氣象服務(wù)領(lǐng)域內(nèi)準(zhǔn)確、高效、合理、符合自然語言表達(dá)的文本生成技術(shù)亟待深入研究。

      國外于20世紀(jì)70年代初就已經(jīng)開始重視了天氣預(yù)報(bào)文本的計(jì)算機(jī)自動(dòng)生成研究。最早的天氣預(yù)報(bào)文本生成器采用了文字替換法(CWF),其代表性的有IFPS、RAREAS、M arWords、Scribe等業(yè)務(wù)應(yīng)用系統(tǒng);隨后20世紀(jì)90年代初開始引入自然語言處理技術(shù)(Natural Language Processing,NLP),一些面向特定天氣預(yù)報(bào)領(lǐng)域的文本生成系統(tǒng)如Forecast Generator(FoG)、Sum Time M eteo等也得到了一定發(fā)展與應(yīng)用[3]。相比之下國內(nèi)相關(guān)領(lǐng)域的研究則開展較晚,氣象部門主要使用了從簡單數(shù)據(jù)到文本表格形式的預(yù)報(bào)文本生成,如采用了從天氣代碼直接到對(duì)應(yīng)文字描述的簡單轉(zhuǎn)換。真正意義上基于自然語言處理技術(shù)的成果,可以追溯到2000年上海交通大學(xué)開展的多語種天氣預(yù)報(bào)文本自動(dòng)生成系統(tǒng)(M LWFA)的初步研究??傮w來看,國內(nèi)外這些研究為面向氣象領(lǐng)域的自然語言文本生成進(jìn)行了有益探索并奠定了一定的基礎(chǔ)[4-8]。

      結(jié)合氣象服務(wù)氣象區(qū)域文本描述的基本業(yè)務(wù)需求,本文分析了中央氣象臺(tái)每日發(fā)布的大量歷史“天氣公報(bào)”文本內(nèi)容,提出了綜合運(yùn)用自然語言處理和地理信息分析方法來形成文本語言自動(dòng)生成方法[9-11],并對(duì)所涉及的歷史文本內(nèi)容分析與特征提取、地理區(qū)域劃分、氣象要素空間分析、文本組織與生成等關(guān)鍵技術(shù)問題進(jìn)行了深入討論。通過探索文本類服務(wù)材料的計(jì)算機(jī)自動(dòng)或者半自動(dòng)生成方法,生成效率的提高將有望將預(yù)報(bào)與服務(wù)人員從繁重、重復(fù)的體力勞動(dòng)中解脫出來,使其有更多的時(shí)間和精力用于真正思考如何更好地做好預(yù)報(bào)與服務(wù),從而提高預(yù)報(bào)準(zhǔn)確率;另一方面,也將有望進(jìn)一步拓寬服務(wù)材料的生成領(lǐng)域,實(shí)現(xiàn)服務(wù)材料的多形式表達(dá)與快速多渠道發(fā)布,不斷滿足用戶精細(xì)化和個(gè)性化的需求。

      2 基本原理

      2.1 氣象落區(qū)描述

      氣象落區(qū)是指某一氣象要素在某一地理區(qū)域內(nèi)發(fā)生的位置,氣象落區(qū)文本描述則是指一定的地理區(qū)域上所發(fā)生的天氣氣候現(xiàn)象及強(qiáng)度的文字性說明,一般包括對(duì)過去發(fā)生的氣象實(shí)況進(jìn)行總結(jié)描述,也包括對(duì)未來預(yù)報(bào)的氣象要素發(fā)生區(qū)域進(jìn)行展望描述,如中央氣象臺(tái)每日發(fā)布的指導(dǎo)預(yù)報(bào)產(chǎn)品“天氣公報(bào)”中,其主要內(nèi)容是對(duì)未來三天的降水預(yù)報(bào)落區(qū)及變化趨勢(shì)進(jìn)行描述,如圖1所示。

      圖1 中央氣象臺(tái)天氣公報(bào)部分內(nèi)容示意圖

      通常氣象落區(qū)文本描述的信息源于可以分兩大類:一類是實(shí)時(shí)氣象臺(tái)站觀測(cè)信息;另一類是氣象預(yù)報(bào)信息。這些信息經(jīng)過預(yù)報(bào)員的大腦解譯與分析后形成的天氣實(shí)況或者氣象預(yù)報(bào)文本,不但要求其文本在時(shí)間、地區(qū)及方位、氣象要素種類(如降水、溫度、濕度等)以及相應(yīng)量級(jí)(如小雨、中雨、暴雨等)等方面合理、準(zhǔn)確并符合自然語言表達(dá),還要求符合預(yù)報(bào)員長期以來形成的語言表達(dá)習(xí)慣,因此具有較高的語言特征和用語要求。

      2.2 基本原理

      氣象落區(qū)文本描述的計(jì)算機(jī)自動(dòng)生成方法,就是要解決從氣象數(shù)據(jù)到文本數(shù)據(jù)的生成問題。本文提出了以下基本思路:首先將氣象觀測(cè)數(shù)據(jù)或者預(yù)報(bào)數(shù)據(jù)通過一定的模型轉(zhuǎn)化到空間區(qū)域上,即一定的氣象落區(qū),然后與一定的地理區(qū)劃數(shù)據(jù)進(jìn)行GIS空間分析,確定特定氣象要素及相應(yīng)的量級(jí)落在某地理區(qū)劃上,最后運(yùn)用自然語言生成技術(shù)(NLG),對(duì)氣象要素的時(shí)間、地點(diǎn)、強(qiáng)度等信息進(jìn)行合理組織,并運(yùn)用段落規(guī)劃、句子規(guī)劃、句子優(yōu)化以及相關(guān)后處理形成自然語言表達(dá)的氣象落區(qū)描述文本。上述流程如圖2所示。

      圖2 技術(shù)流程圖

      3 關(guān)鍵技術(shù)分析

      3.1 文本分析與特征提取

      文本分析與特征提取是為了分析抽取某一類文本的內(nèi)容與結(jié)構(gòu)模板,并為最終生成的文本內(nèi)容提供規(guī)則庫。對(duì)于氣象落區(qū)文本特征的抽取,一般需要對(duì)文本中所涉及的時(shí)間變量、地理變量、方向變量、氣象要素變量,以及短句結(jié)構(gòu)特征、句子、段落和篇章等元素進(jìn)行有效特征提取。

      本文共對(duì)業(yè)務(wù)人員人工撰寫的1963個(gè)歷史“天氣公報(bào)”文檔進(jìn)行了自然語言統(tǒng)計(jì)學(xué)分析,抽取出來了氣象要素、地理及方位變量、描述氣象的短句與結(jié)構(gòu)特征。其中,氣象要素變量包括描述各種氣象信息的天氣名詞及相應(yīng)的強(qiáng)度(量級(jí)),如降水量及“小雨”、“中雨”、“大雨”等。地理變量包括了描述地理位置的地名名詞,如華北、內(nèi)蒙古、長江流域等;方位變量包括了大部、局部、東部、西部、南部、北部、中部、中大部等名詞;短句結(jié)構(gòu)特征是指描述氣象要素所涉及上述變量的通用的句子表達(dá)形式,并同時(shí)經(jīng)過短句結(jié)構(gòu)的抽取形成了句子模板庫。圖3所示是句子模板庫的一個(gè)簡單例子,中括號(hào)(即[])及其中間的信息表示一個(gè)變量,變量有[地點(diǎn)]、[級(jí)數(shù)]、[方向]、[雨雪強(qiáng)度]等。圖3中可以看出,對(duì)于天氣現(xiàn)象風(fēng)的句子結(jié)構(gòu),有如什么海域?qū)⒍嗌偌?jí)的風(fēng),或者地方有多少級(jí)的風(fēng),某些地方風(fēng)力達(dá)到多少級(jí),或者什么地方有多少級(jí)陣風(fēng)、方向多少。

      圖3 天氣公報(bào)句子結(jié)構(gòu)特征

      同時(shí)還對(duì)“天氣公報(bào)”的結(jié)構(gòu)特征進(jìn)行了抽取,主要的特征如圖4所示。圖4中篇章結(jié)構(gòu)表明,通常說明了什么時(shí)間(具體到小時(shí))發(fā)布的預(yù)報(bào),簽發(fā)的預(yù)報(bào)員,主要天氣原因,預(yù)報(bào)的時(shí)效,天氣趨勢(shì)總結(jié),具體預(yù)報(bào)內(nèi)容等主要內(nèi)容,其中具體的預(yù)報(bào)內(nèi)容則結(jié)合圖3所示的句子結(jié)構(gòu)來組織。

      圖4 篇章結(jié)構(gòu)特征

      3.2 地理區(qū)域劃分

      地理區(qū)域是用于描述某種天氣現(xiàn)象所在的空間區(qū)域,它的劃分直接決定了文本生成的內(nèi)容是否符合自然語言特征。一般來講它的劃分原則既要結(jié)合氣象領(lǐng)域的全國氣象地理區(qū)劃標(biāo)準(zhǔn)[12],同時(shí)也要考慮預(yù)報(bào)員多年來形成的語言表達(dá)習(xí)慣。

      全國氣象地理區(qū)劃主要分為四級(jí),其中全國一級(jí)氣象地理區(qū)域有:西北地區(qū)、華北地區(qū)、內(nèi)蒙古地區(qū)、東北地區(qū)、黃淮地區(qū)、江淮地區(qū)、江南地區(qū)、江漢地區(qū)、華南地區(qū)、西南地區(qū)和西藏地區(qū)。全國二級(jí)氣象地理區(qū)域是在全國一級(jí)氣象地理區(qū)域基礎(chǔ)中按方位進(jìn)行劃分的,如西北西部等。各行政省份或直轄市劃分為全國三級(jí)氣象地理區(qū)域,全國四級(jí)氣象地理區(qū)域則在三級(jí)氣象地理區(qū)域的基礎(chǔ)上按方位進(jìn)行劃分,如江西南部、中部、北部。理論上來講,可以直接運(yùn)用標(biāo)準(zhǔn)的四級(jí)氣象地理區(qū)劃來分級(jí)表達(dá)落區(qū),但通過對(duì)天氣公報(bào)的地名統(tǒng)計(jì)分析,發(fā)現(xiàn)除使用全國四級(jí)氣象地理區(qū)劃中所規(guī)定名稱外,預(yù)報(bào)員多年來形成的習(xí)慣還常使用地名和河流、平原、山脈和高原等名稱描述該地域的氣象信息,如青藏高原等。因此,結(jié)合對(duì)地名的統(tǒng)計(jì)分析與識(shí)別的結(jié)果,運(yùn)用地理信息技術(shù)空間分析方法對(duì)上述標(biāo)準(zhǔn)的地理區(qū)域進(jìn)行了合理調(diào)整,形成了面向氣象落區(qū)專用的地理區(qū)域劃,以進(jìn)一步符合預(yù)報(bào)員描述習(xí)慣。對(duì)于中國海域部分,主要分為:渤海、黃海、東海、臺(tái)灣海峽、南海、北部灣等海域,則不再細(xì)分子二級(jí)區(qū)域。

      3.3 氣象要素的空間分析

      氣象要素的空間分析包括了其本身的空間化和空間化后的氣象要素與地理區(qū)域的空間疊加分析,它的分析結(jié)果決定了文本內(nèi)容是否準(zhǔn)確。

      根據(jù)中央氣象臺(tái)的業(yè)務(wù)流程,天氣指導(dǎo)預(yù)報(bào)為落區(qū)預(yù)報(bào),已經(jīng)表達(dá)了一定的地理空間未來可能的發(fā)生的天氣信息,而對(duì)于氣象觀測(cè)類型的數(shù)據(jù),可以采用合適的客觀化分析模型生成基于空間區(qū)域的氣象分布。對(duì)于降水量、溫度等連續(xù)變化量的客觀化,一般可以采用CRESSMAN插值以及IDW(反距離加權(quán)平均)等插值方法,而對(duì)于霧等離散變化的天氣現(xiàn)象量的客觀化,一般可以采用泰森多邊形法(Thiessen)的方法來確定空間分布。

      氣象要素與地理區(qū)域進(jìn)行空間分析可以確定氣象要素所發(fā)生的空間區(qū)域。這里主要運(yùn)用了氣象要素空間分布場(chǎng)與多級(jí)地理區(qū)域進(jìn)行相交(Intersect)分析、融合(Dissolve)分析等,這樣可以獲得不同地理區(qū)域上每類氣象要素的類型、量級(jí)、和面積大小等信息。

      針對(duì)預(yù)報(bào)員在描述預(yù)報(bào)文本時(shí)盡量采用某地區(qū)大部或局部等模糊量詞的特點(diǎn),本文采用“疊加度(P)”及大小來表達(dá)大部和局部等概念,即氣象要素?cái)?shù)據(jù)與其覆蓋地理區(qū)域面積之比。疊加度的引入可以進(jìn)一步判別是否需要按一定的精度來輸出文本。具體空間分析時(shí),采用了首先將氣象要素逐一與四級(jí)地理迭代空間分析,然后根據(jù)“疊加度”判斷是否需要進(jìn)行二級(jí)地理區(qū)域的空間分析,同理是否采用三級(jí)、四級(jí)區(qū)域進(jìn)行再次空間分析。該方法一方面加快了效率,還在空間分析階段就保證了同一區(qū)域沒有被重復(fù)處理。

      此外,天氣預(yù)報(bào)未來三天趨勢(shì)分析時(shí),需要分析氣象要素在時(shí)間尺度上的空間變化,如降水量未來三天將從東部逐步轉(zhuǎn)移到西部地區(qū)。取氣象要素空間分布場(chǎng)的內(nèi)點(diǎn),然后判斷其空間方位以及空間位置的變化,為了處理簡單這里只考慮了最大量級(jí)的氣象要素的空間變化。

      3.4 文本組織與生成

      自然語言生成(Natural Language Generation,NLG)方法能夠從要表達(dá)的意思出發(fā)選擇詞語,生成符合語法和邏輯,內(nèi)容行文流暢,符合人們理解的句子,通常采用了內(nèi)容規(guī)劃(Document Planner)、句子規(guī)劃(M ircoplanner)、表層生成(Surface Realize)的流水線式計(jì)算機(jī)模型[10]。其中,內(nèi)容規(guī)劃主要確定文本的內(nèi)容,句子規(guī)劃則主要通過省略、指代、合并等手段使規(guī)劃的文本更加通順、自然,表層生成則最終輸出文本。

      對(duì)于“天氣公報(bào)”的內(nèi)容規(guī)劃,本文采用了簡單模板方法即通過對(duì)歷史文本的特征提取來形成了一定的模式與規(guī)則;對(duì)于句子規(guī)劃,語句的先后順序需要遵循以下規(guī)律:

      (1)地理區(qū)域空間的描述順序。全國范圍內(nèi)的總體方向主要是先由西向東,再由北到南,如一級(jí)地理區(qū)域主要依次為西北地區(qū)、西藏地區(qū)、內(nèi)蒙古地區(qū)、東北地區(qū)、華北地區(qū)、黃淮地區(qū)、江淮地區(qū)、江漢地區(qū)、江南地區(qū)、華南地區(qū)、西南地區(qū)。

      (2)地理區(qū)域分級(jí)的描述順序。先是全國一級(jí)氣象地理區(qū)域,接著是全國二級(jí)氣象地理區(qū)域,依次類推。但對(duì)風(fēng)要素來看,地理位置包括了陸地與海洋區(qū)域,一般順序?yàn)橄葹榇箨懭缓鬄楹Q蟆?/p>

      (3)氣象要素類型的描述順序。主要順序?yàn)榻涤?、大風(fēng)、降溫以及其他天氣現(xiàn)象。

      對(duì)于氣象要素的數(shù)值量級(jí)的描述,結(jié)合氣象部門的業(yè)務(wù)規(guī)定也逐一轉(zhuǎn)換成文本詞語,如降水量不同的數(shù)值范圍替換成小雨、中雨、大雨、暴雨等詞語。

      對(duì)最終輸出的語句需要進(jìn)行合并等后續(xù)優(yōu)化處理,這里主要涉及了同一地理區(qū)域、相同的量級(jí)大小等語言合并規(guī)則。通過對(duì)比分析大量歷史天氣預(yù)報(bào)圖形和其相應(yīng)的描述文本,設(shè)計(jì)區(qū)域合并規(guī)則如表1所示,并引入輸出“大部”、“局部”等詞語來模糊描述地理區(qū)域[13]。值得注意的是,合并時(shí)還一并考慮了地理區(qū)域本身的空間包含關(guān)系,使得文本表達(dá)更為合理。

      表1 區(qū)域輸出規(guī)則

      4 技術(shù)實(shí)現(xiàn)

      氣象落區(qū)文本特征提取是一種典型的文本信息抽?。↖nformation Extract),如時(shí)間描述(早上、中午、晚上、昨天、明天等),空間描述(區(qū)域、省級(jí)、市級(jí)等),方位描述(西北、東南、南部、大部、局部等),天氣要素描述(降水、溫度、風(fēng))等。本文采用了開源的ICTCLAS分詞工具(它包括了中文分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、新詞識(shí)別等主要功能)進(jìn)行地名提取、氣象變量提取等[14]。同時(shí),進(jìn)一步開發(fā)了詞頻統(tǒng)計(jì)等工具進(jìn)行語句結(jié)構(gòu)與模式的提取以形成模板。

      文本生成過程需要大量的空間數(shù)據(jù)處理操作,GIS發(fā)揮了重要作用。本文采用了開源空間分析包GEOS[15](Geometry Engine,Open Source),它是對(duì)OGC規(guī)范中簡單幾何要素對(duì)象操作的C++語言實(shí)現(xiàn),是一個(gè)集合形狀的拓?fù)潢P(guān)系操作實(shí)用庫,主要實(shí)現(xiàn)了空間關(guān)系(相等、相交、包含)和空間疊加分析(緩沖區(qū)、交叉分析)操作等,能夠較好地實(shí)現(xiàn)本文空間分析。具體分析時(shí),將所有氣象數(shù)據(jù)(M ICAPS14類交預(yù)報(bào)員格式的數(shù)據(jù)))以及地理區(qū)域數(shù)據(jù)轉(zhuǎn)換成GIS格式,然后直接應(yīng)用該空間分析引擎即可。空間分析的結(jié)果采用XM L格式進(jìn)行定義與保存,并最終參與文本生成。

      天氣公報(bào)文本生成采用了基于規(guī)則的文本生成思路,將氣象信息空間分析化的結(jié)果與文本結(jié)構(gòu)模板進(jìn)行關(guān)聯(lián)并形成較好的自然語言表達(dá)的文本內(nèi)容。

      結(jié)合上述文本生成方法,采用C++語言對(duì)“天氣公報(bào)”的氣象落區(qū)文本的生成進(jìn)行全部編程實(shí)現(xiàn),并具備自動(dòng)定時(shí)運(yùn)行能力,程序輸入數(shù)據(jù)主要包括了中央氣象臺(tái)每天的未來三天降水預(yù)報(bào)、災(zāi)害性天氣預(yù)報(bào)落區(qū)的等業(yè)務(wù)數(shù)據(jù)。

      圖5 計(jì)算機(jī)與人工撰寫對(duì)照

      5 問題討論

      自然語言生成領(lǐng)域通常采用正確率(如生成系統(tǒng)是否表達(dá)輸入的全部意思)、通順度(如生成的文本是否通順,文法是否正確,文章風(fēng)格是否符合用戶要求等)、任務(wù)評(píng)估(生成系統(tǒng)應(yīng)用于實(shí)際領(lǐng)域中的代價(jià)、社會(huì)影響等)等指標(biāo)試圖來評(píng)價(jià)生成系統(tǒng)的質(zhì)量。由于通用文本生成方法本身還存在較大的技術(shù)難點(diǎn),因而其相應(yīng)的定性量化評(píng)估方法更是遠(yuǎn)遠(yuǎn)不成熟,上述指標(biāo)也仍然停留在定性化評(píng)估研究階段[16-17]。本文借鑒正確率和通順度兩個(gè)方面評(píng)價(jià)內(nèi)容,對(duì)比分析了2011年4月—2011年9月以來由預(yù)報(bào)員和計(jì)算機(jī)分別生成的文本內(nèi)容,總體可以看出:

      (1)自動(dòng)生成的文本內(nèi)容正確,在落區(qū)描述方面甚至比預(yù)報(bào)員人工撰寫的預(yù)報(bào)文本更加描述細(xì)致(其精細(xì)化程度由本文提出的“疊加度”P取值決定),主要體現(xiàn)在不遺漏重要的氣象要素所在的地理區(qū)域及相應(yīng)的量級(jí),相比之下,預(yù)報(bào)員在撰寫公報(bào)時(shí)則主要考慮總體趨勢(shì)表達(dá)從而做到行文簡潔。這一點(diǎn)上又不太符合天氣預(yù)報(bào)“模糊語言”原則的文本描述習(xí)慣[13],因此自動(dòng)生成的文本某種程度上還顯得“冗長”,尤其是那些復(fù)雜的天氣形勢(shì)。

      (2)自動(dòng)生成的文本內(nèi)容總體符合了預(yù)報(bào)員習(xí)慣,如空間區(qū)域的分級(jí)描述和空間區(qū)域先后順序的描述,文本內(nèi)容也較為通順、語義、語法正確,文本風(fēng)格也符合了預(yù)報(bào)員行文習(xí)慣。

      (3)自動(dòng)生成的文本內(nèi)容固定、形式單一(由模板和規(guī)則庫決定),而預(yù)報(bào)員人工撰寫內(nèi)容時(shí)還經(jīng)常結(jié)合預(yù)報(bào)經(jīng)驗(yàn)和領(lǐng)域知識(shí)做相應(yīng)補(bǔ)充,如落區(qū)量級(jí)表達(dá)時(shí)常對(duì)其局部地區(qū)進(jìn)行補(bǔ)充說明。例如2011年8月29日天氣公報(bào)中有“其中,浙江東南部、福建東部、臺(tái)灣等地的部分地區(qū)有暴雨,局部大暴雨,雨量一般有80~150mm,臺(tái)灣南部局部雨量可達(dá)200~400mm;上述部分地區(qū)并伴有短時(shí)雷雨大風(fēng)等強(qiáng)對(duì)流天氣”等補(bǔ)充性描述(下畫線部分),而這些信息僅僅依靠現(xiàn)有的輸入信息自動(dòng)生成是遠(yuǎn)遠(yuǎn)做不到的。

      上述結(jié)論也得到了負(fù)責(zé)撰寫“天氣公報(bào)”的中央氣象臺(tái)天氣預(yù)報(bào)室短期科等多位同事認(rèn)可,并總體認(rèn)為生成效率高,具有一定的參考性和實(shí)用性,可以作為天氣公報(bào)中文本材料的初稿。圖5為2011年5月1日的降水量預(yù)報(bào)落區(qū)的文本對(duì)比分析示意圖。2011年5月1日屬于氣象業(yè)務(wù)中汛期氣象服務(wù)時(shí)段,因此氣象落區(qū)從降水量量級(jí)、空間分布、范圍等來看均具有一定的代表性和復(fù)雜性。

      6 結(jié)束語

      本文緊緊圍繞氣象落區(qū)文本生成系統(tǒng)的主要問題,即哪些內(nèi)容應(yīng)該包括在生成系統(tǒng)的輸出里,以滿足預(yù)報(bào)員的撰寫意圖,如何保證生成內(nèi)容的連貫性,如何保證生成內(nèi)容在語法和語義上的正確性等;結(jié)合問題提出了氣象落區(qū)文本生成方法與流程,并重點(diǎn)闡述了文本分析與特征提取、地理區(qū)域劃分、氣象要素空間分析、文本組織與生成等四方面關(guān)鍵問題,同時(shí)還給出了相應(yīng)的技術(shù)實(shí)現(xiàn)和初步的評(píng)價(jià)。總體來看,計(jì)算機(jī)自動(dòng)生成的天氣預(yù)報(bào)落區(qū)文本雖然還不能與人工撰寫的內(nèi)容“媲美”,但可以作為預(yù)報(bào)員人工撰寫文本的初稿,預(yù)報(bào)員在此基礎(chǔ)上再作進(jìn)一步的潤色修改即可以成為最終對(duì)外服務(wù)的指導(dǎo)產(chǎn)品。下一步還將深入開展應(yīng)用分析與評(píng)估,并研究將現(xiàn)有的文本生成功能集成于M ICAPS、MESIS或者CIPAS(氣候信息交互顯示與分析系統(tǒng))等業(yè)務(wù)系統(tǒng)中,形成文本輔助生成工具(如生成天氣預(yù)報(bào)文本、實(shí)況文本等信息)供業(yè)務(wù)用戶使用。

      本文綜合運(yùn)用了自然語言處理、地理信息科學(xué)等交叉方法對(duì)計(jì)算機(jī)自動(dòng)生成氣象落區(qū)的文本進(jìn)行了初步的有益探索,其面向特定領(lǐng)域的計(jì)算機(jī)文本生成方法具有一定通用性,這也為進(jìn)一步深入探索面向氣象服務(wù)領(lǐng)域的文本生成開辟了新思路和研究方向。

      猜你喜歡
      預(yù)報(bào)員落區(qū)氣象要素
      我國運(yùn)載火箭落區(qū)控制技術(shù)取得新突破
      成都電網(wǎng)夏季最大電力負(fù)荷變化特征及其與氣象要素的關(guān)系
      江西省天氣預(yù)報(bào)員現(xiàn)狀調(diào)查分析與對(duì)策建議
      臺(tái)風(fēng)“威馬遜”和“海鷗”與大尺度環(huán)流相互作用對(duì)云南暴雨落區(qū)的影響
      預(yù)報(bào)員培訓(xùn)的“復(fù)盤”方法
      掘進(jìn)工作面管棚支護(hù)過冒落區(qū)探究與實(shí)踐
      沈陽市1951—2013年氣候變化特征及其區(qū)域蒸發(fā)的響應(yīng)分析
      北京市朝陽區(qū)大氣污染物時(shí)空分布特征及與氣象要素的關(guān)系研究
      航空氣象預(yù)報(bào)人為因素的分析初探
      探測(cè)環(huán)境變化對(duì)臨沭站氣象要素的影響
      彰化县| 黑龙江省| 闸北区| 云梦县| 城固县| 五寨县| 安国市| 定远县| 和平县| 普安县| 阿克陶县| 北票市| 南岸区| 瑞丽市| 丁青县| 西和县| 环江| 廊坊市| 尉犁县| 台南县| 湾仔区| 承德市| 乌鲁木齐县| 赤城县| 仁寿县| 衡阳市| 灌南县| 阳高县| 布拖县| 建德市| 乐山市| 河间市| 略阳县| 丹棱县| 西昌市| 常山县| 基隆市| 桂阳县| 乌海市| 璧山县| 富阳市|