胡 偉
(庫車縣氣象局,新疆阿克蘇 842000)
GIS 的農(nóng)業(yè)氣象情報文本自動化生成技術
胡 偉
(庫車縣氣象局,新疆阿克蘇 842000)
在氣象情報文本自動化生成中,主要以拓撲原理作為基礎,通過氣象專用語的關聯(lián)來進行統(tǒng)計數(shù)據(jù)的自動生成。這種技術可以將GIS平臺所觀測的農(nóng)業(yè)氣象數(shù)據(jù)進行全面的分析,從而自動生成圖表及文字,并對農(nóng)業(yè)氣象情報進行描述。
拓撲原理 GIS 自動化 氣象情報
(1)在此技術使用中,首先需要有氣象GIS技術對我國農(nóng)業(yè)氣象中的時間、空間等數(shù)據(jù)信息進行整理、集合,并建立相應的農(nóng)業(yè)氣象數(shù)據(jù)信息庫。
(2)此技術主要服務于農(nóng)業(yè),因此,需要將氣候特征、作物生長及不同災害氣象所造成的損傷等級進行確定并建立數(shù)據(jù)庫。
(3)統(tǒng)計在氣象情報文本中所有可能出現(xiàn)的專業(yè)用語,并將這些詞語依據(jù)其所具有的屬性進行分類。
(4)通過拓撲原理的應用,對氣象GIS平臺所提供的數(shù)據(jù)與農(nóng)業(yè)信息數(shù)據(jù)庫進行分析,在語法規(guī)則與語句重組模型的基礎上進行段落重組,完成氣象情報文本的自動生成。
(1)時間表達。時間表達的特征及要素較為簡單,其主要體現(xiàn)出對比的性質(zhì)。一般表達形式為,此次觀測時間與之前的某段時間之間的對比(主要為時間段內(nèi)氣象出現(xiàn)的各類變化對比)或同期之間的對比(通常為與往年之間的比較)。在拓撲映射關系建立時,對時間的語言規(guī)則及模型的建立上,主要是對其對比關系進行說明。
(2)空間表達。農(nóng)業(yè)氣象中,空間表達主要包括地區(qū)名稱、命名規(guī)則、農(nóng)業(yè)災害分布、地理命名規(guī)則、作物種植區(qū)域命名規(guī)則、方位特征命名規(guī)則幾種,且在空間表達上還需要注意地區(qū)各類等級指標。因此,在實際情況中,區(qū)域描述是空間表達中的難點。為了保證氣象情報文本的準確性,在表達上要注意避免出現(xiàn)生僻、啰嗦等情況。
(3)屬性表達。氣象要素的屬性是指,某一時間段要素值與歷史值對比得出結(jié)果所對應的農(nóng)業(yè)氣象要素評價分類指標。一般包括與前一段或前n段時間尺度的對比,與歷史同期相比,與表達指標特征的詞匯映射,即屬性分類指標與程度用語詞匯之間的拓撲關聯(lián)模型。
(1)語法規(guī)則。在進行拓撲映射模型建立中,要應用語法規(guī)則進行各類數(shù)據(jù)的聯(lián)系,其也是語言重組所需具備的最基本條件。在農(nóng)業(yè)氣象中,包含著氣象、時間、空間等內(nèi)容,要通過制定語義、語序、語式的模本來建立語言規(guī)則模型,從而保證文本的可讀性及邏輯性。目前,在拓撲原理中,主要應用的是漢語語言規(guī)則。在實際使用中,文本準確率較高。
(2)語言重組。語句模型與內(nèi)容無關,對語言用法的總結(jié)表達,自然語言的詞匯集有無限個詞匯元素,而語句模型是有限的。無限集通過有限的語法結(jié)構(gòu)框架集合生成無限的句子。情報的句型結(jié)構(gòu)比較固定,只在細節(jié)上有變化,因此,易于構(gòu)建科學數(shù)據(jù)的語句重組模型。
(3)語句生成。在自動生成的氣象情報文本中,要包含對氣象GIS平臺所提供的各類數(shù)據(jù)的詳細分析,并根據(jù)這些觀測報告,對此區(qū)域的農(nóng)作物種植提供實用的建議。其具體包括文本的整體摘要與各類空間、時間等內(nèi)容及要素,再依據(jù)氣象GIS數(shù)據(jù)庫的內(nèi)容,對區(qū)域內(nèi)農(nóng)業(yè)氣象變化的特征進行推演,生成符合拓撲映射關系的語句。
(4)段落生成。農(nóng)業(yè)氣象情報文本內(nèi)容要求結(jié)構(gòu)嚴謹、邏輯清晰、內(nèi)容簡明。因此,在制訂段落生成模型時,要注意減少情報中重復詞匯及重復語句,并且段落生成時,要注意統(tǒng)一屬性、要素的描述歸為一段。例如,對氣溫的描述,將平均氣溫、極端氣溫、溫度距平聚合為一段。對不同農(nóng)作物在特定物候期的氣象條件影響下,應采取的措施進行分層檢索,拓撲關聯(lián)其生產(chǎn)建議記錄。
在人工進行農(nóng)業(yè)氣象情報文本編寫工作中,主要受工作人員的專業(yè)素質(zhì)水平所影響。而應用拓撲原理及氣象GIS的2種技術共同協(xié)作完成的文本自動生成技術,可在條件語句下,以科學數(shù)據(jù)作為基礎,對各類語句進行重組,構(gòu)建完整的段落,能夠提高氣象情報的工作效率。
[1] 李嘉潔,孫涵,華璀,等.基于氣象GIS的農(nóng)業(yè)氣象情報文本自動化生成技術研究.氣象與環(huán)境科學,2016,39(2):137~143