王 亮
(廣東省防汛保障與農(nóng)村水利中心,廣州 510000)
20世紀(jì)70年代至今,水利建設(shè)智能配置、水利信息資源整合一直是我國(guó)的重點(diǎn)工程任務(wù)。隨著社會(huì)經(jīng)濟(jì)、城鎮(zhèn)化建設(shè)的快速發(fā)展,水利行業(yè)受洪水災(zāi)害、水污染、水資源短缺、水利信息人工采集、加工、管理和使用等問(wèn)題的挑戰(zhàn)越來(lái)越大,不僅制約了水利行業(yè)的可持續(xù)發(fā)展,而且嚴(yán)重影響了社會(huì)經(jīng)濟(jì)發(fā)展和生態(tài)可持續(xù)保護(hù)[1]。
提高水利信息使用/管理價(jià)值,以高效、合理的實(shí)現(xiàn)水利工程調(diào)度決策工作。2012年初,Google提出了知識(shí)圖譜技術(shù),其核心是通過(guò)組建實(shí)體-關(guān)系-實(shí)體的數(shù)據(jù)關(guān)系組[2],構(gòu)建網(wǎng)絡(luò)狀的信息工程體系,對(duì)不同區(qū)域內(nèi)水利信息具有相似關(guān)系特征值進(jìn)行聯(lián)結(jié),以進(jìn)行水資源合理調(diào)度、水工程智能監(jiān)管[3]。
為破解北江流域水利改革發(fā)展的難題,實(shí)現(xiàn)智能、合理且準(zhǔn)確的調(diào)度北江流域水工程,文章基于江北流域水利基礎(chǔ)信息,構(gòu)建智能化知識(shí)圖譜,實(shí)現(xiàn)“四預(yù)”(預(yù)報(bào)、預(yù)警、預(yù)演、預(yù)案)功能,優(yōu)化北江流域水工程聯(lián)合調(diào)度系統(tǒng)。并在此基礎(chǔ)上進(jìn)一步挖掘知識(shí)圖譜中水利資源,以提高流域內(nèi)洪水、旱情、地下水沉降和水污染的監(jiān)測(cè)、預(yù)警、防護(hù)能力,達(dá)到區(qū)域水工程高質(zhì)量調(diào)度總目標(biāo),落實(shí)防災(zāi)減災(zāi)的重要指示。通過(guò)知識(shí)圖譜智慧化調(diào)度系統(tǒng),充分發(fā)揮北江流域水利工程防災(zāi)、供電、生態(tài)等綜合經(jīng)濟(jì)效益,實(shí)現(xiàn)水利智能化監(jiān)控調(diào)度、區(qū)域高質(zhì)量建設(shè)和環(huán)境可持續(xù)發(fā)展的任務(wù)。
研究區(qū)位于廣東省境內(nèi)的北江流域,地理位置為E111°52′-114°41′,N23°10′-25°25′,流域北接南嶺和長(zhǎng)江分界,南接分水嶺最高點(diǎn)畫眉山,平均海拔約1752m。北江流域地勢(shì)北高南低,上游陡,而中游順直,下游相連珠江三角洲地區(qū),流域支流眾多,其中,集雨面積超過(guò)1000km2的支流13條,且各條支流呈現(xiàn)葉脈狀排列,支流口接近,加之每年降雨量大,易造成洪水大面積集中爆發(fā)、山體滑坡等現(xiàn)象。在春夏之際,北江流域多暴雨,常引發(fā)洪水危機(jī),造成經(jīng)濟(jì)和生活損失。
流域性水利知識(shí)包括事實(shí)類知識(shí)和認(rèn)知類知識(shí),因此,詳細(xì)的掌握水利綜合知識(shí),對(duì)北江流域水工程知識(shí)圖譜構(gòu)建研究有極為關(guān)鍵的幫助。通過(guò)描述水利知識(shí)組成單元和概念[4],實(shí)現(xiàn)不同類型水利知識(shí)的關(guān)聯(lián)特征,以構(gòu)建完善的水利綜合知識(shí)圖譜,見(jiàn)表1。
表1 水利知識(shí)組成單元和基本概念
由表1可知,事實(shí)類水利知識(shí)一般分為自然、工程和社會(huì)對(duì)象,分別指在自然界天然存在的流域、湖泊等,人工修建的水庫(kù)、灌溉渠、水電站、泵房等人為安全措施和水利管理人員對(duì)水文、水域地理位置、職責(zé)等類的管理,其特點(diǎn)是具備抽象性、認(rèn)同性和普適性等,也是目前水利學(xué)科知識(shí)和預(yù)防措施的關(guān)鍵點(diǎn);認(rèn)知類知識(shí)主要是指在通過(guò)科學(xué)理論、原理、方法、數(shù)學(xué)模型、統(tǒng)計(jì)特征等對(duì)水利知識(shí)進(jìn)行相關(guān)研究。
表1為水利知識(shí)圖譜體系,其核心是水利知識(shí)表示、水利抽取、水利查詢存儲(chǔ)、水利推算和水利交融五部分。其中,水利知識(shí)圖譜體系主要通過(guò)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化方式抽取水利知識(shí);水利知識(shí)查詢和存儲(chǔ)主要以數(shù)據(jù)劃分、查詢優(yōu)化和分布式查詢?yōu)橹鳎凰R(shí)主要通過(guò)可視化和信息推薦進(jìn)行展示,而水利知識(shí)則通過(guò)實(shí)體對(duì)齊、屬性對(duì)齊等完成水利知識(shí)交融。最終,通過(guò)不同特征水利知識(shí)單元構(gòu)建智能化、可視化和調(diào)度信息精準(zhǔn)化的水利知識(shí)圖譜體系,實(shí)現(xiàn)高效、合理的江北流域水工程調(diào)度系統(tǒng)。
1.4.1 實(shí)體關(guān)系獲取
水利實(shí)體關(guān)系獲取是指在非結(jié)構(gòu)化水利數(shù)據(jù)中,構(gòu)建網(wǎng)絡(luò)矩陣確定水利實(shí)體間的關(guān)系特征。通過(guò)統(tǒng)計(jì)分析法獲取不同水利實(shí)體數(shù)據(jù)在文本中出現(xiàn)的次數(shù),隨后,尋找數(shù)據(jù)共性,以分析不同數(shù)據(jù)中水利實(shí)體所占的比例,當(dāng)共同出現(xiàn)的比例高于某一標(biāo)準(zhǔn)值時(shí),知識(shí)圖譜系統(tǒng)則認(rèn)定兩者間存在某種聯(lián)系,進(jìn)而對(duì)不同水利實(shí)體(流域、河流、湖泊、管理機(jī)構(gòu))類型關(guān)系定義,以抽取實(shí)體關(guān)系、實(shí)體和屬性指標(biāo),通過(guò)相似算法將這些抽取數(shù)據(jù)連接至知識(shí)圖譜概念模型中,實(shí)現(xiàn)水利實(shí)體推薦和共享,以大量水利數(shù)據(jù)幫助水利工程領(lǐng)域進(jìn)行聯(lián)合調(diào)度工作。
圖1 水利領(lǐng)域知識(shí)圖譜體系框架
1.4.2 多類型水利知識(shí)融合
融合是指將不同的數(shù)據(jù)源、概念、特征和事物基本點(diǎn)有機(jī)的統(tǒng)一起來(lái),進(jìn)而實(shí)現(xiàn)知識(shí)圖譜信息相互溝通的目的。文章水利知識(shí)融合分為實(shí)體、數(shù)據(jù)屬性等層面進(jìn)行。實(shí)體融合是以此通過(guò)不同流域內(nèi)水利數(shù)據(jù)源的語(yǔ)意關(guān)聯(lián),將不同外界環(huán)境、影響因素等關(guān)聯(lián)后,便捷獲悉各領(lǐng)域內(nèi)的水利知識(shí)信息,經(jīng)進(jìn)一步確定相互水利關(guān)系,進(jìn)而有效的避免水利工程出現(xiàn)的危害。水利知識(shí)屬性融合是不同源數(shù)據(jù)中屬性一致的問(wèn)題,以實(shí)現(xiàn)同一屬性水利信息的相互聯(lián)系,形成多層次、全方位的知識(shí)圖譜系統(tǒng)。
水利知識(shí)圖譜的構(gòu)建不僅有利于北江流域水利信息的便捷采集、查詢和分析,而且能夠有機(jī)的實(shí)現(xiàn)不同轄區(qū)水利信息資源共享,實(shí)現(xiàn)區(qū)域內(nèi)水工程聯(lián)合調(diào)度的基本職能。文章通過(guò)設(shè)計(jì)一種高可靠性和低耦合性的多層次、多功能的水務(wù)知識(shí)圖譜模塊:
1)水利信息資源模塊:
該模塊主要功能是采集水利信息數(shù)據(jù)源,按照結(jié)構(gòu)化體系抽取水利原始文本數(shù)據(jù)、地理數(shù)據(jù)、水利基礎(chǔ)數(shù)據(jù)和用戶數(shù)據(jù)等,半結(jié)構(gòu)化中抽取IE和維基百度中水情況、旱情和氣象等的水利知識(shí)和信息數(shù)據(jù),最后在抽取水利業(yè)務(wù)專題數(shù)據(jù)。
2)水工程聯(lián)合調(diào)度數(shù)據(jù)模塊:
知識(shí)圖譜是集成各類有效性數(shù)據(jù)的中心,為此,將知識(shí)圖譜技術(shù)應(yīng)用與北江流域水工程聯(lián)合調(diào)度中,通過(guò)預(yù)報(bào)和調(diào)度專業(yè)計(jì)算模型庫(kù)、水工程聯(lián)合優(yōu)化調(diào)控業(yè)務(wù)庫(kù)構(gòu)建專題數(shù)據(jù)庫(kù),形成一套集數(shù)據(jù)采集、分析、計(jì)算、預(yù)報(bào)和聯(lián)合調(diào)度應(yīng)用的流程,如圖2所示。
圖2 北江流域水工程聯(lián)合優(yōu)化調(diào)度系統(tǒng)數(shù)據(jù)架構(gòu)圖
對(duì)文章構(gòu)建的知識(shí)圖譜在水利聯(lián)合調(diào)度應(yīng)用系統(tǒng)性能進(jìn)行分析,首先系統(tǒng)平臺(tái)滿足可擴(kuò)展性,通過(guò)修改系統(tǒng)各模塊與組件間的關(guān)系,增加數(shù)據(jù)存儲(chǔ)量和構(gòu)建更為完善知識(shí)圖譜,其次平臺(tái)穩(wěn)定性和簡(jiǎn)單操作性,保證數(shù)據(jù)檢索、分析和變更影響較小,在保證操作穩(wěn)定的同時(shí)滿足高功能性和易操作性。最后,保證平臺(tái)兼容性,一方面解決水利基礎(chǔ)數(shù)據(jù)、地理位置和社會(huì)經(jīng)濟(jì)等數(shù)據(jù)間關(guān)聯(lián)性較低,無(wú)共享的問(wèn)題,另一方面提高流域水利工程檢索效率,將知識(shí)圖譜采集、模擬的數(shù)據(jù)應(yīng)用在水利管理信息中。
2.3.1 水利數(shù)據(jù)抽取
水利數(shù)據(jù)抽取是指在類別中采集、篩選、分析后并存儲(chǔ)有關(guān)水利知識(shí)數(shù)據(jù)。目前,知識(shí)圖譜技術(shù)中的核心模塊則是對(duì)水利數(shù)據(jù)抽取的設(shè)計(jì),面對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)類別進(jìn)行。如百度數(shù)據(jù)則通過(guò)Xpath語(yǔ)句進(jìn)行抽取,文本數(shù)據(jù)聽(tīng)過(guò)語(yǔ)句抽取法進(jìn)行,而對(duì)于水利內(nèi)部信息數(shù)據(jù),則抽取為RDF格式文件,對(duì)不同抽取數(shù)據(jù)匯總,以構(gòu)建足量、多方面、多層次和多理論性的水利知識(shí)圖譜。
2.3.2 可視化數(shù)據(jù)模塊
數(shù)據(jù)可視化是以簡(jiǎn)單、直觀且明了的形式將水利信息數(shù)據(jù)呈列形式和表現(xiàn)形式的科學(xué)研究,通過(guò)可視化技術(shù)實(shí)現(xiàn)圖像、計(jì)算機(jī)視覺(jué)和用戶視角界面的有機(jī)溝通。文章大量水利數(shù)據(jù)儲(chǔ)存于知識(shí)圖譜,以此提取不同區(qū)域內(nèi)數(shù)據(jù)以立體、動(dòng)畫的形式呈現(xiàn),對(duì)北江流域水工程聯(lián)合調(diào)度工作的及時(shí)性、高效性和準(zhǔn)確性有重要意義。
知識(shí)圖譜是水利領(lǐng)域的技術(shù)手段,同時(shí)也是水利領(lǐng)域的大數(shù)據(jù)庫(kù),目前知識(shí)圖譜技術(shù)的日常應(yīng)用主要包括以下3個(gè)方面:①數(shù)據(jù)運(yùn)營(yíng)服務(wù),對(duì)北江流域一張圖所提供的各項(xiàng)基礎(chǔ)資料數(shù)據(jù)、展示影像數(shù)據(jù)等進(jìn)行更新維護(hù);對(duì)防洪、水資源、水工程安全等各項(xiàng)監(jiān)測(cè)信息的接入服務(wù)情況進(jìn)行監(jiān)視,及時(shí)記錄及反饋數(shù)據(jù)接入異常情況;②預(yù)警體系維護(hù),對(duì)北江流域防洪、水資源、水工程安全等預(yù)警指標(biāo)體系在系統(tǒng)中的各種閾值進(jìn)行更新和維護(hù);③功能設(shè)置與調(diào)整,針對(duì)系統(tǒng)中涉及深度專業(yè)交互計(jì)算分析、業(yè)務(wù)流等變化的應(yīng)用需求,及時(shí)進(jìn)行了解和記錄,與水利業(yè)務(wù)數(shù)字孿生支撐服務(wù)運(yùn)營(yíng)共同進(jìn)行適當(dāng)?shù)男薷恼{(diào)整。
數(shù)據(jù)庫(kù)管理系統(tǒng)主要用于對(duì)本項(xiàng)目從外部匯聚和系統(tǒng)自身產(chǎn)生的數(shù)據(jù)進(jìn)行存儲(chǔ)和管理,表2為知識(shí)圖譜技術(shù)水利中心數(shù)據(jù)管理結(jié)果,按照數(shù)據(jù)庫(kù)管理系統(tǒng)標(biāo)準(zhǔn),將水利基礎(chǔ)數(shù)據(jù)分為關(guān)系型數(shù)據(jù)庫(kù)(社會(huì)經(jīng)濟(jì)數(shù)據(jù)、水利基礎(chǔ)數(shù)據(jù)、水利行業(yè)單位)、空間型數(shù)據(jù)庫(kù)(地理信息數(shù)據(jù))兩部分。其中關(guān)系型數(shù)據(jù)庫(kù)是穩(wěn)定水工程聯(lián)合調(diào)度運(yùn)行的基礎(chǔ),在數(shù)據(jù)系統(tǒng)上線后,數(shù)據(jù)存儲(chǔ)和處理容量不斷上升,因而數(shù)據(jù)庫(kù)系統(tǒng)需要具備擴(kuò)容能力,使關(guān)系型數(shù)據(jù)庫(kù)儲(chǔ)存系統(tǒng)隨著水利信息量的增加而增加,同時(shí)關(guān)系型數(shù)據(jù)庫(kù)服務(wù)器系統(tǒng)還應(yīng)具備維護(hù)成本低、可靠、易使用和技術(shù)開放的特點(diǎn)。
由于水利工程調(diào)度中涉及到大量的地理信息數(shù)據(jù),而傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)針對(duì)基礎(chǔ)水利數(shù)據(jù),無(wú)法對(duì)空間信息數(shù)據(jù)進(jìn)行存儲(chǔ),為此,在數(shù)據(jù)庫(kù)類型中增加空間型數(shù)據(jù)庫(kù),將知識(shí)圖譜采集轉(zhuǎn)化的屬性和空間數(shù)據(jù)聯(lián)合管理,其特點(diǎn)是不僅能存儲(chǔ)空間矢量數(shù)據(jù),而且提高了相關(guān)水利數(shù)據(jù)的處理能力,強(qiáng)化了北江流域水工程調(diào)度速度和信息獲取能力。
表2 基于知識(shí)圖譜水利數(shù)據(jù)中心數(shù)據(jù)運(yùn)營(yíng)
隨著智能化的知識(shí)圖譜技術(shù)發(fā)展革新,水利工程高效、智能化調(diào)度越發(fā)深入,基于知識(shí)圖譜的水利工程項(xiàng)目社會(huì)經(jīng)濟(jì)性和安全性隨著智慧化措施也形成了一定改變,如防洪經(jīng)濟(jì)安全措施日常運(yùn)營(yíng):①知識(shí)圖譜根據(jù)江北流域運(yùn)行現(xiàn)狀,收集更新江北流域各水庫(kù)、防洪區(qū)、堤壩、河段等控制目標(biāo)對(duì)象資料,對(duì)超出閾值的數(shù)據(jù)報(bào)警,以保證防洪安全;②聯(lián)合調(diào)度方案維護(hù)過(guò)程,針對(duì)水工程、控制目標(biāo)等情況變化,及時(shí)更新江北流域調(diào)度資料信息,協(xié)同水利業(yè)務(wù)數(shù)字孿生支撐服務(wù)運(yùn)營(yíng)進(jìn)行實(shí)例調(diào)整;同時(shí)以知識(shí)圖譜智慧技術(shù)提前預(yù)防洪水災(zāi)害,確保社會(huì)經(jīng)濟(jì)和安全。文章通過(guò)Copula函數(shù)理論的貝葉斯預(yù)報(bào)處理器對(duì)水利信息進(jìn)行監(jiān)測(cè),其公式如下:
貝葉斯概率水文預(yù)報(bào)方法理論基礎(chǔ)明確,在實(shí)際中應(yīng)用廣泛,是目前概率水利超標(biāo)預(yù)報(bào)方法。
令Hk、Sk(k=1,2,…,K)分別表示待預(yù)報(bào)的實(shí)測(cè)流量和確定性預(yù)報(bào)流量,K為預(yù)見(jiàn)期長(zhǎng)度;hk、sk分別為Hk、Sk的實(shí)現(xiàn)值。根據(jù)貝葉斯公式,預(yù)見(jiàn)期k的實(shí)測(cè)流量Hk的后驗(yàn)密度函數(shù)為:
(1)
式中:φk(hk|Sk)的后驗(yàn)密度函數(shù);gk(hk)為流量先驗(yàn)概率密度,代表了實(shí)測(cè)流量過(guò)程的先驗(yàn)不確定性;對(duì)于確定的Sk=sk,函數(shù)fk(Sk|hk)為Hk的似然函數(shù),反映了確定性預(yù)報(bào)模型的預(yù)報(bào)能力。1)Copula函數(shù)可以將多個(gè)隨機(jī)變量的邊緣分布連接起來(lái)構(gòu)造聯(lián)合分布。令Q(x1,x2,…,xn)為一個(gè)n-維分布函數(shù),其邊緣分布分別為F1(x),F2(x2),…,Fn(xn)。由Sklar定理可知,存在一個(gè)n-Copula函數(shù)C,使得:
Q(x1,x2,…,xn)=C(F(x1),F(xiàn)2(x2),…,F(xiàn)n(xn))
(2)
借助Copula函數(shù),Hk、Sk的聯(lián)合分布函數(shù)可以表示為:
Fk(hk,sk)=Cθ(Gk(hk),F(xiàn)k(Sk))
(3)
式中:u=Ck(hk),v=Fk(sk)分別為邊緣分布函數(shù);θ為Copula函數(shù)的參數(shù),采用Kendall秩相關(guān)系數(shù)τ求解。
通過(guò)合理的知識(shí)圖譜信息技術(shù),保障了北江流域內(nèi)因水利問(wèn)題產(chǎn)生的社會(huì)經(jīng)濟(jì)和安全的問(wèn)題。
文章通過(guò)對(duì)水利知識(shí)和知識(shí)圖譜技術(shù)特征進(jìn)行梳理分析,以結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)為水利數(shù)據(jù)源,提出對(duì)不同類別數(shù)據(jù)的實(shí)體識(shí)別和關(guān)系抽取,設(shè)計(jì)集采集、分析、計(jì)算、預(yù)報(bào)和調(diào)度為一體的知識(shí)圖譜架構(gòu)體系。在水利知識(shí)圖譜基礎(chǔ)上,通過(guò)多源異構(gòu)水利數(shù)據(jù)融合技術(shù),以對(duì)不同類型水利數(shù)據(jù)挖掘和分析的能力,進(jìn)而通過(guò)知識(shí)圖譜實(shí)現(xiàn)水利工程智能化服務(wù)調(diào)度體系的目標(biāo)遵旨。