季彤天 陳樹藩 唐易民 黃敏洧
摘要:電力建設(shè)的過程中包含大量的實(shí)時(shí)和歷史數(shù)據(jù),采集、融合大量異構(gòu)數(shù)據(jù),基于地圖進(jìn)行可視化,構(gòu)建電力建設(shè)項(xiàng)目相關(guān)的可視化地理大數(shù)據(jù)系統(tǒng),實(shí)現(xiàn)對(duì)海量的電力建設(shè)大數(shù)據(jù)甄別、提取、分析,完成決策。同時(shí),利用歷史項(xiàng)目數(shù)據(jù),完成在建項(xiàng)目分析與預(yù)測(cè),幫助管理人員及時(shí)發(fā)現(xiàn)問題做出預(yù)判。在電力建設(shè)工程中使用大數(shù)據(jù)順應(yīng)時(shí)代發(fā)展潮流,進(jìn)行可視化符合人們習(xí)慣,有效解決電力建設(shè)中存在的各類問題。
關(guān)鍵詞:電力建設(shè);數(shù)據(jù)融合;可視化;地圖
中圖分類號(hào):TP311.1? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)36-0014-06
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
當(dāng)前,城市高速發(fā)展的經(jīng)濟(jì)建設(shè),民生的感受日趨受到重視,對(duì)電力建設(shè)工程項(xiàng)目開展的時(shí)間、空間上提出了嚴(yán)格的要求,建設(shè)投資的管理部門的管理方式逐步從粗放向精細(xì)轉(zhuǎn)變,對(duì)建設(shè)項(xiàng)目從精準(zhǔn)投資、項(xiàng)目推進(jìn)、施工窗口、風(fēng)險(xiǎn)把控等方面都提出了更高的要求。
在目前的實(shí)際電力建設(shè)工作中,伴隨著管理工作的進(jìn)一步細(xì)化,隨之而來的是大量信息數(shù)據(jù)的產(chǎn)生,管理人員每天面對(duì)海量的信息要從中做出甄別、提取、分析、決策,其工作強(qiáng)度極高并承擔(dān)著遺漏缺失的決策風(fēng)險(xiǎn)。構(gòu)建電力建設(shè)時(shí)空大數(shù)據(jù)智能地圖,對(duì)電力建設(shè)過程中產(chǎn)生的大數(shù)據(jù)進(jìn)行提煉,建立信息彼此間關(guān)聯(lián)進(jìn)而獲得知識(shí)庫,并對(duì)其高度概括的數(shù)據(jù)進(jìn)行存儲(chǔ)及可視化,既能在宏觀上縱覽全局,又能追蹤某個(gè)電力建設(shè)項(xiàng)目的具體情況,幫助項(xiàng)目管理者選擇正確的策略并做出決策,促進(jìn)建設(shè)項(xiàng)目管理水平的提高。
1 系統(tǒng)簡(jiǎn)述
電力工程建設(shè)是個(gè)復(fù)雜的過程,從前期到施工再到最后竣工規(guī)劃驗(yàn)收存在多個(gè)環(huán)節(jié),需要遵守多個(gè)規(guī)范。從前期路線規(guī)劃、拆遷賠償、建設(shè)對(duì)周邊影響評(píng)估;建設(shè)過程工期安排、監(jiān)督評(píng)價(jià);再到竣工期資料收集、規(guī)劃驗(yàn)收。電力工程建設(shè)中無時(shí)無刻不在產(chǎn)生大量的數(shù)據(jù),利用這些數(shù)據(jù)。因此電力建設(shè)時(shí)空大數(shù)據(jù)地圖將多源多結(jié)構(gòu)的數(shù)據(jù)更多地與地理信息一起融入地圖,以研究電力建設(shè)中的數(shù)據(jù)應(yīng)用。
電力建設(shè)大數(shù)據(jù)智能地圖是一種全新的數(shù)據(jù)承載和表達(dá)形式,通過對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行收集整理,將電力規(guī)劃、業(yè)務(wù)、建設(shè)、政策以及社會(huì)影響等數(shù)據(jù)與地理信息數(shù)據(jù)融合,為多源數(shù)據(jù)增加地理屬性,以表達(dá)數(shù)據(jù)信息的物理分布、聯(lián)系以及時(shí)間上的發(fā)展變化特征,提供面向不同電力建設(shè)需求的數(shù)據(jù)研究與應(yīng)用。
通過對(duì)最為先進(jìn)的地圖應(yīng)用的研究,可以發(fā)現(xiàn)智能地圖的技術(shù)發(fā)展趨勢(shì)主要表現(xiàn)為:
1)地理數(shù)據(jù)多維化,通過多個(gè)維度(空間三維化、室內(nèi)細(xì)節(jié)化、時(shí)間序列化)的空間數(shù)據(jù)的支撐,讓地理信息的表達(dá)更多樣、更翔實(shí);
2)用戶對(duì)象個(gè)性化,智能地圖通過對(duì)數(shù)據(jù)的篩選過濾,貼合用戶使用習(xí)慣及需求,推送個(gè)性化的應(yīng)用信息,提升用戶體驗(yàn),讓決策變得更高效;
3)用戶專業(yè)數(shù)據(jù)與地理數(shù)據(jù)的關(guān)聯(lián):利用數(shù)據(jù)挖掘的知識(shí)提取技術(shù),找到內(nèi)在的關(guān)聯(lián),幫助用戶找到最佳策略;
4)利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能的方法處理海量的多源數(shù)據(jù),并在智能地圖中圖形化地表達(dá)出來。
綜合電力工程建設(shè)特點(diǎn)和智能地圖技術(shù)的發(fā)展趨勢(shì),設(shè)計(jì)大數(shù)據(jù)智能化地圖的明確需求,以長(zhǎng)三角地區(qū)為例:
1)輔助長(zhǎng)三角地區(qū)整體的電力建設(shè)統(tǒng)籌規(guī)劃,融合記錄全區(qū)域包括已建成的、設(shè)計(jì)階段的以及在建階段的電力工程情況,展示電力建設(shè)布局及發(fā)展情況,信息共享,為長(zhǎng)三角地區(qū)電網(wǎng)發(fā)展設(shè)計(jì)提供全局參照;
2)保留歷史數(shù)據(jù),建立歷史案例數(shù)據(jù)庫,通過機(jī)器學(xué)習(xí)的方式優(yōu)化決策者可獲得的推薦信息;
3)針對(duì)在設(shè)計(jì)階段以及在建階段的電力工程,智能化地圖承載的數(shù)據(jù)應(yīng)覆蓋工程建設(shè)全程,在各階段提供相應(yīng)的數(shù)據(jù)服務(wù),以下逐階段進(jìn)行闡述;
4)在電力工程的前期設(shè)計(jì)階段,大數(shù)據(jù)智能化地圖通過地理信息檢索工程相關(guān)地區(qū)政策法規(guī)數(shù)據(jù)、根據(jù)工程基礎(chǔ)數(shù)據(jù)匹配相似歷史工程案例、收集近期相關(guān)社會(huì)新聞,以提供數(shù)據(jù)保證工程設(shè)計(jì)的合規(guī)性與可行性,預(yù)測(cè)工程涉及拆遷賠償費(fèi)用,從而優(yōu)化設(shè)計(jì)決策;
5)在電力工程的施工前期,大數(shù)據(jù)智能化地圖通過與工程屬性與歷史案例學(xué)習(xí)、周邊工程的聯(lián)系、氣候數(shù)據(jù)、社會(huì)性事件的收集等要素,為施工工期預(yù)估與安排提供參考數(shù)據(jù),將規(guī)避雨期、既定社會(huì)事件或周邊工程影響可能會(huì)造成的停工等要素展現(xiàn)出來,為施工做好準(zhǔn)備;
6)在電力工程的施工過程中,大數(shù)據(jù)智能化地圖收集相似歷史案例、實(shí)時(shí)天氣、社會(huì)性新聞、施工人員上傳信息等提供施工記錄與提醒,如施工日志的記錄與極端天氣、突發(fā)事件等的預(yù)警。另一方面支持使用者利用地圖分享建設(shè)信息,展示輸入信息,形成電子白板;
7)在電力工程的竣工規(guī)劃驗(yàn)收階段,大數(shù)據(jù)智能化地圖通過對(duì)歷史案例、當(dāng)前工程特性、竣工驗(yàn)收條例等信息的綜合分析,提供針對(duì)工程的竣工驗(yàn)收辦理步驟參考,提高竣工規(guī)劃驗(yàn)收申請(qǐng)效率。
以上即為電力建設(shè)時(shí)空大數(shù)據(jù)地圖在應(yīng)用中的明確需求,除了以明確功能輔助電力建設(shè)生產(chǎn)外,智能化地圖在實(shí)際應(yīng)用中不斷研究數(shù)據(jù)與建設(shè)之間的關(guān)系,以拓展更多的數(shù)據(jù)標(biāo)簽,進(jìn)一步探索電力建設(shè)中大數(shù)據(jù)的融合和應(yīng)用方法。
2 數(shù)據(jù)融合框架
2.1 電力建設(shè)大數(shù)據(jù)來源
我國國土面積大,同時(shí)人口密度也很大,因此在電力運(yùn)輸線路與相關(guān)的電力設(shè)備建設(shè)情況相對(duì)復(fù)雜。整理電力建設(shè)需求,對(duì)電力建設(shè)要素信息進(jìn)行如下列舉:
以上數(shù)據(jù)可以分為三類:
1)勘測(cè)數(shù)據(jù),此類數(shù)據(jù)是通過實(shí)地勘測(cè)、無人機(jī)航拍、遙感圖像、前期設(shè)計(jì)等手段獲得的帶有明顯地理特征的工程基礎(chǔ)地理信息數(shù)據(jù)。獲得的數(shù)據(jù)格式有:dwg(CAD文件)、tiff(影像數(shù)據(jù))、xlsx(坐標(biāo)點(diǎn)位)、docx(說明文檔)等。
2)專業(yè)數(shù)據(jù),此類數(shù)據(jù)是帶有電力領(lǐng)域?qū)I(yè)性質(zhì),如管線、變電站、架空線路等電力建設(shè)專業(yè)要素的屬性和標(biāo)準(zhǔn),可從電力專業(yè)部門處獲得結(jié)構(gòu)標(biāo)準(zhǔn)、分類明確的電力工程專業(yè)數(shù)據(jù)。專業(yè)數(shù)據(jù)提供了電力工程建設(shè)最基本的專業(yè)要素和規(guī)則參考。而專業(yè)實(shí)體則常與勘測(cè)數(shù)據(jù)綁定,形成完整的電力建設(shè)工程設(shè)計(jì)圖紙,提高地圖主體功能的檢索效率。借助SuperMap提供的SDK來為地理信息添加檢索頻率較高的專業(yè)屬性,構(gòu)建數(shù)據(jù)集,完成工程建設(shè)數(shù)據(jù)的基礎(chǔ)融合。以圖2的點(diǎn)數(shù)據(jù)集為例,每一條記錄中以Sm開頭的七個(gè)字段記錄了工程中某一點(diǎn)的地理信息,其余字段則為與該點(diǎn)相關(guān)的工程專業(yè)數(shù)據(jù),如該點(diǎn)塔基編號(hào)、屬性等。
3)建設(shè)數(shù)據(jù),這類包括法律法規(guī)、社會(huì)熱點(diǎn)信息、氣溫天氣、工程BIM數(shù)據(jù)、工程簽章、周邊類似歷史工程數(shù)據(jù)等多種多樣,沒有統(tǒng)一的結(jié)構(gòu)和獲取途徑,且具有一定時(shí)效性的工程決策分析支撐數(shù)據(jù)。與勘測(cè)數(shù)據(jù)和專業(yè)數(shù)據(jù)擁有一套完整成熟的獲取和錄入方法不同,建設(shè)數(shù)據(jù)涉及面廣,輸入方式多,應(yīng)利用數(shù)據(jù)挖掘和語義識(shí)別技術(shù),從繁雜的數(shù)據(jù)和接口中抽取有效信息,成為數(shù)據(jù)獲取的一種手段。
由于建設(shè)工程的不斷積累與建設(shè)數(shù)據(jù)的實(shí)時(shí)性要求,這三類數(shù)據(jù)形成了一系列連續(xù)、具有時(shí)空屬性的電力建設(shè)大數(shù)據(jù)。最終需要將各渠道獲取的數(shù)據(jù)進(jìn)行有效融合,針對(duì)電力工程建設(shè)構(gòu)造決策分析模型,將所有影響規(guī)劃的因素集中體現(xiàn)在電力建設(shè)智能地圖中。
2.2 多模態(tài)大數(shù)據(jù)抽取
大數(shù)據(jù)的重要技術(shù)優(yōu)勢(shì)之一就是多樣性,這就意味著數(shù)據(jù)來源極其廣泛,數(shù)據(jù)類型極為繁雜。這種復(fù)雜的數(shù)據(jù)環(huán)境給大數(shù)據(jù)的處理帶來很大的挑戰(zhàn)。由上一節(jié)可知,對(duì)電力建設(shè)數(shù)據(jù)需要進(jìn)行抽取與集成。在本節(jié)闡述針對(duì)建設(shè)類數(shù)據(jù)所采取的多模態(tài)大數(shù)據(jù)要素抽取方法。
由于建設(shè)類數(shù)據(jù)來源眾多,將數(shù)據(jù)進(jìn)行分類,對(duì)數(shù)據(jù)進(jìn)行逐類分析,建立各自專屬關(guān)鍵字、處理方式、目標(biāo)網(wǎng)站等對(duì)數(shù)據(jù)進(jìn)行爬取。
想要采集數(shù)據(jù),首先需要明確采集目標(biāo)。以電力建設(shè)法律法規(guī)數(shù)據(jù)為例,該類需求需要采集與電力建設(shè)有關(guān)的法律法規(guī)。那么哪些法律法規(guī)會(huì)涉及這方面?該怎么獲取要采集的關(guān)鍵字?是切入的要點(diǎn)。
首先通過電力建設(shè)法規(guī)指南人工錄入一個(gè)數(shù)據(jù)庫,將獲取的法規(guī)數(shù)據(jù)放入list做詞頻統(tǒng)計(jì),其統(tǒng)計(jì)原理是將獲取的數(shù)據(jù)轉(zhuǎn)化為字符串,再對(duì)其做拆分處理,拆分之后做詞頻的統(tǒng)計(jì),存入字典當(dāng)中,分別是拆分后的詞和其出現(xiàn)的頻率,再對(duì)其按照頻率從大到小排序,篩選出需要的采集關(guān)鍵詞。
選定合適的目標(biāo)網(wǎng)站后對(duì)頁面進(jìn)行分析,優(yōu)化爬取頁面機(jī)制,對(duì)數(shù)據(jù)進(jìn)行采集,基本的采集原理流程圖如圖4。
在進(jìn)行完數(shù)據(jù)清洗后,為數(shù)據(jù)處理與入庫做好準(zhǔn)備。
2.3 關(guān)系型與非關(guān)系型耦合數(shù)據(jù)庫
關(guān)系型數(shù)據(jù)庫與非關(guān)系型數(shù)據(jù)庫是目前應(yīng)用最為廣泛的數(shù)據(jù)庫。關(guān)系型數(shù)據(jù)庫是指采用了關(guān)系模型來組織數(shù)據(jù)的數(shù)據(jù)庫,其優(yōu)點(diǎn)在于容易理解、易于維護(hù)、通用的SQL語言使得操作關(guān)系型數(shù)據(jù)庫非常方便,適用于規(guī)格統(tǒng)一的數(shù)據(jù)。但關(guān)系型數(shù)據(jù)庫強(qiáng)調(diào)對(duì)磁盤上數(shù)據(jù)的查詢和檢索,在網(wǎng)站使用中,讀寫請(qǐng)求的高并發(fā)性和海量數(shù)據(jù)的查詢?cè)L問導(dǎo)致關(guān)系型數(shù)據(jù)庫效率出現(xiàn)瓶頸。非關(guān)系型數(shù)據(jù)庫則可應(yīng)對(duì)海量的結(jié)構(gòu)不確定的數(shù)據(jù),如雜志論文、法律法規(guī)、社會(huì)新聞、多媒體信息等非規(guī)范性的互聯(lián)網(wǎng)信息。但非關(guān)系型數(shù)據(jù)庫數(shù)據(jù)結(jié)構(gòu)相對(duì)復(fù)雜,對(duì)于數(shù)據(jù)的查詢和計(jì)算支持不夠。
總結(jié)以上兩種數(shù)據(jù)庫的特點(diǎn)可知,勘測(cè)數(shù)據(jù)、專業(yè)數(shù)據(jù)以及一部分較為規(guī)范的建設(shè)數(shù)據(jù)由于其統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)與復(fù)雜的計(jì)算需求,適合用關(guān)系型數(shù)據(jù)庫進(jìn)行管理。而建設(shè)類數(shù)據(jù)來源眾多,分類復(fù)雜,長(zhǎng)度不一的文字信息、多媒體信息都包括在內(nèi),在需求方面有著頻繁的讀寫需求但無與地理信息相同的計(jì)算要求,因此適合用無須經(jīng)過SQL層解析,讀寫性能高的非關(guān)系型數(shù)據(jù)庫進(jìn)行管理。
電力建設(shè)時(shí)空大數(shù)據(jù)地圖設(shè)計(jì)了一種關(guān)系型與非關(guān)系型耦合的數(shù)據(jù)庫。由于大數(shù)據(jù)地圖帶有強(qiáng)烈的地理信息屬性,需要一款GIS數(shù)據(jù)庫作為大數(shù)據(jù)智能化地圖的數(shù)據(jù)基礎(chǔ),PostgreSQL是開源空間數(shù)據(jù)庫,構(gòu)建在其上的空間對(duì)象擴(kuò)展模塊PostGIS使其成為一個(gè)真正的大型空間數(shù)據(jù)庫[1]。SuperMap 中的SDX+ for PostGIS 引擎,可以直接訪問 PostgreSQL 空間數(shù)據(jù)庫,充分利用空間信息服務(wù)數(shù)據(jù)庫的能力,如空間對(duì)象、空間索引、空間操作函數(shù)和空間操作符等[2],實(shí)現(xiàn)高效的管理和訪問空間數(shù)據(jù),因此選擇被SuperMap支持的PostgreSQL關(guān)系型數(shù)據(jù)為系統(tǒng)基礎(chǔ)。同時(shí)整合主流的MongoDB和Redis非關(guān)系型數(shù)據(jù)庫,利用MongoDB和Redis對(duì)半結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)的表示和檢索能力,組成電力建設(shè)時(shí)空大數(shù)據(jù)地圖的數(shù)據(jù)庫支撐結(jié)構(gòu)。速度上與傳統(tǒng)數(shù)據(jù)庫相比有大幅提升,更能適應(yīng)大地圖讀寫訪問與計(jì)算要求,同時(shí)又保證了數(shù)據(jù)的一致性,供使用者做決策參考的信息量也得以增加。
在電力建設(shè)時(shí)空大數(shù)據(jù)地圖中,通過上述數(shù)據(jù)庫結(jié)構(gòu),為各類數(shù)據(jù)增加地理屬性,當(dāng)應(yīng)用于某項(xiàng)工程中時(shí),以地理信息為線索檢索特定區(qū)域范圍內(nèi)的數(shù)據(jù)信息,通過對(duì)檢索信息的挖掘分析得到目標(biāo)效果。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫系統(tǒng),當(dāng)遭遇大量的查詢操作時(shí),會(huì)因繁復(fù)的IO操作而花費(fèi)大量時(shí)間,本系統(tǒng)中將最常訪問,且無復(fù)雜計(jì)算需求的建設(shè)數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)(熱數(shù)據(jù)),如氣候、安全熱點(diǎn)、城市事件、辦事流程等,通過非關(guān)系型數(shù)據(jù)庫存放,在后臺(tái)查詢時(shí)便可有效避免直接從關(guān)系型數(shù)據(jù)庫進(jìn)行查詢,當(dāng)熱數(shù)據(jù)發(fā)生改變時(shí),則進(jìn)行重新加載。另一方面利用MongoDB的文檔處理優(yōu)勢(shì),保證法律法規(guī)、VR圖像、實(shí)地視頻等文檔類數(shù)據(jù)的存儲(chǔ)和查看??睖y(cè)數(shù)據(jù)和建設(shè)數(shù)據(jù)的讀寫則通過直接操作關(guān)系型數(shù)據(jù)庫進(jìn)行,由于其IO頻率不高,在首次加載工程時(shí)將該類數(shù)據(jù)讀出存放在緩存中,以供基礎(chǔ)信息標(biāo)定。
3 可視化框架
3.1 時(shí)空大數(shù)據(jù)地圖
可視化地圖是一種圖形化的數(shù)據(jù)資產(chǎn)管理工具,匯聚多種來源的有關(guān)電力建設(shè)的數(shù)據(jù)信息,通過深度認(rèn)知、元數(shù)據(jù)管理、數(shù)據(jù)語義關(guān)聯(lián)、數(shù)據(jù)集成等手段[3],動(dòng)態(tài)緊密地融合各類型數(shù)據(jù),建立數(shù)據(jù)之間的關(guān)聯(lián),實(shí)現(xiàn)在語義一致、時(shí)空一致環(huán)境下的電力建設(shè)業(yè)務(wù)對(duì)象信息的一體化和表達(dá),提供語義網(wǎng)絡(luò)內(nèi)的業(yè)務(wù)數(shù)據(jù)信息組織、查詢、瀏覽服務(wù),提供關(guān)于電力建設(shè)對(duì)象的全方位、多角度的智能信息傳遞服務(wù),并根據(jù)電力建設(shè)業(yè)務(wù)相關(guān)信息的特征立體化、智能化地表達(dá)以及數(shù)據(jù)信息的物理分布與相互聯(lián)系,動(dòng)態(tài)表達(dá)該電力對(duì)象過去、現(xiàn)在的總結(jié)以及將來發(fā)展的可能方向。
地圖即將獲得的各類數(shù)據(jù)以電力建筑或建設(shè)項(xiàng)目為中心表現(xiàn)在電子地圖上,展現(xiàn)數(shù)據(jù)的空間位置關(guān)系和時(shí)空變遷的規(guī)律和趨勢(shì)。通過圖形、圖像、多元素關(guān)聯(lián)圖表等可視化方法來展示數(shù)據(jù)的分析結(jié)果,既能夠一目了然地展示結(jié)果,又能展示數(shù)據(jù)中間復(fù)雜的信息[4],是一種有效簡(jiǎn)潔的大數(shù)據(jù)展示方式。這種可視化的展示方法不僅僅是能夠利用圖樣簡(jiǎn)單易懂地顯示復(fù)雜的關(guān)系,還能夠?qū)?shù)據(jù)做出詳細(xì)的細(xì)節(jié)展示。通過交互的方式,直觀地揭示出各類型數(shù)據(jù)之間的關(guān)聯(lián)和特點(diǎn),充分挖掘數(shù)據(jù)的價(jià)值。
地圖作為一種最直觀的數(shù)據(jù)關(guān)系可視化方案,可以展示從宏觀到微觀的視圖效果,多維度的方式來展示工程數(shù)據(jù)及其所包含的信息,實(shí)現(xiàn)不同尺度間的自由切換。通過將數(shù)據(jù)與不同的尺度進(jìn)行關(guān)聯(lián),可以實(shí)現(xiàn)對(duì)紛繁復(fù)雜的數(shù)據(jù)進(jìn)行過濾展示,同一級(jí)別的數(shù)據(jù)與信息在同一尺度上可視,避免數(shù)據(jù)的堆積而造成認(rèn)知的阻礙[4]。
對(duì)帶有時(shí)間和空間分布特征的電力建設(shè)數(shù)據(jù)而言,地圖可視化的方法能夠十分容易地顯示其區(qū)域分布狀態(tài)以及時(shí)空變遷記錄,可以便捷地了解和探查相應(yīng)電力工程的建設(shè)歷史、發(fā)展規(guī)律和分布特征。智能地圖通過圖示的形式和方法,為使用者建立感官直覺,幫助其得到易控有效的決策依據(jù)。 基于地圖可視化分析的信息提取模式,使用數(shù)據(jù)過濾、同化、整合等各種手段,分類、聚合、回歸、關(guān)聯(lián)等多種方法,從大量的數(shù)據(jù)中挖掘出與工程建設(shè)相關(guān)的信息。
另一方面,智能地圖提供常見的電子地圖編輯與測(cè)量功能。在二維層面,地圖提供系統(tǒng)支持的各類信息修改,常見的各類地圖測(cè)量操作;在三維層面,通過webGL技術(shù)與傾斜三維mesh模型數(shù)據(jù)的融合,實(shí)現(xiàn)了矢量、柵格、模型等多種類型數(shù)據(jù)的無縫疊加。為高速、航道、高壓線路跨越三維測(cè)量提供了基礎(chǔ)數(shù)據(jù)支撐。項(xiàng)目最終將融合后的數(shù)據(jù),通過符號(hào)化的形式,表達(dá)在了智能地圖上。通過控制篩選尺度,以地圖上的位置信息表現(xiàn)電力建設(shè)工程決策所需各類參考,并提供檢索功能,幫助用戶解答工程過程中的所遇到的難題,為電力建設(shè)決策提供了使用便捷、可靠有效的信息輔助,提高工程建設(shè)大數(shù)據(jù)的管理能力、服務(wù)效率,真正體現(xiàn)大數(shù)據(jù)的應(yīng)用價(jià)值。
3.2 基于語義的數(shù)據(jù)符號(hào)化
根據(jù)地圖符號(hào)的認(rèn)知語義原理,以地圖符號(hào)語素為關(guān)聯(lián)紐帶,可構(gòu)建語義、圖形相統(tǒng)一的地圖符號(hào)結(jié)構(gòu)化描述模型[5]。
電力建設(shè)項(xiàng)目的內(nèi)容繁多,為了清晰表達(dá)建設(shè)項(xiàng)目的地理位置,本文對(duì)建設(shè)要素進(jìn)行概括性的表達(dá),主要表示了輸配電項(xiàng)目中的站址位置及輸電線路等主要內(nèi)容,按照點(diǎn)、線面的形式予以展現(xiàn)。
3.3 多層級(jí)柵格影像數(shù)據(jù)表達(dá)
航拍影像幾乎包含了地表全部的可視內(nèi)容,項(xiàng)目收集了上海全域2米分辨率的衛(wèi)星遙感數(shù)據(jù),同時(shí)在關(guān)注的電力建設(shè)的局部區(qū)域收集了無人機(jī)航拍數(shù)據(jù),分辨率高達(dá)到2厘米,數(shù)據(jù)總量高達(dá)500GB以上,為了實(shí)現(xiàn)數(shù)據(jù)的無縫融合,采用坐標(biāo)框架法對(duì)獲取的數(shù)據(jù)進(jìn)行了坐標(biāo)統(tǒng)一化處理,然后采用LOD方式,對(duì)其劃分了23個(gè)層級(jí)的瓦片化處理,前18級(jí)采用衛(wèi)星遙感數(shù)據(jù),后5級(jí)使用航拍數(shù)據(jù)并進(jìn)行了圖面比例等級(jí)的顯示控制,可以極大地降低服務(wù)器和網(wǎng)絡(luò)帶寬的負(fù)擔(dān),并提升地圖瀏覽的速度,滿足了Web端快速加載的需求。
在瓦片化處理過程中,為了提高切圖效率,合理利用計(jì)算機(jī)系統(tǒng)資源,電力建設(shè)時(shí)空大數(shù)據(jù)地圖采用多機(jī)多任務(wù)的切圖方式。多任務(wù)切圖的原理是根據(jù)地圖的比例尺和地理范圍等預(yù)先將切圖任務(wù)拆分成多個(gè)子任務(wù),然后將拆分后的任務(wù)部署在共享目錄中,以實(shí)現(xiàn)多個(gè)進(jìn)程、多臺(tái)機(jī)器同時(shí)在共享目錄中獲取子任務(wù),從而實(shí)現(xiàn)多任務(wù)并行切圖[2]。多任務(wù)切圖方式能充分利用機(jī)器的硬件資源,綜合利用多個(gè)節(jié)點(diǎn)并行切圖,極大地提升切圖的效率。
3.4 基于中文語義的問答檢索
針對(duì)目前電力建設(shè)業(yè)務(wù)中所涉及的知識(shí)面廣、知識(shí)點(diǎn)分布零散等相關(guān)問題,充分運(yùn)用語義互聯(lián)網(wǎng)絡(luò)中的大數(shù)據(jù)信息關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)了基于語義的互聯(lián)網(wǎng)大數(shù)據(jù)信息智能化檢索技術(shù)的研究,提高了信息檢索的精度、準(zhǔn)確性與效率。
用戶提交簡(jiǎn)短問句來進(jìn)行數(shù)據(jù)查詢和事件咨詢,問句通過設(shè)計(jì)的語義匹配算法轉(zhuǎn)化為查詢語言在電力建設(shè)業(yè)務(wù)大數(shù)據(jù)語義關(guān)聯(lián)網(wǎng)絡(luò)中進(jìn)行查詢推理,匹配問答庫,最后將檢索到的答案展示給使用者。
面向上海市電力建設(shè)項(xiàng)目這一特定領(lǐng)域收集資料并標(biāo)注語料數(shù)據(jù),建立領(lǐng)域知識(shí)庫,設(shè)計(jì)并實(shí)現(xiàn)基于BERT模型的中文短文本序列標(biāo)注算法,探究引入不同的語料標(biāo)注策略對(duì)序列標(biāo)注結(jié)果的影響,設(shè)計(jì)并實(shí)現(xiàn)一個(gè)面向上海市工程建設(shè),尤其是電力行業(yè)的中文短文本語義識(shí)別方案。
1)使用Python和Tensorflow來構(gòu)建中文短文本的序列標(biāo)注算法模型。首先使用一些已標(biāo)注的中文短文本語料數(shù)據(jù)進(jìn)行算法的測(cè)試。隨后使用自行標(biāo)注的語料數(shù)據(jù)訓(xùn)練出本方案需要使用的模型。這些語料都將使用BIO方式標(biāo)記,非實(shí)體用O表示;實(shí)體的開頭使用B,其余部分使用I表示。原數(shù)據(jù)集按行存儲(chǔ),每行一個(gè)中文單字和對(duì)應(yīng)的實(shí)體序列標(biāo)注。
2)標(biāo)注語料庫。從中文獻(xiàn)資料中提取信息,使用基于簡(jiǎn)單數(shù)據(jù)增強(qiáng)的語料庫標(biāo)注方法對(duì)其進(jìn)行標(biāo)注,如同義詞替換(Synonym Replacement, SR)、隨機(jī)插入(Random Insertion, RI)、隨機(jī)交換(Random Swap, RS)、隨機(jī)刪除(Random Deletion, RD),這部分使用腳本自動(dòng)實(shí)現(xiàn)。
3)構(gòu)建領(lǐng)域知識(shí)庫。收集所涉及領(lǐng)域的數(shù)據(jù),構(gòu)建知識(shí)庫,此部分主要由人力構(gòu)建。這種描述方式與上文的序列標(biāo)簽標(biāo)注方式契合,即通過工程審批階段、規(guī)定類型和兩個(gè)實(shí)體,可直接在知識(shí)數(shù)據(jù)庫中匹配相應(yīng)分類,得知所得信息可用于解決何種問題。
4)封裝上述模型和領(lǐng)域知識(shí)庫,為系統(tǒng)提供相應(yīng)服務(wù)。
至此電力建設(shè)時(shí)空大數(shù)據(jù)地圖的可視化使用部分搭建完畢。
4 實(shí)現(xiàn)效果
4.1 實(shí)現(xiàn)待建和在建項(xiàng)目的空間數(shù)據(jù)的平臺(tái)統(tǒng)一
設(shè)計(jì)了電力建設(shè)數(shù)據(jù)的地圖語義環(huán)境設(shè)計(jì),讓建設(shè)工程數(shù)據(jù)統(tǒng)一了表現(xiàn)樣式,圖面清晰可讀;通過對(duì)電力建設(shè)項(xiàng)目在基礎(chǔ)地理框架下的標(biāo)準(zhǔn)化、符號(hào)化,疊加項(xiàng)目建設(shè)大數(shù)據(jù)聚合而成的建設(shè)信息,讓管理人員在統(tǒng)一的平臺(tái)下共享項(xiàng)目狀態(tài),掌握工程進(jìn)展,展示設(shè)計(jì)方案,了解建設(shè)項(xiàng)目與高速、高鐵、軌道交通、航道重要設(shè)施的交匯情況、協(xié)同建設(shè)項(xiàng)目信息。
4.2 提供項(xiàng)目管控的決策依據(jù)
通過對(duì)建設(shè)大數(shù)據(jù)及其他可能造成影響關(guān)聯(lián)數(shù)據(jù)的研究、構(gòu)建影響因子權(quán)重算法模型;基于電力建設(shè)的生命周期設(shè)計(jì),實(shí)現(xiàn)有效地復(fù)用優(yōu)化建設(shè)工程關(guān)聯(lián)數(shù)據(jù)的信息,利用網(wǎng)絡(luò)自動(dòng)化技術(shù)定期動(dòng)態(tài)更新相關(guān)消息;通過對(duì)電力建設(shè)大數(shù)據(jù)的挖掘梳理,利用獲得的知識(shí)庫,并且融合政策法規(guī)、規(guī)劃控制、環(huán)境保護(hù)、交通控制等信息,為建設(shè)項(xiàng)目提供管理策略,管理人員以提取概括的信息為依據(jù)做出項(xiàng)目決策。
智能地圖提供常見的電子地圖編輯與測(cè)量功能。并且在二維層面,地圖提供系統(tǒng)支持的各類信息修改,常見的各類地圖測(cè)量操作。在三維層面,通過webGL技術(shù)與傾斜三維mesh模型數(shù)據(jù)的融合,實(shí)現(xiàn)了矢量、柵格、模型等多種類型數(shù)據(jù)的無縫疊加。為高速、航道、高壓線路跨越三維測(cè)量提供了基礎(chǔ)數(shù)據(jù)支撐。
5 總結(jié)與展望
5.1 項(xiàng)目總結(jié)
論文實(shí)現(xiàn)了建設(shè)項(xiàng)目與其他地表地物、其他建設(shè)工程等的相互位置關(guān)系,能完成地圖前端的實(shí)時(shí)編輯更新工作,使得工程信息的變化得以快速反映在地圖上,同時(shí)疊加相關(guān)大數(shù)據(jù)信息,為使用者、工程的決策人員提供參照和意見。
論文還實(shí)現(xiàn)了建設(shè)工程地圖數(shù)據(jù)的格式統(tǒng)一,使得在工程中各參與方之間的信息溝通得以數(shù)字化實(shí)現(xiàn),是一種更加有效的溝通合作方式,減輕了參與者之間的合作難度,降低了工作人員工作門檻,幫助人員提升了辦公效率,為電力建設(shè)的全過程智能決策下一步工作研究奠定了基礎(chǔ)。
5.2 項(xiàng)目展望
研究工作可基于政策法規(guī)、規(guī)劃控制、環(huán)境交通、建筑施工規(guī)范、設(shè)計(jì)規(guī)范、BIM模型、土地利用、征地賠償、估算概算等歷史或現(xiàn)有的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,提取出建設(shè)數(shù)據(jù)的知識(shí)庫,結(jié)合構(gòu)建好的地理信息庫、項(xiàng)目專項(xiàng)數(shù)據(jù)庫,形成工程項(xiàng)目事務(wù)推演、討論、指揮決策的平臺(tái)。
參考文獻(xiàn):
[1] 曾侃.基于開源數(shù)據(jù)庫PostgreSQL的地理空間數(shù)據(jù)管理方法研究[D].杭州:浙江大學(xué),2007.
[2] 北京超圖軟件股份有限公司.SuperMap iDesktop 10i(2020)聯(lián)機(jī)幫助[EB/OL]. [2021-04-06].http://support.supermap.com.cn/DataWarehouse/WebDocHelp/iDesktop/SuperMap_iDesktop_10i.htm.
[3] 王惠峰,白立飛,張峰,等.多源異構(gòu)大數(shù)據(jù)地圖設(shè)計(jì)與實(shí)現(xiàn)技術(shù)研究[J].電視技術(shù),2019,43(Z1):67-70.
[4] 劉三女牙,周東波,李浩,等.基于地圖的教育大數(shù)據(jù)可視分析方法探討[J].電化教育研究,2018,39(7):49-56.
[5] 田江鵬,游雄,賈奮勵(lì),等.地圖符號(hào)的認(rèn)知語義分析與動(dòng)態(tài)生成[J].測(cè)繪學(xué)報(bào),2017,46(7):928-938.
【通聯(lián)編輯:謝媛媛】