宋 軒 高云君 李 勇 關(guān)慶鋒 孟小峰
1(南方科技大學(xué)計(jì)算機(jī)科學(xué)與工程系 廣東深圳 518055) 2(浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 杭州 310027) 3(清華大學(xué)電子工程系 北京 100084) 4(中國(guó)地質(zhì)大學(xué)(武漢)地理與信息工程學(xué)院 武漢 430078) 5(中國(guó)人民大學(xué)信息學(xué)院 北京 100190)
空間數(shù)據(jù)是描述自然地理空間和人類活動(dòng)空間所包含的人、物體、事件的信息.通常來(lái)說(shuō),空間數(shù)據(jù)具有空間位置信息、時(shí)間信息和屬性信息.與土地一樣,具有空間位置信息的空間數(shù)據(jù)是一個(gè)國(guó)家擁有的具有戰(zhàn)略意義的重要資源.我國(guó)幅員遼闊、人口眾多,加上這十多年來(lái)快速發(fā)展的數(shù)字化建設(shè),空間數(shù)據(jù)的現(xiàn)有量級(jí)十分巨大.伴隨著各類傳感器和全球定位系統(tǒng)的更加廣泛使用,諸如遙感數(shù)據(jù)、地圖測(cè)繪、交通軌跡數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、APP打卡數(shù)據(jù)等空間數(shù)據(jù)將持續(xù)增長(zhǎng),并帶來(lái)巨大的價(jià)值.
面對(duì)海量異構(gòu)的空間數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)感知存儲(chǔ)技術(shù)和處理分析方法顯然已經(jīng)不適用,亟需對(duì)應(yīng)的科學(xué)技術(shù)的發(fā)展,這正是空間數(shù)據(jù)智能逐漸興起的原因.空間數(shù)據(jù)智能是利用先進(jìn)通信技術(shù)、人工智能方法、大數(shù)據(jù)分析、先進(jìn)計(jì)算機(jī)技術(shù)等技術(shù)方法對(duì)空間數(shù)據(jù)進(jìn)行更好地感知、采集、分享、管理、分析及應(yīng)用的一個(gè)多學(xué)科交叉的研究領(lǐng)域.空間數(shù)據(jù)智能旨在通過(guò)相關(guān)理論和技術(shù)的突破,充分釋放空間數(shù)據(jù)的潛在價(jià)值,讓海量空間數(shù)據(jù)賦能于各行各業(yè),服務(wù)于我國(guó)經(jīng)濟(jì)社會(huì)的發(fā)展.
隨著空間數(shù)據(jù)智能的持續(xù)發(fā)展,空間數(shù)據(jù)智能逐漸形成了數(shù)據(jù)感知、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)安全等主要發(fā)展方向,分別專注于數(shù)據(jù)的獲取與感知、數(shù)據(jù)的存儲(chǔ)與管理、數(shù)據(jù)的加工和深入分析、數(shù)據(jù)的隱私和安全等方面.
空間數(shù)據(jù)的持續(xù)增長(zhǎng)對(duì)于空間數(shù)據(jù)智能而言,既是機(jī)遇又伴隨挑戰(zhàn).空間數(shù)據(jù)智能所面臨的主要挑戰(zhàn)包括數(shù)據(jù)感知、數(shù)據(jù)分析處理、數(shù)據(jù)應(yīng)用、數(shù)據(jù)隱私與安全、高精度地圖等方面.
1) 數(shù)據(jù)感知.如何全方位、高效、實(shí)時(shí)和可靠地感知空間數(shù)據(jù),從現(xiàn)有海量的傳感器中收集空間數(shù)據(jù),打造一個(gè)海陸空一體化的空間數(shù)據(jù)體系,是目前面臨的一個(gè)關(guān)鍵挑戰(zhàn).隨著物聯(lián)網(wǎng)的快速發(fā)展,無(wú)處不在的傳感器每天都在高速生產(chǎn)海量的空間數(shù)據(jù),急需探究一種能夠滿足在不同類型傳感器和碎片化的數(shù)據(jù)生產(chǎn)過(guò)程中實(shí)現(xiàn)高效穩(wěn)定采集數(shù)據(jù)的方法.
2) 數(shù)據(jù)分析處理.如何處理結(jié)構(gòu)復(fù)雜、高維、高噪音和多源異構(gòu)的海量空間數(shù)據(jù)是目前面臨的一個(gè)主要挑戰(zhàn),傳統(tǒng)的空間數(shù)據(jù)處理技術(shù)已不能滿足現(xiàn)有的實(shí)時(shí)動(dòng)態(tài)計(jì)算需求,迫切需要構(gòu)建一套具備整合、清洗、儲(chǔ)存和處理海量空間數(shù)據(jù)的技術(shù)體系.
3) 數(shù)據(jù)應(yīng)用.面對(duì)多源異構(gòu)的海量空間數(shù)據(jù),如何利用大數(shù)據(jù)、云計(jì)算和人工智能等新一代信息技術(shù)實(shí)現(xiàn)數(shù)據(jù)價(jià)值的挖掘和分析,并針對(duì)不同的應(yīng)用場(chǎng)景提供個(gè)性化、高效、實(shí)時(shí)和有用的價(jià)值服務(wù),也是目前面臨的一個(gè)主要挑戰(zhàn).
4) 數(shù)據(jù)隱私與安全.如何在充分利用空間數(shù)據(jù)的價(jià)值的同時(shí)做好空間數(shù)據(jù)的隱私和安全保護(hù)是一個(gè)非常重大的挑戰(zhàn),空間數(shù)據(jù)直接耦合了大量的位置信息,關(guān)乎個(gè)人隱私和國(guó)家安全,因此,做好空間數(shù)據(jù)的隱私與安全保護(hù)是未來(lái)的一個(gè)極其重要的研究工作.
5) 高精度地圖.現(xiàn)有的位置服務(wù)往往存在精度低、基準(zhǔn)差異大、延時(shí)高、穩(wěn)定性差等痛點(diǎn),無(wú)法滿足人們對(duì)高效精準(zhǔn)的位置服務(wù)的日益增長(zhǎng)的需求,特別是在自動(dòng)駕駛和出行導(dǎo)航方面,因此迫切需要構(gòu)建一套具備高精度、統(tǒng)一基準(zhǔn)和實(shí)時(shí)穩(wěn)定的地圖服務(wù)體系.
1.2.1 時(shí)空數(shù)據(jù)庫(kù)
時(shí)空數(shù)據(jù)庫(kù)旨在存儲(chǔ)與管理同時(shí)具備時(shí)間和空間屬性的時(shí)空數(shù)據(jù).時(shí)空數(shù)據(jù)是包含對(duì)象、過(guò)程、事件及其在空間、時(shí)間、語(yǔ)義等方面的關(guān)聯(lián)關(guān)系.例如,對(duì)于移動(dòng)物體,其在移動(dòng)過(guò)程中產(chǎn)生的軌跡數(shù)據(jù)就屬于時(shí)空數(shù)據(jù).因此,時(shí)空數(shù)據(jù)庫(kù)可以捕捉具有空間參考的移動(dòng)對(duì)象的運(yùn)動(dòng)變化,即通過(guò)增加時(shí)間維度,將原先的空間數(shù)據(jù)模型擴(kuò)展為時(shí)空數(shù)據(jù)模型,并為時(shí)空數(shù)據(jù)提供高性能的讀寫(xiě)和計(jì)算服務(wù).根據(jù)時(shí)空數(shù)據(jù)庫(kù)的存儲(chǔ)和計(jì)算特點(diǎn),時(shí)空數(shù)據(jù)庫(kù)可以分為分布式時(shí)空數(shù)據(jù)庫(kù)、AI賦能時(shí)空數(shù)據(jù)庫(kù)、新型硬件時(shí)空數(shù)據(jù)庫(kù)等.
1) 分布式時(shí)空數(shù)據(jù)庫(kù).由于GPS定位設(shè)備的廣泛普及和移動(dòng)計(jì)算的快速發(fā)展,時(shí)空數(shù)據(jù)的規(guī)模呈爆炸性增長(zhǎng),這對(duì)大規(guī)模時(shí)空數(shù)據(jù)的存儲(chǔ)和處理帶來(lái)了巨大挑戰(zhàn).鑒于此,現(xiàn)有工作提出了基于批式或流式分布式處理平臺(tái)(如Hadoop,Spark,Flink等)的分布式時(shí)空數(shù)據(jù)庫(kù)系統(tǒng)、分布式時(shí)空索引及更新策略等.
2) AI賦能時(shí)空數(shù)據(jù)庫(kù).時(shí)空數(shù)據(jù)的核心價(jià)值是蘊(yùn)含于其中的深層信息/知識(shí).通過(guò)AI技術(shù)可以捕獲時(shí)空數(shù)據(jù)中隱含知識(shí)和數(shù)據(jù)價(jià)值,能夠?qū)崿F(xiàn)更加智能高效的數(shù)據(jù)庫(kù)管理與應(yīng)用.為此,現(xiàn)有工作提出了基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)型索引、基于強(qiáng)化學(xué)習(xí)的參數(shù)調(diào)優(yōu)、基于遷移學(xué)習(xí)的基數(shù)估計(jì)以及基于深度學(xué)習(xí)的異常檢測(cè)等.
3) 新型硬件時(shí)空數(shù)據(jù)庫(kù).數(shù)據(jù)庫(kù)系統(tǒng)大多依賴多級(jí)內(nèi)存層次結(jié)構(gòu)(如磁盤、主內(nèi)存和多個(gè)級(jí)別的處理器緩存),而計(jì)算機(jī)硬件與各個(gè)級(jí)別的設(shè)備都直接影響到數(shù)據(jù)庫(kù)性能.傳統(tǒng)的以CPU為計(jì)算中心的數(shù)據(jù)庫(kù)技術(shù)面臨“能耗墻,內(nèi)存墻”的限制.近年來(lái),新型硬件(如GPU,NPU等)被廣泛應(yīng)用,借助其高吞吐、低延遲、易擴(kuò)展的特點(diǎn)以及其與AI的強(qiáng)交互能力,新型硬件時(shí)空數(shù)據(jù)庫(kù)正在快速發(fā)展.例如,現(xiàn)有工作提出了基于GPU的時(shí)空數(shù)據(jù)庫(kù)系統(tǒng),以提高時(shí)空數(shù)據(jù)的實(shí)時(shí)查詢能力.
針對(duì)數(shù)據(jù)庫(kù)系統(tǒng)的研究,除了需要提供高性能的讀寫(xiě)和計(jì)算服務(wù)外,還要求數(shù)據(jù)庫(kù)在與用戶進(jìn)行交互時(shí)提供高可用性.時(shí)空數(shù)據(jù)庫(kù)可用性主要體現(xiàn)在為用戶提供對(duì)預(yù)期之外的時(shí)空查詢結(jié)果的解釋,滿足用戶從時(shí)空數(shù)據(jù)庫(kù)查詢中得到精確和完整查詢結(jié)果的期望.現(xiàn)有工作提出了針對(duì)反向top-k
查詢的why和why-not問(wèn)題處理框架、路網(wǎng)中基于范圍skyline查詢的why和why-not問(wèn)題處理方法、概率反向skyline查詢的causality與responsibility計(jì)算方法等.1.2.2 空間感知技術(shù)和時(shí)空數(shù)據(jù)挖掘
空間信息的感知依賴于傳感器技術(shù)和網(wǎng)絡(luò)技術(shù),是空間數(shù)據(jù)智能的神經(jīng)末梢.然而現(xiàn)實(shí)世界是復(fù)雜多變的,因此需要可靠的、泛在的、實(shí)時(shí)更新的感知層收集可靠的時(shí)空信息.空間感知技術(shù)可從傳輸網(wǎng)絡(luò)和接口來(lái)分類,根據(jù)網(wǎng)絡(luò)范圍主要分為衛(wèi)星網(wǎng)、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和無(wú)線傳感網(wǎng)技術(shù):1)衛(wèi)星網(wǎng)可以通過(guò)航天衛(wèi)星、航天飛機(jī)、無(wú)人機(jī)等裝置進(jìn)行衛(wèi)星定位、對(duì)地觀測(cè)、地圖繪制,大氣層云圖繪制等;2)互聯(lián)網(wǎng)通過(guò)智能手機(jī)、移動(dòng)終端、智能穿戴設(shè)備等采集人的移動(dòng)性數(shù)據(jù)、社交媒體等;3)物聯(lián)網(wǎng)主要通過(guò)工業(yè)和家用網(wǎng)絡(luò)中常見(jiàn)的RFID室內(nèi)外定位,監(jiān)控設(shè)備,監(jiān)測(cè)傳感器等低能耗消耗的傳感器來(lái)收集環(huán)境數(shù)據(jù);4)無(wú)線傳感網(wǎng)可將其末段傳感器采集的數(shù)據(jù)如地震、電磁、溫度、濕度、噪聲、光強(qiáng)度等借助物聯(lián)網(wǎng),廣域網(wǎng)或者衛(wèi)星網(wǎng)絡(luò)傳輸給網(wǎng)絡(luò)所有者.
由空間感知技術(shù)采集到的多源異構(gòu)時(shí)空數(shù)據(jù),經(jīng)過(guò)有效強(qiáng)大的時(shí)空數(shù)據(jù)庫(kù)存儲(chǔ)和管理,最后由時(shí)空數(shù)據(jù)挖掘技術(shù)來(lái)探索發(fā)現(xiàn)數(shù)據(jù)價(jià)值并給各類應(yīng)用提供有力支撐.空間數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù)進(jìn)行簡(jiǎn)單分類如下:1)時(shí)空數(shù)據(jù)預(yù)處理方法:軌跡分段和壓縮、地圖匹配、區(qū)域劃分和缺值補(bǔ)全等;2)傳統(tǒng)的統(tǒng)計(jì)方法:回歸分析、判別分析、因子分析、歷史平均和自回歸等;3)傳統(tǒng)的機(jī)器學(xué)習(xí)方法:聚類方法、隱空間模型、條件隨機(jī)場(chǎng)等;4)前沿的機(jī)器學(xué)習(xí)方法:深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、元學(xué)習(xí)、遷移學(xué)習(xí)、持續(xù)學(xué)習(xí)和對(duì)比學(xué)習(xí)等;5)可視化方法:時(shí)序數(shù)據(jù)可視化、軌跡可視化、集體趨勢(shì)時(shí)空可視化、聚類可視化、地圖可視化和相似性探索可視化等.數(shù)據(jù)挖掘方法十分豐富,需要綜合使用多種技術(shù)來(lái)挖掘空間數(shù)據(jù)中存在的價(jià)值,為人所用.
1.2.3 時(shí)空數(shù)據(jù)安全與隱私
為了更好地保障用戶對(duì)其個(gè)人數(shù)據(jù)的使用知情權(quán)和處理權(quán),歐洲政府于2018年出臺(tái)了用戶隱私保護(hù)政策《通用數(shù)據(jù)保護(hù)條例》(GDPR).中國(guó)在3年后也頒布了《中華人民共和國(guó)數(shù)據(jù)安全法》,加快填補(bǔ)國(guó)內(nèi)數(shù)據(jù)安全保護(hù)的空白.其中,由于時(shí)空數(shù)據(jù)可以用于城市規(guī)劃、智能交通和商業(yè)分析等應(yīng)用,并且往往涉及到公共事件、政策等方面的敏感信息,因此保障時(shí)空數(shù)據(jù)的安全與隱私更是對(duì)維護(hù)國(guó)家安全有重要意義.在城市發(fā)展的過(guò)程中,依據(jù)空間數(shù)據(jù)的時(shí)空特性,我們認(rèn)為在數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)發(fā)布3個(gè)階段有不同的隱私保護(hù)要求.
1) 數(shù)據(jù)采集.由于設(shè)備和環(huán)境的限制,采集到的連續(xù)數(shù)據(jù)在空間上和時(shí)間上都很強(qiáng)的不確定性.尤其是個(gè)人軌跡數(shù)據(jù)會(huì)更加稀疏,因?yàn)橛脩舨粫?huì)隨時(shí)訪問(wèn)位置服務(wù)并貢獻(xiàn)數(shù)據(jù).為了保護(hù)這一階段用戶的隱私,同時(shí)得到高質(zhì)量的時(shí)空數(shù)據(jù),目前的研究工作提出了在神經(jīng)網(wǎng)絡(luò)模型中引入注意力機(jī)制;采用眾感知框架的同時(shí)結(jié)合壓縮感知等.
2) 數(shù)據(jù)處理.在挖掘空間數(shù)據(jù)包含大量可用信息時(shí),安全和隱私面臨的挑戰(zhàn)更加嚴(yán)峻.如果研究者還是以普通的深度學(xué)習(xí)框架對(duì)數(shù)據(jù)進(jìn)行處理,中心化地處理大規(guī)模的未脫敏數(shù)據(jù),不僅會(huì)加重中心服務(wù)器的負(fù)擔(dān)、浪費(fèi)邊緣計(jì)算資源,更重要的是大量用戶的隱私安全得不到保障.目前,新型的聯(lián)邦學(xué)習(xí)框架已經(jīng)掀起了一陣研究熱潮,致力于解決深度學(xué)習(xí)過(guò)程中隱私泄露問(wèn)題.聯(lián)邦學(xué)習(xí)具有極高的可擴(kuò)展性,并能很好地與其他隱私保護(hù)方法相結(jié)合,例如同態(tài)加密和差分隱私等密碼學(xué)方法.
3) 數(shù)據(jù)發(fā)布.在發(fā)布收集到的原始數(shù)據(jù)或是處理好的數(shù)據(jù)結(jié)果時(shí),平衡好用戶隱私和數(shù)據(jù)可用性之間的關(guān)系時(shí)非常重要的.常見(jiàn)的方法包括K
-匿名和對(duì)數(shù)據(jù)進(jìn)行模糊處理,保障了每個(gè)用戶的敏感信息能夠藏匿于打包的數(shù)據(jù)集中.國(guó)家“十四五”規(guī)劃進(jìn)一步明確了要大力推進(jìn)智能交通的發(fā)展,促進(jìn)交通領(lǐng)域的數(shù)字化和智能化提升.空間數(shù)據(jù)智能技術(shù)是實(shí)現(xiàn)智能交通的關(guān)鍵技術(shù),通過(guò)依托無(wú)處不在的城市交通時(shí)空數(shù)據(jù),借助物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能和數(shù)字孿生等新一代信息技術(shù),可以有效地實(shí)現(xiàn)交通時(shí)空數(shù)據(jù)的價(jià)值分析和共享,能夠?qū)崟r(shí)動(dòng)態(tài)精準(zhǔn)地提供道路交通狀態(tài)信息、位置導(dǎo)航服務(wù)、出行客流情況和環(huán)境天氣關(guān)聯(lián)影響,在實(shí)現(xiàn)交通智能化管理的同時(shí)也可以進(jìn)一步有效地促進(jìn)自動(dòng)駕駛和車路協(xié)同系統(tǒng)的發(fā)展.
未來(lái)通過(guò)借助空間數(shù)據(jù)智能技術(shù),能夠大大加快城市交通由信息化向智能化的轉(zhuǎn)型,為廣大乘客、交通機(jī)構(gòu)和政府部門提供智能化的交通出行和管理服務(wù).對(duì)廣大乘客而言,空間數(shù)據(jù)智能技術(shù)能夠?yàn)橛脩魩?lái)精準(zhǔn)的位置服務(wù)和個(gè)性化的出行線路規(guī)劃,為用戶提供舒適便捷的出行服務(wù),同時(shí)這也是滿足了社會(huì)在出行過(guò)程中對(duì)時(shí)空服務(wù)日益增長(zhǎng)的需求.對(duì)于交通管理機(jī)構(gòu),空間數(shù)據(jù)智能技術(shù)可以幫助其提升交通管理的效率,有效地解決交通擁堵和交通事故等問(wèn)題.與此同時(shí),空間數(shù)據(jù)智能技術(shù)能夠有效輔助政府部門進(jìn)行交通規(guī)劃、商業(yè)選址和基礎(chǔ)建設(shè)的相關(guān)決策,加快智能鐵路、智慧機(jī)場(chǎng)、智能公路、智慧港口和智慧車站的建設(shè),從而進(jìn)一步促進(jìn)智慧城市的發(fā)展.
除了在城市交通上的應(yīng)用外,空間數(shù)據(jù)智能的另一個(gè)主要的應(yīng)用方向?yàn)樵诔鞘谐叨认碌姆罏?zāi)應(yīng)急應(yīng)用.依據(jù)災(zāi)難發(fā)生的時(shí)間,可與將應(yīng)用劃分為三大類:災(zāi)難發(fā)生前的預(yù)測(cè)、災(zāi)難發(fā)生過(guò)程中的緊急調(diào)度、災(zāi)難發(fā)生后的災(zāi)害管理.
1) 災(zāi)難發(fā)生前的預(yù)測(cè).通常而言,災(zāi)難可以劃分為2類,即洪水、臺(tái)風(fēng)、地震、泥石流等自然災(zāi)難,以及車禍、踩踏事件等人為災(zāi)難.這些災(zāi)難絕大部分都不會(huì)毫無(wú)預(yù)兆的發(fā)生,在現(xiàn)有的研究中,依據(jù)土壤類型、降雨量、氣候、海拔、經(jīng)緯度、植被等可以觀測(cè)的空間數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,包括地震、洪水、臺(tái)風(fēng)等災(zāi)難在內(nèi)的自然災(zāi)害都能夠被提前預(yù)知,從而提前做好預(yù)防的準(zhǔn)備,減少突發(fā)的自然災(zāi)難所帶來(lái)的經(jīng)濟(jì)損失.而在2.1節(jié)城市交通應(yīng)用的基礎(chǔ)上所衍生的交通故障預(yù)測(cè),未來(lái)的交通擁堵預(yù)測(cè)以及人流的預(yù)測(cè)等方向也有著成熟的方法,通過(guò)城市尺度的空間數(shù)據(jù)準(zhǔn)確地預(yù)測(cè)了未來(lái)的交通、人群流向,在有政府干預(yù)的前提下,交通事故、踩踏事件等人為災(zāi)難數(shù)量也能夠得到有效的控制,從源頭遏止不必要的經(jīng)濟(jì)損失.
2) 災(zāi)難發(fā)生時(shí)的緊急調(diào)度.在災(zāi)難剛剛發(fā)生的時(shí)候,救援人員難以提前到場(chǎng),此時(shí)受災(zāi)人僅能夠依靠自己逃離受災(zāi)地點(diǎn),而不正確的應(yīng)對(duì)行為以及撤離路線通常會(huì)引發(fā)二次受災(zāi).在歷史的空間數(shù)據(jù),尤其是人群過(guò)往的軌跡數(shù)據(jù)以及相應(yīng)位置的地理以及建筑結(jié)構(gòu)數(shù)據(jù)的支持下,目前這一階段較為成熟的應(yīng)用方向包括了小范圍的突發(fā)狀態(tài)下(例如火災(zāi)現(xiàn)場(chǎng))的人群疏散引導(dǎo),以及城市尺度下的重大災(zāi)難時(shí)(例如突發(fā)的地震)的人流方向推導(dǎo).相比于能夠采集到大量數(shù)據(jù)的災(zāi)前預(yù)測(cè)方向以及災(zāi)難后的災(zāi)害管理方向,災(zāi)難發(fā)生時(shí)的應(yīng)用由于缺乏足夠的數(shù)據(jù)支持,目前還有更多的研究空間.
3) 災(zāi)難發(fā)生后的災(zāi)害管理.在2021年7月20日時(shí),河南省鄭州市連遭暴雨襲擊,同時(shí)產(chǎn)生了嚴(yán)重的內(nèi)澇現(xiàn)象,損失極其嚴(yán)重.但是在災(zāi)后的救援過(guò)程之中,一份收集受災(zāi)人員的空間位置以及受災(zāi)說(shuō)明的數(shù)據(jù)的騰訊文檔卻發(fā)揮了極大的作用.在短短1天內(nèi)其訪問(wèn)量超過(guò)了250萬(wàn)次,并且據(jù)不完全統(tǒng)計(jì)至少救助了超過(guò)85名受災(zāi)群眾.這充分說(shuō)明了空間數(shù)據(jù)在災(zāi)難發(fā)生期間能夠發(fā)揮重大的作用.在現(xiàn)有的研究之中,災(zāi)后的災(zāi)害管理主要以救援路線的規(guī)劃以及救援物資分配為主.依據(jù)災(zāi)后受災(zāi)人員的位置,各個(gè)地方的受災(zāi)情況進(jìn)行規(guī)劃,從而盡可能地減少災(zāi)難發(fā)生后的損失.
基于人群傳播網(wǎng)絡(luò)的傳染病給人類社會(huì)帶來(lái)了廣泛的影響,而傳染病的傳播和人的移動(dòng)息息相關(guān).通過(guò)整合人口遷徙相關(guān)的空間數(shù)據(jù),比如個(gè)人GPS軌跡、交通軌跡、航班數(shù)據(jù)等,結(jié)合傳染病物理傳播模型和深度學(xué)習(xí)等方法進(jìn)行建模,空間數(shù)據(jù)智能可以在疫情預(yù)警、疫情預(yù)測(cè)、疫情排查、疫情物資配置等方面發(fā)揮重要作用.
1) 空間數(shù)據(jù)智能助力疫情預(yù)警.基于區(qū)域間的人口流動(dòng)數(shù)據(jù)建模,可以預(yù)測(cè)下一個(gè)可能爆發(fā)的疫情區(qū)域,為各個(gè)地區(qū)提前預(yù)防、防疫政策調(diào)整提供科學(xué)依據(jù).
2) 空間數(shù)據(jù)智能協(xié)助疫情傳播預(yù)測(cè).在發(fā)生疫情后,根據(jù)該地區(qū)包括人口遷徙、交通運(yùn)輸在內(nèi)的空間數(shù)據(jù),進(jìn)行空間數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型的建立及傳播模擬,可以對(duì)傳染病的傳播態(tài)勢(shì)進(jìn)行預(yù)測(cè),了解疫情發(fā)展態(tài)勢(shì)和峰值時(shí)間等,協(xié)助醫(yī)療專家對(duì)疫情發(fā)展做出更加精確的評(píng)估,輔助政府部門制定防疫政策.
3) 空間數(shù)據(jù)智能協(xié)助疫情排查,通過(guò)對(duì)包括個(gè)人軌跡在內(nèi)的空間數(shù)據(jù)的整合以及密接判定模型的建立,空間數(shù)據(jù)智能方法可以快速鎖定密接接觸者.作為一種重要的“技防”,空間數(shù)據(jù)智能可以讓傳染病排查工作在傳統(tǒng)的流行病學(xué)調(diào)查的基礎(chǔ)上變得更加高效精準(zhǔn).
4) 空間數(shù)據(jù)智能優(yōu)化疫情物資配給.傳染病爆發(fā)區(qū)域?qū)Ψ揽匚镔Y的需求量大,空間數(shù)據(jù)智能通過(guò)先進(jìn)的計(jì)算機(jī)及通信技術(shù)整合各地的物資數(shù)據(jù),利用算法優(yōu)化物資配置并規(guī)劃派送方案,并結(jié)合對(duì)潛在風(fēng)險(xiǎn)區(qū)域的挖掘,協(xié)助防疫物資科學(xué)儲(chǔ)備.
為實(shí)現(xiàn)“碳達(dá)峰”和“碳中和”的目標(biāo),“十四五”期間我國(guó)將加快能源數(shù)字化轉(zhuǎn)型,建設(shè)清潔低碳、安全高效的現(xiàn)代智慧零碳能源體系.空間數(shù)據(jù)智能技術(shù)通過(guò)利用物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、人工智能和5G等技術(shù),可以實(shí)時(shí)感知能源領(lǐng)域的時(shí)空信息,集成多種能源(電、煤、石油、天然氣、供冷、供熱等)的生產(chǎn)、傳輸、存儲(chǔ)、消費(fèi)、交易等時(shí)空數(shù)據(jù)于一體,建立能源體系的數(shù)字底座,實(shí)現(xiàn)風(fēng)光儲(chǔ)一體化、石油管道運(yùn)輸規(guī)劃、電力供應(yīng)、綠色能源交易、用戶需求預(yù)測(cè)等能源全生命周期管理環(huán)節(jié)的價(jià)值挖掘和分析,構(gòu)建能源價(jià)值的一體化智能服務(wù)平臺(tái).
空間數(shù)據(jù)智能技術(shù)可以大大提升能源領(lǐng)域的數(shù)字化、自動(dòng)化和智能化,做到零碳能源智能生產(chǎn),實(shí)現(xiàn)能源的脫碳生產(chǎn)和清潔利用;建立分布式智慧能源網(wǎng)絡(luò),提高能源的傳輸和利用效率;同時(shí)實(shí)現(xiàn)多能協(xié)同供應(yīng)與調(diào)度管理,充分發(fā)揮多種能源相互配合使用的優(yōu)勢(shì).除此之外,空間數(shù)據(jù)智能技術(shù)還可以提供能源的智能交易服務(wù),實(shí)時(shí)高效地滿足供需側(cè)的多樣化需求;打造低碳車聯(lián)網(wǎng)能源服務(wù),促進(jìn)新能源汽車的快速發(fā)展,減少道路交通的碳排放和空氣污染;同時(shí)提供一站式園區(qū)智慧能源服務(wù),降低園區(qū)能耗強(qiáng)度和碳排放強(qiáng)度.因此,空間數(shù)據(jù)智能技術(shù)能夠全面助力能源的數(shù)字化轉(zhuǎn)型,加快雙碳目標(biāo)的實(shí)現(xiàn).
國(guó)家“十四五”規(guī)劃提出要推進(jìn)完善新型城鎮(zhèn)化戰(zhàn)略,構(gòu)建國(guó)土空間開(kāi)發(fā)保護(hù)的新格局.如何在可持續(xù)發(fā)展的目標(biāo)下,研究土地利用變化過(guò)程,預(yù)測(cè)土地利用未來(lái)發(fā)展趨勢(shì),實(shí)現(xiàn)地區(qū)土地利用的數(shù)量、功能、布局、強(qiáng)度等系統(tǒng)性優(yōu)化,是當(dāng)前國(guó)土空間規(guī)劃研究的重點(diǎn).空間數(shù)據(jù)智能技術(shù)是構(gòu)建國(guó)土空間開(kāi)發(fā)新格局,實(shí)現(xiàn)土地資源高效利用和合理配置,為土地管理部門提供成熟決策方法的關(guān)鍵技術(shù).
通過(guò)借助空間數(shù)據(jù)智能技術(shù),將不同部門的多源地理數(shù)據(jù)(地形地貌、遙感影像、地表覆蓋、測(cè)繪基準(zhǔn)、土壤、植被、環(huán)境監(jiān)測(cè)等)聚合在一起,實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)訪問(wèn)接口,構(gòu)建數(shù)據(jù)庫(kù)集成管理和統(tǒng)計(jì)分析系統(tǒng),逐步構(gòu)建地理時(shí)空信息云平臺(tái),旨在實(shí)現(xiàn)國(guó)土空間規(guī)劃“一張圖”,為政府部門提供準(zhǔn)確標(biāo)準(zhǔn)的數(shù)據(jù)支撐.
通過(guò)借助空間數(shù)據(jù)智能技術(shù),構(gòu)建融合統(tǒng)計(jì)方法和地理學(xué)定律的空間計(jì)量模型,可以評(píng)估土地儲(chǔ)備潛力,預(yù)測(cè)未來(lái)土地儲(chǔ)備需求量和土地價(jià)格;構(gòu)建人類活動(dòng)與基礎(chǔ)設(shè)施的時(shí)空關(guān)聯(lián)關(guān)系模型,可以自動(dòng)提取城市邊界,分析城市混合功能空間結(jié)構(gòu),實(shí)現(xiàn)城市功能區(qū)的精細(xì)化管理和動(dòng)態(tài)監(jiān)測(cè);構(gòu)建土地利用變化模擬模型,可以挖掘復(fù)雜驅(qū)動(dòng)力因素對(duì)城市發(fā)展的驅(qū)動(dòng)機(jī)制,分析主導(dǎo)影響因素,預(yù)測(cè)不同情景下的未來(lái)土地利用;構(gòu)建多目標(biāo)土地利用優(yōu)化模型,可以提升用地強(qiáng)度利用效率,對(duì)土地資源進(jìn)行空間合理調(diào)控,實(shí)現(xiàn)經(jīng)濟(jì)發(fā)展、環(huán)境保護(hù)、社會(huì)公平和區(qū)域協(xié)調(diào)的平衡,為國(guó)土規(guī)劃部門提供有效的解決方案和決策支持.
隨著5G和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展、以及時(shí)空應(yīng)用場(chǎng)景的不斷變化,時(shí)空數(shù)據(jù)庫(kù)在不斷發(fā)展的同時(shí),也面臨了諸多亟需解決的挑戰(zhàn)性難題,如多模態(tài)數(shù)據(jù)融合.真實(shí)世界中時(shí)空數(shù)據(jù)除了時(shí)間序列和地理位置數(shù)據(jù)外,還存在大量具有時(shí)空屬性的多模態(tài)數(shù)據(jù),如GPS文本、運(yùn)動(dòng)圖像、交通視頻等,如何在現(xiàn)有時(shí)空數(shù)據(jù)庫(kù)中融合具有時(shí)空屬性的多模態(tài)數(shù)據(jù),以支持多模態(tài)時(shí)空數(shù)據(jù)融合處理,是時(shí)空數(shù)據(jù)庫(kù)領(lǐng)域面臨的新挑戰(zhàn).
此外,隨著以博客、社交網(wǎng)絡(luò)、基于位置的服務(wù)(location based service, LBS)等為代表的新型信息發(fā)布方式的不斷涌現(xiàn),以及云計(jì)算、物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,高精尖的數(shù)據(jù)庫(kù)技術(shù)逐漸進(jìn)入人們的視野,并幫助一般用戶進(jìn)行感知和決策.然而,用戶并不精通數(shù)據(jù)庫(kù)專業(yè)技術(shù),但仍然需要對(duì)許多事務(wù)進(jìn)行決策,因此需要高可用、易懂易用的數(shù)據(jù)庫(kù).“數(shù)據(jù)庫(kù)平民化”已經(jīng)成為數(shù)據(jù)庫(kù)未來(lái)發(fā)展的一大趨勢(shì),如何利用即時(shí)查詢、查詢構(gòu)造等提升時(shí)空數(shù)據(jù)庫(kù)易用性是時(shí)空數(shù)據(jù)庫(kù)領(lǐng)域面對(duì)的又一新挑戰(zhàn).
隨著移動(dòng)智能設(shè)備和移動(dòng)通信技術(shù)的快速發(fā)展,空間數(shù)據(jù)的采集變得日益普遍,使得大規(guī)??臻g數(shù)據(jù)在醫(yī)療、能源、交通等領(lǐng)域具有重要應(yīng)用價(jià)值,然而與空間大數(shù)據(jù)相匹配的信息處理、知識(shí)提取算法仍是亟待研究的領(lǐng)域.此外,人工智能和數(shù)據(jù)挖掘算法在近十余年來(lái)取得了長(zhǎng)足的發(fā)展,我國(guó)也在近年提出了促進(jìn)人工智能和大數(shù)據(jù)國(guó)家戰(zhàn)略,指出人工智能和數(shù)據(jù)挖掘技術(shù)將成為發(fā)展國(guó)民經(jīng)濟(jì)水平各領(lǐng)域的重要抓手.在空間數(shù)據(jù)智能研究中,如何有效地實(shí)現(xiàn)空間大數(shù)據(jù)和人工智能研究的深度融合、再創(chuàng)新是重要的未來(lái)發(fā)展方向.
然而,在空間數(shù)據(jù)智能中,應(yīng)用并發(fā)展人工智能和數(shù)據(jù)挖掘技術(shù)也存在以下幾點(diǎn)重要問(wèn)題:首先,空間數(shù)據(jù)往往體量巨大且結(jié)構(gòu)異質(zhì),這對(duì)發(fā)展、應(yīng)用的人工智能模型的計(jì)算效率、空間復(fù)雜度和可并行度等性能指標(biāo)提出了很高要求.其次,空間大數(shù)據(jù)由于物體在空間上重疊、包含等原因,往往缺乏也難以獲取高質(zhì)量數(shù)據(jù)標(biāo)簽.這使得現(xiàn)有算法模型大部分局限在非監(jiān)督學(xué)習(xí)、弱監(jiān)督學(xué)習(xí)范式下,難以從大規(guī)模無(wú)標(biāo)簽空間數(shù)據(jù)中提取出高質(zhì)量知識(shí).此外,空間大數(shù)據(jù)由于獲取渠道多元、大規(guī)模感知設(shè)備的精度低等原因,存在數(shù)據(jù)質(zhì)量差、單位數(shù)據(jù)價(jià)值密度低等問(wèn)題.空間數(shù)據(jù)噪音在很大程度上受定位設(shè)備的影響,如GPS、蜂窩基站、WiFi熱點(diǎn)等,且不同數(shù)據(jù)渠道采集的數(shù)據(jù)存在較大差異,難以有效融合.因此,在空間數(shù)據(jù)智能中設(shè)計(jì)數(shù)據(jù)挖掘和人工智能算法需要有效解決對(duì)數(shù)據(jù)質(zhì)量的兼容性問(wèn)題,從而實(shí)現(xiàn)穩(wěn)健的空間知識(shí)提取.
隨著社會(huì)分工的不斷深入,快速的城市化是過(guò)去數(shù)十年中貫穿我國(guó)和世界各國(guó)的主旋律.空間上的聚集和由信息技術(shù)發(fā)展帶來(lái)的高頻社交行為,使得復(fù)雜系統(tǒng)成為了研究人類社會(huì)及相關(guān)問(wèn)題的必要范式.
在此背景下,人的行為模式在不同空間尺度下表現(xiàn)出完全不同的復(fù)雜行為模式.以交通規(guī)劃領(lǐng)域?yàn)槔?,其在個(gè)體層面關(guān)注于出發(fā)地-目的地(O-D)的建模,在聚合層面要建道路截面流量,而在城市區(qū)域?qū)用鎰t要關(guān)注宏觀人群流動(dòng)規(guī)律.復(fù)雜系統(tǒng)的內(nèi)在特性使得微觀機(jī)制和宏觀規(guī)律間存在難以預(yù)測(cè)的非線性效應(yīng),這位多尺度的空間數(shù)據(jù)智能研究提出了獨(dú)特的挑戰(zhàn).
現(xiàn)有復(fù)雜系統(tǒng)研究主要采用演繹的研究方法,即基于一系列預(yù)設(shè)的微觀機(jī)制推到、仿真宏觀的行為規(guī)律.然而,這一研究范式無(wú)法有效利用日益豐富的空間數(shù)據(jù),無(wú)法實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的規(guī)律發(fā)現(xiàn)和知識(shí)獲取.另一方面,單純的數(shù)據(jù)挖掘算法無(wú)法有效地和已有復(fù)雜系統(tǒng)理論相結(jié)合,挖掘出的觀測(cè)規(guī)律在理論完備性和可泛化能力上存在隱患.因此,空間數(shù)據(jù)智能的未來(lái)研究中,一個(gè)重要方向是提出能有效結(jié)合復(fù)雜系統(tǒng)理論與空間大數(shù)據(jù)的新研究范式,并且解決其在社會(huì)各領(lǐng)域的有效應(yīng)用.
近年來(lái),機(jī)器學(xué)習(xí)領(lǐng)域取得了蓬勃發(fā)展,對(duì)于現(xiàn)有的機(jī)器學(xué)習(xí)方法來(lái)說(shuō),單純追求預(yù)測(cè)精度是不夠的,這類模型具有一個(gè)共同的特點(diǎn),內(nèi)部結(jié)構(gòu)復(fù)雜,運(yùn)行機(jī)制像一個(gè)黑盒子一樣.且大多數(shù)預(yù)測(cè)模型根據(jù)相關(guān)性進(jìn)行預(yù)測(cè),但相關(guān)性并不意味著因果關(guān)系,模型輸出結(jié)果也難以得到有效解釋.因此,在未來(lái),正確性和可解釋性成為了機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)要實(shí)現(xiàn)的目標(biāo).
深度學(xué)習(xí)領(lǐng)域嘗試開(kāi)展具有可解釋和分析能力的關(guān)系模型,這些模型的一致目標(biāo)是探究能否找到一個(gè)原因,來(lái)對(duì)模型結(jié)果進(jìn)行針對(duì)性的解釋以及可靠的指導(dǎo).因此,深度學(xué)習(xí)開(kāi)始結(jié)合一些因果發(fā)現(xiàn)與因果推斷方法,例如因果圖、結(jié)構(gòu)因果模型等,通過(guò)對(duì)觀測(cè)的時(shí)空數(shù)據(jù)進(jìn)行分析來(lái)揭示隱藏的因果信息.因果分析也是快速發(fā)展的可解釋人工智能領(lǐng)域的一個(gè)重要課題,旨在構(gòu)建可解釋和透明的算法,解釋如何做出決定.從以往研究來(lái)看,因果關(guān)系已經(jīng)在無(wú)數(shù)領(lǐng)域和場(chǎng)景下得到學(xué)習(xí),包括教育、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、流行病學(xué)、氣象學(xué)和環(huán)境健康等.
因果學(xué)習(xí)與機(jī)器學(xué)習(xí)領(lǐng)域有著密切的關(guān)系.機(jī)器學(xué)習(xí)領(lǐng)域的蓬勃發(fā)展促進(jìn)了因果發(fā)現(xiàn)和因果推斷領(lǐng)域的研究與探討.例如,應(yīng)用決策樹(shù)、集成方法、深度神經(jīng)網(wǎng)絡(luò)等強(qiáng)大的機(jī)器學(xué)習(xí)方法,可以更準(zhǔn)確地估計(jì)潛在的結(jié)果.因果學(xué)習(xí)是解釋分析的強(qiáng)大建模工具,它可以使當(dāng)前的機(jī)器學(xué)習(xí)做出可解釋的預(yù)測(cè).因此,如何更進(jìn)一步將因果學(xué)習(xí)與機(jī)器學(xué)習(xí)連接起來(lái),克服認(rèn)識(shí)上的不透明性,從相關(guān)性最終獲得因果性,是未來(lái)需要解決的難題.隨著數(shù)字傳感技術(shù)的進(jìn)步與發(fā)展,以及時(shí)空數(shù)據(jù)庫(kù)的不斷豐富,發(fā)展具有因果關(guān)系挖掘能力的模型或許是破解黑箱模型的關(guān)鍵.
作者貢獻(xiàn)聲明
:宋軒負(fù)責(zé)論文思路構(gòu)思、論文整體寫(xiě)作和修改;高云君、李勇、關(guān)慶鋒和孟小峰進(jìn)行論文寫(xiě)作和修改.