孫靜 李亞龍 萬杰 王偉
摘要:隨著互聯(lián)網(wǎng)經(jīng)濟(jì)的快速發(fā)展,大數(shù)據(jù)技術(shù)成為信息化時代的熱點。大數(shù)據(jù)應(yīng)用的本質(zhì)是數(shù)據(jù)和數(shù)據(jù)分析在業(yè)務(wù)活動中的具體表現(xiàn),如何將大數(shù)據(jù)平臺和技術(shù)應(yīng)用到地震科研學(xué)習(xí)中,提高預(yù)測水平,是地震行業(yè)迫切需要解決的問題。
關(guān)鍵詞:互聯(lián)網(wǎng)經(jīng)濟(jì);大數(shù)據(jù)技術(shù);地震科研
中圖分類號:TP311? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ? ? 文章編號:1009-3044(2018)35-0003-03
Abstract:With the rapid development of Internet economy, big data technology has become a hot topic in the information age. The essence of large data application is the concrete performance of data and data analysis in business activities. How to apply large data platform and technology to seismic scientific research and learning to improve the prediction level is an urgent problem for the seismic industry.
Key words:Internet Economy; Big Data Technology; Earthquake Research
多年以來地震預(yù)測幾乎完全依賴對震頻的監(jiān)測,并在可能發(fā)生類似地震時以此作為預(yù)測的依據(jù)。雖然還有很多潛在的地震預(yù)警信號,比如水溫、動物異常,但是預(yù)測的準(zhǔn)確率還是太低了。隨著大數(shù)據(jù)技術(shù)的興起,開啟了一種新的地震預(yù)報形式,通過基于大數(shù)據(jù)技術(shù)的分析,把某場地震的所有數(shù)據(jù)和其他地震關(guān)聯(lián)起來,可以極大提高預(yù)測準(zhǔn)確度,構(gòu)建出精度極高的地震活動預(yù)測模型。
1 大數(shù)據(jù)及相關(guān)技術(shù)介紹
1.1 大數(shù)據(jù)簡介
大數(shù)據(jù),又稱巨量資料,指的是所涉及的數(shù)據(jù)資料量規(guī)模巨大到無法通過人腦甚至主流軟件工具,在合理時間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。它的特點是數(shù)據(jù)量大、數(shù)據(jù)種類多、 要求實時性強(qiáng)、數(shù)據(jù)所蘊藏的價值大。在各行各業(yè)均存在大數(shù)據(jù),但是眾多的信息和咨詢是紛繁復(fù)雜的,我們需要搜索、處理、分析、歸納、總結(jié)其深層次的規(guī)律。從技術(shù)上看,大數(shù)據(jù)與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。大數(shù)據(jù)可應(yīng)用于各行各業(yè),將人們收集到的龐大數(shù)據(jù)進(jìn)行分析整理,實現(xiàn)資訊的有效利用??偟膩碚f,大數(shù)據(jù)是對大量、動態(tài)、能持續(xù)的數(shù)據(jù),通過運用新系統(tǒng)、新工具、新模型的挖掘,從而獲得具有洞察力和新價值的東西。以前,面對龐大的數(shù)據(jù),我們可能會一葉障目、可見一斑,因此不能了解到事物的真正本質(zhì),從而在科學(xué)工作中得到錯誤的推斷,而大數(shù)據(jù)時代的來臨,一切真相將會展現(xiàn)在我們面前。
1.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是一種技術(shù),將傳統(tǒng)的數(shù)據(jù)分析方法與處理大量數(shù)據(jù)的復(fù)雜算法相結(jié)合(圖1),從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用信息和知識的過程。
數(shù)據(jù)挖掘的過程如圖2所示。
數(shù)據(jù)挖掘的任務(wù)主要分為以下四類,如圖3所示。
l 預(yù)測建模
一種基于類標(biāo)號的學(xué)習(xí)方式,這種類標(biāo)號若是離散的,屬于分類問題;若是連續(xù)的,屬于預(yù)測問題,或者稱為回歸問題。從廣義上來說,不管是分類,還是回歸,都可以看作是一種預(yù)測,差異就是預(yù)測的結(jié)果是離散的還是連續(xù)的。
l 聚類分析
就是“物以類聚,人以群分”在原始數(shù)據(jù)集中的運用,其目的是把原始數(shù)據(jù)聚成幾類,從而使得類內(nèi)相似度高,類間差異性大。
l 關(guān)聯(lián)分析
數(shù)據(jù)挖掘可以用來發(fā)現(xiàn)規(guī)則,關(guān)聯(lián)規(guī)則屬于一種非常重要的規(guī)則,即通過數(shù)據(jù)挖掘方法,發(fā)現(xiàn)事務(wù)數(shù)據(jù)背后所隱含的某一種或者多種關(guān)聯(lián),從而利用這些關(guān)聯(lián)來指導(dǎo)商業(yè)決策和行為。
l 異常檢測
根據(jù)一定準(zhǔn)則識別或者檢測出數(shù)據(jù)集中的異常值,所謂異常值就是和數(shù)據(jù)集中的絕大多數(shù)數(shù)據(jù)表現(xiàn)不一致。
2 地震科研不斷發(fā)展為大數(shù)據(jù)的應(yīng)用提供了條件
2.1 密集地震觀測網(wǎng)將地震帶進(jìn)大數(shù)據(jù)時代
大數(shù)據(jù)就是巨量數(shù)據(jù),巨量數(shù)據(jù)的產(chǎn)生是設(shè)備和傳感器從精密到簡單,從笨重到智能、從昂貴到低廉、從量少到量大。在互聯(lián)網(wǎng)時代,互聯(lián)網(wǎng)智能技術(shù)和微電機(jī)傳感器技術(shù)使地震觀測設(shè)備也遵循大數(shù)據(jù)產(chǎn)生的規(guī)律,這完全適應(yīng)了烈度速報應(yīng)用和地震預(yù)警需求,從而產(chǎn)生了密集地震觀測網(wǎng),將地震行業(yè)帶進(jìn)了大數(shù)據(jù)時代。
(1) 地震烈度速報
在汶川特大地震發(fā)生之前,雖然我國的地震速報能在震后迅速提供地震三要素,但是還沒有建立常規(guī)運行的地震烈度速報系統(tǒng),因此無法提供有效的地震烈度速報圖,導(dǎo)致不能有效進(jìn)行應(yīng)急救援和應(yīng)急響應(yīng)。當(dāng)一個地震發(fā)生時,目前是能夠立刻知道地震發(fā)生的震中位置、發(fā)震時間和震級大小。但是地震的發(fā)生不是在一個簡單的點上,對于一個破壞性地震來說,一般都會在地下形成一個破裂帶,造成地面破壞范圍可能是以震中為圓點半徑為幾百公里之長。提供的三要素只告訴我們哪里發(fā)生了地震,卻并沒有提供哪個地方的震動最強(qiáng)烈的信息,而當(dāng)破壞性地震發(fā)生時,政府卻需要立即知道哪個地區(qū)的震動最強(qiáng)烈、破壞最嚴(yán)重,需要準(zhǔn)備什么樣的救援物資。這就需要地震部門能及時給出不同地區(qū)的烈度分布情況,它對搶救生命和應(yīng)急救援意義重大。這就需要建立有效的密集地震監(jiān)測網(wǎng),獲得地震以后的地震烈度速報。
(2) 地震預(yù)警
地震預(yù)警是在日本3.11地震之后被越來越多的人提起,其含義主要就是超快地震速報。因此,目前所說的地震預(yù)警就是地震警報。當(dāng)某一個地方發(fā)生地震時,相對電磁波的每秒30萬千米,地震波的每秒幾千米要慢得多,所以人們可以將地震發(fā)生得消息用電話、手機(jī)、電視、網(wǎng)絡(luò)、廣播等迅速傳播出去,這樣離地震發(fā)生地比較遠(yuǎn)的,由于收到報警時地震波還未到達(dá),這時可以采取緊急措施逃生和關(guān)閉水、電、氣等,減少損失,避免次生災(zāi)害。綜上所述,地震預(yù)警就是以信息技術(shù)和地震觀測技術(shù)為基礎(chǔ)的新技術(shù)。但是由于地震預(yù)警是在發(fā)生在破壞性地震之后向遠(yuǎn)處發(fā)出地震警報,從破壞性地震發(fā)生到發(fā)出警報是需要時間的,這個時間是地震波從發(fā)震處到達(dá)地震臺的時間和地震臺處理地震信號判斷震級的時間。也就是說,雖然地震發(fā)生了,但是卻不能立即發(fā)出警報,它需要地震臺網(wǎng)收到地震信號并判定為破壞性地震時,才能發(fā)出警報。這段時間對應(yīng)的S波傳播距離,稱之為盲區(qū),而為了縮小盲區(qū),也是需要建立密集的觀測網(wǎng)。如果用傳統(tǒng)的技術(shù)建立臺站,需要巨額的投資。
(3) MEMS傳感器烈度計和智能設(shè)備
MEMS技術(shù)是以智能手機(jī)開發(fā)的地震烈度計和動態(tài)地震烈度網(wǎng)技術(shù),這種技術(shù)適合布設(shè)大量密集的地震觀測網(wǎng)。
綜上所述,密集的地震觀測網(wǎng)符合大數(shù)據(jù)產(chǎn)生的規(guī)律,從傳統(tǒng)精密的地震儀到簡單的MEMS烈度計,從價格不菲的設(shè)備到價格便宜的MEMS設(shè)備,從精度高的儀器到智能化的設(shè)備,從稀疏少量的臺站到密集的地震觀測網(wǎng),觀測的數(shù)據(jù)從少量的數(shù)據(jù)到巨量數(shù)據(jù)。
2.2 大量的觀測數(shù)據(jù)為大數(shù)據(jù)挖掘提供了基礎(chǔ)
目前,我國的地震前兆觀測網(wǎng)絡(luò)系統(tǒng)是由近千個地震前兆臺和三千多套觀測設(shè)備組成,手段可以分為電磁、流體和形變,每個手段都有很多種觀測項,而每種觀測項又分為一個或多個分項,數(shù)據(jù)庫中觀測數(shù)據(jù)是以測量分項的形式保存下來的,因而數(shù)據(jù)的類型多樣。除此之外,觀測數(shù)據(jù)還呈現(xiàn)多型號儀器、多個臺站,多個區(qū)域產(chǎn)出的數(shù)據(jù)并存的情況,這些組合也使得數(shù)據(jù)具有多屬性的特點。這種情況導(dǎo)致了觀測數(shù)據(jù)會出現(xiàn)不一致性和重復(fù)性,甚至還會存在數(shù)據(jù)比較雜亂的現(xiàn)象。當(dāng)需要使用這些數(shù)據(jù)時,傳統(tǒng)的方法是沒辦法操作的,這就需要利用大數(shù)據(jù)的挖掘技術(shù)來提取有用的數(shù)據(jù)。
另外,我國的觀測數(shù)據(jù)開始于邢臺地震,從最初的人工觀測、模擬觀測,到“九五”后的數(shù)字觀測,到目前的“十五”網(wǎng)絡(luò)化觀測,經(jīng)歷了50年的時間,積累了大量基于時間的觀測資料。但是由于存在人工或模擬讀數(shù),數(shù)據(jù)保存不是很完整,比較分散,雖然各省的地震局都在花大力氣收集這些資料并采用數(shù)據(jù)庫的方式統(tǒng)一管理,但是完整的獲取這部分資料仍然比較困難。這也必須引入數(shù)據(jù)挖掘技術(shù)提煉出有效的數(shù)據(jù)資料。
3 大數(shù)據(jù)在地震科研中的作用
3.1 數(shù)據(jù)處理簡單化
在傳統(tǒng)的小數(shù)據(jù)時代,數(shù)據(jù)處理算法的研究在數(shù)據(jù)限制無法突破情況下越來越深入,其算法也日漸復(fù)雜。當(dāng)數(shù)據(jù)量以指數(shù)級往上增長時,大數(shù)據(jù)的簡單算法準(zhǔn)確率大幅提高,這時就比小數(shù)據(jù)的復(fù)雜算法更有效。
3.2 大數(shù)據(jù)使快速決策成為可能
以前地震臺網(wǎng)處理數(shù)據(jù)和確定決策都會非常慎重,都要通過分析和收集數(shù)據(jù)來驗證得到的結(jié)果;如果一些數(shù)據(jù)存在問題,導(dǎo)致原先的結(jié)果可能是有問題的,這時決策就要非常慎重。所以在這樣的情況下,小數(shù)據(jù)時代要得到快速、有效的決策結(jié)果是不可能的。
而以密集臺網(wǎng)為基礎(chǔ)的大數(shù)據(jù),可以準(zhǔn)確而簡單的知道地震發(fā)生的時間、地點和震級而無須重復(fù)檢查和復(fù)核,在這種情況下地震工作人員能快速做出決定,地震預(yù)警可以在幾秒之內(nèi)發(fā)出,地震烈度速報可以在幾分鐘之內(nèi)發(fā)出。以此為基礎(chǔ),應(yīng)急指揮部就能快速決策以減輕破壞性地震的災(zāi)害和搶救生命。
3.3 大數(shù)據(jù)催生了地震新業(yè)態(tài)和新模式
大數(shù)據(jù)的最大貢獻(xiàn)之一就是使人類通過依靠計算模型做決定轉(zhuǎn)變成依靠數(shù)據(jù)做決定,從而催生了新業(yè)態(tài)和新的工作模式。
(1) 密集的地震觀測網(wǎng)帶來的改變和創(chuàng)新
通過密集的地震觀測網(wǎng)可以得到大量的中小地震觀測數(shù)據(jù),以中小地震為基礎(chǔ)生成地下動態(tài)結(jié)構(gòu)反演成像,每次地震成像就形成了動態(tài)“地下云圖”,可以動態(tài)的監(jiān)視地下結(jié)構(gòu)的變化。目前,地震預(yù)測研究認(rèn)為地震預(yù)報的戰(zhàn)略之一就是探索地震形成的機(jī)理,這就需要地震工作者動態(tài)的監(jiān)視地下變化。這是以前稀疏臺網(wǎng)產(chǎn)出的小量數(shù)據(jù)所無法實現(xiàn)的,這就需要密集的觀測臺網(wǎng)輸出的大數(shù)據(jù)提供數(shù)據(jù)基礎(chǔ)。
(2) 大數(shù)據(jù)為地震前兆的探尋提供新的方法
現(xiàn)代互聯(lián)網(wǎng)和新技術(shù)的迅速發(fā)展,發(fā)明了各種新的傳感器以及先進(jìn)的信息技術(shù),為地震前兆的研究提供了廉價的設(shè)備,為密集觀測提供了條件。密集的觀測產(chǎn)出大量的數(shù)據(jù),因此這些巨量數(shù)據(jù)也將地震前兆觀測帶進(jìn)了大數(shù)據(jù)時代,這時探尋前兆觀測和地下變化以及地震之間的關(guān)聯(lián)都會有新的突破,將推動地震科研的創(chuàng)新。
(3) 大數(shù)據(jù)給地震應(yīng)急救援提供基礎(chǔ)
目前興起的“互聯(lián)網(wǎng)+地震”,科研產(chǎn)生地震互聯(lián)網(wǎng)大數(shù)據(jù),,它可以又快又準(zhǔn)確地得到和地震有關(guān)的數(shù)據(jù)信息,大大加快了破壞性地震的應(yīng)急和救援時的速度、能力。
(4) 物聯(lián)網(wǎng)大數(shù)據(jù)在地震中的應(yīng)用
物聯(lián)網(wǎng)是新一代信息技術(shù)的重要組成部分,其用戶端擴(kuò)展和延伸到任何物品與物品之間,實現(xiàn)物品之間的通信和信息交換,可以源源不斷的收集數(shù)據(jù)、產(chǎn)出數(shù)據(jù),一切都可以數(shù)據(jù)化。通過物聯(lián)網(wǎng)上收集的大數(shù)據(jù)可以發(fā)現(xiàn)和地震現(xiàn)象之間的關(guān)聯(lián),得到地震學(xué)的新發(fā)現(xiàn),為地震研究帶來了新的發(fā)展前景。
4 結(jié)論
大數(shù)據(jù)是多變、大量、高速的信息,它能促成更強(qiáng)的決策能力、洞察力和最佳處理,為地震預(yù)測、地震應(yīng)急提供了一種全新的技術(shù)和思路。利用大數(shù)據(jù)的特性,推進(jìn)技術(shù)融合、數(shù)據(jù)融合、業(yè)務(wù)融合,實現(xiàn)跨地域、跨部門、跨業(yè)務(wù)的協(xié)同管理和服務(wù),更好地開展地震前兆觀測工作,提高地震預(yù)測的準(zhǔn)確性。
參考文獻(xiàn):
[1] 王秀英,張玲,張聰聰.探討地震前兆觀測中的大數(shù)據(jù)挖掘與應(yīng)用[J].震災(zāi)防御技術(shù),2015(1):39-45.
[2] 劉軍.大數(shù)據(jù)處理[M].北京:人民郵電出版社,2015.
[3] 潘希. 2017 年大數(shù)據(jù)發(fā)展趨勢十大預(yù)測發(fā)布[N]. 中國科學(xué)報,2016-12-13(4).
[4] 張晁軍,陳會忠,李衛(wèi)東,等. 大數(shù)據(jù)時代對地震監(jiān)測預(yù)報問題的思考[J]. 地球物理學(xué)進(jìn)展,2015,30(4):1561-1568.
[5] Marx V. Biology: the big challenges of big data[J]. Nature,2013,498(7453):255-260.
[通聯(lián)編輯:王力]