徐翠萍 盛文婷 侯雪嬌
摘要:針對水文地質時間序列數據分析,本文提出以相關性算法為核心思想的算法設計,簡單介紹并且研究了時間序列的定義、公式和降維方法以及相似性算法的概念、公式、特點和用法。并通過對海量水文地質數據的相關性分析,對礦井突水進行預測。
關鍵詞:時間序列;相似性算法;水文地質數據
1相關知識背景簡介
1.1時間序列定義
時間序列其實就是以時間順序為依據進行相關排列,且是有順序的值, 表示時間序列,子時間序列就是連續(xù)的一個片段,它用 來代表,子時間序列的長度用 來表示。
時間序列數據的降維主要有以下方法:時間序列基于域變換的描述、分段線性表示PLR的描述[1]、分段聚合近似PAA的描述[2]、符號化表示方法描述、奇異值分解SVD 的描述[3]。
1.2皮爾森相關系數
本文主要用皮爾森相關系數來對時間序列的相關性進行表示。它是線性相關系數。對統計量關于變量之間線性相關程度進行反映。定義如式:
相關系數用corr表示,樣本量用n來表示,均值以及方差用 來表示兩者。corr所描述的是關于兩個變量間線性相關強弱的程度。如果corr的絕對值越大,則證明具有越強的相關性
2水文地質數據
2.1水文地質參數
水文地質地質參數主要有以下幾點:滲透系數、釋(儲)水系數(給水度、彈性釋水系數的定義)、其他參數、參數的測定。
2.2造成地質災害的水文地質因素
造成地質災害的水文地質因素有:不是穩(wěn)定的關于礦區(qū)地下礦物層、地質災害的形成關于沙土液化現象、地面沉降的生成對于水文因素、地基變形因素的描述、地質災害由地裂縫造成、災害由地面塌陷造成。礦山地質災害危險等級分類如表1。
3 某礦的相關性分析
1)礦井基礎條件
在礦井初步設計中,預計正常涌稅量為240 ,最大涌水量為600 。中央泵房安裝四臺MD500-57×9型礦用耐磨多級離心式水泵(500 ),預留有一臺水泵位置,副井敷設Φ325×12mm排水管兩趟,主井筒內安裝兩趟Φ325×12mm強排管路。中央泵房主副水倉總容量4588 ,系統排水能力1619 。礦井水文地質條件,各含水層抽水試驗如表2所示,礦井突水量變化曲線圖如圖1所示:
依據突水系數公式推導含水層頂界到巷道底板最大距離為:
按照隔水層厚度公式計算:
計算結果表示含水層頂界到巷道底板的距離是10~57m。由上可得,正常情況下的突水水量為60m3/h,最大突水水量為93m3/h。當超過正常涌水量時就會容易發(fā)生突水水害。
2)礦井水文地質相關性算法
本研究中選擇用到的是Pearson相關系數:
選擇兩組數據,X為安全時候的數據集,Y數據集為實際測量數據。數據X、Y的折線圖如圖3所示,得到兩組數據集的相關系數r=0.0312。
3)礦井水文地質相關性分析
相關系數的絕對值越大,相關性越強;相關系數越接近1或-1,相關度就越強;相關系數越接近于0,相關度越弱。
由此可以看出r=0.0312為弱相關/無相關,兩數據集之間為正相關關系,發(fā)生礦井突水危害的可能性還是很高的,應及早做好預防措施,以避免不必要的傷亡和損失。
4結論
本文首先通過對時間序列數據、相似性算法以及水文地質數據等知識進行簡要介紹,通過對結果進行預測分析,求出相關系數,對相關系數進行分析,估算水害發(fā)生的概率,以便于及早預防,減少不必要的人員和財產損失。
作者簡介:徐翠萍,新疆米泉人,1979年5月生,本科,研究方向移動數據網運維;
盛文婷,甘肅武威人,1983年10月生,碩士,研究方向大數據分析;
候雪嬌,新疆木壘縣人,1997年4月生,本科,研究方向為軌道交通信號與控制。