謝慶和 劉城 楊廣華 張博
[摘要]結(jié)合地震數(shù)據(jù)分析軟件MSDP與全球地震發(fā)生地的地震三要素,運用多元線性回歸分析方法,將格爾木地震臺在2003年至2013年這11年間采集的地震,震級在M≧5.0區(qū)域的大地震的相對時差進行分析建模,為建立相對時差與地震發(fā)生地的深度、震中距、方位角這三個變量之間的函數(shù)關(guān)系提供了一種簡單的方法,并且求出相應(yīng)的多元線性回歸方程。
[關(guān)鍵詞]地震 時差 相關(guān)系數(shù)分析
[中圖分類號] P4 [文獻碼] B [文章編號] 1000-405X(2015)-8-384-2
0前言
格爾木地震臺屬于國家基準(zhǔn)臺站之一,多年在年終材料評比中獲得優(yōu)秀名次,地震臺采集的地震數(shù),以及地震波形分析科學(xué)性,準(zhǔn)確性,都得到全國各基準(zhǔn)臺站的好評,數(shù)據(jù)來源可靠。朱德斌等(2008)做出了淺層地震勘探數(shù)據(jù)擬同步采集時差分析[1],該文對格爾木地震臺采集的地震震級在M≧5.0區(qū)域的地震走時進行細(xì)心觀察與分析下,利用SPSS統(tǒng)計軟件方便快捷地得出該地震臺采集的地震波理論走時與實際走時的時差與震中距、方位角的回歸模型,以及相關(guān)系數(shù)分析。
1數(shù)據(jù)來源與定性變量的量化分析
本文數(shù)據(jù)來源于格爾木地震臺從2003年至2013年11年間的大地震的地震波形分析走時,利用地震分析數(shù)據(jù)軟件MSDP與全球地震發(fā)生地的地震三要素的實際波形走時資料。進行多元回歸分析,研究該地震臺采集的地震波理論走時與實際走時的時差與震中距、方位角的變量之間的數(shù)學(xué)回歸模型。諸影響因素中,時差△(y)、震源深度H(x1)、震中距d(x2)、方位角 (x3),時差的產(chǎn)生在地震數(shù)據(jù)分析中是隨著地質(zhì)結(jié)構(gòu)而產(chǎn)生的,朱德兵,平立姣等淺層地震勘探數(shù)據(jù)擬同步采集時差分析與實踐中對時差的界定很清楚(2008)理想的地震勘探數(shù)據(jù)采集與實際采集到的時刻的差值,就形成了時差,造成時差產(chǎn)生的因素很多,本文以比較顯著地地震信息數(shù)據(jù)予以探究,本文理論計算的走時表是J—B走時表。J—B走時表是全球范圍內(nèi)的平均走時表,臺站所在地區(qū)地殼和上地幔結(jié)構(gòu)同J—B模型的差異,必然要反應(yīng)到臺站觀測到的真實走時與J—B走時之間的差異上來。數(shù)據(jù)源信息統(tǒng)計(見表1)。
表1中反映數(shù)據(jù)集中地樣本總量為1608個,時差△的平均值為2.311s;深度h的平均值為52.682Km; 震中距d的平均值為50.861 Km; 方位角θ的平均值為8601.02(方位角轉(zhuǎn)化為弧度制)。
2正態(tài)性檢驗及異常值判斷
2.1異常值診斷
采用SPSS軟件中地數(shù)據(jù)里的標(biāo)識異常個案統(tǒng)計得出:變量中方位角有四組異常值,有效值的采用率達(dá)到99.8%;震中距有26組異常值,有效值得采用率達(dá)到98.4%;震源深度有50組異常值,有效值采用率達(dá)到97.9%。整體來說數(shù)據(jù)采用價值很高。
2.2相關(guān)性分析
回歸統(tǒng)計表(見表2)中顯示的是回歸模型統(tǒng)計量:R是相關(guān)系數(shù);R Square是相關(guān)系數(shù)的平方,又稱判定系數(shù),判定線性回歸的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例);djusted R Square調(diào)整后的判定系數(shù);結(jié)合SPSS軟件處理數(shù)據(jù)分析結(jié)果顯示(見表3):sig(單側(cè))表示顯著性水平,在0.005水平下,顯著相關(guān),(因為0.000<0.05)并且呈現(xiàn)出明顯的“正相關(guān)關(guān)系”;深度h顯著水平值為0.348〉0.05,顯著水平為不明顯。 pearson相關(guān)系數(shù)采用的是“參數(shù)統(tǒng)計方法”。
結(jié)果分析:(1)從相關(guān)性的表格中可以看出:在0.05水平下,顯著相關(guān),(因為0.000<0.05)并且呈現(xiàn)出明顯的“正相關(guān)關(guān)系”;(2)從相關(guān)系數(shù)表中可以得出:震中距d,方位角 兩種方式都呈現(xiàn)出相關(guān)性,綜合以上兩種不同方法的分析的得到,①不同的方法得出的相關(guān)系數(shù)值也不同,深度h分別為:0.010、1.000;震中距d分別為:-0.117、0.121;方位角 分別為0.158、0.095.這些都對應(yīng)分別代表了相關(guān)強弱。②不同的方法都能檢測出顯著水平比較明顯的是震中距d,方位角 。
通過上述分析該文研究實例符合線性回歸的條件,考慮到所選取的自變量之間的多重共線性,以下分別采用不同的方法對比選取自變量進行線性回歸分析,并確定回歸數(shù)學(xué)模型。
3回歸分析的三種方法的對比的實例分析應(yīng)用
3.1分析回歸分析的條件
3.1.1擬合程度的測定
與一元線性回歸中可決系數(shù)r2相對應(yīng),多元線性回歸中也有多重可決系數(shù)R2,它是在因變量的總變化中,由回歸方程解釋的變動(回歸平方和)所占的比重,R2越大,回歸方程對樣本數(shù)據(jù)點擬合的程度越強,所有自變量與因變量的關(guān)系越密切。
3.1.2估計標(biāo)準(zhǔn)誤差
3.1.3回歸方程的顯著性檢驗
回歸方程的顯著性檢驗,即檢驗整個回歸方程的顯著性,或者說評價所有自變量與因變量的線性關(guān)系是否密切。
3.2逐步回歸分析法的研究應(yīng)用
采用逐步回歸分析法,將變量一個一個的輸入,每輸入一個自變量,會對已輸入的變量進行逐個檢驗,當(dāng)原輸入的變量由于后面變量引入而改變得不再顯著時,則將其刪除。輸入(已刪除)變量應(yīng)按照偏F檢驗值得最大(或最?。﹥?yōu)先被輸入的原則,知道既無顯著變量被輸入,又無不顯著地變量被刪除為止。在逐步回歸的過程中,發(fā)現(xiàn)有強影響點,SPSS軟件自動將原數(shù)據(jù)表中的不顯著的影響因素(震源深度h自變量),逐條刪除后,繼續(xù)用逐步法做回歸分析,得到修正后的回歸模型。
在此以逐步回歸分析法為例來通過圖型分析正態(tài)性檢驗:P-P概率圖,根據(jù)時差的累計概率對應(yīng)于正態(tài)分布累計概率繪制的散點圖,從圖形上看,代表樣本數(shù)據(jù)的點成對角線分布(見圖1),另外仔細(xì)觀察趨勢頻率直方圖(見圖2),即按正態(tài)分布計算的理論值和實際值之差的分布情況的分布?xì)埐顖D,數(shù)據(jù)點除幾個異常值外,故時差服從正態(tài)分布。
時差數(shù)據(jù)分布的回歸標(biāo)準(zhǔn)化預(yù)計值與指定正態(tài)分布的實際數(shù)據(jù)之間的散點圖(見圖3),同樣可以直觀的看出時差服從正態(tài)分布。
3.3前進法回歸分析的應(yīng)用
利用前進法,按照F檢驗值最大優(yōu)先進入的原則,讓自變量逐個進入回歸模型,并接受檢驗。考慮到強影響點,為此下面在刪除部分強影響點后繼續(xù)用前進法進行回歸分析,逐步刪除強影響點后,得到修正的回歸模型。
4比較研究結(jié)果
對比上述3 種回歸法研究結(jié)果,前進法、后退法、逐步回歸法確定的模型調(diào)整相關(guān)系數(shù)分別為R2adj=0.071,0.071,0.071,在用樣本量和模型中自變量的個數(shù)進行調(diào)整后,在RI 用量的變差中,可由模型中自變量解釋的比例依次增加;從三種方法的模型2中地結(jié)果都一致,但回歸系數(shù)不同,相關(guān)系數(shù)較低;根據(jù)AIC 準(zhǔn)則選擇變量結(jié)果與3.2節(jié)模型保持一致. 因此逐步回歸法綜合了前進法和后退法的特點,更好地突出了對因變量時差△的重要影響因素.
參考文獻
[1]朱德兵,平立姣,朱自強.淺層地震勘探數(shù)據(jù)擬同步采集時差分析與實踐[J].地球物理學(xué)進展,2008,23(6)1958-1962
[2]薛峰,趙永,等. 1998.中國地震速報臺網(wǎng)走時殘差分析與走時修改[J].地震地磁觀測與研究,19(4):48-54.
[3]賈素娟. 1983.用P波走時殘差研究深部結(jié)構(gòu)[J].山西地震,1:17-22.
[4]張文彤.SPSS統(tǒng)計分析高級教程[M].北京:高等教育出版社,2004,91-116,213-289.
[5]梅長林,范金城.數(shù)據(jù)分析方法 [M].北京:高等教育出版社,2008,38-113.