趙 卿,周興東
減弱觀測誤差對回歸模型的影響研究
趙 卿1,2,周興東1
(1.江蘇師范大學測繪學院,江蘇徐州 221116;2.江西省數(shù)字國土重點實驗室,江西撫州 344000)
對變形監(jiān)測序列進行數(shù)據建模分析時,含有誤差的監(jiān)測數(shù)據會對模型的建立產生較大的影響。提出一種“事件”模型改變原始觀測序列的表達形式,通過對原始觀測數(shù)據進行轉換,對變形監(jiān)測數(shù)據按照某種規(guī)則進行分類劃分,劃分后的數(shù)據能夠適應Cox模型。根據經驗或者實際情況,適當調節(jié)“事件”模型參數(shù),在一定程度上可以減弱觀測誤差帶給Cox回歸模型的影響,算例分析進一步論證了該模型計算結果的準確度能夠進一步地提高計算結果的準確度。
觀測誤差;變形監(jiān)測;事件模型;Cox回歸模型
變形監(jiān)測對觀測精度有很高的要求,而監(jiān)測過程中不可避免受到外界條件干擾(如水汽等)而帶來觀測誤差,通過平差的方法可以消除每期觀測結果含有的偶然誤差,但是在整個監(jiān)測時期內,監(jiān)測點的觀測序列中含有的誤差仍然無法消除[1-2],而且較大的誤差會對后續(xù)建模分析產生很大影響[3];實際監(jiān)測工作中,小波變換進行消噪是目前處理含有噪聲信息的監(jiān)測序列較為常用的辦法[3]。該方法對減弱誤差對觀測序列的影響,具有很好的效果[4]。本文提出一種“事件”模型來變換監(jiān)測序列,通過調節(jié)模型參數(shù),可以減弱觀測誤差對數(shù)據分析結果的影響,應用Cox回歸模型計算[5-6]得到對變形數(shù)據分析的新方法。
建立“事件”模型的假設為:上次“事件”的發(fā)生對下一次“事件”的發(fā)生遲早會產生很大影響[5,7]。在變形監(jiān)測數(shù)據分析過程中,監(jiān)測點在某時刻的變形信息,在一定程度上要受到前一時期內變形結果的影響?;诖思僭O,在變形監(jiān)測數(shù)據分析中,對監(jiān)測資料中的位移量建立如下“事件”模型。
(1)設監(jiān)測資料中第i監(jiān)測點在監(jiān)測時刻j的位移量數(shù)據為δij(i=1,2,…,n;j=1,2,…,m),計算該監(jiān)測點在相鄰觀測時刻間的平均位移速率vij(i=1,2,…,n;j=1,2,…,m-1),并以矩陣的形式表達,即
式中,Vi(i=1,2,…,n)表示第i個監(jiān)測點的位移序列。
(2)根據監(jiān)測資料中各個監(jiān)測點的平均位移速率vij(i=1,2,…,n;j=1,2,…,m-1),計算該監(jiān)測資料的位移速率閾值
或者憑多年觀測經驗,給定一個位移速率的閾值v0,定義“監(jiān)測點位移速率vij和給定閾值v0的比較結果”為“事件”,用eij(i=1,2,…,n;j=1,2,…,m-1)表示。
(3)對于第i個監(jiān)測點,如果滿足“vij<v0”,則稱監(jiān)測點i在時刻j為“事件未發(fā)生”狀態(tài),相應的eij=0;如果滿足“vij>v0”,則稱監(jiān)測點i在時刻j為“事件發(fā)生”狀態(tài),相應的eij=1,即,以監(jiān)測點位移速率vij與閾值v0的比較結果,決定各監(jiān)測點的“事件”狀態(tài),并把式(1)表達成“事件矩陣”其中,Ei(i=1,2,…,n)表示第i個監(jiān)測點的“事件”狀態(tài)序列。
通過上述步驟(1)—(3),可以將原始觀測數(shù)據位移δij轉化成“事件”eij,完成“事件”模型的建立。
分析“事件”模型的建立的過程,可以發(fā)現(xiàn)該模型在一定程度上可以減弱觀測誤差的影響。
變形監(jiān)測的過程,不可避免地會有各類誤差源的干擾,尤其是在觀測條件較差的環(huán)境里,致使計算得到的位移數(shù)據帶有誤差。通過適當調整位移速率的閾值v0,可以有效減弱觀測誤差的影響。
例如,由于觀測條件較差(受水汽較大等影響),第i監(jiān)測點在j時刻的Xij坐標含有誤差,設真值為為觀測值,觀測精度為σij,真誤差為εij,則
假定本期與上期觀測為等精度觀測,間隔為δtij=tij-ti,j-1,則本期的位移為
平均速率的精度為
按照常規(guī)的分析計算(如回歸分析、時間序列等方法),以位移為研究對象,可以明顯看到由于觀測誤差εij影響,致使回歸模型在此刻的輸入數(shù)據δij中含有εij-εi,j-1誤差;如果建立“事件”模型,根據需要,調整位移速率的閾值v0,使得第i監(jiān)測點在j時刻的“事件”狀態(tài)保持一致,不受原始觀測值含有的誤差之影響。例如調整閾值v0為
v0的調節(jié)范圍在,可以始終讓第i監(jiān)測點在j時刻的“事件”狀態(tài)為eij=0作為模型輸入,則可以有效減弱原始觀測誤差σ的影響。
由于各個觀測值含有的真誤差εij未知,則在調節(jié)閾值v0范圍時,參考式(7),可以取2倍于平均速率的中誤差作為調節(jié)限差;由于每個監(jiān)測時期的觀測精度σij及時間間隔δtij不同,所以調節(jié)限差εv大小,可以取
式中:
為了使調節(jié)限差的結果不至于影響所有監(jiān)測點的情況,需要嚴格控制調節(jié)限差εv大小,可以取
3.1 事件模型的建立
結合我國某大壩為例[8],取該變形體上某部位的16個監(jiān)測點數(shù)據為例,由于觀測該監(jiān)測部位的視線不得不穿過水面,致使觀測結果受水汽的影響較大,觀測數(shù)據含有大量的噪聲,如圖1所示。通過對原始觀測數(shù)據序列的擬合,計算得到16個監(jiān)測點各自在x方向的觀測精度,如圖2所示。
圖1 監(jiān)測點位移過程線Fig.1 Process of disp lacement atmonitoring points
圖2 原始觀測中誤差Fig.2 Mean square errors of the original observations
根據式(2)計算得到平均位移速率閾值v0=1.90 mm/d;由于觀測值的真誤差無法得到,故采用式(9)計算可以調整限差εv的大小。最大天數(shù)間隔為max{δtij}=14 d,根據圖2,最小原始觀測中誤差min{σij}=3.26 mm,根據式(10)得到εv=±0.66 mm/d。
為了書寫及表述方便,選取監(jiān)測點P3~P7這5個監(jiān)測點自2003年4月11日至2004年7月11日間部分數(shù)據。位移數(shù)據及平差后各監(jiān)測時刻的真誤差估計值如圖3所示。
圖3 位移過程線及各時期真誤差估計值Fig.3 Displacement process and estimated true errors in each period
在沒有受到觀測誤差影響前,根據式(3)及平均位移速率閾值v0=1.90 mm/d,得事件矩陣ME;如果考慮每個監(jiān)測時刻觀測誤差的影響,顧及式(6),其事件矩陣為M′E;根據式(10),調節(jié)εv大小,本例前面計算得到εv∈[-0.66,0.66],根據式(8)適度調整閾值v0=1.90+0.22=2.12 mm/d,據此計算事件矩陣M″E,如圖4所示。
圖4 各計算結果的狀態(tài)矩陣Fig.4 Statusmatrices in three form s
比較圖4中的3個事件矩陣可以看出,由于受到原始觀測誤差的影響(如圖3中的“Err”線所示),致使事件狀態(tài)矩陣M′E與ME有較大差異,如果按照事件狀態(tài)矩陣M′E進行分析計算(如回歸分析、時間序列等),那么計算結果會受到原始誤差很大的影響;而通過“事件”模型調節(jié)εv大小,適度調整閾值v0,得到事件矩陣M″E,可以發(fā)現(xiàn),事件矩陣M″E與ME僅存在少量差異,在進行Cox回歸模型計算時[6],分析結果受原始誤差的影響將會得到有效的控制。
3.2 Cox回歸模型計算結果
仿照圖4數(shù)據變換過程,對圖1的觀測序列計算事件狀態(tài)矩陣,分別將事件狀態(tài)矩陣的3種計算結果ME,M′E和M″E代入Cox回歸模型計算[6,9],結果如表1所示。
表1 3種不同事件矩陣的Cox回歸模型計算結果Table 1 Results calculated by Cox regression model from three different statusmatrices
從表1可以看出,由于觀測序列含有偶然誤差的影響,致使M′E矩陣代入Cox回歸模型計算得到的風險比超過ME的計算結果,而經過模型參數(shù)調節(jié)得到的M″E矩陣,其回歸模型計算結果,接近M′E矩陣的Cox模型計算結果,即調節(jié)模型參數(shù)后的事件矩陣,減弱了原始觀測數(shù)據中誤差對Cox回歸模型計算結果的影響。
結合“風險比”的解釋意義,實際上,隨著監(jiān)測時間的推移,該變形體整體的位移速率呈逐步下降的趨勢,按照M′E矩陣(即受原始數(shù)據觀測誤差的影響)的計算結果,平均約遞減92.0%;按照M″E矩陣(即調節(jié)事件模型參數(shù)后)的計算結果,平均約遞減95.8%,接近以ME矩陣(即原始數(shù)據不含有觀測誤差)為準的計算結果96.5%。
對于變形觀測工作來講,由于受觀測條件影響(如水汽較大),致使觀測結果不可避免地受到一定影響。可以建立“事件”模型對原始數(shù)據進行轉換,把原始監(jiān)測數(shù)據轉換成“事件狀態(tài)”數(shù)據,通過調節(jié)模型參數(shù)、速率閾值參數(shù)的大小,在一定程度上可以減弱觀測誤差帶給Cox加固歸模型的影響,能夠進一步提高計算結果的準確度。
[1] BONALDIP,F(xiàn)ANELLIM,GIUSEPPETTIG.Displacement Forecasting for Concrete Dams via Deterministic Mathematical Models[J].InternationalWater Power andDam Construction,1977,29(9):42-45.
[2] FANELLIM,GIUSEPPETTIG.Techniques to Evaluate Effects of Internal Temperatures in Mass Concrete[J].InternationalWater Power and Dam Construction,1975,(6):162-168.
[3] 文鴻雁,張正祿.小波分析與傅立葉變換相結合在探測周期性變形中應用[J].測繪通報,2004,(4):14-16.(WEN Hong-yan,ZHANG Zheng-lu.Detection of the Periodical Signal in the Deformation Analysis with Wavelet and Fourier Transformation[J].Bulletin of Surveying and Mapping,2004,(4):14-16.(in Chinese))
[4] 陳 剛,趙 斌,胡友健,等.無電離層延遲組合GPS數(shù)據的小波預處理方法研究[J].測繪學報,2009,38(6):477-481.(CHEN Gang,ZHAO Bin,HU Youjian,et al.Research on GPS Pre-processing Method for Ionosphere-free Combination Data Using Wavelet[J].Acta Geodaetica et Cartographica Sinica,2009,38(6):477-481.(in Chinese))
[5] PURER E,STEINER N.Application of Statistical Methods in Monitoring Dam Behavior[J].InternationalWater Power and Dam Construction,1986,(12):33-35.
[6] COX D R.Regression Models and Life Tables(with Discussion)[J].Journal of the Royal Statistical Society,Series B,1972,(34):187-220.
[7] MARUBINI E,VALSECCHIM G.Analyzing Survival Data Form Clinical Trials and Observational Studies[M].Chichester,UK:John Wiley&Sons,1994.
[8] 趙 卿.大壩變形分析多測點統(tǒng)計模型的應用研究[D].武漢:武漢大學,2010:92-100.(ZHAO Qing.Research and Application of the Multi-point Statistical Model on Dam-deformation Analysis[D].Wuhan:Wuhan University,2010:92-100.(in Chinese))
[9] 趙 卿,黃聲享.一種分析大壩整體位移變化規(guī)律的新方法[J].武漢大學學報(信息科學版),2009,12(34):1419-1422.(ZHAOQing,HUANG Sheng-xiang.A Way for Overall Analysis on Dam’s Displacement[J].Geomatics and Information Science of Wuhan University,2009,12(34):1419-1422.(in Chinese) )
(編輯:曾小漢)
Impact of Reducing Observation Errors on Regression M odel
ZHAO Qing1,2,ZHOU Xing-dong1
(1.School of Geodesy and Geomatics,Jiangsu Normal University,Xuzhou 221116,China;2.Jiangxi Provincial Key Lab for Digital Land,F(xiàn)uzhou 344000,China)
Errors of deformation monitoring data has great impact on the modeling of the data sequences.A new model called Event-Model,which changes the expression of the original observation data,was proposed.First,the deformation rate at each monitoring point in the original data was calculated,and then the rates were divided into several ranges.By converting the original observation data into events,the numerical data were divided into categorical datawhich were composed of thematrix,named EventMatrix in this paper,which could be fitted to the Cox regression model.Each group of categorical data contained certain ranges.On the basis of experiences and the actual situation such as the average displacement rate calculated previously,parameters in the“Event-Model”were adjusted to avoid or weaken the effect of observation errors.Themean square error of the observation data could be treated as adjusted parameters instead of unknown true errors in practice.The influence ofmonitoring data containing observation errors on the follow-up Cox regressionmodel can be reduced to some extent and improve the accuracy of the calculation results.
observation errors;deformation monitoring;eventmodel;Cox regression model
TV698.1
A
1001-5485(2012)12-0020-04
勘誤啟事
10.3969/j.issn.1001-5485.2012.12.005 2012,29(12):20-23
2011-10-08;
2012-02-20
江蘇師范大學博士學位教師科研支持項目(10XLR23,10XLR16);江西省數(shù)字國土重點實驗室開放研究基金資助項目(DLLJ201203)
趙 卿(1983-),男,江蘇徐州人,講師,博士,主要從事變形監(jiān)測與災害預報的研究,(電話)18752128985(電子信箱)zhaoqing7@QQ.com。
《長江科學院院報》2012年第10期《纖維混凝土在水利工程中的應用》一文中的作者單位:“b.流域水利河南省高校工程技術研究中心”應為“b.小流域水利河南省高校工程技術研究中心”(P114)。特此說明,并對該文作者致歉。