謝鵬飛 王文杰 田昊放 陳麗娟
摘 要:近年來,我國ATM保有量持續(xù)攀升,ATM市場發(fā)展迅猛。為了全面的分析ATM交易狀態(tài)特征,本文通過提取出特征參數(shù),為設計出準確度高、適應性強的交易狀態(tài)異常檢測方案做了相關鋪墊。依據(jù)拉依達準則剔除異常數(shù)據(jù),并分析SPSS軟件對業(yè)務量、交易成功率和交易響應時間之間的相關性分析結果,確定了各指標之間的相關性。使用雙次N值比較法,以交易成功率的平均值y和方差σ2作為交易成功率特征參數(shù)。
關鍵詞:特征參數(shù) ATM市場 雙次N值比較
中圖分類號:F069 文獻標識碼:A 文章編號:2096-0298(2018)08(c)-180-02
在互聯(lián)網(wǎng)金融浪潮下,ATM市場尋找增長動力的同時,也要注重“質”的提升。通過對ATM交易狀態(tài)的特征分析與異常檢測,不僅可以捕捉ATM應用系統(tǒng)的運行情況,提高ATM的服務水平和服務質量,而且可以及時發(fā)現(xiàn)和處理交易系統(tǒng)的異常情況,為ATM市場的發(fā)展保駕護航、提供動力。
1 異常數(shù)據(jù)的剔除
首先,使用Matlab軟件繪制業(yè)務量—交易成功率—交易響應時間散點圖,通過圖1觀察,初步確定數(shù)據(jù)中存在異常點。為了減小后續(xù)計算過程中的誤差,因此采用拉依達準則剔除異常數(shù)據(jù)。
已知業(yè)務量的變化存在以下特征:工作日和非工作日的業(yè)務量存在差別;一天內,業(yè)務量也存在業(yè)務低谷時間段和正常業(yè)務時間段。因此在剔除異常數(shù)據(jù)時,不以業(yè)務量為主要指標進行剔除操作,而是針對成功率和響應時間這兩個指標,采用拉依達準則剔除異常數(shù)據(jù)。拉依達準則,即3倍標準偏差法。當某一測量數(shù)據(jù)與其測量結果的算術平均值之差大于3倍標準偏差時,該測量數(shù)據(jù)應舍棄,用公式表示為:
在剔除異常數(shù)據(jù)前,響應時間的平均值為100.7657,標準差601.4808;成功率的平均值為0.9586,標準差為0.0276。在剔除異常數(shù)據(jù)后,響應時間的平均值為91.5838,標準差為14.8084;成功率的平均值為0.9605,標準差為0.0199。經(jīng)過剔除異常數(shù)據(jù)的操作,響應時間的標準差由601.4808降低至14.8084,成功率的標準差由0.0276降低至0.0199,響應時間、成功率標準差的降低說明波動大的異常變量已被剔除,由此可以確定拉依達準則有效地剔除了異常數(shù)據(jù)。
在剔除異常數(shù)據(jù)后,使用Matlab軟件繪制業(yè)務量—交易成功率—交易響應時間散點圖,圖2可以直觀的發(fā)現(xiàn)波動較大的異常變量已被剔除。因此,進一步確定,通過拉依達準則,有效地剔除了異常數(shù)據(jù)。
2 相關性分析
為了分析三個指標之間的相關性,本文使用SPSS軟件對數(shù)據(jù)進行了相關性分析,得到業(yè)務量—交易成功率—交易響應時間相關性分析結果,如表1所示。
根據(jù)業(yè)務量—交易成功率—交易響應時間相關性分析結果,成功率與業(yè)務量的顯著性概率為0.276,大于顯著水平,相關性不顯著;相關系數(shù)為-0.010,則成功率與業(yè)務量基本不相關。成功率與響應時間的顯著性概率為0.035,小于顯著水平,相關性顯著;相關系數(shù)為-0.019,相關程度弱,則成功率與響應時間基本不相關。業(yè)務量與響應時間的顯著性概率為0,小于顯著水平,相關性顯著;相對系數(shù)為-0.588,則業(yè)務量與響應時間負相關,相關程度為中度相關。
基于相關性的分析,得出如下結論:成功率與業(yè)務量基本不相關,成功率與響應時間基本不相關,業(yè)務量與響應時間負相關,相關程度為中度相關。
3 提取特征參數(shù)
通過分析圖3,可 以得出以下結論:在日期相同的條件下,在凌晨和深夜時分散點的離散程度高。成功率主要維持在0.95左右。因此,用方差分析法來尋找其置信區(qū)間。
此處應用方差分析法計算交易成功率與其均值的離散程度。當數(shù)據(jù)變化的絕對值超過N倍標準均方差變化閥值的數(shù)據(jù)個數(shù)達到一定標準時,說明數(shù)據(jù)存在異常。
通過觀察和分析交易成功率—日期—時間散點圖,發(fā)現(xiàn)成功率存在離散程度很高的數(shù)據(jù),因此使用雙次N值比較法。根據(jù)雙次N值比較法的需要,先進行第一次N值比較處理,在去除極端異常值之后,以交易成功率的平均值y和σ2方差作為其特征參數(shù):
4 結語
本文為了得到更準確的特征參數(shù),首先要進行數(shù)據(jù)預處理,依據(jù)拉依達準則進行異常數(shù)據(jù)的剔除。為了分析三個指標之間的相關性,使用SPSS軟件的相關性分析結果確定了三個指標之間的相關性。采用雙次N值比較法,通過第1次N值比較去除干擾后,以交易成功率的平均值y和σ2方差作為其特征參數(shù)。
參考文獻
[1] 柴洪峰.基于數(shù)據(jù)挖掘的異常交易檢測方法[J].計算機應用與軟件,2013,30(1).
[2] 孫萌.A銀行風險控制研究[D].蘇州大學,2016.