• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      聚類分析在外匯管理中的研究與應(yīng)用

      2014-04-29 00:44:03劉可
      時(shí)代金融 2014年27期
      關(guān)鍵詞:聚類分析數(shù)據(jù)挖掘

      【摘要】隨著外匯業(yè)務(wù)信息系統(tǒng)與數(shù)據(jù)采集的全面覆蓋,調(diào)研、分析、核查與檢查等工作基本依賴于系統(tǒng)數(shù)據(jù)。而面向日趨龐大且結(jié)構(gòu)更為復(fù)雜的外匯業(yè)務(wù)數(shù)據(jù),如何使用數(shù)據(jù)挖掘技術(shù)從中高效獲取潛在規(guī)律的方法研究勢(shì)在必行。本文使用數(shù)據(jù)挖掘中的聚類分析技術(shù),按安徽省轄內(nèi)銀行與地區(qū)交易額匯總數(shù)據(jù)進(jìn)行聚類實(shí)驗(yàn),并對(duì)聚類結(jié)果進(jìn)行分析,認(rèn)為將數(shù)據(jù)挖掘技術(shù)應(yīng)用在外匯業(yè)務(wù)數(shù)據(jù)是值得進(jìn)一步研究與探索的。

      【關(guān)鍵詞】數(shù)據(jù)挖掘 聚類分析 k-means

      一、引言

      隨著外匯管理數(shù)據(jù)采集和信息系統(tǒng)不斷發(fā)展與完善,其數(shù)據(jù)組織趨向豐富與合理,同時(shí)數(shù)據(jù)量也日趨龐大。大數(shù)據(jù)時(shí)代的到來,亟須數(shù)據(jù)挖掘的方法獲取潛在但未知的規(guī)律(模式),為外匯業(yè)務(wù)監(jiān)管提供新的技術(shù)手段與數(shù)據(jù)支撐。本文通過數(shù)據(jù)挖掘中經(jīng)典的聚類分析算法在外匯統(tǒng)計(jì)數(shù)據(jù)中的實(shí)踐應(yīng)用,提出劃分分類管理主體對(duì)象的一種計(jì)算方法。

      二、聚類分析簡(jiǎn)介

      聚類分析(cluster analysis)簡(jiǎn)稱聚類(cluster),是指將給定記錄的集合劃分為若干個(gè)“聚簇”,這種劃分要使同簇內(nèi)記錄相似度較大而不同簇之間的差異較大。與分類或回歸等有監(jiān)督學(xué)習(xí)方式不同,聚類的輸入對(duì)象并沒有相關(guān)聯(lián)的目標(biāo)。不同聚類算法對(duì)不同數(shù)據(jù)集合以及目標(biāo)的適用性也不同,對(duì)某應(yīng)用而言相對(duì)“最優(yōu)”的聚類是需要多種聚類算法去嘗試的,然后根據(jù)實(shí)際需要去確定最合適的算法。

      三、k-means(k-均值)算法

      k-means算法是一種基于圖形中心的算法。設(shè)輸入對(duì)象數(shù)據(jù)集D={xi|i=1,2,...,N},xi表示第i個(gè)記錄或?qū)ο?。該算法將D劃分為k個(gè)聚簇,把每個(gè)xi都?xì)w類到唯一的簇中,聚簇標(biāo)識(shí)相同的xi屬于同一個(gè)簇。關(guān)于k值即簇的數(shù)量是依據(jù)某些先驗(yàn)知識(shí)或者經(jīng)多次嘗試確定,應(yīng)是以聚類結(jié)果的實(shí)用性與有效性為依據(jù)的。聚類算法是以對(duì)象間的相似度或緊密度為出發(fā)點(diǎn)進(jìn)行聚合的,k-means默認(rèn)的緊密度衡量標(biāo)準(zhǔn)為歐幾里德距離?,F(xiàn)以集合C={cj|j=1,2,...,k}來標(biāo)識(shí)每個(gè)聚簇的數(shù)據(jù)中心,那么該算法的本質(zhì)就是要最小化如下函數(shù)[1]:

      由公式可以看出,目標(biāo)函數(shù)要使每個(gè)xi與距離其最近的簇中心cj之間歐氏距離的平方和最小,算法簡(jiǎn)略描述如下[2]:從數(shù)據(jù)集D中隨機(jī)選取k個(gè)數(shù)據(jù)點(diǎn)作為初始集合C;將D中每個(gè)xi重新劃分到與其最近的ci代表簇中,更新其聚簇標(biāo)識(shí)mi(m為聚簇標(biāo)識(shí)向量);更新聚簇均值向量C;直到目標(biāo)函數(shù)Cost值收斂,否則轉(zhuǎn)向第二步。

      四、實(shí)驗(yàn)結(jié)果與分析

      分別以2014年6月安徽省跨境收支按銀行和地區(qū)匯總結(jié)果為實(shí)驗(yàn)數(shù)據(jù)對(duì)象,使用聚類分析工具為spss clementine。將EXCEL數(shù)據(jù)導(dǎo)入至clementine,k取值為3。聚類結(jié)果如表1和表2所示,其中“距離”列標(biāo)識(shí)該記錄數(shù)據(jù)點(diǎn)距該簇最終均值位置的歐幾里得距離。

      從聚類結(jié)果可以看出表1中,A獨(dú)立為1簇,另5家業(yè)務(wù)量較大分行為1簇,其余18家銀行為1簇;表2中,A市為1簇,B市、G市外匯業(yè)務(wù)量較大為1簇,其余13個(gè)地市為一簇。所得結(jié)論與按業(yè)務(wù)量經(jīng)驗(yàn)劃分結(jié)果基本相符(實(shí)驗(yàn)數(shù)據(jù)來源為真實(shí)交易業(yè)務(wù)發(fā)生數(shù)據(jù),統(tǒng)計(jì)表格隱去真實(shí)銀行名稱、地市名稱和交易額數(shù)字)。

      表1 按銀行收支聚類結(jié)果

      表2 按地區(qū)收支聚類結(jié)果

      當(dāng)決策者或外匯業(yè)務(wù)相關(guān)主管部門需要根據(jù)各地區(qū)或各金融機(jī)構(gòu)的外匯業(yè)務(wù)規(guī)模、特性或其他屬性為其制定執(zhí)行不同的政策,首先要做的就是將這些機(jī)構(gòu)或地區(qū)進(jìn)行分類。傳統(tǒng)做法是根據(jù)須納入考量的因子加權(quán)后進(jìn)行排序,然后依據(jù)直觀結(jié)果或主觀經(jīng)驗(yàn)判斷各類型的邊界。此種方式存在三個(gè)主要問題,一是如果需要考量的屬性或因子太多,無法通過線性計(jì)算簡(jiǎn)單表達(dá),難以確定歸類“順序”。事實(shí)上,多維空間問題用簡(jiǎn)單的線性方法解決本身也是不科學(xué)的。二是類與類之間的邊界難以劃定,如果邊界對(duì)象與相鄰兩類較為接近,那么究竟將其劃入哪一類呢?三是分類的個(gè)數(shù)如何確定。如計(jì)劃執(zhí)行階梯型政策時(shí),如何科學(xué)的確定階梯層級(jí)數(shù)量?聚類分析可以較好的解決以上問題:從前文算法可知聚類中記錄xi之間的相似性或距離計(jì)算本身就是基于多維空間的;其計(jì)算結(jié)果是能夠精確表達(dá)多維空間的數(shù)據(jù)點(diǎn)之間距離遠(yuǎn)或近的;可以通過不同k值的嘗試獲得較“理想”的聚簇,即要使得簇內(nèi)相似度高而簇間差異大。由此可見聚類分析能夠較好的解決以上三個(gè)問題。

      五、總結(jié)

      隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)挖掘技術(shù)日益受到社會(huì)各行業(yè)的重視并逐漸得到廣泛應(yīng)用。經(jīng)濟(jì)的連續(xù)高速發(fā)展和國(guó)家開放度的提升,使外匯業(yè)務(wù)數(shù)據(jù)飛速增長(zhǎng)。在外匯核查、檢查、分析和調(diào)研等工作中,傳統(tǒng)的工作與研究方法對(duì)大數(shù)據(jù)潛在的規(guī)律和線索的發(fā)現(xiàn)尚無更新的手段可用。加強(qiáng)數(shù)據(jù)挖掘技術(shù)在外匯管理業(yè)務(wù)數(shù)據(jù)中的研究、探索與應(yīng)用,將會(huì)豐富形勢(shì)分析和外匯監(jiān)管手段,發(fā)掘外匯業(yè)務(wù)數(shù)據(jù)的潛在價(jià)值,為外匯管理政策的制定與執(zhí)行提供科學(xué)的數(shù)據(jù)支持依據(jù)[3]。

      參考文獻(xiàn)

      [1](美)吳信東(Xindong Wu),(美)庫(kù)馬爾(Vipin Kumar)編著,李文波,吳素研譯.《數(shù)據(jù)挖掘十大算法》[m].清華大學(xué)出版社,2013.5,19-20.

      [2](美)韓家煒(Han,J.)等著,范明等譯著.《數(shù)據(jù)挖掘:概念與技術(shù)》[m].機(jī)械工業(yè)出版社,2012.7,293.

      [3]邢江澤,陸秉煒,劉可,李興勇.數(shù)據(jù)挖掘在外匯管理中的應(yīng)用——基于聚類和關(guān)聯(lián)分析的實(shí)踐[J].中國(guó)外匯蘇皖專刊.2009,14-15.

      猜你喜歡
      聚類分析數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      基于聚類分析研究貴州省各地區(qū)經(jīng)濟(jì)發(fā)展綜合評(píng)價(jià)
      商情(2016年39期)2016-11-21 08:45:54
      新媒體用戶行為模式分析
      農(nóng)村居民家庭人均生活消費(fèi)支出分析
      基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
      基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
      科技視界(2016年20期)2016-09-29 12:32:48
      “縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      长春市| 吴桥县| 屏山县| 阳东县| 江陵县| 汉川市| 合川市| 连江县| 长治县| 灵石县| 墨脱县| 曲阳县| 垣曲县| 霍山县| 南和县| 招远市| 阿瓦提县| 平凉市| 鄂伦春自治旗| 新巴尔虎右旗| 曲阜市| 南丰县| 哈尔滨市| 阳新县| 南江县| 南澳县| 台山市| 上思县| 太谷县| 兖州市| 萨嘎县| 府谷县| 万载县| 铜陵市| 府谷县| 三门县| 卓尼县| 元阳县| 武川县| 芦溪县| 米易县|