• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于決策樹技術的農(nóng)戶小額貸款客戶信用評價研究

      2019-12-16 01:48:12尹水軍
      電腦知識與技術 2019年29期
      關鍵詞:小額貸款結點決策樹

      尹水軍

      摘要:本文研究決策樹分類算法lD3算法、C4.5算法和C5.0算法的基礎上,通過比較決策樹幾種分類算法優(yōu)劣,選擇決策樹C5.0算法作為本文模型建立方法,并以某市農(nóng)村商業(yè)銀行農(nóng)戶小額貸款數(shù)據(jù)信息作為數(shù)據(jù)源,利用SPSS Clemen—tinel2.0開發(fā)環(huán)境建立了決策樹分類模型,建立農(nóng)戶小額貸款客戶信用評價的決策樹模型,并以此幫助農(nóng)村商業(yè)銀行對農(nóng)戶信用進行評價,并作為貸款與否的依據(jù)。

      關鍵詞:決策樹;C5.0 算法;農(nóng)戶小額貸款;信用評價

      中圖分類號:G642文獻標識碼:A

      文章編號:1009-3044(2019)29-0259-04

      1概述

      決策樹是一顆判定樹,其內(nèi)部結點代表屬性判定,分支結點代表測試結果,葉子節(jié)點就代表一個判定類別。決策樹根結點信息量最大,樹的中間結點是子樹中信息量最大的屬性,決策樹的葉子結點是樣本的類別值。決策樹的構建是一種自上而下的歸納過程。從根結點開始,對每個非葉子結點,找出其樣本集中的一個屬性對樣本集進行測試。根據(jù)測試結果將樣本集劃分成子樣本集,子樣本集構成新葉子結點。對新葉子結點再重復上述過程,直至達到終止條件。構建決策樹的關鍵環(huán)節(jié)是測試屬性的選擇和樣本集的劃分。構建決策樹后可對一個新數(shù)據(jù)對象進行分析,從而判定出新數(shù)據(jù)對象的分類或取值。

      決策樹的歸納學習是以樣本集為基礎的,它是從一組無序樣本集中形成分類規(guī)則。它采用遞歸方式,其內(nèi)部結點進行屬性值的比較,根據(jù)判定并得到向下分支。最終得到判定結論。得出分類模型后,取一級已知類別的數(shù)據(jù)作為測試集,用測試集對分類模型進行測試,以驗證其分類判定的正確性。決策樹的生成過程可表示為如圖1所示,從圖中可知決策樹的生成過程是一種歸納一測試一演繹過程。由訓練集得到?jīng)Q策樹分類模型的過程稱歸納一過程,用測試集對分類模型進行測試稱為測試過程,再由分類模型對新數(shù)據(jù)進行分類的過程稱為演繹過程。

      2ID3算法

      ID3算法是一種基于信息熵的由Quinlan提出的決策樹分類算法,其選擇測試屬性的依據(jù)是信息熵的下降速度,屬性集的取值確定其類別。在構造決策樹時,ID3算法屬性選取的標準是信息增益,決策結點即為信息增益最大的屬性,并由其建立分支,再遞歸調(diào)用該方法建立決策樹結點的子分支,直至僅包含同一類別的數(shù)據(jù)為止。

      5農(nóng)村商業(yè)銀行農(nóng)戶小額貸款分類模型實證研究

      5.1實證背景

      農(nóng)戶小額貸款作為金融服務的新品種,自推出以來,就受到了廣大農(nóng)民的歡迎,這一新的支農(nóng)金融政策為支持農(nóng)村經(jīng)濟發(fā)展發(fā)揮了積極的作用。然而農(nóng)戶小額信用貸款向農(nóng)戶發(fā)放的無抵押擔保的貸款,是農(nóng)村商業(yè)銀行的一種創(chuàng)新產(chǎn)品。因為農(nóng)戶小額貸款對象經(jīng)營的是一受自然災害的制約因素較多的產(chǎn)業(yè),導致各類逃債的現(xiàn)象極為頻繁,不良貸款比率遠遠高于其他商業(yè)貸款,嚴重損害了農(nóng)村商業(yè)銀行的利益。因此,農(nóng)村商業(yè)銀行業(yè)面臨的緊迫問題是建立一個信用風險評估模型,以降低農(nóng)村商業(yè)銀行的信貸風險。將決策樹技術應用于信用評估模型,能在一定程度上解決農(nóng)村商業(yè)銀行所面臨的信貸風險問題。本文以某市農(nóng)村商業(yè)銀行農(nóng)戶小額貸款數(shù)據(jù)信息作為數(shù)據(jù)源,利用決策樹分類模型C5.0對農(nóng)戶信用進行評價,并作為貸款與否的依據(jù)。

      5.2商業(yè)理解

      在實施決策樹分類前,要充分理解項目的商業(yè)目標。如果不能完全理解項目的商業(yè)目標,挖掘模型很難符合要求。在項目進行需求分析之后才能進行項目實施,以此確定系統(tǒng)的目標。決策樹挖掘模型能將重要信息從海量數(shù)據(jù)中挖掘出來,以形成有用的規(guī)劃,且這些重要信息人們很難通過觀察直接得到,我們可以利用形成的規(guī)則來確定信用等級。本文以農(nóng)戶小額貸款相關數(shù)據(jù)信息作為測試對象,運用決策樹模型形成的規(guī)則幫助農(nóng)村商業(yè)銀行進行信用評估,分析出農(nóng)戶哪些因素能確定農(nóng)戶信用等級,并用決策樹的形式顯示其相關程度,為農(nóng)村商業(yè)銀行發(fā)放小額貸款提供參考依據(jù)。

      5.3數(shù)據(jù)準備

      數(shù)據(jù)準備是決策樹分類過程中一個重要環(huán)節(jié),數(shù)據(jù)準備階段工作量巨大。要對某一項目建立決策樹分類模型,必須有明確的數(shù)據(jù)樣本,因此,準備數(shù)據(jù)就成為決策樹分類過程中的非常關鍵的一個過程。本文的數(shù)據(jù)信息主要來自某市農(nóng)村商業(yè)銀行2018年貸款農(nóng)戶的基本數(shù)據(jù)信息,考慮到運用決策樹分類技術是為了發(fā)現(xiàn)規(guī)律,作為農(nóng)戶借款的依據(jù),我們只選取了與農(nóng)戶信用評價關系較為密切的信息。我們總共選取采集了600份農(nóng)戶信息,其中300份農(nóng)戶信息作為訓練數(shù)據(jù)集。另外300份農(nóng)戶信息作為測試數(shù)據(jù)集。

      5.4數(shù)據(jù)預處理

      數(shù)據(jù)預處理的目的是得到完整的、含噪聲相對較少的、基本一致的數(shù)據(jù)。本文的農(nóng)戶數(shù)據(jù)信息雖然都來自某農(nóng)村商業(yè)銀行網(wǎng)點,但由于農(nóng)戶辦理小額貸款全部分散到全市所有的營業(yè)網(wǎng)點,其數(shù)據(jù)的填寫并非完全一致,將其整理成為一個數(shù)據(jù)庫,有很多與本研究主題無關的信息需要將其摒棄,有的數(shù)據(jù)還需要進行離散化處理。

      (1)數(shù)據(jù)變換。在農(nóng)戶信息數(shù)據(jù)庫中,保存著農(nóng)戶基本信息,其中有很大一部分是與此次挖掘任務無關的信息,如果用全部數(shù)據(jù)進行挖掘,就會使此次挖掘變得毫無意義。本文中的農(nóng)戶數(shù)據(jù)信息來自不同的營業(yè)網(wǎng)點,部分數(shù)據(jù)缺失且不規(guī)范,將來這些來自多數(shù)據(jù)源的數(shù)據(jù)按統(tǒng)一格式組合、連接到一起,將部分不規(guī)范的數(shù)據(jù)屬性作規(guī)范化變換。例如。本次挖掘模型中,為方便運用挖掘模型,將家庭收入來源分為三類,包括純種植業(yè)收入、種植業(yè)和畜牧業(yè)、種植業(yè)、畜牧業(yè)及其他混合。

      (2)數(shù)據(jù)清洗。采集來的數(shù)據(jù)中有些是與個人信用風險評估無關的數(shù)據(jù),在數(shù)據(jù)模型建立前必須將其清除,否則將會影響建模效果。本次采集的數(shù)據(jù)中。由于源數(shù)據(jù)庫包含的個人客戶信息很多,有些信息與個人信用評估基本沒有關系,如農(nóng)戶姓名、農(nóng)戶身份證號碼、農(nóng)戶住址、電話號碼、合同編號、合同簽訂日期、貸款調(diào)查人、貸后管理人員等,為簡單起見,直接從數(shù)據(jù)庫中刪除。

      (3)噪聲處理。在最終形成的農(nóng)戶信息數(shù)據(jù)庫中,有一些數(shù)據(jù)明顯偏離預期挖掘目標、不符合建模要求、空缺值多、有誤差等數(shù)據(jù)進行清洗或修正,最終得到比較整齊的、干凈的、可以用作數(shù)據(jù)處理和模型開發(fā)的數(shù)據(jù)樣本。

      此次采集到的數(shù)據(jù),通過多次使用上述方法進行數(shù)據(jù)預處理,從農(nóng)戶小額貸款處理數(shù)據(jù)集形成一個適合數(shù)據(jù)挖掘任務的數(shù)據(jù)集,這個集合共有600條記錄,每條記錄由9個字段組成,分別為:農(nóng)戶年齡、婚姻狀況、供養(yǎng)人數(shù)、家庭年平均收入、月還款收入比、家庭收入來源、貸款用途、貸款數(shù)額以及信用記錄。

      5.5基于C5.0算法的數(shù)據(jù)挖掘模型的構造

      將決策樹預測應用于農(nóng)村商業(yè)銀行農(nóng)戶貸款信用評價問題中,基本思路是:根據(jù)已知的樣本與原始信用評價狀態(tài),運用決策樹發(fā)現(xiàn)貸款人信用狀態(tài)與其某些特征屬性之間的關系,使得能夠通過對農(nóng)戶這些屬性的具體觀察值,對貸款人的信用情況進行預測。

      本文采用SPSS Clementine12.0數(shù)據(jù)挖掘分析工具設計數(shù)據(jù)挖掘流,得出挖掘結果并進行針對主題的分析,根據(jù)需求所建立的數(shù)據(jù)挖掘模型如圖2所示。

      5.6挖掘模型執(zhí)行結果分析

      由于挖掘模型選擇月還款收入百分比作為根結點,所以能夠得出的結論是:農(nóng)村商業(yè)銀行要對農(nóng)戶進行貸款前的評估,農(nóng)戶的月還款與收入的比值與農(nóng)戶的評估等級關系最為密切,其次是家庭收人來源,這兩項對評估農(nóng)戶的信用等級最為重要,再是家庭平均收入和貸款數(shù)額,這兩項也與評估農(nóng)戶的信用等級關系較為密切。此外,婚姻狀況、信用記錄、供養(yǎng)人數(shù)、貸款用途也與評估農(nóng)戶信用等級存在一定的關系。農(nóng)戶年齡雖然與評估農(nóng)戶的信用等級相關,但相關度還是非常弱的。通過用決策樹C5.0算法對農(nóng)戶信息數(shù)據(jù)庫的實證分析,筆者認為農(nóng)村商業(yè)銀行對農(nóng)戶進行貸款,不應重點關注貸款數(shù)額的多少,更應該注重農(nóng)戶的還款能力,而且應重點關注農(nóng)戶的家庭收入來源。

      對上面的分析結果,也可以用圖表形式瀏覽挖掘模型,當選擇數(shù)據(jù)模型頁面中的Viewer頁面后,得到一個瀏覽窗口,該瀏覽窗口是用一個形象的樹來描述模型,且能清晰地看到各個結點中客戶信用評級情況,如圖3所示。

      5.7C5.0模型準確度分析

      前面用C5.0決策樹模型分析農(nóng)戶信用評估信息后,利用訓練集的數(shù)據(jù)來檢驗此模型的準確程度,執(zhí)行測試集的數(shù)據(jù)流的分析結果如圖4所示。

      從C5.0模型準確度分析圖可以看出,用C5.0算法對農(nóng)戶訓練數(shù)據(jù)集進行測試后,此模型的準確率為86%,數(shù)據(jù)總數(shù)為300個,錯誤率為14%。從準確率來看,用此模型對農(nóng)戶數(shù)據(jù)信息進行分析的結果具有一定的參考價值。但不意味著具有這些特征的農(nóng)戶都只要放心貸款,因為此模型的錯誤率為14%,略為偏高,分析其原因可能是本次挖掘所得到的數(shù)據(jù)并不全面,或是農(nóng)戶數(shù)據(jù)信息過少引起的,或者是所選擇的數(shù)據(jù)中還有一部分數(shù)據(jù)也具有一定的噪聲。因此,在數(shù)據(jù)挖掘中,應該選擇農(nóng)戶數(shù)據(jù)信息足夠多,且必須花大量工作來進行數(shù)據(jù)預處理,這樣才能為農(nóng)村商業(yè)銀行提供有真正意義的貸款依據(jù)。

      6結束語

      農(nóng)戶小額貸款是面向農(nóng)村的金融服務的新品種,是國家高度重視“三農(nóng)”問題的真實體現(xiàn)。如何充分地利用農(nóng)戶信息,把數(shù)據(jù)挖掘技術應用到小額貸款業(yè)務是當前農(nóng)村商業(yè)銀行面臨的一個非常重要的現(xiàn)實問題,通過建立新的評價模型輔助信貸管理人員進行決策與分析,真正地做到對農(nóng)戶進行客觀的評價,從而達到加強信貸能力減少不良貸款產(chǎn)生的目的。

      猜你喜歡
      小額貸款結點決策樹
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      加強小額貸款企業(yè)風險管理與防范探討
      活力(2019年22期)2019-03-16 12:47:12
      決策樹和隨機森林方法在管理決策中的應用
      電子制作(2018年16期)2018-09-26 03:27:06
      Ladyzhenskaya流體力學方程組的確定模與確定結點個數(shù)估計
      基于決策樹的出租車乘客出行目的識別
      基于肺癌CT的決策樹模型在肺癌診斷中的應用
      山東:首次表彰小額貸款先進 累計發(fā)放貸款471.16億元
      商戶小額貸款信用評價模型
      基于Raspberry PI為結點的天氣云測量網(wǎng)絡實現(xiàn)
      河北省小額貸款公司發(fā)展情況表
      洛浦县| 田林县| 姜堰市| 江源县| 鹤山市| 皋兰县| 洪湖市| 玉溪市| 金堂县| 阳西县| 沙湾县| 台江县| 云阳县| 辽阳市| 哈尔滨市| 西华县| 黄平县| 靖安县| 鱼台县| 孙吴县| 临桂县| 镇康县| 鸡西市| 达日县| 孝义市| 胶州市| 米泉市| 花垣县| 襄汾县| 巨鹿县| 观塘区| 凤山县| 弥渡县| 永泰县| 山阳县| 禹州市| 汕头市| 中超| 行唐县| 富锦市| 常德市|