• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      自動實時按揭風(fēng)險早期預(yù)警模型的開發(fā)

      2014-05-30 01:31:35蔡哲皓
      中國外資·下半月 2014年4期
      關(guān)鍵詞:購房邏輯貸款

      蔡哲皓

      1 引言

      近年來,中國的經(jīng)濟(jì)實力迅猛增長。然而,一些基本經(jīng)濟(jì)制度仍不完善,信用體系就是非常重要的一環(huán)。有資料說,在被稱為“史上最嚴(yán)厲”的房地產(chǎn)調(diào)控中,我國溫州房價不再繼續(xù)瘋漲,部分炒房者手中的房子開始貶值,有的溫州投資者不但血本無歸,甚至還欠上巨額債務(wù),一些炒房者選擇了違約甚至“跑路”。還有文章預(yù)測,房價開始下跌,壞賬將一波一波襲來,然后進(jìn)入惡性循環(huán)。

      融機(jī)構(gòu)面對日益激烈的競爭和不斷增長的壓力,為增加收益,他們需要尋求更有效的方式來吸引新的信譽(yù)良好的客戶,并在同一時間,控制風(fēng)險和損失。

      因此,本課題的目的是開發(fā)一個自動和實時房貸風(fēng)險模型以提供拖欠的早期預(yù)警。隨著這種模式的實施,達(dá)到風(fēng)險警戒線(如拖欠可能性為50%)的賬戶將被抽出來,顯示在報告中,金融機(jī)構(gòu)可以早期采取適當(dāng)措施,防止損失。

      本模型運(yùn)用統(tǒng)計手段能夠高效準(zhǔn)確地篩查出絕大部分的違約人群,及時給貸款部門提出預(yù)警 。

      2 方法

      2.1 數(shù)據(jù)

      本文用于模型開發(fā)和驗證的數(shù)據(jù)來源為某金融機(jī)構(gòu)2005年至2010年數(shù)萬條客戶貸款數(shù)據(jù)。每年的數(shù)據(jù)包括客戶貸款申請數(shù)據(jù)和客戶表現(xiàn)數(shù)據(jù)。貸款申請數(shù)據(jù)包含的變量有信用評分,是否是首次購房者,職業(yè)狀況,貸款與價值比率,債務(wù)與收入比率,利率,貸款用途,貸款期限等。客戶表現(xiàn)數(shù)據(jù)包含的變量有貸款拖欠狀況,貸款期限,現(xiàn)行利率,等等共35個。

      另外,2005至2010年宏觀經(jīng)濟(jì)指數(shù)如GDP,失業(yè)率,居民消費(fèi)價格指數(shù),通貨膨脹指數(shù)等也用于預(yù)測拖欠。

      2.2原理

      2.2.1 邏輯回歸模型的開發(fā)原理

      邏輯回歸是一種統(tǒng)計模型,它針對因變量是二分變量(即是=1;否=0),而自變量可以是分類的或連續(xù)的,用于預(yù)測離散結(jié)果。

      本文以拖欠狀況作為因變量開發(fā)邏輯回歸模型(如果該帳戶付款已逾期超過30天,它被認(rèn)為是拖欠= 1,否則拖欠=0)。自變量包括客戶貸款申請和表現(xiàn)數(shù)據(jù)中所包含的若干變量。

      邏輯回歸模型可用下列公式表示:

      其中P值是直接的拖欠可能性(概率),1-P是不拖欠的概率。ln(P/1-P)是拖欠可能性的logit(即事件發(fā)生比的自然對數(shù))而不是直接的拖欠可能性P。 β0是常數(shù), β1到βN是回歸系數(shù),X 1到X n是自變量,即為貸款申請數(shù)據(jù)包含的自變量和客戶表現(xiàn)數(shù)據(jù)包含的變量。βN系數(shù)表示了拖欠可能性的ln(P/1-P)和自變量的線性關(guān)系,通過計算 ln( P/1-P)可推算出拖欠的概率P。 開發(fā)本預(yù)測模型所用的統(tǒng)計分析軟件是SAS 9.2版,逐步回歸添加變量分析。在這項研究中 p值(P value)< 0.05才可添加新變量。

      得到邏輯回歸模型公式后,把建模數(shù)據(jù)帶進(jìn)模型,得到結(jié)果,并將預(yù)測的拖欠可能性按順序排列并分成10組, 計算柯爾莫哥洛夫 - 斯米爾諾夫值( Kolmogorov-Smirnov簡稱KS)(KS是最常用的評估二分變量結(jié)果模型的預(yù)測能力,如好與壞,響應(yīng)與不響應(yīng),拖欠與不拖欠等。KS的范圍理論值從0到100,但一般模型的KS是20到70 ,它是累積事件發(fā)生的百分比和累積事件不發(fā)生的百分比的差的絕對值 。最大KS用來衡量模型的分離能力。KS值越高,預(yù)測能力越強(qiáng)。)。最終做出增益圖。

      2.2.2模型的驗證原理

      將驗證數(shù)據(jù)帶入建立的邏輯回歸模型,將預(yù)測的拖欠可能性按順序排列并分成10組, 計算KS值,并做出增益圖。如果驗證數(shù)據(jù)的KS接近建模數(shù)據(jù)的KS,則該模型被認(rèn)為是穩(wěn)定的。

      3 數(shù)據(jù)分析與結(jié)果

      3.1單因素分析

      3.1.1連續(xù)變量描述性統(tǒng)計

      表1 連續(xù)變量的描述性分析(2005年數(shù)據(jù))

      說明:行數(shù) - 所有數(shù)據(jù)的行數(shù) 缺失值行數(shù) - 變量值有缺失的行數(shù)。

      3.1.2分類變量描述性統(tǒng)計

      對分類變量,分析每個變量值出現(xiàn)的頻數(shù)和百分比,并總結(jié)列于表2中。

      表2 分類變量的頻率分析

      3.1.3數(shù)據(jù)清理

      要建立一個有效的模型,數(shù)據(jù)質(zhì)量是非常重要的。對于連續(xù)變量,有缺失值的數(shù)據(jù)行會被除去,根據(jù)表1的描述性統(tǒng)計,沒有異常值。缺失值因只占總數(shù)據(jù)量的2.5%則從分析數(shù)據(jù)中除去,。

      對于分類變量,因為缺失值可能代表一定的行為模式。在本課題中,采用新的方法處理缺失數(shù)據(jù)。有缺失值的數(shù)據(jù)行被視為變量的一種可能值,將其重新定義成一個新的變量。

      例如,對于變量“first_home_buyer_flag(是否第一次買房),3種可能值是“是”,“否”和缺失。帶有缺失值的數(shù)據(jù)行約占10 %,刪除它們是不適合的。所以,變量“是否第一次購房”就被重新分成3個新變量:

      新變量1 ,fhb _yes(是第一次購房),如果是“是”,則數(shù)值被編碼為1 ,否則編碼為0;

      新變量2,fhb _no(不是第一次購房),如果是“否”,則數(shù)值被編碼為1,否則編碼為0;

      新變量3,fhb_miss(第一次買房值缺失),如變量的值為缺失,則數(shù)值被編碼為1,否則編碼為0 。

      3.2雙變量分析

      雙變量分析是評估某一自變量是否可成為因變量的預(yù)測因子。

      本課題使用KS值來評估自變量因子的預(yù)測能力。其目的是為了在不影響概率測算精準(zhǔn)度的情況下使得邏輯回歸分析中的變量大大減少,從而 “節(jié)約”變量和運(yùn)算。表3列出了某些自變量的KS 值。

      雙變量分析結(jié)果表明, FICO信用評分,債務(wù)與收入比率及貸款目的等變量用于預(yù)測拖欠可能性是最有效的預(yù)測自變量。

      3.3模型開發(fā) - 建模數(shù)據(jù)的回歸

      把2005年的29,225行建模數(shù)據(jù)帶入邏輯回歸計算中,獲得系數(shù)值β。進(jìn)而就可得到ln( P / ( 1 -P)所滿足的關(guān)系式(見后)。

      建模數(shù)據(jù)的拖欠回歸分析結(jié)果列于表4 。

      在這個課題中,模型開發(fā)的最大KS是31。表明該模型能有效地分離拖欠的賬戶和按期付款的賬戶。

      3.4模型驗證 - 驗證數(shù)據(jù)的邏輯回歸分析

      將留作驗證的2006年的19,484個未進(jìn)行分析的數(shù)據(jù),用于邏輯回歸模型中進(jìn)行驗證。最后,該模型的 KS值被統(tǒng)計計算(表6)。模型驗證的最大KS是33, 非常接近建模的KS ,表明模型穩(wěn)定。

      4 討論

      4.1邏輯回歸模型結(jié)果及系數(shù)解釋

      根據(jù)表4中所列,預(yù)測拖欠的模型為:

      ln( P/1-P)=5.7069-0.0119×FICO分?jǐn)?shù)+0.0142×債務(wù)對收入比率+ 0.0144 ×貸款價值比+0.1774×不是首次購房者-0.2153×購房自用-0.1606×貸款用于購房+0.155×貸款用于融資

      所列參數(shù)的系數(shù)為正表明增加拖欠可能性,系數(shù)為負(fù)則表示減少拖欠可能。

      4.2綜合評價模型

      邏輯回歸模型 與一般多元線性回歸模型不同。所有的分析均建立在二項分布的基礎(chǔ)上。 也正是基于此,系數(shù)及模型檢驗要用似然比檢驗和沃爾德等檢驗。本模型經(jīng)由似然比和沃爾德測試檢驗。所有測試表明P值均< 0.0001 ,表明在本研究中所獲得的邏輯回歸模型比截距模型更有效。

      通過對所建模型進(jìn)行擬合優(yōu)度測試,得出結(jié)論:本模型擬合數(shù)據(jù)良好。

      4.3驗證預(yù)測概率

      一個常用的方法之一是將模型的增益圖表和驗證模型的增益圖表相比較。圖1是建模數(shù)據(jù)集和驗證數(shù)據(jù)集的增益圖。這兩條曲線幾乎重疊,表明該模型是相對穩(wěn)定的。另一方面在圖1中還可以看到,如果我們篩選10%的賬戶,該模型將檢測會找到拖欠賬戶的22%。而根據(jù)隨機(jī)效應(yīng)(d45線),如果我們隨機(jī)抽取10%的賬戶,只能將拖欠帳戶的10%檢測到。同樣,如果我們篩選30%的賬戶,該模型將檢測會找到拖欠賬戶的53%。而根據(jù)隨機(jī)效應(yīng)(d45線),如果我們隨機(jī)抽取30%的賬戶,只能將拖欠帳戶的30%檢測到。由此得出本模型提升了檢測概率。

      5 模型的改進(jìn) - 宏觀經(jīng)濟(jì)指數(shù)用于預(yù)測拖欠

      將2005至2010年宏觀經(jīng)濟(jì)指數(shù),如失業(yè)率,居民消費(fèi)價格指數(shù),通貨膨脹指數(shù)等和所在年份的客戶數(shù)據(jù)合并,創(chuàng)建一個新的數(shù)據(jù)行用于預(yù)測拖欠。數(shù)據(jù)隨機(jī)分成2份,60%用于建立模型,40%用于驗證模型。

      5.1 基本模型(不包括宏觀經(jīng)濟(jì)指數(shù))的建立

      將表4中所有的有預(yù)測能力的變量用于基本模型。將建模數(shù)據(jù)進(jìn)行邏輯回歸計算,得出預(yù)測拖欠概率的基本模型為:

      ln( P/1-P)=6.9205-0.01517×FICO分?jǐn)?shù)+ 0.0199×債務(wù)對收入比率+ 0.0204×貸款價值比+0.4629×不是首次購房者-0.2328×購房自用+0.2644×購房用于投資-0.2020×貸款用于購房+0.2915×貸款用于融資

      再對此模型計算KS值,得到最大KS為 41,表明模型預(yù)測能力強(qiáng)。

      5.2 改進(jìn)模型(包括宏觀經(jīng)濟(jì)指數(shù))的建立

      經(jīng)變量相關(guān)性分析,失業(yè)率和居民消費(fèi)價格指數(shù)有明顯的相關(guān)性,因此在建模中保留失業(yè)率,GDP和通貨膨脹指數(shù)

      預(yù)測拖欠的改進(jìn)模型(加入宏觀經(jīng)濟(jì)指數(shù))為:

      ln( P/1-P)=8.1187-0.01316×FICO分?jǐn)?shù)+0.0163×債務(wù)對收入比率+0.0180×貸款價值比-0.2745×首次購房選項缺失-0.2180×購房自用+0.2169×購房用于投資-0.3267×貸款用于購房+0.1756×貸款用于融資-0.3128×失業(yè)率- 0.0179×通貨膨脹指數(shù)

      改進(jìn)模型的KS為44. 和基本模型相比(KS為41),增加宏觀經(jīng)濟(jì)指數(shù)加強(qiáng)了模型預(yù)測拖欠的能力。

      上述模型說明:

      - 失業(yè)率提高可能降低拖欠可能性,這是由于失業(yè)率對貸款拖欠有滯后作用。在此模型中采用2005-2010年數(shù)據(jù),滯后現(xiàn)象還沒有充分觀察到。 通貨膨脹指數(shù)提高可能降低拖欠可能性。 GDP對預(yù)測拖欠可能性沒有顯著意義。

      5.3 改進(jìn)模型(包括宏觀經(jīng)濟(jì)指數(shù))的驗證

      將驗證數(shù)據(jù)帶入改進(jìn)模型進(jìn)行驗證,并計算KS。得出模型驗證的最大KS是44, 非常接近建模的KS ,表明模型穩(wěn)定。

      6 結(jié)論

      在這個課題中,對房屋貸款2005至2010年的客戶的申請和表現(xiàn)數(shù)據(jù)進(jìn)行了分析,制定一個預(yù)測模型來預(yù)測拖欠付款的可能性。并用不同年份的數(shù)據(jù)對該模型進(jìn)行驗證.得出結(jié)論:該模型是穩(wěn)定的。因此模型具備長期使用價值,而且預(yù)測性強(qiáng)。

      此外,通過對模型的改進(jìn),用05到10年數(shù)據(jù)并將一些宏觀經(jīng)濟(jì)變量添加到模型中。與基本模型(無宏觀經(jīng)濟(jì)變量)相比,KS由41增長為44,說明數(shù)據(jù)年份跨度加大和添加宏觀變量可以提高好壞賬戶的分離能力,使預(yù)測更為精確。

      綜上所述,本模型可以通過金融機(jī)構(gòu)來實現(xiàn)早期階段自動檢測拖欠帳戶。當(dāng)模型實施時,一個定時器被設(shè)置在操作系統(tǒng)如Unix上,進(jìn)行通宵自動運(yùn)行的程序,每天早上提交拖欠概率較高的賬戶的風(fēng)險報告。以便在早期階段的采取相應(yīng)措施,以防止經(jīng)濟(jì)損失。

      在未來的研究中,還可以將更多的有預(yù)測拖欠能力的變量添加到模型中,如個人資產(chǎn),就業(yè)狀況,婚姻狀況等,此外,其他一些宏觀經(jīng)濟(jì)變量,也可以添加到模型中,如消費(fèi)者信心指數(shù),汽油的價格等,這些變量可以提高模型的分離能力,使預(yù)測更為精確。

      參考文獻(xiàn):

      [1] Peng, C. J., Lee, K. L., Ingersoll, G. M. An Introduction to Logistic Regression Analysis and Reporting. The Journal of Educational Research, 96(1), 3-14.

      [2]Tabachnick, B., and Fidell, L. Using Multivariate Statistics (4th Ed.). Needham Heights, MA: Allyn & Bacon, 2001.

      [3]StatSoft, Electronic Statistics Textbook, http://www.statsoft.com/textbook/stathome.html. http://www.statsoft.com/textbook/stathome.html.

      [4] Stokes, M., Davis, C. S. Categorical Data Analysis Using the SAS System, SAS Institute Inc., 1995.

      [5]Raymond Anderson. The Credit Scoring Toolkit: Theory and Practice for Retail Credit Risk Management and Decision Automation. Oxford University Press, USA, 2007.8

      [6]王濟(jì)川,郭志剛,logistic回歸模型---方法與應(yīng)用,高等教育出版社 2001

      (責(zé)任編輯:羅亦成)

      猜你喜歡
      購房邏輯貸款
      刑事印證證明準(zhǔn)確達(dá)成的邏輯反思
      法律方法(2022年2期)2022-10-20 06:44:24
      互聯(lián)網(wǎng)背景下房地產(chǎn)網(wǎng)絡(luò)營銷模式分析——以HD“線上購房”為例
      邏輯
      創(chuàng)新的邏輯
      購房合同中的“霸王條款”不得不防
      Wang Yuan: the Brilliant Boy
      My Huckleberry Friends:Even if the Whole World Stand against me,I Will always Stand by You
      女人買買買的神邏輯
      37°女人(2017年11期)2017-11-14 20:27:40
      付款不及時賣家將房賣出,能否解除購房合同?
      貸款為何背上黑鍋?
      乡宁县| 隆化县| 昂仁县| 微博| 翼城县| 镇康县| 乐亭县| 新乡市| 高陵县| 沾化县| 夹江县| 都江堰市| 湄潭县| 玉树县| 罗田县| 运城市| 安图县| 额尔古纳市| 苏州市| 忻州市| 西贡区| 新龙县| 托克托县| 岢岚县| 台北市| 雷山县| 新建县| 津南区| 萨迦县| 田林县| 鹰潭市| 新巴尔虎右旗| 民丰县| 余江县| 吐鲁番市| 恩施市| 巴马| 开封市| 邢台县| 石城县| 特克斯县|