基于Logistic模型的企業(yè)公共信用綜合評(píng)價(jià)方法研究

2023-04-29 17:28:54顧遵雷

信息系統(tǒng)工程 2023年5期

顧遵雷

摘要：公共信用綜合評(píng)價(jià)是政府部門實(shí)施分級(jí)分類監(jiān)管，構(gòu)建以信用為基礎(chǔ)的新型監(jiān)管機(jī)制的重要支撐，在提高跨部門資源整合能力、優(yōu)化資源配置、防范化解風(fēng)險(xiǎn)等方面發(fā)揮了積極作用。在充分研究、借鑒國內(nèi)外、業(yè)內(nèi)外信用評(píng)級(jí)優(yōu)秀做法基礎(chǔ)上，結(jié)合實(shí)際情況，基于Logistic模型，利用公共信用數(shù)據(jù)，對(duì)企業(yè)公共信用綜合評(píng)價(jià)指標(biāo)和方法進(jìn)行研究和探索，并對(duì)評(píng)價(jià)模型進(jìn)行驗(yàn)證分析。

關(guān)鍵詞：信用評(píng)價(jià)；邏輯回歸；研究

一、前言

（一）研究背景和意義

公共信用綜合評(píng)價(jià)是政府部門實(shí)施分級(jí)分類監(jiān)管的重要依據(jù)，是構(gòu)建以信用為基礎(chǔ)的新型監(jiān)管機(jī)制、推進(jìn)社會(huì)信用體系建設(shè)高質(zhì)量發(fā)展、促進(jìn)形成新發(fā)展格局的的重要基礎(chǔ)。2019年7月，國務(wù)院辦公廳出臺(tái)《關(guān)于加快推進(jìn)社會(huì)信用體系建設(shè)構(gòu)建以信用為基礎(chǔ)的新型監(jiān)管機(jī)制的指導(dǎo)意見》（國辦發(fā)〔2019〕35號(hào)），要求加強(qiáng)事前、事中、事后全流程監(jiān)管。特別是在事中環(huán)節(jié)信用監(jiān)管中，要求對(duì)市場主體開展全覆蓋、標(biāo)準(zhǔn)化、公益性的公共信用綜合評(píng)價(jià)，定期將評(píng)價(jià)結(jié)果推送至相關(guān)政府部門、金融機(jī)構(gòu)、行業(yè)協(xié)會(huì)商會(huì)參考使用，并依照有關(guān)規(guī)定向社會(huì)公開。2022年3月，中辦國辦印發(fā)《關(guān)于推進(jìn)社會(huì)信用體系建設(shè)高質(zhì)量發(fā)展促進(jìn)形成新發(fā)展格局的意見》指出要加快健全以信用為基礎(chǔ)的新型監(jiān)管機(jī)制，全面建立企業(yè)信用狀況綜合評(píng)價(jià)體系，以信用風(fēng)險(xiǎn)為導(dǎo)向優(yōu)化配置監(jiān)管資源。

（二）研究思路和目標(biāo)

1.研究的思路

研究借鑒金融機(jī)構(gòu)信用評(píng)級(jí)、省內(nèi)外公共信用綜合評(píng)價(jià)、相關(guān)行業(yè)信用評(píng)價(jià)工作實(shí)踐，對(duì)比分析評(píng)價(jià)指標(biāo)，研究建立評(píng)價(jià)模型指標(biāo)，采用回歸分析方法，利用樣本數(shù)據(jù)進(jìn)行建模，并利用樣本外的數(shù)據(jù)，對(duì)模型的效力進(jìn)行驗(yàn)證。利用評(píng)價(jià)模型對(duì)市場主體進(jìn)行評(píng)價(jià)，并對(duì)評(píng)價(jià)結(jié)果進(jìn)行分析。

2.研究的目標(biāo)

基于我省法人信用基礎(chǔ)數(shù)據(jù)庫，構(gòu)建公共信用綜合評(píng)價(jià)指標(biāo)，建立可行的、科學(xué)的評(píng)價(jià)模型，對(duì)我省企業(yè)進(jìn)行公共信用綜合評(píng)價(jià)，支撐政府部門實(shí)施分級(jí)分類和精確有效監(jiān)管[1]。

（三）研究的內(nèi)容和方法

1.研究的內(nèi)容

研究利用Logistic回歸模型建立公共信用綜合評(píng)價(jià)模型，主要包括：構(gòu)建評(píng)價(jià)指標(biāo)體系，對(duì)模型變量預(yù)測強(qiáng)度進(jìn)行分析，構(gòu)建評(píng)分模型，利用K-S值、GINI系數(shù)判斷模型的分區(qū)能力等。

2.研究的方法

（1）資料分析法。梳理分析國家及省關(guān)于社會(huì)信用體系建設(shè)、構(gòu)建新型監(jiān)管機(jī)制等文件要求，梳理借鑒國內(nèi)外信用評(píng)級(jí)或信用評(píng)價(jià)的理論方法，為公共信用綜合評(píng)價(jià)提供制度和理論支撐。

（2）比較分析法。通過對(duì)兄弟省市、相關(guān)行業(yè)部門，以及第三方信用服務(wù)機(jī)構(gòu)的信用評(píng)價(jià)方法進(jìn)行比較分析，總結(jié)各自優(yōu)勢、特點(diǎn)和經(jīng)驗(yàn)，提煉出對(duì)我省公共信用綜合評(píng)價(jià)的有用的思路、方法和模型。

（3）調(diào)查分析法。通過開展實(shí)地調(diào)研，學(xué)習(xí)借鑒先進(jìn)做法和經(jīng)驗(yàn)，對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分析歸納，建立評(píng)價(jià)指標(biāo)，并邀請(qǐng)專家對(duì)指標(biāo)選擇、模型設(shè)計(jì)等方面進(jìn)行論證，使評(píng)價(jià)指標(biāo)和模型更具科學(xué)性和權(quán)威性。

二、評(píng)分模型原理和方法

（一）選擇擬合函數(shù)

目前，常用建模方法非常多，如判別分析、線性回歸、邏輯回歸及分類樹等統(tǒng)計(jì)方法；或是機(jī)器學(xué)習(xí)、類神經(jīng)網(wǎng)絡(luò)、基因算法及專家系統(tǒng)等非統(tǒng)計(jì)方法。由于公共信用綜合評(píng)價(jià)是通過企業(yè)的行為特征信息來預(yù)測其“好”與“壞”，因此本文采用邏輯回歸（Logistic）方法建立評(píng)分模型。logistic回歸是一種廣義線性回歸（generalized linear model），它是一種分類算法，用于解決因變量為二分類（0or1）或多分類問題的方法[2]。對(duì)于分類問題而言，其輸出因變量的范圍應(yīng)該在（0，1）之間，選用Sigmod函數(shù)可以有效地?cái)M合分類問題的期望輸出。Logistic回歸模型的適用條件：

1.因變量為二分類的分類變量或某事件的發(fā)生率。但是需要注意，重復(fù)計(jì)數(shù)現(xiàn)象指標(biāo)不適用于Logistic回歸。

2.殘差和因變量都要服從二項(xiàng)分布。二項(xiàng)分布對(duì)應(yīng)的是分類變量，所以不是正態(tài)分布，進(jìn)而不是用最小二乘法，而是用最大似然法來解決方程估計(jì)和檢驗(yàn)問題。

3.自變量和Logistic概率是線性關(guān)系。

4.各觀測對(duì)象間相互獨(dú)立。

（二）自變量處理和分析

1.自變量處理

（1）連續(xù)型變量分箱處理和WOE轉(zhuǎn)化

對(duì)于連續(xù)性變量進(jìn)行分箱處理。首先按照頻數(shù)盡量平均分成多組，初步形成變量分組，然后在初步分組的基礎(chǔ)上合并相似組形成最終分箱[3]。分組合并時(shí)，需要按照如下標(biāo)準(zhǔn)進(jìn)行：

①不同的分箱間好壞比例要有差異；

②單一變量應(yīng)維持至多8個(gè)區(qū)間；

③每個(gè)分箱中的好/壞件數(shù)至少大于等于10；

④每個(gè)分箱中記錄數(shù)占比至少大于2%；

⑤每個(gè)分箱好壞比率的排序需要和業(yè)務(wù)常識(shí)保持一致。

其中③和④是通常情況下的標(biāo)準(zhǔn)，在特殊情況下，這兩個(gè)標(biāo)準(zhǔn)要求會(huì)適當(dāng)提高或放松。

變量分箱完成后，對(duì)變量進(jìn)行WOE轉(zhuǎn)換，用每個(gè)分組的WOE值替換原來的變量值。

（2）分類型變量的分箱和虛擬變量引入

對(duì)于分類型變量，可以將每個(gè)屬性作為一個(gè)分箱。Logistic回歸中分類變量需要使用啞變量來操作。

2.自變量分析

在建立模型的過程中，可以通過以下兩個(gè)指標(biāo)對(duì)模型變量的預(yù)測強(qiáng)度進(jìn)行分析。

（1）WOE（Weight Of Evidence）跡象權(quán)數(shù)，表示當(dāng)前分箱中好壞客戶的各自占總體好壞客戶比例的差異，描述了預(yù)測變量與目標(biāo)變量之間的關(guān)系。WOE絕對(duì)值越高，表示該組違約和正常企業(yè)區(qū)分度越高，反之，區(qū)分度越低[4]。

（2）IV（information value）信息值，又稱VOI（Value Of Information），用來表示變量預(yù)測能力的強(qiáng)度，可用于單變量篩選。IV越高，說明該自變量與因變量關(guān)聯(lián)度高，預(yù)測強(qiáng)度高，適合納入預(yù)測模型。

（三）參數(shù)估計(jì)

邏輯回歸模型的參數(shù)是用最大似然法估計(jì)。極大似然估計(jì)是一種統(tǒng)計(jì)方法，利用已知的樣本結(jié)果信息，反推最具有可能（最大概率）導(dǎo)致這些樣本結(jié)果出現(xiàn)的模型參數(shù)值。每個(gè)觀察值yi皆為0或1，因此，yi～Bernoulli（π），i=1，…， n（此為白努利分配，n為樣本數(shù)）。

（四）模型建立

邏輯回歸得到的是因變量為“1”和“0”比值的自然對(duì)數(shù)，即ln（odds），其中odds也稱勝算率。若要以分?jǐn)?shù)形態(tài)呈現(xiàn)，必須要經(jīng)過轉(zhuǎn)換，轉(zhuǎn)換公式為：

Score=ln（odds）×Scale+Location

轉(zhuǎn)換的步驟如下：

1.設(shè)定odds為某一固定值的分?jǐn)?shù)為l；

2.設(shè)定odds每增加1倍時(shí)，相對(duì)增加的分?jǐn)?shù)為p，此分?jǐn)?shù)也成為了PDO（Point of double odds）；

3.將odds=1：1和2：1時(shí)的分?jǐn)?shù)套入公式，解方程可以得出Location 的值為l，Scale的值為p ln （2）；

4.最后得到評(píng)價(jià)模型計(jì)算公式為：

Score=ln（odds）×? p? +l。

三、信用評(píng)分模型建立與實(shí)證分析

建模的步驟主要分為：模型設(shè)計(jì)、建模數(shù)據(jù)準(zhǔn)備、變量選取、建立模型、模型評(píng)估、完成信用評(píng)分表。

（一）模型變量的設(shè)計(jì)

1.觀察期和表現(xiàn)期

（1）觀察時(shí)點(diǎn)（Observation Point）

觀察時(shí)點(diǎn)是指所需樣本選取的時(shí)間點(diǎn)，該時(shí)點(diǎn)下的企業(yè)信息即是評(píng)價(jià)模型用來評(píng)價(jià)客戶及預(yù)測企業(yè)將來是否發(fā)生失信的重要參考。

（2）觀察期間（Observation Period）

觀察期間是指開發(fā)樣本在觀察時(shí)點(diǎn)之前一段時(shí)間，該期間是對(duì)樣本信息進(jìn)行觀察和提煉的時(shí)期。本課題選取的觀察期間為12個(gè)月。

（3）表現(xiàn)時(shí)點(diǎn)（Outcome Point）

表現(xiàn)時(shí)點(diǎn)是最終判斷樣本屬于失信或非失信的時(shí)間點(diǎn)。

（4）表現(xiàn)期間（Outcome Period）

觀察時(shí)點(diǎn)至表現(xiàn)時(shí)點(diǎn)這段時(shí)間為表現(xiàn)期間。表現(xiàn)期是對(duì)觀察點(diǎn)上企業(yè)進(jìn)行監(jiān)控的時(shí)間周期，該期間內(nèi)企業(yè)會(huì)被分類成失信企業(yè)、非失信企業(yè)或無法確定。

2.失信企業(yè)的表現(xiàn)定義

在表現(xiàn)期間存在行政處罰記錄、執(zhí)行案件記錄（未履行案件）、失信被執(zhí)行人記錄、聯(lián)合懲戒記錄的企業(yè)視為失信企業(yè)。沒有上述信息的企業(yè)視為非失信企業(yè)。

3.排除規(guī)則

模型開發(fā)樣本應(yīng)具備群體代表性，而且必須有準(zhǔn)確的預(yù)測信息和表現(xiàn)信息，才能使模型更加準(zhǔn)確。因此對(duì)于一些特殊企業(yè)，如已被注銷、吊銷的企業(yè)，其行為無法預(yù)測，將不包含在評(píng)分模型開發(fā)中。

（二）建模數(shù)據(jù)準(zhǔn)備

從全部數(shù)據(jù)中抽取兩類樣本：開發(fā)樣本和檢驗(yàn)樣本。開發(fā)樣本時(shí)建立模型的實(shí)際數(shù)據(jù)集。檢驗(yàn)樣本用于檢驗(yàn)?zāi)Ｐ偷姆€(wěn)健性。本次共選取50萬家在業(yè)企業(yè)作為樣本數(shù)據(jù)，70%為開發(fā)樣本，30%為驗(yàn)證樣本。

（三）變量分析及選取

對(duì)影響企業(yè)信用綜合評(píng)價(jià)結(jié)果的因素進(jìn)行逐一分析，計(jì)算WOE和IV值，判斷指標(biāo)預(yù)測強(qiáng)度，刪除預(yù)測強(qiáng)度低的指標(biāo)。以注冊(cè)資金為例做如下分析：

該變量是連續(xù)性變量，對(duì)其進(jìn)行分箱處理，并進(jìn)行WOE轉(zhuǎn)化，計(jì)算IV值，得到結(jié)果如表1。

IV為0.34，該變量預(yù)測強(qiáng)度高，可納入評(píng)價(jià)模型。經(jīng)過同樣的方法分析，納入模型的變量包括：注冊(cè)資本、成立年限、所屬行業(yè)、欠稅記錄條數(shù)、嚴(yán)重失信記錄條數(shù)、行政處罰條數(shù)、執(zhí)行案件記錄條數(shù)、法定代表人嚴(yán)重失信記錄條數(shù)、法定代表人執(zhí)行案件條數(shù)、關(guān)聯(lián)企業(yè)嚴(yán)重失信條數(shù)、關(guān)聯(lián)企業(yè)執(zhí)行案件記錄條數(shù)。

（四）模型的建立

將樣例數(shù)據(jù)中表現(xiàn)期有失信記錄的企業(yè)因變量設(shè)為1，無失信記錄的企業(yè)因變量設(shè)為0。將樣例數(shù)據(jù)導(dǎo)入SPSS軟件進(jìn)行回歸分析，得到結(jié)果如表2。

根據(jù)上表的回歸結(jié)果，結(jié)合每個(gè)指標(biāo)的分值權(quán)重，在確定好標(biāo)準(zhǔn)評(píng)分、標(biāo)準(zhǔn)ODDS和PDO后，按照上文的轉(zhuǎn)換公式和轉(zhuǎn)換步驟，最終得到模型評(píng)分卡。

（五）模型的評(píng)估

1.區(qū)分度指標(biāo)驗(yàn)證

以注冊(cè)資金為例，利用不保留樣本數(shù)據(jù)計(jì)算模型的K-S值和基尼系數(shù)，以判斷模型的預(yù)測能力。按照該指標(biāo)得分進(jìn)行分段并由低到高排序，計(jì)算各分段失信企業(yè)占比累計(jì)與正常企業(yè)占比累計(jì)差值，K-S=MAX（失信企業(yè)占比累計(jì)-正常企業(yè)占比累計(jì)）。經(jīng)計(jì)算，各指標(biāo)K-S值和基尼系數(shù)均在可接受范圍內(nèi)[5]。

2.群體穩(wěn)定度指標(biāo)驗(yàn)證

群體穩(wěn)定度指標(biāo)（PSI）是用來衡量群體評(píng)分卡在開發(fā)群體時(shí)點(diǎn)與現(xiàn)行評(píng)分時(shí)點(diǎn)的評(píng)分對(duì)象的差異程度。按照PSI計(jì)算方法，各指標(biāo)PSI計(jì)算結(jié)果顯示穩(wěn)定度均在中等以上，驗(yàn)證合格。

四、結(jié)語

本次研究，主要是基于Logistic模型，利用目前已歸集的公共信用信息，構(gòu)建評(píng)價(jià)指標(biāo)、建立評(píng)價(jià)模型。隨著公共信用信息歸集范圍不斷擴(kuò)大，已經(jīng)數(shù)據(jù)的不斷積累，今后將定期評(píng)估、完善評(píng)價(jià)指標(biāo)，用新數(shù)據(jù)定期迭代評(píng)級(jí)模型，不斷修正評(píng)分卡，并定期發(fā)布企業(yè)公共信用綜合評(píng)價(jià)結(jié)果。

參考文獻(xiàn)

[1]劉開元.隨機(jī)森林與邏輯回歸模型在違約預(yù)測中的應(yīng)用[J].信息與電腦（理論版），2016（21）：111-112.

[2]阿明翰，張達(dá)敏，李偉.邏輯回歸在信用卡風(fēng)險(xiǎn)評(píng)估模型構(gòu)建中的應(yīng)用[J].內(nèi)江科技，2016（9）：41-42.

[3]徐喆.邏輯回歸模型在互聯(lián)網(wǎng)金融P2P業(yè)務(wù)信用風(fēng)險(xiǎn)的應(yīng)用[J].統(tǒng)計(jì)科學(xué)與實(shí)踐，2015（11）：26-29.

[4]姜明輝，許佩，任瀟，等.個(gè)人信用評(píng)分模型的發(fā)展及優(yōu)化算法分析[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào)，2015（5）：40-45.

[5]朱艷敏.基于信用評(píng)分模型的小微企業(yè)貸款的可獲得性研究[D].蘇州：蘇州大學(xué)，2014.

作者單位：江蘇省戰(zhàn)略與發(fā)展研究中心

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

基于Logistic模型的企業(yè)公共信用綜合評(píng)價(jià)方法研究