陳惠娟,加云崗
(西安工程大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,陜西 西安 710048)
改革開放以來,我國信貸業(yè)務(wù)獲取了長足的發(fā)展,信貸機(jī)構(gòu)競爭加劇,隨著信貸業(yè)務(wù)的不斷發(fā)展,信貸風(fēng)險(xiǎn)在信貸業(yè)務(wù)中的作用也越來越重要[1-2]。信貸風(fēng)險(xiǎn)管理是一項(xiàng)綜合性、系列化的工作,貫穿于整個信貸業(yè)務(wù)流程,自貸前信用分析、貸時(shí)審查控制、貸后監(jiān)控管理直至貸款安全收回。當(dāng)前信貸部門依賴的是內(nèi)部數(shù)據(jù)來判斷是否存在風(fēng)險(xiǎn),雖然信貸部門建立了面向整個信貸鏈條的數(shù)據(jù)倉庫,整合了信貸業(yè)務(wù)和信用業(yè)務(wù)的數(shù)據(jù),但由于這些數(shù)據(jù)筆記單一,不能全面的全方位的反應(yīng)出信貸風(fēng)險(xiǎn)?;?hortonworks大數(shù)據(jù)平臺技術(shù)實(shí)現(xiàn)信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng),將內(nèi)部數(shù)據(jù)、信貸數(shù)據(jù)和外部新聞數(shù)據(jù)、法院數(shù)據(jù)、抵押數(shù)據(jù)、房產(chǎn)數(shù)據(jù)等內(nèi)外部數(shù)據(jù)在大數(shù)據(jù)平臺上有機(jī)的結(jié)合在一起,通過對這些數(shù)據(jù)的有效分析,建立全面的風(fēng)險(xiǎn)指標(biāo)評估體系[9]。通過對內(nèi)外部數(shù)據(jù)建立的風(fēng)險(xiǎn)指標(biāo)的分析和監(jiān)控實(shí)現(xiàn)對信貸風(fēng)險(xiǎn)的全方位評估,使得信貸單位對信貸各個環(huán)節(jié)的各類風(fēng)險(xiǎn)及時(shí)作出應(yīng)對措施。
基于大數(shù)據(jù)平臺總體架構(gòu)如圖1所示??傮w架構(gòu)包括五部分組成:源數(shù)據(jù)層、數(shù)據(jù)交換層、數(shù)據(jù)計(jì)算層、數(shù)據(jù)應(yīng)用層和數(shù)據(jù)訪問層。源數(shù)據(jù)層是信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)的數(shù)據(jù)依據(jù),主要包括行內(nèi)的業(yè)務(wù)數(shù)據(jù)和行外的外部數(shù)據(jù);數(shù)據(jù)交換層是對信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)數(shù)據(jù)源的統(tǒng)一管理,主要將數(shù)據(jù)源層數(shù)據(jù)有效的進(jìn)行組織和存儲,供數(shù)據(jù)計(jì)算層使用;數(shù)據(jù)計(jì)算層將數(shù)據(jù)交換層提供的各類數(shù)據(jù)在 hortonworks大數(shù)據(jù)平臺中通過抽取、清洗、加工、匯總統(tǒng)計(jì)生成需要的基礎(chǔ)數(shù)據(jù)和匯總指標(biāo);數(shù)據(jù)應(yīng)用層將數(shù)據(jù)計(jì)算層中通過大數(shù)據(jù)平臺加工的切片數(shù)據(jù)傳輸?shù)疥P(guān)系數(shù)據(jù)庫,供用戶訪問層使用。下面將對各個層進(jìn)行詳細(xì)的介紹。
圖1 信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)總體結(jié)構(gòu)Fig.1 Overall structure of credit risk pre-warning system
源數(shù)據(jù)層是信貸風(fēng)險(xiǎn)系統(tǒng)的數(shù)據(jù)源也是信貸風(fēng)險(xiǎn)系統(tǒng)的基礎(chǔ),主要包括2部分?jǐn)?shù)據(jù)源,內(nèi)部數(shù)據(jù)源如信貸業(yè)務(wù)數(shù)據(jù),ECIF客戶數(shù)據(jù)[5],外部數(shù)據(jù)源:如法院數(shù)據(jù)、被執(zhí)行人數(shù)據(jù)、黑名單數(shù)據(jù)、抵押數(shù)據(jù),新聞信息數(shù)據(jù)等。
數(shù)據(jù)交換層是信貸風(fēng)險(xiǎn)系統(tǒng)的數(shù)據(jù)交換平臺,也是信貸系統(tǒng)獲取數(shù)據(jù)的平臺,主要作用是將數(shù)據(jù)源中的數(shù)據(jù)放到數(shù)據(jù)交換平臺中。數(shù)據(jù)主要以文件的形式存放。
數(shù)據(jù)計(jì)算層是信貸風(fēng)險(xiǎn)系統(tǒng)的核心,該層將采用hortaonworks數(shù)據(jù)平臺的相互技術(shù),將數(shù)據(jù)源中數(shù)據(jù)存放到分布式系統(tǒng)中,將結(jié)構(gòu)數(shù)據(jù)[6]和非結(jié)構(gòu)數(shù)據(jù)[7]進(jìn)行加工成為符合信貸風(fēng)險(xiǎn)的基礎(chǔ)數(shù)據(jù),然后按照計(jì)算規(guī)則對數(shù)據(jù)進(jìn)行加工、篩選和匯總生成信貸風(fēng)險(xiǎn)指標(biāo)。采用hive[3]存儲關(guān)系型數(shù)據(jù),hbase[4]存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),sqoop用于傳輸數(shù)據(jù),Streaming用于計(jì)算實(shí)時(shí)數(shù)據(jù),oozie用于調(diào)度作業(yè)。
數(shù)據(jù)應(yīng)用層是把數(shù)據(jù)計(jì)算中匯總數(shù)據(jù)和基礎(chǔ)切片數(shù)據(jù)傳輸?shù)綌?shù)據(jù)應(yīng)用服務(wù)器中,供數(shù)據(jù)訪問層使用。主要采用關(guān)系型數(shù)據(jù)庫oracle。
數(shù)據(jù)訪問層:訪問信貸風(fēng)險(xiǎn)系統(tǒng)的窗口。
Hive是建立在 Hadoop上的數(shù)據(jù)倉庫基礎(chǔ)構(gòu)架。在信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)中,Hive主要是在數(shù)據(jù)計(jì)算層貼源數(shù)據(jù)區(qū)、數(shù)據(jù)標(biāo)準(zhǔn)區(qū)和數(shù)據(jù)匯總區(qū)中使用,不僅是ETL加工的對應(yīng)的數(shù)據(jù)庫,用來儲存行內(nèi)和行外的結(jié)構(gòu)化數(shù)據(jù),同時(shí)將ETL加工結(jié)果及其歷史結(jié)果都存儲在HIVE中。
HBase是一個分布式的、面向列的開源數(shù)據(jù)。在信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)中,HBase主要是在數(shù)據(jù)計(jì)算層貼源數(shù)據(jù)區(qū)中使用,主要是存儲行外的非結(jié)構(gòu)化數(shù)據(jù),同時(shí)將這些非結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),存儲到Hive中。
Oozie工作流是放置在控制依賴 DAG[8](有向無環(huán)圖 Direct Acyclic Graph)中的一組動作,其中指定了動作執(zhí)行的順序。在信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)中,Oozie主要是對流程進(jìn)行調(diào)度,即在流程調(diào)度區(qū)中使用,Oozie主要是對在大數(shù)據(jù)平臺中ETL加工的各個作業(yè)進(jìn)行調(diào)度管理。
Sqoop是一個用來將Hadoop和關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)相互轉(zhuǎn)移的工具,在信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)中,Sqoop主要是在數(shù)據(jù)應(yīng)用層中使用,將在數(shù)據(jù)計(jì)算層中加工的基礎(chǔ)數(shù)據(jù)和匯總數(shù)據(jù)通過 sqoop傳輸?shù)疥P(guān)系型數(shù)據(jù)庫中,供web端查詢使用。
Hadoop Streaming 提供了一個便于進(jìn)行MapReduce編程的工具包,在信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)中,Streaming主要是對實(shí)時(shí)數(shù)據(jù)進(jìn)行處理,將數(shù)據(jù)計(jì)算層中貼源區(qū)的數(shù)據(jù)實(shí)時(shí)的傳輸?shù)疥P(guān)系型數(shù)據(jù)庫中,供web端查詢使用。
在預(yù)警系統(tǒng)中實(shí)現(xiàn)數(shù)據(jù)的存儲和加工是預(yù)警系統(tǒng)的關(guān)鍵環(huán)節(jié),此節(jié)主要闡述預(yù)警系統(tǒng)總體架構(gòu)中數(shù)據(jù)計(jì)算層的設(shè)計(jì)和實(shí)現(xiàn)。數(shù)據(jù)計(jì)算層主要是在大數(shù)據(jù)平臺上設(shè)計(jì)和實(shí)現(xiàn)的,首先將數(shù)據(jù)交換區(qū)各類數(shù)據(jù)文件傳輸?shù)酱髷?shù)據(jù)平臺并存儲在數(shù)據(jù)計(jì)算層中的貼源數(shù)據(jù)區(qū)對應(yīng)的Hive和HBase中,之后在數(shù)據(jù)計(jì)算層中的數(shù)據(jù)標(biāo)準(zhǔn)區(qū)中,對這些數(shù)據(jù)文件進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化操作實(shí)現(xiàn)統(tǒng)一的設(shè)計(jì)和管理,然后在數(shù)據(jù)計(jì)算層中的匯總層將標(biāo)準(zhǔn)化后的數(shù)據(jù)按照指標(biāo)加工規(guī)則進(jìn)行加工統(tǒng)計(jì),最后將當(dāng)期數(shù)據(jù)通過Sqoop傳輸?shù)疥P(guān)系型數(shù)據(jù)庫中供Web端展示或者直接將歷史數(shù)據(jù)在Web進(jìn)行展示。下面將進(jìn)行詳細(xì)的介紹。
(1)本架構(gòu)中,數(shù)據(jù)交換區(qū)域的外部數(shù)據(jù)平臺包含3部分內(nèi)容,業(yè)務(wù)數(shù)據(jù)文件、外部數(shù)據(jù)文件和實(shí)時(shí)數(shù)據(jù),這3部分內(nèi)容通過傳輸?shù)姆绞交蛘咄扑偷姆绞絺鬏數(shù)酱髷?shù)據(jù)平臺HDFS上。
(2)本架構(gòu)中,通過YARN對大數(shù)據(jù)平臺進(jìn)行統(tǒng)一的資源管理。通過HDFS進(jìn)行數(shù)據(jù)文件的存儲和集群的創(chuàng)建管理。
(3)大數(shù)據(jù)平臺上的業(yè)務(wù)數(shù)據(jù)文件通過 Hive轉(zhuǎn)入到Hive對應(yīng)的業(yè)務(wù)數(shù)據(jù)表中,這個過程中需要使用腳步封裝數(shù)命令,供Oozie進(jìn)行調(diào)度。
(4)大數(shù)據(jù)平臺上外部數(shù)據(jù)通過 HBASE轉(zhuǎn)換后轉(zhuǎn)入到Hive,這個過程中需要使用腳步封裝數(shù)命令,供Oozie進(jìn)行調(diào)度。
(5)大數(shù)據(jù)平臺上的業(yè)務(wù)數(shù)據(jù)和外部數(shù)據(jù)表通過 Hive及其相關(guān)轉(zhuǎn)換腳本生成數(shù)據(jù)的標(biāo)準(zhǔn)化的作業(yè),并存儲到Hive中,這個作業(yè)需要Oozie的調(diào)度管理。
(6)通過腳本分裝Sqoop將RDMBS中的數(shù)據(jù)傳輸?shù)紿ive中,這些腳本供Oozie調(diào)度。
(7)通過Sqoop連接外部的RDBMS傳輸應(yīng)用數(shù)據(jù),結(jié)合標(biāo)準(zhǔn)化后的業(yè)務(wù)數(shù)據(jù),采用HIVE/Spark Sql手段按照匯總規(guī)則加工生成匯總統(tǒng)計(jì)數(shù)據(jù)作業(yè),供Oozie調(diào)度。
(8)大數(shù)據(jù)平臺上的實(shí)時(shí)數(shù)據(jù)結(jié)合標(biāo)準(zhǔn)化后的業(yè)務(wù)數(shù)據(jù),采用Saprk Streaming實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)的加工。
(9)大數(shù)據(jù)平臺中的數(shù)據(jù)處理過程采用 Oozie進(jìn)行統(tǒng)一管理和調(diào)度。
(10)通過腳本封裝 Sqoop將標(biāo)準(zhǔn)化后的基礎(chǔ)數(shù)據(jù)和匯總數(shù)據(jù)傳輸?shù)?RDBMS上,這些腳本供Oozie調(diào)度。
(11)BI工具通過標(biāo)準(zhǔn)sql訪問RDBMS中的基礎(chǔ)數(shù)據(jù)、應(yīng)用數(shù)據(jù)和匯總數(shù)。
(12)BI工具通過Spark Sql訪問數(shù)據(jù)歷史區(qū)中數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)。
圖2 數(shù)據(jù)計(jì)算層架構(gòu)Fig.2 Data computing layer structure
本系統(tǒng)主要包括四個數(shù)據(jù)區(qū):貼源數(shù)據(jù)區(qū),數(shù)據(jù)標(biāo)準(zhǔn)區(qū),數(shù)據(jù)匯總區(qū)和歷史數(shù)據(jù)區(qū)。為了更好的區(qū)分四個數(shù)據(jù)區(qū)的各類業(yè)務(wù)數(shù)據(jù),本系統(tǒng)的數(shù)據(jù)表組織分為三級。第一級用于區(qū)分?jǐn)?shù)據(jù)屬于哪一個區(qū),第二級用于區(qū)分?jǐn)?shù)據(jù)屬于哪個業(yè)務(wù)類型,第三級為具體的數(shù)據(jù)表信息,數(shù)據(jù)分組主要依據(jù)具體含義命名。
例如:貼源區(qū)的對公客戶基礎(chǔ)表命名為 SR_CST_—_ENT_BASE_INFO,標(biāo)準(zhǔn)區(qū)對公客戶基礎(chǔ)表命名為SD_CST_ENT_BASE_INFO,匯總區(qū)對公客戶指標(biāo)表命名為SM_CST_ENT_INDEX_INFO。
表1 第一級的數(shù)據(jù)分類 Tab.1 First layer data classification
表2 第二級的數(shù)據(jù)分類Tab.2 Second layer data classification
本系統(tǒng)的數(shù)據(jù)文件均存儲到HDSF上,為了更好區(qū)分業(yè)務(wù)類型以及文件類型,對數(shù)據(jù)文件進(jìn)行了組織。
目錄格式:/data/rms/業(yè)務(wù)分類/日期/.其中業(yè)務(wù)分類和數(shù)據(jù)表組織的第二級一樣,文件格式為:file_表名_屬性_日期.txt。屬性為:add-增量,all-全量。
例如:
/data/rms/CST/20160701/file_CST_ENT_
BASE_INFO_ADD_20160701.txt表示的是2016年7月1日對公客戶基礎(chǔ)信息的增量數(shù)據(jù)文件。
作業(yè)是一個作業(yè)處理多個數(shù)據(jù)邏輯或者是一個業(yè)務(wù)邏輯差分為多個作業(yè)進(jìn)行處理。
作業(yè)格式:JOB_類型_含義_屬性。其中類型指:SQL是指sql語句, SH指shell。其中含義指:表示此過程加工的目的,例如CST_ENT_
BASE_INFO對公客戶基礎(chǔ)信息。其中屬性指:LOAD文件加載,INIT是初始化,PROCESS是數(shù)據(jù)加工。例如:JOB_SH_CST_ENT_BASE_INFO_LOAD表示作業(yè)對公客戶基礎(chǔ)信息裝載。
貼源數(shù)據(jù)區(qū)是為了數(shù)據(jù)加載和轉(zhuǎn)換而設(shè)計(jì)的一個數(shù)據(jù)區(qū),是一個純技術(shù)加工的數(shù)據(jù)區(qū),將按照源系統(tǒng)相同的數(shù)據(jù)結(jié)構(gòu)及數(shù)據(jù)內(nèi)容加載到貼源數(shù)據(jù)區(qū),此步驟主要包括兩部分:建立數(shù)據(jù)表和數(shù)據(jù)的導(dǎo)入。
第一部分建立數(shù)據(jù)表。為了保證數(shù)據(jù)的完整性,數(shù)據(jù)表的建立將和源系統(tǒng)數(shù)據(jù)結(jié)構(gòu)保持一致。本系統(tǒng)采用hive作為數(shù)據(jù)倉庫,建立貼源區(qū)客戶基礎(chǔ)數(shù)據(jù)表結(jié)構(gòu)如下:
create table tb_ent_cust_address
(
address_id string,
party_id string,
customer_num string,
address_type_cd string,
nationality_cd string,
province_cd string,
district string,
city_cd string,
street_address string,
zip_num string,
telephone string,
fax string,
website string,
mobile_phone string,
email string,
update_date string,
regionalism_cd string,
rural_id string,
villages_id string,
customer_name string,
) row format delimited fields terminated by '|'
stored as text;
第二部分?jǐn)?shù)據(jù)的裝入。數(shù)據(jù)的轉(zhuǎn)入采用load的方式進(jìn)行轉(zhuǎn)入。命令如下:
load data inpath '/data/rms/cst/20160701/file_cst_ent_address_info.txt' into table sr_cst_ent_address_info;
數(shù)據(jù)標(biāo)準(zhǔn)區(qū)是為了實(shí)現(xiàn)將貼源數(shù)據(jù)區(qū)的數(shù)據(jù)按照信貸業(yè)務(wù)的分類進(jìn)行標(biāo)準(zhǔn)化的過程,這部分主要包括代碼的標(biāo)準(zhǔn)化和碼值的標(biāo)準(zhǔn)化。此步驟包括兩部分:建立標(biāo)準(zhǔn)化的數(shù)據(jù)表和建立標(biāo)準(zhǔn)的碼值數(shù)據(jù)。
第一部分建立標(biāo)準(zhǔn)數(shù)據(jù)表,按照數(shù)據(jù)組織格式建立的標(biāo)準(zhǔn)表如下結(jié)構(gòu):
create table sd_cst_ent_address_info
(
ADDRESS_ID string,
CST_NO string,
ADDRESS_TYPE string,
NATIONALITY_CD string,
PROVINCE_CD string,
DISTRICT_CD string,
AREA_CD string,
ADDRESS string,
ZIP_NO string,
TELEPHONE string,
FAX string,
WEBSITE string,
MOBILE_PHONE string,
EMAIL string,
UPDATE_DT string,
AD_DIVISION string,
RURAL_ID string,
VILLAGES_ID string
) row format delimited fields terminated by '|'
stored as orc;
第二部分是實(shí)現(xiàn)碼值的轉(zhuǎn)換,實(shí)現(xiàn)過程主要是通過在標(biāo)準(zhǔn)化數(shù)據(jù)的過程中實(shí)現(xiàn)轉(zhuǎn)換,例如:將地址類型轉(zhuǎn)換。轉(zhuǎn)換規(guī)則表3所示。
數(shù)據(jù)匯總區(qū)是為了實(shí)現(xiàn)將標(biāo)準(zhǔn)數(shù)據(jù)區(qū)的數(shù)據(jù)按照信貸業(yè)務(wù)的風(fēng)險(xiǎn)指標(biāo)加工規(guī)則進(jìn)行數(shù)據(jù)加工的過程。此步驟包括兩部分:建立匯總的數(shù)據(jù)表和數(shù)據(jù)表的加工過程。
表3 碼值轉(zhuǎn)換規(guī)則Tab.3 Coding conversion rule
第一部分建立匯總數(shù)據(jù)表,按照數(shù)據(jù)組織格式建立的標(biāo)準(zhǔn)表如下結(jié)構(gòu):
create table SM_CST_BASE_INDEX
( biz_date string,
cst_no string,
conn_cst_warn_flg string,
lawsuit_cst_flag string,
conn_lawsuit_flag string,
conn_promises_flag string,
staff_FLAG string,
conn_NEGATIVE_flag string
)row format delimited fields terminated by '|'
stored as orc;
第二部分是實(shí)現(xiàn)匯總數(shù)據(jù)的加工,例如:客戶關(guān)聯(lián)人信息加工如下:
select
A.CST_NO,
case when B.Warn_Level = '01' then 1 else 0 end warn_level,
case when C.executed_no is not null or C.executed_no != '' then 1 else 0 end executed_no,
case when (to_date('$INPUT_DATE', 'YYYYMMDD') - C.filing_dt) < 5 then 1 else 0 end difference_time,
case when F.dishonest_no is not null or F.dishonest_no != '' then 1 else 0 end dishonest_no,
case when D.STAFF_ID is not null or D.STAFF_ID != '' then 1 else 0 end staff_id,
case when E.new_no is not null or E.new_no != ''then 1 else 0 end new_no
from TM_CST_CONNECTOR A
left join T_WARN_Info B on A.CST_NO =B.Cst_NO
and B.Warn_TM left join T_WARN_THE_EXECUTED C on A.CONN_CST_NO = C.cst_sku_no and C.create_dt <=to_date('$INPUT_DATE','yyyymmdd') left join F_STAFF_H D on A.CONN_CST_NO =D.CERTIFICATE_NO and D.DATA_START_DT >= '$INPUT_DATE' and D.DATA_END_DT < '$INPUT_DATE' left join T_WARN_NEGATIVE_NEWS E on A.CONN_CST_NM = E.cst_nm and E.create_dt <=to_date('$INPUT_DATE','yyyymmdd') left join T_WARN_DISHONEST_PERSON F on A.CONN_CST_NO = F.cst_sku_no and F.create_dt<=to_date('$INPUT_DATE','yyyymmdd'); 在此項(xiàng)目中,Sqoop實(shí)現(xiàn)數(shù)據(jù)的傳輸,將 hive中基礎(chǔ)應(yīng)用數(shù)據(jù)和匯總數(shù)據(jù)傳輸?shù)疥P(guān)系型數(shù)據(jù)庫中供數(shù)據(jù)應(yīng)用成使用。 實(shí)現(xiàn)部分代碼如下: sqoop import --connect jdbc:oracle:thin:@10.100.85.21:5021:RDMS --username udmp --password udmp --table cust_info --fields-terminated-by '|' --hive-import --hive-database RDMS—— --hive-overwrite --hive-table rms_cust_info 流程調(diào)度主要是實(shí)現(xiàn)作業(yè)的調(diào)度管理,此系統(tǒng)大部分的實(shí)現(xiàn)都是通過腳本實(shí)現(xiàn),因此調(diào)度的作業(yè)類型都是shell作業(yè)。流程調(diào)度主要包括3個實(shí)現(xiàn)文件,一個是作業(yè)流程,一個是配置信息,一個是腳本信息。作業(yè)流程主要是作業(yè)調(diào)度的管理,配置信息主要是多參數(shù)的說明,而腳本主要是對實(shí)現(xiàn)過程的封裝。其中作業(yè)流程如下所示: 針對性的配置信息如下所示: nameNode=hdfs://10.100.2.220:8020 jobTracker=vm.datanode1.hdp:8050 queueName=default examplesRoot=examples oozie.libpath=${nameNode}/user/oozie/share/lib oozie.use.system.libpath=true oozie.wf.application.path=${nameNode}/user/${user.name}/portal/shell exec=create.sh 客戶預(yù)警風(fēng)險(xiǎn)統(tǒng)計(jì)和押品預(yù)警風(fēng)險(xiǎn)統(tǒng)計(jì)指標(biāo)如圖3圖4所示。 本文主要闡述了基于大數(shù)據(jù)平臺的信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。使用信貸業(yè)務(wù)數(shù)據(jù)結(jié)合外部數(shù)據(jù),通過大數(shù)據(jù)平臺上實(shí)現(xiàn)信貸風(fēng)險(xiǎn)預(yù)警系統(tǒng),建立360度的風(fēng)險(xiǎn)評估體系。經(jīng)測試證明,此設(shè)計(jì)可以滿足對信貸風(fēng)險(xiǎn)的全方位的評估要求,具有一定的實(shí)用價(jià)值。 圖3 客戶風(fēng)險(xiǎn)預(yù)警指示圖Fig.3 Credit risk pre-warning direction 圖4 押品風(fēng)險(xiǎn)預(yù)警指示圖Fig.4 mortgage risk pre-warning direction [1] 程學(xué)旗, 靳小龍, 王元卓. 大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J].軟件學(xué)報(bào), 20149: 1889-1890.CHEN XueLong, JIN XiaoLong, WAN GYuanZhuo. A review of large data systems and analysis techniques[J]. Journal of software, 20149: 1889-1890. [2] 于千程. 淺析大數(shù)據(jù)時(shí)代下商業(yè)銀行信貸業(yè)務(wù)[J]. 網(wǎng)絡(luò)應(yīng)用, 2014.18: 56-57.YU QianCheng.Analysis of commercial bank credit business in big data Era[J]. network application, 2014. 18: 56-57. [3] 楊艷. 大數(shù)據(jù)環(huán)境下海量多媒體信息過濾技術(shù)改進(jìn)[J]. 西安工程大學(xué)學(xué)報(bào). 2017. 31(4): 569-575.YANG Yan. Improvement of massive multimedia information filtering technology in large data environment[J]. Journal of Xi'an Polytechnic University. 2017. 31(4): 569-575. [4] 杜艷綏. 移動互聯(lián)網(wǎng)環(huán)境下大數(shù)據(jù)的存儲技術(shù)分析[J]. 數(shù)字技術(shù)與應(yīng)用, 2015. 10: 229-230.DU Yan. Analysis of storage technology of large data in mobile Internet environment[J]. Digital technology and Application. 2015. 10: 229-230. [5] 申旭. 住房公積金EXLφ系統(tǒng)的發(fā)展與空間研究[J]. 電子技術(shù)與軟件工程, 2017. 09.SHEN Xu. Development and space research of ECIF system for housing accumulation fund[J]. electronic technology and software engineering.2017. 09. [6] 張敏, 魯筠, 石磊. 基于高層次結(jié)構(gòu)數(shù)據(jù)的多水平發(fā)展模型設(shè)計(jì)及應(yīng)用[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2017. 6: 134-147.ZHANG MIN,LU Jun,SHI Lei. Design and application of multi level development model based on high-level structure data[J]. Quantitative economic, technical and Economic Research. 2017. 6: 134-147. [7] 郭春霞. 大數(shù)據(jù)環(huán)境下高校圖書館非結(jié)構(gòu)化數(shù)據(jù)融合分析[J]. 圖書館學(xué)研究, 2015. 5: 30-34.GUO Chunxia.unstructured data fusion analysis of University Libraries in large data environment[J]. Library Science. 2015.5: 30-34. [8] 薛慧麗, 邵孟良. 移動云環(huán)境下多ΔAΓ節(jié)能調(diào)度算法 山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017, 48(3): 327-333.XUE Huili,SHAO Mengliang. Multi DAG energy saving scheduling algorithm in mobile cloud environment [J] Journal of Shandong Agricultural University (NATURAL SCIENCE EDITION). 2017, 48(3): 327-333. [9] 李飛云, 鄢飛, 張謙. 基于GA-SVW的上市公司財(cái)務(wù)危機(jī)預(yù)警研究[J]. 西安工程大學(xué)學(xué)報(bào). 2010(12): 822-826.LI Feiyun, YAN Fei, ZHANG Qian. Study on financial crisis early warning of listed companies based on GA-SVW[J].Journal of Xi'an Polytechnic University. 2010(12): 822-826.4.4 hive中數(shù)據(jù)傳輸?shù)絆RACLE的實(shí)現(xiàn)
4.5 流程調(diào)度的實(shí)現(xiàn)
5 結(jié)束語