• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      金融科技在互聯(lián)網(wǎng)金融行業(yè)性風險防范領域的應用

      2018-03-01 03:48:53胡鵬飛
      大數(shù)據(jù) 2018年1期
      關鍵詞:數(shù)據(jù)源欺詐圖譜

      胡鵬飛

      北京宜信致誠信用管理有限公司,北京 100022

      1 引言

      2006—2016年,中國的普惠金融已經(jīng)發(fā)展成為中國金融體系的重要組成部分,隨著行業(yè)監(jiān)管細則的不斷落地,行業(yè)發(fā)展愈加有章可循。但與此同時,借款人的信用風險(借款人多頭負債和欺詐風險)嚴重影響了行業(yè)的健康發(fā)展。這些風險如果得不到很好的防控,很可能會演化成一個行業(yè)的系統(tǒng)性風險。在此背景下,如何做好風險管理與防范成為行業(yè)發(fā)展的重中之重。

      2 互聯(lián)網(wǎng)金融行業(yè)面臨的挑戰(zhàn)

      隨著互聯(lián)網(wǎng)金融行業(yè)規(guī)模的不斷擴大,借款需求持續(xù)增加,行業(yè)整體的風控水平亟待提升,主要面臨的挑戰(zhàn)包括以下3點。

      ● 行業(yè)數(shù)據(jù)“孤島”現(xiàn)象嚴重?;ヂ?lián)網(wǎng)金融機構每天都會接到大量借款申請,但由于缺乏數(shù)據(jù)共享機制,機構獲知有關借款人的信用數(shù)據(jù),特別是強金融屬性數(shù)據(jù)的難度非常大。一方面導致機構無法有效判斷客戶的風險等級,另一方面也導致多頭負債現(xiàn)象頻生。這就需要通過技術手段實現(xiàn)信用信息的互聯(lián)互通,并從海量數(shù)據(jù)中挖掘有效信息用以識別信用風險。

      ● 行業(yè)惡意欺詐現(xiàn)象越來越嚴重,欺詐手段不斷翻新,且趨于科技化、專業(yè)化、規(guī)模化,也更具有隱蔽性,這已經(jīng)嚴重制約了互聯(lián)網(wǎng)金融行業(yè)的健康發(fā)展。

      ● 金融科技在風控制領域滲透度低,行業(yè)機構的風控水平參差不齊,很多機構仍采用線下人工的傳統(tǒng)信用審計方式,缺乏金融科技的應用與助力,在風控成本、風控質量、風控時效性上均無法滿足實際的業(yè)務需求。

      因此,首先應當解決行業(yè)數(shù)據(jù)割裂的瓶頸,形成了一個行業(yè)機構間的共享生態(tài)系統(tǒng),實現(xiàn)互聯(lián)網(wǎng)金融行業(yè)數(shù)據(jù)的互聯(lián)與互通,有效防范行業(yè)多頭負債的發(fā)生。其次,應擁有強大的信用數(shù)據(jù)分析與挖掘能力,推動數(shù)據(jù)在風控決策中的運用,幫助機構防范信用風險。最后,應最大化地將金融科技與業(yè)務融合,并通過量化評分、風險分級,對風險實現(xiàn)最優(yōu)排序性和區(qū)分度,準確識別用戶欺詐的可能性,精準反饋風險信息。

      3 技術難點及應對思路

      為了解決當前互聯(lián)網(wǎng)金融行業(yè)面臨的挑戰(zhàn),防范行業(yè)系統(tǒng)性風險的集中爆發(fā),推動行業(yè)健康發(fā)展,北京宜信致誠信用管理有限公司(以下簡稱致誠信用)推出了致誠阿福風控平臺(以下簡稱阿福平臺),以共享為核心,基于強金融屬性數(shù)據(jù)及先進風控經(jīng)驗、大數(shù)據(jù)分析應用及評分建模能力,采用分布式服務化的系統(tǒng)架構,通過RESTful應用程序編程接口(application programming interface,API)方式提供海量數(shù)據(jù)對接查詢服務,幫助信貸機構防范在貸前調查、貸中授信和貸后管理中因信息不對稱帶來的潛在風險。除此之外,還將知識圖譜、大數(shù)據(jù)分析等金融科技應用于信用審計風控領域,以提升機構風險管理的效率和效果,讓金融科技成為金融行業(yè)發(fā)展的動力。這是專為網(wǎng)絡借貸機構、消費信貸、小額信貸、銀行信用卡中心等提供身份識別、反欺詐、信用評估等服務的一站式智能風控云平臺。

      在開發(fā)阿福平臺的過程中,存在一些技術上的難點,主要包括以下幾個問題。

      (1)第三方機構的系統(tǒng)穩(wěn)定性問題

      第三方機構系統(tǒng)規(guī)范程度不同,提供服務的能力參差不齊,如果千萬級的訪問量直接運行在第三方機構的系統(tǒng)上,絕大部分系統(tǒng)都難以承載。即使有緩存層作為防護,還是會存在緩存穿透的可能性,導致大量請求涌入第三方機構,引發(fā)機構的服務“雪崩”。因此,一方面要做好監(jiān)控預警,另一方面也要充分挖掘第三方機構的系統(tǒng)承載潛力。因此,提出了第三方機構系統(tǒng)“健康度”的概念。

      健康度是根據(jù)第三方機構歷史吞吐量、響應時間、服務返回數(shù)據(jù)質量綜合計算得出的。在分發(fā)請求時,會根據(jù)健康度智能決定查詢數(shù)據(jù)的方式。如果健康度高,能夠滿足秒級響應,則實時反饋查詢結果;如果健康度一般,則從緩存獲取,隨后異步請求機構,更新緩存內容,從而保證秒級響應;如果健康度差,則直接從緩存獲取數(shù)據(jù)。同時,監(jiān)控系統(tǒng)也會檢測到機構的健康度問題,及時和第三方機構進行溝通處理。

      (2)并發(fā)訪問性能問題

      由于對并發(fā)訪問性能有很高的要求,需要應對10億級的被查歷史數(shù)據(jù)量、千萬級訪問請求量、億級的請求分發(fā)量、秒級的訪問響應時間,因此通過優(yōu)化緩存命中率和并發(fā)訪問調度機制來解決。

      首先,建立多級緩存機制,包含內存級緩存和固態(tài)硬盤(solid state drive,SSD)級緩存,內存級緩存過期時間為24 h,SSD級緩存過期時間為7天(可配置),在兩級緩存的作用下,緩存命中率將達到80%以上,緩存集群采用Redis集群方式部署。緩存失效分為主動失效和被動失效,被動失效采用最近最少使用(least recently used,LRU)算法,主動失效為確保查詢的信息準確性,在系統(tǒng)容量充足且第三方機構健康度指標達標的情況下,主動發(fā)起信息更新行為。

      其次,采用NIO+連接池的方式提高并發(fā)訪問性能,減少分布式鎖的使用,同時通過多級測試獲得單個服務節(jié)點的服務能力上限,使線程數(shù)為最佳設置值,最大限度地利用系統(tǒng)性能。

      (3)異構數(shù)據(jù)處理問題

      將知識圖譜技術應用于信用審計風控領域,可提升機構風險管理的效率和效果。在構建知識圖譜的過程中,需要處理大量的不同數(shù)據(jù)源的異構數(shù)據(jù),如果針對每一個新增的數(shù)據(jù)源都寫一個對應的適配器,會極大地影響開發(fā)效率,增加維護難度。因此,可通過引入MoonBox和Wormhole解決異構數(shù)據(jù)處理問題。

      通過引入上述技術,可以實現(xiàn)支持自動適配不同數(shù)據(jù)源(包括My SQ L、Oracle、HDFS、MongoDB等)、透明化異構數(shù)據(jù)系統(tǒng)異構交互方式、跨異構數(shù)據(jù)系統(tǒng)混算。Wormhole還可提供可視化的操作界面、極簡的配置流程、基于SQL的業(yè)務開發(fā)方式,并屏蔽大數(shù)據(jù)處理底層技術細節(jié),使知識圖譜項目開發(fā)和管理變得更加可控可靠。

      4 平臺架構

      阿福平臺采用分布式架構設計,系統(tǒng)主要包括展示層、服務層、消息層、緩存層、數(shù)據(jù)層、監(jiān)控層6部分,涵蓋了從用戶請求接收和分發(fā)、異構數(shù)據(jù)的接入和歸一化處理、數(shù)據(jù)模型的構建、對外服務能力的輸出以及系統(tǒng)整體健康度的檢測和預警等內容,系統(tǒng)架構如圖1所示。

      圖1 系統(tǒng)架構

      (1)展示層

      通過使用Shrio和分布式會話管理技術,支持不同機構用戶動態(tài)展示不同菜單功能項,優(yōu)化了展示效果。同時通過使用單點登錄(single sign on,SSO)技術,提供各子系統(tǒng)用戶統(tǒng)一信息查詢入口,包括通過用戶界面(user interface,UI)直接查詢和通過RESTful API批量查詢,在確保用戶體驗的基礎上,滿足了用戶多種查詢模式的需求。

      (2)服務層

      將Dubbo作為分布式服務框架,使用ZooKeeper提供服務的自動注冊與發(fā)現(xiàn),使用Hystrix提供服務熔斷機制,使用UAVStack提供服務限流和降級、自動化應用/服務畫像、無侵入調用鏈跟蹤、一站式線程分析、秒級大規(guī)模服務圖譜繪制、瀏覽器訪問跟蹤、多維可視化看板等功能。

      (3)消息層

      使用Kafka和RocketMQ提供消息服務,其中Kafka應用于日志信息同步,RocketMQ應用于訂單等要求高可用的使用場景。構建統(tǒng)一的消息中心,支持多種消息中間件,同時抽象出消息的發(fā)送和接收、消息限流、消息去重等功能。

      (4)緩存層

      使用R e d i s、M e m c a c h e等建立CacheManager,提供統(tǒng)一緩存服務接口、分布式鎖服務,同時針對對象存儲提供透明的序列化/反序列化服務,支持無縫擴展NoSQL數(shù)據(jù)源。

      (5)數(shù)據(jù)層

      采用MySQL+HBase集群的方式,其中MySQL采用Sharding-JDBC進行分庫分表,同時為提高讀取性能,采用了讀寫分離技術,一主多從。使用DBus進行流式同步,解決不同業(yè)務系統(tǒng)的數(shù)據(jù)源的同步效率問題,使數(shù)據(jù)同步效率從原來的T+1提高到準實時。

      (6)監(jiān)控層

      建立多級監(jiān)控體系,引入E L K+UAVMonitor ,能夠對虛擬機、Docker、物理機的基礎性能指標、Java虛擬機、線程狀態(tài)、服務整體生命周期、服務調用棧、統(tǒng)一日志、數(shù)據(jù)庫連接池等進行全面監(jiān)控和預警。

      圖2 知識圖譜架構

      5 知識圖譜在平臺的應用

      平臺將知識圖譜技術應用在反欺詐領域,為傳統(tǒng)風控帶來了極具競爭力的革新。目前利用致誠信用11年來的海量數(shù)據(jù),構建了一個包含企業(yè)實體超過1億、人的實體超過4 000萬、關系量超過50億的知識圖譜。

      知識圖譜對數(shù)據(jù)的存儲和組合有巨大優(yōu)勢,但是不利于進一步的分析,因此結合金融行業(yè)的特點,形成了一個更適用于金融場景的社交網(wǎng)絡圖譜。不同于微信、微博等一般社交網(wǎng)絡,金融場景下的社交網(wǎng)絡更為稀疏,且節(jié)點含有豐富的金融屬性,狀態(tài)變化頻繁。社交網(wǎng)絡的屬性描述如下。

      ● 節(jié)點:基于貸前貸后數(shù)據(jù)進行用戶畫像,如進件次數(shù)、被拒次數(shù)、最近申請時間等。

      ● 邊:把實體關系細分為o w n、contact、call等,并通過組合得到人與人之間的不同關系。

      構建知識圖譜基于的數(shù)據(jù)來源于兩大塊數(shù)據(jù)源:一是軟件開發(fā)工具包(software development kit,SDK)傳遞的用戶設備數(shù)據(jù),如設備基本信息、IP地址信息、全球定位系統(tǒng)(global positioning system,GPS)信息等;二是致誠信用歷史用戶授權信息。針對不同的數(shù)據(jù)源,采用不同的處理方式。對于實時數(shù)據(jù),基于Spark Streaming開發(fā)了數(shù)據(jù)導入工具,對其進行數(shù)據(jù)清洗、格式轉換、自然語言處理等相關操作,可以在秒級時延內將數(shù)據(jù)導入系統(tǒng)。對于一些歷史數(shù)據(jù),使用Spark和MapReduce進行處理。另外,對于已經(jīng)存儲的社交網(wǎng)絡數(shù)據(jù),可以通過RESTful API方式進行查詢,也可以將數(shù)據(jù)導入Hive中,供數(shù)據(jù)分析人員進行數(shù)據(jù)分析。知識圖譜架構如圖2所示。

      通過構建的知識圖譜,可以進行圖特征提取,計算人脈信用得分和反欺詐得分,進行觸黑關聯(lián)查詢等,其應用如圖3所示。

      圖3 知識圖譜的應用

      6 應用效果

      (1)大幅提升信審時效

      通過強大的信用數(shù)據(jù)分析與挖掘能力,解決了行業(yè)數(shù)據(jù)割裂的瓶頸,在得到客戶授權的前提下,以共享為基礎,通過分布式架構設計及API調用技術,形成了一個行業(yè)機構間的共享生態(tài)系統(tǒng),實現(xiàn)了互聯(lián)網(wǎng)金融行業(yè)數(shù)據(jù)的互聯(lián)與互通,有效防范了行業(yè)多頭負債的發(fā)生。截至2017年10月,阿福平臺已經(jīng)為行業(yè)累計預警多頭借貸1 733萬次。其中,在2家及以上機構申請借款的總人數(shù)達443萬人,在5家及以上機構申請借款的總人數(shù)達137.8萬人,同一借款人最多向30家機構申請了借款。此外,還幫助行業(yè)機構將傳統(tǒng)線下審批模式升級為線上智能決策的模式,并成功解決了千萬級并發(fā)訪問性能問題,實現(xiàn)了查詢結果秒級反饋,大大降低了風控成本,提升了信用審計效率。

      (2)提升行業(yè)反欺詐能力

      以知識圖譜為底層架構建立了反欺詐的風控體系,創(chuàng)新性地研發(fā)了福網(wǎng),以經(jīng)過校驗核實的多條業(yè)務線的風險數(shù)據(jù)、社交數(shù)據(jù)以及其他數(shù)據(jù)為基礎進行整合,在提升數(shù)據(jù)純度的基礎上,有效釋放了數(shù)據(jù)價值,通過自然語言處理、機器學習、聚類算法等方法構建了模型,創(chuàng)建了多維度數(shù)據(jù)畫像。通過量化評分、風險分級,對風險實現(xiàn)最優(yōu)排序性和區(qū)分度,準確識別用戶欺詐的可能性,并為機構反饋精準且區(qū)隔度高的風險信息。在欺詐客戶的造假手段識別,構建客戶知識圖譜、社交關系網(wǎng)絡,從更多維度識別隱蔽性欺詐、團體欺詐預警等方面,都取得了非常好的防范效果。截至2017年10月,阿福平臺有效識別欺詐借款人31 784人,攔截欺詐申請109 367次。

      [1] ABREU D D, FLORES A, PALMA G, et al.Choosing between graph databases and RDF engines for consuming and mining linked data[C]//The 4th International Conference on Consuming Linked Data,July 13, 2013, Sydney, Australia. Aachen:CEUR-WS.org, 2013: 37-49.

      [2] BORDES A, USUNIER N, WESTON J, et al.Translating embeddings for modeling multi-relational data[C]//The 26th International Conference on Neural Information Processing Systems,December 5-10, 2013, Lake Tahoe, USA.New York: Curran Associates Inc., 2013:2787-2795.

      [3] JENATTON R, ROUX N L, BORDES A, et al.A latent factor model for highly multirelational data[C]//The 25th International Conference on Neural Information Processing Systems, December 3-6,2012, Lake Tahoe, USA. New York:Curran Associates Inc., 2012: 3167-3175.

      猜你喜歡
      數(shù)據(jù)源欺詐圖譜
      關于假冒網(wǎng)站及欺詐行為的識別
      眼科新進展(2023年9期)2023-08-31 07:18:36
      關于假冒網(wǎng)站及欺詐行為的識別
      繪一張成長圖譜
      警惕國際貿易欺詐
      中國外匯(2019年10期)2019-08-27 01:58:04
      Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
      補腎強身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      基于不同網(wǎng)絡數(shù)據(jù)源的期刊評價研究
      主動對接你思維的知識圖譜
      網(wǎng)購遭欺詐 維權有種法
      基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質量評價算法
      夹江县| 绥中县| 郑州市| 大丰市| 克什克腾旗| 吉安市| 武隆县| 始兴县| 宜宾市| 塘沽区| 阿克苏市| 定边县| 锡林浩特市| 瓮安县| 盐边县| 新源县| 富民县| 景泰县| 白朗县| 安岳县| 靖安县| 大港区| 宁德市| 高雄市| 梅州市| 平度市| 三河市| 深圳市| 大城县| 宜城市| 抚顺市| 三台县| 丹东市| 巨野县| 浪卡子县| 罗定市| 孟连| 兴国县| 民丰县| 根河市| 六枝特区|