呂笑顏 石丹
技術的多場景應用,讓很多依靠技術創(chuàng)新的創(chuàng)業(yè)公司誕生。如何有邊界地創(chuàng)新,成為人們關注的話題。
11月15日,同盾科技有限公司(下稱“同盾科技”)發(fā)布聲明稱,其子公司杭州信川科技“未能完全防范極個別‘套路貸等不法分子利用信川產(chǎn)品和服務的情況”,并向公眾道歉。
值得注意的是,前一天公安部曾通報“凈網(wǎng)2019”專項行動典型案例,提到“套路貸”的犯罪鏈條涉及非法獲取公民個人信息的數(shù)據(jù)支撐服務商、負責研發(fā)的技術服務商等。據(jù)《財新》報道,上述數(shù)據(jù)服務商為同盾科技、杭州魔蝎數(shù)據(jù)科技有限公司(下稱“魔蝎科技”)、聚信立和新顏科技。
雖然監(jiān)管意在治理“套路貸”“超利貸”等違規(guī)貸款產(chǎn)品,但是大部分爬蟲服務暫停的影響卻波及到全行業(yè)。事實上,此次專項調查風波目前已經(jīng)波及到銀行。據(jù)業(yè)內(nèi)人士向《商學院》記者透露,10月24日左右,央行發(fā)文緊急調研銀行與第三方數(shù)據(jù)公司合作情況。
整個消費金融行業(yè)猝不及防地迎來了“去爬蟲”時代,尤其是現(xiàn)金貸受影響最大。數(shù)據(jù)缺失,迫使整個消費金融行業(yè)進行風控策略的大調整。
此次爬蟲風波發(fā)生后,行業(yè)內(nèi)討論時普遍認為“技術無罪”,但是實際上在法律中和現(xiàn)實操作中,這句話應該重新理解。爬蟲合規(guī)與違規(guī)的邊界到底應該怎么設置?今后數(shù)據(jù)爬蟲到底能不能用?
數(shù)據(jù)信用行業(yè)正在走向規(guī)范化,此番數(shù)據(jù)爬蟲整治行動也只是開端,未來行業(yè)監(jiān)管趨于常態(tài)化。依靠數(shù)據(jù)得以安身立命的數(shù)據(jù)服務商們未來的路又將何去何從?
針對被查原因、發(fā)展現(xiàn)狀、業(yè)務影響、轉型方向等,商學院記者分別向同盾科技、魔蝎科技、聚信立、新顏科技等方面發(fā)去采訪函,截至發(fā)稿,尚未獲得回復。
11月15日下午,同盾科技發(fā)表公開聲明稱,其旗下獨立運營的子公司杭州信川科技及有關人員正在積極配合警方調查曾經(jīng)服務的某第三方單位。此前同盾科技曾公開表示,信川科技自2018年開始已經(jīng)逐步調整業(yè)務,目前已全部停止相關服務。
事實上,今年9月中旬以來,杭州、上海多家數(shù)據(jù)公司接連被查,包括魔蝎科技、聚信立、同盾科技等,引起行業(yè)震蕩。當時,多位業(yè)內(nèi)人士曾告訴記者,被查原因很可能與違規(guī)使用爬蟲數(shù)據(jù)以及暴力催收有關。
11月14日,公安部在發(fā)布會上通報,此次“凈網(wǎng)2019”專項行動對“套路貸”犯罪開展了全鏈條式打擊,系列行動的起點是今年在黑龍江省七臺河市偵破的“7·30”套路貸專案。
以此案為線索,9月1日以來,公安部網(wǎng)絡安全保衛(wèi)局在全國鏟除了一批幫助犯罪的技術服務商、數(shù)據(jù)支撐服務商、支付服務商,共打掉團伙147個,抓獲嫌疑人1531名。
在數(shù)據(jù)市場,由于爬蟲停止運轉,數(shù)據(jù)的價格正在被急劇抬升。這使得風控成本迅速上升,眾多放貸機構對此并沒有充分的準備,由于替代方案的不成熟以及對新風控措施的觀望,部分貸款產(chǎn)品的壞賬率飆升。
“爬蟲,是整個大數(shù)據(jù)風控行業(yè)的靈魂,是大數(shù)據(jù)風控的底層基石。要做大數(shù)據(jù)風控,先要有豐富的數(shù)據(jù),然后才能運用這些數(shù)據(jù)建立模型,進行信用評價?!蹦车谌姐y行資深風控人士向記者指出,大多數(shù)大數(shù)據(jù)風控公司本身并沒有那么多數(shù)據(jù)。因為數(shù)據(jù)是從業(yè)務當中來的,但是有大量數(shù)據(jù)源的機構實際上并不多,多數(shù)大數(shù)據(jù)風控公司的數(shù)據(jù)是靠爬蟲爬取。爬蟲服務暫停,消費金融行業(yè)的公司都多少受到影響,其中現(xiàn)金貸是重災區(qū),受影響最大的是運營商數(shù)據(jù)和電商數(shù)據(jù)兩種數(shù)據(jù)。該資深風控人士告訴記者,市場上除了極少數(shù)非常頭部的公司的產(chǎn)品之外,大部分現(xiàn)金貸類的產(chǎn)品都受到了影響,同時也包括部分非現(xiàn)金貸場景。據(jù)他估計,無場景現(xiàn)金貸大約占網(wǎng)貸平臺資產(chǎn)的60%~70%。據(jù)他介紹,網(wǎng)貸平臺沒有了爬蟲所提供的數(shù)據(jù),能找到的替代數(shù)據(jù)有限,聯(lián)合建模獲取的數(shù)據(jù)作用并不太理想。因此,許多產(chǎn)品的壞賬率飆升。
運營商數(shù)據(jù)和電商數(shù)據(jù)的缺失,使得大多數(shù)消費金融類公司都不得不調整風控方案。
首先被想到的替代方案是自建爬蟲團隊。
不過,據(jù)上述資深風控人士介紹,這樣做的公司目前并不多。原因是從無到有自建爬蟲團隊的成本比較高,而且要自建爬蟲團隊,關鍵是要挖到合適的人,這方面的人才尚有缺口。更麻煩的是,自建爬蟲團隊恐非長久之計。他說,如果自建爬蟲團隊,還是涉及到爬取數(shù)據(jù)違規(guī)、侵犯個人隱私的問題,問題主要是在“強制授權”上,而不在“雇傭第三方爬”還是“自建團隊爬”上。
自建爬蟲團隊的想法被放棄之后,能否接入別的數(shù)據(jù)源,成為首先被考慮的方向。
據(jù)了解,國慶節(jié)前后,許多有現(xiàn)金貸產(chǎn)品的公司在密切接觸這次受影響不大的機構,如銀行、大互聯(lián)網(wǎng)旗下金融科技公司、頭部P2P平臺、消費金融公司等。據(jù)上述風控人士介紹,機構之間的相互對接,都開始“看身份”。他說:“一方面,一些有數(shù)據(jù)源的機構只愿意與持牌金融機構合作;一方面,持牌金融機構,也要看合作方是否獲得了合法的數(shù)據(jù)源授權。”
事實上,此次受爬蟲暫停影響的并非只有放貸機構,目前還在正常運營的大數(shù)據(jù)風控公司也受到了不小的影響。他說,大數(shù)據(jù)風控平臺之間的數(shù)據(jù)是“你中有我,我中有你”的,大數(shù)據(jù)風控公司的數(shù)據(jù)不僅接給很多貸款公司,也有很多其他的大數(shù)據(jù)風控公司接。爬蟲停止之后,這些公司所應用的數(shù)據(jù)少了一大塊,所以各種評分產(chǎn)品的效力大大下降。
爬蟲風波之后,數(shù)據(jù)的價值迅速凸顯出來,有些握有數(shù)據(jù)的公司坐地起價。據(jù)悉,原先一份運營商報告3毛錢,字段覆蓋很全,也非常有利于做反欺詐和催收。現(xiàn)在運營商報告無法獲取,只能用與數(shù)據(jù)公司聯(lián)合建模方式來獲取運營商信息,比如月流量、通話地區(qū)分布等,這樣使得成本大大提高,價格翻了好幾倍。不少公司看準了數(shù)據(jù)荒所形成的市場空白,趁勢而上。
爬蟲整治風波之下,行業(yè)在等待監(jiān)管下一步動態(tài)的同時,也在尋找目力范圍內(nèi)的可替代方式,聯(lián)合建模被認為是大數(shù)據(jù)風控未來最為合規(guī)的替代方案,行業(yè)對“聯(lián)合建?!标P注度在提升。
不過,最耐人尋味的是,雖然目前聯(lián)合建模的市場熱度有所上升,但是身處其中的公司,差異卻很大:有的公司銷售電話被打爆,有的公司只是業(yè)務的詢問量有一定程度的上升、簽單量也有上升,但是實際成交量并沒有“暴漲”。
據(jù)悉,大數(shù)據(jù)風控行業(yè)最為合規(guī)的業(yè)務——聯(lián)合建模,早在2015年前后就已經(jīng)在市場上出現(xiàn)。聯(lián)合建模的最終目的,就是既保護用戶隱私、又控制好金融風險,因為這項技術可以在雙方數(shù)據(jù)不出本地的情況下,運用數(shù)據(jù)建立風控模型。但是,在此次大部分主流廠商的爬蟲服務暫停之前,聯(lián)合建模市場并不大。
據(jù)上述資深風控人士估計,業(yè)內(nèi)用聯(lián)合建模這種方案進行風險控制的公司大概只占四成,六成的公司都是通過爬蟲獲取數(shù)據(jù)。在他看來,原因主要有兩個:一個是成本,聯(lián)合建模的成本比較高,比如聯(lián)合建模一個模型就需要至少10萬元,質量好一些的聯(lián)合建模,加上商務洽談產(chǎn)生的費用至少30萬,有的則可能高達50萬,對規(guī)模較小的公司來說并不劃算;另一個原因是數(shù)據(jù),不少金融公司主要是看重外部的一些重要數(shù)據(jù)源,而不是建模能力。而在實際業(yè)務中,缺乏數(shù)據(jù)源的聯(lián)合建模,其效果也不是特別好,在市場上缺乏競爭力。他坦言:“雖然說是在找聯(lián)合建模,但其實如果你有獨特的數(shù)據(jù)源,別人才會和你聯(lián)合建模。如果你沒有,只有技術,那就不行?!?p>
據(jù)業(yè)內(nèi)人士向記者透露,聯(lián)合建模這個領域,做得好的公司“悶聲發(fā)大財”,市場上幾乎看不到他們的宣傳。而在到處做市場推廣的公司,實際上業(yè)務做的并不多?!耙驗槟切┳龅煤玫墓静恍枰麄?,全行業(yè)都知道他們?!彼硎尽2贿^,隨著監(jiān)管的加強,聯(lián)合建模被業(yè)內(nèi)認為確實是未來的方向。因為隨著對數(shù)據(jù)合規(guī)的監(jiān)管日益嚴格,聯(lián)合建模將成為不得不選擇的方案。
目前的“數(shù)據(jù)荒”如何應對?一位業(yè)內(nèi)人士坦言:“現(xiàn)在不是應對,而是觀望。在確定監(jiān)管層對爬蟲的明確態(tài)度之前,還沒法確定如何應對?!?/p>
眾所周知,金融的核心環(huán)節(jié)是風控,而作為大數(shù)據(jù)行業(yè)不僅連接著用戶,還面向現(xiàn)金貸公司,是現(xiàn)金貸機構的重要合作伙伴。通過第三方數(shù)據(jù)的服務,一方面能夠為現(xiàn)金貸風控提供安全參考,但另一方面一旦數(shù)據(jù)被販賣、泄露,就會對用戶的隱私造成侵犯,也容易將大數(shù)據(jù)風控行業(yè)推向深淵。
這一切的罪魁禍首就是爬蟲技術。
爬蟲技術本無罪。多位大數(shù)據(jù)風控行業(yè)資深人士向記者表示,不能把爬蟲“妖魔化”。據(jù)百度百科顯示,所謂“爬蟲”其實是一個自動提取網(wǎng)頁的程序,其按照一定的規(guī)則,自動抓取互聯(lián)網(wǎng)信息并存儲到自身數(shù)據(jù)庫的程序或者腳本。在用戶授權后,風控數(shù)據(jù)提供商可通過后臺爬蟲搜集信息,將通話信息、消費數(shù)據(jù)等互聯(lián)網(wǎng)信息整合標準化,最終形成對借款人的綜合評估,供金融機構做相應的后續(xù)決策。
據(jù)業(yè)內(nèi)人士表示:“用爬蟲爬取信息,除了自動化對用戶來說比較省事之外,對放貸機構來講,獲取的數(shù)據(jù)也更真實。很多需要人手填的數(shù)據(jù),都會有造假的成分,因為可以隨意填寫。但是如果用自動化的程序去抓取的話,很多數(shù)據(jù)是無法修改的,部分能修改的用戶臨時修改數(shù)據(jù)也是很難的,因此數(shù)據(jù)真實性更高,有保證。”
據(jù)上述資深風控人士表示:“其實,爬蟲服務本身如果在客戶充分授權的前提下是可以用的,但是因為像一些第三方數(shù)據(jù)平臺使用爬蟲時,他們的數(shù)據(jù)來源往往說不清。更加嚴重的是,這些由爬蟲獲取的數(shù)據(jù),會被一些比較下沉的金融平臺拿去做一些涉及暴力催收的事情?!?/p>
他認為,大數(shù)據(jù)風控服務在實際應用中出現(xiàn)問題的核心在于,爬蟲爬取的數(shù)據(jù)被“二次販賣”,而不是“爬取”這個動作本身。同時,需要特別強調的是,并不是所有應用爬蟲技術的公司都會將數(shù)據(jù)“二次販賣”。
據(jù)他介紹,在實際應用中,搜索引擎就是爬蟲技術的一個較大應用。但是,這個“爬蟲”和這次整治風波中的爬蟲有所不同。搜索引擎的爬蟲,爬取的是公開的網(wǎng)頁信息,并不涉及個人隱私,因此不在這次整治當中。
上述資深風控人士說,在實際的金融領域應用中,爬蟲被用在兩類公司:一類是第三方大數(shù)據(jù)風控公司,一類是頭部網(wǎng)貸平臺。
對于許多小型的網(wǎng)貸公司來說,因為自己養(yǎng)不起爬蟲團隊,一般都會采用第三方大數(shù)據(jù)風控公司提供的服務。第三方風控公司的爬蟲業(yè)務利潤并不豐厚,一般來說爬取一條信息所收取的費用甚至可以低至1毛錢,一個公司單靠這項業(yè)務無法盈利。于是,很多第三方風控公司將爬取的用戶信息存儲、出售給其他公司,從而獲取更多收益。
而頭部放貸機構一般都選擇自建爬蟲團隊。這其中的原因有幾個方面:首先,頭部機構技術力量足夠同時能有客戶授權,比較安全;其次,自建爬蟲團隊,爬取的數(shù)據(jù)更加個性化、更符合業(yè)務需要,因為爬蟲爬來數(shù)據(jù)的廣度和深度直接決定著公司后續(xù)風控的質量,是風控的基礎,頭部放貸機構不愿將業(yè)務的核心放在別人手里;再次,第三方風控公司爬取數(shù)據(jù)之后會進行出售,頭部放貸機構不愿自家的客戶被別的公司搶走,因此傾向于保護數(shù)據(jù)不外泄;此外,如果用戶數(shù)據(jù)被轉賣,會造成多頭借貸,因為別的公司拿到這些用戶的數(shù)據(jù)就會給這些用戶放款,一個用戶在多家借款,會影響這個用戶的最終還款。因此,轉賣用戶數(shù)據(jù)和頭部放貸機構的商業(yè)利益是根本違背的。
對于爬蟲的應用邊界,多位大數(shù)據(jù)風控業(yè)內(nèi)人士表示,業(yè)內(nèi)形成的共識是:只要數(shù)據(jù)使用有個人明確授權,把授權給誰、用途說清楚,爬蟲并非不能使用。
上海交通大學數(shù)據(jù)法律研究中心執(zhí)行主任何淵表示,官方的態(tài)度實際上是很明確的,數(shù)據(jù)并不是不能爬,“說得很清楚,收集的時候不能采取妨礙網(wǎng)站的正常運行,甚至有一個尺度,流量不能超過別人網(wǎng)站的1/3?!焙螠Y認為,金融數(shù)據(jù)爬蟲到底能不能爬?關鍵看三個點:爬的什么東西?怎么爬?爬的合法數(shù)據(jù)用來干什么?“這三點決定你是不是犯罪,是不是違法?!?/p>
此前,10月8日,中國人民大學國家發(fā)展與戰(zhàn)略研究院金融科技與互聯(lián)網(wǎng)安全研究中心主任楊東在人民政協(xié)報上撰文《依法保護金融數(shù)據(jù)》,其中提到盡管紛擾不斷,但傳統(tǒng)金融機構線上化進程不可逆轉。當前的緊要任務,是推動形成金融監(jiān)管機構、行業(yè)頭部企業(yè)與法律界等共同研究探討的善治局面,鼓勵科技向善。同時,針對當前數(shù)據(jù)分析行業(yè)的弊端,他提出了幾點應對措施,其中包括:第一,金融監(jiān)管機構出臺金融業(yè)個人數(shù)據(jù)保護合規(guī)操作指南;第二,建立個人數(shù)據(jù)保護的行業(yè)自律組織;第三,以合規(guī)供應商清單的方式促進數(shù)據(jù)分析行業(yè)的發(fā)展。
目前,對個人金融數(shù)據(jù)監(jiān)管最具針對性的一部法律是《個人金融信息(數(shù)據(jù))保護試行辦法》。此前據(jù)媒體報道,《個人金融信息(數(shù)據(jù))保護試行辦法(初稿)》已經(jīng)出爐,央行已經(jīng)下發(fā)到各家銀行,目前正在征求意見中。