謝瑋 宋杰
9月以來,大數(shù)據(jù)行業(yè)可謂風聲鶴唳。
一時間,魔蝎數(shù)據(jù)、新顏科技、公信寶、快錢支付、天翼征信等公司先后傳來有人被警方帶走調(diào)查的消息。
這令處于大數(shù)據(jù)風控服務核心的——爬蟲技術(shù)推上了風口浪尖,大數(shù)據(jù)行業(yè)也迎來了前所未有的“震蕩”。消息稱,被調(diào)查或是因為這些公司利用網(wǎng)絡(luò)爬蟲技術(shù)侵犯個人隱私數(shù)據(jù),這些隱私數(shù)據(jù)的泄露,加劇了暴力催收的泛濫,助長了“套路貸”“高利貸”。
而港股上市公司51信用卡(02051.HK)被警方突擊調(diào)查的消息,則為這場風波炸響了一聲“驚雷”。10月21日晚,杭州公安通報稱,51信用卡被突擊調(diào)查原因在于,今年9月以來,其委托的外包催收公司冒充國家機關(guān),采取恐嚇、滋擾等軟暴力手段催收債務,涉嫌尋釁滋事。
目前,已經(jīng)有多家大數(shù)據(jù)風控平臺暫停部分服務。大數(shù)據(jù)行業(yè)似乎進入了一個前所未有的“整頓期”。
在近年互聯(lián)網(wǎng)金融大潮中,大數(shù)據(jù)風控供應商一直扮演著重要角色。爬蟲技術(shù)也是大數(shù)據(jù)風控行業(yè)的主打產(chǎn)品。“爬蟲”怎么成了“害蟲”?在互聯(lián)網(wǎng)金融風險整治不斷深化的大背景下,大數(shù)據(jù)風控行業(yè)又將何去何從?
網(wǎng)絡(luò)爬蟲也叫網(wǎng)絡(luò)蜘蛛(spider),是一種自動瀏覽網(wǎng)絡(luò)的計算機技術(shù),能夠自動化、高效率地檢索互聯(lián)網(wǎng)并抓取數(shù)據(jù)。爬蟲技術(shù)也是搜索引擎技術(shù)的核心元素之一,經(jīng)歷了20多年的發(fā)展,已經(jīng)日趨多樣化,在搜索引擎、數(shù)據(jù)分析、人工智能等領(lǐng)域得到了廣泛應用。
此次風波中的公司大多是國內(nèi)較早從事大數(shù)據(jù)風控的服務商,主要為銀行、保險、消費金融公司、貸款機構(gòu)等提供風控技術(shù)解決方案,而其中就包括了爬蟲服務或者基于爬蟲技術(shù)而形成的產(chǎn)品。
知名大數(shù)據(jù)風控平臺同盾科技卷入了此次風波。其旗下子公司信川科技的數(shù)聚魔盒業(yè)務已經(jīng)停止。公開信息顯示,數(shù)聚魔盒主要涉及數(shù)據(jù)采集流程,支持爬取數(shù)據(jù)用作信用評估。
“信川科技是同盾科技下屬獨立運營的子公司,旗下的數(shù)聚魔盒業(yè)務已經(jīng)停止?!蓖芸萍枷嚓P(guān)負責人向《中國經(jīng)濟周刊》記者介紹,數(shù)聚魔盒業(yè)務本身對適用條件與場景有嚴格的授權(quán)要求與限制,為更加嚴格地保護用戶合法權(quán)益,并積極響應國家關(guān)于個人信息保護的相關(guān)政策,去年公司已經(jīng)開始主動收縮該業(yè)務,今年上半年已完全停止。
而背靠中國電信的天翼征信也傳來被調(diào)查的消息。有媒體報道稱,9月12日上午,天翼征信總經(jīng)理、副經(jīng)理以下及市場人員,共計十余人被警察帶走。
天翼征信相關(guān)負責人對《中國經(jīng)濟周刊》記者表示,“我們現(xiàn)在一切都正常,沒有什么太大問題。未來可能將對客戶進行篩選。我們業(yè)務都是合規(guī)的,至于行業(yè)里的傳聞也不太好評價。而關(guān)于有無人員被帶走調(diào)查,對外不做任何回復?!?/p>
爬蟲作為一種計算機技術(shù)具有中立性,在法律上也從未被禁止,為什么這些公司會因為爬蟲技術(shù)而被調(diào)查?
插圖:《中國經(jīng)濟周刊》美編 劉屹鈁
問題的關(guān)鍵在于爬取的行為和爬取獲得的數(shù)據(jù)是否觸及監(jiān)管紅線——是否經(jīng)過授權(quán)?是否過度爬取數(shù)據(jù)?獲取了哪些數(shù)據(jù)?是否為獲取數(shù)據(jù)破壞被爬服務器的防護措施?
前述同盾科技負責人直言,“爬蟲其實是一個中立的技術(shù),但現(xiàn)在可能會有灰色地帶存在?!?h3>“爬蟲”的野蠻生長
在近年來的互聯(lián)網(wǎng)金融大潮中,大數(shù)據(jù)風控服務商扮演著重要角色。
隨著互聯(lián)網(wǎng)金融興起,非銀行金融機構(gòu)如P2P、小貸公司、消費金融公司等都試圖掘金傳統(tǒng)征信數(shù)據(jù)缺失人群。而伴隨用戶金融行為進一步線上化,還產(chǎn)生了除工商財稅、水電煤繳費之外的信息,如支付和交易信息、社交大數(shù)據(jù)信息等等,成為判斷用戶信用水平的重要數(shù)據(jù)類型。
然而,對于這些機構(gòu)而言,自身搭建完整的風控系統(tǒng)成本動輒高達數(shù)千萬。在此背景下,服務金融機構(gòu)以及類金融機構(gòu)的第三方大數(shù)據(jù)風控公司應運而生。
從這些大數(shù)據(jù)風控企業(yè)的合作體量,就可以看出市場需求的旺盛。公開信息顯示,魔蝎科技已與國內(nèi)銀行、保險機構(gòu)、消費金融、互聯(lián)網(wǎng)金融等超過2000家客戶合作。新顏科技合作機構(gòu)2500家以上;數(shù)聚魔盒在2019年3月份下線前,合作企業(yè)超過10000家。
隨著行業(yè)的“野蠻生長”,競爭日益激烈,一些變異的爬蟲產(chǎn)品也隨之出現(xiàn),涉及竊取、泄露、濫用用戶數(shù)據(jù)等。
有業(yè)內(nèi)人士向《中國經(jīng)濟周刊》記者介紹,一些大數(shù)據(jù)風控服務商為了獲取海量數(shù)據(jù),許多非授權(quán)隱私數(shù)據(jù)也會成為爬蟲的目標,甚至用戶手機里的通訊錄、通訊記錄、電商交易數(shù)據(jù)、外賣交易記錄等等,要是被盯上,“基本上你就沒什么秘密了”。
而有些爬蟲技術(shù)則采用“多線程爬取”,從而導致網(wǎng)站癱瘓或不能訪問,這也是大多數(shù)網(wǎng)絡(luò)攻擊所使用的方法之一。
“去年就一直存在個人隱私信息不斷被泄露,部分金融公司通過各種數(shù)據(jù)源對用戶數(shù)據(jù)進行打包出售再加工,嚴重涉及到公民隱私及數(shù)據(jù)安全的問題?!庇袠I(yè)內(nèi)人士對《中國經(jīng)濟周刊》記者表示,有的金融公司通過各種數(shù)據(jù)源對用戶數(shù)據(jù)進行打包出售再加工,嚴重涉及公民隱私及數(shù)據(jù)安全問題。去年問題爆發(fā)得很明顯,主要集中在消費金融和現(xiàn)金貸兩大業(yè)務板塊。
部分拓展在線零售業(yè)務的中小城商行、農(nóng)商行,也會選擇與第三方大數(shù)據(jù)風控公司合作,進行數(shù)據(jù)交叉驗證、豐富風控維度。
在上述業(yè)內(nèi)人士看來,大量第三方數(shù)據(jù)公司為了獲得銀行業(yè)務,會提供大量不同的數(shù)據(jù)源,很多數(shù)據(jù)是“非脫敏”數(shù)據(jù),“銀行業(yè)是一個國家的經(jīng)濟命脈, 這些數(shù)據(jù)提供給銀行就會涉及到金融安全問題?!?/p>
“即便客戶允許你抓取,也是在這一次審批當中可以用,你把這些數(shù)據(jù)留存用于其他場景肯定是不對的。”一位不愿透露姓名的業(yè)內(nèi)人士對《中國經(jīng)濟周刊》記者分析,從對個人信息保護的嚴格意義上講,這些數(shù)據(jù)應當全部銷毀。而部分爬蟲公司并不銷毀歷史上抓取的數(shù)據(jù),同時還提供給其他客戶、其他場景使用。
這位業(yè)內(nèi)人士舉例稱,還有一類公司會采用特殊手段規(guī)避法律風險,“比如:用戶上傳身份證號碼,征信公司直接顯示用戶每個月納稅金額,這肯定觸犯法律。但他們會規(guī)避掉法律風險,用數(shù)據(jù)標簽給用戶的納稅金額打分,比如繳稅1萬元的人就是5分,1萬元以下的就是3分?!?h3>劍指爬蟲,意在數(shù)據(jù)
隨著強監(jiān)管信號的不斷釋放,“野蠻生長”的大數(shù)據(jù)爬蟲時代或?qū)⒔Y(jié)束。在不少業(yè)內(nèi)人士看來,本次整頓也是一個行業(yè)凈化、洗牌的過程,有利于整個行業(yè)更加健康、規(guī)范發(fā)展。
今年5月28日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布了《數(shù)據(jù)安全管理辦法(征求意見稿)》 (下稱“《管理辦法》”),用部門立法的方式對互聯(lián)網(wǎng)數(shù)據(jù)收集、數(shù)據(jù)處理使用,都做了明確的界定。
《管理辦法》第十六條規(guī)定,“網(wǎng)絡(luò)運營者采取自動化手段訪問收集網(wǎng)站數(shù)據(jù),不得妨礙網(wǎng)站正常運行;此類行為嚴重影響網(wǎng)站運行,如自動化訪問收集流量超過網(wǎng)站日均流量三分之一,網(wǎng)站要求停止自動化訪問收集時,應當停止。”
在北京大成律師事務所執(zhí)業(yè)律師、北京網(wǎng)貸協(xié)會法律顧問肖颯看來,沒有授權(quán)的爬蟲就一定是違法的,需要重點整治?,F(xiàn)在的關(guān)鍵是如何面對這些看似“合法”的爬蟲,重中之重就是運營商做到用戶授權(quán)鏈的完整,明晰完整的授權(quán)鏈,做到源頭控制。總的來說,應當盡快制定完善針對網(wǎng)絡(luò)爬蟲的數(shù)據(jù)安全法律法規(guī),將網(wǎng)絡(luò)爬蟲引向合法軌道。若是違法進行網(wǎng)絡(luò)爬蟲,就要重拳出擊,加大懲罰力度和偵查力度,涉及刑事犯罪的要重點處理。
然而,過去一個多月的行業(yè)“震蕩”昭示著,針對大數(shù)據(jù)風控行業(yè)的強監(jiān)管才剛剛開始。
10月24日,有報道稱,央行日前發(fā)文緊急調(diào)研銀行與第三方數(shù)據(jù)公司合作情況。其中,銀行需排查的內(nèi)容主要涉及數(shù)據(jù)采集、信用欺詐、信用評分、風控建模等方面。央行還要求各企業(yè)征信機構(gòu)排查自身業(yè)務中是否存在違規(guī)爬蟲行為。央行表示,如存在上述情況,請立即上報,對于存在違規(guī)爬蟲業(yè)務的要立即整改。如不存在上述情況的,請出具加蓋公章的書面承諾函,并于10月24日前送至央行征信管理處。
責編:陳棟棟 chendongdong@ceweekly.cn
編審:張偉
美編:黃河浪