黃芳芳
2017年5月末,大數(shù)據(jù)行業(yè)被媒體貼上“監(jiān)管趨緊”“大洗牌”“灰色數(shù)據(jù)交易”的標(biāo)簽,并稱多家大數(shù)據(jù)公司被列入監(jiān)管的調(diào)查名單之中。
“被調(diào)查”風(fēng)波
數(shù)據(jù)堂被某媒體報道“中槍”后的第4天,在全國中小企業(yè)股份轉(zhuǎn)讓系統(tǒng)(新三板)網(wǎng)站上發(fā)布臨時公告稱:“公司某一客戶存在被公安機(jī)關(guān)調(diào)查的情況,公安機(jī)關(guān)為進(jìn)一步了解具體情況,向公司個別業(yè)務(wù)人員及財務(wù)人員進(jìn)行情況了解,不存在傳聞‘公司高管被抓的情形。”
“對于多家大數(shù)據(jù)公司被調(diào)查的報道目前還無法證實?!卑⒗飻?shù)據(jù)經(jīng)濟(jì)研究中心秘書長潘永花告訴《經(jīng)濟(jì)》記者,但從側(cè)面來看,個人信息保護(hù)受到監(jiān)管層的重視?!氨槐O(jiān)管查出問題的企業(yè)在數(shù)據(jù)交易方面,或多或少存在違規(guī)現(xiàn)象?!敝埃皵?shù)據(jù)灰色地帶或許被行業(yè)或監(jiān)管部門所容忍。但2017年6月1日《網(wǎng)絡(luò)安全法》正式實施以后,清理不規(guī)范企業(yè)對整個產(chǎn)業(yè)規(guī)范化發(fā)展是有利的。”
在大數(shù)據(jù)行業(yè)15年之久的貝格大數(shù)據(jù)總裁李常青告訴《經(jīng)濟(jì)》記者,它出現(xiàn)的背景是《網(wǎng)絡(luò)安全法》,將來無論是對不合規(guī)企業(yè)約談還是處罰,都會促進(jìn)行業(yè)的健康發(fā)展。
“一直以來,國家對數(shù)據(jù)的灰色交易打擊很嚴(yán)厲,該抓的抓,但不能說是針對大數(shù)據(jù)行業(yè)進(jìn)行的?!本糯畏酱髷?shù)據(jù)創(chuàng)始人王叁壽對《經(jīng)濟(jì)》記者表示,對于打擊灰色數(shù)據(jù)交易,首先要從打擊內(nèi)鬼開始,我們經(jīng)常看到手機(jī)號碼泄密或各種賬戶泄密問題,“很多數(shù)據(jù)外流都是因為內(nèi)鬼?!?/p>
《最高人民法院、最高人民檢察院關(guān)于辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》規(guī)定了非法獲取或出售50條以上個人信息,以及違法所得5000元以上等均可入罪。潘永花指出,法律填補(bǔ)了我國個人信息保護(hù)的空白,是對打擊非法數(shù)據(jù)交易的重要依據(jù)。
數(shù)據(jù)確權(quán)之困
“過去我們也有過困惑,非法交易數(shù)據(jù)很容易賺錢,但通過正常的技術(shù)采集、清洗、加工的大數(shù)據(jù)公司卻賺錢不易。這很不正常?!蓖跞壅f。
“幾個人或幾十個人的團(tuán)隊攢點數(shù)據(jù)就去賣錢,這些底層數(shù)據(jù)的價格便宜,很容易產(chǎn)生暴利,也激活了很多公司的內(nèi)鬼?!蓖跞壑赋?,這種行為對合法的數(shù)據(jù)流通會造成負(fù)面影響。
“一個人買了別人偷來的手機(jī),這是什么性質(zhì)?”王叁壽向《經(jīng)濟(jì)》記者透露,采購數(shù)據(jù)機(jī)構(gòu)不乏保險公司和銀行,包括小貸公司、互聯(lián)網(wǎng)金融公司,他們交易的數(shù)據(jù)的確不是他們偷的,但是他們買了小偷的數(shù)據(jù)?!昂弦?guī)的金融機(jī)構(gòu)不應(yīng)該去采購沒有經(jīng)過確權(quán)的數(shù)據(jù)?!?/p>
“令我們最為困惑的是數(shù)據(jù)確權(quán)問題。比如,政府的數(shù)據(jù)就應(yīng)該是政府,醫(yī)院、電信運(yùn)營商的數(shù)據(jù)也應(yīng)該屬于他們自己?!碧詫毶系馁徫飻?shù)據(jù)到底屬于誰的,國家一直沒有明確規(guī)定。王叁壽認(rèn)為,國家應(yīng)該盡快出臺關(guān)于數(shù)據(jù)確權(quán)的法律,也有利于打擊灰色數(shù)據(jù)交易。
“數(shù)據(jù)作為一種新的資產(chǎn)類型,哪些數(shù)據(jù)是屬于個人的,哪些是屬于企業(yè)的,哪些是可以交易的,未來都會有一個界定?!崩畛G啾硎荆F(xiàn)在除了國家安全、個人信息等數(shù)據(jù)不能交易,其他數(shù)據(jù)仍是混沌狀態(tài)。他建議,數(shù)據(jù)交易可以先從公開渠道披露的數(shù)據(jù)入手,比如上市公司披露的報表、行情、價格等數(shù)據(jù)進(jìn)行加工整合,給客戶一些預(yù)測性意見。再如,淘寶等電商積累的消費數(shù)據(jù)雖然不能交易,但由此形成的快消品報告是可以銷售的。
“在產(chǎn)業(yè)界,非個人數(shù)據(jù)交易也很多?!蹦持髷?shù)據(jù)交易平臺CTO陳逸云告訴《經(jīng)濟(jì)》記者,我們自己采集、加工的數(shù)據(jù),不涉及具體的人或物,甚至沒有特定物體的標(biāo)識,像人工智能、無人駕駛等企業(yè)對這些數(shù)據(jù)的需求量大?!暗珨?shù)據(jù)的版權(quán)問題至今無解。我們提供的數(shù)據(jù)被用戶買走后再復(fù)制傳播,我們毫無辦法,唯一的生存之道就是不斷地做新數(shù)據(jù)。”
數(shù)據(jù)交易之困
未來需要數(shù)據(jù)化、智能化的事物無窮無盡。東興軟件股份公司大數(shù)據(jù)事業(yè)部副總經(jīng)理張涵誠指出,產(chǎn)業(yè)尚未形成規(guī)模,“未來企業(yè)在數(shù)據(jù)生態(tài)中的競爭也是無窮無盡的。”
“大數(shù)據(jù)的行業(yè)規(guī)則仍不明晰,只在細(xì)分領(lǐng)域有所突破?!弊?012年開始關(guān)注大數(shù)據(jù)行業(yè)的騰訊研究院首席經(jīng)濟(jì)學(xué)家、產(chǎn)業(yè)與經(jīng)濟(jì)研究中心主任孟昭莉?qū)Α督?jīng)濟(jì)》記者表示,整體產(chǎn)業(yè)沒有規(guī)范化,目前還沒有成熟或被大家所認(rèn)可的商業(yè)模式出現(xiàn),市場還沒有發(fā)展起來。行業(yè)較為關(guān)注的大數(shù)據(jù)交易,其交易規(guī)則、定價、數(shù)據(jù)所有權(quán)以及數(shù)據(jù)盈利如何分配等問題仍在探索之中。
“如果賣給你不需要的數(shù)據(jù),你1分錢都不會出。如果是你需要的數(shù)據(jù),100元你也愿意出?!蓖跞壅J(rèn)為,定價不是問題,也不是影響數(shù)據(jù)交易產(chǎn)業(yè)發(fā)展的主因?!拔覀冏罱诳紤]數(shù)據(jù)拍賣的事情。一組脫敏的數(shù)據(jù),某家公司比其他10家出的價格高,就可以獨享這些數(shù)據(jù)。”
中國電子信息產(chǎn)業(yè)發(fā)展研究院互聯(lián)網(wǎng)研究所副所長陸峰告訴《經(jīng)濟(jì)》記者,應(yīng)該鼓勵發(fā)展大數(shù)據(jù)交易,健全數(shù)據(jù)開放、共享、流通、交易、使用相關(guān)規(guī)章制度,以及加強(qiáng)對數(shù)據(jù)采集、存儲、傳輸、交易、流通、使用等過程中數(shù)據(jù)保護(hù)技術(shù)的研究,提高技術(shù)自主可控能力。
數(shù)據(jù)交易所是一個很好的探索。張涵誠認(rèn)為,但目前仍處在發(fā)展初期。“目前數(shù)據(jù)交易所仍采取傳統(tǒng)的會員制?!彼鼪]有進(jìn)一步解決數(shù)據(jù)存儲、確權(quán)、脫敏等問題。
脫敏是實現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)的一種技術(shù)?!皵?shù)據(jù)脫敏本身不是技術(shù)難題,但問題是數(shù)據(jù)到底要脫敏到什么程度?”李常青指出,企業(yè)拿到工商局網(wǎng)站上的數(shù)據(jù)做了MD5的身份驗證,但很容易通過身份證號來推導(dǎo),這種脫敏的意義就不大。
“底層數(shù)據(jù)好比泉水,脫敏以后可以把它變成農(nóng)夫山泉或依云礦泉水?!蓖跞郾硎?,脫敏肯定會增加成本,數(shù)據(jù)的采集、清洗、脫敏的程序,類似大數(shù)據(jù)領(lǐng)域的“富士康”,要依靠大量的人工成本支撐,這也是大數(shù)據(jù)分析師的由來。
“做數(shù)據(jù)生意的人丟單率比較高?!睆埡\指出,“業(yè)務(wù)談了一段時間,談著談著就崩了?!?/p>
“客戶買不到想要的數(shù)據(jù),這是買方市場最大的困惑?!睌?shù)據(jù)公司提供的往往不是買方真正的需求,或者能夠支撐起業(yè)務(wù)的數(shù)據(jù)。賣方也很難按照買方的邏輯加工數(shù)據(jù)?!皵?shù)據(jù)是多重要的資源,哪能你想要啥就給你啥?”很多數(shù)據(jù)都是在業(yè)務(wù)過程中產(chǎn)生的?!拔覀兌甲鐾瑯拥纳?,我怎么愿意把自己的數(shù)據(jù)給你呢?所以,真正有價值的數(shù)據(jù),別人是不愿意出售的?!?/p>
“客戶的確對大數(shù)據(jù)很挑剔?!标愐菰票硎荆拔覀冊跀?shù)據(jù)質(zhì)量、模式、交付方式以及后期數(shù)據(jù)質(zhì)保等一系列流程都要考量加工完的數(shù)據(jù)是否是最終用戶需要的東西,并按照他們的標(biāo)準(zhǔn)去交付?!?/p>
應(yīng)用之困
“目前非盈利、匿名化,不涉及個人信息的大數(shù)據(jù)應(yīng)用是公眾比較接受的?!?/p>
大家越來越多地意識到,政府部門擁有很多有價值的數(shù)據(jù)。政府也意識到這一點。孟昭莉指出,政府?dāng)?shù)據(jù)在某些公共服務(wù)領(lǐng)域凸顯出數(shù)據(jù)的應(yīng)用價值。比如,通過地理位置、熱地圖等信息判斷某地的交通狀況、出行狀況。去年武漢的那場暴雨,受災(zāi)面積廣泛。“今年則不同,比如一個人發(fā)布某地鐵站進(jìn)水較深,當(dāng)這些數(shù)據(jù)通過眾包的模式收集起來,政府利用這些信息進(jìn)行提前預(yù)警?!?/p>
“利用人臉識別技術(shù)尋找丟失小孩的應(yīng)用也有價值?!泵险牙虮硎荆?dāng)前人臉識別率已達(dá)到98%的精準(zhǔn)度,正是通過大數(shù)據(jù)、人工智能技術(shù)來尋找失聯(lián)的孩子。
“很多時候,我們拿到的數(shù)據(jù)需要進(jìn)行二次加工。”李常青表示,數(shù)據(jù)在使用的過程中需要通過它們之間的關(guān)聯(lián)性發(fā)掘一些有價值的東西。譬如,某機(jī)械加工廠得知螺紋鋼漲價了,過去他會覺得生產(chǎn)成本增加了得趕緊購買原材料。但現(xiàn)在他可以通過歷史數(shù)據(jù)去了解行業(yè)下游的需求?!斑@才是大數(shù)據(jù)應(yīng)用的意義?!?/p>
“好的數(shù)據(jù)產(chǎn)品會說話?!睆埡\指出,隨著醫(yī)保、社保、交通、水電煤氣等政務(wù)數(shù)據(jù)不斷地被政府釋放出來,應(yīng)該開發(fā)更有價值的數(shù)據(jù)產(chǎn)品。“像查詢企業(yè)信用的數(shù)據(jù)產(chǎn)品在銷售環(huán)節(jié)既有章可循,也可以產(chǎn)生一定的經(jīng)濟(jì)效益。”
“我們很早就使用大數(shù)據(jù)、云計算為客戶提供服務(wù)了?!蹦炒髷?shù)據(jù)企業(yè)創(chuàng)始人沈立勤對《經(jīng)濟(jì)》記者表示,“但目前我更關(guān)注的是AI(人工智能)?!?/p>
“大數(shù)據(jù)是AI的基礎(chǔ)?!泵险牙虮硎?,“我們至少需要大量的數(shù)據(jù)來喂養(yǎng)一個AI?!盜BM的AI機(jī)器人沃森可以學(xué)習(xí)各種病例,比人類學(xué)得快,積累得多。谷歌的AlphaGo也是通過大數(shù)據(jù)學(xué)習(xí),戰(zhàn)勝了李世石和柯潔。“沒有數(shù)據(jù),AI很難實現(xiàn)??梢灶A(yù)見,未來3-5年,大數(shù)據(jù)和AI將是高熱投資區(qū)域?!?/p>
監(jiān)管之困
目前數(shù)據(jù)非法交易的監(jiān)管難度較大。陸峰告訴《經(jīng)濟(jì)》記者,一方面非法數(shù)據(jù)交易信息互聯(lián)網(wǎng)傳播渠道尚未被及時、有效切斷,多部門協(xié)同打擊的常態(tài)化機(jī)制尚未建立。另一方面,非法數(shù)據(jù)交易傳統(tǒng)打擊手段難以有效應(yīng)對,網(wǎng)絡(luò)化和平臺化監(jiān)管治理模式尚未建立。
“貴陽大數(shù)據(jù)交易所探索了兩年多,交易量才突破1億元,但是黑市交易的數(shù)據(jù)量至少是我們的99倍!”王叁壽的另一個身份是貴陽大數(shù)據(jù)交易所執(zhí)行總裁。他認(rèn)為,區(qū)塊鏈技術(shù)可以有效打擊數(shù)據(jù)非法流通問題。“目前交易所就采用了區(qū)塊鏈技術(shù),相當(dāng)于給數(shù)據(jù)加了一個GPS,可以對交易的數(shù)據(jù)進(jìn)行追蹤?!钡壳八]有真正發(fā)揮出實力?!爸挥写蠹叶加脜^(qū)塊鏈技術(shù),才能真正解決黑市交易問題?!?/p>
“打擊大數(shù)據(jù)灰產(chǎn)交易,如果采用新的技術(shù),監(jiān)管的效果也會有明顯提升?!泵险牙虮硎荆?dāng)短信詐騙、微信詐騙形成一定的規(guī)模時,我們也積累了打擊它們的辦法和技術(shù)。
如果有人把偽基站放進(jìn)雙肩包,然后繞著國貿(mào)大廈附近走動,偽基站的信號會覆蓋大廈四周,樓內(nèi)的人會收到偽基站推送的信息,并信以為真。偽基站的信號與正常信號不同,麒麟系統(tǒng)檢測到它,并發(fā)出預(yù)警,此時可通知地勤人員根據(jù)指定位置,抓捕或監(jiān)視犯罪人員?!八峭ㄟ^大數(shù)據(jù)進(jìn)行監(jiān)控,專門針對這類技術(shù)犯罪?!泵险牙蛘J(rèn)為,如果反詐騙能力或技術(shù)的不斷提高,對大數(shù)據(jù)行業(yè)的困局也會有所改變。