國家千人計劃專家、中國聯(lián)通集團(tuán)信息化事業(yè)部總架構(gòu)師
繼云計算和移動互聯(lián)網(wǎng)之后,大數(shù)據(jù)的熱潮愈演愈烈。在政府的號召下,互聯(lián)網(wǎng)和傳統(tǒng)企業(yè)都從大數(shù)據(jù)的浪潮中看到了無限商機,看到了轉(zhuǎn)型創(chuàng)新的期望。相比于云計算,大數(shù)據(jù)更具跨界融合的潛能,它不僅包含了底層的基礎(chǔ)設(shè)施和中層的數(shù)據(jù)庫及數(shù)據(jù)挖掘技術(shù),而且通過應(yīng)用滲透到各行各業(yè),成為數(shù)字化運營不可或缺的利器。數(shù)據(jù)也因此成為了一種價值載體逐漸在市場上流通起來,各地政府聯(lián)合企業(yè)相繼成立了大數(shù)據(jù)交易市場。據(jù)了解,最初成立的貴陽大數(shù)據(jù)交易所去年的成交額達(dá)一億元以上。然而和這種火熱的現(xiàn)象相比,出于對數(shù)據(jù)非法二次轉(zhuǎn)售、數(shù)據(jù)價值持久化發(fā)展等擔(dān)憂,一些真正的數(shù)據(jù)擁有方并不愿意將自己的數(shù)據(jù)拿出來交易,也不看好大數(shù)據(jù)交易中心這種數(shù)據(jù)共享方式。他們更希望在有效技術(shù)手段出現(xiàn)之前,數(shù)據(jù)能夠盡量停留在他們可控的范圍內(nèi)使用。他們也希望數(shù)據(jù)共享是在一種大家都遵循雙邊或多邊游戲規(guī)則的誠信環(huán)境下去進(jìn)行,而不是通過什么中間機構(gòu)與陌生的第三方去交易。去中心化、數(shù)據(jù)不出戶、與分布式數(shù)據(jù)存儲相結(jié)合的分布式計算、區(qū)塊鏈等課題成為了新一代推動數(shù)據(jù)流通共享的思考方向,也是企業(yè)間大數(shù)據(jù)整合的另一種方法與途徑。
在數(shù)據(jù)流通等過程中需要解決的另一個問題就是個人信息保護(hù)問題。它是除數(shù)據(jù)價值保護(hù)之外阻礙數(shù)據(jù)流通共享的另一大因素?,F(xiàn)在普遍的做法是對含個人信息的數(shù)據(jù)進(jìn)行脫敏和加密處理。加密只是對傳輸過程中可能出現(xiàn)的泄露、盜取進(jìn)行保護(hù)或防止非授權(quán)方使用數(shù)據(jù),但解決不了數(shù)據(jù)個人隱私的保護(hù)問題。不可逆脫敏可以有效地保護(hù)個人或企業(yè)敏感信息,可以通過匿名化、標(biāo)簽化、群體化處理保護(hù)個人信息。可是從最終應(yīng)用的角度來看,除去統(tǒng)計規(guī)劃、市場洞察、行業(yè)指數(shù)類的一些應(yīng)用之外,許多如精準(zhǔn)營銷、個人征信、貸后管理等高價值應(yīng)用都因脫敏而無法實現(xiàn)。所以個人信息的保護(hù)問題不能只從技術(shù)角度尋求解決方案,它必須首先要具備一個既保護(hù)個人隱私又允許數(shù)據(jù)流通的法律環(huán)境。怎樣在開放、共享數(shù)據(jù)的大環(huán)境下避免侵犯用戶隱私的現(xiàn)象?我們希望通過一些國內(nèi)發(fā)生的典型案例和歐美國家在立法和執(zhí)法等方面的經(jīng)驗來揭示保護(hù)用戶個人信息的迫切性及必要性。
在大數(shù)據(jù)時代,電信運營商被公認(rèn)為是掌握大量用戶數(shù)據(jù)的企業(yè)之一,特別是像中國聯(lián)通,自2012年開始就集中了全國4億用戶的客戶數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、企業(yè)管理數(shù)據(jù)等。運營商自身也具備采集、存儲、加工、使用數(shù)據(jù)的傳統(tǒng)。經(jīng)營分析系統(tǒng)、計費系統(tǒng)等都是運營商數(shù)據(jù)應(yīng)用的典型代表。在移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)的新形式下,傳統(tǒng)的技術(shù)與應(yīng)用受到了兩方面的挑戰(zhàn)。一是隨著數(shù)據(jù)采集量不斷增大,原有的技術(shù)架構(gòu)及數(shù)據(jù)加工、挖掘方式開始捉襟見肘,滿足不了性能與功能上的需求;二是在萬物皆數(shù)據(jù)的時代,有哪些新的應(yīng)用領(lǐng)域可以發(fā)揮數(shù)據(jù)的價值,帶來效率上的提高,帶來業(yè)務(wù)收入的增長?大數(shù)據(jù)技術(shù)為我們帶來的不僅僅是分布式存儲、分布式計算、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)處理能力等零星的局域性改變,它為我們提供的更是云計算和大數(shù)據(jù)相融合的基礎(chǔ):共享的X86架構(gòu)基礎(chǔ)設(shè)施、豐富的計算框架與數(shù)據(jù)庫平臺服務(wù)、開放式的各類數(shù)據(jù)應(yīng)用。傳統(tǒng)系統(tǒng)的技術(shù)改造、網(wǎng)絡(luò)領(lǐng)域使用數(shù)據(jù)進(jìn)行應(yīng)用創(chuàng)新,這些案例都為大數(shù)據(jù)的價值做出了最好的詮釋。
云在算、數(shù)在轉(zhuǎn)、人在干。我們期望通過本期大數(shù)據(jù)專輯的介紹能為讀者帶來對數(shù)據(jù)共享、保護(hù)、應(yīng)用及技術(shù)更進(jìn)一步的理解與思考,從而推動大數(shù)據(jù)在運營商內(nèi)部的發(fā)展和在外部的跨界合作。