雷中杰,徐慶,孫暉,張欣,李飛
(中國移動通信集團湖北有限公司,湖北 武漢 430000)
運營商大數(shù)據(jù)安全領(lǐng)域的相關(guān)研究,目前主要體現(xiàn)在大數(shù)據(jù)基礎架構(gòu)的安全技術(shù)方面以及隱私保護等方面,缺乏管理層面的運營商大數(shù)據(jù)對外共享管控機制的研究方案。因此本文深入分析大數(shù)據(jù)環(huán)境下,運營商對外數(shù)據(jù)共享面臨的問題,根據(jù)相關(guān)業(yè)務特點,針對外部合作單位監(jiān)管的重要環(huán)節(jié),提出了優(yōu)化安全管控機制的相關(guān)建議,可供參考。
由于某些數(shù)據(jù)的特性決定了擁有者不愿意將自己掌握的數(shù)據(jù)分享出去,畢竟一些大型數(shù)據(jù)需要他們花費很多時間、金錢甚至動用整個團隊才搜集到的,數(shù)據(jù)成本非常大,而且若這些數(shù)據(jù)持有者在這部分領(lǐng)域占有絕對的優(yōu)勢,很容易形成自身壟斷。比如阿里巴巴公司發(fā)起的相關(guān)健康項目,他們就可以利用專門的藥品電子監(jiān)管網(wǎng),掌握全國藥品零售企業(yè)的所有數(shù)據(jù)信息,他們甚至可以利用相關(guān)的數(shù)據(jù)服務壟斷整個醫(yī)藥行業(yè)。
由于數(shù)據(jù)可以變現(xiàn),可以將其看作為一種資產(chǎn),而且數(shù)據(jù)共享需要花時間與精力去維護,若撈不到什么好處,數(shù)據(jù)擁有者是不會主動共享數(shù)據(jù)的。隨著大數(shù)據(jù)的共享與融合,數(shù)據(jù)本身的價值也相應地降低,這樣一來數(shù)據(jù)持有者越多,數(shù)據(jù)本身的競爭優(yōu)勢就會越來越低。所以通常情況下,數(shù)據(jù)擁有者很難主動共享數(shù)據(jù)。對于證券行業(yè)或風險投資等領(lǐng)域來說,數(shù)據(jù)分析的方式基本上都是在線實時處理,數(shù)據(jù)分析的結(jié)果越快出現(xiàn),對應的收益就越大,否則就會承受巨額虧損,因此數(shù)據(jù)的時效性相當重要。相互聯(lián)系的不同主體因為各種原因,不能保證各主體間之間實時共享相關(guān)數(shù)據(jù)[1]。
數(shù)據(jù)持有者認為數(shù)據(jù)是自己獨有的財富,有了這些數(shù)據(jù)就相當于有了行業(yè)的競爭優(yōu)勢。一旦數(shù)據(jù)共享后,自身優(yōu)勢就會被削弱,利益可能會因此受到影響。再說了數(shù)據(jù)持有者還會擔心數(shù)據(jù)在共享過程中,個人隱私有可能被泄露,以及核心數(shù)據(jù)該不該共享等方面的問題。而接受數(shù)據(jù)的一方則會疑慮相關(guān)的數(shù)據(jù)資料是否安全可靠、完整有效等,各種懷疑之下,數(shù)據(jù)共享也就成了人們普遍都不愿意做的事情。畢竟他們不是擔心行業(yè)競爭就是認為得不到預期回報,以及沒有時間、金錢進行相關(guān)的數(shù)據(jù)管理等。人人都有這樣或那樣的顧慮,數(shù)據(jù)共享就成了“千金難買我愿意”的難題[2]。
雖然有些主體有數(shù)據(jù)共享方面的意向,但現(xiàn)實中存在各種限制條件,導致他們無法順利參與數(shù)據(jù)共享。比如他們的數(shù)據(jù)來源太過局限而且數(shù)據(jù)共享技術(shù)欠缺等導致數(shù)據(jù)共享過程中挫折不斷,受數(shù)據(jù)共享的相關(guān)政策及文化等方面的影響若大環(huán)境對數(shù)據(jù)共享并不熱衷,實踐中的數(shù)據(jù)共享活動也將裹足不前[3]。
想要實現(xiàn)數(shù)據(jù)共享,不僅要有相關(guān)的數(shù)據(jù)共享技術(shù),還得有提供數(shù)據(jù)發(fā)布、維護以及系統(tǒng)配置等服務相關(guān)的各種數(shù)據(jù)共享平臺。確保該數(shù)據(jù)平臺能夠支持不同級別數(shù)據(jù)量的應用系統(tǒng)及傳輸運作,集成數(shù)據(jù)共享審核、交易等各方面業(yè)務,實現(xiàn)跨行業(yè)數(shù)據(jù)應用及共享。若缺乏統(tǒng)一的數(shù)據(jù)交換平臺,很容易造成重復投資等情況,不利于互連互通相關(guān)的數(shù)據(jù)資源。比如醫(yī)療行業(yè),若能有效挖掘、分析相關(guān)的醫(yī)療數(shù)據(jù),對疾病診治、健康干預等方面都有著非凡意義。但醫(yī)療數(shù)據(jù)在共享過程中,會涉及到醫(yī)院疾病預防控制、衛(wèi)生管理、婦幼保健等部門的協(xié)調(diào)監(jiān)管,在信息化建設中很容易出現(xiàn)各自為政,標準不統(tǒng)一,數(shù)據(jù)共享困難等方面問題。因此,只有搭建一個專門的醫(yī)療衛(wèi)生數(shù)據(jù)集成共享平臺,才能確保信息共享渠道暢通。目前,該類統(tǒng)一標準的數(shù)據(jù)共享平臺比較稀缺,所以醫(yī)療大數(shù)據(jù)的利用率較低[4]。
由于大數(shù)據(jù)能夠高效洞察行業(yè)趨勢及相關(guān)主體的行為,同時也存在安全因素方面的困擾對于軍事、政治方面的保密型數(shù)據(jù)來說,數(shù)據(jù)共享無法實現(xiàn)絕對保密。對于一些涉及到個人隱私的數(shù)據(jù),政府雖然能夠調(diào)用相關(guān)數(shù)據(jù)并采取相應措施,但個人卻無法獲悉信息會被傳播到什么地方,用來干什么,泄露個人信息會產(chǎn)生什么樣的后果等,數(shù)據(jù)一旦共享很難跟蹤細微數(shù)據(jù),對于專業(yè)技術(shù)欠佳的人來說,根本無法維護自身信息的安全。因此,隱私保護范圍難以確定、侵犯隱私行為的判定以及隱私信息管理難度大等方面的安全問題一直阻礙著大數(shù)據(jù)共享[5]。
邊界安全:由于大數(shù)據(jù)安全環(huán)境復雜,邊界安全也是大數(shù)據(jù)安全管理體系的重點考慮因素之一。它包括網(wǎng)絡安全及身份認證。相關(guān)的防護對系統(tǒng)及數(shù)據(jù)/服務的訪問,通過身份認證確保用戶的真實/有效性。Hadoop及其相關(guān)系統(tǒng)中的組件都支持Kerberos驗證用戶的身份[6]。
訪問控制與授權(quán):運營商通過對用戶的授權(quán),達到對數(shù)據(jù)資源及相關(guān)服務的訪問管理及控制權(quán)限等方面的目的。
數(shù)據(jù)保護:運營商可以利用加密或脫敏等方式,在數(shù)據(jù)層面保護業(yè)內(nèi)敏感信息不外泄。其中數(shù)據(jù)加密主要體現(xiàn)在數(shù)據(jù)傳輸及存儲兩個環(huán)節(jié)。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)脫敏法廣泛被使用,因為得到的海量數(shù)據(jù)需要相當開放地,共享給內(nèi)部不同團隊以及外部的相關(guān)機構(gòu),數(shù)據(jù)的利用率越高,價值意義才最大。因此,脫敏法能夠保障部分敏感信息的安全。
審計與監(jiān)控:實時監(jiān)控與審計能夠有效管理數(shù)據(jù)安全取證、回溯及數(shù)據(jù)的安全合規(guī)等方面的性能。
基于以上的安全體系,根據(jù)大數(shù)據(jù)平臺特性,運營商在實踐大數(shù)據(jù)平臺安全化時,應具備更詳細的結(jié)構(gòu)設計,以數(shù)據(jù)為中心,完善相關(guān)的管理制度,使大數(shù)據(jù)處理規(guī)范化,再從訪問控制與數(shù)據(jù)客戶層面入手,加強數(shù)據(jù)使用方面的安全防范力度。然后安全部署網(wǎng)絡與基礎層面的平臺加固,因此大數(shù)據(jù)安全架構(gòu)應包含這5個核心模塊。
運營商應根據(jù)業(yè)務要求、數(shù)據(jù)敏感性/合規(guī)性以及關(guān)聯(lián)風險等方面,分類、分級管理相關(guān)數(shù)據(jù),有利于對數(shù)據(jù)保護的安全管控做出合理決策。從大數(shù)據(jù)特性層面標記數(shù)據(jù)(如數(shù)據(jù)類型、分析方式等)了解數(shù)據(jù)是如何出現(xiàn)在大數(shù)據(jù)平臺的,它將被誰使用、如何使用等,有利于運營商對現(xiàn)有數(shù)據(jù)的訪問,制定可行性較強的相關(guān)控制策略。進而掌握敏感數(shù)據(jù)在大數(shù)據(jù)平臺的分布情況,并對其使用情況進行有效監(jiān)控,達到全面保護數(shù)據(jù)安全的效果。
大數(shù)據(jù)系統(tǒng)幾乎都支持Kerberos驗證用戶身份,Kerberos能與運營商的LDAP結(jié)合,快速生成密鑰分發(fā)中心,用戶通過身份認證后,能夠獲取一定的大數(shù)據(jù)平臺訪問資格,并設置好用戶的訪問權(quán)限。在制定相關(guān)的訪問控制方案時,應符合相關(guān)要求結(jié)合敏感數(shù)據(jù)的相關(guān)保護策略等,針對不同業(yè)務需求制定不同的訪問控制規(guī)則,實現(xiàn)數(shù)據(jù)高效利用。
數(shù)據(jù)保護技術(shù)是針對整個大數(shù)據(jù)產(chǎn)業(yè)快速發(fā)展的有力保障,通過脫敏匿名化限制分布等相關(guān)技術(shù)處理之后,讓經(jīng)過處理之后的數(shù)據(jù)達到安全交易、對外共享的目的。對企業(yè)內(nèi)部來說,脫敏后的數(shù)據(jù),無限設定復雜的訪問控制,能讓更多的數(shù)據(jù)分析應用得到高效實施,并通過開發(fā)出新的項目。在充分利用大數(shù)據(jù)的同時,應遵從行業(yè)數(shù)據(jù)監(jiān)管隱私相關(guān)的法律法規(guī)。
運營商為了保證數(shù)據(jù)傳輸?shù)陌踩?,各?jié)點之間或客戶端與服務器之間的通信都應加密處理(比如Hadoop平臺支持RPC加密等)。除了加密設置網(wǎng)絡通信以外,化可以使用網(wǎng)關(guān)服務器將客戶端與大數(shù)據(jù)平臺的直接訪問進行有效隔離,以此提升網(wǎng)絡安全。
大數(shù)據(jù)平臺需要分析或識別一些安全事件,解決非法訪問或特權(quán)訪問等方面的問題,因此需要審計并監(jiān)控大數(shù)據(jù)平臺的一切活動,使其生成相關(guān)的報警信息。即安全事故監(jiān)控系統(tǒng)。利用SIEM系統(tǒng)能有效收集、監(jiān)控分析以及生成各種安全報告,捕捉一切可能發(fā)生的安全事故,進行事后分析、追蹤根源。
總之,大數(shù)據(jù)時代,數(shù)據(jù)價值的潛力無限,為了更好地挖掘數(shù)據(jù)資源中的有效信息,使其在實踐中得到合理應用。必須同時考慮相關(guān)的數(shù)據(jù)成本及經(jīng)濟效益。因此數(shù)據(jù)共享無疑是最好的途徑,在運營商大數(shù)據(jù)對外共享的同時,相應的阻礙問題也在接踵而至,所以必須深入分析數(shù)據(jù)共享存在的一系列問題,克服所有的共享困難,才能在實踐中進一步優(yōu)化運營商大數(shù)據(jù)對外共享安全管控機制。