李一航
摘要:隨著當今移動通信技術(shù)的飛速發(fā)展,移動用戶行為的活躍及地理位置的改變,使基于位置的服務應運而生。在分析通信基站記錄群體登記信息的同時,個人開戶信息與基站記錄數(shù)據(jù)的關(guān)聯(lián),導致用戶受到各種因素潛在風險的威脅。有可能造成個人信息數(shù)據(jù)的泄密、造成直接經(jīng)濟損失。本篇論文是解決個人信息保護與位置服務權(quán)衡的問題,探討如何使位置服務與個人信息保護達到平衡并相互促進的目的。
關(guān)鍵詞:個人隱私 位置服務 k匿名
中圖分類號:TN918.91 文獻標識碼:A 文章編號:1007-9416(2016)07-0113-02
1 概述
隨著移動通信技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,傳統(tǒng)微型計算機與通信手機結(jié)合而誕生的智能手機終端已經(jīng)廣泛普及。社會的各個領(lǐng)域(醫(yī)療、金融、交通、電子商務等)都在利用成熟順暢的移動通信網(wǎng)絡訪問智能手機第三方應用程序(APP)[1]。移動智能終端手機使通信溝通、信息處理合二為一。用戶在享受移動互聯(lián)網(wǎng)環(huán)境下信息溝通的暢快淋漓的同時產(chǎn)生的信息泄露不容小覷。每一個移動通信智能手機用戶從開機連接互聯(lián)網(wǎng)開始,無時無刻不的數(shù)據(jù)被通信基站記錄并更新交替位置數(shù)據(jù)、社交軟件數(shù)據(jù)電子商務數(shù)據(jù)電子地圖導航等數(shù)據(jù)。詳細的用戶數(shù)據(jù)在未經(jīng)過差分隱私保護等手段處理的情況下被分析者做上下文檢索并得到更多的用戶位置隱私信息。過度無良的商家為賺取廣告費用不擇手段的獲取用戶個人隱私。無論是移動通信運營商、互聯(lián)網(wǎng)電商還是社交軟件、電子金融,都在極力的提供用戶位置服務,為用戶推送出的相關(guān)推薦性服務產(chǎn)品,達到爭搶用戶資源和市場的目的。隨著數(shù)據(jù)挖掘的縱深方向的發(fā)展和用戶隱私權(quán)意識的覺醒,為了解決兩者的矛盾:一方面滿足數(shù)據(jù)分析者需要更多數(shù)據(jù)做位置服務的商業(yè)科研等目的,另一方面又要維護數(shù)據(jù)載體用戶的個人信息隱私的非公開性,使用戶對個人信息公開的心理接受程度不陷入恐慌。
2 相關(guān)概念
2.1 個人隱私
國外著名的隱私解決方案提供商TRUSTe的調(diào)查報告顯示,隱私問題主要分為如下幾類:地理位置;唯一歸屬個人信息(例如社保號碼、身份證號);社交關(guān)系網(wǎng)絡信息。
綜合以上調(diào)研情況,結(jié)合移動網(wǎng)絡業(yè)務的特性,本文將隱私數(shù)據(jù)分為如下幾類:
(1)數(shù)字化數(shù)據(jù):唯一關(guān)聯(lián)終端用戶數(shù)字,包括身份證號碼和電話號碼等;
(2)地理位置數(shù)據(jù): 手機登陸基站標識、GPS經(jīng)緯度數(shù)據(jù);
(3)應用鏈接數(shù)據(jù):具體手機APP應用相關(guān)的數(shù)據(jù),包括用戶名、密碼、聯(lián)系人等。
2.2 k匿名
k匿名由samarati和sweeney提出,實際上已經(jīng)成為了最為常見也是最為基礎(chǔ)的一種匿名化原則。幾乎所有的匿名化準則都是在k匿名基礎(chǔ)上再加上其他限制。如果表T中任何一個元組都和至少另外k-1個元組在準標識符上是不可區(qū)分的,那么即使攻擊者知道表T中某個人的身份及其準標識符信息,因為T中至少有無個元組可以與之連接(他們構(gòu)成一個等價類,攻擊者就無法確定這個等價類里的哪條元組與這個人對應),這樣的性質(zhì)使得滿足k匿名的數(shù)據(jù)具有良好的隱私保護能力[2]。
2.3 應用領(lǐng)域
用戶行為軌跡LBS服務基于地理位置定位一般有三種方式。1.基于GPS;2.基于運營商基站;3.WIFI另外藍牙還有傳感器也可以定位。傳統(tǒng)的定位方式會使用戶有被“監(jiān)視”的感覺,約束的個人地理位置的自由和位置隱私。
本文研究討論隱私數(shù)據(jù)的合理保護和基于用戶行為數(shù)據(jù)的模式抽取兩者兼得,正是隱私保護數(shù)據(jù)挖掘方法的出發(fā)點和最終目標。是數(shù)據(jù)挖掘方基于非精確的原始數(shù)據(jù)而抽取出精確的模式與規(guī)則,對推動交叉學科互融互通和城市規(guī)劃統(tǒng)計決策有著重要的意義。對國民經(jīng)濟生產(chǎn),優(yōu)化產(chǎn)業(yè)結(jié)構(gòu),重組社會資源的決策有著重要的研究顯示意義。
3 問題研究及方法
3.1 存在的問題
在移動通信網(wǎng)中,能記錄用戶地理位置信息的經(jīng)緯度致使用戶隱私行為暴露。因為在核心網(wǎng)HLR中,可以使用關(guān)聯(lián)分析的方法利用用戶登記記錄的身份標識(身份證號碼)記錄關(guān)聯(lián)用戶地理位置的經(jīng)緯度;根據(jù)智能手機用戶點擊社交、位置等服務類手機軟件時,軟件后臺可以記錄用戶的相關(guān)活動的描述性信息。例如在微信、陌陌、探探等基于位置的虛擬社會軟件中還提供了一些好友信息等隱私性的描述文檔,包括用戶喜好、習慣、評價等等。因此,無良商家為了廣告目的利用這些描述性文檔,采用直接點對點的個人準確推薦方法,來提高推薦務的準確性,從而引起用戶恐慌。
在移動通信網(wǎng)絡提供給用戶便捷的暢通服務中,使用方的隱私保護問題一直都是“魚和熊掌”的問題。一方面用戶需要享受運營商,APP服務商等帶來的舒適便捷的項目服務,另一方面用戶同時懼怕陌生人對己方信息了如指掌后的安全性擔憂。如果使用加密技術(shù)對個人用戶信息通篇加密,又會使計算開銷和用戶自己存取使用帶來不必要的麻煩。再一方面,數(shù)據(jù)使用者分析方(商家,科研機構(gòu))希望獲得原始資料,在經(jīng)過信息層層加密,隱私化之后的數(shù)據(jù)可利用度另人懷疑。
3.2 解決辦法
居民身份證號碼是每一個公民與生俱來的唯一身份識別號碼。根據(jù)〖中華人民共和國國家標準GB 11643-1999〗中有關(guān)公民身份號碼的規(guī)定,公民身份號碼是特征組合碼,由十七位數(shù)字本體碼和一位數(shù)字校驗碼組成。排列順序從左至右依次為:六位數(shù)字地址碼,八位數(shù)字出生日期碼,三位數(shù)字順序碼和一位數(shù)字校驗碼。 居民身份證是國家法定的證明公民個人身份的有效證件。銀行,公安,教育,交通,通信等機構(gòu)掌握有大量的公民身份證號碼。公民身份證號碼一旦泄露,對個人造成直接財產(chǎn)損失。因此本文提出基于K匿名的個人身份證號碼隱私保護方法其基本思想是:對公民身份證號碼的有效分割數(shù)字地址碼、數(shù)字出生日期碼、數(shù)字順序碼,打亂三者一對一關(guān)系來保護個人用戶的隱私。簡單的程序操作就可以將六位數(shù)字地址碼和后三位數(shù)字順序碼一位數(shù)字校驗碼去隱私保護,使用戶出生年月日成為用戶標識,在基于位置的服務中,屬于使用者既可以通過基站小區(qū)記錄登記的用戶出生年月將用戶歸類進行用戶行為分析、推薦挖掘,又不能獲取用戶完整身份證號碼而侵害用戶權(quán)益。將用戶數(shù)據(jù)利用最大化與用戶隱私達到博弈平衡點的效果
4 結(jié)語
在有效的保護好用戶隱私的基礎(chǔ)上實現(xiàn)群體用戶行為軌跡服務推薦,使得原始數(shù)據(jù)經(jīng)過隱私化后篩選分類得到的子集既能充分反映用戶行為軌跡路線的興趣偏好,盡可能多的覆蓋具體個人推薦服務項目;又能滿足用戶隱私的保護不被泄露的安全感。通過對移動通信用戶數(shù)據(jù)行為軌跡LBS服務的研究,為智能城市,智能交通理念的推廣與探索,為城市區(qū)域內(nèi)用戶行為軌跡做規(guī)劃,推薦選擇資源最優(yōu)化出行交通工具與便捷服務。
參考文獻
[1]湯琳,何豐.隱私保護的數(shù)據(jù)挖掘方法的研究[J].計算機技術(shù)與發(fā)展,2011,21(4).
[2]何賢芒.隱私保護中k_匿名算法和匿名技術(shù)研究_何賢芒[D].復旦大學,2011.