• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數據挖掘中的信息倫理沖突問題

      2013-03-31 12:09:28黃曉勇
      長沙大學學報 2013年4期
      關鍵詞:隱私權數據挖掘個人信息

      黃曉勇

      (福建師范大學人民武裝學院,福建 福州 350007)

      信息時代給我們帶來了數據爆炸性增長,也催生了從海量數據中提取出有用知識的富有挑戰(zhàn)性的研究領域——數據挖掘。數據挖掘是指針對包括網頁內容、網頁結構、訪問信息、用戶數據、電商信息等各種網絡數據,運用數據挖掘方法,用以幫助人們從網絡中提取知識,為用戶、運營商以及包括電子商務在內的基于互聯(lián)網的商務活動提供決策支持[1]。但是,具有強大發(fā)展性和生命力的數據挖掘,勢必與公民信息隱私權利的保護產生一定的矛盾,如若處理不當則可引起倫理沖突。

      《數據挖掘:以破壞隱私為代價》報告(Ann Cavoukian,1998)稱,數據挖掘可能是個人隱私提倡者未來10年所要面對的“最根本的挑戰(zhàn)”,數據的質量、用途、安全、開放程度、個人權利、義務等方面不應違背國際社會所提倡的“良好數據使用原則”。但在數據挖掘的實踐中,這一原則往往難以遵循。尤其是關系到人這個主體的私有數據,一旦濫用和誤用,必然引發(fā)倫理沖突問題。

      一 數據挖掘中涉及的倫理問題

      (一)數據挖掘與用戶隱私權的問題

      在日常生活中,用戶訪問某個網站,該網站服務器的日志記錄就會留下關于該用戶的訪問信息,例如客戶訪問該網站的個人資料、逗留時間、瀏覽行為、訪問習慣、購物偏好等。這些積累起來的海量數據,可以成為數據庫的重要數據源。而對這些數據進行深入挖掘,可以對用戶群的行為、偏好、習慣等進行分析,提煉出某個用戶或某類用戶群的特質進行分析,以提供具有針對性的個性化服務。然而與此同時,挖掘這些個人數據信息也為侵犯用戶個人網絡隱私提供了便利。在數據挖掘中,挖掘者(包括從事數據挖掘的個人或組織)可能會在以下幾個方面侵犯公民的個人數據隱私權。

      1.個人信息的過度開采。要想數據挖掘獲得良好的效果,首要的是采集到足夠大量和全面的數據。在數據采集過程中未征得信息所有者的同意、未聲明數據的使用目的和范圍,或通過欺詐、偷盜及其他非法途徑獲取個人信息的,都是對個人信息隱私權的侵犯。我們常常會發(fā)現(xiàn)在某些網站提供的頁面上出現(xiàn)自己瀏覽過的或相關的商品廣告,就是因為目前很多網站都配置有監(jiān)控用戶瀏覽記錄和上網習慣的程序,更有甚者未經用戶授權就私自記錄保存了用戶的相關隱私檔案,包括用戶的IP地址、電郵地址、瀏覽記錄和網購記錄等,這些都是侵犯用戶隱私權的表現(xiàn)。

      2.個人信息的濫用。數據挖掘對個人信息隱私權在數據使用階段的侵犯主要包括挖掘者私自改變、擴大用戶個人信息的用途和應用范圍。就目前普遍情況而言,還未有挖掘者在采集用戶個人信息時用通俗易懂的方式明確告知用戶其提供的信息將會用于數據挖掘。換句話說,幾乎目前所有的對用戶個人信息進行的數據挖掘活動都不合法。更有甚者,挖掘者對用戶個人信息進行非法編輯,篡改其真實性、完整性和準確性,嚴重侵犯了用戶的隱私權。

      3.個人信息的錯誤分析。數據挖掘者采集數據的根本目的是分析數據并從中獲取潛在的有用信息。例如,通過分析用戶的身份、職業(yè)、收入、消費水平等信息與其近期經常瀏覽的網頁內容之間的關聯(lián)性,可以推斷出該用戶的品位和消費偏好。但是如果所挖掘的數據本身無法保證其正確性、完整性和全面性,再加上不完善的挖掘工具和不恰當的挖掘方法,最后分析出的結果很可能扭曲數據主體的形象得出謬論。羅冰眉曾經說過:“由于前一步的信息搜集就有極大的隨意性,而且有可能搜集到錯誤信息,因此很有可能產生與當事人真實情況不符的‘資料形象’(Material Image)”[2]。而這種所謂的“資料形象”很有可能在無形當中有意無意地暴露數據主體的個人形象,甚至扭曲和破壞數據主體的形象。

      4.個人信息的非可用性。由于網絡挖掘技術的大量使用,致使大部分信息在無用戶授權的情況下被使用和復制,由此可能威脅到信息的可用性[3]。挖掘者未經當事人授權,私自公開用戶的個人信息,就已經侵犯了用戶的個人隱私權。正如前文提到的,數據挖掘從業(yè)者在采集用戶數據時大多數情況下并沒有聲明這些個人信息將會被用于數據挖掘;而有些即便是已作出相關說明的,在進行數據挖掘工作之后,又將這些用戶個人信息另作他用,又甚至公然將這些個人信息進行販賣,嚴重侵犯用戶的隱私權。

      (二)個人信息的所有權

      長期以來,私有數據挖掘活動中關于數據所有權的歸屬一直存在爭論。在法律意義上,所有權是由具有資格出售某件特別財產的人決定的[4],但是當所涉及到的數據關乎人本身,顯然這樣的提法有失妥當,而關于私有數據所有權的歸屬也是難以統(tǒng)一的;然而在實踐中不難發(fā)現(xiàn),可用于進行數據挖掘的用戶私有信息是海量并極具潛在價值的[5]。對互聯(lián)網上大量的網頁信息的挖掘涉及到網頁所有者的所有權問題,目前的數據挖掘活動都是在未經數據所有者授權的前提下開展的,在海量的存儲著用戶個人信息的網頁和相關網絡鏈接以及用戶訪問網頁的記錄中采集、整理出關于用戶的有用信息,分析用戶偏好,并對個體用戶提供具有針對性的個性化信息服務。然而,目前針對網頁內容、網絡訪問記錄以及網絡結構的數據挖掘全都涉及對版權的保護。若單純從保護網頁版權的角度出發(fā),限制對網頁進行數據挖掘,那么,網頁數據挖掘技術也就不能得到使用和發(fā)展,亦不能實現(xiàn)其功能和價值,不利于傳播信息和知識。從理論意義上來說,網頁版權保護的最終目的是為了實現(xiàn)保障用戶權利和促進信息傳播雙贏,平衡各方的利益。網頁數據挖掘可以促進網絡信息資源的深度共用共享,增進知識的利用與傳播。

      所以,在網絡數據挖掘工具發(fā)達與計算機通訊網絡普及的當今社會,數據挖掘面臨的最重要的問題之一,就是解決好用戶個人信息隱私保護權和信息所有權歸屬的問題,只有解決了這個問題,才能確保在合理的信息訪問和數據挖掘過程中,用戶隱私受到保護且被挖掘的信息具有安全性、合理性和合法性。

      二 解決數據挖掘過程中的倫理問題

      數據挖掘活動是一項復雜的工作,在實施過程中我們會遇到這樣那樣的問題。社會倫理,本來就是一個界限模糊的概念,什么是符合倫理?什么是不符合倫理?這恐怕只能由我們在現(xiàn)實中慢慢摸索。但是在實踐中,我們應該從以下幾個方面著手做起:

      (一)數據挖掘從業(yè)者需樹立良好的職業(yè)道德觀

      所謂職業(yè)道德,是指所有從業(yè)人員在職業(yè)活動中應該遵循的行為準則[6]。由于數據挖掘活動是涉及公民個人隱私權問題、信息所有權等多方面利益的一項工作,因此需要從事數據挖掘活動的工作人員具備良好的職業(yè)道德觀,并遵從該職業(yè)范圍內的特殊道德要求,亦即尊重和保障用戶的個人信息隱私權。同時,這也是大眾對數據挖掘從業(yè)者的從業(yè)觀念、工作態(tài)度、職業(yè)紀律和原則作風等方面的行為規(guī)范和標準要求。如果有些人,一心想著窺探他人隱私,甚至將他人的隱私作為日常八卦的談資,在無形中就泄露了很多用戶的個人隱私信息,這類人就不符合成為數據挖掘從業(yè)者的基本要求。也有的人,金錢利益高于一切,被蠅頭小利迷失了心智,很可能會把工作中用戶的個人隱私信息當作金錢交易的籌碼,這更是對用戶的個人隱私權造成了極大的侵害。由此可見,要想成為一名合格的數據挖掘從業(yè)者必須具備或培養(yǎng)良好的職業(yè)道德觀,否則將會對數據挖掘活動和用戶主體造成極大的威脅。

      (二)建立和健全用戶主體的登記審批制度

      1984年,英國頒布《數據保護法》,其中第5條規(guī)定:只有經過登記被批準為數據使用者(或數據使用者兼計算機處理中心)之后,該使用者才有權持有個人數據[7]。盡管這部法律頒布之時尚未有數據挖掘一說,但卻為日后保護數據挖掘活動中的用戶隱私權提供了理論基礎。而如今我們要做的是在建立和健全數據用戶主體的登記批準制度的基礎上,對采集用戶個人信息的主體做出規(guī)范性限制,將用戶個人信息的數據采集權授予并且僅授予那些承諾為用戶主體保密的數據挖掘者。目前我國尚未建立關于采集用戶隱私信息的相關登記批準制度,望在未來能夠盡早填補這一空白。

      (三)開發(fā)與利用新興技術

      網絡數據挖掘是一種技術系統(tǒng),所以解決網絡數據挖掘的倫理問題要通過技術的手段來實現(xiàn)。如果僅是從保護用戶個人信息安全的方面來說,現(xiàn)有的相關安全技術已經存在。但如果在技術層面上過度地保護用戶個人信息,那么數據挖掘從業(yè)者采集數據的難度勢必會大大增加,不利于相關工作的開展,也不利于數據挖掘本身的發(fā)展。解決方法之一就是研究保持隱私的挖掘算法和挖掘方法。隱私保護和信息安全是數據挖掘中的一個很有意義的研究方向。目前在這方面已經取得了一定的成果,在保護隱私的挖掘方法方面,有學者提出分布式數據挖掘的隱私保護技術,該技術主要采用的是基于密碼學的隱私保持技術。其中具有代表性的是基于SMC(值匹配個數/屬性個數)的隱私保護數據挖掘技術,而常見的密碼學工具有:可交換密碼、同態(tài)加密、秘鑰共享、零知識證明、不經意傳輸等,采用安全多維計算來保護隱私[8],除了需要考量挖掘結果的準確性外,還要結合安全強度、計算成本以及通信成本等問題。國外目前已經推出了相關軟件,諸如“隱私保護神”等用以保護用戶的個人使用記錄等隱私。國外現(xiàn)在已研制出PET(Privacy Enhancing Technique,隱私增強技術)軟件,如 Anonymous Remailers、Surf Anon-mously、Cookie Busters等[9]。這類應用軟件的主要功能大多旨在幫助數據主體理解互聯(lián)網服務提供商的隱私政策;或者是用匿名方式訪問網絡站點,在最大程度上實現(xiàn)對用戶個人信息的保護,使之不易被網絡數據挖掘工具探測到。而從長期的發(fā)展來看,開發(fā)網絡數據挖掘軟件或相關搜索引擎對于用戶和網絡數據挖掘從業(yè)者雙方而言,都將是一種切實可行的技術性解決方法。

      (四)建立和健全相應的法律法規(guī)

      在這個技術不斷推陳出新的時代,任何技術都有死角,也都可能隨時被攻克或被新技術取代,因此技術雖是基礎卻不萬能,必須輔以法律為保障。所以,隱私權立法必須得到加強,用法律保護來填補技術的缺失和保護的不足。隱私權立法應該綜合考慮以下幾點:首先,要明確用戶個人信息采集的依據,政府的官方采集行為必須是以憲法和法律為依據,根據具體的數據挖掘活動的職責和工作需要來決定,以防止濫用政府行為造成對用戶個人信息隱私權的侵犯;而其他社會組織和個人的數據采集行為除法律規(guī)定外,則必須要取得當事人的同意后方可進行;其次,強調在沒有經過用戶本人同意授權的情況下,不得將采集的數據用于最初聲明的目的之外的用途和范圍;再次,采集者還要保證采集到的用戶個人信息具備完整性、準確性和安全性。數據挖掘從業(yè)者需在合法的范圍內運用合法手段使用用戶的個人信息;應當明確且完整地將所采集信息的使用目的和整理過程用通俗易懂的方式告知用戶,不可故意刁難或隱瞞;不應私自更改已作約定的信息用途;不應在未經用戶許可或法律批準的情況下以任何形式公開、販賣用戶信息;應當保證用戶個人信息真實、安全,并對使用后可能產生的后果負相關責任;防止數據遺漏、丟失和無授權訪問[10]。

      (五)提高用戶的自我防范意識

      基于多方面因素,國人對于隱私權的重視程度一直不高。用戶作為數據主體,提高其信息隱私權利意識至關重要。從一個角度來看,某些用戶自身信息權利意識淡薄,未關注到網絡數據挖掘活動可能會對自身信息權利將產生的影響;從另一角度來看,用戶應劃歸為弱勢群體,不得不提供一些關于自己的信息來換取某些服務。大多數時候,用戶的信息權利是在無意識中被“合法”侵犯了。由此可見,如果用戶具備足夠的“意識”,就能不斷提高自身的保護能力,依靠各種技術手段增強自我保護,例如采用匿名方式注冊和瀏覽、禁用網站Cookies以及應用技術軟件等;還應積極了解網絡站點采集的信息主要內容和種類,采集信息的方法和用途,信息的使用主體、場合、方式,是否提供這些信息將會導致何種后果以及可能擁有獲得何種補償等;積極運用法律武器保障自己的合法權益;集體追究或起訴數據挖掘者濫用用戶個人信息造成惡性后果,對挖掘者的行為形成一種制約和規(guī)范,促進網絡數據挖掘合理地運用、發(fā)展和進步[11]。大力宣傳教育,增強用戶的隱私權保護意識,樹立隱私權觀念,使用戶清楚認識自己享有的隱私權權利,學習了解如何保護隱私權不受侵犯等。

      (六)加大政府有效監(jiān)管的力度

      在是否應該加大政府監(jiān)管力度的問題上一直存在爭議。一方面,在現(xiàn)代市場經濟環(huán)境中,信息的傳播是開放而自由的;如果政府監(jiān)管或干預過多,可能影響信息的采集、傳播和利用,導致整個信息產業(yè)的發(fā)展受到不同程度的影響。然而,另一方面,如果對網絡采取完全任之的態(tài)度亦是不行的,只有加大政府有效監(jiān)管的力度,才能保障網絡安全有序,使整個網絡環(huán)境向著健康積極的方向發(fā)展。并且隨著通訊技術在全球的普及和發(fā)展,互聯(lián)網絡已經成為人們日常生活中不可缺少的一部分,并且發(fā)揮著越來越重要的作用。但網絡就猶如一把雙刃劍,在日常生活各個方面都依賴它的同時,許多問題也隨之產生。在網絡數據挖掘活動中,就已經出現(xiàn)了諸如用戶隱私權、信息版權、網絡安全等各方面涉及網絡倫理的問題。這些問題不好好解決,就會阻滯信息科技的進步和信息產業(yè)的發(fā)展。只有加大政府有效監(jiān)管的力度,才能平衡和協(xié)調好信息社會中的各方關系,巧妙解決這些矛盾。因此,我國應該在現(xiàn)有基礎上建立有效的政府監(jiān)管機制,加強對網絡數據挖掘等信息活動的管理。政府在實施監(jiān)管的過程中,應以“適度”為準,“引導”為主,促進網絡數據挖掘技術的合理、合法使用和健康長遠發(fā)展[12]。

      [1]安淑芝.數據倉庫與數據挖掘[M].北京:清華大學出版社,2006.

      [2]羅冰眉.網絡環(huán)境下個人數據與其隱私權的保護[J].現(xiàn)代情報,2003,(9).

      [3]牛少彰.信息安全[M].北京:北京大學出版社,2005.

      [4][5]石志明.數據挖掘中的個人隱私和社會影響[J].電腦知識與技術,2007,(13).

      [6]楊玉麟,曹美琴.論數據挖掘與公民信息隱私權的沖突與調適[J].高校圖書館論壇,2007,(3).

      [7][11]劉先紅.論數據挖掘中的個人數據隱私權問題[J].大眾科技,2007,(11).

      [8]華蓓,鐘誠.數據挖掘中的隱私保護技術進展分析[J].微電子學與計算機,2009,(8).

      [9]Tavani H T.KDD,data mining and the challenge for normative privacy[J].Ethics and Information Technology,2005,(1).

      [10][12]曹玉平.數據挖掘中的信息倫理問題研究[J].情報理論與實踐,2008,(5).

      猜你喜歡
      隱私權數據挖掘個人信息
      如何保護勞動者的個人信息?
      工會博覽(2022年16期)2022-07-16 05:53:54
      個人信息保護進入“法時代”
      納稅人隱私權的確立、限制與保護
      探討人工智能與數據挖掘發(fā)展趨勢
      警惕個人信息泄露
      綠色中國(2019年14期)2019-11-26 07:11:44
      媽媽,請把隱私權還給我
      學生天地(2019年29期)2019-08-25 08:52:12
      谷歌尊重雕像“隱私權”的啟示
      華人時刊(2018年17期)2018-11-19 00:41:21
      基于并行計算的大數據挖掘在電網中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一種基于Hadoop的大數據挖掘云服務及應用
      個人信息保護等6項通信行業(yè)標準征求意見
      庆阳市| 合山市| 乌兰察布市| 万全县| 璧山县| 朝阳县| 北碚区| 定襄县| 额尔古纳市| 蕲春县| 陇川县| 巩留县| 耿马| 尤溪县| 都匀市| 白河县| 二手房| 武邑县| 锡林浩特市| 上高县| 普定县| 美姑县| 沾益县| 乌兰县| 东乡| 宾阳县| 临猗县| 隆林| 会东县| 鹤峰县| 文登市| 类乌齐县| 紫金县| 临颍县| 明水县| 禄劝| 云南省| 禄丰县| 清原| 边坝县| 巴东县|