王 征 朱 光
(西南財(cái)經(jīng)大學(xué) 計(jì)算機(jī)與人工智能學(xué)院&研究生院 成都 611130)
近年來(lái),國(guó)內(nèi)外學(xué)界/業(yè)界參考企業(yè)數(shù)據(jù)治理的定義,提出了政務(wù)數(shù)據(jù)治理的定義:“數(shù)據(jù)驅(qū)動(dòng)的政務(wù)環(huán)境中,圍繞具備更高可用性的數(shù)據(jù)標(biāo)準(zhǔn)與數(shù)據(jù)模型,規(guī)劃構(gòu)建采集、存儲(chǔ)、管理、服務(wù)等一整套制度體系的系統(tǒng)工程”;其中,廣義的政務(wù)數(shù)據(jù)治理包含政務(wù)數(shù)據(jù)管理和數(shù)據(jù)價(jià)值實(shí)現(xiàn)兩部分,集成了數(shù)據(jù)架構(gòu)、主政數(shù)據(jù)、數(shù)據(jù)質(zhì)量、時(shí)序數(shù)據(jù)等諸多數(shù)據(jù)管理活動(dòng)[1-2]。由于政務(wù)數(shù)據(jù)治理工作是高度有序與緊密銜接的,因而任何一處信息隱患造成的危害都可能在后續(xù)治理環(huán)節(jié)中被放大,因此其中的數(shù)據(jù)安全與隱私保護(hù)工作顯得尤為重要;而弱隱私信息保護(hù)是目前需要關(guān)注的重點(diǎn)之一。弱隱私信息是指單獨(dú)難以造成重大信息安全事故、但會(huì)給數(shù)據(jù)處理過(guò)程帶來(lái)較大安全隱患的隱私信息,例如單獨(dú)的手機(jī)號(hào),如不配合姓名、身份證號(hào)、銀行卡號(hào)等其他弱隱私信息,詐騙分子也難以通過(guò)它開展犯罪活動(dòng)。目前,針對(duì)政務(wù)數(shù)據(jù)治理中的弱隱私安全問(wèn)題,國(guó)內(nèi)外專家學(xué)者提出了眾多的解決方案與配套模型,但由于弱隱私信息存在安全特征弱、影響關(guān)聯(lián)復(fù)雜、治理應(yīng)用線路長(zhǎng)等特點(diǎn),因此尚缺乏準(zhǔn)確、全面、高效的弱隱私信息監(jiān)測(cè)方法與模型[3]?;诖?,本文提出了面向政務(wù)數(shù)據(jù)治理的弱隱私信息追蹤監(jiān)測(cè)模型(WPTM),構(gòu)建了基于關(guān)聯(lián)動(dòng)態(tài)信息追蹤與靜態(tài)安全結(jié)構(gòu)特征檢測(cè)融合的配套算法,實(shí)施危害性評(píng)估,為政務(wù)數(shù)據(jù)治理工作提供信息安全參考與告警。
針對(duì)當(dāng)前政務(wù)數(shù)據(jù)治理中的弱隱私信息問(wèn)題,以及相關(guān)解決方案存在的問(wèn)題,本研究的開展依據(jù)與核心思想如下:我國(guó)電子政務(wù)系統(tǒng)結(jié)構(gòu)的“二網(wǎng)四庫(kù)十二金”,其中二網(wǎng)指公眾信息網(wǎng)(外網(wǎng))與電子政務(wù)內(nèi)網(wǎng),二者通常采用物理隔離,因此內(nèi)網(wǎng)中的信息很少發(fā)生技術(shù)上的泄露;但隨著數(shù)字化治理工作的深入開展,越來(lái)越多的業(yè)務(wù)需要內(nèi)外網(wǎng)協(xié)同工作,同時(shí)公眾信息網(wǎng)中處理的涉密(主要是涉及公眾的弱隱私信息)也越來(lái)越多,因此必須對(duì)其中的弱隱私保護(hù)問(wèn)題進(jìn)行研究和解決。政府信息安全管理機(jī)構(gòu)及相關(guān)部門可以應(yīng)用WPTM模型中的模型及子算法,對(duì)其治理域內(nèi)的信息進(jìn)行過(guò)濾與篩查,并采用弱隱私結(jié)構(gòu)特征識(shí)別技術(shù),實(shí)施弱隱私信息的危害性評(píng)估,縱向上評(píng)估其對(duì)政務(wù)數(shù)據(jù)治理業(yè)務(wù)流的危害程度,橫向上評(píng)估其對(duì)政務(wù)數(shù)據(jù)治理生態(tài)環(huán)境的影響程度,從而全面對(duì)其弱隱私安全結(jié)構(gòu)特征進(jìn)行識(shí)別,并生成信息安全警示與輔助決策信息?;谏鲜鏊枷?,本研究對(duì)當(dāng)前國(guó)內(nèi)外相關(guān)研究成果進(jìn)行了總結(jié)與剖析,并對(duì)其中的缺陷與不足提出了改進(jìn)與優(yōu)化路徑。
從當(dāng)前政務(wù)數(shù)據(jù)治理的安全現(xiàn)狀來(lái)看,主流的安全管理策略中還缺乏針對(duì)流程數(shù)據(jù)中弱隱私信息的跟蹤監(jiān)測(cè)方法與模型;政務(wù)數(shù)據(jù)治理中常用的隱私保護(hù)和動(dòng)態(tài)關(guān)聯(lián)分析方法,一方面對(duì)隱私信息源(主要是文件)的監(jiān)測(cè)不徹底,通常采用分時(shí)段進(jìn)行特定文件的橫向關(guān)聯(lián)掃描分析,而不是全程式的跟蹤分析;另一方面大量模型和系統(tǒng)仍采用硬性隱私判別規(guī)則,漏檢率較高,響應(yīng)速度也較慢,因此WPTM模型針對(duì)這些問(wèn)題提出了相關(guān)的破解方案。國(guó)內(nèi)外相關(guān)研究成果主要集中在顯性公開數(shù)據(jù)的安全過(guò)濾模型、數(shù)據(jù)訪問(wèn)流程管控等方面,鮮見弱隱私信息相關(guān)的成果。田賢鵬、張豹等人指出:政務(wù)數(shù)據(jù)治理工作中的信息融合以及安全隱患,對(duì)整個(gè)數(shù)據(jù)治理生態(tài)構(gòu)成了一定的威脅[4-5]。吳信東、熊翠蘭等發(fā)現(xiàn)近年大數(shù)據(jù)背景下的信息開放和共享,使得隱私和信息安全問(wèn)題被顯著放大,因此政務(wù)數(shù)據(jù)治理中的弱隱私問(wèn)題已成為學(xué)界與業(yè)界的關(guān)注焦點(diǎn)[6-7]。占南等人指出:當(dāng)前的政務(wù)數(shù)據(jù)治理中,忽視了弱隱私信息的關(guān)聯(lián)融合式泄露,導(dǎo)致了相關(guān)的安全事故頻發(fā),迫切需要構(gòu)建在應(yīng)用與治理流程中進(jìn)行弱隱私信息安全監(jiān)測(cè)的算法與模型[8]。基于此,本研究一方面將研究弱隱私信息在政務(wù)數(shù)據(jù)治理生態(tài)中的靜態(tài)結(jié)構(gòu)特征,另一方面將對(duì)治理過(guò)程中弱隱私信息的動(dòng)態(tài)變遷特征與形態(tài)進(jìn)行剖析,從而為跟蹤監(jiān)測(cè)工作奠定數(shù)據(jù)基礎(chǔ)。
從當(dāng)前的政務(wù)數(shù)據(jù)治理的安全管理方式來(lái)看,基于局部文件與內(nèi)存掃描的安全監(jiān)控方法仍然處于主流地位,缺少動(dòng)態(tài)的、全域的弱隱私信息安全監(jiān)測(cè)模型與手段。國(guó)內(nèi)外相關(guān)研究成果主要集中在文件的隱私評(píng)估、內(nèi)存監(jiān)測(cè)管理、文件的外部訪問(wèn)控制等方面,鮮見弱隱私信息的應(yīng)用流程監(jiān)測(cè)相關(guān)成果。Alhuwail Dari,Birch Kean等人指出:數(shù)據(jù)治理生態(tài)中的信息具有動(dòng)態(tài)性、融合性和流動(dòng)性,應(yīng)對(duì)這種數(shù)據(jù)管理模式之下的隱私安全給予足夠的重視[9-10]。Holt Alison和Gillan Ana等人指出弱隱私信息隱蔽性較強(qiáng),導(dǎo)致其很難通過(guò)單一文件或端口進(jìn)行監(jiān)測(cè),必須設(shè)計(jì)持續(xù)跟蹤的動(dòng)態(tài)監(jiān)測(cè)算法,才能對(duì)其安全性進(jìn)行評(píng)估[11-12]。PerezPozuelo Ignacio等人通過(guò)構(gòu)建對(duì)電子政務(wù)系統(tǒng)中的公開文件進(jìn)行了融合式安全檢測(cè),發(fā)現(xiàn)了部分國(guó)外網(wǎng)站中的弱隱私信息漏洞;而進(jìn)一步的研究發(fā)現(xiàn),電子政務(wù)服務(wù)器的緩沖、信息交換區(qū)等臨時(shí)存儲(chǔ)空間中更多的弱隱私信息[13]?;诖耍琖PTM模型將重點(diǎn)研究如何根據(jù)弱隱私信息的關(guān)聯(lián)影響范圍與可能危害程度進(jìn)行安全甄別,實(shí)現(xiàn)全程、全面、有效的弱隱私信息安全參考與告警。
最后,從當(dāng)前的政務(wù)數(shù)據(jù)治理中的弱隱私安全管理模型與工具來(lái)看,應(yīng)對(duì)外部入侵與非法訪問(wèn)為主的防火墻技術(shù)仍然處于主導(dǎo)地位,缺少?gòu)淖陨碇卫憝h(huán)境出發(fā)、監(jiān)測(cè)與評(píng)估內(nèi)部弱隱私信息安全的算法與模型。國(guó)內(nèi)外相關(guān)研究成果主要集中在對(duì)外防御網(wǎng)絡(luò)入侵、非法訪問(wèn)等方面,鮮見對(duì)內(nèi)進(jìn)行基于數(shù)據(jù)治理進(jìn)行弱隱私信息安全管理的相關(guān)成果。Brous Paul, Mara Maretti等人指出當(dāng)前政務(wù)數(shù)據(jù)治理安全算法,大多仍然拘泥于訪問(wèn)模式識(shí)別,管理效率較低,很難解決弱隱私數(shù)據(jù)的低安全辨識(shí)度和低匹配度問(wèn)題[14-15]。Mark Keil, Jones Kerina, Delacroix Sylvie等人研發(fā)了若干針對(duì)政務(wù)系統(tǒng)的全局隱私偵測(cè)系統(tǒng),盡管取得了較高的監(jiān)測(cè)精度,但由于需要進(jìn)行全局一致性偵測(cè),系統(tǒng)開銷較大[16-18]。基于此,WPTM模型中的子算法與配套模型,將重點(diǎn)對(duì)政務(wù)數(shù)據(jù)治理環(huán)境中的內(nèi)部弱隱私信息進(jìn)行安全監(jiān)測(cè),重點(diǎn)研究它們?cè)谥卫砹鞒膛c應(yīng)用過(guò)程出現(xiàn)的安全隱患,從而保證弱隱私信息在可控的安全域內(nèi)公開與應(yīng)用。
WPTM模型主要包括幾個(gè)功能模塊(如圖1所示):首先是信息對(duì)象監(jiān)測(cè)模塊,該模塊主要對(duì)政務(wù)數(shù)據(jù)治理過(guò)程中應(yīng)用到的各種信息對(duì)象進(jìn)行監(jiān)測(cè),并生成其元數(shù)據(jù)(文件名、修改時(shí)間、存儲(chǔ)位置等)備用。其次是信息特征掃描模塊,該模塊主要對(duì)政務(wù)數(shù)據(jù)治理過(guò)程中動(dòng)態(tài)生成的各類信息對(duì)象進(jìn)行弱隱私信息特征掃描,重點(diǎn)從其內(nèi)容與結(jié)構(gòu)上進(jìn)行安全特征分析。再次是動(dòng)態(tài)關(guān)聯(lián)追蹤模塊,該模塊主要對(duì)政務(wù)數(shù)據(jù)治理過(guò)程中各信息對(duì)象之間的關(guān)系進(jìn)行檢測(cè),重點(diǎn)從對(duì)象間關(guān)系、對(duì)象與治理環(huán)境之間的關(guān)系進(jìn)行安全分析。最后是交互管理模塊,該模塊主要為安全管理人員提供管理接口與全程安全視圖,如:在發(fā)生弱隱私信息報(bào)警時(shí)。
圖1 WPTM結(jié)構(gòu)與處理流程
Step1:當(dāng)政務(wù)數(shù)據(jù)治理過(guò)程中的信息對(duì)象被處理時(shí),將觸發(fā)信息對(duì)象監(jiān)測(cè)模塊。基于數(shù)據(jù)治理生態(tài)中既有的安全監(jiān)測(cè)評(píng)估先驗(yàn)概率信息集(既往評(píng)估數(shù)據(jù)),對(duì)弱隱私信息對(duì)象(主要是文件)的靜態(tài)安全結(jié)構(gòu)進(jìn)行初始化,之后可以對(duì)其權(quán)重進(jìn)行調(diào)節(jié),使之逼近穩(wěn)定狀態(tài);最終,上文中的監(jiān)測(cè)對(duì)象集合可以演變?yōu)楦潞鬆顟B(tài)和預(yù)測(cè)狀態(tài),并存儲(chǔ)在數(shù)據(jù)庫(kù)中備用:
xt=ft(xt-1,vt-1)
(1)
yt=ht(xt,wt)
(2)
算式(1)和(2)中,ft與ht是弱隱私信息監(jiān)測(cè)對(duì)象與安全等級(jí)之間構(gòu)成的系統(tǒng)動(dòng)力方程,在t時(shí)刻,監(jiān)測(cè)對(duì)象的更新后狀態(tài)與預(yù)測(cè)狀態(tài)用xt與yt代表,而其中的環(huán)境干擾與測(cè)度干擾用vt與wt代表,這些變量間是彼此獨(dú)立的;由此可以將整個(gè)數(shù)據(jù)治理過(guò)程的弱隱私信息對(duì)象集合定義為:
x0:t={x0,x1,…,xt}
(3)
y0:t={y0,y1,…,yt}
(4)
Step2:當(dāng)靜態(tài)的弱隱私信息對(duì)象進(jìn)入動(dòng)態(tài)的政務(wù)數(shù)據(jù)治理過(guò)程中,并處于被處理或應(yīng)用狀態(tài)時(shí),信息特征掃描模塊將對(duì)其結(jié)構(gòu)與內(nèi)容進(jìn)行掃描;并通過(guò)p(xt,yt)對(duì)其后續(xù)的安全信息進(jìn)行預(yù)測(cè),有:
(5)
政務(wù)數(shù)據(jù)治理過(guò)程中生成的臨時(shí)文件和處理操作的安全性都將在該步驟中由動(dòng)態(tài)關(guān)聯(lián)追蹤模塊進(jìn)行監(jiān)測(cè);由此,對(duì)整個(gè)治理過(guò)程持續(xù)進(jìn)行監(jiān)測(cè),可得其在整個(gè)過(guò)程中的安全狀態(tài)(詳細(xì)的分解算法將在下文中詳述):
p(xt|yt)∝p(yt|xt)p(xt|yt-1)
(6)
(7)
WPTM模型中的核心算法包括弱隱私信息特征掃描子算法和關(guān)聯(lián)動(dòng)態(tài)追蹤子算法。其中,前者主要對(duì)政務(wù)數(shù)據(jù)處理過(guò)程中產(chǎn)生的、獨(dú)立的中間信息對(duì)象與處理應(yīng)用場(chǎng)景進(jìn)行安全結(jié)構(gòu)特征掃描;后者主要對(duì)政務(wù)數(shù)據(jù)處理過(guò)程中的信息對(duì)象間的關(guān)系結(jié)構(gòu)進(jìn)行動(dòng)態(tài)追蹤,從而發(fā)掘其中影響信息安全的關(guān)鍵對(duì)象。
既往的信息安全要素特征掃描或者監(jiān)測(cè)框架,往往忽略弱隱私信息的融合安全結(jié)構(gòu)特征,片面基于其單獨(dú)或若干的信息特征進(jìn)行掃描,而弱隱私信息,特別是復(fù)雜政務(wù)數(shù)據(jù)治理環(huán)境中的弱隱私信息,其信息暴露過(guò)程通常較為復(fù)雜,既往算法難以奏效?;谏鲜觯狙芯恳环矫鎸?duì)弱隱私的安全結(jié)構(gòu)特征進(jìn)行挖掘,另一方面通過(guò)其應(yīng)用場(chǎng)景進(jìn)行融合式安全結(jié)構(gòu)特征掃描,從而大大提高了弱隱私信息的識(shí)別精度與覆蓋度。
由于政務(wù)數(shù)據(jù)治理環(huán)境中的弱隱私信息,在不同信息應(yīng)用空間(場(chǎng)景)中呈現(xiàn)的安全性與重要性是完全不同的,因此,本研究構(gòu)建了動(dòng)態(tài)的數(shù)據(jù)治理空間的安全核函數(shù),從而對(duì)不同信息空間的弱隱私信息賦予差異化的權(quán)重,以便更為精準(zhǔn)的對(duì)其安全結(jié)構(gòu)特征進(jìn)行描述。WPTM框架中,采用的核函數(shù)為:
(8)
(9)
由于弱隱私信息在數(shù)據(jù)治理環(huán)境中的結(jié)構(gòu)存在變換關(guān)系,因此需要對(duì)其結(jié)構(gòu)特征模型的變化進(jìn)行微觀變換記錄,構(gòu)建變換記錄函數(shù),有:
(10)
(11)
此時(shí),可以生成弱隱私信息對(duì)象的結(jié)構(gòu)特征,有:
Gx(x,y)=H(x+1,y)-H(x-1,y)
(12)
Gy(x,y)=H(x,y+1)-H(x,y-1)
(13)
其中,H(x,y)靜態(tài)安全信息表征此,而Gx,Gy可以生成:
(14)
結(jié)構(gòu)傾向可以表示為:
(15)
為了進(jìn)一步對(duì)數(shù)據(jù)治理過(guò)程中的信息元素進(jìn)行動(dòng)態(tài)權(quán)重度量,利用橫向時(shí)間軸變遷相似性算法,可以分解出弱隱私信息對(duì)象安全結(jié)構(gòu)變遷的概率分布;其兩次相關(guān)處理的安全分布分別為pu、qu,n設(shè)為其安全維度,則有:
(16)
(17)
此時(shí),可以通過(guò)政務(wù)數(shù)據(jù)治理中通用的安全檢測(cè)框架預(yù)期安全程度和當(dāng)前安全程度(To與Tc)進(jìn)行測(cè)度,最終的安全程度如下:
(18)
此時(shí),可以引入更替系數(shù)α來(lái)表征當(dāng)前弱隱私信息對(duì)象的結(jié)構(gòu)安全程度,有:Tt-1,Tt,可以得到Tc的更替辦法為:
Tc=αTt+(1-α)Tt-1
(19)
由于政務(wù)數(shù)據(jù)治理中的信息結(jié)構(gòu)操作差異較大,為避免誤報(bào)警,設(shè)定了數(shù)據(jù)治理操作影響閾值dthr,當(dāng)兩次操作之內(nèi)的安全程度相差不超限的情況下,并不告警或關(guān)停操作,有:
d(To,Tc)>dthr
(20)
如上文所述,在政務(wù)數(shù)據(jù)治理過(guò)程中,弱隱私信息對(duì)象的重要性在不同的過(guò)程中、不同階段中是不斷變化的,因此WPTM模型通過(guò)關(guān)聯(lián)動(dòng)態(tài)信息追蹤子算法對(duì)其進(jìn)行全面監(jiān)測(cè)。上節(jié)中子算法對(duì)其自身的安全結(jié)構(gòu)特征進(jìn)行了刻畫與監(jiān)測(cè),本節(jié)中將通過(guò)關(guān)聯(lián)動(dòng)態(tài)信息追蹤子算法對(duì)弱隱私信息對(duì)象在周邊對(duì)象集合的關(guān)聯(lián)安全程度進(jìn)行刻畫,從而進(jìn)一步提高安全偵測(cè)的準(zhǔn)確性與全面性。
(21)
(22)
落實(shí)到具體的弱隱私對(duì)象的關(guān)聯(lián)動(dòng)態(tài)信息追蹤過(guò)程中,有如下處理過(guò)程:
首先通過(guò)政務(wù)數(shù)據(jù)治理部門獲取弱隱私信息的m類安全問(wèn)題,其中每類安全問(wèn)題中n項(xiàng)指標(biāo):x1,x2,…,xm,而具體的弱隱私關(guān)聯(lián)信息安全指標(biāo)項(xiàng)為y1,y2,…,yt,有:
xi={xi(1),xi(2),…,xi(n)}i=1,2,…,m
(23)
yj={yj(1),yj(2),…,yj(n)}j=1,2,…,t
(24)
此時(shí),可以將同一個(gè)數(shù)據(jù)治理過(guò)程中的弱隱私關(guān)聯(lián)信息安全程度表述為:
(25)
此時(shí),將對(duì)xi與yi之間的關(guān)聯(lián)信息安全度進(jìn)行測(cè)算:
(26)
(27)
為加快處理速度,通過(guò)(22)式對(duì)上式進(jìn)行了化簡(jiǎn),有:
(28)
此時(shí),兩種安全度之間的差可以表述為:
εij(k)=ξij(k)-rij
(29)
ξij(k)=εij(k)+rij
(30)
進(jìn)一步對(duì)(28)式進(jìn)行刻畫,可得:
(31)
最終,通過(guò)對(duì)該值進(jìn)行判斷,即可得到當(dāng)前的弱隱私信息是否會(huì)對(duì)具體數(shù)據(jù)治理過(guò)程中的關(guān)聯(lián)信息造成重大安全影響,并發(fā)出報(bào)警或記錄。
為了檢驗(yàn)面向政務(wù)數(shù)據(jù)治理的弱隱私信息追蹤監(jiān)測(cè)模型(WPTM)的實(shí)際效能,開展了相應(yīng)數(shù)據(jù)跟蹤實(shí)驗(yàn)與安全算例剖析。本研究并未采用高級(jí)服務(wù)器實(shí)施安全偵測(cè),相關(guān)硬件環(huán)境包括HP Z710商用服務(wù)器(至強(qiáng)E40處理器,16G內(nèi)存)和百兆以太網(wǎng);軟件環(huán)境包括Windows Server2016操作系統(tǒng)、Suse操作系統(tǒng)以及MySQL數(shù)據(jù)庫(kù)。上述軟硬件均為電子政務(wù)網(wǎng)絡(luò)中常用配置,保證了實(shí)驗(yàn)與算例的真實(shí)性與普適性。相關(guān)的算例剖析與實(shí)驗(yàn)結(jié)果如下:
WPTM的算例基于某電子政務(wù)中心的財(cái)政服務(wù)數(shù)據(jù)治理環(huán)境展開,其基本步驟如圖1中所示,相關(guān)過(guò)程中的算例細(xì)節(jié)如下:
Step1:基于數(shù)據(jù)治理生態(tài)中既有的安全評(píng)估先驗(yàn)概率信息集(既往評(píng)估數(shù)據(jù)),對(duì)弱隱私信息安全結(jié)構(gòu)進(jìn)行初始化,之后可以對(duì)其權(quán)重進(jìn)行調(diào)節(jié),使之逼近穩(wěn)定狀態(tài),從而進(jìn)行跟蹤過(guò)程中的第一次結(jié)構(gòu)檢測(cè)。在該項(xiàng)檢測(cè)中,DaikuanID.xlsx等3個(gè)文件均未出現(xiàn)安全閾值超標(biāo)的情況。實(shí)際上,這3個(gè)文件均包含了身份證號(hào)等隱私信息,但由于這些信息不能單獨(dú)形成破壞,安全閾值并未超標(biāo),因此繼續(xù)進(jìn)行后續(xù)監(jiān)測(cè)。
Step2:當(dāng)弱隱私信息在數(shù)據(jù)治理過(guò)程中被處理或應(yīng)用后,將根據(jù)第3節(jié)中的算法進(jìn)行監(jiān)測(cè),對(duì)其安全狀態(tài)以及在當(dāng)前數(shù)據(jù)治理步驟中的信息安全重要程度進(jìn)行追蹤。DaikuanID.xlsx與其他文件臨時(shí)合并,生成了“貸款所需放款銀行卡號(hào)、貸款人姓名、身份證號(hào)”這一信息結(jié)構(gòu),WPTM中子算法經(jīng)過(guò)處理,發(fā)現(xiàn)其已經(jīng)屬于高危信息,提高了其安全優(yōu)先級(jí),并將其初步判定為弱隱私信息。
Step3:通過(guò)數(shù)據(jù)治理操作跟蹤與弱隱私信息融合概率的調(diào)偏,求得監(jiān)測(cè)目標(biāo)在最大相似狀態(tài)的權(quán)重,從而根據(jù)3.2節(jié)中的子算法進(jìn)一步從全局對(duì)弱隱私信息的安全狀態(tài)進(jìn)行追蹤和分析。在該步驟中,3.2節(jié)中的子算法進(jìn)一步檢測(cè)到“貸款所需放款銀行卡號(hào)、貸款人姓名、身份證號(hào)”信息結(jié)構(gòu)中引入了“電話號(hào)碼、地址”信息,其安全閾值嚴(yán)重超標(biāo),此時(shí)將該臨時(shí)文件截獲,并將生成該臨時(shí)文件的若干源文件及地址進(jìn)行記錄。
Step4:數(shù)據(jù)治理操作完成后,對(duì)弱隱私信息的監(jiān)測(cè)進(jìn)入最后縱向融合階段;將綜合前3個(gè)步驟中的局部與全局安全信息進(jìn)行全過(guò)程迭代計(jì)算,從而獲得上述3項(xiàng)弱隱私信息的總體安全度,并作出最后的安全評(píng)估,最終將安全報(bào)告(臨時(shí)文件、源文件以及相關(guān)的數(shù)據(jù)治理過(guò)程記錄)提交給管理員。
由于算例剖析是通過(guò)外部視角對(duì)政務(wù)數(shù)據(jù)治理過(guò)程進(jìn)行安全性檢測(cè),因此無(wú)法以內(nèi)部管理視角對(duì)其進(jìn)行運(yùn)行效能方面的實(shí)驗(yàn)。為保證WPTM的適用性,通過(guò)某高校網(wǎng)站(靜態(tài)偵測(cè)文件超過(guò)230萬(wàn)個(gè),動(dòng)態(tài)跟蹤數(shù)據(jù)治理過(guò)程8 000多項(xiàng))對(duì)其進(jìn)行了性能實(shí)驗(yàn),相關(guān)結(jié)果如下:
在弱隱私信息偵測(cè)方面,WPTM模型從230萬(wàn)份文件中偵測(cè)到3份包含弱隱私信息的文件,其中包含有超過(guò)800條學(xué)生隱私信息(因數(shù)據(jù)治理過(guò)程是動(dòng)態(tài)的,數(shù)量一直不斷增長(zhǎng)),為該校排除了重大信息安全隱患。
圖2 內(nèi)存資源占用對(duì)比
如圖2所示,在系統(tǒng)內(nèi)存資源占用方面,WPTM在整個(gè)靜態(tài)偵測(cè)周期內(nèi)(與前后兩個(gè)工作日的同時(shí)段內(nèi)存使用情況進(jìn)行對(duì)比)并未過(guò)多占用內(nèi)存資源;此外,網(wǎng)絡(luò)流量監(jiān)測(cè)顯示W(wǎng)PTM模型帶來(lái)的附加網(wǎng)絡(luò)流量也很小,并未引起網(wǎng)絡(luò)負(fù)載過(guò)大,體現(xiàn)了較高的實(shí)用性。
如圖3所示,在系統(tǒng)計(jì)算資源(CPU)占用方面,WPTM在整個(gè)動(dòng)態(tài)弱隱私信息偵測(cè)周期內(nèi)(與前后兩個(gè)工作日的同時(shí)段CPU使用情況進(jìn)行對(duì)比)并未過(guò)多占用計(jì)算資源,顯示了良好的性價(jià)比。
圖3 CPU占用率對(duì)比
綜上所述,WPTM及其配套子算法的弱隱私信息檢測(cè)能力良好,并且由于其采用靜態(tài)安全結(jié)構(gòu)偵測(cè)與關(guān)聯(lián)動(dòng)態(tài)信息追蹤的方法相結(jié)合,避免了靜態(tài)對(duì)象的反復(fù)動(dòng)態(tài)刷新和評(píng)估,降低了系統(tǒng)資源開銷,具有較高的可用性。
針對(duì)政府?dāng)?shù)據(jù)治理過(guò)程中暴露出來(lái)的弱隱私泄露等實(shí)際問(wèn)題,本研究構(gòu)建了面向政務(wù)數(shù)據(jù)治理的弱隱私信息追蹤監(jiān)測(cè)模型,給出了該模型的結(jié)構(gòu)與關(guān)鍵子算法。該模型一方面對(duì)弱隱私的結(jié)構(gòu)特征進(jìn)行挖掘,并通過(guò)應(yīng)用場(chǎng)景進(jìn)行融合式安全特征掃描;另一方面通過(guò)關(guān)聯(lián)信息安全追蹤子算法對(duì)弱隱私信息對(duì)象在處理過(guò)程中的安全程度進(jìn)行刻畫,從而實(shí)現(xiàn)弱隱私信息的數(shù)據(jù)治理過(guò)程全監(jiān)測(cè)。針對(duì)未來(lái)可能出現(xiàn)的問(wèn)題,還計(jì)劃對(duì)政府?dāng)?shù)據(jù)治理中的情報(bào)信息功率評(píng)估、暫存流式文件等問(wèn)題開展進(jìn)一步的研究。