李莉
摘 ?要:大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,個(gè)人數(shù)字檔案逐步取代傳統(tǒng)紙質(zhì)檔案成為個(gè)人信息管理的主要方式,且個(gè)人數(shù)字檔案的內(nèi)容、樣式更豐富,安全性也更高。針對(duì)各個(gè)數(shù)字檔案的分類管理問(wèn)題,提出基于元數(shù)據(jù)和標(biāo)簽的分類管理模式,提升信息分類查詢和提取效率的同時(shí)還附帶了定位功能,且能夠滿足一定的社交要求;在個(gè)人檔案的隱私保護(hù)方面,以私鑰加密為基礎(chǔ)采用CA電子證書(shū)認(rèn)證的方式,在大數(shù)據(jù)和開(kāi)放的網(wǎng)絡(luò)環(huán)境下提升個(gè)人隱私保護(hù)的安全等級(jí)。
關(guān)鍵詞:大數(shù)據(jù);個(gè)人數(shù)字檔案;分類管理;隱私保護(hù);檔案管理
Abstract: In the big data network environment, personal digital Archives gradually replace the traditional paper Archives as the main way of personal information management, and the content, style and security of personal digital Archives are richer. Aiming at the classification management of digital Archives, a classification management mode based on metadata and tags is proposed to improve the efficiency of information classification query and extraction, and at the same time, it also has positioning function, which can meet certain social requirements; In the privacy protection of personal files, based on private key encryption, CA electronic certificate authentication is adopted to improve the security level of personal privacy protection in the big data and open network environment.
Keywords: Big data; Personal digital archives; Classified management; Privacy protection; Archives management
在大數(shù)據(jù)環(huán)境下,個(gè)人檔案的數(shù)字化管理與傳統(tǒng)管理模式相比,具有更重要的意義和價(jià)值。當(dāng)前,在云存儲(chǔ)技術(shù)的支持下,個(gè)人數(shù)字檔案可以被存儲(chǔ)于云端,進(jìn)一步提高了個(gè)人數(shù)字檔案的安全性。本文在大數(shù)據(jù)環(huán)境下,深入研究了個(gè)人數(shù)字檔案資源體系的變化,分類管理的方法,及具體的加密防護(hù)措施,通過(guò)對(duì)個(gè)人數(shù)字檔案的優(yōu)化管理的加密處理,進(jìn)一步提升個(gè)人數(shù)字檔案的管理效率及安全性。
1 大數(shù)據(jù)環(huán)境下個(gè)人檔案管理資源體系的變化
1.1 數(shù)字化個(gè)人檔案數(shù)量多,來(lái)源廣泛。當(dāng)前我國(guó)個(gè)人檔案的普及率明顯提高,在傳統(tǒng)個(gè)人檔案管理模式下,丟失的、不完整的或被損壞的檔案占很大比例。在推進(jìn)個(gè)人檔案管理數(shù)字化工作以后,個(gè)人檔案的總體數(shù)量和完整度都有很大程度的改善。尤其是在大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,個(gè)人檔案數(shù)據(jù)的來(lái)源呈現(xiàn)出社會(huì)化和平民化的趨勢(shì),檔案數(shù)據(jù)的來(lái)源也更為廣泛。
1.2 個(gè)人數(shù)字檔案數(shù)據(jù)內(nèi)容、樣式更加豐富。數(shù)字檔案的載體樣式較為豐富,具體包括文本類、圖像類、視頻類、音頻類等,同一組信息能夠通過(guò)不同的樣式展現(xiàn)出來(lái),也更方便用戶查詢和調(diào)用信息。個(gè)別特殊復(fù)雜個(gè)人檔案,如含有過(guò)多半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),需要借助大數(shù)據(jù)和云計(jì)算工具處理。個(gè)人檔案復(fù)雜化,是未來(lái)網(wǎng)絡(luò)大數(shù)據(jù)時(shí)代的主要發(fā)展趨勢(shì)之一,也是評(píng)價(jià)個(gè)人素質(zhì)、能力的主要依據(jù)之一。
1.3 個(gè)人數(shù)字檔案的采集方式趨于多樣化。個(gè)人數(shù)字檔案的一些基礎(chǔ)信息主要來(lái)源于歷史檔案,隨著個(gè)人履歷的增長(zhǎng),一些重要的有價(jià)值的信息會(huì)被及時(shí)地填充到檔案系統(tǒng)當(dāng)中。權(quán)威的網(wǎng)絡(luò)信息是個(gè)人數(shù)字檔案的有效補(bǔ)充,能夠讓個(gè)人檔案更豐富、完整,也便于檔案的使用者調(diào)用相關(guān)信息。
2 基于元數(shù)據(jù)和標(biāo)簽的個(gè)人數(shù)字檔案管理
分類存儲(chǔ)和管理是個(gè)人檔案管理的核心,也是數(shù)字檔案處理的首個(gè)步驟,本文利用元數(shù)據(jù)和個(gè)性化標(biāo)簽對(duì)原始個(gè)人檔案進(jìn)行分類,并建立完善的查詢索引和目錄,個(gè)人數(shù)字檔案的分類管理循環(huán)過(guò)程描述如圖1。
個(gè)人數(shù)字檔案在歸檔和存儲(chǔ)前,需要一定的標(biāo)準(zhǔn)分類,例如可以按數(shù)字檔案的年度分類或按數(shù)字檔案的類型分類。其中,按照檔案類型分類的方式更利于檔案信息的查詢和修改,個(gè)人數(shù)字檔案類型分類具體包括個(gè)人數(shù)字相片、數(shù)字視頻、數(shù)字音頻、個(gè)人郵件、個(gè)人郵箱微博等。個(gè)人數(shù)字相片是最基本的數(shù)字檔案內(nèi)容,在檔案分類中為個(gè)人數(shù)字相片添加元數(shù)據(jù)標(biāo)簽,可以增加與其他信息項(xiàng)的關(guān)聯(lián)關(guān)系以便于查詢,同時(shí)也起到防偽和避免個(gè)人數(shù)據(jù)丟失的作用。
個(gè)人數(shù)字檔案中的個(gè)人相片由數(shù)字照片、與之匹配的文字說(shuō)明及EXIF(可交互圖像)信息等構(gòu)成。相片中的元數(shù)據(jù)可通過(guò)Adobe-Lightroom計(jì)算機(jī)軟件讀取和編輯處理,攜帶元數(shù)據(jù)的個(gè)人數(shù)字檔案在查詢、調(diào)用和修正等方面具有良好的安全性和便捷性。
Adobe-Lightroom是針對(duì)數(shù)字檔案元數(shù)據(jù)編輯和使用的一種高效信息管理軟件,既可以在相片中添加不同類型的元數(shù)據(jù),還可以根據(jù)數(shù)字相片中已有的元數(shù)據(jù)查詢用戶感興趣的信息。除了元數(shù)據(jù)之外,為個(gè)人檔案添加標(biāo)簽也是分類管理的重要措施之一。首先,可以為個(gè)人檔案數(shù)字相片添加PICASA工具或GPS LOGGER工具,以上兩種工具都具有GPS定位功能,且與主流的IOS系統(tǒng)、ANDROID系統(tǒng)兼容,在移動(dòng)網(wǎng)絡(luò)環(huán)境下即可進(jìn)行數(shù)據(jù)的導(dǎo)入、調(diào)取和導(dǎo)出。其次,個(gè)人檔案管理系統(tǒng)中的個(gè)性化標(biāo)簽與WE CHAT、MICROBLOG等社交軟件在網(wǎng)絡(luò)環(huán)境下實(shí)現(xiàn)兼容,滿足用戶在檔案處理中的社交需求。
隨著個(gè)人數(shù)字檔案資源的信息量不斷增多和應(yīng)用范圍的不斷拓展,電子檔案的重要性逐漸被更多用戶認(rèn)可。個(gè)人電子檔案的分類管理中,按照檔案的元數(shù)據(jù)和標(biāo)簽建立個(gè)人檔案索引目錄十分必要,根據(jù)檔案的元數(shù)據(jù)、文件名、位置信息、用戶名+密碼等不同的方式,能夠檢索出用戶需要的檔案信息。
由于個(gè)人每天都會(huì)產(chǎn)生大量的信息,包括位置信息、偏好信息、網(wǎng)絡(luò)瀏覽軌跡等,除了一些核心與關(guān)鍵的信息以外,絕大部分信息要被及時(shí)地覆蓋和清理掉,避免個(gè)人數(shù)字檔案的規(guī)模被無(wú)限制擴(kuò)大,個(gè)人數(shù)字檔案管理系統(tǒng)會(huì)主動(dòng)標(biāo)記信息重要性的星級(jí),通過(guò)循環(huán)同步更新更多重要的信息會(huì)被保留下來(lái),而不重要、冗余的甚至錯(cuò)誤的檔案信息會(huì)被系統(tǒng)當(dāng)成臟數(shù)據(jù)清洗掉。
3 大數(shù)據(jù)模式下個(gè)人數(shù)字檔案的加密處理與保護(hù)
3.1 個(gè)人數(shù)字檔案的加密。目前個(gè)人數(shù)字檔案的加密主要通過(guò)密鑰實(shí)現(xiàn),密鑰作為一種從“明文-密文-明文”的計(jì)算機(jī)算法轉(zhuǎn)換參數(shù),更適合于海量大數(shù)據(jù)模式下的個(gè)人數(shù)字檔案加密。
密鑰根據(jù)加密的方式又細(xì)分為私鑰和公鑰,私鑰的加密過(guò)程運(yùn)行速度快,但公鑰的加密方式更加靈活,兩種方式分別適用于不同的場(chǎng)景,其中個(gè)人數(shù)字檔案的加密處理更適合于私鑰加密和解密方式。
密鑰是個(gè)人數(shù)字檔案信息加密和解密的唯一憑證,具有較高的安全性,但密鑰的算法只能供個(gè)人數(shù)字檔案的使用者單獨(dú)使用;而公鑰的解密算法都是公開(kāi)的,可以對(duì)外給其他人使用。
例如,CA證書(shū)是一種典型的私鑰類型,其由硬件部分和軟件部分構(gòu)成,CA證書(shū)是個(gè)人數(shù)字檔案信息提取的唯一憑證,經(jīng)過(guò)加密后具有較高的安全性和使用便捷性。為防止個(gè)人數(shù)字檔案數(shù)據(jù)丟失或被損毀,需要周期性地對(duì)個(gè)人檔案數(shù)據(jù)做備份處理。
3.2 個(gè)人數(shù)字檔案隱私的保護(hù)。就個(gè)人隱私保護(hù)而言,首先從根本上還是要依靠密鑰技術(shù)和網(wǎng)絡(luò)防火墻技術(shù)。[1]當(dāng)前一些網(wǎng)絡(luò)病毒、蠕蟲(chóng)和惡意攻擊手段都在變種和升級(jí),針對(duì)攻擊手段的多樣化,個(gè)人隱私保護(hù)技術(shù)也要不斷地升級(jí)加以應(yīng)對(duì)。
在大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,面對(duì)規(guī)模不斷膨脹的個(gè)人數(shù)字檔案,只有不斷地提高技術(shù)水平和防御技術(shù),才能更好地保護(hù)個(gè)人檔案管理和存儲(chǔ)等方面的安全性。其次就個(gè)人層面而言,急需強(qiáng)化個(gè)人信息的自我保護(hù)意識(shí)?;ヂ?lián)網(wǎng)環(huán)境下個(gè)人數(shù)字檔案的重要性不斷升級(jí),不僅關(guān)系到個(gè)人隱私的泄露,還會(huì)影響到個(gè)人的經(jīng)濟(jì)安全、個(gè)人信用乃至職業(yè)生涯。個(gè)人在注冊(cè)數(shù)字檔案時(shí)應(yīng)妥善管理自己的賬戶、密碼、私鑰等信息,不能夠在任何情況下透露私密信息,禁止或減少在公共網(wǎng)絡(luò)環(huán)境下或公共電腦終端登錄個(gè)人檔案信息。此外,還要定期地驗(yàn)證自己的個(gè)人賬戶,發(fā)現(xiàn)異常及時(shí)聯(lián)系系統(tǒng)管理員排除異常因素。最后,個(gè)人數(shù)字檔案的安全防護(hù)已經(jīng)成為一個(gè)事關(guān)公眾隱私保護(hù)的普遍性問(wèn)題。從國(guó)家和相關(guān)信息安全管理部門(mén)的角度來(lái)看,一方面應(yīng)從立法的角度將打擊網(wǎng)絡(luò)攻擊保護(hù)網(wǎng)絡(luò)安全寫(xiě)入法律條例,提升法律對(duì)不法分子的震懾力。另一方面加強(qiáng)對(duì)網(wǎng)絡(luò)安全的宣傳與推廣工作,繼續(xù)推進(jìn)網(wǎng)絡(luò)實(shí)名制和軟件使用的實(shí)名制工作,有效緩解網(wǎng)絡(luò)入侵和網(wǎng)絡(luò)攻擊,保護(hù)個(gè)人數(shù)字檔案和隱私的安全性。
4 保障措施
4.1 優(yōu)化數(shù)字檔案資源的采集方式,提升個(gè)人數(shù)字檔案資源整合的科學(xué)性。目前,半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)在數(shù)字資源體系中占據(jù)重要的地位,在個(gè)人數(shù)字檔案中,圖像、視頻、音頻、符號(hào)等是大數(shù)據(jù)背景下個(gè)人數(shù)字檔案資源的基礎(chǔ)。半結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)中,一些底層化、碎片化的數(shù)據(jù)中也包含著重要信息。因此,大數(shù)據(jù)環(huán)境下的個(gè)人數(shù)字檔案資源管理,應(yīng)從信息資源采集的多樣化和碎片化信息整合的角度提升分類管理的科學(xué)性。
4.2 拓寬數(shù)字檔案的服務(wù)范圍,進(jìn)一步提升管理效率。大數(shù)據(jù)時(shí)代背景下,個(gè)人數(shù)字檔案服務(wù)會(huì)朝著個(gè)性化服務(wù)和智能化服務(wù)的方向發(fā)展,其中個(gè)性化服務(wù)以滿足用戶個(gè)性化需求為目標(biāo),注重管理細(xì)節(jié)的提升和服務(wù)范圍的拓展。只有從服務(wù)范圍、服務(wù)質(zhì)量和技術(shù)投入等層面入手,才能提高個(gè)人數(shù)字檔案的管理效率,更好地滿足用戶個(gè)性化、智能化的使用要求。
4.3 以技術(shù)防御為核心,加大對(duì)網(wǎng)絡(luò)安全技術(shù)革新的資金投入,強(qiáng)化個(gè)人數(shù)字檔案的安全服務(wù)標(biāo)準(zhǔn)。防御技術(shù)能力和水平提升仍舊是當(dāng)前數(shù)字檔案管理和安全防護(hù)的首要問(wèn)題,如果無(wú)法保證用戶個(gè)人數(shù)據(jù)和隱私的安全,個(gè)人數(shù)字檔案分類管理就失去了意義。[2]提升技術(shù)防御等級(jí),一方面要做好系統(tǒng)軟硬件的適配工作,盡量減少個(gè)人數(shù)字檔案管理系統(tǒng)安全漏洞的產(chǎn)生;另一方面還要加大對(duì)個(gè)人隱私防火墻技術(shù)的資金投入和軟件升級(jí)力度,全方位保障用戶的個(gè)人因素安全。
質(zhì)疑。
參考文獻(xiàn):
[1]孫大東,張歡笑.我國(guó)檔案網(wǎng)站隱私政策調(diào)查研究[J].檔案管理,2018(06):65-68.
[2]卞咸杰.大數(shù)據(jù)時(shí)代檔案信息資源共享平臺(tái)構(gòu)建的目標(biāo)定位與實(shí)現(xiàn)[J].檔案管理,2020(05):75-76.
(作者單位:鄭州市第七人民醫(yī)院 來(lái)稿日期:2021-07-15)