鄒宗慶 唐蔚
摘要:本文分析了日益增長的科技稿件公開發(fā)表需求對稿件脫敏審查工作帶來的技術(shù)挑戰(zhàn),結(jié)合科技稿件中需標(biāo)注已不涉密的科研計劃項目,如何進行數(shù)據(jù)脫敏的難點,探討數(shù)據(jù)脫敏方法在科技稿件脫敏審查業(yè)務(wù)中的應(yīng)用,并對數(shù)據(jù)脫敏的實現(xiàn)方法予以重點論述,提出了怎樣提高科技稿件投稿錄用率的幾點建議,以期為科技稿件投稿人掌握稿件脫敏審查方法,順利投稿提供參考。
關(guān)鍵詞:科技稿件;脫敏;審查方法
數(shù)據(jù)脫敏技術(shù)作為近年來解決數(shù)據(jù)安全問題的重要技術(shù)得到了快速發(fā)展,在政府部門、金融行業(yè)、高等院校、科研院所、醫(yī)療體系等諸多行業(yè)領(lǐng)域中得以應(yīng)用。本文將數(shù)據(jù)脫敏技術(shù)應(yīng)用到科技稿件脫敏審查工作中,通過對指定的敏感數(shù)據(jù)進行編輯,使得敏感數(shù)據(jù)不再含有敏感內(nèi)容,從而保障科技稿件中敏感數(shù)據(jù)安全,同時保留數(shù)據(jù)原有格式、屬性,實現(xiàn)數(shù)據(jù)的可用性最大化。
1.難點分析
1.1科技稿件脫敏審查的難點
對基于科研計劃項目而產(chǎn)生的科技稿件,如果投稿人只是截取項目的部分少量內(nèi)容,經(jīng)過脫密審查確定已不涉密,則可公開發(fā)表,但投稿人在標(biāo)注不涉密的科研計劃項目時,往往不知如何進行數(shù)據(jù)脫敏處理。從近年來科技稿件審查情況來看,科技稿件中標(biāo)注的科研計劃項目內(nèi)容也是風(fēng)險高發(fā)領(lǐng)域,其科技稿件如果公開發(fā)表,覆蓋范圍廣、傳播速度快,帶來很大風(fēng)險。
1.2數(shù)據(jù)脫敏與數(shù)據(jù)加密的區(qū)別
數(shù)據(jù)脫敏是采用專業(yè)的數(shù)據(jù)脫敏算法,可以兼顧數(shù)據(jù)安全與數(shù)據(jù)使用;數(shù)據(jù)加密是通過對數(shù)據(jù)進行密碼保護,使用密碼檢索原始值。數(shù)據(jù)加密不能完全從技術(shù)上保證數(shù)據(jù)的安全,任何有權(quán)限訪問數(shù)據(jù)的人員,均有可能導(dǎo)致數(shù)據(jù)泄露。數(shù)據(jù)脫敏,敏感數(shù)據(jù)的實際值轉(zhuǎn)換為虛構(gòu)的,但是看起來非常逼真的數(shù)值,原始值具有不可逆性,無法復(fù)原,能夠更好的保護數(shù)據(jù)安全。
數(shù)據(jù)脫敏和數(shù)據(jù)加密是兩種不同的技術(shù),在不同的工作要求中廣泛應(yīng)用,在科研單位內(nèi)部交流時,往往采用數(shù)據(jù)加密,在科技稿件公開發(fā)表時,必須采用數(shù)據(jù)脫敏保護數(shù)據(jù)安全。
2.脫敏審查方法
2.1脫敏主體
科技稿件的所有署名人是稿件脫敏的責(zé)任主體。稿件所有署名人需要通過在實踐中不斷摸索,尋求科技稿件公開發(fā)表和稿件脫敏之間的平衡點,對標(biāo)注的科研計劃項目內(nèi)容先行嚴格把關(guān),提高認知能力和水平,提升綜合防控能力。
2.2脫敏方法
“先靜之,再思之,五六分把握即做之”是一種謹慎的智慧,同樣適用于科技稿件脫敏審查工作。
(一) 投稿前,先靜之
投稿前,稿件作者應(yīng)再三思考,科技稿件數(shù)據(jù)脫敏是否符合要求。稿件脫敏流程主要包括敏感數(shù)據(jù)識別、算法選擇、任務(wù)執(zhí)行、結(jié)果輸出四個步驟。
1. 敏感數(shù)據(jù)識別
為了科技稿件能夠安全公開發(fā)表,充分發(fā)揮其價值,需要對稿件敏感數(shù)據(jù)進行脫敏,確保稿件中敏感數(shù)據(jù)不被泄露,而敏感數(shù)據(jù)識別是稿件脫敏的前提和關(guān)鍵。
2.脫敏算法選擇
依據(jù)不同的科技稿件敏感數(shù)據(jù)類型、特征和脫敏需求,選擇不同的脫敏算法,科技稿件所采用的脫敏算法一般包括隱藏、偏移、平均值、替換、遮蔽、隨機等等。
3.脫敏任務(wù)執(zhí)行
科技稿件敏感數(shù)據(jù)脫敏執(zhí)行過程包括啟動、暫停、終止等操作。
4.脫敏結(jié)果輸出
依據(jù)稿件脫敏流程,脫敏任務(wù)執(zhí)行完畢,輸出科技稿件敏感數(shù)據(jù)脫敏結(jié)果。
(二)靜后,再思之
靜中細思,當(dāng)思奮爭。仔細檢查,反復(fù)修改,總會發(fā)現(xiàn)數(shù)據(jù)脫敏還有不恰當(dāng)、不完善之處,原先估計不到的問題,經(jīng)過反復(fù)審查和修改,十分必要。所以,一定要再思之,再思的過程實際上就是之前思考的結(jié)論二次復(fù)盤,認真地再次梳理數(shù)據(jù)脫敏有無差錯、有無遺漏。
(三)五六分把握即做之
靜之再思之方可成立。當(dāng)稿件作者對數(shù)據(jù)脫敏流程和脫敏要求非常清楚時,便可開展稿件脫敏審查。
1. 科研計劃項目來源核查法
對基于科研計劃項目而產(chǎn)出的科技稿件,如果投稿人只選取部分內(nèi)容,并且進行了脫密處理,經(jīng)審查確定已經(jīng)不涉密,則可公開發(fā)表,但在科技稿件中如需標(biāo)注項目內(nèi)容時,首先需要識別出項目來源中的“項目的完整名稱”、“項目完成時間”、“臺套數(shù)”、“生產(chǎn)計劃”、“應(yīng)用前景”等敏感數(shù)據(jù),接著對其敏感數(shù)據(jù)選擇脫敏算法,然后啟動脫敏,最后輸出脫敏后的數(shù)據(jù)。
2.3隱藏法
在處理“項目的完整名稱”這個待脫敏的數(shù)據(jù)時,投稿人通過對敏感數(shù)據(jù)進行隱藏,讓敏感數(shù)據(jù)無價值,使它無效。一般采用特殊字符(*或X)代替真實值,這種隱藏敏感數(shù)據(jù)的方法簡單便捷。
2.4偏移法
在處理“項目完成時間”這個待脫敏的數(shù)據(jù)時,投稿人通過隨機移位改變?nèi)掌跀?shù)據(jù),偏移法在保持了數(shù)據(jù)的安全性的同時保證了日期范圍的大致真實性。
2.5平均值
在處理“臺套數(shù)”這個待脫敏的數(shù)據(jù)時,投稿人通過先計算它們的均值,然后使脫敏后的值在均值附近隨機分布,從而保持臺套數(shù)的總和不變。
(一)科研計劃項目關(guān)鍵詞檢索法
科技稿件關(guān)鍵詞檢索即在脫敏范圍所列的條款中選取關(guān)鍵詞,對科技稿件進行全文查驗、比對。例如:科技稿件中如標(biāo)注項目內(nèi)容,需要對敏感數(shù)據(jù)“生產(chǎn)計劃”進行數(shù)據(jù)脫敏。通常分為精確匹配和廣泛匹配兩種。
2.6精確匹配
當(dāng)投稿人搜索詞與關(guān)鍵詞完全一致時才能匹配。例如精確匹配下“生產(chǎn)計劃”這個關(guān)鍵詞,投稿人只有搜索“生產(chǎn)計劃”才能啟動。
2.7廣泛匹配
當(dāng)投稿人搜索與關(guān)鍵詞高度相關(guān)的詞即可啟動。例如廣泛匹配下“生產(chǎn)計劃”這個關(guān)鍵詞,投稿人可以啟動搜索出“項目生產(chǎn)計劃”、“生產(chǎn)計劃進展”、“計劃生產(chǎn)”、“生產(chǎn)安排”、“生產(chǎn)方案”等等。
在科技稿件脫敏審查中,往往采用廣泛匹配,全文查驗,比對相應(yīng)的法律法規(guī)和管理要求,確保敏感數(shù)據(jù)完成脫敏。
(一)稿件內(nèi)容鑒別法
稿件內(nèi)容鑒別法就是逐一分析稿件內(nèi)容,對敏感技術(shù)或者領(lǐng)域中易造成風(fēng)險的關(guān)鍵點進行嚴格審查把關(guān)。例如:科技稿件中如標(biāo)注項目內(nèi)容,需要對敏感數(shù)據(jù)“應(yīng)用前景”進行數(shù)據(jù)脫敏。脫敏審查不僅包括文字內(nèi)容,還應(yīng)該包括圖片、音視頻等內(nèi)容。圖像脫敏除了使用馬賽克,可以采用圖像分析和圖像合成等技術(shù),音頻脫敏可以通過差分隱私技術(shù),為數(shù)據(jù)添加噪聲等方式進行數(shù)據(jù)脫敏。
3.結(jié)語
科技稿件脫敏審查是一項專業(yè)性很強的工作,需要嚴把數(shù)據(jù)脫敏關(guān),須臾不能松懈。本文探討的數(shù)據(jù)脫敏方法在科技稿件脫敏審查業(yè)務(wù)中的應(yīng)用,以期為科技稿件投稿人掌握稿件脫敏審查方法,順利投稿提供參考。
參考文獻:
[1]孫允凱.科技稿件脫密審查小議[J].保密工作,2021.
[2]武薇.全媒體語境下新聞出版泄密風(fēng)險與防控[J].保密工作,2021.
[3]畢婷.工業(yè)數(shù)據(jù)脫敏技術(shù)研究[J].保密科技技術(shù),2021.
[4]蔡玉琪.科技期刊編輯如何利用專家審稿意見提高審稿能力[J].編輯學(xué)報,2006.