文/陳瑋琳 席 文 羅 濤
本文通過研究數(shù)據(jù)可視化技術(shù)的發(fā)展現(xiàn)狀,分析數(shù)據(jù)可視化在軍隊檔案利用、管理過程中的應(yīng)用模式與作用,并對其需要把握的問題進行剖析,從而加強檔案數(shù)據(jù)分析挖掘水平,進一步提升軍隊檔案利用效率
可視化技術(shù)能夠?qū)Ⅲw量巨大的抽象數(shù)據(jù)轉(zhuǎn)換為直觀、形象、可識別的圖形、圖像、視頻或動畫,提高用戶對數(shù)據(jù)的深刻認知與使用效率?!皵?shù)據(jù)可視化的作用在于格物致知,即從看見物體到獲取知識[1]”。而檔案數(shù)據(jù)涉及范圍廣,時間跨度大,關(guān)聯(lián)性強,屬性內(nèi)容抽象龐雜、應(yīng)用頻繁,檔案數(shù)據(jù)的可視化應(yīng)用研究,對提高檔案數(shù)據(jù)利用效率、增強軍隊檔案工作“為戰(zhàn)服務(wù)”能力,具有重要意義。
隨著信息技術(shù)的高速發(fā)展,各類數(shù)據(jù)呈爆炸趨勢增長。Tianhan Zhang認為,面對龐雜的數(shù)據(jù),如果可以直接將數(shù)據(jù)轉(zhuǎn)化為圖像,則分析將會很容易[2]。Jake R Carlson等早在2011年就已將數(shù)據(jù)可視化能力作為數(shù)據(jù)素養(yǎng)核心能力體系之一對待,更加凸顯出數(shù)據(jù)可視化的重要性[3]。
張蒞坤認為:“數(shù)據(jù)可視化將數(shù)據(jù)的各個屬性值以多維數(shù)據(jù)的形式表示,使人們可以從不同的維度觀察數(shù)據(jù),從而對數(shù)據(jù)進行更深入的觀察和分析?!盵4]
程佳軍、游宏梁等認為,數(shù)據(jù)可視化既是數(shù)據(jù)分析過程的支撐工具,又是數(shù)據(jù)應(yīng)用的重要出口,是數(shù)據(jù)分析的重要支撐技術(shù)[5]。
目前,檔案數(shù)據(jù)在利用及分析過程中存在檢索輸出數(shù)據(jù)量大、關(guān)聯(lián)性不強,篩選和展示條件單一等問題,不利于檔案的高效利用。筆者認為,數(shù)據(jù)可視化是一種成熟的數(shù)據(jù)分析工具,能夠?qū)㈩愋投鄻?、結(jié)構(gòu)各異、分散復(fù)雜的數(shù)據(jù)表達轉(zhuǎn)換為直觀、個性化的圖像表達,有效提高檔案信息分析利用效率。
目前,軍隊檔案數(shù)據(jù)在轉(zhuǎn)化為編研利用成果的過程中仍采用如圖1所示的原始方式,該方式僅執(zhí)行數(shù)據(jù)檢索指令,用戶需要在眾多檢索結(jié)果中自行逐一篩選并統(tǒng)計自己所需內(nèi)容。該種方式既降低使用者的使用體驗,又易造成數(shù)據(jù)錯漏,降低檔案利用效率。(圖1)
圖1 檔案利用的過程
軍隊檔案數(shù)據(jù)可視化主要應(yīng)用于檔案數(shù)據(jù)編研利用的“輸出”環(huán)節(jié),能夠有效輔助使用者作出相應(yīng)決策。如圖2所示,使用者通過將適宜的可視化工具與個性化需求相結(jié)合,建立檔案數(shù)據(jù)分類檢索與關(guān)聯(lián)分析模型,對檔案數(shù)據(jù)進行深入分析利用,可有效提高編研利用工作效率。(圖2)
圖2 檔案可視化利用的過程
其中,實現(xiàn)軍隊檔案數(shù)據(jù)可視化有三個關(guān)鍵步驟:
其一,系統(tǒng)篩選,即檔案數(shù)據(jù)清洗。其主要目的是根據(jù)檔案的利用目標(biāo),對異構(gòu)、分散的數(shù)據(jù)進行結(jié)構(gòu)化、標(biāo)準(zhǔn)化處理,為最終檔案數(shù)據(jù)的可視化呈現(xiàn)提供數(shù)據(jù)質(zhì)量支撐。
其二,可視化轉(zhuǎn)換,即檔案數(shù)據(jù)可視化展現(xiàn)形式的匹配。其主要目的是根據(jù)數(shù)據(jù)含義及用戶可視化呈現(xiàn)需求匹配最終的可視化展現(xiàn)形式,也決定了檔案數(shù)據(jù)含義表現(xiàn)得是否充分,是否便于用戶深刻理解。
其三,可視化呈現(xiàn),這是檔案數(shù)據(jù)可視化應(yīng)用過程中系統(tǒng)在前臺輸出的最終結(jié)果,能夠有效提升檔案數(shù)據(jù)價值,幫助用戶對檔案數(shù)據(jù)本質(zhì)含義的理解,提高分析利用效率。
2.1 過濾清洗冗余數(shù)據(jù)
在輸入檢索條件檢索相關(guān)檔案數(shù)據(jù)時,通過使用數(shù)據(jù)可視化工具,將符合檢索條件的檔案數(shù)據(jù)按照相關(guān)性大小進行可視化處理,用戶只需根據(jù)需求進行選擇即可。這不僅降低了查詢響應(yīng)時間,還能為下一步檔案編研利用打下良好基礎(chǔ),避免人工檢索可能造成的錯漏。
2.2 加強檔案資源聚合
用戶可使用數(shù)據(jù)可視化工具,將檔案信息數(shù)據(jù)進行提取、分類后,存入檔案知識數(shù)據(jù)庫中,再結(jié)合用戶需求,對檔案信息進行分析和挖掘[6],使其按照需求以圖像、視頻等方式呈現(xiàn)。如圖3所示,數(shù)據(jù)可視化使零散的檔案信息被重新整合,數(shù)據(jù)間關(guān)聯(lián)性和聚合度顯著增強,不僅能夠提升檔案信息的交互性,充分挖掘檔案信息資源,還能根據(jù)用戶具體需求實現(xiàn)檔案信息個性化挖掘“一人一策”,最大程度發(fā)揮檔案利用效能。(圖3)
圖3 數(shù)據(jù)可視化應(yīng)用于檔案資源聚合
2.3 提升服務(wù)保障能力
對檔案信息數(shù)據(jù)進行可視化處理的最終目的是提升檔案服務(wù)保障能力。隨著軍隊檔案服務(wù)保障要求向“為戰(zhàn)服務(wù)”的方向發(fā)展,軍隊檔案管理與利用也應(yīng)進一步提升技術(shù)水平。如圖4所示,數(shù)據(jù)可視化工具能夠應(yīng)用于檔案管理全壽命周期,在檔案管理的各個階段對檔案現(xiàn)狀和檔案數(shù)據(jù)分析利用進行有效控制。(圖4)
圖4 數(shù)據(jù)可視化應(yīng)用于檔案管理全壽命過程
數(shù)據(jù)可視化工具要在軍隊檔案領(lǐng)域持續(xù)深度有效應(yīng)用,仍需把握好以下幾個方面問題:
數(shù)據(jù)可視化工具能否在軍隊檔案利用過程中發(fā)揮最大效能,取決于數(shù)據(jù)質(zhì)量的高低。這需要對檔案數(shù)據(jù)在其產(chǎn)生到歸檔的全過程進行嚴格的質(zhì)量管控。
在檔案形成環(huán)節(jié),應(yīng)當(dāng)注重檔案質(zhì)量管控,確保歸檔文件主體完整、內(nèi)容可靠、能夠長期保存;在檔案征集管理環(huán)節(jié),應(yīng)當(dāng)注重檔案主體質(zhì)量管控,確保檔案資料鑒定準(zhǔn)確、保管妥當(dāng),數(shù)字化檔案數(shù)據(jù)符合標(biāo)準(zhǔn)、要素齊全;在檔案服務(wù)利用環(huán)節(jié),應(yīng)注重檔案元數(shù)據(jù)管控,確保檔案數(shù)據(jù)格式合規(guī)、調(diào)用便利。
檔案部門應(yīng)當(dāng)加強檔案數(shù)據(jù)管理,保證數(shù)據(jù)可視化工具能在數(shù)據(jù)保密安全的前提下為軍隊各項工作任務(wù)提供最大范圍、最大程度的支撐保障。主要應(yīng)從以下四個方面考慮:
(1)精準(zhǔn)定密。軍隊檔案涉密程度深,涉及領(lǐng)域廣。為確保檔案能夠真正實現(xiàn)高效利用服務(wù),避免因失泄密導(dǎo)致的決策失誤、保障失利,檔案管理人員必須結(jié)合檔案原密級和相關(guān)規(guī)章制度,嚴格精準(zhǔn)鑒定被利用檔案密級,嚴防在檔案數(shù)據(jù)可視化服務(wù)利用過程中因定密失誤而造成的失泄密問題。
(2)跨網(wǎng)安全。從保密安全的角度出發(fā),目前各軍隊檔案館間信息數(shù)據(jù)利用形式仍為物理隔離、單向傳送,這種模式為檔案數(shù)據(jù)跨單位數(shù)據(jù)調(diào)用帶來不便。隨著軍隊檔案利用模式逐漸向一體化、共享型方向發(fā)展,軍隊檔案信息數(shù)據(jù)未來將逐漸走出局域網(wǎng)限制,轉(zhuǎn)化為跨網(wǎng)共享模式。該模式下,需格外注重數(shù)據(jù)傳輸安全,可使用網(wǎng)閘等跨網(wǎng)信息數(shù)據(jù)交換設(shè)備,保證在不同網(wǎng)絡(luò)安全區(qū)之間、物理隔離網(wǎng)絡(luò)之間實現(xiàn)數(shù)據(jù)的安全傳輸[7],確保聯(lián)合作戰(zhàn)下檔案數(shù)據(jù)可視化工具能夠科學(xué)運行、安全保障。
(3)授權(quán)分享。為在方便利用的同時保障本單位檔案信息數(shù)據(jù)安全,提高檔案數(shù)據(jù)挖掘分析和可視化呈現(xiàn)質(zhì)量,檔案管理單位可在本單位共享平臺上對不同檔案利用人員和單位賦予相應(yīng)的檔案使用權(quán)限,在保證檔案信息數(shù)據(jù)充分利用前提下,對檔案信息數(shù)據(jù)調(diào)用情況進行把關(guān),對被利用檔案數(shù)據(jù)及時回收,在提高檔案利用效果的同時保證檔案信息數(shù)據(jù)的保密安全。
(4)日志記錄。檔案信息數(shù)據(jù)在使用時應(yīng)做好數(shù)據(jù)調(diào)用、數(shù)據(jù)管理、身份賦權(quán)等方面的日志記錄,嚴格確保數(shù)據(jù)安全,為數(shù)據(jù)信息追溯提供依據(jù)。
檔案數(shù)據(jù)可視化工具應(yīng)當(dāng)不斷迭代更新以適應(yīng)任務(wù)需求和科技水平的不斷變化,在此期間應(yīng)處理好以下幾個方面的關(guān)系:
(1)處理好通用性與專業(yè)性的關(guān)系
檔案數(shù)據(jù)可視化工具在迭代更新期間,首先應(yīng)當(dāng)保證應(yīng)用的通用性,使不同角色的用戶都能夠使用該應(yīng)用處理大部分常見任務(wù),但針對各軍兵種的不同專業(yè)特色,也應(yīng)在此基礎(chǔ)之上兼顧好應(yīng)用的專業(yè)性,按照不同單位、不同任務(wù)群體量身設(shè)計不同的特色應(yīng)用模塊,以擴大應(yīng)用用戶覆蓋面,保障各單位不同的任務(wù)需求。
(2)處理好繼承性與創(chuàng)新性的關(guān)系
應(yīng)不斷收集用戶使用體驗數(shù)據(jù),結(jié)合前沿技術(shù)發(fā)展對應(yīng)用功能和使用體驗不斷升級,在保留用戶反饋良好的功能的基礎(chǔ)之上,及時做好刪繁就簡、去粗取精的工作,并及時引入新技術(shù)、新算法,不斷推陳出新,根據(jù)用戶需求推出新的應(yīng)用模塊,以適應(yīng)用戶需求、科技發(fā)展等日新月異的變化。
(3)處理好便捷性與安全性的關(guān)系
檔案數(shù)據(jù)可視化工具能夠使數(shù)據(jù)分析基礎(chǔ)較差的檔案工作人員也可以輕松對檔案數(shù)據(jù)信息進行分析挖掘,因此用戶前臺操作便捷、使用門檻低。但由此也帶來了數(shù)據(jù)安全方面的問題,增加了失泄密風(fēng)險。在應(yīng)用迭代更新的過程中,應(yīng)當(dāng)對身份驗證、身份賦權(quán)、日志記錄、數(shù)據(jù)維護和數(shù)據(jù)提取等方面做好維護升級,全力保障后臺檔案數(shù)據(jù)安全不被泄露。
本文從分析數(shù)據(jù)可視化技術(shù)應(yīng)用現(xiàn)狀入手,探索了數(shù)據(jù)可視化工具在軍隊檔案管理中的應(yīng)用過程與作用,并對軍隊檔案可視化應(yīng)用需把握的問題進行了深入分析。今后,隨著科學(xué)技術(shù)的進一步飛速發(fā)展,數(shù)據(jù)可視化工具必將成為軍隊檔案管理利用的重要手段之一。