梁其華
河北省環(huán)境地質(zhì)勘查院在多年技術(shù)密集型發(fā)展的研究實踐中,在水資源、水環(huán)境監(jiān)測、地質(zhì)災(zāi)害、礦山環(huán)境、地質(zhì)環(huán)境等學(xué)科領(lǐng)域形成了獨特技術(shù)專業(yè)優(yōu)勢。自1957年監(jiān)測院建成至今已積累了大量科技地質(zhì)資料檔案,這些寶貴的地質(zhì)檔案信息資源對地質(zhì)環(huán)境監(jiān)測、地質(zhì)災(zāi)害防治等相關(guān)調(diào)查、綜合研究工作有著重要的支撐作用,因此,迫切需要建立地質(zhì)資料檔案信息管理平臺,實現(xiàn)內(nèi)部資源的保存和網(wǎng)絡(luò)資源共建共享、查詢、利用以更好地服務(wù)于國民經(jīng)濟建設(shè)。
一、地質(zhì)檔案的現(xiàn)狀
河北省環(huán)境地質(zhì)勘查院(2017年更名為:河北省地質(zhì)環(huán)境監(jiān)測院,以下簡稱:監(jiān)測院)資料室以前對地質(zhì)檔案管理采用的是“河北省地質(zhì)環(huán)境目錄信息系統(tǒng)”管理平臺,本系統(tǒng)的建設(shè)只是實現(xiàn)了監(jiān)測院所有地質(zhì)檔案的目錄、檔號、作者、形成日期等簡單查詢。而對地質(zhì)檔案還未實現(xiàn)全文檢索,電子資源規(guī)?;?、規(guī)范化分類組織,統(tǒng)一調(diào)度與管理資源。目前監(jiān)測院約有1萬4千多份地質(zhì)檔案,分別保存在監(jiān)測院以及6市監(jiān)測分院,為盤活現(xiàn)有總院和各監(jiān)測院地質(zhì)資料檔案信息資源,提高地質(zhì)資料開發(fā)利用水平,避免重復(fù)投入,需建建立全院一體化數(shù)字資源管理系統(tǒng)“信息資源管理平臺”來管理地質(zhì)資料檔案,解決現(xiàn)有的大量電子文件和紙質(zhì)文件數(shù)字化后的管理難題,實現(xiàn)監(jiān)測總院與監(jiān)測分院信息中心資源信息共建共享,以便提供最新、全面、快捷的地質(zhì)檔案信息資源服務(wù)。
二、地質(zhì)檔案信息管理平臺框架建設(shè)與研究
1.信息管理平臺建設(shè)的內(nèi)容分析
目前,地質(zhì)檔案管理工作模式與時代發(fā)展對地質(zhì)檔案的需求存在嚴(yán)重的脫節(jié)。仍以紙質(zhì)檔案為主的管理模式,不僅產(chǎn)生了大量紙電一致性檢查等費時費力缺乏意義的工作,也影響了現(xiàn)代地質(zhì)工作中多元化手段所產(chǎn)生的豐富的信息數(shù)據(jù)檔案信息資源的記錄、展現(xiàn)和利用。為適應(yīng)信息化時代的發(fā)展和需求,信息管理平臺建設(shè)需從資源規(guī)劃、資源整合、數(shù)據(jù)流程、總體框架建設(shè)、功能建設(shè)和檢索信息門戶的建設(shè)等六個方面內(nèi)容進行了分析與研究。
2.信息管理平臺資源規(guī)劃
河北省地質(zhì)環(huán)境監(jiān)測院針對三種數(shù)據(jù)進行分析、管理、規(guī)劃。
(1)紙質(zhì)資源管理:通過系統(tǒng)提供數(shù)字化加工系統(tǒng)進行批量紙質(zhì)資源加工。
(2)內(nèi)部電子文檔(包括音視頻資源):通過系統(tǒng)提供數(shù)據(jù)遷移模塊對內(nèi)部電子檔案進行批量整合。
(3)技術(shù)信息管理:由于監(jiān)測院技術(shù)信息數(shù)據(jù)資源多為非結(jié)構(gòu)化數(shù)據(jù),因此系統(tǒng)在處理過程中需借助優(yōu)質(zhì)的軟硬件設(shè)備,以便得出準(zhǔn)確的結(jié)果。
3.信息管理平臺資源整合
河北省地質(zhì)環(huán)境監(jiān)測院就是要整合現(xiàn)有數(shù)據(jù)及紙質(zhì)資源,主要有以下資源需要進行整合:
(1)電子文檔:對現(xiàn)有的地質(zhì)原始和成果檔案電子文件,通過標(biāo)引、分類、組織等工作,統(tǒng)一導(dǎo)入到資源平臺,并保持實時更新。
(2)紙質(zhì)文檔:對現(xiàn)存在的大量紙質(zhì)資料,需要通過數(shù)字化制作、分類、組織等工作,以統(tǒng)一格式導(dǎo)入到資源平臺,并保持實時更新。
4.地質(zhì)檔案的分類
對現(xiàn)有的地質(zhì)資料檔案管理模式進行綜合研究和科學(xué)分類,為平臺框架建設(shè)打好基礎(chǔ)工作。
(1)根據(jù)地質(zhì)檔案生產(chǎn)階段監(jiān)測院分為:原始地質(zhì)檔案和成果地質(zhì)檔案。
依據(jù)《原始地質(zhì)資料立卷歸檔規(guī)則》規(guī)定原始地質(zhì)資料檔案分十個類別:底/D、測/C、觀/G、探/T、樣/Y、試/S、錄/L、像/X、綜/Z、文/W 。
依據(jù)《成果地質(zhì)檔案電子文件匯交格式要求》成果地質(zhì)資料檔案分為:正文類、審批類、附圖類、附表類、附件類、數(shù)據(jù)庫和軟件類、多媒體類、其他類。
(2)根據(jù)地質(zhì)資料檔案的類型監(jiān)測院分為:技術(shù)地質(zhì)成果、地形圖、國家標(biāo)準(zhǔn)規(guī)范、行業(yè)標(biāo)準(zhǔn)規(guī)范、年鑒、地質(zhì)圖書、地質(zhì)期刊、參考資料等。
5.信息管理平臺數(shù)據(jù)流程
系統(tǒng)的數(shù)據(jù)來源共有兩種:電子資源、紙質(zhì)文檔和各種數(shù)據(jù)庫。因此就其數(shù)據(jù)流程分述如下:
(1)電子資源:對經(jīng)過審定的電子文檔直接經(jīng)過分類和標(biāo)引后存儲到數(shù)據(jù)庫中,供用戶查閱。
(2)紙質(zhì)文檔:對經(jīng)過審定的紙質(zhì)文檔首先需經(jīng)過掃描,形成電子文檔,其次經(jīng)OCR識別軟件識別,提取出文字信息,再從文字信息中提取出目錄信息,最后經(jīng)過分類和標(biāo)引后存儲到數(shù)據(jù)庫中。
6.信息管理平臺總體框架建設(shè)
河北省環(huán)境地質(zhì)監(jiān)測院信息管理平臺總體框架的建設(shè)根據(jù)地質(zhì)檔案類別要求總體上采用松散耦合的分層架構(gòu),以統(tǒng)一的標(biāo)準(zhǔn)體系和安全保障體系作為支撐,由基礎(chǔ)設(shè)施層、數(shù)據(jù)資源層、平臺支撐層、業(yè)務(wù)應(yīng)用層四個層次組成。TPI信息資源建設(shè)與管理系統(tǒng)中的各個模塊將這四個層次有機結(jié)合起來,使每層功能相對集中和獨立,能夠為上一層提供很好的支撐服務(wù),層與層之間具有明確的邊界劃分,這種松散耦合的結(jié)構(gòu)便于未來軟硬件及應(yīng)用服務(wù)的調(diào)整、擴展與升級,基于面向服務(wù)(SOA)的設(shè)計理念以基礎(chǔ)設(shè)施為基礎(chǔ),以數(shù)據(jù)資源整合共享為核心,將各種信息功能快速整合,開發(fā)出組合式應(yīng)用,實現(xiàn)監(jiān)測總院及6市監(jiān)測分院地質(zhì)檔案信息化資源整合共享的目標(biāo)。(整個系統(tǒng)的架構(gòu)見圖1)
7.信息平臺管理功能的建設(shè)
系統(tǒng)需要將分散無序、形式各異的地質(zhì)檔案采集、整理、加工、集成、整合,形成統(tǒng)一的數(shù)據(jù)信息服務(wù)體系,并存儲到資源數(shù)據(jù)庫中,由此發(fā)布到網(wǎng)站平臺上,提供相應(yīng)的服務(wù)功能需求如下。
紙質(zhì)文檔加工系統(tǒng)主要對文檔進行電子化處理,包括:掃描儀、照拍儀驅(qū)動開發(fā)及與相關(guān)系統(tǒng)集成、圖像處理、目錄樹智能識別、OCR文本識別,電子標(biāo)準(zhǔn)格式解析,電子瀏覽器開發(fā)等。將數(shù)字化的地質(zhì)成果報告的正文類、審批類、附圖類、附表類、附件類、數(shù)據(jù)庫和軟件類、多媒體類和其他類等資源通過數(shù)字化加工系統(tǒng),建成科技信息數(shù)據(jù)庫,最終實現(xiàn)科技信息的系統(tǒng)化管理。
整個系統(tǒng)以監(jiān)測總院為中心,構(gòu)建中心服務(wù)器,各個分院通過客戶端上傳總院內(nèi)部的中心服務(wù)器。各分院使用掃描儀設(shè)備將成果報告以及所有紙質(zhì)資料檔案掃描成圖像文件輸入計算機,掃描成冊的圖像文件通過加工工具轉(zhuǎn)換成pdf格式,并在該工具中實現(xiàn)生成圖片雙層pdf,目錄加工,基本圖像處理,pdf水印等操作。之后與各處電子資源一并通過分類標(biāo)引工具進行文字的加工標(biāo)引、校對等工作后,上傳至中心服務(wù)器。數(shù)據(jù)經(jīng)中心服務(wù)器或客戶端發(fā)布形成監(jiān)測院地質(zhì)檔案管理平臺門戶系統(tǒng),從而為用戶提供地質(zhì)資料檔案查詢、借閱等服務(wù)。(見圖2地質(zhì)紙質(zhì)檔案數(shù)字化功能建設(shè)框架圖)
8.檢索與信息資源門戶的建設(shè)
(1)用戶授權(quán)管理
將數(shù)據(jù)進行掃描、導(dǎo)入、建庫、分類、標(biāo)引后,進入數(shù)據(jù)的發(fā)布流程。通過系統(tǒng)的發(fā)布后臺對訪問者的信息以及數(shù)據(jù)的分配等操作權(quán)限進行管理。管理員賬戶可對訪問者賬戶進行增加、刪除、修改等功能的操作。并給訪問者賬戶分配不同等級的數(shù)據(jù)操作權(quán)限,包含:添加、修改、刪除、分配任務(wù)、建庫、標(biāo)引、分類、檢查、文獻檢索、下載、在線瀏覽、打印、文件拷貝等權(quán)限。
數(shù)據(jù)庫存儲的密級管理,分為公開、內(nèi)部、秘密、機密和絕密五個等級,可以根據(jù)自己需要設(shè)置。對本系統(tǒng)的使用操作用戶進行管理,使得應(yīng)用系統(tǒng)擁有合理、高效而靈活的統(tǒng)一用戶管理安全機制,不同身份的用戶擁有不同的操作權(quán)限,管理者還可以根據(jù)實際情況為用戶動態(tài)添加權(quán)限。通過多層次的權(quán)限驗證機制,確保沒有相應(yīng)權(quán)限的用戶無法修改或訪問相關(guān)的信息,充分保障關(guān)鍵數(shù)據(jù)的安全。
(2)信息資源門戶
通過該系統(tǒng)的各個工具將數(shù)據(jù)資源按照一定的規(guī)則建立,并經(jīng)過系統(tǒng)發(fā)布后臺設(shè)置權(quán)限將數(shù)據(jù)統(tǒng)一發(fā)布后,可通過建立一個綜合應(yīng)用類門戶,將各種應(yīng)用系統(tǒng)、數(shù)據(jù)資源和網(wǎng)絡(luò)資源集成到監(jiān)測院地質(zhì)檔案信息管理平臺上,實現(xiàn)單點登陸、內(nèi)容聚合和個性化定制等。被授權(quán)賬戶可以通過單一的入口安全的訪問信息資源全部和部分內(nèi)容。門戶系統(tǒng)的搭建,將所需要的各類數(shù)據(jù)資源目錄按照設(shè)定好的分類體系進行有條理的展示和導(dǎo)航,從而達到一站式導(dǎo)航的共享應(yīng)用目標(biāo)。(見圖3管理平臺檢索標(biāo)準(zhǔn)門戶圖)
三、功能缺陷及拓展方向
1.功能缺陷
(1)地質(zhì)檔案信息管理平臺還未實現(xiàn)原始地質(zhì)檔案上傳文件自動分類板塊功能。
(2)還未實現(xiàn)與全國地質(zhì)資料歸檔匯交信息系統(tǒng)DE-Maker2018軟件對接功能。
2.拓展方向
地質(zhì)檔案信息管理系統(tǒng)建設(shè)目的就是實現(xiàn)地質(zhì)檔案多模式管理、匯交、利用與服務(wù),實現(xiàn)與全國各省地質(zhì)檔案館、地質(zhì)檔案室互聯(lián)互通、信息集成、數(shù)據(jù)交換、信息共享,完成地質(zhì)檔案工作向以數(shù)據(jù)為主的服務(wù)模式全面轉(zhuǎn)型,為社會提供系列化、標(biāo)準(zhǔn)化的地質(zhì)檔案數(shù)據(jù)信息產(chǎn)品。為此,需要對“地質(zhì)檔案信息管理平臺建設(shè)”繼續(xù)進行拓展與研究,完成與監(jiān)測院現(xiàn)有地質(zhì)檔案信息目錄系統(tǒng)對接,與全國地質(zhì)資料歸檔匯交信息系統(tǒng)DE-Maker2018對接,形成對地質(zhì)資料數(shù)據(jù)進行在線電子文檔制作,自動接收、查驗、入庫管理、涉密清理、集成整合等處理模式,達到可以進行匯交地質(zhì)資料的數(shù)字資源唯一標(biāo)識符申請及著錄、匯交等業(yè)務(wù)的在線辦理和指導(dǎo)工作,形成支持原始地質(zhì)檔案分類和地質(zhì)成果分類的標(biāo)準(zhǔn)化、規(guī)?;?、可共享的地質(zhì)資料檔案數(shù)字資源信息,形成一個分散為集中的地質(zhì)檔案全國信息管理系統(tǒng)大數(shù)據(jù)中心,進一步提高地質(zhì)檔案的科學(xué)管理與社會化服務(wù)水平。
(作者單位:河北省地質(zhì)環(huán)境監(jiān)測院)