郭明多,魏 彬
(交通運(yùn)輸部科學(xué)研究院,北京 100029)
政務(wù)信息資源產(chǎn)生于各級政府部門履行職責(zé)過程中的各個(gè)環(huán)節(jié)[1],這些信息資源是各部門開展相關(guān)業(yè)務(wù)的基礎(chǔ)和依據(jù),在各行業(yè)管理、科學(xué)決策、對外服務(wù)等方面發(fā)揮著越來越重要的作用。隨著信息系統(tǒng)在交通運(yùn)輸各級政務(wù)部門中的廣泛應(yīng)用,交通運(yùn)輸行業(yè)已經(jīng)積累了較為豐富的政務(wù)信息資源。為切實(shí)提高行業(yè)信息資源開放共享和開發(fā)利用水平,實(shí)現(xiàn)以信息資源目錄管理交通運(yùn)輸數(shù)據(jù)資產(chǎn),使行業(yè)信息資源能夠“找得著、用得上、管得了”[2],從而有效支撐“四個(gè)交通”的建設(shè)和發(fā)展,交通運(yùn)輸行業(yè)的政務(wù)信息資源目錄編制工作勢在必行?;诮煌ㄟ\(yùn)輸行業(yè)在政務(wù)信息資源目錄體系前期相關(guān)研究成果,通過本文所闡述的信息資源目錄編制方法,交通運(yùn)輸部首次對部級信息資源進(jìn)行了全面的梳理和匯總,形成了第一版部級政務(wù)信息資源目錄,為行業(yè)信息資源目錄體系的搭建、信息資源管理、信息資源共享和開發(fā)利用奠定了堅(jiān)實(shí)基礎(chǔ)。
美國等西方發(fā)達(dá)國家從20世紀(jì)70年代就開始開展政務(wù)信息資源的管理政策研究。1994年,美國商務(wù)部提出了一種政府公開信息資源的分布式目錄管理和利用體系,即政務(wù)信息定位服務(wù)(Govern?ment Information Locator Service,簡稱GILS),并將其作為政府信息處理標(biāo)準(zhǔn)頒發(fā),各政府機(jī)構(gòu)可以利用GILS標(biāo)準(zhǔn)梳理各自的信息資源,建立自己的政務(wù)信息資源目錄和信息資源檢索系統(tǒng)[3],該項(xiàng)標(biāo)準(zhǔn)在其他國家也得到了廣泛應(yīng)用[4]。1995年,由聯(lián)機(jī)計(jì)算機(jī)圖書館中心(Online Computer Library Cen?ter,簡稱OCLC)與國家超級計(jì)算應(yīng)用中心(Na?tional Center for Supercomputing Applications,簡稱NCSA)聯(lián)合發(fā)起了都柏林核心元數(shù)據(jù)(Dublin Core Metadata,簡稱DCM)[5],其基本方案包括15個(gè)核心元素的集合,相關(guān)規(guī)范都由都柏林核心元數(shù)據(jù)倡議組織(Dublin Core Metadata Initiative,簡稱DCMI)管理和維護(hù)。都柏林核心元數(shù)據(jù)具有簡單、易理解、易擴(kuò)展以及能與其他元數(shù)據(jù)形式進(jìn)行橋接的優(yōu)點(diǎn),成為迄今為止應(yīng)用最廣泛的元數(shù)據(jù)集[6]。英國、澳大利亞等國家的政務(wù)信息資源元數(shù)據(jù)標(biāo)準(zhǔn)都是基于都柏林元數(shù)據(jù)標(biāo)準(zhǔn)發(fā)展而來的,其中最典型的是英國電子政務(wù)元數(shù)據(jù)標(biāo)準(zhǔn)(e?Gov?ernment Metadata Standard,簡稱 e?GMS),它定義了公共部門使用的管理元數(shù)據(jù)的結(jié)構(gòu)和規(guī)則,包括25個(gè)核心元素、幾十個(gè)限定元素及其編碼模式,在都柏林核心元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上添加了一些元數(shù)據(jù)并進(jìn)行了精簡以滿足公共部門的特殊需要[7]。
我國相關(guān)研究起步較晚,在21世紀(jì)初開始理論和實(shí)踐的探索[8],但隨著信息技術(shù)的飛速發(fā)展和信息資源的爆炸式增長,政府部門越來越重視政務(wù)信息資源的開發(fā)利用。國家信息中心較早關(guān)注政務(wù)信息資源目錄體系建設(shè),并提出了基于目錄體系的政務(wù)信息資源整合方法[9]。隨后,國務(wù)院辦公廳于2017年5月印發(fā)了《政務(wù)信息系統(tǒng)整合共享實(shí)施方案》(國辦發(fā)〔2017〕39號)[10],國家發(fā)改委和中央網(wǎng)信辦隨后在6月聯(lián)合印發(fā)了《政務(wù)信息資源目錄編制指南(試行)》(發(fā)改高技〔2017〕1272號)[11],旨在指導(dǎo)各級政府部門編制信息資源目錄,提高我國政務(wù)信息資源整合共享水平。國內(nèi)部分行業(yè)及省、市政府部門已經(jīng)編制了政務(wù)信息資源目錄,如國家發(fā)改委、公安部等部委,上海市的政府?dāng)?shù)據(jù)服務(wù)網(wǎng)已累計(jì)匯聚了11個(gè)重點(diǎn)領(lǐng)域300多類數(shù)據(jù)[12]。各部委和地方政府在信息資源目錄體系上的建設(shè),對我國政務(wù)信息資源目錄體系建設(shè)與理論實(shí)踐進(jìn)行了有效探索。
交通運(yùn)輸部從2006年開始開展交通信息資源目錄體系前期研究工作,并于2009年發(fā)布了《交通信息資源核心元數(shù)據(jù)》[13]、《公路水路交通信息資源業(yè)務(wù)分類》[14]、《交通信息資源標(biāo)識符編碼規(guī)則》[15]3項(xiàng)行業(yè)標(biāo)準(zhǔn),隨后陸續(xù)研究制定了涉及交通數(shù)據(jù)管理、交通管理數(shù)據(jù)字典、交通基礎(chǔ)信息數(shù)據(jù)元等一系列標(biāo)準(zhǔn),為行業(yè)信息資源的梳理和目錄編制奠定了基礎(chǔ)。交通運(yùn)輸部海事局、黑龍江省交通運(yùn)輸廳[16]和廣西省交通運(yùn)輸廳等省級行業(yè)管理部門,已經(jīng)開展了信息資源目錄的編制工作,形成了各自的目錄體系和成果,但交通運(yùn)輸行業(yè)仍然未能形成覆蓋全行業(yè)的政務(wù)信息資源目錄??傮w上,行業(yè)政務(wù)信息資源“家底”不清、共享困難、開發(fā)利用不充分等問題依然十分突出。
要摸清行業(yè)政務(wù)信息資源,首先要開展信息資源調(diào)查與梳理。政務(wù)信息資源目錄的梳理有兩種途徑可供選擇:一是從業(yè)務(wù)梳理入手,調(diào)查業(yè)務(wù)環(huán)節(jié)和業(yè)務(wù)辦理流程,梳理各個(gè)業(yè)務(wù)相關(guān)的信息,從而摸清部門所產(chǎn)生的政務(wù)信息資源;二是從現(xiàn)有政務(wù)信息系統(tǒng)入手,對系統(tǒng)情況和數(shù)據(jù)庫中的數(shù)據(jù)資源進(jìn)行調(diào)查和梳理,形成信息資源清單[17]。
自上而下的梳理方法相對簡單便捷,梳理出的信息資源清單整齊規(guī)范,但是因?qū)嶋H信息系統(tǒng)和數(shù)據(jù)資源與業(yè)務(wù)環(huán)節(jié)和業(yè)務(wù)流程并非一一對應(yīng),清單實(shí)用性差,不能作為指導(dǎo)今后數(shù)據(jù)資源交換共享的依據(jù)。因此,結(jié)合交通運(yùn)輸行業(yè)信息資源目錄相關(guān)科研和工作經(jīng)驗(yàn),第2種自下而上的途徑更容易在行業(yè)中開展和落地。
交通運(yùn)輸政務(wù)信息資源目錄編制工作,從信息系統(tǒng)調(diào)查入手,對部內(nèi)各司局主管的用于提供公眾服務(wù)、日常辦公及支撐業(yè)務(wù)運(yùn)轉(zhuǎn)所有信息系統(tǒng)的基本情況、主要設(shè)備基本情況、數(shù)據(jù)資源基本情況(包括數(shù)據(jù)庫名稱、數(shù)據(jù)表名稱、數(shù)據(jù)記錄數(shù)、數(shù)據(jù)存儲量、數(shù)據(jù)更新頻率)、數(shù)據(jù)字典情況(字段名稱、字段含義、數(shù)據(jù)類型、長度等)等進(jìn)行了詳細(xì)的調(diào)查研究和梳理,從而初步摸清了部級政務(wù)信息資源的家底,形成了信息資源清單。數(shù)據(jù)資源基本情況調(diào)查表和數(shù)據(jù)字典調(diào)查表如表1和表2所示。
表1 信息系統(tǒng)數(shù)據(jù)資源基本情況調(diào)查表
表2 信息系統(tǒng)數(shù)據(jù)字典調(diào)查表
為了加強(qiáng)行業(yè)政務(wù)信息資源有序管理,促進(jìn)信息資源共享和利用,應(yīng)形成一套科學(xué)的信息資源分類方法和標(biāo)識符編碼規(guī)范,以實(shí)現(xiàn)信息資源的分類管理、快速檢索和精準(zhǔn)定位。
依據(jù)行業(yè)內(nèi)各部門現(xiàn)有的“三定方案”(定職能、定機(jī)構(gòu)、定編制)和工作職能,采用自上而下、線面結(jié)合的分類方法,梳理交通運(yùn)輸政務(wù)信息資源分類體系。首先以行業(yè)領(lǐng)域及其運(yùn)輸方式作為行業(yè)分類的主要依據(jù),然后依照各行業(yè)分類下的業(yè)務(wù)范圍作為業(yè)務(wù)分類的主要依據(jù),并在業(yè)務(wù)范圍內(nèi)從管理對象、管理業(yè)務(wù)行為的主題和信息資源的類別3個(gè)不同維度定位信息分類。最終形成了9個(gè)行業(yè)類目、35個(gè)業(yè)務(wù)類目以及11個(gè)管理對象類目、10種行為主題類目和3種信息類別類目的分類體系[18],分類結(jié)構(gòu)如圖1所示,類目名稱如表3所示。
圖1 交通運(yùn)輸政務(wù)信息資源分類結(jié)構(gòu)
表3 交通運(yùn)輸政務(wù)信息資源分類類目
基于上述信息資源分類,結(jié)合信息資源提供方代碼等標(biāo)識符,形成行業(yè)政務(wù)信息資源編碼規(guī)則,給所有信息資源貼上了唯一的“標(biāo)簽”[19]。
交通運(yùn)輸政務(wù)信息資源代碼由前段碼、分隔符和后段碼3部分組成。其中,前段碼是交通運(yùn)輸行業(yè)政府管理機(jī)構(gòu)編碼,表現(xiàn)為20位的字符串;分隔符為“/”;后段碼包括資源來源系統(tǒng)代碼和資源分類代碼,表現(xiàn)為17位的字符串。信息資源代碼的表示形式如圖2所示。
圖2 信息資源代碼格式
元數(shù)據(jù)是描述信息資源特征的數(shù)據(jù),是關(guān)于數(shù)據(jù)的數(shù)據(jù),用于組織、描述、檢索、保存和管理信息資源[20]。利用元數(shù)據(jù)來描述信息資源后,就能夠?qū)崿F(xiàn)快速發(fā)現(xiàn)和確認(rèn)信息資源、為信息資源提供檢索點(diǎn)等以及在不同系統(tǒng)之間進(jìn)行數(shù)據(jù)交換。給元數(shù)據(jù)進(jìn)行賦值,是信息資源編目過程中最重要的環(huán)節(jié)。
交通運(yùn)輸政務(wù)信息資源目錄的元數(shù)據(jù),結(jié)合行業(yè)特點(diǎn),在國家發(fā)改委印發(fā)的《政務(wù)信息資源目錄編制指南(試行)》[11]要求的基礎(chǔ)上進(jìn)行了一定的擴(kuò)展和完善,確定了包含必選項(xiàng)和可選項(xiàng)在內(nèi)的共計(jì)33個(gè)核心元數(shù)據(jù)(如圖3所示)。
圖3 交通運(yùn)輸政務(wù)信息資源目錄元數(shù)據(jù)
其中,為了方便聯(lián)系數(shù)據(jù)資源提供方,在國家要求的基礎(chǔ)上增加了提供方聯(lián)系方式;由于現(xiàn)在行業(yè)信息資源仍然存在“一數(shù)多源”的現(xiàn)象,增加來源系統(tǒng)和來源數(shù)據(jù)庫兩個(gè)核心元數(shù)據(jù),用于對來自不同系統(tǒng)的相同信息資源進(jìn)行區(qū)分;此外,還增加了數(shù)據(jù)元編號,為今后信息資源目錄與行業(yè)數(shù)據(jù)元標(biāo)準(zhǔn)的對標(biāo)工作提供基礎(chǔ)。
交通運(yùn)輸政務(wù)信息資源目錄編制主要包含目錄編制、目錄審核、目錄注冊和目錄發(fā)布4個(gè)過程。其中,目錄編制主要涉及信息資源目錄信息化部分編制、信息資源目錄業(yè)務(wù)部分編制以及信息資源目錄匯總3個(gè)環(huán)節(jié)。交通運(yùn)輸政務(wù)信息資源目錄的編制過程如圖4所示。
圖4 交通運(yùn)輸政務(wù)信息資源目錄編制過程
依托前期信息資源調(diào)研成果,編目人員可通過電子表格的形式直接進(jìn)行人工編目,或使用目錄系統(tǒng)進(jìn)行在線人工編目。此外,對于可直接訪問其業(yè)務(wù)數(shù)據(jù)庫的信息資源,可通過目錄系統(tǒng)從數(shù)據(jù)庫中提取元數(shù)據(jù)特征信息,從而實(shí)現(xiàn)自動(dòng)編目。信息化部分編目,將完成對信息資源名稱、信息資源提供方、信息資源提供方代碼、來源系統(tǒng)、來源數(shù)據(jù)庫、信息資源格式、信息項(xiàng)屬性、更新周期等核心元數(shù)據(jù)的賦值,形成信息資源清單。以全國道路運(yùn)政管理信息系統(tǒng)為例,形成的信息資源清單如表4所示。
表4 信息資源清單示例(部分內(nèi)容省略)
基于信息資源清單,由各被調(diào)查機(jī)構(gòu)的業(yè)務(wù)人員根據(jù)業(yè)務(wù)特點(diǎn)和資源特點(diǎn),確定信息資源的業(yè)務(wù)屬性,包括對信息資源進(jìn)行分類,補(bǔ)充信息資源的共享類型、共享?xiàng)l件、共享范圍以及信息資源提供共享的方式分類、方式類型等,確定信息資源的開放屬性,最后各自形成部門信息資源目錄。
匯總各部門信息資源目錄,由目錄系統(tǒng)完成信息資源編碼和元數(shù)據(jù)校驗(yàn),并將目錄注冊到目錄管理系統(tǒng)中。報(bào)部審核通過后,進(jìn)行信息資源目錄的發(fā)布,實(shí)現(xiàn)部級信息資源目錄的在線查詢和檢索,完成目錄編制工作。此版信息資源目錄最終共計(jì)匯總了11個(gè)部內(nèi)司局和部直屬機(jī)構(gòu)反饋的500多個(gè)信息資源,包含6 900余個(gè)信息項(xiàng)。
以班線線路信息為例,形成的信息資源目錄如表5所示[21],在目錄系統(tǒng)中查詢結(jié)果如圖5所示。
表5 信息資源目錄示例(部分內(nèi)容省略)
圖5 信息資源目錄查詢結(jié)果
通過編制政務(wù)信息資源目錄,交通運(yùn)輸部第一次摸清了部級政務(wù)信息資源的“家底”,初步形成了交通運(yùn)輸政務(wù)信息資源的“總賬本”,成為行業(yè)各級部門了解行業(yè)信息資源現(xiàn)狀的重要工具。各級交通運(yùn)輸政務(wù)部門可在信息化項(xiàng)目立項(xiàng)和建設(shè)實(shí)施過程中,通過信息資源目錄了解現(xiàn)有信息資源情況,充分利用現(xiàn)有信息資源開展信息系統(tǒng)建設(shè),避免數(shù)據(jù)的重復(fù)采集,從源頭減少“信息煙囪”和“信息孤島”的出現(xiàn),促進(jìn)信息資源的整合。
部級信息資源目錄的編制,為各級交通運(yùn)輸政務(wù)部門開展信息資源目錄編制工作奠定了良好的基礎(chǔ)。各省可參照部級目錄,依據(jù)目錄編制指南開展各自的信息資源目錄編制和目錄系統(tǒng)建設(shè)工作。在信息資源共享方面,信息資源目錄為部級信息資源交換共享和開放應(yīng)用平臺建設(shè)提供了技術(shù)前提和保障。目前交通運(yùn)輸部正在依托信息資源目錄,開展共享數(shù)據(jù)庫建設(shè),推進(jìn)信息資源匯聚。同時(shí),通過信息資源目錄,能夠有效促進(jìn)各部門挖掘信息資源共享需求,推動(dòng)業(yè)務(wù)協(xié)同和業(yè)務(wù)流程的升級優(yōu)化。
通過本文所闡述的信息資源目錄編制方法,交通運(yùn)輸部完成了第1版部級政務(wù)信息資源目錄編制,目錄的應(yīng)用已經(jīng)開始初顯成效。后續(xù)將持續(xù)進(jìn)行信息資源目錄的維護(hù)和更新,通過目錄使用過程中收集的反饋意見,對信息資源分類和元數(shù)據(jù)不斷進(jìn)行優(yōu)化。同時(shí),依托信息資源目錄推動(dòng)信息資源匯聚和共享服務(wù)上線,真正實(shí)現(xiàn)以目錄管理交通運(yùn)輸數(shù)據(jù)資產(chǎn)。