• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)起源技術(shù)的政府網(wǎng)站信息長(zhǎng)期保存研究

      2017-04-11 17:23黃新平
      新世紀(jì)圖書(shū)館 2017年3期

      摘 要 論文對(duì)數(shù)據(jù)起源的概念、數(shù)據(jù)起源追蹤方法、數(shù)據(jù)起源的存儲(chǔ)機(jī)制進(jìn)行了概述,將數(shù)據(jù)起源技術(shù)創(chuàng)新性的引入政府網(wǎng)站信息長(zhǎng)期保存研究,分析了基于數(shù)據(jù)起源技術(shù)開(kāi)展政府網(wǎng)站信息管理的價(jià)值,在此基礎(chǔ)上,對(duì)數(shù)據(jù)起源技術(shù)支撐下的政府網(wǎng)站信息長(zhǎng)期保存管理系統(tǒng)進(jìn)行設(shè)計(jì),并提出實(shí)現(xiàn)政府網(wǎng)站信息長(zhǎng)期保存應(yīng)解決的關(guān)鍵問(wèn)題及策略。

      關(guān)鍵詞 數(shù)據(jù)起源 政府網(wǎng)站信息 長(zhǎng)期保存

      分類號(hào) G255.76

      DOI 10.16810/j.cnki.1672-514X.2017.03.008

      The Application of Data Provenance Technology Within Government Website Information Long-term Preservation

      Huang Xinping

      Abstract This paper gives a fair summary of the concept of data provenance, the tracing method of data provenance, and the storage mechanism of data provenance, and innovatively introduces the data provenance technology within government website information long-term preservation, and analyses the value of government website information management based on the data provenance technology. On this basis, it designs the government website information long-term preservation and management system supported by the technology of data provenance. In addition, the problems and countermeasures of how to realize the government website information long-term preservation are also discussed.

      Keywords Data provenance. Government website information. Long-term preservation.

      在電子政務(wù)促進(jìn)政府服務(wù)轉(zhuǎn)型背景下,各類政府網(wǎng)站每天都在生產(chǎn)大量信息數(shù)據(jù),這些規(guī)模巨大的信息資源涵蓋政府服務(wù)的方方面面,具有極大的開(kāi)發(fā)利用價(jià)值。然而由于不同政府網(wǎng)站的構(gòu)建相對(duì)獨(dú)立,受到技術(shù)、法律、管理等因素的限制,形成政務(wù)信息“條塊分割”的局面,無(wú)法抵擋媒體遷移、技術(shù)更新等帶來(lái)的影響。如何借助網(wǎng)絡(luò)信息采集處理技術(shù),實(shí)現(xiàn)對(duì)政府網(wǎng)站信息的長(zhǎng)期保存,是當(dāng)前迫切需要解決的問(wèn)題[1]。數(shù)據(jù)起源是處理大量派生數(shù)據(jù),掌握數(shù)據(jù)由產(chǎn)生到利用整個(gè)生命周期變化的技術(shù),能詳細(xì)記錄數(shù)據(jù)對(duì)象的動(dòng)態(tài)變化,完整保存初始數(shù)據(jù)及其衍生物,保障了數(shù)據(jù)資源存儲(chǔ)的真實(shí)性和可靠性。因此,將數(shù)據(jù)起源技術(shù)引入政務(wù)網(wǎng)站信息長(zhǎng)期保存中,通過(guò)分析政府網(wǎng)站信息管理特點(diǎn),設(shè)計(jì)政府網(wǎng)站信息數(shù)據(jù)起源管理系統(tǒng),對(duì)于電子政務(wù)信息的存儲(chǔ)與共享具有重要意義。

      1 數(shù)據(jù)起源技術(shù)及其相關(guān)研究

      1.1 數(shù)據(jù)起源的概念

      起源又稱為溯源,體現(xiàn)了數(shù)據(jù)信息的產(chǎn)生與發(fā)展過(guò)程。人們通過(guò)記錄起源信息,可以掌握數(shù)據(jù)對(duì)象的一系列變化,了解與之相關(guān)的原因、地點(diǎn)、時(shí)間等信息,進(jìn)而解決包括數(shù)據(jù)分析、數(shù)據(jù)引用、數(shù)據(jù)可靠度等在內(nèi)的復(fù)雜問(wèn)題。數(shù)據(jù)起源技術(shù)產(chǎn)生于上世紀(jì)九十年代,在金融、生物、計(jì)算機(jī)等領(lǐng)域均有應(yīng)用。數(shù)據(jù)起源的基礎(chǔ)研究包括語(yǔ)義描述、起源捕獲、組織模型等。Greenwood認(rèn)為其屬于記錄實(shí)驗(yàn)過(guò)程、工作流的元數(shù)據(jù);Lanter則認(rèn)為其是對(duì)原始數(shù)據(jù)及其轉(zhuǎn)換過(guò)程的動(dòng)態(tài)描述。實(shí)質(zhì)上,每個(gè)數(shù)據(jù)對(duì)象都要經(jīng)歷從生成、加工、轉(zhuǎn)換、存檔直至消亡的過(guò)程,即具備獨(dú)特的生命周期,而數(shù)據(jù)起源技術(shù)正是對(duì)數(shù)據(jù)對(duì)象生命周期的記錄[2]。

      1.2 數(shù)據(jù)起源追蹤方法

      由于不同的系統(tǒng)對(duì)數(shù)據(jù)的記錄、加工方式不同,要想有效追蹤、管理起源信息,首先需要設(shè)計(jì)相應(yīng)的組織模型,發(fā)揮統(tǒng)領(lǐng)全局的作用。而數(shù)據(jù)起源技術(shù)的應(yīng)用關(guān)鍵,也在于通過(guò)設(shè)計(jì)與構(gòu)建組織模型,分析起源信息包含的內(nèi)容,對(duì)數(shù)據(jù)捕獲、存儲(chǔ)與加工等進(jìn)行引導(dǎo)。對(duì)起源信息的追蹤和捕獲,主要應(yīng)用到雙向指針追蹤、標(biāo)注、位向量存儲(chǔ)定位等方法。其中標(biāo)注法是將與起源數(shù)據(jù)相關(guān)的信息記錄下來(lái),操作相對(duì)簡(jiǎn)單,應(yīng)用頻率高;而雙向指針追蹤法僅適用于特定數(shù)據(jù)庫(kù)中,基于位向量的存儲(chǔ)定位只能記錄簡(jiǎn)單的數(shù)據(jù)路徑,目前還無(wú)法得到廣泛推廣[3]。工作流起源管理系統(tǒng)中多采用標(biāo)注法,以前是將標(biāo)注作為元數(shù)據(jù)進(jìn)行存儲(chǔ),隨著數(shù)據(jù)環(huán)境的日益復(fù)雜,逐漸將兩者分開(kāi)存儲(chǔ),以方便后續(xù)調(diào)用。

      1.3 數(shù)據(jù)起源的存儲(chǔ)機(jī)制

      基于數(shù)據(jù)起源的數(shù)據(jù)采集和存儲(chǔ),改變了傳統(tǒng)的數(shù)據(jù)管理模式,使得標(biāo)注與數(shù)據(jù)的聯(lián)系更為緊密。由于標(biāo)注具有多粒度特性,因此附帶起源的數(shù)據(jù)存儲(chǔ)對(duì)象并非常規(guī)數(shù)據(jù),而是包含標(biāo)注的數(shù)據(jù)。同時(shí)針對(duì)用戶的數(shù)據(jù)查詢,數(shù)據(jù)起源系統(tǒng)可以提供數(shù)據(jù)查詢、標(biāo)注查詢,以及數(shù)據(jù)和標(biāo)注查詢?nèi)N方式。根據(jù)數(shù)據(jù)與標(biāo)注的不同關(guān)系,將數(shù)據(jù)存儲(chǔ)分為離散、混合存儲(chǔ)兩類。離散存儲(chǔ)實(shí)現(xiàn)了標(biāo)注與數(shù)據(jù)物理層面的分離,可以采取邏輯鏈接的方式將兩者結(jié)合起來(lái)[4]。在數(shù)據(jù)管理過(guò)程中,應(yīng)該考慮該存儲(chǔ)方式是否存在數(shù)據(jù)修改,以及是否需要更新版本等?;旌洗鎯?chǔ)需要構(gòu)建數(shù)據(jù)集索引,以特定信息維持標(biāo)注與數(shù)據(jù)之間的共同存儲(chǔ)。數(shù)據(jù)起源的引入給數(shù)據(jù)管理帶來(lái)了新變化,要求創(chuàng)建、設(shè)置與獲取標(biāo)注,也要求尋找全新的數(shù)據(jù)索引、查詢與存儲(chǔ)方法。為避免起源信息對(duì)數(shù)據(jù)應(yīng)用的影響,要求標(biāo)注、數(shù)據(jù)之間相對(duì)獨(dú)立,因此采取離散存儲(chǔ)方式更為合適。

      2 基于數(shù)據(jù)起源技術(shù)開(kāi)展政府網(wǎng)站信息管理的價(jià)值

      數(shù)據(jù)起源技術(shù)是在起源追蹤、捕獲、查詢、可視化等技術(shù)上發(fā)展起來(lái)的,解決復(fù)雜數(shù)據(jù)存儲(chǔ)問(wèn)題的全新處理方法。在政府網(wǎng)站信息管理中引入數(shù)據(jù)起源技術(shù),只需要選擇合適的軟硬件設(shè)備,設(shè)計(jì)合理的起源數(shù)據(jù)組織模型,而無(wú)需考慮系統(tǒng)的負(fù)載和計(jì)算能力。這樣不僅可以解決政府網(wǎng)站信息分散、基礎(chǔ)設(shè)施建設(shè)重復(fù)、系統(tǒng)缺乏互聯(lián)等問(wèn)題,也可以有效降低信息管理成本,提升政務(wù)信息利用率,最大限度實(shí)現(xiàn)電子政務(wù)信息共享。

      2.1 促進(jìn)政務(wù)信息資源共享

      數(shù)據(jù)起源技術(shù)可以模擬數(shù)據(jù)對(duì)象的產(chǎn)生、傳播和衍生過(guò)程,促進(jìn)數(shù)據(jù)的優(yōu)化與共享。對(duì)于政府網(wǎng)站信息的存儲(chǔ)管理,首先需要考慮數(shù)據(jù)的可靠性和可用性。由于電子政務(wù)系統(tǒng)不斷更新,數(shù)據(jù)源處于動(dòng)態(tài)變化中,當(dāng)政府網(wǎng)站的信息發(fā)生變化時(shí),數(shù)據(jù)起源可以描述數(shù)據(jù)對(duì)象的演變過(guò)程,并根據(jù)起源信息進(jìn)行數(shù)據(jù)重構(gòu),保障數(shù)據(jù)傳播的順暢、有序性,也為政府網(wǎng)站信息共享提供了便利。同時(shí)數(shù)據(jù)起源技術(shù)實(shí)現(xiàn)了異構(gòu)分布政務(wù)信息的高效采集,在對(duì)數(shù)據(jù)來(lái)源進(jìn)行跟蹤審計(jì)的基礎(chǔ)上,為不同政務(wù)部門的數(shù)據(jù)存儲(chǔ)提供了公共平臺(tái)。通過(guò)構(gòu)建基于數(shù)據(jù)起源的政務(wù)信息存儲(chǔ)系統(tǒng),可以實(shí)現(xiàn)對(duì)分散系統(tǒng)的信息集成,從業(yè)務(wù)層面實(shí)現(xiàn)政務(wù)信息整合,促進(jìn)不同政府網(wǎng)站之間的數(shù)據(jù)交換共享,消除政務(wù)“信息孤島”。

      2.2 降低政府網(wǎng)站資源維護(hù)成本

      數(shù)據(jù)起源技術(shù)的應(yīng)用改變了政府網(wǎng)站傳統(tǒng)的軟硬件設(shè)施開(kāi)發(fā)模式,能夠?qū)崿F(xiàn)對(duì)政務(wù)系統(tǒng)配套軟硬件資源的統(tǒng)一分配,避免出現(xiàn)部分伺機(jī)服務(wù)器超負(fù)荷運(yùn)轉(zhuǎn)而部分服務(wù)器利用率低的問(wèn)題。同時(shí)借助數(shù)據(jù)起源技術(shù),可以對(duì)政府網(wǎng)站信息進(jìn)行追蹤、捕獲和采集,計(jì)算不同信息資源的負(fù)載分配情況,迅速定位系統(tǒng)錯(cuò)誤部位,分析出現(xiàn)錯(cuò)誤的原因,進(jìn)而幫助系統(tǒng)管理者迅速制定解決方案,極大提升了政務(wù)系統(tǒng)的穩(wěn)定性。此外,數(shù)據(jù)起源技術(shù)對(duì)政務(wù)系統(tǒng)數(shù)據(jù)資源的配置和管理,能夠保障不同功能模塊互不干擾,提高軟硬件設(shè)施的利用率,降低政府網(wǎng)站各類資源的維護(hù)成本。

      2.3 提升政府系統(tǒng)運(yùn)行穩(wěn)定性

      數(shù)據(jù)起源技術(shù)對(duì)政府網(wǎng)站信息的追蹤采集過(guò)程中,在分析數(shù)據(jù)來(lái)源的同時(shí),也可以構(gòu)建與數(shù)據(jù)版權(quán)相關(guān)的派生樹(shù),方便用戶根據(jù)派生樹(shù)驗(yàn)證數(shù)據(jù)對(duì)象的版權(quán),分析數(shù)據(jù)對(duì)象的真實(shí)性。而數(shù)據(jù)對(duì)象的創(chuàng)建者,也可以借助數(shù)據(jù)起源技術(shù),通過(guò)查找派生樹(shù)的方式,了解其創(chuàng)建數(shù)據(jù)的使用情況,實(shí)現(xiàn)對(duì)數(shù)據(jù)版權(quán)的有效保護(hù),避免出現(xiàn)版權(quán)糾紛。同時(shí)數(shù)據(jù)起源與分布式、虛擬化技術(shù)的結(jié)合,可以實(shí)現(xiàn)對(duì)異構(gòu)分布政務(wù)信息的追蹤、監(jiān)測(cè),并通過(guò)設(shè)置訪問(wèn)控制權(quán)限的方式,降低政務(wù)信息利用中存在的風(fēng)險(xiǎn)。從硬件角度分析,數(shù)據(jù)起源技術(shù)能夠迅速定位系統(tǒng)故障,確保系統(tǒng)的高容錯(cuò)性和故障動(dòng)態(tài)遷移性,并且以數(shù)據(jù)冗余備份的方式,降低發(fā)生故障的頻率。

      3 基于數(shù)據(jù)起源技術(shù)的政府網(wǎng)站信息長(zhǎng)期保存管理系統(tǒng)設(shè)計(jì)

      數(shù)據(jù)起源技術(shù)在長(zhǎng)期存儲(chǔ)系統(tǒng)中,可以形成以事件為中心的起源信息記錄方式。因此,可通過(guò)分析數(shù)據(jù)對(duì)象的一系列變化,實(shí)現(xiàn)對(duì)政務(wù)信息的動(dòng)態(tài)管理。

      3.1 起源管理系統(tǒng)設(shè)計(jì)原則

      在政府網(wǎng)站信息長(zhǎng)期存儲(chǔ)的整個(gè)生命周期中,要綜合考慮起源管理的影響因素,筆者認(rèn)為數(shù)據(jù)起源管理系統(tǒng)的設(shè)計(jì)應(yīng)該遵循以下原則:①以數(shù)據(jù)保存周期為依據(jù),將數(shù)據(jù)對(duì)象產(chǎn)生作為起始,對(duì)其錄入系統(tǒng)后整個(gè)生命周期的所有變化進(jìn)行動(dòng)態(tài)管理;②以O(shè)AIS(長(zhǎng)期保存通用標(biāo)準(zhǔn))為準(zhǔn)則,遵循OAIS了解數(shù)據(jù)對(duì)象長(zhǎng)期保存的基本流程,明確定義起源信息的構(gòu)成,將其作為系統(tǒng)設(shè)計(jì)的依據(jù);③以事件作為起源信息記錄中心,數(shù)據(jù)對(duì)象在存儲(chǔ)管理活動(dòng)中會(huì)產(chǎn)生大量事件,可以說(shuō)起源信息與事件是相伴相生的;④保障適用性和交互性,管理系統(tǒng)設(shè)計(jì)應(yīng)該為數(shù)據(jù)對(duì)象管理提供所有可能的功能與流程,明確不同存儲(chǔ)系統(tǒng)與不同模塊之間的嵌入關(guān)系,強(qiáng)化數(shù)據(jù)對(duì)象在不同系統(tǒng)中的交互性,并嵌入OAIS流程實(shí)現(xiàn)高效管理。

      3.2 面向數(shù)據(jù)周期的起源事件清單

      事件是數(shù)據(jù)對(duì)象一系列變化的驅(qū)動(dòng)力,借助事件不僅可以捕獲起源信息,也能夠掌握數(shù)據(jù)的動(dòng)態(tài)變化。隨著起源管理活動(dòng)中事件的增多,通過(guò)了解與數(shù)據(jù)對(duì)象相關(guān)的事件鏈,就可以展現(xiàn)長(zhǎng)期存儲(chǔ)對(duì)象的狀態(tài)變化[5]。因此,對(duì)于數(shù)據(jù)起源管理系統(tǒng)的設(shè)計(jì),將起源事件定義為系統(tǒng)可識(shí)別的,能夠至少影響一個(gè)對(duì)象的動(dòng)作,如捕獲起源信息、調(diào)取文件等。在整個(gè)數(shù)據(jù)生命周期中,OAIS包含攝入、歸檔、數(shù)據(jù)處理、業(yè)務(wù)管理、保存規(guī)劃以及訪問(wèn)等環(huán)節(jié)。對(duì)于起源事件的判斷和甄選,應(yīng)該以O(shè)AIS流程為依據(jù),綜合考慮數(shù)據(jù)對(duì)象的產(chǎn)生、發(fā)生的變化,以及數(shù)據(jù)對(duì)象的派生產(chǎn)物,進(jìn)而為數(shù)據(jù)長(zhǎng)期保存提供依據(jù)。在政府網(wǎng)站信息產(chǎn)生之初,就存在不可預(yù)知的變化因素,包括元數(shù)據(jù)、信息內(nèi)容、格式、保存責(zé)任人等,即使部分?jǐn)?shù)據(jù)本身變化不大,也需要考慮與之相關(guān)的數(shù)據(jù)對(duì)象或管理版權(quán)的變化,全面了解基于數(shù)據(jù)周期的詳細(xì)起源事件。

      3.3 嵌入OAIS的起源管理框架

      根據(jù)基于數(shù)據(jù)周期的起源事件來(lái)看,數(shù)據(jù)起源管理涉及與OAIS相關(guān)的所有功能模塊,因此對(duì)于政府網(wǎng)站信息的長(zhǎng)期保存,應(yīng)該嵌入OAIS流程中形成完整的起源管理框架,具體如圖1所示。

      由圖1可知,起源信息管理貫穿于OAIS的整個(gè)流程中,實(shí)現(xiàn)了對(duì)不同環(huán)節(jié)起源事件的動(dòng)態(tài)追蹤,也可以根據(jù)系統(tǒng)預(yù)先設(shè)定的起源事件清單,實(shí)現(xiàn)對(duì)數(shù)據(jù)對(duì)象的動(dòng)態(tài)捕獲。然后,將需要長(zhǎng)期保存的數(shù)據(jù)對(duì)象,依據(jù)相應(yīng)的起源組織模型轉(zhuǎn)換為規(guī)范的歸檔信息,保障起源信息的真實(shí)性、完整性和可用性,并且存儲(chǔ)于特定數(shù)據(jù)庫(kù)中,由對(duì)應(yīng)的管理模塊實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的長(zhǎng)期保存。對(duì)于政府網(wǎng)站信息長(zhǎng)期保存的起源管理,需要設(shè)置事件配置、事件監(jiān)控、事件組織等功能模塊。其中,事件配置模塊主要功能在于定義需捕獲數(shù)據(jù)的類型,實(shí)現(xiàn)對(duì)事件的合理配置。在起源信息捕獲前,由長(zhǎng)期保存系統(tǒng)的管理者根據(jù)實(shí)際需求,結(jié)合系統(tǒng)的基本操作按類型歸納需要捕獲的起源事件,在對(duì)其進(jìn)行詳細(xì)描述的基礎(chǔ)上,對(duì)起源事件清單進(jìn)行格式轉(zhuǎn)換,最后配置為系統(tǒng)可讀的內(nèi)容。事件監(jiān)控模塊負(fù)責(zé)對(duì)長(zhǎng)期保存系統(tǒng)的所有事件進(jìn)行動(dòng)態(tài)監(jiān)測(cè),若發(fā)現(xiàn)某個(gè)起源事件或預(yù)定義事件,與清單中其它事件相互匹配時(shí),就需要將完整的事件信息呈遞給組織模塊。由事件組織模塊獲取動(dòng)態(tài)信息,并將其添加至起源管理任務(wù)列表中,采取異步記錄的方式實(shí)現(xiàn)對(duì)起源信息的合理組織,減少服務(wù)器的運(yùn)行壓力[6]。存儲(chǔ)模塊的功能在于接收并存儲(chǔ)經(jīng)過(guò)有序化組織的數(shù)據(jù)信息,并維護(hù)不同數(shù)據(jù)對(duì)象間的聯(lián)系。

      4 基于數(shù)據(jù)起源的政府網(wǎng)站信息長(zhǎng)期保存應(yīng)解決的關(guān)鍵問(wèn)題

      基于數(shù)據(jù)起源的政府網(wǎng)站信息長(zhǎng)期保存,目的在于實(shí)現(xiàn)對(duì)數(shù)字政務(wù)信息的有序化管理和長(zhǎng)期訪問(wèn)。其數(shù)據(jù)起源管理的實(shí)現(xiàn),實(shí)質(zhì)上就是建設(shè)一個(gè)長(zhǎng)效訪問(wèn)機(jī)制,通過(guò)起源信息捕獲、鑒定與整合,保障訪問(wèn)信息與網(wǎng)站原生信息的一致性。在數(shù)據(jù)起源技術(shù)具體應(yīng)用過(guò)程中,需要制定合理的網(wǎng)站信息采集策略,實(shí)現(xiàn)對(duì)采集的科學(xué)編目,并解決數(shù)據(jù)歸檔安全問(wèn)題,真正為政務(wù)信息長(zhǎng)效利用提供保障?;静呗匀鐖D2所示。

      4.1 制定網(wǎng)站信息采集策略

      面對(duì)海量異構(gòu)的網(wǎng)絡(luò)資源,要求制定科學(xué)合理的網(wǎng)頁(yè)信息采集策略,這也是實(shí)現(xiàn)數(shù)據(jù)起源管理需要解決的問(wèn)題。由于目前缺乏專門針對(duì)數(shù)據(jù)長(zhǎng)期存儲(chǔ)的起源捕獲工具,因此在長(zhǎng)期保存系統(tǒng)中多依據(jù)OAIS流程開(kāi)發(fā)捕獲插件或工具包,或者通過(guò)編寫?yīng)毩⒑瘮?shù)模塊,用于感知和記錄系統(tǒng)內(nèi)部發(fā)生的所有起源事件。也可以采用工作流軟件,以轉(zhuǎn)換、制作復(fù)本的方式抽取起源,利用系統(tǒng)插件迅速捕獲內(nèi)部起源信息。目前市面上出現(xiàn)了專門的起源元數(shù)據(jù)抽取軟件,如DROID,可以通過(guò)動(dòng)態(tài)追蹤數(shù)據(jù)對(duì)象,記錄與之相關(guān)的各類事件,是當(dāng)前網(wǎng)頁(yè)數(shù)據(jù)采集的常用方式。此外,云計(jì)算具有并行處理大規(guī)模異構(gòu)數(shù)據(jù)的優(yōu)勢(shì),適用于分散數(shù)據(jù)的高速計(jì)算,可以分布式計(jì)算框架為依托,借助網(wǎng)絡(luò)爬蟲(chóng)技術(shù)篩選網(wǎng)頁(yè)信息,實(shí)現(xiàn)對(duì)存儲(chǔ)目標(biāo)的高效、自動(dòng)采集[7]。

      圖2 政府網(wǎng)站信息長(zhǎng)期保存應(yīng)解決的關(guān)鍵問(wèn)題及策略

      4.2 網(wǎng)站信息的歸類與編目

      在采集完成政府網(wǎng)站信息后,需要通過(guò)科學(xué)分類、編目與鑒定,使大規(guī)模數(shù)據(jù)資源有序化,為后續(xù)的長(zhǎng)期保存奠定基礎(chǔ)。根據(jù)政府網(wǎng)站信息的特點(diǎn),可以從數(shù)據(jù)的產(chǎn)生、利用和流通三個(gè)方面,設(shè)計(jì)適應(yīng)起源數(shù)據(jù)管理的元數(shù)據(jù)存儲(chǔ)方案,選擇基于XML的元數(shù)據(jù)標(biāo)準(zhǔn),為信息編目提供依據(jù)。同時(shí)利用貝葉斯分類、云計(jì)算等方法,實(shí)現(xiàn)對(duì)政務(wù)信息的科學(xué)歸類。然后構(gòu)建政務(wù)信息存儲(chǔ)的智能鑒定模型,對(duì)采集數(shù)據(jù)進(jìn)行鑒定,實(shí)現(xiàn)系統(tǒng)資源的優(yōu)化配置[8]。由于政府網(wǎng)站信息存儲(chǔ)屬于持續(xù)、長(zhǎng)期的活動(dòng),面對(duì)不斷增加的信息存儲(chǔ)量,還需要引入開(kāi)源計(jì)算技術(shù),通過(guò)調(diào)用Web服務(wù)器中的運(yùn)行程序,完成對(duì)網(wǎng)站存儲(chǔ)信息的提取、讀寫和刪除等操作,提升用戶數(shù)據(jù)訪問(wèn)的響應(yīng)速度,實(shí)現(xiàn)政府網(wǎng)站信息的高效存取和優(yōu)化利用。

      4.3 網(wǎng)站信息歸檔的安全防護(hù)

      由于網(wǎng)頁(yè)信息的動(dòng)態(tài)性、易變性,這就需要著力解決政務(wù)信息歸檔的安全保護(hù)問(wèn)題。在起源數(shù)據(jù)管理過(guò)程中,可以引入數(shù)據(jù)保護(hù)、數(shù)據(jù)加密等技術(shù),借助虛擬化技術(shù)平臺(tái),設(shè)置政務(wù)信息訪問(wèn)控制或隔離機(jī)制,進(jìn)而保障信息安全。也可以通過(guò)設(shè)置用戶信任等級(jí)證書(shū),在獲取驗(yàn)證信息的基礎(chǔ)上控制訪問(wèn)量,實(shí)現(xiàn)對(duì)長(zhǎng)期保存數(shù)據(jù)的適當(dāng)隔離[9]。為避免出現(xiàn)政府網(wǎng)站無(wú)法鏈接、網(wǎng)頁(yè)數(shù)據(jù)丟失等問(wèn)題,可以采用超鏈接、HTML重寫等技術(shù),達(dá)到重現(xiàn)歸檔政務(wù)信息的目的。同時(shí)為提升政府網(wǎng)站信息的歸檔價(jià)值,數(shù)據(jù)管理者可以引入信息推送、大數(shù)據(jù)技術(shù),為用戶提供多元化的增值服務(wù),如信息檢索、數(shù)據(jù)挖掘等,體現(xiàn)“以人為本”的服務(wù)理念。

      5 結(jié)語(yǔ)

      對(duì)政府網(wǎng)站信息的長(zhǎng)期保存,需要綜合考慮軟硬件投入、資源維護(hù)、參與主體等因素。數(shù)據(jù)起源作為描述數(shù)據(jù)對(duì)象演變歷程的技術(shù),為解決政務(wù)信息存檔問(wèn)題提供了可能。由于起源信息與情境信息存在重疊,加上復(fù)雜的網(wǎng)絡(luò)環(huán)境,因此在設(shè)計(jì)政府網(wǎng)站信息長(zhǎng)期保存系統(tǒng)時(shí),應(yīng)該明確界定起源事件,詳細(xì)記錄起源信息,并制定完善的數(shù)據(jù)起源管理規(guī)劃,切實(shí)保障存檔信息的安全性和真實(shí)性。

      參考文獻(xiàn):

      [ 1 ] 何歡歡.政府網(wǎng)站信息資源保存挑戰(zhàn)及對(duì)策[J].圖書(shū)情報(bào)工作,2011,55(7):130-133.

      [ 2 ] 戴超凡,王濤,張鵬程.數(shù)據(jù)起源技術(shù)發(fā)展研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2010,27(9):3215-3221.

      [ 3 ] 徐揚(yáng),王申罡.數(shù)據(jù)起源研究進(jìn)展[J].情報(bào)理論與實(shí)踐,2016,39(7):136-140,135.

      [ 4 ] 苗麗娟.基于XML的起源計(jì)算和起源存儲(chǔ)研究[D].南京:南京理工大學(xué),2012.

      [ 5 ] 吳振新,李文燕,蔣世銀.構(gòu)建以事件為核心的長(zhǎng)期保存系統(tǒng)起源管理框架[J].圖書(shū)情報(bào)工作,2016(6):91-96.

      [ 6 ] 吳振新,李文燕.起源技術(shù)在長(zhǎng)期保存中的應(yīng)用與研究[J].圖書(shū)情報(bào)工作,2015,59(8):118-125.

      [ 7 ] 王萍,黃新平,陳為東,等.政府網(wǎng)站原生數(shù)字政務(wù)信息云歸檔模型及策略研究[J].情報(bào)理論與實(shí)踐,2016,39(4):60-65.

      [ 8 ] HAN Y. Cloud storage for digital preservation:optimal uses of Amazon S3 and Glacier[J].Library Hi Tech,2015

      (2):261-271.

      [ 9 ] 顏倩倩,王鳳英.云計(jì)算平臺(tái)下的數(shù)據(jù)起源安全方案[J].山東理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,25(5):67-70.

      黃新平 吉林大學(xué)管理學(xué)院博士研究生。吉林長(zhǎng)春,130022。

      (收稿日期:2016-12-06 編校:劉忠斌)

      伊春市| 红原县| 宁陕县| 绥阳县| 瑞昌市| 修武县| 保德县| 扬州市| 辽中县| 石林| 商城县| 镇原县| 金坛市| 桦甸市| 尚义县| 镇远县| 称多县| 北川| 云浮市| 清水县| 青龙| 金昌市| 隆德县| 当雄县| 红河县| 新津县| 吴川市| 湖南省| 康保县| 车险| 比如县| 永川市| 分宜县| 丰城市| 左云县| 安西县| 清新县| 海安县| 安顺市| 兰溪市| 荃湾区|