• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)時代檔案數(shù)據(jù)資源整合探究

      2022-11-26 03:30:38李佳男
      檔案與建設(shè) 2022年9期
      關(guān)鍵詞:資源整合資源

      金 波 陳 堅 李佳男 海 嘯 楊 鵬

      (1.上海大學文化遺產(chǎn)與信息管理學院,上海,200444;2.上海市醫(yī)療保險事業(yè)管理中心,上海,200041)

      檔案數(shù)據(jù)資源整合是檔案數(shù)據(jù)資源建設(shè)的重要內(nèi)容。大數(shù)據(jù)時代,隨著社會對檔案信息資源需求的日益增長,檔案數(shù)據(jù)資源布局的不均衡性、分散性、封閉性等成為共享利用的瓶頸,需要立足檔案數(shù)據(jù)資源現(xiàn)狀與管理實踐,探索檔案數(shù)據(jù)資源整合動力、整合模式和整合策略,利用現(xiàn)代信息技術(shù)手段對分散獨立的檔案數(shù)據(jù)資源進行整合匯聚、集成管理,打破檔案數(shù)據(jù)孤島,力爭將離散、多元、異構(gòu)的檔案數(shù)據(jù)資源通過邏輯方式或物理方式聯(lián)結(jié)成一個有序化、系統(tǒng)化、結(jié)構(gòu)化的整體,構(gòu)建檔案數(shù)據(jù)資源共享空間,為檔案數(shù)據(jù)資源互聯(lián)互通和開發(fā)利用提供支撐。

      1 檔案數(shù)據(jù)資源整合內(nèi)涵

      大數(shù)據(jù)時代,新一代信息技術(shù)迅速發(fā)展和應(yīng)用,檔案管理工作對象逐漸由模擬態(tài)、數(shù)字態(tài)向數(shù)據(jù)態(tài)轉(zhuǎn)型,檔案數(shù)據(jù)成為檔案學研究的新熱點,檔案數(shù)據(jù)資源整合也成為新的研究方向。根據(jù)檔案信息資源整合相關(guān)概念,結(jié)合數(shù)據(jù)整合理論,檔案數(shù)據(jù)資源整合的內(nèi)涵是指:檔案部門與社會組織協(xié)同合作,利用一定的技術(shù)方法,使分散保管的檔案數(shù)據(jù)資源相互聯(lián)結(jié)成為有序化、結(jié)構(gòu)化、系統(tǒng)化的整體,實現(xiàn)檔案數(shù)據(jù)資源集成和融合匯聚。檔案數(shù)據(jù)資源整合對象是檔案數(shù)據(jù);整合范圍應(yīng)根據(jù)整合要求確定,既可以是一定區(qū)域內(nèi)的檔案部門,也可以是檔案部門與形成機構(gòu),或者是檔案部門與數(shù)據(jù)管理部門;整合方法是利用數(shù)據(jù)管理技術(shù)方式手段消除檔案數(shù)據(jù)之間的格式異構(gòu)、語義異構(gòu)、系統(tǒng)異構(gòu)和資源異構(gòu),打破檔案數(shù)據(jù)孤島,使檔案數(shù)據(jù)資源從分散走向集成;整合目的是實現(xiàn)檔案數(shù)據(jù)資源匯聚融合、互聯(lián)互通、集成共享。開展檔案數(shù)據(jù)資源整合具有重要意義:

      一是促進檔案數(shù)據(jù)資源有效集成。大數(shù)據(jù)時代,數(shù)據(jù)資源在各種平臺和系統(tǒng)中大量形成,檔案數(shù)據(jù)資源分散保管在各個部門和機構(gòu)中,由于管理體制、軟硬件系統(tǒng)、技術(shù)標準的差異,部門與行業(yè)間形成了“數(shù)據(jù)鴻溝”“數(shù)據(jù)孤島”,如何將分散異構(gòu)的檔案數(shù)據(jù)資源實現(xiàn)集成統(tǒng)一管理,是檔案數(shù)據(jù)資源整合的首要任務(wù)。將檔案數(shù)據(jù)資源進行整合的直接目的就是為了解決“檔案數(shù)據(jù)資源管理無序與有序、分散與集成、孤立與互通、異構(gòu)與統(tǒng)一之間的矛盾”[1],實現(xiàn)檔案數(shù)據(jù)資源結(jié)構(gòu)標準化、管理系統(tǒng)標準化和運行平臺標準化,破除檔案數(shù)據(jù)管理壁壘,促進多源異構(gòu)檔案數(shù)據(jù)資源的集成統(tǒng)一和互聯(lián)互通,激活檔案數(shù)據(jù)資源的潛在價值。

      二是提高檔案數(shù)據(jù)資源管理與利用效率。通過整合,一方面,能夠全面、直觀地了解當前檔案數(shù)據(jù)存量、種類和保存狀況,發(fā)現(xiàn)管理環(huán)節(jié)中存在的漏洞與不足,以便完善與加強檔案數(shù)據(jù)資源管理,有效提高檔案數(shù)據(jù)資源管理效率。另一方面,檔案數(shù)據(jù)資源由于分散、異構(gòu)的特點,往往被存儲在不同類型、不同地點的數(shù)據(jù)庫中,用戶為獲取所需的檔案數(shù)據(jù)資源常常需要訪問多方數(shù)據(jù)庫,不同數(shù)據(jù)庫采用的查詢語言、數(shù)據(jù)存儲方式和數(shù)據(jù)表示形式往往也不一致,極大降低用戶利用檔案數(shù)據(jù)資源效率。而進行檔案數(shù)據(jù)資源整合,對檔案數(shù)據(jù)資源進行集成處理后,便可為用戶提供統(tǒng)一通用的檔案數(shù)據(jù)查詢界面和檢索語言,從而方便用戶獲取準確、完整、全面的檔案數(shù)據(jù)資源,提高檔案數(shù)據(jù)資源利用效率。

      三是推動檔案數(shù)據(jù)資源開放共享。我國檔案工作歷來十分重視檔案保密工作,存在“保密保險,利用危險”的觀念,檔案資源的開放度較低,與發(fā)達國家存在較大差距。大數(shù)據(jù)時代,數(shù)據(jù)來源更加多元、數(shù)據(jù)異構(gòu)更加突出、數(shù)據(jù)流動越來越頻繁快速,為了加強對檔案數(shù)據(jù)資源的管理,滿足社會大眾利用需求,充分釋放檔案數(shù)據(jù)資源價值,需要強化檔案數(shù)據(jù)資源工作的整體布局和戰(zhàn)略規(guī)劃,通過技術(shù)和管理手段整合各社會主體形成的有價值的檔案數(shù)據(jù)資源,加大檔案數(shù)據(jù)資源開放開發(fā)力度,構(gòu)建起跨層級、跨區(qū)域、跨部門的一體化檔案數(shù)據(jù)資源交換共享平臺,促進檔案數(shù)據(jù)資源開放共享。

      2 檔案數(shù)據(jù)資源整合動力

      檔案數(shù)據(jù)資源整合在實踐中受到多種因素推動,其中包括國家政策的支持、現(xiàn)代信息技術(shù)的應(yīng)用、社會信息需求的拉動、檔案資源整合的實踐等方面。深入分析探索檔案數(shù)據(jù)資源整合動力,有助于更加科學合理地開展檔案數(shù)據(jù)資源整合工作。

      2.1 國家政策支持

      大數(shù)據(jù)時代,數(shù)據(jù)資源已成為國家經(jīng)濟社會發(fā)展的戰(zhàn)略性資源,國家高度重視數(shù)據(jù)資源建設(shè),出臺了一系列戰(zhàn)略舉措,為檔案數(shù)據(jù)資源整合提供政策支持。2015年,國務(wù)院印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》提出,“加快政府數(shù)據(jù)開放共享,推動資源整合,提升治理能力?!保?]2021年,《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》提出,“依托全國檔案查詢利用服務(wù)平臺建立更加便捷的檔案信息資源共享聯(lián)動新機制,推動國家、地區(qū)檔案信息資源共享平臺一體化發(fā)展?!保?]可見,數(shù)據(jù)資源整合已成為提升國家治理能力的重要途徑和手段。檔案數(shù)據(jù)資源整合是數(shù)據(jù)資源整合的重要內(nèi)容,國家出臺的相關(guān)政策規(guī)劃了檔案數(shù)據(jù)資源整合發(fā)展藍圖,調(diào)動了檔案部門主動開展檔案數(shù)據(jù)資源整合的積極性和主動性,有力地推動了檔案數(shù)據(jù)資源整合共享。

      2.2 現(xiàn)代信息技術(shù)應(yīng)用

      現(xiàn)代信息技術(shù)對檔案數(shù)據(jù)資源整合具有重要的推動作用,不僅加快了檔案數(shù)據(jù)資源整合技術(shù)的升級,而且變革了檔案數(shù)據(jù)資源整合的方式。一是為檔案數(shù)據(jù)的整合共享創(chuàng)造條件。大數(shù)據(jù)、云計算等現(xiàn)代信息技術(shù)的廣泛應(yīng)用,能夠?qū)崿F(xiàn)檔案資源數(shù)據(jù)化和檔案數(shù)據(jù)資源虛擬存儲,為檔案數(shù)據(jù)資源的集約存儲、整合利用、集成共享創(chuàng)造條件。二是推動檔案數(shù)據(jù)資源的互聯(lián)互通。檔案數(shù)據(jù)來源于不同機構(gòu)、不同部門、不同系統(tǒng),數(shù)據(jù)類型多種、數(shù)據(jù)描述多樣、數(shù)據(jù)內(nèi)容多元,檔案數(shù)據(jù)資源必然存在結(jié)構(gòu)性異構(gòu)和語義性異構(gòu)等問題。[4]利用關(guān)聯(lián)數(shù)據(jù)技術(shù)建立數(shù)字檔案多維語義關(guān)聯(lián)框架[5],能夠?qū)崿F(xiàn)分散、異構(gòu)、跨界檔案數(shù)據(jù)資源語義層的關(guān)聯(lián),有助于檔案數(shù)據(jù)資源之間、檔案數(shù)據(jù)資源與其他領(lǐng)域數(shù)據(jù)資源之間進行語義互操作;運用人工智能技術(shù)、集群技術(shù)、數(shù)據(jù)交換技術(shù)等貫通聯(lián)結(jié)多元、分散的檔案數(shù)據(jù)平臺,能夠?qū)崿F(xiàn)檔案數(shù)據(jù)在各平臺之間的無縫對接和自由流動。三是促進檔案數(shù)據(jù)資源的有效傳遞。隨著移動通信技術(shù)的發(fā)展及應(yīng)用,檔案信息資源傳播方式更加多維、傳播速度更加快捷、傳播范圍更加廣泛?!耙揽炕ヂ?lián)網(wǎng)、衛(wèi)星網(wǎng)等傳輸途徑以及光盤、移動存儲設(shè)備等傳輸體系,可以達成全方位、高速度傳遞檔案資源整合成果的目的?!保?]5G、元宇宙等技術(shù)的發(fā)展與應(yīng)用,為檔案數(shù)據(jù)資源提供更加廣闊的傳播平臺,推動檔案數(shù)據(jù)資源在更大范圍、更廣空間、更深領(lǐng)域整合集成。

      2.3 社會信息需求拉動

      一是用戶信息需求的轉(zhuǎn)型。信息時代,“檔案用戶的信息需求呈現(xiàn)出多樣化、網(wǎng)絡(luò)化等新的特點,其利用目的也呈現(xiàn)出了多元化的發(fā)展態(tài)勢”[7],需要檔案部門提供及時、精準、高效、智能的檔案信息服務(wù)和檔案文化服務(wù),激活社會對信息的各方面需求。二是組織管理決策的需求。大數(shù)據(jù)時代,政府組織決策面對的情況更為復雜多樣,需要能夠直接解決問題的知識方案。檔案作為一種重要的信息資源和組織的核心知識資產(chǎn),因其真實性、可靠性、原始性成為組織機構(gòu)進行管理決策的重要參考和分析依據(jù)。對檔案數(shù)據(jù)資源進行整合集成,運用數(shù)據(jù)技術(shù)對檔案數(shù)據(jù)資源進行分析挖掘、知識關(guān)聯(lián)和可視化,從海量數(shù)據(jù)中揭示出隱含潛在價值的知識單元,將檔案數(shù)據(jù)資源轉(zhuǎn)化為能夠直接支撐組織開展管理決策的知識資源,有助于充分發(fā)揮檔案資源的資政作用,提高政府組織決策能效。三是數(shù)字記憶建構(gòu)的需要。大數(shù)據(jù)時代,社會各領(lǐng)域在進行實踐活動的同時形成了海量的數(shù)據(jù),檔案數(shù)據(jù)資源作為社會實踐活動在數(shù)字世界的映射,成為構(gòu)建社會記憶的基礎(chǔ)性資源。作為重要的記憶機構(gòu)之一,檔案館承擔著守護社會記憶的責任,在信息時代的數(shù)字記憶建設(shè)和存續(xù)中扮演著越發(fā)重要的角色。因此,為建構(gòu)完整的數(shù)字記憶,檔案部門需要聯(lián)合其他信息機構(gòu)、數(shù)據(jù)機構(gòu)和個人協(xié)同開展檔案數(shù)據(jù)資源整合,構(gòu)建數(shù)字記憶資源集成空間,借助數(shù)字技術(shù)再現(xiàn)歷史記憶、編織數(shù)字記憶。

      2.4 檔案資源整合實踐

      信息時代,為適應(yīng)政府職能轉(zhuǎn)變,優(yōu)化政府管理方式,提高政府信息資源管理與利用效率,檔案部門主動行動,積極推動檔案資源整合。檔案部門開展檔案信息資源整合的早期實踐主要有浦東模式、和縣模式、深圳模式和順德模式等。舉例而言,浦東模式是2001年浦東新區(qū)提出整合檔案管理體制、實行大檔案機構(gòu)框架的構(gòu)想,其強調(diào)整合浦東新區(qū)檔案局的綜合檔案工作、規(guī)劃局的城建檔案工作和建設(shè)局的房產(chǎn)土地檔案工作,在體制上實行檔案局、檔案館、城建檔案信息管理中心,形成“三塊牌子、一個機構(gòu)、統(tǒng)一管理”的檔案工作局面。[8]數(shù)字時代下,源于數(shù)字轉(zhuǎn)型、電子政務(wù)等的推動作用,政府機構(gòu)開始大力推行無紙化辦公,數(shù)字檔案資源體量增長迅速,為了滿足公眾多元化、跨區(qū)域的利用需求,檔案部門針對數(shù)字檔案資源也開展了一系列整合實踐。如2013年,“浙江省麗水市建立‘1+9+N檔案協(xié)同管理系統(tǒng)’,將市級、9個縣(市、區(qū))的黨政機關(guān)和鄉(xiāng)鎮(zhèn)數(shù)字檔案室整合到同一個網(wǎng)絡(luò)平臺上,形成了以市級為中心,9縣(市、區(qū))為節(jié)點的強大的云檔案服務(wù)系統(tǒng)。”[9]

      多層次、多種類檔案資源整合實踐的開展,為檔案數(shù)據(jù)資源整合提供了實踐依據(jù)和寶貴經(jīng)驗。一是在檔案數(shù)據(jù)資源整合過程中要建立統(tǒng)一的數(shù)據(jù)平臺。通過平臺發(fā)揮聚集效應(yīng),實現(xiàn)區(qū)域內(nèi)多方檔案資源整合力量的協(xié)作,將區(qū)域內(nèi)不同主體的檔案數(shù)據(jù)資源加以有效整合,以實現(xiàn)對檔案數(shù)據(jù)資源的集成管理和共享利用。二是順應(yīng)電子政務(wù)發(fā)展潮流。將檔案數(shù)據(jù)資源集成整合融入到電子政務(wù)中,依托電子政務(wù)系統(tǒng)收集政府檔案數(shù)據(jù)資源,推進文件、檔案資源的一體化管理和整合。三是重點關(guān)注民生領(lǐng)域檔案數(shù)據(jù)資源的整合。整合的目的是為了滿足公眾日益增長的檔案利用需求,民生數(shù)據(jù)資源直接關(guān)系到公眾的根本利益,需要強化主體協(xié)同,整合就業(yè)、教育、社保、住房、醫(yī)療衛(wèi)生等方面的民生檔案數(shù)據(jù)資源,滿足公眾檔案信息和文化需求。

      3 檔案數(shù)據(jù)資源整合策略

      《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》提出,“加大相關(guān)檔案資源跨領(lǐng)域、跨區(qū)域、跨層級整合力度……推動檔案全面納入國家大數(shù)據(jù)戰(zhàn)略,在國家相關(guān)政策和重大舉措中強化電子檔案管理要求,實現(xiàn)對國家和社會具有長久保存價值的數(shù)據(jù)歸口各級各類檔案館集中管理?!保?0]檔案數(shù)據(jù)資源整合是一項系統(tǒng)工程,在實踐中受到信息技術(shù)、標準法規(guī)、機構(gòu)狀況等多種因素影響,需要理念、管理、技術(shù)、平臺多要素協(xié)同發(fā)力。應(yīng)通過加強檔案數(shù)據(jù)資源整合頂層設(shè)計、推進檔案數(shù)據(jù)資源整合新技術(shù)應(yīng)用、完善檔案數(shù)據(jù)資源整合系統(tǒng)平臺建設(shè)等策略,全面促進檔案數(shù)據(jù)資源整合活動的開展與落實,提升檔案數(shù)據(jù)資源整合能力,填平不同地區(qū)、不同層級、不同部門之間的“數(shù)字鴻溝”。

      3.1 加強檔案數(shù)據(jù)資源整合頂層設(shè)計

      檔案數(shù)據(jù)資源整合作為一項系統(tǒng)性活動,需要通過頂層設(shè)計來謀劃布局、指引方向、營造氛圍、激勵主體、規(guī)制行動,為檔案數(shù)據(jù)資源整合提供整體方案與上層牽引。

      (1)制定檔案數(shù)據(jù)資源整合規(guī)劃

      作為對檔案數(shù)據(jù)資源整合的宏觀管控,頂層設(shè)計首先需要做好檔案數(shù)據(jù)資源整合規(guī)劃,即明確檔案數(shù)據(jù)資源整合總體建設(shè)與發(fā)展的思路、任務(wù)與目標,保證檔案數(shù)據(jù)資源整合質(zhì)量與效率,將檔案數(shù)據(jù)資源整合納入到科學、有序、預設(shè)的軌道運行,減少不必要的重復或沖突,指引檔案數(shù)據(jù)資源建設(shè),提高工作效率。第一,理清現(xiàn)階段檔案數(shù)據(jù)資源整合的發(fā)展環(huán)境與面臨挑戰(zhàn),總結(jié)經(jīng)驗,認清態(tài)勢,在此基礎(chǔ)上制定規(guī)劃;第二,明確檔案數(shù)據(jù)資源整合的戰(zhàn)略定位,對檔案數(shù)據(jù)資源整合的指導思想、需求、目標、價值做出基本界定與判斷,將之作為檔案數(shù)據(jù)資源整合的基本出發(fā)點;第三,制定檔案數(shù)據(jù)資源整合的主要任務(wù),明確相關(guān)主體責任目標,使檔案數(shù)據(jù)資源整合實踐更有方向性和針對性;第四,確立檔案數(shù)據(jù)資源整合實現(xiàn)指標,以便對照檢查,保證檔案數(shù)據(jù)資源整合質(zhì)量;第五,確定檔案數(shù)據(jù)資源整合保障措施與實施建議,如組織實施、科技支撐、人才培養(yǎng)、宣傳推廣、合作交流等,為檔案數(shù)據(jù)資源整合提供行動指南。

      (2)構(gòu)建檔案數(shù)據(jù)資源整合協(xié)同機制

      檔案數(shù)據(jù)資源整合要突破單一主體界限,在跨層級、跨系統(tǒng)、跨部門、跨區(qū)域間實現(xiàn)檔案數(shù)據(jù)資源集成。為此,構(gòu)建檔案數(shù)據(jù)資源整合協(xié)同機制至關(guān)重要,通過疏通和協(xié)調(diào)檔案數(shù)據(jù)資源整合的內(nèi)外部關(guān)系,強化多主體協(xié)同共建,提高檔案數(shù)據(jù)資源整合的廣度、深度、全度,破除數(shù)據(jù)壁壘,實現(xiàn)數(shù)據(jù)共享利用。第一,構(gòu)建檔案部門間的協(xié)同機制。檔案部門作為檔案數(shù)據(jù)治理的“元治者”,是檔案數(shù)據(jù)資源整合的主要場域?!鞍凑铡y(tǒng)一平臺、互聯(lián)互通,存量共享、增量共建,物理分散、邏輯集中’的原則,利用大數(shù)據(jù)技術(shù),打破部門隔閡和‘條塊分割’的碎片化狀態(tài)”[11],通過目標協(xié)同、工具協(xié)同、規(guī)劃協(xié)同等具體機制路徑,優(yōu)化完善檔案部門的檔案數(shù)據(jù)資源整合模式,使檔案數(shù)據(jù)資源在縱向、橫向檔案部門之間得以充分流通,打破層級隔閡、系統(tǒng)壁壘、區(qū)域限制,使各級各類檔案部門成為檔案數(shù)據(jù)資源整合的“共同體”。第二,構(gòu)建檔案部門與信息(數(shù)據(jù))管理部門間的協(xié)同機制。大數(shù)據(jù)環(huán)境下,檔案部門不是唯一的檔案數(shù)據(jù)保管部門,很多檔案數(shù)據(jù)資源流向其他數(shù)據(jù)保管機構(gòu)。推動檔案數(shù)據(jù)資源整合,需要檔案部門主動出擊,構(gòu)建檔案部門與信息(數(shù)據(jù))管理部門間的協(xié)同機制,明確數(shù)據(jù)權(quán)責、共享方式、整合渠道,落實跨界整合,共同推動檔案數(shù)據(jù)資源建設(shè),促進檔案數(shù)據(jù)資源有序流動和共建共享。第三,構(gòu)建檔案部門與其他社會主體間的協(xié)同機制。企事業(yè)單位、社會團體組織、民眾個人等形成和保管的有價值的檔案數(shù)據(jù),諸如企業(yè)經(jīng)營數(shù)據(jù)、公共健康數(shù)據(jù)、民情輿情數(shù)據(jù)、社交媒體數(shù)據(jù)等,也是大數(shù)據(jù)時代檔案數(shù)據(jù)資源的重要組成部分,但這一部分檔案數(shù)據(jù)資源通常游離于檔案工作與檔案部門管轄范圍之外。實現(xiàn)對這部分檔案數(shù)據(jù)資源的整合,形成檔案數(shù)據(jù)資源群,需要檔案部門加強與社會主體間的協(xié)同,引導激勵社會主體參與檔案數(shù)據(jù)資源建設(shè),通過宣傳引導、開辟渠道、搭建平臺等措施,推動社會檔案數(shù)據(jù)資源集成管理,保障社會檔案數(shù)據(jù)資源融入到檔案數(shù)據(jù)資源倉庫中。

      (3)健全檔案數(shù)據(jù)資源整合標準規(guī)范

      完善的標準規(guī)范體系是檔案數(shù)據(jù)資源整合的前提,傳統(tǒng)檔案資源相關(guān)的規(guī)章、制度、措施難以適應(yīng)大數(shù)據(jù)時代的檔案數(shù)據(jù)資源管理。第一,強化檔案數(shù)據(jù)資源整合法制化建設(shè)。法制化是實現(xiàn)檔案數(shù)據(jù)資源整合的基礎(chǔ)和保障。當前針對檔案數(shù)據(jù)資源建設(shè)的相關(guān)法規(guī)制度缺乏,迫切需要制定專門的管理法規(guī)、指南、條例,推動檔案數(shù)據(jù)資源整合,促進檔案資源建設(shè)。第二,加強檔案數(shù)據(jù)資源整合標準化建設(shè)。首先,推動檔案元數(shù)據(jù)標準完善。完善檔案元數(shù)據(jù)標準有助于推動檔案數(shù)據(jù)在各個系統(tǒng)平臺的交換和轉(zhuǎn)換,實現(xiàn)檔案數(shù)據(jù)關(guān)聯(lián)集成,推動檔案數(shù)據(jù)有序化整合利用[12];完善檔案元數(shù)據(jù)標準要從本體角度出發(fā),合理構(gòu)建由形式和內(nèi)容組成的檔案數(shù)據(jù)資源描述體系。其次,制定檔案管理軟硬件標準。在檔案信息化建設(shè)早期,各部門往往采用不同軟硬件設(shè)施,相互之間難以兼容,檔案數(shù)據(jù)難以進行轉(zhuǎn)換和交換,檔案數(shù)據(jù)存在丟失和失真的風險。因此,要著力推動檔案信息化中的網(wǎng)絡(luò)設(shè)施、應(yīng)用軟硬件、檔案數(shù)據(jù)化、存儲系統(tǒng)等的標準化建設(shè),制定完善檔案數(shù)據(jù)管理軟硬件標準。最后,加強與各級標準的協(xié)調(diào),做好標準的銜接工作,避免發(fā)生矛盾,維護標準的系統(tǒng)性,提高標準的前瞻性和適用性。

      3.2 推進檔案數(shù)據(jù)資源整合新技術(shù)應(yīng)用

      大數(shù)據(jù)時代,數(shù)據(jù)處理技術(shù)持續(xù)發(fā)展創(chuàng)新,數(shù)據(jù)處理效能不斷提高。在檔案數(shù)據(jù)資源整合中,應(yīng)當注重關(guān)鍵技術(shù)和新技術(shù)的引進、選優(yōu)、應(yīng)用與推廣,推動技術(shù)升級與技術(shù)賦能,讓技術(shù)成為檔案數(shù)據(jù)資源整合的重要驅(qū)動力。

      (1)利用關(guān)聯(lián)數(shù)據(jù)技術(shù)實現(xiàn)檔案數(shù)據(jù)資源關(guān)聯(lián)集成

      關(guān)聯(lián)數(shù)據(jù)是指通過明確的語義表達發(fā)布數(shù)據(jù)資源,使數(shù)據(jù)之間能夠相互關(guān)聯(lián)。關(guān)聯(lián)數(shù)據(jù)技術(shù)在檔案數(shù)據(jù)資源整合過程中很好契合了檔案數(shù)據(jù)內(nèi)容細粒度的整合需求,具有廣闊的應(yīng)用前景。首先,在檔案數(shù)據(jù)資源整合集成中,可以從檔案主題、類型格式、內(nèi)容屬性、時空范圍等多個維度,通過計算相關(guān)度,建立檔案數(shù)據(jù)資源之間定量化的語義關(guān)聯(lián),實現(xiàn)檔案數(shù)據(jù)資源的智能管理和精準搜索。與此同時,還可根據(jù)用戶需求,實現(xiàn)不同時間階段、地理位置、專業(yè)領(lǐng)域檔案數(shù)據(jù)資源的關(guān)聯(lián)聚合,形成具有高度關(guān)聯(lián)、能夠滿足用戶需求的檔案數(shù)據(jù)塊。其次,通過關(guān)聯(lián)數(shù)據(jù)的URI標識與復用機制,確定檔案數(shù)據(jù)實體對象的URI標識,從而在實現(xiàn)信息資源的聚合、知識的關(guān)聯(lián)的同時,利用關(guān)聯(lián)數(shù)據(jù)自身攜帶的大量URI鏈接關(guān)聯(lián)到更多數(shù)據(jù)集的信息,有效地擴大信息挖掘的信息量、信息范圍和深度。[13]再次,通過關(guān)聯(lián)數(shù)據(jù)的RDF描述與鏈接機制,將數(shù)據(jù)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)所要求的RDF數(shù)據(jù)形式[14],利用RDF將分散保存的檔案數(shù)據(jù)資源形成共享集成的關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò),從而提高檔案數(shù)據(jù)資源整合的深度和廣度。

      (2)利用知識圖譜技術(shù)構(gòu)建檔案數(shù)據(jù)知識網(wǎng)絡(luò)

      知識圖譜的本質(zhì)是揭示實體間關(guān)系的語義網(wǎng)絡(luò),可以形式化地描述事物及其之間的相互關(guān)系。[15]大數(shù)據(jù)時代,檔案數(shù)據(jù)資源整合將逐漸從傳統(tǒng)的全宗級、案卷級、文件級過渡到語義層面,知識圖譜技術(shù)對檔案數(shù)據(jù)資源實現(xiàn)語義層面的整合具有重要意義。運用知識圖譜技術(shù)實現(xiàn)檔案數(shù)據(jù)資源語義層面的整合主要包括四方面:一是將多源異構(gòu)檔案數(shù)據(jù)進行結(jié)構(gòu)化處理,統(tǒng)一成特定的格式。多源異構(gòu)的檔案數(shù)據(jù)既包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),也有文本、圖形、音視頻等格式。二是進行知識抽取。包括實體抽取、關(guān)系抽取和屬性抽取,主要運用專家法、爬蟲法、機器學習等方法,構(gòu)建檔案數(shù)據(jù)資源的實體、屬性和關(guān)系三元組。三是進行信息融合。信息融合目的是對多源異構(gòu)知識進行聚合集成,獲取蘊含的知識。檔案數(shù)據(jù)信息融合需要數(shù)據(jù)格式清洗轉(zhuǎn)化,“通過對抽取的實體、屬性和關(guān)系三元組與已構(gòu)建的知識圖譜進行語義相似度計算,確定最優(yōu)概念匹配和關(guān)系匹配,實現(xiàn)信息融合?!保?6]四是進行知識建模和知識存儲。將檔案數(shù)據(jù)資源存儲于相關(guān)的關(guān)系數(shù)據(jù)庫中,使檔案數(shù)據(jù)資源、屬性、事件等實現(xiàn)關(guān)聯(lián)集成。

      (3)利用數(shù)據(jù)虛擬化技術(shù)實現(xiàn)多源異構(gòu)檔案數(shù)據(jù)集成

      數(shù)據(jù)虛擬化技術(shù)是提供一個虛擬的視圖,來獲取和查閱異構(gòu)數(shù)據(jù)庫中數(shù)據(jù)的技術(shù)。[17]數(shù)據(jù)虛擬化技術(shù)超越了原有的系統(tǒng)數(shù)據(jù)管理和存儲環(huán)境,提供的中間層類似于一個統(tǒng)一、虛擬的整合數(shù)據(jù)庫,用戶可以通過同一頁面和平臺訪問各個數(shù)據(jù)庫中的多元異構(gòu)數(shù)據(jù),無須關(guān)注數(shù)據(jù)的存儲位置、存儲格式等,就能夠便捷地獲取所需數(shù)據(jù)資源。數(shù)據(jù)虛擬化對推進多元異構(gòu)的檔案數(shù)據(jù)集成具有重要的技術(shù)優(yōu)勢。一是應(yīng)用數(shù)據(jù)虛擬化技術(shù)可以讓檔案數(shù)據(jù)的關(guān)聯(lián)性被自動發(fā)現(xiàn)或人工定義,無論是實時檔案數(shù)據(jù)還是歷史檔案數(shù)據(jù),無論是文本數(shù)據(jù)庫還是多媒體數(shù)據(jù)庫,無論是關(guān)系型數(shù)據(jù)庫還是非關(guān)系型數(shù)據(jù)庫,都將被重新分類和關(guān)聯(lián),并且在新的虛擬平臺上進行展現(xiàn)。二是提供統(tǒng)一的數(shù)據(jù)訪問接口。不同的檔案數(shù)據(jù)存儲可能使用不同的格式,例如有的檔案數(shù)據(jù)存儲在XML文件中,有的存儲在HTML網(wǎng)頁中,有的存儲在Excel電子表格中,數(shù)據(jù)虛擬化層可以提供一個統(tǒng)一的數(shù)據(jù)訪問接口區(qū),訪問不同的存儲格式,如ODBC/JDBC/ADO.NET接口等,大大縮短了檔案數(shù)據(jù)的訪問時間。三是運用數(shù)據(jù)虛擬化技術(shù)有助于對檔案元數(shù)據(jù)進行規(guī)范,檔案數(shù)據(jù)庫中可能會存在一些不規(guī)范、不標準、不統(tǒng)一的格式,對此,數(shù)據(jù)虛擬化層可以實現(xiàn)檔案數(shù)據(jù)的集中轉(zhuǎn)換和數(shù)據(jù)清洗。

      3.3 完善檔案數(shù)據(jù)資源系統(tǒng)平臺建設(shè)

      大數(shù)據(jù)時代,檔案數(shù)據(jù)資源整合需要借助一定的系統(tǒng)平臺來實現(xiàn)。檔案數(shù)據(jù)資源系統(tǒng)平臺既是檔案數(shù)據(jù)資源的生存環(huán)境,也是檔案數(shù)據(jù)運行、流轉(zhuǎn)、保存、利用的場域。因此,完善檔案數(shù)據(jù)資源系統(tǒng)平臺建設(shè)是推進檔案數(shù)據(jù)資源整合的關(guān)鍵內(nèi)容。

      (1)創(chuàng)建統(tǒng)一的檔案數(shù)據(jù)管理系統(tǒng)

      檔案數(shù)據(jù)管理系統(tǒng)是檔案數(shù)據(jù)賴以生存的軟硬件平臺,離開系統(tǒng),檔案數(shù)據(jù)采集、處理、存儲、利用等一系列處置活動無從談起。推進檔案數(shù)據(jù)資源整合,需要創(chuàng)建統(tǒng)一的檔案數(shù)據(jù)管理系統(tǒng),且具有可擴展性、可對接性、可關(guān)聯(lián)性,有利于檔案數(shù)據(jù)資源的快速響應(yīng)和便捷調(diào)取。一方面,加強檔案數(shù)據(jù)融合是基礎(chǔ)。檔案數(shù)據(jù)融合要求將分散保存在不同數(shù)據(jù)庫中的不同數(shù)據(jù)格式、不同數(shù)據(jù)類型、關(guān)聯(lián)度低的數(shù)據(jù)進行統(tǒng)一架構(gòu)、無縫鏈接、綜合集成。其可從三個方面進行:一是統(tǒng)一檔案數(shù)據(jù)格式,解決檔案數(shù)據(jù)資源結(jié)構(gòu)層面的異構(gòu)問題,排除檔案數(shù)據(jù)融合障礙;二是加強檔案數(shù)據(jù)清洗與轉(zhuǎn)換,提高檔案數(shù)據(jù)質(zhì)量,減少無用數(shù)據(jù)或價值密度低的數(shù)據(jù)對檔案數(shù)據(jù)整合集成的影響;三是完善檔案數(shù)據(jù)語義本體建設(shè),“對檔案資源管理領(lǐng)域的知識元進行提煉”[18],建立由責任者、時間、地點、關(guān)鍵詞、檔號等組成的檔案數(shù)據(jù)關(guān)聯(lián)體系。另一方面,統(tǒng)一系統(tǒng)架構(gòu)是關(guān)鍵。由管理系統(tǒng)異構(gòu)導致檔案數(shù)據(jù)整合共享障礙的現(xiàn)象普遍存在,有必要創(chuàng)建基于統(tǒng)一邏輯、統(tǒng)一接口、統(tǒng)一架構(gòu)的檔案數(shù)據(jù)管理系統(tǒng),保障檔案數(shù)據(jù)資源整合系統(tǒng)具有良好的耦合性、擴展性、互通性,確保檔案數(shù)據(jù)傳遞便捷、運行通暢、利用方便、整合高效。[19]

      (2)組建國家檔案數(shù)據(jù)資源庫

      大數(shù)據(jù)時代,海量檔案數(shù)據(jù)資源被分散保存在不同主體和不同部門,給檔案數(shù)據(jù)資源一站式利用服務(wù)帶來障礙,需要強化檔案館在保存和管理檔案數(shù)據(jù)資源中的主體地位,“建立國家檔案數(shù)據(jù)庫,整合各類數(shù)據(jù)資源,構(gòu)建統(tǒng)一的檔案數(shù)據(jù)共享平臺,提供檔案數(shù)據(jù)的一站式服務(wù)。”[20]首先,加強檔案數(shù)據(jù)化建設(shè)。強化檔案數(shù)據(jù)資源規(guī)劃管理和頂層設(shè)計,圍繞“增量電子化”“存量數(shù)據(jù)化”,開展檔案數(shù)據(jù)資源建設(shè),逐步建立以檔案數(shù)據(jù)資源為主導的現(xiàn)代檔案資源體系?!凹訌娦滦蜋n案資源建設(shè),廣泛開展業(yè)務(wù)數(shù)據(jù)、公務(wù)電子郵件、網(wǎng)頁信息、社交媒體信息等的收集歸檔工作”[21],推動檔案部門同數(shù)據(jù)管理機構(gòu)、政府部門、社會組織等的有效協(xié)同,促進檔案數(shù)據(jù)管理系統(tǒng)與業(yè)務(wù)系統(tǒng)的無縫對接,實現(xiàn)檔案數(shù)據(jù)應(yīng)歸盡歸、應(yīng)收盡收、應(yīng)管盡管,建立覆蓋全面、種類齊全、內(nèi)容豐富、質(zhì)量上乘的檔案數(shù)據(jù)倉儲。其次,創(chuàng)建檔案數(shù)據(jù)一體化平臺。加快檔案數(shù)據(jù)管理系統(tǒng)平臺建設(shè),推進檔案數(shù)據(jù)管理流程重構(gòu)、技術(shù)融合和平臺整合,推動國家、地方檔案數(shù)據(jù)資源一體化平臺建設(shè),推進檔案數(shù)據(jù)資源跨區(qū)域、跨層級、跨部門集成整合,“實現(xiàn)各類信息內(nèi)容、媒介資源、技術(shù)應(yīng)用和系統(tǒng)平臺有效整合、共融共通?!保?2]創(chuàng)建檔案數(shù)據(jù)資源共享聯(lián)動新機制,打造一站式、知識化、智慧型服務(wù)平臺,探索智慧檔案館建設(shè)路徑,拓展檔案數(shù)據(jù)應(yīng)用場景,推動檔案數(shù)據(jù)資源規(guī)模、質(zhì)量和服務(wù)能力同步提升。最后,建設(shè)國家檔案數(shù)據(jù)庫。檔案數(shù)據(jù)整合的基本任務(wù)是建立檔案數(shù)據(jù)資源庫,在檔案數(shù)據(jù)資源庫建設(shè)過程中,遵循“利用優(yōu)先、分步實施、集約高效”的原則,優(yōu)先完成檔案文件級目錄數(shù)據(jù)庫和案卷級目錄數(shù)據(jù)庫建設(shè),逐步推進全文檔案數(shù)據(jù)庫、專題檔案數(shù)據(jù)庫、多媒體檔案數(shù)據(jù)庫、特色檔案數(shù)據(jù)庫建設(shè),“逐步在全國建立起區(qū)域性、多層次、分布式、規(guī)范化的各類檔案數(shù)據(jù)庫群”[23],為檔案數(shù)據(jù)“一站式”利用服務(wù)提供資源支撐。

      猜你喜歡
      資源整合資源
      讓有限的“資源”更有效
      少先隊活動與校外資源整合的實踐與探索
      基礎(chǔ)教育資源展示
      “五育并舉”下家校社資源整合的價值意義
      一樣的資源,不一樣的收獲
      海外并購中的人力資源整合之道
      中國外匯(2019年19期)2019-11-26 00:57:32
      資源回收
      智慧高速資源整合方式實踐
      資源再生 歡迎訂閱
      資源再生(2017年3期)2017-06-01 12:20:59
      激活村莊內(nèi)部治理資源
      決策(2015年9期)2015-09-10 07:22:44
      会东县| 徐州市| 蚌埠市| 茶陵县| 三门峡市| 丹江口市| 绥芬河市| 白城市| 康马县| 都匀市| 拉萨市| 故城县| 饶阳县| 吉木乃县| 兰考县| 辉南县| 滦南县| 鄂伦春自治旗| 民乐县| 乃东县| 牙克石市| 包头市| 海原县| 毕节市| 准格尔旗| 金昌市| 永川市| 胶南市| 廊坊市| 从化市| 洪泽县| 尖扎县| 栾川县| 台北市| 彭阳县| 阳谷县| 澎湖县| 台北县| 桓仁| 出国| 罗源县|