• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)文件歸檔研究

      2018-08-20 08:13王子鵬
      檔案管理 2018年4期
      關(guān)鍵詞:元數(shù)據(jù)電子文件數(shù)據(jù)文件

      王子鵬

      摘? 要:按照信息的存在形式劃分,數(shù)據(jù)文件是電子文件的重要類別之一。本文界定了數(shù)據(jù)文件的概念和本質(zhì)屬性,總結(jié)了數(shù)據(jù)文件面臨的管理難題,即來(lái)源復(fù)雜、系統(tǒng)依賴程度高和缺乏真實(shí)性保障。從具體案例入手,在實(shí)踐層面分析了數(shù)據(jù)文件的歸檔價(jià)值、真實(shí)性保障途徑和歸檔流程。在此基礎(chǔ)上,提出了加強(qiáng)數(shù)據(jù)文件歸檔工作的對(duì)策思考。

      關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)文件;電子文件;元數(shù)據(jù)

      Abstracts: According to the form of information, data files are one of the most important categories of electronic records. This paper defines the concept and essential attributes of data files, and summarizes the management difficulties faced by data files, namely, complex sources, high system dependence and lack of authenticity protection. Then from the specific case, the archiving value of data files, the way of ensuring the authenticity and the process of archiving are analyzed in the practical level. On this basis, this paper puts forward some countermeasures to strengthen the archiving of data files.

      Keywords: Big data ;? Data file ;? Electronic records;? Metadata

      近年來(lái),政務(wù)、商務(wù)、醫(yī)療、交通、媒體、教育等各行業(yè)領(lǐng)域,越來(lái)越重視數(shù)據(jù)的積累,嘗試采用基于大數(shù)據(jù)驅(qū)動(dòng)的管理與決策。據(jù)國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè),2020 年全球數(shù)據(jù)量將達(dá)到 44ZB,而中國(guó)的數(shù)據(jù)量將會(huì)在 2020 年超過(guò) 8ZB[1],世界正在實(shí)質(zhì)性地邁入大數(shù)據(jù)時(shí)代。在此背景下,數(shù)據(jù)文件歸檔工作,無(wú)疑將成為檔案學(xué)理論研究和實(shí)踐探索的重點(diǎn)之一。

      1 研究對(duì)象的界定

      按照信息的存在形式,電子文件可分為文本文件、數(shù)據(jù)文件、圖像文件、影像文件、聲音文件、程序文件、多媒體文件、超文本文件、超媒體文件等[2]。數(shù)據(jù)文件,作為電子文件重要的存在形式,主要包括兩類,一是指含有數(shù)據(jù)的電子表格文件,如用Excel軟件、WPS表格等制作的用于記錄或計(jì)算各類數(shù)據(jù)的表格;二是數(shù)據(jù)庫(kù)電子文件,是指在事務(wù)處理系統(tǒng)中單獨(dú)承擔(dān)文件職責(zé),或者作為文件的重要組成部分出現(xiàn)的數(shù)據(jù)對(duì)象[3]。從本質(zhì)上來(lái)講,Excel等表格處理軟件也算一種體量微小的數(shù)據(jù)庫(kù),數(shù)據(jù)文件可以理解為“以數(shù)據(jù)庫(kù)形式存在的具有文件屬性的記錄”。

      1.1 數(shù)據(jù)庫(kù)形式。處理不同體量的數(shù)據(jù),需要不同數(shù)量級(jí)的數(shù)據(jù)庫(kù)軟件。比如,日常辦公處理數(shù)據(jù),Excel等表格軟件即可滿足需要;而管理海量數(shù)據(jù)信息,則需要Oracle、SQL等大中型數(shù)據(jù)庫(kù)。不同軟件公司出品的數(shù)據(jù)庫(kù)文件格式相異,比如Access數(shù)據(jù)庫(kù)的擴(kuò)展名是.mdb,SQL數(shù)據(jù)庫(kù)的擴(kuò)展名是.mdf, Oracle數(shù)據(jù)庫(kù)的擴(kuò)展名是.dbf。即使是同一款數(shù)據(jù)庫(kù),不同版本也會(huì)產(chǎn)生不同擴(kuò)展名的數(shù)據(jù)文件。

      1.2 文件屬性。根據(jù)《檔案工作基本術(shù)語(yǔ)》(DA/T1-2000)的規(guī)定,“文件”是指“國(guó)家機(jī)構(gòu)、社會(huì)組織或個(gè)人在履行其法定職責(zé)或處理事務(wù)中形成的各種形式的信息記錄”。數(shù)據(jù)文件具有文件屬性,指在社會(huì)實(shí)踐活動(dòng)中產(chǎn)生的,經(jīng)過(guò)形成、辦理、傳輸?shù)攘鞒?,以?shù)據(jù)庫(kù)文件格式存儲(chǔ)的信息記錄。其他不具備文件屬性的數(shù)據(jù)庫(kù)文件,不是數(shù)據(jù)文件。

      2 數(shù)據(jù)文件歸檔面臨的主要問(wèn)題

      2.1 來(lái)源復(fù)雜。產(chǎn)生數(shù)據(jù)文件主要有兩個(gè)途徑:一是在使用Excel等辦公軟件管理數(shù)據(jù),生成.xlsx文件;二是業(yè)務(wù)系統(tǒng)(business system,BS )產(chǎn)生的數(shù)據(jù)文件,如辦公自動(dòng)化系統(tǒng)、電子商務(wù)系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、地理空間數(shù)據(jù)系統(tǒng)、客戶關(guān)系管理系統(tǒng)、人力資源管理系統(tǒng)等。業(yè)務(wù)系統(tǒng)產(chǎn)生的文檔,會(huì)被歸入電子文檔管理系統(tǒng)(Electronic Records Management System,ERMS)或電子文件長(zhǎng)期保存系統(tǒng)(trusted digital repository,TDR)進(jìn)行管理,實(shí)現(xiàn)文檔一體化。

      2.2 系統(tǒng)依賴程度高。除了Excel表格類文件外,數(shù)據(jù)文件對(duì)業(yè)務(wù)系統(tǒng)軟件和數(shù)據(jù)庫(kù)的依賴程度高。沒(méi)有了數(shù)據(jù)庫(kù),無(wú)法讀取數(shù)據(jù)文件;缺少了業(yè)務(wù)系統(tǒng)軟件,不能確定各字段數(shù)據(jù)之間的關(guān)聯(lián),無(wú)法表達(dá)確定含義?;仡檾?shù)據(jù)庫(kù)發(fā)展歷史中出現(xiàn)了多種數(shù)據(jù)模型,無(wú)論是層次模型、網(wǎng)狀模型,還是面向?qū)ο蟮哪P停即嬖谳^大程度的數(shù)據(jù)庫(kù)依賴和軟件依賴。

      2.3 元數(shù)據(jù)無(wú)法保障數(shù)據(jù)文件真實(shí)性。關(guān)系型數(shù)據(jù)庫(kù)的元數(shù)據(jù),主要是指對(duì)創(chuàng)建時(shí)間、權(quán)屬、權(quán)限、用戶、角色等數(shù)據(jù)庫(kù)層要素進(jìn)行描述,對(duì)數(shù)據(jù)表、數(shù)據(jù)表關(guān)系、視圖、存儲(chǔ)過(guò)程等數(shù)據(jù)分區(qū)層邏輯關(guān)系進(jìn)行解釋,對(duì)約束、索引、觸發(fā)器、字段限制等數(shù)據(jù)表層要素進(jìn)行說(shuō)明??梢?jiàn),數(shù)據(jù)文件的元數(shù)據(jù),功能在于完整、清晰地呈現(xiàn)數(shù)據(jù)文件的含義,而不在于確保其真實(shí)性。從數(shù)據(jù)、信息和文件之間的關(guān)系可知,數(shù)據(jù)處于底層,信息是提供決策的有效數(shù)據(jù)(處于中層),文件是由機(jī)構(gòu)或個(gè)人在社會(huì)實(shí)踐過(guò)程中所產(chǎn)生或接收的記錄信息(處于頂層)[4]。業(yè)務(wù)系統(tǒng)管理處于底層的數(shù)據(jù),在產(chǎn)生數(shù)據(jù)文件后,并沒(méi)有像文書(shū)類電子文件一樣,經(jīng)歷起草、流轉(zhuǎn)、簽批、歸檔等流程,也沒(méi)有電子簽章、時(shí)間戳等元數(shù)據(jù)保障其真實(shí)性。

      3 基于實(shí)踐案例的數(shù)據(jù)文件管理探索

      3.1 系統(tǒng)業(yè)務(wù)流程及數(shù)據(jù)文件歸檔價(jià)值?!皵?shù)據(jù)系統(tǒng)”基于Excel表格設(shè)計(jì),內(nèi)嵌8張參數(shù)表、81張基礎(chǔ)數(shù)據(jù)表、10張數(shù)據(jù)分析表,用于采集與管理全國(guó)各高職院校人才培養(yǎng)數(shù)據(jù)。系統(tǒng)產(chǎn)生典型的數(shù)據(jù)文件,每張表格可以分別以.xlsx格式導(dǎo)出,所有數(shù)據(jù)也可以打包成一個(gè).xlsx文件或.bak文件。

      3.2 數(shù)據(jù)文件歸檔實(shí)踐

      3.2.1 在線歸檔。數(shù)據(jù)上傳至院校數(shù)據(jù)平臺(tái)、教育主管部門數(shù)據(jù)平臺(tái)、教育部數(shù)據(jù)平臺(tái)的過(guò)程,分別對(duì)應(yīng)不同的主體,完成了三次在線歸檔。同時(shí),教育部數(shù)據(jù)平臺(tái)賦予各院校和教育主管部門相應(yīng)的賬號(hào)和密碼,方便其在平臺(tái)上瀏覽、下載本級(jí)數(shù)據(jù)[5]。

      3.2.2 離線歸檔。參照本單位檔案分類法,將數(shù)據(jù)文件按照“年度——組織機(jī)構(gòu)——保管期限”的方法進(jìn)行管理。為了確保數(shù)據(jù)文件的長(zhǎng)期可讀性,將數(shù)據(jù)文件、系統(tǒng)軟件安裝包同步歸檔,并制作電子備考表,記錄系統(tǒng)的運(yùn)行環(huán)境和需要注意的問(wèn)題。進(jìn)一步,將系統(tǒng)數(shù)據(jù)以.xlsx表格文件導(dǎo)出后,轉(zhuǎn)換成PDF版式文件保存,重要的數(shù)據(jù)表格打印成紙質(zhì)載體歸檔。

      3.3 數(shù)據(jù)文件真實(shí)可靠性研究

      3.3.1 數(shù)據(jù)源頭采集機(jī)制。“人才數(shù)據(jù)系統(tǒng)”賦予填報(bào)個(gè)人或機(jī)構(gòu)用戶名和密碼,用戶登錄后填報(bào)系統(tǒng)指定的表單,確保從源頭采集數(shù)據(jù)。所有填報(bào)用戶與此項(xiàng)工作無(wú)利害關(guān)系,也不知道系統(tǒng)數(shù)據(jù)的內(nèi)部關(guān)聯(lián)性。

      3.3.2 數(shù)據(jù)校驗(yàn)機(jī)制。校驗(yàn)有三個(gè)層次,一是“人才數(shù)據(jù)系統(tǒng)”內(nèi)置校驗(yàn)?zāi)K,對(duì)數(shù)據(jù)內(nèi)部邏輯進(jìn)行校驗(yàn);二是數(shù)據(jù)上報(bào)至國(guó)家教育部平臺(tái)后,平臺(tái)會(huì)將其與該校歷史數(shù)據(jù)、同類型其他院校數(shù)據(jù)進(jìn)行關(guān)聯(lián)校驗(yàn);三是各級(jí)教育主管部門,會(huì)將“人才數(shù)據(jù)系統(tǒng)”的數(shù)據(jù),與該校同年度其他數(shù)據(jù)統(tǒng)計(jì)報(bào)表,如“高等教育基層統(tǒng)計(jì)報(bào)表”“高校社科和科技統(tǒng)計(jì)年報(bào)”等,進(jìn)行一致性校驗(yàn)(同字段數(shù)據(jù)需一致)。

      3.3.3 教學(xué)評(píng)估檢查機(jī)制。教育主管部門,每隔幾年會(huì)對(duì)各高職院校進(jìn)行教學(xué)評(píng)估檢查,而檢查的依據(jù),即是評(píng)估年度內(nèi)該院校上報(bào)的各類型數(shù)據(jù)。所以,各高職院校既不會(huì)敷衍這項(xiàng)工作,也不會(huì)作假提升數(shù)據(jù)美觀度。

      4 加強(qiáng)數(shù)據(jù)文件歸檔工作的對(duì)策思考

      4.1 來(lái)源原則適用于數(shù)據(jù)文件管理。無(wú)論數(shù)據(jù)文件的來(lái)源多么雜亂,其生成主體必定可以劃歸至某一組織機(jī)構(gòu)。如果是多個(gè)業(yè)務(wù)主體共同負(fù)責(zé),則可以劃歸至牽頭機(jī)構(gòu)。檔案部門應(yīng)該進(jìn)行深入的調(diào)查研究,考察各職能部門生成數(shù)據(jù)文件的現(xiàn)狀,參照檔案分類方案,制定數(shù)據(jù)文件的收集范圍和保管期限,與紙質(zhì)文件、其他類型電子文件同步歸檔。

      4.2 數(shù)據(jù)文件歸檔形式分析。數(shù)據(jù)文件系統(tǒng)依賴程度高,所以歸檔數(shù)據(jù)文件應(yīng)包含三部分內(nèi)容:一是數(shù)據(jù)文件本身;二是軟件安裝包(含業(yè)務(wù)系統(tǒng)和數(shù)據(jù)庫(kù))和使用說(shuō)明書(shū);三是制作電子備考表,記錄該業(yè)務(wù)系統(tǒng)和數(shù)據(jù)庫(kù)運(yùn)行環(huán)境及其他需要關(guān)注的問(wèn)題。在此基礎(chǔ)上,考慮到數(shù)據(jù)文件能以表格的形式展現(xiàn),可以通過(guò)技術(shù)手段,將其轉(zhuǎn)換為版式文件存儲(chǔ),進(jìn)而打印成紙質(zhì)載體歸檔。

      4.3 數(shù)據(jù)文件的真實(shí)性保障路徑。雖然數(shù)據(jù)文件的元數(shù)據(jù)在確保其真實(shí)性方面,具有先天劣勢(shì),但是,參考案例的做法,可以通過(guò)數(shù)據(jù)關(guān)聯(lián)性、機(jī)構(gòu)權(quán)威性等途徑,確保數(shù)據(jù)文件的真實(shí)性。從機(jī)械論的角度出發(fā),元數(shù)據(jù)可以用來(lái)確定電子文件從產(chǎn)生到歸檔各個(gè)步驟的因果關(guān)系。而在大數(shù)據(jù)時(shí)代,數(shù)據(jù)之間的相關(guān)性在某種程度上可以取代原來(lái)的因果關(guān)系,幫助我們得到答案,這便是大數(shù)據(jù)思維的核心[6]。在確保電子文件真實(shí)性方面,數(shù)據(jù)關(guān)聯(lián)性與元數(shù)據(jù)并非完全對(duì)立,前者是對(duì)后者有益的補(bǔ)充。

      參考文獻(xiàn):

      [1] John Gantz,David Reinsel.The Digital Universe in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East[EB/OL].(2012-12)[2018-2-10].https://www.emc.com/leadership/digital-universe/2012iview/index.htm.

      [2][3]馮惠玲,劉越男.電子文件管理教程(第二版)[M].北京:中國(guó)人民大學(xué)出版社,2017:8-9.

      [4]石峻峰,周俐霞,樊澤恒,等.大數(shù)據(jù)時(shí)代高校數(shù)字檔案資源管理研究[J].現(xiàn)代教育技術(shù),2015(1):19-24.

      [5]教育部“高等職業(yè)院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集與管理系統(tǒng)”網(wǎng)址:http://crpdc.gzvtc.cn/xin/log/login.aspx.

      [6]吳軍.智能時(shí)代——大數(shù)據(jù)與智能革命重新定義未來(lái)[M].北京:中信出版社,2016:141.

      猜你喜歡
      元數(shù)據(jù)電子文件數(shù)據(jù)文件
      數(shù)據(jù)文件恢復(fù)專題問(wèn)答
      數(shù)據(jù)文件安全管控技術(shù)的研究與實(shí)現(xiàn)
      SQL數(shù)據(jù)文件恢復(fù)工具
      電子文件檢查歸檔移交備份存儲(chǔ)機(jī)研究
      淺談電子文檔與紙質(zhì)文檔在保護(hù)技術(shù)上的差異
      元數(shù)據(jù)與社會(huì)化標(biāo)簽在微視頻搜索中的應(yīng)用
      高等院校智慧校園建設(shè)規(guī)劃與實(shí)現(xiàn)
      檔案管理中電子文件的存儲(chǔ)探究
      淺談電子文件的全過(guò)程管理
      Tekla Structure數(shù)據(jù)文件交互格式分析
      齐齐哈尔市| 莱州市| 阿拉善盟| 全南县| 济南市| 江津市| 朝阳县| 莆田市| 景宁| 岗巴县| 榕江县| 温泉县| 株洲市| 阿尔山市| 石屏县| 金门县| 合江县| 铜梁县| 桦川县| 仁化县| 蓝田县| 雷波县| 改则县| 即墨市| 手机| 大埔区| 克拉玛依市| 雷波县| 富锦市| 宁陵县| 黑水县| 汉源县| 博客| 辽阳市| 五台县| 惠东县| 辉南县| 天柱县| 福泉市| 怀来县| 土默特右旗|