文/上海財經(jīng)大學(xué)檔案館(校史館、博物館) 李倩
高校是人才培養(yǎng)和學(xué)術(shù)研究的重要場所,其所產(chǎn)生的大量文獻和資料有著巨大的歷史和文化價值。為了更好地保護和利用這些珍貴的文獻和資料,高校數(shù)字檔案館建設(shè)已經(jīng)成為一項重要的任務(wù)。數(shù)字檔案館的建設(shè),不僅可以保護珍貴文獻和資料,還可以為后人提供文獻查詢和學(xué)術(shù)研究的便利。本文將分析人工智能對高校數(shù)字化檔案建設(shè)的影響與挑戰(zhàn),并提出一些解決方案。
人工智能是一種模擬人類智能的技術(shù),包括機器學(xué)習(xí)、自然語言處理、計算機視覺等多個領(lǐng)域。近年來,隨著計算機科學(xué)技術(shù)水平的不斷提高和算法的不斷優(yōu)化,人工智能技術(shù)已經(jīng)在各個領(lǐng)域得到廣泛應(yīng)用。
(一)機器學(xué)習(xí)。是人工智能技術(shù)的一個重要分支,其主要目的是通過算法讓計算機自動學(xué)習(xí)并改進自己的性能。機器學(xué)習(xí)可以應(yīng)用于語音識別、圖像識別、自然語言處理等多個領(lǐng)域,如谷歌的AlphaGo就是一種基于機器學(xué)習(xí)的人工智能棋手。
(二)自然語言處理。指計算機能夠理解和處理自然語言的技術(shù)。其應(yīng)用范圍廣泛,包括機器翻譯、情感分析、文本分類等多個領(lǐng)域。如微軟的小冰就是一種基于自然語言處理技術(shù)的聊天機器人。
(三)計算機視覺。指讓計算機理解和處理圖像和視頻的技術(shù)。其應(yīng)用范圍廣泛,包括人臉識別、圖像搜索、自動駕駛等多個領(lǐng)域。如谷歌的圖像搜索就是一種基于計算機視覺技術(shù)的搜索引擎。
(一)人工智能賦能數(shù)字檔案信息化建設(shè)。人工智能技術(shù)可以有效提升數(shù)字檔案信息化建設(shè)的效率,可以自動檢測檔案信息,快速準(zhǔn)確地進行歸類和分析,大大降低人力成本,提高工作效率。人工智能技術(shù)能夠改善數(shù)字檔案信息化建設(shè)的質(zhì)量,有效解決檔案信息的檢索、歸類等問題,更好地為用戶提供服務(wù)。此外,人工智能技術(shù)還能改變數(shù)字檔案信息化建設(shè)的結(jié)構(gòu),可以實現(xiàn)檔案信息的自動化處理,大大改變傳統(tǒng)檔案信息處理模式,實現(xiàn)更加高效的管理。
(二)借助人工智能技術(shù)建設(shè)智能化數(shù)字檔案館。在人工智能背景下,數(shù)字檔案館可以利用AI技術(shù)進行更加智能化和高效的數(shù)字化處理、管理和利用,建立云端數(shù)字檔案系統(tǒng),人工智能技術(shù)可以幫助高校數(shù)字檔案館實現(xiàn)數(shù)字化目標(biāo)。如通過OCR技術(shù)將紙質(zhì)文獻和資料數(shù)字化,從而使其能更加方便地存儲、檢索和利用。數(shù)字化后的檔案數(shù)據(jù)可以存儲在網(wǎng)絡(luò)云端或者專門的數(shù)字化存儲設(shè)備中。將歷史檔案數(shù)據(jù)進行數(shù)字化,并存放在學(xué)校統(tǒng)一建設(shè)的云存儲上,使檔案館的老師能夠隨時隨地訪問和檢索,不僅提高了工作效率,盤活了歷史檔案的價值,還能夠保障歷史檔案數(shù)據(jù)的存儲安全。
此外,基于AI的自動化處理引擎,通過機器學(xué)習(xí)算法自動識別文獻和資料的類型和屬性,對數(shù)字檔案進行統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)化處理,包括統(tǒng)一的命名規(guī)則、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)格式標(biāo)準(zhǔn)等,能夠減輕人工處理的負擔(dān),提高工作效率,方便管理和利用。
建立檔案數(shù)據(jù)關(guān)聯(lián)分析平臺,通過智能分析和模式識別,分析不同歷史檔案的關(guān)聯(lián)信息,挖掘出檔案內(nèi)部的潛在聯(lián)系,從而實現(xiàn)關(guān)聯(lián)查詢和模糊查詢功能,可以為檔案利用業(yè)務(wù)提供更加精準(zhǔn)的檔案查詢服務(wù)。構(gòu)建檔案智能審核系統(tǒng),借助機器學(xué)習(xí)技術(shù),自動識別檔案中的信息,并基于識別結(jié)果進行分類存檔以及檢測檔案中的錯誤等,能有效提高審核效率。構(gòu)建智能檔案管理系統(tǒng),建立大數(shù)據(jù)智能管理系統(tǒng),能夠有效管理檔案的歸檔、檢索、統(tǒng)計等工作,提高檔案管理效率。
(一)數(shù)字檔案館建設(shè)內(nèi)容。上海財經(jīng)大學(xué)檔案館以建設(shè)“數(shù)字化智慧檔案館”為核心,實現(xiàn)了檔案管理過程的科學(xué)化、規(guī)范化、自動化,提供了跨部門、跨單位、跨職能、跨組織的檔案智慧管理服務(wù)。數(shù)字化智慧檔案館建設(shè)內(nèi)容主要包括檔案數(shù)字化收集系統(tǒng)、檔案自動歸檔系統(tǒng)、檔案綜合管理系統(tǒng)、數(shù)字檔案云存儲系統(tǒng)、檔案利用綜合服務(wù)系統(tǒng)、檔案存儲與保護系統(tǒng)以及電子簽章密碼認證系統(tǒng)對數(shù)字檔案的鑒定等。
檔案數(shù)字化收集系統(tǒng),對接上財管理信息系統(tǒng)2.0平臺,自動收集來自辦公自動化系統(tǒng)的公文、內(nèi)請、督辦等電子文檔,教學(xué)管理系統(tǒng)、研究生管理系統(tǒng)的學(xué)生信息表、成績單、錄取名冊等學(xué)生檔案,人事管理系統(tǒng)的干部人事檔案數(shù)據(jù),科研項目管理系統(tǒng)中的科研及教學(xué)成果,評教系統(tǒng)中的教師評價表,教師培訓(xùn)管理系統(tǒng)中的教師培訓(xùn)及發(fā)展電子檔案等,實現(xiàn)了電子檔案自動收集的應(yīng)用場景和目標(biāo)。
檔案自動歸檔系統(tǒng)的數(shù)據(jù)來源于電子檔案自動收集的所有數(shù)據(jù),自動歸檔系統(tǒng)根據(jù)自定義規(guī)則,把不同門類的數(shù)字化檔案自動分類、編排后,統(tǒng)一建立索引并歸檔保存,以方便后續(xù)的檔案利用和檔案管理。
檔案綜合管理系統(tǒng)主要實現(xiàn)檔案登記、檔案編目、檔案分類、檔案存放、檔案查詢、檔案審核以及檔案的安全管理等功能,實現(xiàn)檔案的審批、審核,提高檔案的安全管理效率。
數(shù)字檔案云存儲系統(tǒng)實現(xiàn)檔案存放管理、檔案檢索管理的功能。另外,暴露開放的API給檔案綜合管理系統(tǒng)遠程調(diào)用,包含檔案的檢索、查詢等功能。
檔案利用綜合服務(wù)系統(tǒng)實現(xiàn)了用戶查檔信息登記、館員查檔調(diào)閱、復(fù)印打印、郵件快遞等信息化管理,實現(xiàn)了檔案利用一站式服務(wù)。其通過系統(tǒng)實現(xiàn)數(shù)字檔案的共享,方便各部門或組織之間的檔案調(diào)用,提高檔案管理效率。
檔案存儲與保護系統(tǒng)主要實現(xiàn)數(shù)字檔案的備份、數(shù)據(jù)的恢復(fù)、歷史數(shù)據(jù)的存檔等功能,可有效保證檔案的安全,防止檔案的意外丟失或損壞。
電子簽章是一種新型的檔案管理工具,借助電子簽章技術(shù)建設(shè)數(shù)字檔案鑒定系統(tǒng),對查檔用戶進行身份驗證,并準(zhǔn)確記錄每次檔案使用的時間、內(nèi)容以及使用者的身份等信息,以便于館員更好地監(jiān)督檔案的使用情況。其中,實現(xiàn)檔案的分級存儲,根據(jù)檔案的重要性給予不同的權(quán)限,以確保檔案的安全。對于日常煩瑣的數(shù)字檔案鑒別真?zhèn)芜@項常規(guī)工作提供了新的技術(shù)手段,用戶只需要自主到系統(tǒng)里去鑒定,無須館員的人工接入,大大減少了工作量,也受到查檔用戶的一致好評。
(二)數(shù)字檔案館建設(shè)的經(jīng)驗總結(jié)。為了順應(yīng)數(shù)字化轉(zhuǎn)型的發(fā)展趨勢,高校檔案館自2019年啟動并穩(wěn)步推進數(shù)字檔案館的建設(shè),努力建設(shè)一套功能完善、管理有序、便捷高效的管理體系,規(guī)范學(xué)校數(shù)字檔案的收集、歸檔、管理、利用、存儲、備份等整套流程,實現(xiàn)了數(shù)字檔案收集的自動化、智能化,聲像檔案管理的信息化、規(guī)范化,檔案利用的自助化、流程化。其中電子簽章技術(shù)應(yīng)用于檔案鑒定的創(chuàng)新工作思路,簡化了人工鑒定時代煩瑣復(fù)雜的工作流程。另外,檔案管理系統(tǒng)可自動收集和統(tǒng)計并生成可視化報表和館領(lǐng)導(dǎo)“駕駛艙儀表盤”,方便館領(lǐng)導(dǎo)從全局科學(xué)地掌控檔案工作的全貌,科學(xué)輔助領(lǐng)導(dǎo)層做決策。
目前,一期的項目已經(jīng)完成階段性工作,確定了數(shù)字檔案館的功能定位,把握好了數(shù)字檔案館的功能結(jié)構(gòu),制定了符合學(xué)校實際的功能定位;建立了學(xué)校數(shù)字檔案館的數(shù)據(jù)架構(gòu),建立了完善的數(shù)據(jù)管理機制,制定了相應(yīng)的數(shù)據(jù)管理規(guī)范,并以此為標(biāo)準(zhǔn)加強數(shù)據(jù)管理,推動了學(xué)校數(shù)字檔案館的信息共享,達到了項目的驗收標(biāo)準(zhǔn),為數(shù)字檔案館未來的建設(shè)夯實了基礎(chǔ),也為上海市數(shù)字化轉(zhuǎn)型標(biāo)桿學(xué)校的順利驗收做出了一定的貢獻。今后,我館將繼續(xù)推進數(shù)字檔案館二期的建設(shè)進程,認真總結(jié),及時改進工作,并加強同兄弟院校的交流互訪,使得數(shù)字檔案能夠更好地支撐學(xué)校的中心工作,讓數(shù)字檔案賦能人才培養(yǎng)和學(xué)科建設(shè)。
(三)數(shù)字檔案館的建設(shè)路徑。具體如下:
1.制定數(shù)字化建設(shè)規(guī)劃。高校檔案館應(yīng)先制定數(shù)字化建設(shè)規(guī)劃,明確數(shù)字化目標(biāo)、范圍、標(biāo)準(zhǔn)和要求,確定數(shù)字化資源建設(shè)和數(shù)字化服務(wù)的方向和目標(biāo)。評估高校檔案館的數(shù)字化資源現(xiàn)狀和需求,確定數(shù)字化的文物資源、目標(biāo)受眾、數(shù)字服務(wù)范圍、數(shù)字化存儲需求等,為后續(xù)數(shù)字化工作提供指導(dǎo)。高校檔案館還需確定數(shù)字化建設(shè)方案,包括數(shù)字化流程、數(shù)字資源管理系統(tǒng)、數(shù)字化存儲設(shè)備、數(shù)字化服務(wù)等,確保數(shù)字化工作的高效性、規(guī)范性和可持續(xù)性。對需要進行數(shù)字化建設(shè)的工作,包括文物數(shù)字化、元數(shù)據(jù)制作、數(shù)字化存儲、數(shù)字化管理系統(tǒng)開發(fā)等,應(yīng)建設(shè)數(shù)字檔案館數(shù)字資源庫和數(shù)字服務(wù)平臺。
2.數(shù)字資源管理。高校檔案館需要對數(shù)字資源進行分類、編目、檢索、保存、備份、維護等管理工作,確保數(shù)字資源的長期保存和服務(wù)能力;需要為用戶提供數(shù)字化服務(wù),包括數(shù)字資源的在線展示、查詢、下載等服務(wù),以滿足不同用戶的需求。數(shù)字檔案存儲一般包括本地存儲和云存儲。本地存儲指在本地計算機或服務(wù)器中存儲,云存儲指將數(shù)字檔案存儲在云端,使用云存儲可以提高數(shù)據(jù)的可靠性和可訪問性。為了保障數(shù)字檔案的安全性和完整性,需要定期進行數(shù)據(jù)備份。備份可以采用本地備份和云備份的方式,以保證數(shù)據(jù)在出現(xiàn)故障或者損壞時能夠得到恢復(fù)。
3.監(jiān)測評估。高校檔案館需要對數(shù)字檔案館的數(shù)字資源、數(shù)字服務(wù)等方面進行監(jiān)測和評估,包括數(shù)字資源使用情況、用戶滿意度、數(shù)字資源保存狀況等,為數(shù)字檔案館的后續(xù)發(fā)展提供參考依據(jù)。還要充分考慮數(shù)字化資源的特殊性,科學(xué)規(guī)劃,全面布局,有序推進,創(chuàng)新服務(wù),確保數(shù)字化工作的高效性、規(guī)范性和可持續(xù)性。
(四)人工智能對高校數(shù)字檔案館建設(shè)的挑戰(zhàn)。一是隱私泄露。在數(shù)字化和自動化的過程中,高校數(shù)字檔案館可能會涉及用戶的隱私信息,如個人身份信息、社會保障號碼、成績單等。因此,高校數(shù)字檔案館需要采取有效的安全措施來防止隱私泄露,如采用加密技術(shù)保護用戶隱私信息,建立完善的安全管理機制等。其中使用AI技術(shù)進行數(shù)據(jù)處理和挖掘時需要保障數(shù)據(jù)的隱私和安全。二是數(shù)據(jù)質(zhì)量。高校檔案涵蓋了豐富的歷史文化和知識資料,這些資料需要高質(zhì)量的數(shù)字化轉(zhuǎn)換以及有效的數(shù)據(jù)標(biāo)準(zhǔn)化分類。數(shù)字化和自動化需要大量的數(shù)據(jù)支持。因此,高校數(shù)字檔案館需要建立完善的數(shù)據(jù)管理機制來保證數(shù)據(jù)的質(zhì)量。如需要對數(shù)據(jù)進行分類、整合、清洗等處理,確保數(shù)據(jù)的準(zhǔn)確性和完整性。三是高效存儲和檢索。AI技術(shù)可以通過語義分析和自然語言處理等技術(shù),實現(xiàn)高效的檔案存儲和檢索,方便學(xué)者和研究者快速獲取所需信息,還可通過自然語言理解和智能問答等技術(shù),為學(xué)者和研究者提供智能化的問答服務(wù),解答他們的疑問和需求。四是技術(shù)壁壘。人工智能技術(shù)需要專業(yè)的人才和先進的設(shè)備來支持。因此,高校數(shù)字檔案館要投入大量的人力、物力和財力來建設(shè)和維護。此外,人工智能技術(shù)的快速發(fā)展也要求高校數(shù)字檔案館不斷跟進和更新技術(shù),以適應(yīng)新的需求和挑戰(zhàn)。
高校數(shù)字檔案館是高校信息化建設(shè)的重要組成部分,具有重要的文化、歷史和教育價值。人工智能技術(shù)作為一種新興技術(shù),為高校數(shù)字檔案館的建設(shè)和發(fā)展提供了新的機遇和挑戰(zhàn)。
在數(shù)字化、自動化和智能化的過程中,高校數(shù)字檔案館需要注意隱私保護、數(shù)據(jù)質(zhì)量和技術(shù)壁壘等問題。因此,高校數(shù)字檔案館要不斷跟進和更新技術(shù),積極探索人工智能技術(shù)在數(shù)字檔案館建設(shè)和服務(wù)中的應(yīng)用,更好地服務(wù)于高校的教育和研究工作。
此外,高校數(shù)字檔案館也需要加強與其他高校之間的協(xié)作和共享,建立數(shù)字檔案館聯(lián)盟或者平臺,共同促進數(shù)字檔案館的建設(shè)和發(fā)展。同時,數(shù)字檔案館也需要與相關(guān)部門、機構(gòu)和企業(yè)進行合作,共同推進數(shù)字檔案館的普及和應(yīng)用。
高校數(shù)字檔案館的建設(shè)和發(fā)展離不開人工智能技術(shù)的支持和應(yīng)用。在數(shù)字化、自動化和智能化的過程中,數(shù)字檔案館需要注意隱私保護、數(shù)據(jù)質(zhì)量和技術(shù)壁壘等問題。未來,數(shù)字檔案館還需要與時俱進,積極探索人工智能技術(shù)在數(shù)字檔案館建設(shè)和服務(wù)中的應(yīng)用,更好地服務(wù)于高校的教育和研究工作。