• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)字人文環(huán)境下歷史文獻資源共建共享模式新探

      2021-06-24 10:21夏翠娟賀晨芝劉倩倩朱武信
      圖書與情報 2021年1期
      關(guān)鍵詞:數(shù)字人文模式研究

      夏翠娟 賀晨芝 劉倩倩 朱武信

      摘 ? 要:數(shù)字人文的勃興為GLAM領(lǐng)域的資源共建共享提出了新的需求。文章以上海圖書館“中文古籍聯(lián)合目錄及循證平臺”“中國家譜知識服務(wù)平臺”“人名規(guī)范庫”“歷史文獻眾包平臺”為例,介紹數(shù)字人文環(huán)境下新的歷史文獻資源共建共享模式,主要包括“資源與服務(wù)全托管模式”“資源與服務(wù)半托管模式”“聯(lián)合編目模式”“數(shù)據(jù)中心模式”“開放鏈接模式”“眾包模式”等六種,隨后分析比較其適用范圍和可行的技術(shù)方案。通過實踐案例論證了解決數(shù)字人文環(huán)境下GLAM領(lǐng)域的資源共建共享問題,利用以技術(shù)的手段作為政策和機制的補充,提供一種技術(shù)驅(qū)動的低成本資源共建共享途徑。

      關(guān)鍵詞:數(shù)字人文;資源共建共享;最佳實踐;模式研究

      中圖分類號:G122 ? 文獻標(biāo)識碼:A ? DOI:10.11968/tsyqb.1003-6938.2021008

      New Exploration on the Co-construction and Sharing Mode of Historical Literature Resources in the Digital Human Environment

      Abstract The development of Digital Humanities has brought forward new demands for Resource Co- Construction and Sharing in GLAM. Taking the "Chinese Ancient Books Union Catalogue and Evidence-based Platform", "Chinese Genealogy Knowledge Service Platform", "Authority Names Database" and "Historical Document Crowd-sourcing Platform" as examples, this paper explores the mode of co-construction and sharing of historical literature resources in the digital humanities environment, including six modes. The paper analyzes and compares the application scope and feasible technical solutions. Through practical cases, the paper demonstrates that the problems of resource co construction and sharing in GLAM field under the digital human environment can be solved by technical means as a supplement to policies and mechanism.

      Key words digital humanities; resource co construction and sharing; best practice; mode research

      1 ? 引言

      圖書館界對于資源共建共享歷來十分重視,建國以來各種多機構(gòu)合作修纂聯(lián)合目錄如《中國叢書綜錄》《中國古籍善本書目》《中國古籍總目》《中國家譜總目》等工作起到了摸清家底的作用,為新世紀(jì)伊始數(shù)字圖書館建設(shè)大潮中數(shù)字化歷史文獻資源的共建共享打下了基礎(chǔ)。21世紀(jì)初互聯(lián)網(wǎng)時代的到來,對網(wǎng)絡(luò)環(huán)境下文獻資源共建共享的研究達到一個高峰,從現(xiàn)狀調(diào)查和反思[1],到管理機制[1]、運行模式[2],再到實踐[3]進行了全方位的探討。由國家(原)文化部、財政部共同發(fā)起并組織實施的三項重大公共數(shù)字文化工程(簡稱“三大工程”),即“全國文化信息資源共享工程”“數(shù)字圖書館推廣工程”和“公共電子閱覽室計劃”,在公共文化服務(wù)體系的資源共建共享方面取得了一定的成就,初步完成了信息基礎(chǔ)設(shè)施建設(shè),在資源建設(shè)方面也制定了系統(tǒng)性的資源數(shù)字化加工、數(shù)字對象管理、資源描述、長期保存的標(biāo)準(zhǔn)規(guī)范,為不同機構(gòu)間的資源共建共享奠定了一定的基礎(chǔ)。高校圖書館經(jīng)過中國高等教育文獻保障系統(tǒng)(CALIS)、大學(xué)數(shù)字圖書館國際合作計劃(CADAL)等項目在高校圖書館界的資源共建共享等方面也取得了類似的成就。

      國家十四五規(guī)劃提出實施文化產(chǎn)業(yè)數(shù)字化戰(zhàn)略,上海市全面推進城市數(shù)字化轉(zhuǎn)型,強調(diào)以新技術(shù)廣泛應(yīng)用為重點,大力提升城市創(chuàng)新能級。而隨著“數(shù)智時代”的到來和數(shù)字人文的興起,為數(shù)字人文研究提供“數(shù)據(jù)基礎(chǔ)設(shè)施”支撐和數(shù)字學(xué)術(shù)環(huán)境保障成為歷史文獻資源開發(fā)利用的目的之一?!皵?shù)據(jù)基礎(chǔ)設(shè)施”需要充分體現(xiàn)資源覆蓋全,數(shù)據(jù)規(guī)模大,覆蓋時間長,地域范圍廣,描述粒度小、維度多等特點,以支持全網(wǎng)域(Webb-scale)的數(shù)據(jù)調(diào)度、融合和自動化的分析、統(tǒng)計,以及大規(guī)模數(shù)據(jù)的可視化。這就對歷史文獻資源的共建共享提出了更高的要求。數(shù)字圖書館時代以三大工程為代表的資源共建共享都有著自上而下的政策和管理驅(qū)動的特點,成本較高。數(shù)智技術(shù)不僅為數(shù)字資源的管理加工提供了更為高效的平臺和工具,也改變了資源收藏者的觀念,對資源使用者催生了新的需求,而能否通過新技術(shù)的應(yīng)用,為跨機構(gòu)的協(xié)同共建和開放共享提供更為便捷輕型的解決方案,滿足實際情況下各個機構(gòu)對資源共建共享的不同需求,提供靈活的選擇,正是本文試圖通過家譜、古籍、人名規(guī)范庫、眾包等數(shù)字人文項目實踐來探討的問題。

      2 ? 文獻調(diào)研

      為避免重復(fù)建設(shè)和服務(wù)的均等化,資源的共建共享是必然的需求[4]。我國自“十二五”時期開始加強對公共數(shù)字文化資源建設(shè)的重視,并推出大量涉及公共數(shù)字文化資源整合的策略[5]。隨著三大工程的實施,各地政府推出地方數(shù)字文化網(wǎng)站、資源共享平臺(中心),建設(shè)地方特色數(shù)字資源,但由于各地建設(shè)技術(shù)不一、數(shù)據(jù)結(jié)構(gòu)各異,造成總體內(nèi)容不成體系、無法互鏈共享、更新維護欠佳等問題,也難以為公眾提供全面高質(zhì)量的數(shù)字文化資源服務(wù)[6-7]。

      國外資源共建共享項目起步于上世紀(jì)90年代,至今已推出各類較為成熟的跨機構(gòu)、跨地域歷史文獻資源共建共享平臺,如歐盟的Europeana、紐約公共圖書館的DPLA、法國國家圖書館的Gallica、澳大利亞國家圖書館的Trove、美國國會圖書館主導(dǎo)開發(fā)的WDL等,集合了不同機構(gòu)的大量數(shù)字文化資源,為公眾提供一站式服務(wù)[8]。

      資源建設(shè)方面,各平臺以規(guī)范的數(shù)據(jù)格式上傳資源、遵循約定協(xié)議關(guān)聯(lián)整合等方式匯聚資源。Europeana制定了EDM數(shù)據(jù)模型(Europeana data model)以語義技術(shù)融合各類資源元數(shù)據(jù),不同機構(gòu)自行加工數(shù)據(jù),將符合要求的資源元數(shù)據(jù)上傳至平臺[9]。Gallica則根據(jù)參與機構(gòu)數(shù)字化能力提供不同的建設(shè)方式,除了提供基于OAI-PMH協(xié)議的資源共建方式外,還為資源尚未數(shù)字化的機構(gòu)提供數(shù)字化服務(wù)并將其納入平臺,對于資源已數(shù)字化但沒有獨立數(shù)字資源發(fā)布平臺的機構(gòu),在將其資源納入平臺的同時,還提供基于Gallica平臺、在界面設(shè)計(配色)上根據(jù)機構(gòu)意愿個性化定制的數(shù)字資源發(fā)布平臺建設(shè)服務(wù)[10]。Trove在機構(gòu)與機構(gòu)共建數(shù)據(jù)的基礎(chǔ)上,引入了基于用戶貢獻的眾包理念,邀請用戶通過文獻標(biāo)引、全文抄錄的方式與機構(gòu)共同建設(shè)資源數(shù)據(jù)[11]。

      資源共享與服務(wù)方面,在提供資源統(tǒng)一檢索門戶的基礎(chǔ)上,部分網(wǎng)站還提供了更為深入的知識服務(wù)、數(shù)據(jù)開放服務(wù)。WDL的資源元數(shù)據(jù)都可點擊關(guān)聯(lián)至相關(guān)檢索結(jié)果,Gallica提供與主題作者等相關(guān)的資源推薦,通過不同資源間的關(guān)聯(lián)提高資源利用率與可見度。WDL還利用國際圖象相互操作框架支持圖像資源的共享、關(guān)聯(lián)與再利用。DPLA和Europeana除了常規(guī)的服務(wù)平臺以外,還有專業(yè)版服務(wù)平臺,通過開放Search API、Record API、IIIF APIs、SPARQL、OAI-PMH Service等各類資源接口提供數(shù)據(jù)開放服務(wù)[12-13]。

      3 ? 數(shù)字人文環(huán)境下歷史文獻資源共建共享模式——實踐探索

      圖書館參與數(shù)字人文項目的最初出發(fā)點是利用新技術(shù)更好地整合開發(fā)館藏資源,尤其是用活用好珍貴的歷史文獻資源,以為研究者提供更好的數(shù)字學(xué)術(shù)支撐環(huán)境,以上海圖書館為例,其作為研究型公共圖書館,需要利用數(shù)據(jù)可視化、AR、VR等技術(shù)拉近專業(yè)性較強的歷史文獻資源與普通大眾的距離,從總體上提高資源的利用率。上海圖書館的數(shù)字人文項目建設(shè)始于2014年,從上圖的特色資源家譜開始,利用以關(guān)聯(lián)數(shù)據(jù)、知識圖譜為主的語義萬維網(wǎng)(Semantic Web)技術(shù),融合597家館藏機構(gòu)和眾多私人收藏者的家譜元數(shù)據(jù)記錄、專家的研究成果(姓氏、祠堂、家規(guī)家訓(xùn))、相關(guān)的網(wǎng)絡(luò)資源、人名詞典,基于本體(Ontology)建模的方法重組整合數(shù)據(jù),建成“中國家譜知識服務(wù)平臺”,在提供更好的文獻查閱服務(wù)之外還提供數(shù)據(jù)驅(qū)動的知識服務(wù),為使該平臺成為一個不斷生長的有機體,還開發(fā)了在線捐贈、在線識譜、在線修譜、聯(lián)合編目等各種眾包功能,吸納用戶貢獻內(nèi)容。經(jīng)過數(shù)年的探索實踐,上海圖書館建設(shè)了手稿、檔案、古籍、紅色文獻等文獻知識庫,并以人名規(guī)范庫等知識庫作為不同機構(gòu)、不同類型的文獻的數(shù)據(jù)鏈接中心和知識共享中心,形成了將各種文獻庫和知識庫融為為一體的人文數(shù)據(jù)基礎(chǔ)設(shè)施。在這個過程中,不可避免地涉及到跨機構(gòu)的資源共建共享的問題,根據(jù)各個機構(gòu)的資源管理服務(wù)政策、現(xiàn)狀和需求,探索了不同的資源共建共享模式。在“中國家譜知識服務(wù)平臺”中,探索了“聯(lián)合編目模式”和“眾包模式”;在“中文古籍聯(lián)合目錄及循證平臺”中探索了“資源與服務(wù)全托管模式”、“資源與服務(wù)半托管模式”和“開放鏈接”模式;而人名規(guī)范庫則是通過一個人物實體作為“數(shù)據(jù)中心”,來鏈接來自不同機構(gòu)和不同類型的文獻資源;“歷史文獻眾包平臺”則是一個旨在為不同機構(gòu)、不同種類的歷史文獻提供眾包項目分發(fā)、管理和回收的綜合性眾包平臺,面向個人用戶,支持元數(shù)據(jù)編目和全文圖像抄錄成文本,是典型的“眾包模式”。

      3.1 ? ?資源與服務(wù)全托管模式

      “資源與服務(wù)全托管模式”是指資源收藏機構(gòu)無獨立的特藏資源服務(wù)站點,將要服務(wù)的資源元數(shù)據(jù)和數(shù)字化全文掃描影像提交給托管機構(gòu),由托管機構(gòu)負責(zé)進行數(shù)據(jù)加工和格式轉(zhuǎn)換及系統(tǒng)開發(fā),在云平臺上提供元數(shù)據(jù)和數(shù)字化全文掃描影像服務(wù),并支持功能開發(fā)及后續(xù)維護(數(shù)據(jù)更新、站點維護管理等)。

      如澳門大學(xué)圖書館與上海圖書館的古籍項目合作就是采用資源與服務(wù)全托管模式。澳門大學(xué)圖書館將其館藏2480種古籍的MARC元數(shù)據(jù)和數(shù)字化全文掃描影像托管給上海圖書館,上海圖書館數(shù)字人文團隊對元數(shù)據(jù)進行數(shù)據(jù)清洗和知識提取,提取元數(shù)據(jù)中的作品、版本、責(zé)任者等信息,按照上圖古籍本體的知識結(jié)構(gòu)進行重組和RDF格式轉(zhuǎn)換,對PDF格式的古籍掃描影像進行IIIF的轉(zhuǎn)換,并在上圖中文古籍聯(lián)合目錄及循證平臺(http://gj.library.sh.cn)上為澳門大學(xué)圖書館發(fā)布了單獨的古籍目錄站點,直接在云端為該館讀者提供獨立的古籍館藏服務(wù)站點(https://gj.library.sh.cn/org/mcu)。澳門大學(xué)圖書館可以自行對該站點的界面外觀、高級檢索字段、詳情頁面顯示的字段、排序規(guī)則等進行個性化設(shè)置(見圖1),也可對資源和用戶進行維護和管理。平臺支持澳門大學(xué)圖書館管理員對資源元數(shù)據(jù)進行查詢修改、館藏導(dǎo)出或新增資源的批量上傳,以上設(shè)置和維護也可全權(quán)委托上海圖書館。

      同時,澳門大學(xué)圖書館也可共享平臺提供的1400余家機構(gòu)館藏目錄一站式檢索的“聯(lián)合目錄”功能,和融合各種聯(lián)合目錄、史志目錄、官修目錄、私家目錄和避諱字、藏印、刻工等各種外掛知識庫的“循證研究”功能,以及還原各種古籍目錄并提供全文檢索和閱覽的“古籍目錄”功能等。

      這種模式適用于資源收藏機構(gòu)無暇投入人力自行開發(fā)館藏資源服務(wù)站點,其優(yōu)點是資源托管機構(gòu)成熟的技術(shù)方案和開發(fā)經(jīng)驗,能快速按既有流程完成開發(fā),提高了開發(fā)的效率,雙方的數(shù)據(jù)深度融合形成規(guī)?;瘍?yōu)勢;由于采用一致的數(shù)據(jù)模型和技術(shù)方案,確保了雙方資源整合時數(shù)據(jù)標(biāo)準(zhǔn)和技術(shù)架構(gòu)的統(tǒng)一,避免了不同技術(shù)體系帶來的互操作障礙;此外,資源集中存儲,服務(wù)在云端,在后續(xù)的更新和維護上,也有一定的便利性。

      3.2 ? ?資源與服務(wù)半托管模式

      資源與服務(wù)半托管模式是指資源收藏機構(gòu)已有獨立的特藏資源服務(wù)站點,但將要建設(shè)的元數(shù)據(jù)和數(shù)字化全文掃描影像提交給資源托管機構(gòu),由后者負責(zé)進行數(shù)據(jù)加工和格式轉(zhuǎn)換,在云平臺上提供元數(shù)據(jù)和數(shù)字化全文掃描影像服務(wù),以及平臺功能開發(fā)及后續(xù)的維護(資源更新、站點維護管理等),云平臺的服務(wù)作為前者已有服務(wù)站點的補充。

      如柏克萊加州大學(xué)東亞圖書館與上海圖書館的合作就是采用資源與服務(wù)半托管模式。前者曾將館藏的清乾隆六十年以前所有中文刻本及稿、鈔、校本編著為《柏克萊加州大學(xué)東亞圖書館中文古籍善本書志》公開出版,其中收錄該館所藏中文古籍善本802種,每種書志的著錄非常詳細和完善,包括書名、卷數(shù)、著者、版本、冊數(shù)、行款、版匡高廣、牌記、刻工、寫工、原書序跋、著者仁履、內(nèi)容提要、版本考訂、收藏或經(jīng)眼者批校題跋、收藏概況、鈐印等項,為反映海外圖書館漢籍收藏的一本重要工具書。上海圖書館以此書為基礎(chǔ)與柏克萊加州大學(xué)東亞圖書館進行合作,雙方商定,前者為后者提供中文古籍聯(lián)合目錄與循證平臺的所有登錄用戶可訪問的內(nèi)容和服務(wù),后者允許前者將802種善本書志的內(nèi)容數(shù)據(jù)化后融入中文古籍聯(lián)合目錄和循證平臺。

      上海圖書館數(shù)字人文團隊對善本書志進行了結(jié)構(gòu)化、數(shù)據(jù)清洗和知識提取,提取元數(shù)據(jù)中的分類、作品、版本、責(zé)任者、鈐印等信息,按照上海圖書館古籍本體的知識結(jié)構(gòu)進行重組和RDF格式轉(zhuǎn)換,融入中文古籍聯(lián)合目錄及循證平臺。并對該館提供的279種全文掃描影像進行IIIF轉(zhuǎn)換,在上海圖書館的中文古籍聯(lián)合目錄及循證平臺上發(fā)布了單獨的柏克萊加州大學(xué)東亞圖書館古籍目錄站點(https://gj.library.sh.cn/org/bkl),為該館讀者提供獨立的善本書志目錄全文檢索和部分全文掃描影像的IIIF服務(wù)。柏克萊加州大學(xué)東亞圖書館可以自行對站點的主頁進行個性化設(shè)置和資源維護。同時,根據(jù)柏克萊加州大學(xué)東亞圖書館的要求:善本書志的內(nèi)容無條件地公開訪問,但數(shù)字化全文掃描影像則只供雙方用戶在局域網(wǎng)訪問。針對此需求,平臺采用IP控制和用戶權(quán)限控制的方式,支持雙方的用戶通過統(tǒng)一用戶登錄后,在IP控制的范圍內(nèi),訪問“中文古籍聯(lián)合目錄及循證平臺”上的所有向登錄用戶開放的內(nèi)容和功能,而除數(shù)字化全文掃描影像外的全部內(nèi)容,不登錄也可以訪問。

      這種模式適用于收藏機構(gòu)有一定的信息化和開發(fā)能力,但希望托管機構(gòu)提供更好的服務(wù)作為已有服務(wù)的補充。針對收藏機構(gòu)在數(shù)字化全文掃描影像服務(wù)策略上的不同需求,托管機構(gòu)需提供靈活的服務(wù)方式。如上海圖書館中文古籍聯(lián)合目錄及循證平臺就支持對數(shù)字化全文掃描圖像的訪問權(quán)限進行靈活的控制,如可配置的IP控制、用戶角色權(quán)限控制、針對某種古籍單獨的權(quán)限控制等。

      3.3 ? ?聯(lián)合編目模式

      2018年,上海圖書館主持的國家哲學(xué)社會科學(xué)基金重大課題“ 編纂《1949年以來中國家譜總目》(18ZDA329)”立項。該課題的創(chuàng)新點之一是,充分利用互聯(lián)網(wǎng)+分布式工作的思維和上海圖書館數(shù)字人文項目建設(shè)已有的成果,在中國家譜知識服務(wù)平臺已有的新家譜目錄數(shù)據(jù)基礎(chǔ)上,由上海圖書館研發(fā)家譜聯(lián)合編目系統(tǒng),支持參與新家譜總目編纂的各家機構(gòu)基于一致的著錄規(guī)范,在同一系統(tǒng)在線協(xié)同聯(lián)合編目,編目數(shù)據(jù)實時與中國家譜知識服務(wù)平臺同步,一邊協(xié)同編目,一邊就能向各個收藏機構(gòu)和廣大用戶提供服務(wù)。新家譜目錄編目完成后,由系統(tǒng)按照書本式目錄的格式生成《1949年以來中國家譜總目》草稿。

      家譜聯(lián)合編目系統(tǒng)(http://jplb.library.sh.cn)于2020年3月研發(fā)完成開始投入使用,截至2021年2月,已有56家機構(gòu)參與聯(lián)合編目,已完成1800余種家譜的著錄。系統(tǒng)支持不同的機構(gòu)遵循一致的著錄規(guī)范進行編目。在著錄界面提供詳細的著錄范例,并對字段內(nèi)容,字段格式、字段長度按照著錄規(guī)范進行自動數(shù)據(jù)校驗。系統(tǒng)支持著錄查重,著錄人員在著錄之前需先查重,如查到手頭待著錄的家譜已有其它機構(gòu)著錄過,則只需添加本機構(gòu)館藏信息如索書號、冊數(shù)、是全本還是殘本等說明。一方面減少了著錄人員的工作量,另一方面提升了家譜目錄數(shù)據(jù)的質(zhì)量,有利于系統(tǒng)按作品-實例-單件(復(fù)本)這樣的結(jié)構(gòu)生成書本式目錄,減輕了總目編纂人員的工作負擔(dān)。系統(tǒng)支持流程控制和質(zhì)量控制。編目工作的整個生命周期分為草稿,待初審,待定審三種狀態(tài)。著錄人員在著錄過程中,可以提交,也可以暫存為草稿。提交后,著錄工作單發(fā)送到機構(gòu)專家初審,機構(gòu)專家負責(zé)本機構(gòu)著錄工作的質(zhì)量控制,確認無誤后,提交到編委會專家。編委會專家對各個機構(gòu)的著錄結(jié)果以出版的要求進行第二次質(zhì)量控制,對有問題的著錄工作單進行修改,確認完成定審操作。定審后,數(shù)據(jù)就會實時同步到家譜知識服務(wù)平臺提供服務(wù)。除了單條目錄著錄外,系統(tǒng)也支持批量查重、批量數(shù)據(jù)導(dǎo)入、批量數(shù)據(jù)導(dǎo)出功能。

      “聯(lián)合編目模式”適用于歷史文獻資源聯(lián)合目錄的共建共享,其優(yōu)點在于數(shù)據(jù)加工規(guī)范和格式的一致性,和在線協(xié)同工作方式的高效性,可以極大地避免重復(fù)建設(shè),提高工作效率。但系統(tǒng)的研發(fā)維護成本較高、對系統(tǒng)穩(wěn)定性和用戶體驗要求較高。

      3.4 ? ?數(shù)據(jù)中心模式

      “數(shù)據(jù)中心模式”是從多源異構(gòu)數(shù)據(jù)中采集數(shù)據(jù),在云端建設(shè)統(tǒng)一的數(shù)據(jù)中心中,記錄數(shù)據(jù)來源,反過來再根據(jù)其來源鏈接處于不同網(wǎng)域中的資源,關(guān)聯(lián)開放數(shù)據(jù)云(Linked Open Data Cloud)即是一種典型的數(shù)據(jù)中心模式。

      上海圖書館在數(shù)字人文的項目建設(shè)中,將人名、地名、時間、事件數(shù)據(jù)從不同的資源中抽取出來,分別建設(shè)了人名規(guī)范庫,地理名詞表,歷史紀(jì)年表,歷史文化事件知識庫,作為鏈接不同資源的數(shù)據(jù)中心。其中人名規(guī)范庫建設(shè)的初衷是提供互聯(lián)網(wǎng)環(huán)境下人名規(guī)范控制,后來逐步成為多源異構(gòu)資源的數(shù)據(jù)鏈接中心?,F(xiàn)已收錄人物共133萬余人,來自上海圖書館的中國家譜知識服務(wù)平臺、中文古籍聯(lián)合目錄及循證平臺、手稿檔案知識庫、上海年華系列專題庫、革命(紅色)文獻服務(wù)平臺,融合了國家圖書館人名規(guī)范檔、哈佛大學(xué)中國歷代人物傳記資料庫(CBDB)、各種人名大辭典的數(shù)據(jù),另有浦東區(qū)圖書館、華東師范大學(xué)圖書館、韜奮紀(jì)念館等機構(gòu)也提供了部分人物數(shù)據(jù)。

      人名規(guī)范庫作為數(shù)據(jù)中心體現(xiàn)在兩個方面,一是開放數(shù)據(jù)鏈接,通過一個人物鏈接到不同機構(gòu)不同網(wǎng)域中的資源,包括文獻資源、相關(guān)人物、故居等,以“馮契”的人物信息頁面為例,打開頁面,可以看出其小傳數(shù)據(jù)來自《中國近現(xiàn)代人物名號大辭典》、國家圖書館人名規(guī)范檔和華東師范大學(xué)名師庫,并鏈接到上海圖書館的各種館藏資源,以及其社會網(wǎng)絡(luò)關(guān)系中的人物(見圖2);二是開放數(shù)據(jù)服務(wù),人名規(guī)范庫作為上海圖書館歷史人文數(shù)據(jù)基礎(chǔ)設(shè)施的一部分,提供API、Sparql Endpoint、內(nèi)容協(xié)商等方式將人物信息封裝成數(shù)據(jù)消費接口,供其他機構(gòu)或個人通過程序調(diào)用,按需獲取數(shù)據(jù),并用于自己的應(yīng)用環(huán)境中。

      3.5 ? ?開放鏈接模式

      開放鏈接模式是指資源收藏機構(gòu)與資源托管機構(gòu)在元數(shù)據(jù)層面進行資源的共建共享,資源托管機構(gòu)負責(zé)對元數(shù)據(jù)進行加工和平臺功能開發(fā),資源收藏機構(gòu)自行進行資源掃描全文部分的開發(fā)并以開放鏈接的方式提供服務(wù)。

      如哈佛大學(xué)哈佛燕京圖書館與上海圖書館的古籍項目合作就是采用開放鏈接的模式。哈佛燕京圖書館藏中文善本古籍特藏,一直以質(zhì)量之高、數(shù)量之大著稱于世,為方便海內(nèi)外學(xué)者便捷地利用這些資料進行研究,哈佛大學(xué)燕京圖書館在特藏文獻資源的整理和服務(wù)方面也一直走在新技術(shù)應(yīng)用的前沿,有自己古籍館藏資源服務(wù)站點,采用IIIF公開發(fā)布了數(shù)字化全文掃描影像,提供在線閱覽、標(biāo)注和下載服務(wù),古籍文獻有獨立的URL(http://nrs.harvard.edu/urn-3:FHCL:3622194),可全網(wǎng)域訪問和定位。故與上海圖書館合作時,哈佛燕京圖書館將中文善本元數(shù)據(jù)記錄共享給上海圖書館,上海圖書館技術(shù)團隊對其進行了進一步地數(shù)據(jù)清洗和知識提取,提取元數(shù)據(jù)中的類別、作品、版本、責(zé)任者、索書號、IIIF全文瀏覽頁面鏈接等信息,按照上圖古籍本體的知識結(jié)構(gòu)進行重組和RDF格式轉(zhuǎn)換,在上圖古籍聯(lián)合目錄及循證平臺上發(fā)布了單獨的哈佛燕京圖書館古籍目錄站點(https://gj.library.sh.cn/org/harvard),并在每種古籍的元數(shù)據(jù)詳情頁面加入哈佛燕京圖書館古籍的IIIF服務(wù)URL,鏈接到其已有的IIIF全文瀏覽頁面。通過這樣的合作,哈佛大學(xué)的用戶也可共享“中文古籍聯(lián)合目錄及循證平臺”上的所有開放內(nèi)容和功能。

      若收藏機構(gòu)已對館藏資源進行了一定程度的數(shù)字化或信息化開發(fā),無需重復(fù)建設(shè),且有提升影響力或提高資源利用率的意愿,可采用開放鏈接的合作模式,在元數(shù)據(jù)層面達成機構(gòu)間資源的融合與共享,以支持資源的統(tǒng)一檢索。這種合作模式的前提是收藏機構(gòu)在資源的信息化開發(fā)上有一定的成果并為每種資源提供開放訪問的URL和相應(yīng)的服務(wù)界面。

      3.6 ? ?眾包模式

      眾包模式是指公共文化機構(gòu)采用“眾包”的理念和用戶貢獻內(nèi)容(UGC)的技術(shù),充分吸納公眾的認知盈余來實現(xiàn)共建共享。機構(gòu)將數(shù)字資源及建設(shè)需求發(fā)布至公共平臺,公眾根據(jù)要求自發(fā)地進行如抄錄、校對、標(biāo)引、捐贈等工作,用戶貢獻的內(nèi)容由專家審核收集整理并發(fā)布至服務(wù)平臺,取之于公眾,用之于公眾。上海圖書館的“歷史文獻眾包平臺”“中國家譜知識服務(wù)平臺”即是采用眾包模式進行資源共建共享的例子。

      歷史文獻眾包平臺構(gòu)建了一個既面向大眾又面向機構(gòu)的文獻資源共建共享平臺,邀請公共文化機構(gòu)發(fā)布文獻圖像資源及元數(shù)據(jù)、吸引大眾參與文獻全文抄錄及元數(shù)據(jù)深度標(biāo)引,促進大眾與文化機構(gòu)共同加工建設(shè)數(shù)字資源、分享再利用建設(shè)成果。平臺支持為不同的資源自定義元數(shù)據(jù)元素集,支持不同機構(gòu)上傳不同類型歷史文獻圖像資源及元數(shù)據(jù)信息,以任務(wù)的形式打包發(fā)布至平臺。大眾在平臺的任務(wù)廣場頁面(見圖3)選擇感興趣的文獻資源進行全文抄錄、元數(shù)據(jù)字段標(biāo)引等數(shù)據(jù)加工。對于用戶貢獻內(nèi)容的質(zhì)量控制,平臺采用專家審核制度進行人工審核修訂并將修訂結(jié)果反饋貢獻者,所有通過審核的數(shù)據(jù),都將作為資源發(fā)布機構(gòu)用于建設(shè)數(shù)字人文項目的數(shù)據(jù)基礎(chǔ),實現(xiàn)細粒度的、基于文獻內(nèi)容的服務(wù)。

      借助該平臺,上海圖書館與南京大學(xué)合作舉辦了“文化遺產(chǎn)數(shù)字化”競賽,將上海圖書館館藏“盛宣懷檔案”文獻發(fā)布至任務(wù)廣場,請南京大學(xué)組織高校學(xué)生參與文本抄錄。競賽吸引了南京大學(xué)、復(fù)旦大學(xué)、南開大學(xué)等多家高校的63位學(xué)生參與,最終完成256件文獻的文本抄錄工作。截止2020年年底,平臺發(fā)布手稿、信函、章程、諭旨等多種類型文獻資源627件,參與建設(shè)用戶200余人,完成全文抄錄422件,所有完成抄錄文獻都可在眾包平臺中閱覽全文。

      “中國家譜知識服務(wù)平臺”的眾包模式資源共建共享體現(xiàn)在上傳家譜、在線識譜、在線修譜這三個功能,邀請大眾與機構(gòu)一起豐富家譜資源、并對家譜數(shù)據(jù)進行深加工。

      上傳家譜(在線捐贈)區(qū)別于郵件寄送、到館捐贈等傳統(tǒng)家譜捐獻路徑,為大眾提供了便捷、規(guī)范的家譜捐獻窗口,同時方便了捐獻者和受贈機構(gòu)。用戶只需根據(jù)網(wǎng)站規(guī)定格式上傳家譜影像圖片并提供譜籍地、責(zé)任者、裝訂等家譜信息即可捐獻家譜,為便于用戶理解,平臺為每個填寫字段都提供了說明文字及參考樣例,上傳家譜影像圖片也支持多種圖像格式。上傳后的家譜將交由家譜整理研究專家審核,通過審核的家譜即可設(shè)為館藏,數(shù)據(jù)進入知識服務(wù)平臺對外提供服務(wù)。

      在線修譜功能服務(wù)于有家譜修纂需求的用戶,提供規(guī)范化的家譜內(nèi)容輸入和世系表編輯,支持多人協(xié)作,并能按照不同的家譜體例如歐式、蘇式、寶塔式、牒記式,由系統(tǒng)自動生成出版格式。

      在線識譜是集眾人之力對平臺開放的數(shù)字化家譜全文中的世系表進行文本化、結(jié)構(gòu)化,以便于生成可視化的家族樹或為研究者提供量化分析的結(jié)構(gòu)化數(shù)據(jù)。世系表是家譜最重要的內(nèi)容之一,記錄歷代家族成員信息、成員關(guān)系、大事記等,蘊藏了大量的信息,可為家譜數(shù)字人文分析提供大量數(shù)據(jù)依據(jù)。但由于譜系圖結(jié)構(gòu)復(fù)雜,傳統(tǒng)的文本識別方式僅能識別出文字但無法識別出結(jié)構(gòu)化的個人信息和人與人之間的關(guān)系,不能滿足其數(shù)據(jù)化需求,在線識譜功能支持廣大用戶協(xié)同識別世系表,獲得結(jié)構(gòu)化數(shù)據(jù),加速家世系表數(shù)據(jù)化進程。

      4 ? 結(jié)語

      數(shù)字人文的勃興為GLAM領(lǐng)域的資源共建共享提出了新的需求,數(shù)字人文注重的不僅是資源的數(shù)字化,更是資源內(nèi)容的數(shù)據(jù)化和數(shù)據(jù)的大規(guī)模、全量級、細粒度、長時間和大空間的覆蓋,以及在此基礎(chǔ)上建設(shè)以資源、數(shù)據(jù)、知識為核心、以可持續(xù)性和開放性為保障、以滿足多樣化個性化的用戶需求為導(dǎo)向的數(shù)據(jù)基礎(chǔ)設(shè)施。過去那種自上而下的依賴政策和管理機制來實現(xiàn)不同機構(gòu)之間資源共建共享的方式已不能滿足需求。本文試圖通過上海圖書館的數(shù)字人文項目建設(shè)的實踐,探討一種利用現(xiàn)代信息技術(shù)自下而上地實現(xiàn)不同機構(gòu)甚至是團體和個人之間的歷史文獻資源共建共享的路徑??偨Y(jié)提煉出的六種歷史文獻資源共建共享的模式,未必能解決資源共建共享中的所有問題,但有望能為業(yè)界提供另一種角度、另一種思路和參考案例。

      參考文獻:

      [1] ?高波,劉茲恒,于麗鳳.網(wǎng)絡(luò)環(huán)境下我國圖書館信息資源共建共享現(xiàn)狀調(diào)查報告[J].中國圖書館學(xué)報,2001,27(4):48-52.

      [2] ?高波.文獻信息資源共建共享模式新論[J].中國圖書館學(xué)報,2002(6):25-28.

      [3] ?袁海波,孟連生.網(wǎng)絡(luò)環(huán)境下信息資源共建共享的實踐——兼述國家科技圖書文獻中心的建設(shè)與發(fā)展[J].情報學(xué)報,2002,21(1):57-62.

      [4] ?肖希明,完顏鄧鄧.以公共數(shù)字文化資源整合促進基本公共文化服務(wù)均等化[J].圖書館,2015(11):22-25,31.

      [5] ?肖希明,盧世晴.公共數(shù)字文化資源整合政策體系探討[J].圖書館,2015(9):1-5.

      [6] ?韋楠華,吳高.公共數(shù)字文化資源共建共享現(xiàn)狀、障礙及對策研究[J].圖書館建設(shè),2018(9):18-26.

      [7] ?吳高.地方公共數(shù)字文化特色資源建設(shè)現(xiàn)狀調(diào)查與思考——以全國文化信息資源共享工程省級分中心特色數(shù)字資源建設(shè)為例[J].圖書館建設(shè),2016(1):39-46.

      [8] ?張福俊,高雪,周秀霞.國內(nèi)外數(shù)字資源發(fā)現(xiàn)平臺比較研究——以Trove,DPLA,Europeana,WDL和文津搜索為例[J].國家圖書館學(xué)刊,2018,27(1):86-96.

      [9] ?Share your data[EB/OL].[2021-02-04].https://pro.europeana.eu/share-your-data/.

      [10] ?Rapport dactivité 2019[EB/OL].[2021-02-04].https://www.bnf.fr/fr/ra2019-gallica-et-la-politique-de-diffusion-numerique-des-collections#bnf-l-offre-documentaire-et-les-fonctionnalit-s.

      [11] ?Trove[EB/OL].[2021-02-04].https://trove.nla.gov.au/.

      [12] ?李金芮,楊蕾.國外公共數(shù)字文化資源整合項目服務(wù)方式調(diào)查分析[J].圖書與情報,2015(1):22-26.

      [13] ?Our APIs[EB/OL].[2021-02-04].https://pro.europeana.eu/page/apis.

      作者簡介:夏翠娟,女,上海圖書館研究館員,研究方向:元數(shù)據(jù)、知識本體、知識組織、關(guān)聯(lián)數(shù)據(jù)、數(shù)字人文、文化記憶;賀晨芝,女,上海圖書館工程師,研究方向:數(shù)字人文;劉倩倩,女,上海圖書館館員,研究方向:數(shù)字人文;朱武信,男,上海圖書館工程師,研究方向:數(shù)字人文。

      本文系國家哲學(xué)社會科學(xué)基金項目“支撐城市記憶項目的‘?dāng)?shù)據(jù)基礎(chǔ)設(shè)施理論建構(gòu)與實踐探索”(項目編號:19BTQ007 )研究成果之一。

      收稿日期:2021-02-18;責(zé)任編輯:柴若熔

      猜你喜歡
      數(shù)字人文模式研究
      數(shù)字人文時代公共圖書館經(jīng)典閱讀推廣研究
      數(shù)字人文目標(biāo)下圖書館信息服務(wù)模式研究
      數(shù)字學(xué)術(shù)與公眾科學(xué):數(shù)字圖書館新生態(tài)
      跨界與融合:全球視野下的數(shù)字人文
      跨界與融合:全球視野下的數(shù)字人文
      大規(guī)模古籍文本在中國史定量研究中的應(yīng)用探索
      多元文化教育背景下的國際學(xué)校主題班會模式研究
      服裝設(shè)計智能化趨向及模式研究
      基于精細化理念的沈陽市鄉(xiāng)村規(guī)劃編制與建設(shè)管理模式研究
      高校內(nèi)部控制的定位與模式研究
      文安县| 锡林郭勒盟| 张家界市| 肃南| 蓝山县| 山丹县| 蓝田县| 清徐县| 泽普县| 天全县| 南丹县| 鄂尔多斯市| 永泰县| 沙田区| 兴城市| 渑池县| 奎屯市| 山阴县| 苗栗市| 东丰县| 龙岩市| 长顺县| 建湖县| 崇仁县| 仙居县| 五华县| 临海市| 邻水| 墨竹工卡县| 德保县| 鸡泽县| 荣成市| 温宿县| 青海省| 凤冈县| 永善县| 余江县| 文成县| 寿阳县| 永兴县| 阜新市|