付躍安
經(jīng)過(guò)多年發(fā)展,包括商業(yè)數(shù)據(jù)庫(kù)與非營(yíng)利文化數(shù)據(jù)庫(kù)在內(nèi)的數(shù)字資源庫(kù)為數(shù)字圖書(shū)館提供了豐富的內(nèi)容資源,特別是近年來(lái)隨著數(shù)字人文受到重視,一大批基于文獻(xiàn)遺產(chǎn)數(shù)字化項(xiàng)目建立的數(shù)字圖書(shū)館相繼問(wèn)世。但不同機(jī)構(gòu)(甚至同一機(jī)構(gòu)內(nèi))在數(shù)字資源的共享上存在障礙,這源于不同資源庫(kù)和平臺(tái)使用了獨(dú)立的技術(shù)框架、資源格式和應(yīng)用程序,導(dǎo)致不同資源庫(kù)在資源存儲(chǔ)、管理與傳播上存在差異,其對(duì)用戶(hù)的影響主要體現(xiàn)在用戶(hù)無(wú)法一站發(fā)現(xiàn)、使用和管理資源,必須往返于不同平臺(tái)并熟悉多個(gè)平臺(tái)功能。為解決數(shù)字資源“孤島”問(wèn)題,學(xué)界引入資源集成概念,并先后在理論和實(shí)踐上進(jìn)行了探索。根據(jù)實(shí)現(xiàn)方式,目前出現(xiàn)了3種集成:第一種是將不同來(lái)源的對(duì)象資源集成到一起,如世界數(shù)字圖書(shū)館,但由于實(shí)施難度大,成功的案例不多,業(yè)界更多采用另外2 種集成方式,即基于元數(shù)據(jù)的集成和功能集成,前者采用元數(shù)據(jù)收割或提交等方式建設(shè)統(tǒng)一的數(shù)據(jù)服務(wù)平臺(tái),如美國(guó)公共數(shù)字圖書(shū)館、歐洲Europeana,后者提供統(tǒng)一的導(dǎo)航和檢索平臺(tái)(如跨庫(kù)檢索),由系統(tǒng)調(diào)取各庫(kù)信息并在同一個(gè)平臺(tái)展示,各圖書(shū)館使用的發(fā)現(xiàn)系統(tǒng)基本上采用的是后一種。第二種與第三種集成雖然實(shí)施較多,但共同問(wèn)題是主要面向發(fā)現(xiàn)服務(wù),能協(xié)助讀者在一個(gè)平臺(tái)中查找資源,但由于不保存對(duì)象資源,讀者在使用資源時(shí)仍然受“孤島”問(wèn)題困擾——讀者需要前往各個(gè)平臺(tái)利用資源,并受制于平臺(tái)瀏覽器功能的局限;讀者只能采用保存鏈接或?qū)①Y源下載到本地等“笨拙”的方式對(duì)資源進(jìn)行管理,特別是當(dāng)平臺(tái)不允許讀者下載或?qū)ο螺d設(shè)置限制時(shí),讀者在保存資源時(shí)會(huì)面臨很大障礙。為此,需要將資源集成向“縱深”推進(jìn),不僅能幫助讀者一站發(fā)現(xiàn)資源,也能實(shí)現(xiàn)讀者對(duì)資源的統(tǒng)一使用和管理。
2018年12 月,筆者作為交流學(xué)者應(yīng)邀前往大英圖書(shū)館(The British Library)訪問(wèn),期間了解到一種新的資源交互協(xié)議——國(guó)際圖像互操作框架(International Image Interoperability Framework,IIIF)正在被全球越來(lái)越多的圖書(shū)館、博物館、檔案館、文化遺產(chǎn)組織、軟件公司等機(jī)構(gòu)采用,該框架能有效協(xié)助用戶(hù)對(duì)資源進(jìn)行一站使用和多來(lái)源集成,支持用戶(hù)與資源的多種互動(dòng),同時(shí)對(duì)基于元數(shù)據(jù)收割的發(fā)現(xiàn)服務(wù)也能起到改進(jìn)作用,值得國(guó)內(nèi)圖書(shū)館界認(rèn)真對(duì)待。
IIIF 于 2011 年被提出,2015 年 6 月大英圖書(shū)館、新西蘭國(guó)家圖書(shū)館、歐洲Europeana、牛津大學(xué)圖書(shū)館、哈佛大學(xué)等29個(gè)機(jī)構(gòu)宣布成立該框架。IIIF致力于建設(shè)一個(gè)全球圖像互操作框架,借助關(guān)聯(lián)數(shù)據(jù)、JSON數(shù)據(jù)交換、W3C網(wǎng)絡(luò)協(xié)議等技術(shù)和標(biāo)準(zhǔn),在不同系統(tǒng)和平臺(tái)之間架起溝通的橋梁,使資源被方便地共享、分析和注釋?zhuān)瑸閷W(xué)者和研究人員提供對(duì)資源的最優(yōu)訪問(wèn)[1],以解決文化資源在被數(shù)字化后產(chǎn)生的難于被發(fā)現(xiàn)、被再利用、引用、交換和比較分析等的挑戰(zhàn)。盡管IIIF面向的是“圖像”資源,但它并不是一個(gè)單純的圖像技術(shù),而是對(duì)以圖像格式存在的數(shù)字資源的傳播和利用提出一整套標(biāo)準(zhǔn)框架,由于當(dāng)前多數(shù)文獻(xiàn)遺產(chǎn)資源平臺(tái)都是采用掃描或拍照建庫(kù),圖像是主要資源形態(tài),因此IIIF具有廣泛的適用性。
IIIF定義了若干個(gè)系統(tǒng)間用于交換數(shù)據(jù)的接口(API),它們能用于描述和傳遞圖像及關(guān)于圖像的結(jié)構(gòu)化數(shù)據(jù)。IIIF 目前共設(shè)置4 個(gè)API:圖像API、展示API、授權(quán)API與檢索API,前兩個(gè)為核心API,后兩個(gè)為擴(kuò)展API。圖像API支持參數(shù)化圖像URI構(gòu)造,根據(jù)標(biāo)準(zhǔn)化HTTP或HTTPS請(qǐng)求,返回一幅圖像或圖像的基礎(chǔ)技術(shù)信息,其中返回圖像的URI 結(jié)構(gòu)為:{scheme}://{server}{/prefix}/ {identifier}/ {region}/ {size}/ {rotation}/{quality}.{format},前4項(xiàng)為共享要素,描述了同一資源庫(kù)中所有圖像的共有屬性,后5項(xiàng)為個(gè)性要素,從區(qū)域、大小、角度、質(zhì)量、格式等方面由客戶(hù)端或用戶(hù)對(duì)圖像進(jìn)行設(shè)置。展示API基于Shared Canvas 數(shù)據(jù)模型,返回JSON-LD 文檔,提供了圖像或圖像集的描述信息(如元數(shù)據(jù))、結(jié)構(gòu)、順序、布局及關(guān)聯(lián)內(nèi)容(如文本數(shù)據(jù)、標(biāo)注數(shù)據(jù)等)等并予以組織,以確保圖像在基于網(wǎng)絡(luò)的瀏覽環(huán)境中被正確顯示、導(dǎo)航和操作。展示API還支持合作性標(biāo)注、修正和語(yǔ)義抽取等,并可將不同的標(biāo)注工具、描述工具、地理信息工具等配合使用[2]。檢索API提供已知資源內(nèi)的搜索功能(不用于查找資源和提供發(fā)現(xiàn)服務(wù)),例如若圖像資源被添加了文本數(shù)據(jù),檢索API可提供對(duì)文本的檢索。授權(quán)API主要是用來(lái)對(duì)版權(quán)資源的使用權(quán)限進(jìn)行設(shè)置,但不影響IIIF功能的發(fā)揮。
圖1 IIIF展示API數(shù)據(jù)結(jié)構(gòu)[3]
在IIIF資源傳播中,實(shí)現(xiàn)關(guān)鍵是請(qǐng)求方系統(tǒng)向資源方系統(tǒng)提交所請(qǐng)求資源的信息,這一信息是一種類(lèi)似貨物清單的資源列表(Manifest,簡(jiǎn)稱(chēng)“資源表”),采用JSON-LD文件,以關(guān)聯(lián)數(shù)據(jù)集成多個(gè)來(lái)源的信息,如元數(shù)據(jù)、資源結(jié)構(gòu)和布局及順序、關(guān)聯(lián)內(nèi)容等,其中包括指向圖像的URI。一個(gè)資源表對(duì)應(yīng)的是一種資源,既可以是獨(dú)立的圖像,如一張照片、一幅地圖,也可以是一個(gè)圖像集,如一本數(shù)字化古籍,有些機(jī)構(gòu)甚至將整個(gè)文件夾作為資源表的對(duì)應(yīng)單元[4]。對(duì)普通用戶(hù)來(lái)講,該過(guò)程可以簡(jiǎn)化為“拖-放”的過(guò)程,即在資源平臺(tái)找到需要的資源后,將資源旁邊的IIIF標(biāo)志拖到圖像瀏覽器即可。一般情況下,資源方大都提供了資源表的JSON文件,用戶(hù)點(diǎn)擊IIIF按鈕即可查看和下載,如果用戶(hù)對(duì)JSON 文件比較熟悉,也可以對(duì)資源表進(jìn)行修改,以生成符合需要的資源表。
自推出以來(lái),IIIF就以簡(jiǎn)單有效而受到越來(lái)越多機(jī)構(gòu)青睞,目前已形成一個(gè)全球使用網(wǎng)絡(luò)。除上述單位外,其他參與機(jī)構(gòu)還包括大英博物館、美國(guó)公共數(shù)字圖書(shū)館、劍橋大學(xué)、斯坦福大學(xué)、密歇根大學(xué)、耶魯大學(xué)、哈佛大學(xué)、哥倫比亞大學(xué)、多倫多大學(xué)、東京大學(xué)等,以及一些國(guó)家圖書(shū)館或博物館(如美國(guó)國(guó)會(huì)圖書(shū)館、澳大利亞國(guó)家圖書(shū)館),OCLC 數(shù)字資產(chǎn)管理平臺(tái)(CONTENTdm)亦宣布支持IIIF。我國(guó)廈門(mén)大學(xué)圖書(shū)館于2016年安裝了Loris2圖像服務(wù)器,搭建IIIF 影像接口,并在前端配置IIIF 資源瀏覽器OpenSeadragon[5]。這些機(jī)構(gòu)不僅是IIIF 的使用者,也是IIIF的研究者,為完善IIIF做出了貢獻(xiàn)。例如,IIIF資源瀏覽器Mirador最早就是由斯坦福大學(xué)開(kāi)發(fā),由于該瀏覽器屬于開(kāi)源軟件,哈佛大學(xué)又進(jìn)行了改進(jìn);英國(guó)牛津大學(xué)Bodleian圖書(shū)館甚至開(kāi)發(fā)了一款I(lǐng)IIF 資源表編輯器,使不熟悉JSON文件的學(xué)者也能方便地對(duì)資源表進(jìn)行編輯、修改。為方便機(jī)構(gòu)和學(xué)者圍繞IIIF進(jìn)行延伸開(kāi)發(fā),IIIF在軟件開(kāi)發(fā)平臺(tái)github.com中設(shè)置IIIF專(zhuān)欄,用于發(fā)布各種開(kāi)發(fā)成果。
IIIF并不排斥各個(gè)機(jī)構(gòu)對(duì)數(shù)字圖書(shū)館技術(shù)和標(biāo)準(zhǔn)的選擇,而是在現(xiàn)有技術(shù)和標(biāo)準(zhǔn)之上,另外搭建一條內(nèi)容描述和傳播通道,使采用不同服務(wù)器、使用不同工具和標(biāo)準(zhǔn)建設(shè)的圖像資源在此通道上實(shí)現(xiàn)輸入、輸出的標(biāo)準(zhǔn)化[6]。例如,在上述圖像API 的URI 結(jié)構(gòu)中,其中一項(xiàng)為“格式”(Format),IIIF 對(duì)圖像格式并無(wú)限定,資源平臺(tái)可以自行選擇資源格式,如JPEG、TIFF、PNG、PDF等,上述格式的圖像均可以在IIIF環(huán)境下被調(diào)取和顯示。再如,IIIF官網(wǎng)特別強(qiáng)調(diào),IIIF并不提供某種所有系統(tǒng)都必須遵守的信息標(biāo)準(zhǔn)(如元數(shù)據(jù)標(biāo)準(zhǔn)),任何系統(tǒng)采用的任何元數(shù)據(jù)都可以被正確傳遞和顯示,如下文劍橋數(shù)字圖書(shū)館藏牛頓手稿《基礎(chǔ)數(shù)學(xué)》的資源表(元數(shù)據(jù)節(jié)選)JSON 文件[7]所示,每一項(xiàng)元素至少包括兩項(xiàng)內(nèi)容:標(biāo)簽名與值,字段名本身被作為標(biāo)簽名而獲得傳遞。系統(tǒng)環(huán)境的獨(dú)立性避免了不同機(jī)構(gòu)為實(shí)現(xiàn)資源共享和技術(shù)兼容而對(duì)系統(tǒng)進(jìn)行的標(biāo)準(zhǔn)化改造,降低了資源集成的障礙。
{"viewingDirection":"left-to-right",
"metadata":[
{"label":"Origin Place",
"value":"England"},
{"label":"Date of Creation",
"value":"c.1669-1700"},
{"label":"Title",
"value":"Elementary Mathematics"},
……
IIIF屬于資源傳遞標(biāo)準(zhǔn),與其有著直接聯(lián)系的是兩類(lèi)應(yīng)用:圖像服務(wù)器與圖像瀏覽器,對(duì)此IIIF也沒(méi)有專(zhuān)門(mén)要求,而是采取開(kāi)放政策,允許不同機(jī)構(gòu)自行開(kāi)發(fā)或選擇應(yīng)用。根據(jù)IIIF 官網(wǎng),目前已有多款支持IIIF的圖像服務(wù)器與圖像瀏覽器(詳見(jiàn)表1[8])被開(kāi)發(fā)出來(lái),其中很多服務(wù)器和瀏覽器是開(kāi)源軟件,這些服務(wù)器與瀏覽器中有些是專(zhuān)門(mén)為IIIF開(kāi)發(fā)的,有些是對(duì)已有服務(wù)器和瀏覽器的改進(jìn)。在基于圖像格式的資源建設(shè)和服務(wù)中,圖像瀏覽器的安裝是不可缺少的,因?yàn)闆](méi)有圖像瀏覽器,讀者就無(wú)法查看和操作資源,但圖像服務(wù)器的安裝并非必需,因?yàn)閮H借助網(wǎng)絡(luò)服務(wù)器系統(tǒng)也能提供圖像服務(wù),不過(guò)安裝圖像服務(wù)器卻能帶來(lái)顯著不同。在數(shù)字資源建設(shè)和服務(wù)中,對(duì)于圖像資源往往要進(jìn)行多次處理,按照使用場(chǎng)景、使用目的等生成諸如拇指圖、概覽圖、高清圖等衍生圖像。如果不安裝圖像服務(wù)器,這些衍生圖像就需要分次生成并被分別保管,給系統(tǒng)運(yùn)行、存儲(chǔ)和管理造成壓力。但如果安裝了圖像服務(wù)器,上述處理過(guò)程就可以自動(dòng)完成,也不必分別保存,實(shí)現(xiàn)“一次發(fā)布,多次使用”。正是考慮到圖像服務(wù)器的這一特點(diǎn),IIIF的圖像URI提供了參數(shù)設(shè)置功能,IIIF瀏覽器能根據(jù)用戶(hù)的操作形成關(guān)于區(qū)域、大小、角度、質(zhì)量及格式等圖像參數(shù),用戶(hù)也可以手動(dòng)對(duì)這些參數(shù)進(jìn)行更改,IIIF 圖像服務(wù)器根據(jù)攜帶參數(shù)的URI 傳送圖像,而不是在全部圖像下載后用戶(hù)才能查看,從而提高了傳輸效率[9]。
表1 IIIF圖像瀏覽器與圖像服務(wù)器列表
按照傳統(tǒng)的數(shù)字圖書(shū)館建設(shè)和服務(wù),資源方一方面要對(duì)資源進(jìn)行保存和管理;另一方面也要搭建使用環(huán)境,資源保存和使用服務(wù)由同一機(jī)構(gòu)提供,但I(xiàn)IIF突破了這一模式,實(shí)現(xiàn)了保存和使用的分離,其過(guò)程如下:借助資源表,用戶(hù)所在平臺(tái)向資源方服務(wù)器發(fā)出請(qǐng)求,資源方服務(wù)器將被請(qǐng)求的圖像和信息以數(shù)據(jù)包的方式發(fā)送到用戶(hù)所在平臺(tái)并在用戶(hù)本地顯示和接受用戶(hù)操作,但資源卻不會(huì)在用戶(hù)本地備份,同時(shí)用戶(hù)對(duì)資源的各種操作如縮放、加標(biāo)簽和注釋等數(shù)據(jù)也不會(huì)被回傳給資源方服務(wù)器,由用戶(hù)所在平臺(tái)自行處理。這種保存與使用的分離對(duì)數(shù)字資源建設(shè)和服務(wù)具有多重意義:一是避免了在本地保存資源而引起版權(quán)風(fēng)險(xiǎn);二是減輕了用戶(hù)所在平臺(tái)管理資源的壓力;三是由于不存在頻繁的數(shù)據(jù)回傳,降低了網(wǎng)絡(luò)帶寬壓力,也減輕了資源方系統(tǒng)保存用戶(hù)數(shù)據(jù)的壓力。不過(guò),這一方式也有缺陷,就是用戶(hù)對(duì)資源的操作記錄容易丟失,目前IIIF平臺(tái)多數(shù)都不提供操作數(shù)據(jù)托管服務(wù),用戶(hù)只能借助個(gè)人電腦中的緩存獲取歷史操作記錄[10],一旦更換電腦或?yàn)g覽器,或者清理緩存,有關(guān)數(shù)據(jù)就會(huì)消失,這給用戶(hù)使用帶來(lái)不便。實(shí)現(xiàn)用戶(hù)操作數(shù)據(jù)的本地保存是IIIF研究團(tuán)隊(duì)下一步的攻關(guān)目標(biāo)。
IIIF技術(shù)使用戶(hù)一站使用資源成為可能。傳統(tǒng)情況下,用戶(hù)只能利用資源所在平臺(tái)的瀏覽器使用資源,如果用戶(hù)需要的資源來(lái)自多個(gè)平臺(tái),用戶(hù)就要往返于不同平臺(tái)并熟悉多個(gè)平臺(tái)功能。盡管元數(shù)據(jù)聚合平臺(tái)與跨庫(kù)檢索系統(tǒng)能方便用戶(hù)一站發(fā)現(xiàn)資源,但由于不能集成對(duì)象數(shù)據(jù),用戶(hù)仍然要前往資源所在平臺(tái)使用資源和查閱信息。由于采用標(biāo)準(zhǔn)的傳輸協(xié)議,借助IIIF技術(shù),用戶(hù)就可以突破資源所在平臺(tái)局限,從一個(gè)瀏覽器中查看和操作任何來(lái)源并且支持IIIF的資源。例如,大英圖書(shū)館的讀者可以利用大英圖書(shū)館安裝在平臺(tái)中的IIIF瀏覽器(Universal Viewer)查看和操作劍橋數(shù)字圖書(shū)館、斯坦福大學(xué)圖書(shū)館、哈佛大學(xué)圖書(shū)館等機(jī)構(gòu)的資源。用戶(hù)甚至可以自由選擇瀏覽器,而不影響對(duì)資源的使用。例如,大英圖書(shū)館的讀者可以使用劍橋數(shù)字圖書(shū)館的IIIF瀏覽器(Mirador)打開(kāi)斯坦福大學(xué)圖書(shū)館的資源。這一功能為用戶(hù)一站使用多個(gè)來(lái)源的資源提供了方便,也能使數(shù)字圖書(shū)館將資源開(kāi)放給專(zhuān)業(yè)瀏覽器,提高資源的使用價(jià)值。
為方便用戶(hù)一站使用資源,圖書(shū)館需要在平臺(tái)上安裝IIIF瀏覽器。借助該瀏覽器,讀者不僅可以查看本機(jī)構(gòu)資源,也可以查看其他機(jī)構(gòu)資源。圖書(shū)館可以將原有瀏覽器全部替換成IIIF瀏覽器,也可以在保留原有瀏覽器的情況下設(shè)置可選瀏覽器,這樣既滿(mǎn)足了讀者對(duì)IIIF瀏覽器的需要,也保留了本地平臺(tái)個(gè)性化的界面、標(biāo)志或品牌以及對(duì)使用的控制[11],如劍橋數(shù)字圖書(shū)館就在原資源查看界面旁設(shè)置了“在Mirador 中打開(kāi)”的按鈕,這體現(xiàn)了IIIF技術(shù)系統(tǒng)環(huán)境獨(dú)立性的優(yōu)勢(shì)。圖書(shū)館還可以在發(fā)現(xiàn)系統(tǒng)中嵌入IIIF瀏覽器,讀者檢索到資源后點(diǎn)擊打開(kāi)原圖,系統(tǒng)從資源所在庫(kù)調(diào)取資源并在IIIF瀏覽器中顯示,從而將一站發(fā)現(xiàn)和一站使用在同一個(gè)平臺(tái)完成,讀者不必前往資源所在平臺(tái)使用,使發(fā)現(xiàn)系統(tǒng)的使用體驗(yàn)得到改進(jìn)。
除瀏覽器外,數(shù)字圖書(shū)館還可以為用戶(hù)搭建多種IIIF資源應(yīng)用環(huán)境。例如,可以在博客或網(wǎng)絡(luò)文章中提供嵌入圖像或圖像區(qū)域的功能,或創(chuàng)建能集成多來(lái)源資源的虛擬展覽。為了給研究人員、學(xué)生的項(xiàng)目研究提供一個(gè)資源保存、管理、交流和成果展示的平臺(tái),波士頓東北大學(xué)圖書(shū)館建立了一個(gè)專(zhuān)門(mén)的系統(tǒng)(The Community Enhanced Repository for Engaged Scholarship,CERES),項(xiàng)目人員可在系統(tǒng)中創(chuàng)建自己的展覽、頁(yè)面、博客等,在涉及圖像資源時(shí),系統(tǒng)嵌入了能夠兼容IIIF 資源的瀏覽器,通過(guò)定制化的API請(qǐng)求命令調(diào)取項(xiàng)目組存儲(chǔ)在圖書(shū)館機(jī)構(gòu)庫(kù)中的資源或外部資源,并集成到所制作的展覽、頁(yè)面或博客中[12]。
IIIF自設(shè)計(jì)之初就希望為學(xué)者提供一個(gè)專(zhuān)業(yè)圖像查看和操作工具,如深度縮放和流暢平移,對(duì)尺寸、區(qū)域、方位、分辨率等的靈活修改,標(biāo)簽和注解添加,對(duì)資源的全文檢索(已建有文本數(shù)據(jù))等,各IIIF 圖像瀏覽器對(duì)此都給予了良好支持,并提供了特色功能。其中,Mirador以其獨(dú)特的功能受到學(xué)者青睞。Mirador 是基于JavaScript、專(zhuān)門(mén)針對(duì)IIIF 開(kāi)發(fā)的開(kāi)源瀏覽器,能提供多資源庫(kù)、可配置、可擴(kuò)展、便于整合的圖像瀏覽和注釋創(chuàng)建與圖像比較環(huán)境,提供的功能包括可用來(lái)比較多個(gè)圖像資源的多窗口環(huán)境、對(duì)內(nèi)容結(jié)構(gòu)和視覺(jué)的同步導(dǎo)航、遵從開(kāi)放注釋(Open Annotation)的注釋創(chuàng)建和可深度擴(kuò)展的圖像瀏覽、元數(shù)據(jù)展示、原文閱讀、書(shū)簽添加等。Mirador 最突出的功能是多窗口創(chuàng)建功能,即在同一個(gè)頁(yè)面,用戶(hù)可以建立多個(gè)子窗口,每個(gè)子窗口都可以獨(dú)立查看資源并對(duì)資源執(zhí)行Mirador所支持的操作,從而方便用戶(hù)對(duì)不同來(lái)源的資源進(jìn)行比較和分析,也可以對(duì)同一資源的不同部分同時(shí)進(jìn)行查看和比較、分析,甚至可以將被不同機(jī)構(gòu)收藏的手稿殘片拼接起來(lái)。Mirador還提供了多種注釋創(chuàng)建功能,如讀者可以框定某個(gè)區(qū)域并為該區(qū)域添加注釋?zhuān)商砑有畔㈩?lèi)型包括文本、鏈接、圖片、音視頻等。如果資源本身帶有文本數(shù)據(jù),Mirador還可以提供對(duì)文本的全文檢索,檢索結(jié)果以高亮方式同步顯示在資源上。
用戶(hù)需要的資源往往來(lái)自多個(gè)平臺(tái),支持IIIF 的平臺(tái)大多提供了資源的JSON 文件(資源表),用戶(hù)可以對(duì)這些JSON文件執(zhí)行保存、編輯和修改等操作,從而建立個(gè)人數(shù)字圖書(shū)館。用戶(hù)還可以對(duì)不同來(lái)源的JSON文件執(zhí)行合并、排序等操作,以建立個(gè)性化資源表,獲得流暢的使用體驗(yàn)。例如,對(duì)于年代久遠(yuǎn)的文獻(xiàn)遺產(chǎn),許多資源都分散收藏在不同機(jī)構(gòu),甚至一套書(shū)或一本書(shū)的不同部分也分藏于不同單位,如《永樂(lè)大典》就分散收藏在多個(gè)國(guó)家的多個(gè)機(jī)構(gòu)中,IIIF的這一功能可以在用戶(hù)端屏蔽來(lái)源差異,使用戶(hù)感覺(jué)在使用一部完整的資源。圖書(shū)館可以借助IIIF及軟件提供的功能,為用戶(hù)建立一個(gè)可深度定制的個(gè)人工作空間,使讀者方便地將全球資源庫(kù)中與個(gè)人研究和工作有關(guān)的資源集成到一起,并使讀者獲得對(duì)這些資源進(jìn)行統(tǒng)一收集、儲(chǔ)存、標(biāo)注、管理和共享等功能[13],即使不熟悉JSON 文件,用戶(hù)也能借助圖形式化操作界面對(duì)IIIF資源進(jìn)行集成和編輯。多倫多大學(xué)圖書(shū)館基于IIIF為用戶(hù)構(gòu)建了一個(gè)功能豐富的本地軟件套裝,用戶(hù)可以根據(jù)需要將該套裝下載到電腦上,管理自己的資源。用戶(hù)既可以上傳本地資源,也可以從其他平臺(tái)調(diào)取資源,軟件集成了Mirador,用戶(hù)既可以查看和操作資源,也可以創(chuàng)建虛擬展覽,并將這些資源應(yīng)用于教學(xué)展示、研究等。目前多倫多大學(xué)共提供3個(gè)軟件套裝,分別具備不同的功能,由用戶(hù)選擇安裝[14]。日本國(guó)立情報(bào)研究所和統(tǒng)計(jì)數(shù)理研究所共同設(shè)立的人文學(xué)公開(kāi)數(shù)據(jù)共同利用中心(Center for Open Data in the Humanitiees)開(kāi)發(fā)了IIIF集成平臺(tái)(IIIF Curation Platform),該平臺(tái)開(kāi)發(fā)了自有IIIF瀏覽器,并提供了一系列軟件套裝,利用該平臺(tái),用戶(hù)可以將全球IIIF資源庫(kù)中對(duì)自己有用的資源執(zhí)行保存、截取、編輯、添加注釋等操作,以建立個(gè)人數(shù)字圖書(shū)館,也可以將所保存的資源向他人共享[15]。
借助IIIF技術(shù),圖書(shū)館可以從全球資源庫(kù)中為本地用戶(hù)遴選資源并在不保存對(duì)象資源的情況下為用戶(hù)建設(shè)虛擬特色數(shù)據(jù)庫(kù),同時(shí)通過(guò)嵌入IIIF瀏覽器為用戶(hù)提供一站使用服務(wù)。從前臺(tái)看,用戶(hù)感覺(jué)不到資源不在本地的影響,也感受不到不同資源平臺(tái)功能上的差異,特別是那些由不同機(jī)構(gòu)分藏不同部分的同一資源,用戶(hù)在使用時(shí)能獲得一致的體驗(yàn)。日本人文學(xué)公開(kāi)數(shù)據(jù)共同利用中心就利用其開(kāi)發(fā)的ICP技術(shù),從日本國(guó)文學(xué)研究資料館、慶應(yīng)義塾大學(xué)圖書(shū)館、京都大學(xué)圖書(shū)館收藏的圖像資源中,以面部表情為對(duì)象,建設(shè)了虛擬專(zhuān)藏“面部表情專(zhuān)藏”(Collection of Facial Expressions),收集了各圖像資源中不同人物、不同形態(tài)的面部表情,并由機(jī)器為圖像添加標(biāo)簽,平臺(tái)安裝了統(tǒng)一的IIIF瀏覽器。截止本文調(diào)查,該專(zhuān)藏已有5,824張面部數(shù)據(jù)[16]。由于僅需在本地保存資源的有關(guān)數(shù)據(jù),而不用對(duì)資源進(jìn)行復(fù)雜的下載、轉(zhuǎn)換和加工,因此這一方式能減輕建庫(kù)館員壓力,提高建庫(kù)效率,同時(shí)也能減少在本地保存資源帶來(lái)的版權(quán)風(fēng)險(xiǎn)。這一方式也擴(kuò)大了特色數(shù)據(jù)庫(kù)的資源入藏范圍,因?yàn)椴⒎撬匈Y源庫(kù)都允許用戶(hù)下載和在本地保存資源,如果采用在本地備份方式建設(shè)數(shù)據(jù)庫(kù),會(huì)導(dǎo)致無(wú)法從某些數(shù)據(jù)庫(kù)中集成資源,這也是當(dāng)前國(guó)內(nèi)特色數(shù)據(jù)庫(kù)建設(shè)的瓶頸之一。
由于IIIF技術(shù)主要面向終端用戶(hù),以提供資源庫(kù)之間或資源庫(kù)與數(shù)據(jù)聚合平臺(tái)之間的互操作為目的,因此IIIF并沒(méi)有設(shè)置中央數(shù)據(jù)庫(kù),不提供內(nèi)容整合和發(fā)現(xiàn)服務(wù),這在IIIF官網(wǎng)中有明確說(shuō)明。盡管如此,自IIIF推出伊始,人們就對(duì)借助IIIF實(shí)現(xiàn)發(fā)現(xiàn)服務(wù)抱有濃厚興趣,并成立了研究小組,OCLC 還基于其數(shù)字內(nèi)容管理系統(tǒng)(CONTENTdm)的圖像資源開(kāi)展了這方面的嘗試,推出了IIIF Explorer測(cè)試版。在數(shù)字資源整合的兩種方式中,IIIF在元數(shù)據(jù)整合中的應(yīng)用得到了較多關(guān)注。目前,元數(shù)據(jù)整合使用最普遍的是基于OAI-PMH協(xié)議的整合技術(shù)。但該技術(shù)具有封閉性,對(duì)數(shù)據(jù)提供方有一定技術(shù)要求。IIIF使系統(tǒng)間的標(biāo)準(zhǔn)化通信成為可能,因而IIIF為基于元數(shù)據(jù)收割的數(shù)據(jù)整合提供了便利,這已被一些實(shí)驗(yàn)和案例研究確認(rèn)[17]。在IIIF的API提供的輸出信息中,存在著足夠的信息供HTTP機(jī)器人對(duì)IIIF端點(diǎn)爬行并收割數(shù)字資源的鏈接及相應(yīng)數(shù)據(jù)。IIIF的API結(jié)構(gòu)清晰,易于理解,使元數(shù)據(jù)整合平臺(tái)從各庫(kù)獲取數(shù)據(jù)變得容易。因此,對(duì)于已經(jīng)實(shí)施了IIIF技術(shù)的數(shù)據(jù)提供者,基于IIIF的元數(shù)據(jù)收割能大大降低技術(shù)和成本要求,提高數(shù)據(jù)提供者參與的積極性。不過(guò)IIIF在支持?jǐn)?shù)據(jù)整合方面也有不足,如數(shù)據(jù)集成需要的部分元素并非強(qiáng)制,一些數(shù)據(jù)集未提供有關(guān)元素;IIIF也沒(méi)有提供數(shù)字對(duì)象的修改時(shí)間戳,當(dāng)資源庫(kù)變得較大(10萬(wàn)件以上)或帶寬有限時(shí),會(huì)影響數(shù)據(jù)的收割效率,但在不涉及大型資源或在帶寬有保障時(shí)不會(huì)有太大影響,數(shù)據(jù)整合平臺(tái)也可以結(jié)合其他技術(shù)予以克服。
IIIF的推出使數(shù)字圖書(shū)館之間的跨平臺(tái)資源交換成為可能,有助于減少因平臺(tái)異構(gòu)造成的用戶(hù)在使用和管理資源方面遇到的障礙。同時(shí),IIIF對(duì)于圖書(shū)館重構(gòu)應(yīng)用系統(tǒng),提升資源管理效率也能發(fā)揮作用。例如,圖書(shū)館可以建立獨(dú)立的圖像資源庫(kù),其他系統(tǒng)如網(wǎng)站系統(tǒng)、活動(dòng)管理系統(tǒng)、在線展覽系統(tǒng)、資源推薦系統(tǒng)、自動(dòng)化系統(tǒng)、社交管理模塊等均可以調(diào)用該庫(kù)資源,圖像服務(wù)器根據(jù)請(qǐng)求生成不同分辨率、不同格式的衍生圖像,滿(mǎn)足系統(tǒng)的不同需要。不過(guò)由于IIIF推出時(shí)間有限,其應(yīng)用潛力尚未得到充分發(fā)揮,同時(shí)存在一些不足,如用戶(hù)數(shù)據(jù)難于保存、缺少獨(dú)立客戶(hù)端、資源類(lèi)型有限(目前僅支持圖像資源,對(duì)音頻和視頻資源的支持仍在研究之中),但其開(kāi)放性特點(diǎn)為用戶(hù)開(kāi)發(fā)各種IIIF 應(yīng)用提供了空間,也為克服這些不足帶來(lái)了曙光。
致謝筆者在研究過(guò)程中獲得了大英圖書(shū)館Sandra Tuppen博士、Kai-Chuan Chapman女士的熱情幫助,她們提供了大量資料,并聯(lián)系大英圖書(shū)館負(fù)責(zé)IIIF的技術(shù)人員解答有關(guān)問(wèn)題,謹(jǐn)致謝忱!