近年來,數(shù)字人文研究領(lǐng)域的發(fā)展,為圖書館資源重組與應(yīng)用提供了新的思路與方法。數(shù)字人文提倡運(yùn)用技術(shù)手段助力傳統(tǒng)人文學(xué)科的研究,其中以地理信息系統(tǒng)(Geography Information System,GIS)為基礎(chǔ)的“空間分析法”在人類學(xué)、歷史學(xué)、經(jīng)濟(jì)學(xué)、語言學(xué)等人文社會(huì)科學(xué)領(lǐng)域得到了廣泛應(yīng)用,逐漸形成一套以“空間”為切入點(diǎn)的新型研究方法[1]。2017年5月第二屆“北京大學(xué)數(shù)字人文論壇”會(huì)議指出,地理信息系統(tǒng)(GIS)已經(jīng)成為處理和操縱時(shí)空數(shù)據(jù)最有力的工具[2]。歷史地理數(shù)據(jù)及其相關(guān)技術(shù)、平臺(tái)和方法的應(yīng)用已成為數(shù)字人文研究中不容忽視的要素和不可或缺的一部分[3]。
地理信息系統(tǒng)(GIS)是以地理空間數(shù)據(jù)庫(kù)為基礎(chǔ),按照空間位置和時(shí)間序列管理、操作、分析、展示相關(guān)信息的計(jì)算機(jī)系統(tǒng)[4]。GIS在圖書館領(lǐng)域的應(yīng)用主要有圖書館空間信息管理系統(tǒng)、數(shù)字圖書館應(yīng)用、閱覽導(dǎo)航、地圖或古籍資源的圖形化查詢等[5]。本文試圖利用GIS技術(shù)的地理空間信息處理、分析和可視化功能[6],通過互聯(lián)網(wǎng)和局域網(wǎng),以圖形、圖像等直觀形式對(duì)圖書館異構(gòu)歷史地理信息資源進(jìn)行整合,實(shí)現(xiàn)集約管理、直觀展示,滿足讀者對(duì)圖書館相關(guān)主題異構(gòu)資源的一站式查詢檢索需求,提升圖書館資源服務(wù)效率。
圖書館開展GIS服務(wù)具備得天獨(dú)厚的資源優(yōu)勢(shì)和組織優(yōu)勢(shì)[7]。圖書館作為人文研究所需原始資料的保存者和服務(wù)機(jī)構(gòu),積累了大量數(shù)字資源和高度結(jié)構(gòu)化、規(guī)范化的元數(shù)據(jù)記錄[8],同時(shí)在資源收集、組織、編目、檢索、利用等方面也積累了大量經(jīng)驗(yàn)?;跉v史地理信息的資源包括古地圖、地方志、年鑒、地情資料、古籍文獻(xiàn)、地名辭典、拓片、名人家譜、人物傳記等,這些歷史地理資源較珍貴,多數(shù)為特藏資源,具有很高的學(xué)術(shù)研究?jī)r(jià)值;然而這些資源結(jié)構(gòu)不統(tǒng)一,存在各種形態(tài)(如文本、掃描件、圖像、音視頻),即便都是文本資源,不同數(shù)據(jù)庫(kù)存儲(chǔ)的元數(shù)據(jù)格式也千差萬別。通過歷史地理資源共有的“地理屬性”,運(yùn)用GIS技術(shù)整合異構(gòu)歷史地理信息資源(以下簡(jiǎn)稱“異構(gòu)資源”),能夠充分匯聚分散、孤立、封閉的異構(gòu)資源,創(chuàng)建可促進(jìn)人文研究的大規(guī)模結(jié)構(gòu)化數(shù)據(jù)集[9]。
以方志資源為例。方志是地方志的簡(jiǎn)稱,是記載一定地區(qū)(或行政區(qū)劃)自然和社會(huì)各個(gè)方面的歷史和現(xiàn)狀的綜合性著述[10]。方志具有明顯的地理屬性,是GIS用于異構(gòu)資源整合的典型代表。方志的數(shù)據(jù)源分為兩類,一類是商業(yè)方志類數(shù)據(jù)庫(kù),如愛如生數(shù)字化技術(shù)研究中心的中國(guó)方志庫(kù)、北京籍古軒的中國(guó)數(shù)字方志庫(kù);一類為地方自建方志類資源,如杭州數(shù)字方志館、陜西省地情網(wǎng)。這些方志分別存放于不同的系統(tǒng)平臺(tái),研究者想要查閱某一主題的方志,可能需要跨越多個(gè)系統(tǒng)平臺(tái)。此外,目前方志平臺(tái)提供的揭示手段有題名/責(zé)任者檢索、地域?yàn)g覽功能、目錄、全文檢索、標(biāo)簽云等,關(guān)于方志的地域性特征揭示,都是基于文字的地域名鏈接瀏覽[11]。若能結(jié)合GIS技術(shù),整合多系統(tǒng)多平臺(tái)異構(gòu)的方志資源,將資源分布通過地圖直觀呈現(xiàn),不僅能提高資源的聚合度,而且為方志的研究提供了一種新的思路,有效促進(jìn)相關(guān)資源的深度挖掘與分析。
2017年7月,南京大學(xué)召開了“數(shù)字人文:大數(shù)據(jù)時(shí)代學(xué)術(shù)前沿與探索”學(xué)術(shù)研討會(huì),會(huì)議將GIS技術(shù)在歷史地理領(lǐng)域的應(yīng)用列為數(shù)字人文研究的前沿問題進(jìn)行探討。GIS為歷史地理領(lǐng)域的研究提供了新的視角,是數(shù)字人文在歷史、地理領(lǐng)域賴以發(fā)展的重要工具。以GIS為載體的各種主題性地理信息系統(tǒng)成為當(dāng)前數(shù)字人文研究的重點(diǎn)項(xiàng)目[12];以方志、拓片、家譜等為代表的異構(gòu)歷史地理資源在存儲(chǔ)、獲取上與地理屬性相關(guān)度極高[13],因而運(yùn)用GIS技術(shù)實(shí)現(xiàn)異構(gòu)資源的整合具有十分重要的意義。
(1)提升資源完整性,促進(jìn)數(shù)字人文學(xué)研究。數(shù)字人文研究在于對(duì)大規(guī)模文本的深度挖掘與智能分析,因此相關(guān)資源的大規(guī)模整合以及資源的細(xì)粒度、關(guān)聯(lián)性重建是圖書館支撐人文研究的資源建設(shè)重點(diǎn)[14]。地理信息系統(tǒng)通過匯聚相同主題的異構(gòu)歷史地理數(shù)據(jù),打破信息孤島現(xiàn)象,創(chuàng)建可促進(jìn)人文研究的大規(guī)模數(shù)據(jù)集,擴(kuò)大了人文學(xué)者的研究范圍,實(shí)現(xiàn)了異構(gòu)資源的完整與統(tǒng)一。
(2)有利于資源直觀/可視化呈現(xiàn)?;诠灿械牡乩韺傩?,GIS將異構(gòu)資源以地圖的形式直觀展現(xiàn),充分揭示歷史地理資源的時(shí)空特性。通過地理信息系統(tǒng)可以獲得數(shù)據(jù)分布的直觀顯示,為用戶帶來更直接的感官體驗(yàn)。
(3)提高檢索效率。作為數(shù)字人文研究的重要輔助工具,GIS將異構(gòu)資源整合呈現(xiàn),大大提高了信息檢索和文獻(xiàn)獲取效率,使用戶能夠快速一站式地獲取資源,得到在時(shí)間和空間兩方面的直觀檢索集,突破了傳統(tǒng)的文字檢索模式[15]。
(4)為研究提供新視角。地理信息系統(tǒng)把一些看似毫不相關(guān)的信息通過地理位置屬性有機(jī)地組織起來,在現(xiàn)有數(shù)據(jù)基礎(chǔ)上探索、創(chuàng)造出新的信息,揭示出傳統(tǒng)平臺(tái)無法呈現(xiàn)的潛在規(guī)律、關(guān)系和傾向[16],為研究提供了一種新的思路。
中國(guó)歷史地理信息系統(tǒng)(China Historical Geographic Information System,CHGIS)[17]由復(fù)旦大學(xué)歷史地理研究中心主持,復(fù)旦大學(xué)和哈佛大學(xué)聯(lián)合繪制,收錄了中國(guó)歷史時(shí)期(公元前221-1911年)人口聚居地和歷史行政單位的相關(guān)數(shù)據(jù)。CHGIS以地理位置和行政單位的形式記錄數(shù)據(jù)庫(kù),可用來調(diào)查與中國(guó)有關(guān)的任意具體的地理數(shù)據(jù)。CHGIS為用戶提供了一個(gè)基礎(chǔ)GIS平臺(tái),用以空間分析、時(shí)間統(tǒng)計(jì)建模、繪制數(shù)字地圖等。用戶能夠?qū)⒆约旱臄?shù)據(jù)集導(dǎo)入CHGIS平臺(tái),使自己的數(shù)據(jù)與CHGIS記錄關(guān)聯(lián)起來,對(duì)不同歷史時(shí)期和不同級(jí)別的聚合進(jìn)行排序、查詢和顯示。CHGIS系統(tǒng)試圖建立一套中國(guó)歷史時(shí)期連續(xù)變化的基礎(chǔ)地理信息庫(kù),用于教學(xué)、科研和出版物。
中國(guó)歷代人物傳記資料庫(kù)(China Biographical Database,CBDB)[18]是一個(gè)收錄中國(guó)歷史人物傳記信息的關(guān)系型數(shù)據(jù)庫(kù),目標(biāo)在于系統(tǒng)地收錄中國(guó)歷史上所有重要的人物傳記資料,并將數(shù)據(jù)免費(fèi)開放供學(xué)術(shù)研究之用。截至2017年4月,CBDB共收錄7~19世紀(jì)人物傳記信息約37萬條。CBDB鼓勵(lì)研究學(xué)者共同參與,貢獻(xiàn)新的數(shù)據(jù)與其他學(xué)者分享。CBDB整合了CHGIS歷史地理數(shù)據(jù),利用數(shù)據(jù)的歷史地理屬性,在人物傳記資料的組織和呈現(xiàn)上融入“空間分析法”,將歷史人物的出生、生活、任職、游歷、田產(chǎn)、死亡、安葬等活動(dòng)置于多維時(shí)空架構(gòu)之中[19],實(shí)現(xiàn)資源可視化與空間分析,為研究者發(fā)現(xiàn)問題、解決問題提供了全新的方法和手段,是專題資料庫(kù)基于歷史地理信息進(jìn)行GIS整合的成功案例。
ChinaXmap是哈佛大學(xué)針對(duì)中國(guó)歷史研究推出的中國(guó)歷史電子地圖,涵蓋中國(guó)歷史上大多數(shù)朝代的基本歷史地圖圖層,能夠查詢從商周時(shí)期到現(xiàn)代的所有數(shù)據(jù),包括農(nóng)業(yè)、氣候、地理結(jié)構(gòu)、古代海洋、人口、區(qū)域規(guī)劃等信息[20]。ChinaXmap屬于哈佛大學(xué)世界地圖平臺(tái)(WorldMap)的一部分,WorldMap是一個(gè)開源Web地圖系統(tǒng),支持多學(xué)科、多來源、多格式的數(shù)據(jù)發(fā)現(xiàn),旨在幫助教學(xué)科研人員以及大眾從空間和時(shí)間上更好地調(diào)查、分析、編輯和發(fā)布地理空間信息,進(jìn)行可視化研究、通信和存檔[21]。ChinaXmap是在WorldMap平臺(tái)上創(chuàng)建的,哈佛大學(xué)中國(guó)研究院的許多學(xué)者作出了很大貢獻(xiàn)。ChinaXmap數(shù)據(jù)集通過圖層形式展示,不同朝代地域特點(diǎn)分別顯示在不同圖層,用戶通過勾選特定朝代或地域,可以查看相對(duì)應(yīng)圖層,也可以上傳自己的數(shù)據(jù)創(chuàng)建新圖層。哈佛大學(xué)圖書館網(wǎng)站中的“哈佛地圖庫(kù)(Harvard Map Collection)”收集了數(shù)千份地圖數(shù)據(jù)資源[22],匯聚成數(shù)千個(gè)圖層的疊加,并且隨著研究的深入,還在不斷增加中。
中華文明之時(shí)空基礎(chǔ)架構(gòu)(ChineseCivilization in Time and Space,CCTS)[23]是我國(guó)臺(tái)灣地區(qū)“中央研究院”進(jìn)行的研究,構(gòu)建了以中國(guó)為空間范圍、以原始社會(huì)迄今的中國(guó)歷史為時(shí)間縱深、以中國(guó)文明為內(nèi)涵的整合性資訊應(yīng)用環(huán)境。CCTS包含基本空間資料、Web GIS整合應(yīng)用環(huán)境和主體化的屬性資訊三大部分。項(xiàng)目以譚其驤主編的《中國(guó)歷史地圖集》為主要基礎(chǔ),整合研究院的漢籍電子文獻(xiàn)系統(tǒng)、清代糧價(jià)資料庫(kù)、明清地方志聯(lián)合目錄資料庫(kù)等,并輔以各類其他歷史地圖和遙感影像等基礎(chǔ)圖像資源,提供上古至清代,上下逾兩千年的中國(guó)歷史基本底圖。借助該系統(tǒng),用戶可以從古代地圖為入口了解到當(dāng)時(shí)的地名設(shè)置、區(qū)域大小、重要道路以及其他重要文化信息[24]。該項(xiàng)目是基于GIS的漢學(xué)研究綜合應(yīng)用環(huán)境。
“華人家譜總目·上海圖書館家譜知識(shí)服務(wù)平臺(tái)”是上海圖書館推出的基于GIS的家譜知識(shí)服務(wù)平臺(tái)[25]。家譜,又稱譜牒、族譜、宗譜、家乘、世譜等,是同宗共祖的血親團(tuán)體記載本族世系和相關(guān)事跡、反映本家族繁衍發(fā)展過程的歷史圖籍。上海圖書館擁有全球最多的中文家譜原件,利用GIS技術(shù)實(shí)現(xiàn)家譜資源的可視化,是上海圖書館基于家譜資源提供數(shù)字人文服務(wù)的重要嘗試。該平臺(tái)基于時(shí)空關(guān)聯(lián)進(jìn)行發(fā)現(xiàn)和探索,主要有兩種瀏覽方式:一種是“時(shí)間軸—地圖”瀏覽,轉(zhuǎn)動(dòng)“時(shí)間軸”按鈕,查看相應(yīng)年份中家譜的地理分布;另一種是“地圖畫圈瀏覽”,在地圖上劃出范圍,查看相應(yīng)地域范圍內(nèi)的家譜分布[26]。另外,該平臺(tái)還支持基于UGC(用戶貢獻(xiàn)內(nèi)容)的知識(shí)進(jìn)化和積累,鼓勵(lì)專家、學(xué)生、民間團(tuán)體貢獻(xiàn)知識(shí),撰寫反饋意見進(jìn)行交流互動(dòng),經(jīng)過認(rèn)證的專家可直接修改系統(tǒng)數(shù)據(jù),經(jīng)審核后發(fā)布,系統(tǒng)會(huì)記錄每一次修改,使數(shù)據(jù)在使用過程中增值。
“秘籍琳瑯——北京大學(xué)數(shù)字圖書館古文獻(xiàn)資源庫(kù)”[27]是北京大學(xué)圖書館在CALIS技術(shù)支持下建設(shè)的完整展示北京大學(xué)圖書館館藏古籍的網(wǎng)絡(luò)平臺(tái),讀者可以在該系統(tǒng)檢索北京大學(xué)圖書館館藏全部各種類型古文獻(xiàn)元數(shù)據(jù),查看和瀏覽古籍書影、電子圖書,以及拓片、輿圖圖像等。在該系統(tǒng)的時(shí)空檢索模塊,運(yùn)用GIS技術(shù)作為主要檢索方式,讀者可以查看相應(yīng)資源在地圖上的分布情況,可以通過選擇激活圖層來顯示國(guó)界、省界、地形、地貌、河流、省縣級(jí)地名等信息。另外,讀者還可以在不同朝代的歷史地圖上按照用戶劃出的區(qū)域進(jìn)行檢索,檢索結(jié)果可以直接在地圖上反映出來[28-29]。然而,目前該“時(shí)空檢索”模塊僅提供金石拓片資源的檢索,包括墓志、墓碑、刻經(jīng)、造像及全部拓片共5種類型的拓片資源。
基于GIS的異構(gòu)資源整合框架分為三部分,分別為異構(gòu)資源層、核心數(shù)據(jù)層、應(yīng)用服務(wù)層,如圖1所示。
圖1 基于GIS的歷史地理資源整合框架設(shè)計(jì)
(1)異構(gòu)資源層匯集來自不同系統(tǒng)平臺(tái)的同主題歷史地理資源。筆者所在的數(shù)字人文項(xiàng)目組在2014-2017年間對(duì)全國(guó)師范大學(xué)圖書館聯(lián)盟中涉及古籍善本、方志、民國(guó)圖書等資源的164個(gè)特藏資源數(shù)據(jù)庫(kù)進(jìn)行了跟蹤調(diào)研,其中,數(shù)據(jù)庫(kù)軟 件 平 臺(tái) 有 TPI、 TRS、DIPS、 Apabi、 IDLETD(CALIS提供)、超星、麥達(dá)及圖書館自主開發(fā)平臺(tái),除TPI為封閉的KBase系統(tǒng)外,平臺(tái)涉及的后臺(tái)數(shù)據(jù)庫(kù)多為MS SQL、MySQL等關(guān)系型數(shù)據(jù)庫(kù)。異構(gòu)資源平臺(tái)的數(shù)據(jù)形態(tài)既包含了結(jié)構(gòu)化數(shù)據(jù)(MS SQL、MySQL、Oracle等),也包含了大量半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)(Excel、KBase、XML等)。
(2)系統(tǒng)采用元數(shù)據(jù)收割協(xié)議OAI-PMH(The Open Archive Protocol for Metadata Harvesting),通過FTPS(Explicit/Implicit FTP over TLS/SSL)數(shù)據(jù)傳輸協(xié)議從異構(gòu)資源層提取元數(shù)據(jù)信息,經(jīng)過數(shù)據(jù)清洗、轉(zhuǎn)換與解析,整合異構(gòu)數(shù)據(jù)源中的歷史地理信息,從時(shí)間維度和空間維度細(xì)化加工,構(gòu)建GIS核心元數(shù)據(jù)集。時(shí)間維度包含紀(jì)年、年號(hào)、帝王等;空間維度包含經(jīng)緯度信息、歷史地名、今地名、行政區(qū)劃等。根據(jù)異構(gòu)資源的主題類型,選擇合適的時(shí)空維度,通過時(shí)間維度和空間維度的交互呈現(xiàn),提供多朝代多時(shí)空的人文研究。
(3)GIS核心元數(shù)據(jù)集采用RDF(Resource Description Framework)數(shù)據(jù)模型,利用統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifier,URI)命名數(shù)據(jù)實(shí)體,而SPARQL[30](SPARQL Protocol and RDF Query Language)是為RDF開發(fā)的一種查詢語言和數(shù)據(jù)獲取協(xié)議,是W3C的推薦標(biāo)準(zhǔn),也是主流網(wǎng)絡(luò)數(shù)據(jù)庫(kù)查詢語言和數(shù)據(jù)獲取標(biāo)準(zhǔn)。WEB GIS系統(tǒng)使用SPARQL作為GIS核心元數(shù)據(jù)集的查詢與互操作協(xié)議,調(diào)用網(wǎng)絡(luò)地圖云API,實(shí)現(xiàn)數(shù)據(jù)的可視化分析、開放應(yīng)用、語義化集成與共享。
GIS服務(wù)模式包含Web型、移動(dòng)型、桌面型和嵌入型。WEB型GIS基于Web基礎(chǔ)架構(gòu),采用B/S模式,使用網(wǎng)絡(luò)瀏覽器為用戶提供一致的界面,開發(fā)、維護(hù)成本較低,且具有良好的開放性,易于擴(kuò)展。桌面型GIS采用C/S模式,通過安裝在本地的應(yīng)用程序(即客戶端應(yīng)用程序)和服務(wù)器進(jìn)行交互操作,客戶端響應(yīng)速度較快,但開發(fā)困難、維護(hù)成本高,目前多數(shù)桌面應(yīng)用系統(tǒng)已逐漸向WEB應(yīng)用模式轉(zhuǎn)變。移動(dòng)型GIS主要針對(duì)以手機(jī)、平板電腦為介質(zhì)的移動(dòng)終端應(yīng)用,實(shí)際開發(fā)過程中除需考慮傳統(tǒng)因素外,還需考慮目標(biāo)受眾用戶粘性、網(wǎng)絡(luò)流量限制等問題,且開發(fā)成本較高。嵌入型GIS應(yīng)用中,軟件對(duì)硬件依賴性較高,不僅需要高層次軟件技術(shù)人員,還需掌握硬件原理和接口的硬件設(shè)計(jì)人員,實(shí)現(xiàn)軟硬件的高度配合,開發(fā)實(shí)施難度較大,但嵌入式GIS系統(tǒng)穩(wěn)定性較強(qiáng),運(yùn)算效率高,提供友好的GUI,在人工智能領(lǐng)域具有廣泛的應(yīng)用。例如,美國(guó)北卡羅來納州立大學(xué)亨特圖書館的自動(dòng)倉(cāng)儲(chǔ)機(jī)器人系統(tǒng)[31],利用嵌入式GIS系統(tǒng)實(shí)現(xiàn)150萬冊(cè)圖書的智能倉(cāng)儲(chǔ),讀者將所借書目信息輸入系統(tǒng)后,機(jī)器人通過機(jī)械升降臂準(zhǔn)確找到書籍,并運(yùn)送至讀者面前,整個(gè)過程只需幾分鐘,大大提高了工作效率,節(jié)約了時(shí)間和人力成本。
本文中,GIS系統(tǒng)以整合異構(gòu)歷史地理信息資源為目標(biāo),因此,在服務(wù)模式的選擇上,應(yīng)遵循簡(jiǎn)單、易操作的原則。前期階段,選擇易于開發(fā),成本較低的WEB GIS服務(wù)模式,能夠有效降低整合的技術(shù)門檻,實(shí)現(xiàn)異構(gòu)資源最大范圍內(nèi)的整合。作為互聯(lián)網(wǎng)的主要載體,Web能夠提供隨時(shí)隨地的數(shù)據(jù)訪問環(huán)境,Web基礎(chǔ)架構(gòu)以HTTP協(xié)議為依托并提供數(shù)據(jù)應(yīng)用程序接口API,是互聯(lián)網(wǎng)環(huán)境下數(shù)據(jù)開放應(yīng)用的常規(guī)選擇[32]。WEB GIS系統(tǒng)開發(fā)成本較低、可操作性強(qiáng),在建站、引流、維護(hù)方面具有一整套成熟的架構(gòu)體系,能夠?qū)崿F(xiàn)異構(gòu)數(shù)據(jù)源的高效率整合。WEB GIS的開放性與擴(kuò)展性也有利于系統(tǒng)后續(xù)的功能拓展與數(shù)據(jù)共享,實(shí)現(xiàn)集數(shù)據(jù)與功能的統(tǒng)一。
網(wǎng)絡(luò)地圖服務(wù)商均免費(fèi)提供了地圖服務(wù)應(yīng)用程序接口,WEB GIS核心系統(tǒng)只需調(diào)用地圖接口API,即可訪問地圖服務(wù)商通過云平臺(tái)提供的服務(wù)和數(shù)據(jù),構(gòu)建功能豐富、交互性強(qiáng)的WEB GIS服務(wù)系統(tǒng),極大地減少了開發(fā)的技術(shù)難度,節(jié)約了開發(fā)成本。網(wǎng)絡(luò)地圖服務(wù)商種類繁多,GIS開發(fā)人員應(yīng)從功能和性能上綜合考慮,選擇合適的地圖服務(wù)接口。表1選取了6大主流地圖服務(wù)商,分別從支持的API類型、頁面渲染時(shí)間、平均操作響應(yīng)時(shí)間三個(gè)方面進(jìn)行對(duì)比分析。
關(guān)于API種類。表格中統(tǒng)計(jì)的API服務(wù)范圍涉及WEB開發(fā)(如JavaScript API);移動(dòng)端開發(fā)(如 Android SDK、iOS SDK);服務(wù)應(yīng)用接口(如靜態(tài)地圖API、街景圖像API、地點(diǎn)檢索API、地理/逆地理編碼API、路徑規(guī)劃API、批量算路API)。API支持種類的多少?zèng)Q定了系統(tǒng)功能的豐富性及可拓展性。
關(guān)于頁面渲染時(shí)間及平均響應(yīng)時(shí)間。頁面渲染指瀏覽器將用戶初次請(qǐng)求的頁面資源基于一定規(guī)則(CSS、JS等)完成頁面布局及繪制的過程。渲染時(shí)長(zhǎng)反映了服務(wù)器的運(yùn)算及數(shù)據(jù)存儲(chǔ)能力。
關(guān)于平均響應(yīng)時(shí)間。平均響應(yīng)時(shí)間是指從用戶發(fā)出一個(gè)操作請(qǐng)求開始,到接收返回結(jié)果頁面所耗費(fèi)的時(shí)間,本文中具體指API調(diào)用的平均響應(yīng)時(shí)間。表1中頁面渲染時(shí)間和平均響應(yīng)時(shí)間均指WEB模式下的響應(yīng)時(shí)長(zhǎng)。響應(yīng)時(shí)間在1秒鐘之內(nèi),屬于“很不錯(cuò)的”;在1~2秒之間,屬于“好的”;在2~3秒之間,屬于“勉強(qiáng)接受的”;超過3秒,用戶很可能不會(huì)繼續(xù)等待下去[34]。
表1 主流地圖服務(wù)應(yīng)用對(duì)比[33]
豐富的API接口有利于系統(tǒng)功能拓展,而系統(tǒng)渲染及響應(yīng)時(shí)間直接影響到用戶的使用感受。從表1中可以看出,搜狗地圖和Bing地圖的頁面渲染及響應(yīng)效率較高,然而,兩者均不支持街景圖像API服務(wù);百度地圖支持的API服務(wù)種類最多,雖響應(yīng)時(shí)間略遜,但總體上在可接受范圍內(nèi),因此,推薦選擇百度地圖作為GIS對(duì)接地圖服務(wù)商。
GIS可視化應(yīng)用表現(xiàn)在時(shí)間軸檢索、古今地名對(duì)照、POI檢索、熱力圖、點(diǎn)聚合、測(cè)距、計(jì)算面積等,主要基于GIS時(shí)空本體模型、POI數(shù)據(jù)組織與檢索、GIS聚類服務(wù)三個(gè)方面。
圖2 基于地名的時(shí)空本體模型
本體是描述對(duì)象概念及概念間關(guān)系的一種形式化定義。GIS時(shí)空本體模型以地名為中心,詮釋了歷史地理信息資源的時(shí)空概念及其關(guān)系,如圖2所示。地名是促成異構(gòu)歷史地理資源整合的重要信息,尤其是古地名,包含有特定的時(shí)間屬性,其對(duì)應(yīng)的行政區(qū)劃、聚落、治所、歸屬關(guān)系都有特定的存續(xù)時(shí)間范圍。時(shí)間維度上主要包含公元紀(jì)年、朝代、年號(hào)等。地名是空間維度的核心,不同的古地名對(duì)應(yīng)著不同的生命周期(如新建、更名、治所遷移、撤銷等),采用URI(統(tǒng)一資源標(biāo)識(shí)符)將每一個(gè)歷史上曾出現(xiàn)過的古地名進(jìn)行標(biāo)識(shí)、定位,建立古今地名在空間上的繼承關(guān)系,以便在互聯(lián)網(wǎng)進(jìn)行訪問。每一個(gè)地名都有唯一URI與之對(duì)應(yīng),通過唯一URI定位地名在空間的位置,也可以通過空間位置檢索到與之相關(guān)的屬性數(shù)據(jù)。例如通過訪問地名URI可獲取該地名的存續(xù)時(shí)間范圍、空間范圍、治所信息及其經(jīng)緯度數(shù)據(jù),以及與其他地名的行政歸屬和空間歸屬關(guān)系;也可根據(jù)地名的存續(xù)時(shí)間范圍、空間范圍、治所名稱等查詢?cè)摰孛跁r(shí)間序列上有同一關(guān)系的其他地名及其相關(guān)時(shí)空數(shù)據(jù)[35]。歷史地理信息資源包含有大量歷史、地理相關(guān)信息,利用本體技術(shù)從時(shí)間維度和空間維度構(gòu)建GIS時(shí)空本體模型,實(shí)現(xiàn)GIS系統(tǒng)的時(shí)間軸檢索服務(wù)及古今地名對(duì)照服務(wù)。
基于歷史地理數(shù)據(jù)屬性及結(jié)構(gòu)特征對(duì)異構(gòu)資源進(jìn)行關(guān)聯(lián)聚合是實(shí)現(xiàn)資源在空間范圍內(nèi)可視化展示的關(guān)鍵。GIS在地圖上通過空間標(biāo)記點(diǎn)形式實(shí)現(xiàn)異構(gòu)數(shù)據(jù)整合呈現(xiàn)。當(dāng)數(shù)據(jù)規(guī)模較大時(shí),地圖區(qū)域內(nèi)有大量空間點(diǎn)需要可視化表達(dá),勢(shì)必會(huì)造成某些區(qū)域空間點(diǎn)的重疊覆蓋、顯示困難、不易選取和查看等。GIS聚類服務(wù)采用地圖空間點(diǎn)聚合技術(shù),主要解決有限可視區(qū)域內(nèi)或特定縮放級(jí)別下空間點(diǎn)分布密集問題??臻g點(diǎn)聚合技術(shù)通過對(duì)空間點(diǎn)分布規(guī)律及密集性進(jìn)行提取和抽象,用少量特征點(diǎn)代表某一區(qū)域范圍內(nèi)大量相似點(diǎn)標(biāo)識(shí),以更有效的方式表達(dá)空間點(diǎn)分布狀態(tài),使地圖顯示更清晰和明朗[36]。
空間點(diǎn)聚合算法主要有四種:基于網(wǎng)格的點(diǎn)聚合算法、基于距離的點(diǎn)聚合算法、基于方格距離的點(diǎn)聚合算法和基于K-means的點(diǎn)聚合算法。丁立國(guó)等在《專題圖空間點(diǎn)聚合可視化算法研究》文章中詳細(xì)探討了四種算法的原理及性能優(yōu)勢(shì)[37],不再贅述。為便于分析,筆者將4種算法在聚合性能和聚合形態(tài)上分為4個(gè)維度,如圖3所示。由圖3可見,維度越高,算法越優(yōu)。聚合性能由算法的復(fù)雜程度、運(yùn)行效率決定,好的聚合算法能減輕系統(tǒng)負(fù)荷,消耗資源少,運(yùn)算速度快,實(shí)時(shí)響應(yīng)時(shí)間短。聚合形態(tài)指聚合可視化效果,好的渲染效果能全面展示原始空間點(diǎn)分布規(guī)律和特征,根據(jù)縮放級(jí)別實(shí)時(shí)調(diào)整分布形態(tài),建立良好的交互體驗(yàn)。基于網(wǎng)格的點(diǎn)聚合算法運(yùn)算速度最快,但點(diǎn)聚合展示效果最差;基于K-means的點(diǎn)聚合算法聚合效果最優(yōu),但運(yùn)算速度最慢。從聚合性能和聚合形態(tài)綜合考量,基于方格距離的點(diǎn)聚合算法聚合性能較優(yōu)、聚合可視化形態(tài)較佳,是比較理想的選擇,谷歌地圖、百度地圖、高德地圖采用了基于方格距離的點(diǎn)聚合算法。熱力圖是聚類服務(wù)的典型應(yīng)用。根據(jù)聚合量大小采用熱力圖方式展現(xiàn)聚合區(qū)域目標(biāo)分布密集程度,直觀顯示各區(qū)域目標(biāo)權(quán)重信息,為研究提供參考。
圖3 點(diǎn)聚合算法對(duì)比
Point of Interest(POI)中文翻譯為興趣點(diǎn),是一種代表真實(shí)地理實(shí)體的點(diǎn)狀數(shù)據(jù),包含經(jīng)緯度、地址等空間信息以及名稱、類別等屬性信息。在地理信息系統(tǒng)中,每個(gè)POI都有唯一ID可供查詢,對(duì)應(yīng)一條數(shù)據(jù)資源,因此,通過POI空間分布特征能夠識(shí)別資源分布集聚區(qū)域和熱點(diǎn)區(qū)域,從而分析資源的集聚特征。
POI數(shù)據(jù)包含反映資源地理屬性的空間信息和反映資源內(nèi)容的屬性信息,是基于位置服務(wù)的最核心數(shù)據(jù)。POI數(shù)據(jù)組織過程是根據(jù)用戶需求,對(duì)原始數(shù)據(jù)中位置數(shù)據(jù)和屬性信息進(jìn)行提取、歸集、融合和邏輯計(jì)算,形成適用于GIS所需數(shù)據(jù)格式的過程。通過對(duì)POI屬性數(shù)據(jù)進(jìn)行分詞運(yùn)算,結(jié)合位置信息,建立字典樹索引,實(shí)現(xiàn)關(guān)鍵詞快速檢索查詢。POI檢索分為三種類型:周邊檢索、區(qū)域檢索、城市內(nèi)檢索和POI詳情信息檢索。周邊檢索是以某一點(diǎn)為中心,指定距離為半徑,根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行POI檢索;區(qū)域檢索是在指定矩形區(qū)域內(nèi)、根據(jù)關(guān)鍵詞進(jìn)行POI檢索;城市內(nèi)檢索是在某一城市內(nèi),根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行POI檢索;POI詳情檢索是根據(jù)POI的ID信息,檢索該興趣點(diǎn)的屬性信息。網(wǎng)絡(luò)地圖服務(wù)商為POI檢索接口提供了豐富的類和方法,供開發(fā)人員調(diào)用,其中以測(cè)距和計(jì)算面積的應(yīng)用最為廣泛。
GIS是專門管理地理信息的軟件系統(tǒng),不但能分門別類、分級(jí)分層管理與地理位置相關(guān)的信息,而且能進(jìn)行各種組合、分析、再組合和再分析等[38]。面對(duì)圖書館館藏資源的激增,GIS可視化技術(shù)是展示館藏資源知識(shí)元及其語義關(guān)聯(lián)的有效手段[39]。隨著數(shù)字人文研究的不斷發(fā)展,基于GIS技術(shù)的空間分析法在人文學(xué)科領(lǐng)域的研究不斷深化,然而利用GIS系統(tǒng)進(jìn)行異構(gòu)資源整合的研究還比較少見。資源整合一直是圖書館研究的熱點(diǎn)和難點(diǎn),尤其是異構(gòu)資源的整合和應(yīng)用。
基于歷史地理信息的異構(gòu)資源以資源的地理屬性為基礎(chǔ),運(yùn)用GIS技術(shù)整合異構(gòu)歷史地理數(shù)據(jù),實(shí)現(xiàn)相同主題異構(gòu)資源的統(tǒng)一可視化呈現(xiàn),不僅為人文學(xué)者的研究提供了新的思路和方法,而且對(duì)于數(shù)字圖書館建設(shè)具有重要意義。本文在充分調(diào)研國(guó)內(nèi)外基于歷史地理資源的GIS系統(tǒng)基礎(chǔ)上,結(jié)合歷史地理資源的地理屬性特征,試圖探索GIS系統(tǒng)在異構(gòu)資源整合上的應(yīng)用模式。GIS技術(shù)的發(fā)展為異構(gòu)資源整合提供了很好的應(yīng)用平臺(tái),加之網(wǎng)絡(luò)地圖服務(wù)商為開發(fā)者免費(fèi)提供了豐富的API應(yīng)用接口,幫助開發(fā)者構(gòu)建功能豐富、交互性強(qiáng)的GIS應(yīng)用,同時(shí)也大大降低了GIS系統(tǒng)開發(fā)和維護(hù)成本。筆者所在的華東師范大學(xué)圖書館調(diào)用高德地圖API建立了異構(gòu)方志資源的GIS整合平臺(tái),是異構(gòu)方志資源整合的一次重要實(shí)踐,也為本文的研究提供了強(qiáng)有力支撐。