牛文淵 李 洋,3*
(1 塔里木大學(xué)西域文化研究院, 新疆 阿拉爾 843300)(2 塔里木大學(xué)歷史與哲學(xué)學(xué)院, 新疆 阿拉爾 843300)(3 武漢大學(xué)歷史學(xué)院, 湖北 武漢 430072)
西域是歷史上對我國古代西北邊疆地區(qū)的專有稱謂,其特定的政治內(nèi)涵和具體的地理范圍隨時代不同而變化,也分狹義和廣義兩種[1,2]。本文所述,以狹義的西域?yàn)橹?,即指天山以南,昆侖山以北,蔥嶺以東,玉門以西的地域[3],兼及周邊區(qū)域。西域自古以來就是中國領(lǐng)土的一部分,也是絲綢之路的重要部分。西域歷史文化資源豐富,主要種類包括:歷史文獻(xiàn)、不可移動文物、可移動文物、非物質(zhì)文化遺產(chǎn);中外研究者以此為研究對象產(chǎn)生的研究專著、論文、影像資料等西域歷史文化研究成果等。
近年來,隨著國家“一帶一路”倡議的提出,學(xué)術(shù)界逐漸重視西域歷史文化類資源的數(shù)字化工作[4-6],國內(nèi)數(shù)個相關(guān)數(shù)據(jù)庫陸續(xù)建成并投入使用。相比于歷史文化類其他專題數(shù)據(jù)庫建設(shè)研究[7-9]而言,西域歷史文化類數(shù)據(jù)庫建設(shè)的調(diào)查與研究有待加強(qiáng)。因此,本文擬通過對國內(nèi)西域歷史文化類數(shù)據(jù)庫的建設(shè)狀況調(diào)查和用戶體驗(yàn)評價(jià),分析制約數(shù)據(jù)庫建設(shè)的因素,結(jié)合塔里木大學(xué)在建數(shù)字西域平臺的情況,提出下一階段建設(shè)策略,以提高資源的利用效率和研究價(jià)值,改善用戶體驗(yàn),為西域歷史文化研究提供信息資源保障。
經(jīng)初步調(diào)查,目前國內(nèi)以西域歷史文化為主題且運(yùn)行狀況良好的數(shù)據(jù)庫共有8個,下文首先對這8個數(shù)據(jù)庫進(jìn)行簡要介紹,然后通過建設(shè)狀況調(diào)查與用戶體驗(yàn)評價(jià),分析制約數(shù)據(jù)庫建設(shè)的因素。
(1)“絲綢之路民族歷史文化研究數(shù)據(jù)庫”
該數(shù)據(jù)庫是同方知網(wǎng)(北京)技術(shù)有限公司(簡稱“中國知網(wǎng)”)在中宣部與國家廣電總局聯(lián)合運(yùn)作的“中英文絲路文獻(xiàn)數(shù)據(jù)庫多國合作項(xiàng)目”資助下,以“民族”這個貫穿絲路歷史發(fā)展的核心元素,系統(tǒng)整合了“中國知網(wǎng)”旗下《中國知識資源總庫》中學(xué)術(shù)期刊、博碩士論文、會議論文、報(bào)紙、年鑒、工具書等不同類型的文獻(xiàn)資源構(gòu)建而成。該數(shù)據(jù)庫包括六個專題板塊:“絲路民族歷史”、“現(xiàn)代民族研究”、“絲路語文史”、“絲路名人史”、“特色專題”、“專家視角”。總文獻(xiàn)量約53~55萬篇,年更新資源量約3. 5~4萬篇。關(guān)鍵詞聚合與人工編輯的聯(lián)合應(yīng)用,使得該數(shù)據(jù)庫聚合的文獻(xiàn)主題契合度高。其搜索引擎可以單獨(dú)搜索庫內(nèi)資源或合并搜索總庫資源,加之《中國知識資源總庫》收錄文獻(xiàn)的全面性,可對一個研究方向形成較為全面的闡述。
(2)“絲綢之路宗教歷史文化研究數(shù)據(jù)庫”
作為“絲綢之路民族歷史文化研究數(shù)據(jù)庫”的姐妹庫,該數(shù)據(jù)庫以“宗教”為主題,包括九個專題板塊,又可分為兩大類:一類是絲路歷史上重要宗教的分別整合(包括“佛教”、“道教”、“伊斯蘭教”、“猶太與基督宗教”、“祆教與摩尼教”、“中國與印度宗教”等);另一類則對絲路沿線宗教的專題性研究進(jìn)行歸納總結(jié):包括“宗教名人”、“特色專題”和“專家視角”等。總文獻(xiàn)量約12~14萬篇;年更新資源量約1萬篇。其建設(shè)特點(diǎn)與“絲綢之路民族歷史文化研究數(shù)據(jù)庫”相似。
(3)“新疆地方文獻(xiàn)數(shù)字化資源中心”
該數(shù)據(jù)庫是由北京超星集團(tuán)提供技術(shù)支持,全國地方文獻(xiàn)資源共建共享聯(lián)盟聯(lián)合新疆自治區(qū)圖書館創(chuàng)建的地方文獻(xiàn)數(shù)字化資源數(shù)據(jù)庫群的一個省館節(jié)點(diǎn)。該數(shù)據(jù)庫按照聯(lián)盟統(tǒng)一標(biāo)準(zhǔn)劃分為十四個欄目,包括“特色文獻(xiàn)推薦”、“最新文獻(xiàn)速遞”、“地方人士著述”、“地方期刊數(shù)據(jù)庫”、“地方報(bào)紙數(shù)據(jù)庫”、“地方百科資料庫”、“地方人物數(shù)據(jù)庫”、“地方視頻資料庫”、“地方圖片數(shù)據(jù)庫”、“地方專利數(shù)據(jù)庫”、“新疆地方志專藏”、“新疆年鑒專藏”、“地方文獻(xiàn)搜索引擎”、“地方圖書數(shù)據(jù)庫”等。所提供的“地方文獻(xiàn)搜索引擎”既可對庫內(nèi)資源單獨(dú)搜索又可對超星總庫資源合并搜索。全國地方文獻(xiàn)資源共建共享聯(lián)盟和北京超星集團(tuán)成熟的運(yùn)營模式使得該數(shù)據(jù)在技術(shù)引擎、欄目設(shè)置和資源數(shù)量等方面有較明顯的優(yōu)勢。此外,在新疆地區(qū)還有喀什圖書館和哈密圖書館加入聯(lián)盟,各自創(chuàng)建了相似的地市館節(jié)點(diǎn)。
(4)“新疆歷史在線”
該數(shù)據(jù)庫由新疆社會科學(xué)院《西域研究》雜志社主辦,包括“學(xué)術(shù)信息”、“地方史”、“民族史”、“宗教史”、“文化史”、“文物考古”、“歷史地理”和“過刊瀏覽”八個欄目,這些欄目轉(zhuǎn)載或鏈接其他網(wǎng)站的眾多資料文獻(xiàn),并提供《西域研究》部分過刊瀏覽和精品文章轉(zhuǎn)載。該數(shù)據(jù)庫提供類似“中國知網(wǎng)”搜索引擎的搜索服務(wù),功能較為完善,同時作為《西域研究》雜志的官方網(wǎng)站提供遠(yuǎn)程稿件處理系統(tǒng)入口。
(5)“新疆經(jīng)典人文特色數(shù)據(jù)庫”
該數(shù)據(jù)庫由新疆烏魯木齊一心閱讀文化科技有限公司構(gòu)建,有國語、維語和哈薩克語三個版本,內(nèi)容一致。該數(shù)據(jù)庫劃分為四個欄目,其中“新疆地方志”的主要講述新疆特色城鎮(zhèn),地方傳奇故事,地名由來考證等;“新疆人物志”主要講述新疆歷史文化名人;“新疆博物館志”主要是新疆境內(nèi)博物館制作的紀(jì)錄片或宣傳片;“新疆印象”主要是關(guān)于新疆非物質(zhì)文化遺產(chǎn)或特色文物的紀(jì)錄片。該數(shù)據(jù)庫共收錄520余部視頻資料。
(6)“西域文物考古數(shù)據(jù)庫”
該數(shù)據(jù)庫經(jīng)新疆美術(shù)攝影出版社與美國克魯格出版社授權(quán),由谷浪遠(yuǎn)景(北京)科技發(fā)展有限公司研發(fā),較為全面地匯集了新疆文物考古成果。該數(shù)據(jù)庫以地圖和地州縣市名稱為導(dǎo)覽,將新疆文物考古成果按地區(qū)展示,具體分為“文獻(xiàn)圖鑒”、“考古區(qū)域”、“文物類別”三類。數(shù)據(jù)來源以《西域文物考古全集》、《西域民俗研究》及《西域巖畫圖案全集》為主,收錄了新疆及周邊約1萬處文物遺址的相關(guān)資料,包括文字約1 000萬字,圖片約6萬幅。該數(shù)據(jù)庫采取商業(yè)化運(yùn)作,目前國內(nèi)外約10所大學(xué)購買了該數(shù)據(jù)庫的使用權(quán)限或本地鏡像。
(7)“‘一帶一路’數(shù)據(jù)庫:史話庫”
社會科學(xué)文獻(xiàn)出版社為配合國家“一帶一路”倡議實(shí)施,整合國內(nèi)外研究資源構(gòu)建了“‘一帶一路’數(shù)據(jù)庫”。該數(shù)據(jù)庫是“‘一帶一路’數(shù)據(jù)庫”的子庫,收錄關(guān)于“一帶一路”的國內(nèi)外歷史文化類文獻(xiàn)資料780篇,提供基本檢索功能。
(8)“絲路審美文化中外互通資源數(shù)據(jù)庫”
該數(shù)據(jù)庫由蘭州大學(xué)文學(xué)院構(gòu)建,包括四個專題板塊:“絲路審美文化數(shù)據(jù)庫”收錄絲綢之路文化相關(guān)的論文、著作、圖片和影像資源;“專家講座”收集專家講座視頻;“論壇會議”收錄會議資訊;“古絲綢之路沿線地理交通圖示”仍在策劃階段,建成后將以靜態(tài)圖片、二維動畫、3D建模等形式展示古絲路沿線的地理交通。該數(shù)據(jù)庫收錄論文3篇,著作20部,圖片資訊70篇,影視作品44部,講座視頻18部,學(xué)術(shù)論壇及會議鏈接23條。
表1是上述數(shù)據(jù)庫建設(shè)狀況基本信息表,體現(xiàn)建設(shè)現(xiàn)狀如下:(1)數(shù)據(jù)庫構(gòu)建單位以文化機(jī)構(gòu)和文化企業(yè)為主,其專業(yè)領(lǐng)域與發(fā)展規(guī)劃決定數(shù)據(jù)庫建設(shè)方式,如:“中國知網(wǎng)”旗下數(shù)據(jù)庫借助《中國知識資源總庫》進(jìn)行同主題文獻(xiàn)的聚合分類,實(shí)現(xiàn)快速搭建“行業(yè)知識服務(wù)與知識管理平臺”、“專題知識庫”;新疆自治區(qū)圖書館以加入全國地方文獻(xiàn)資源共建共享聯(lián)盟的方式通過館藏資源數(shù)字化建成數(shù)據(jù)庫;“新疆經(jīng)典人文特色數(shù)據(jù)庫”則是一心閱讀文化科技有限公司從書店轉(zhuǎn)型進(jìn)行區(qū)域特色數(shù)據(jù)庫研發(fā)的成果之一。(2)涉及領(lǐng)域覆蓋了歷史學(xué)、民族學(xué)、語言學(xué)、考古學(xué)、宗教學(xué)、地方志、非物質(zhì)文化遺產(chǎn)、文化產(chǎn)業(yè),旅游管理等,既有綜合庫,如:“新疆地方文獻(xiàn)數(shù)字化資源中心”;又有專題庫,如:“絲綢之路民族歷史文化研究數(shù)據(jù)庫”、“絲綢之路宗教歷史文化研究數(shù)據(jù)庫”和“西域文物考古數(shù)據(jù)庫”。(3)數(shù)據(jù)庫資源以傳統(tǒng)資源為主,包括文獻(xiàn)、圖片、視頻三種資源類型,其中文獻(xiàn)占絕大多數(shù),如:“絲綢之路民族歷史文化研究數(shù)據(jù)庫”和“絲綢之路宗教歷史文化研究數(shù)據(jù)庫”的資源是期刊論文、學(xué)位論文等文獻(xiàn);“新疆經(jīng)典人文特色數(shù)據(jù)庫”的資源是紀(jì)錄片和電視節(jié)目視頻;“西域文物考古數(shù)據(jù)庫”的資源則全部是來自正式出版物。(4)多數(shù)數(shù)據(jù)庫的目標(biāo)用戶以科研人員為主,個別數(shù)據(jù)庫的目標(biāo)用戶為普通大眾。(5)數(shù)據(jù)庫的開放程度差異較大,“新疆歷史在線”、“新疆經(jīng)典人文特色數(shù)據(jù)庫”、“‘一帶一路’數(shù)據(jù)庫:史話庫”、“絲路審美文化中外互通資源數(shù)據(jù)庫”四個數(shù)據(jù)庫完全開放,其他為有限開放或僅限購買。
表1 數(shù)據(jù)庫基本信息表
(1)各數(shù)據(jù)庫的用戶整體滿意度差別較大。8個數(shù)據(jù)庫的平均分為0. 78,極差0. 32,標(biāo)準(zhǔn)差0. 114 8,反映出這8個西域歷史文化類數(shù)據(jù)庫建設(shè)水平參差不齊。
(2)選題建庫的用戶滿意度較高。特色性評分≧0. 8的數(shù)據(jù)庫6個,占總數(shù)75%,說明這類數(shù)據(jù)庫由于涉及神秘西域歷史文化而在選題上占據(jù)先機(jī)。一致性評分≧0. 8的數(shù)據(jù)庫6個,占總數(shù)75%,可能與西域歷史文化類數(shù)據(jù)庫自身的選題面較窄有關(guān)。
(3)數(shù)據(jù)資源的用戶滿意度較低。數(shù)據(jù)資源的優(yōu)劣直接決定數(shù)據(jù)庫的核心競爭力,“絲綢之路民族歷史文化研究數(shù)據(jù)庫”、“絲綢之路宗教歷史文化研究數(shù)據(jù)庫”、“新疆歷史在線”的數(shù)據(jù)資源加權(quán)合計(jì)≧0. 4(等于1分制0. 8),顯示其在數(shù)據(jù)資源上的突出優(yōu)勢,相應(yīng)的整體用戶體驗(yàn)滿意度也高于其他數(shù)據(jù)庫。值得注意的是,數(shù)據(jù)資源中數(shù)據(jù)來源的用戶滿意度普遍較低,并與其面向人員的專業(yè)性程度正相關(guān),也就是說,專業(yè)性明確的數(shù)據(jù)庫涉及領(lǐng)域較專一,數(shù)據(jù)相對能滿足用戶需求,專業(yè)性不明確的數(shù)據(jù)庫涉及領(lǐng)域較分散,數(shù)據(jù)較難滿足用戶需求。
(4)系統(tǒng)功能的用戶滿意度較高?!敖z路審美文化中外互通資源數(shù)據(jù)庫”系統(tǒng)功能評分0. 12(等于1分制0. 6)是該項(xiàng)最低分,其他數(shù)據(jù)庫得分均在0. 15(等于1分制0. 75)之上,說明現(xiàn)有數(shù)據(jù)庫搜索引擎技術(shù)帶來的用戶體驗(yàn)差別不大,且現(xiàn)有技術(shù)已能滿足大多數(shù)用戶的基本體驗(yàn)。
表2 數(shù)據(jù)庫用戶體驗(yàn)評價(jià)統(tǒng)計(jì)表
(1)缺少牽頭整合各類數(shù)據(jù)庫資源的組織機(jī)構(gòu)
數(shù)據(jù)庫構(gòu)建單位希望通過已有資源快速服務(wù)用戶,以便快速進(jìn)入市場,加之專題數(shù)據(jù)庫在專業(yè)性明確的條件下,往往追求數(shù)據(jù)資源的“專而精”。然而,用戶更加希望“一站式”獲取資源,即在同一數(shù)據(jù)庫獲得領(lǐng)域更寬廣、內(nèi)容更豐富的數(shù)據(jù)資源。數(shù)據(jù)庫構(gòu)建單位出發(fā)點(diǎn)和用戶需求之間的矛盾,可以通過整合各類數(shù)據(jù)庫資源而消減,然而目前缺少能夠牽頭整合工作的組織機(jī)構(gòu)。
(2)數(shù)據(jù)庫建設(shè)商業(yè)驅(qū)動力不足
用戶體驗(yàn)調(diào)查表明,數(shù)據(jù)資源用戶滿意度不高的主要原因是缺乏商業(yè)驅(qū)動力,沒有盈利就難以持續(xù)提升數(shù)據(jù)資源質(zhì)量。
(3)數(shù)據(jù)資源專業(yè)性與通俗性之間的矛盾
用戶體驗(yàn)調(diào)查表明專業(yè)人士普遍對專業(yè)性不明確的數(shù)據(jù)庫資源持不滿態(tài)度,因?yàn)樗鼈儙磉^多無用信息而影響工作效率;非專業(yè)人士認(rèn)為專業(yè)數(shù)據(jù)資源晦澀難懂、趣味性低,獲取知識難度大。因此,專業(yè)性資源和通俗性資源之間存在矛盾,且兩者的元數(shù)據(jù)差別較大,通常不適合放在同一數(shù)據(jù)庫。
(4)數(shù)據(jù)庫建設(shè)人才知識的不全面性
西域歷史文化類數(shù)據(jù)庫建設(shè)與三種人才有關(guān),即數(shù)據(jù)庫工程師,文獻(xiàn)情報(bào)專業(yè)人員,歷史文化學(xué)者。這三種人才在數(shù)據(jù)庫建設(shè)方面,均會受到自身知識不全面性的約束。例如,數(shù)據(jù)庫工程師和文獻(xiàn)情報(bào)專業(yè)人員無法準(zhǔn)確判斷數(shù)據(jù)資源的專業(yè)價(jià)值;歷史文化學(xué)者則不太重視數(shù)據(jù)庫的建設(shè)路徑且不掌握關(guān)鍵技術(shù)。了解西域歷史文化和文獻(xiàn)情報(bào)分類理論,并掌握數(shù)據(jù)庫搭建技術(shù)的復(fù)合型人才缺口明顯。
2012年,塔里木大學(xué)西域文化研究院提出數(shù)字西域平臺的概念,旨在建設(shè)以環(huán)塔里木地區(qū)為中心,輻射中西南亞,涉及文化、歷史、考古、旅游、經(jīng)濟(jì)等多學(xué)科的綜合科研資源平臺。經(jīng)歷數(shù)年的探索和積累,現(xiàn)已完成總體框架構(gòu)建,包括數(shù)字西域服務(wù)平臺和數(shù)字西域?qū)n}數(shù)據(jù)庫群,前者集中提供系統(tǒng)功能,后者按專題提供數(shù)據(jù)資源支撐。下文將從建設(shè)原則、總體框架、建設(shè)方式和關(guān)鍵技術(shù)等方面對其建設(shè)現(xiàn)狀進(jìn)行介紹。
數(shù)字西域平臺建設(shè)遵循以下原則:
(1)協(xié)調(diào)性原則
已有西域歷史文化類數(shù)據(jù)庫資源分散,數(shù)據(jù)利用率低,存在一定程度的學(xué)術(shù)研究壁壘。數(shù)字西域平臺強(qiáng)調(diào)協(xié)調(diào)性原則,以便打破壁壘,提高利用率,實(shí)現(xiàn)平臺共建、數(shù)據(jù)資源共享。
(2)統(tǒng)一性原則
為實(shí)現(xiàn)平臺共建、數(shù)據(jù)資源共享,數(shù)字西域平臺總體設(shè)計(jì)和專題數(shù)據(jù)庫設(shè)計(jì)遵循統(tǒng)一性原則,保證數(shù)據(jù)資源的標(biāo)準(zhǔn)化與規(guī)范化。
(3)擴(kuò)充性原則
在數(shù)字西域平臺建設(shè)中保證擴(kuò)充性,可滿足專題數(shù)據(jù)庫逐步構(gòu)建、按需增加、實(shí)施分布式存儲與運(yùn)行,并可以納入其它機(jī)構(gòu)的專題數(shù)據(jù)庫。在專題數(shù)據(jù)庫中保證擴(kuò)充性,可滿足數(shù)據(jù)類型、數(shù)據(jù)字段和數(shù)據(jù)記錄不斷擴(kuò)充。
圖1是數(shù)字西域平臺的總體框架,主體包括數(shù)字西域服務(wù)平臺和數(shù)字西域?qū)n}數(shù)據(jù)庫群兩大部分。數(shù)字西域服務(wù)平臺提供通過提供用戶管理、權(quán)限管理、跨庫檢索、數(shù)據(jù)組織等功能。數(shù)字西域?qū)n}數(shù)據(jù)庫群設(shè)置5個專題數(shù)據(jù)庫,分別是環(huán)塔里木歷史文化資源信息庫、環(huán)塔里木非物質(zhì)文化遺產(chǎn)信息庫、西域-絲路文獻(xiàn)信息庫、中西南亞國別信息庫、西域新疆信息庫。兩者通過數(shù)字西域平臺用戶界面進(jìn)行連接。
圖1 數(shù)字西域平臺總體框架圖
數(shù)字西域平臺的建設(shè)以自主設(shè)計(jì)研發(fā)為主,兼顧其他方式。其中,數(shù)字西域服務(wù)平臺由塔里木大學(xué)數(shù)字西域?qū)嶒?yàn)室自主設(shè)計(jì)研發(fā),以保證學(xué)校在平臺研發(fā)中的原創(chuàng)價(jià)值與主體地位,保證平臺理念的準(zhǔn)確實(shí)施;同時,為充分利用資源,降低資金成本與時間成本,實(shí)現(xiàn)效益最大化,專題數(shù)據(jù)庫的建設(shè)采用多種方式,包括自主設(shè)計(jì)研發(fā)、合作共建、委托企業(yè)搭建、購買重組等。
(1)多源數(shù)據(jù)融合技術(shù)
多源數(shù)據(jù)融合技術(shù)指通過協(xié)同利用不同來源的異構(gòu)數(shù)據(jù),使其互為補(bǔ)充、融為一體,以獲得事物客觀評價(jià)的數(shù)據(jù)處理技術(shù)。西域歷史文化類資源的采集、數(shù)字化以及3S技術(shù)應(yīng)用等多種數(shù)據(jù)積累手段造成了多源異構(gòu)數(shù)據(jù)。多源數(shù)據(jù)融合技術(shù)使這些容量巨大、類別龐雜、格式多樣的多源異構(gòu)數(shù)據(jù)有機(jī)融合、深度利用。其關(guān)鍵在于,深入挖掘并規(guī)范化表達(dá)描述同一主題的多源數(shù)據(jù)語義,并將規(guī)范化表達(dá)的數(shù)據(jù)語義經(jīng)共同目標(biāo)融合到一起。就數(shù)字西域平臺而言,研發(fā)該技術(shù)能夠幫助用戶快速、高效地利用數(shù)據(jù)資源;研發(fā)高級階段,該技術(shù)能夠自動聚合同主題的多源異構(gòu)數(shù)據(jù),實(shí)現(xiàn)自動深度挖掘數(shù)據(jù)語義,便于開展深入研究。
(2)跨庫檢索技術(shù)
跨庫檢索技術(shù)是指在呈現(xiàn)給用戶的一個檢索系統(tǒng)界面中,對存在于多個數(shù)據(jù)庫的資源進(jìn)行相關(guān)搜索,也被稱為統(tǒng)一檢索平臺。該技術(shù)可以在用戶提交一次數(shù)據(jù)檢索命令時,把分布于不同服務(wù)器主機(jī)、不同網(wǎng)絡(luò)、不同數(shù)據(jù)庫存儲系統(tǒng)中的數(shù)據(jù)一同檢索出來,并集成檢索結(jié)果,在用戶操作界面上進(jìn)行統(tǒng)一展示[12,13]。數(shù)字西域平臺采用跨庫檢索的優(yōu)勢在于,用戶只需登錄一次就可完成所有專題庫的權(quán)限認(rèn)證,實(shí)現(xiàn)在平臺范圍內(nèi)搜索資源,免去專題庫間切換與重復(fù)登錄,從而提高系統(tǒng)功能的易用性,提高用戶工作效率。
數(shù)字西域平臺建設(shè)分為數(shù)字西域服務(wù)平臺建設(shè)和數(shù)字西域?qū)n}數(shù)據(jù)庫群建設(shè)兩大部分。服務(wù)平臺已完成詳細(xì)設(shè)計(jì)和關(guān)鍵技術(shù)研發(fā),進(jìn)入功能實(shí)施與細(xì)化階段,其用戶界面如圖2所示。
數(shù)字西域?qū)n}數(shù)據(jù)庫群建設(shè)包括五項(xiàng)專題數(shù)據(jù)庫建設(shè),具體情況為:
(1)環(huán)塔里木歷史文化資源信息庫
以北京谷浪遠(yuǎn)景科技發(fā)展有限公司的“西域文物考古數(shù)據(jù)庫”為基礎(chǔ)重組建庫,內(nèi)含新疆文物局版權(quán)所有的新疆境內(nèi)88個縣市的不可移動文物,共計(jì)近萬處遺址,6萬幅圖片、700萬文字。
(2)環(huán)塔里木非物質(zhì)文化遺產(chǎn)信息庫
以塔里木大學(xué)與浙江大學(xué)合作完成的國家科技支撐計(jì)劃項(xiàng)目《環(huán)塔里木非遺文化旅游綜合服務(wù)系統(tǒng)構(gòu)建與應(yīng)用》為基礎(chǔ),建成環(huán)塔里木非物質(zhì)文化遺產(chǎn)信息庫,該專題數(shù)據(jù)庫包含300項(xiàng)新疆境內(nèi)的各類非遺基礎(chǔ)資料,32項(xiàng)深度挖掘非遺項(xiàng)目資料,非遺傳承人信息,新疆境內(nèi)非遺旅游精品線路,新疆境內(nèi)非遺項(xiàng)目的最新動態(tài)等。
(3)西域-絲路文獻(xiàn)信息庫
計(jì)劃與塔里木大學(xué)圖書館合作,以其特色館藏“西域文獻(xiàn)庫”為基礎(chǔ),對館內(nèi)西域文獻(xiàn)庫中有關(guān)西域文化的特色館藏資源進(jìn)行數(shù)字化,構(gòu)建“西域-絲路文獻(xiàn)信息庫”。
(4)中西南亞國別信息庫
以北京新文圖信科技有限公司的“區(qū)域研究數(shù)據(jù)庫:中亞”為基礎(chǔ)重組建庫,包括基礎(chǔ)文獻(xiàn)庫、國外智庫、國內(nèi)智庫、咨詢觀察庫、基本事實(shí)庫,現(xiàn)處于重組階段。
(5)西域新疆信息庫
該專題庫是具有西域、新疆地域歷史文化特色的專題性數(shù)據(jù)庫,現(xiàn)處于邏輯設(shè)計(jì)階段。
數(shù)字西域平臺的建設(shè)與發(fā)展以塔里木大學(xué)數(shù)字西域重點(diǎn)實(shí)驗(yàn)室委托,該實(shí)驗(yàn)室的建規(guī)劃分三步走,即“西域歷史文化資源數(shù)字化保護(hù)”、“數(shù)字西域平臺建設(shè)及西域文化數(shù)字化傳播”、“西域歷史文化資源產(chǎn)業(yè)化及社會應(yīng)用示范推廣”。數(shù)字西域平臺建設(shè)作為其重要環(huán)節(jié)位于承上啟下的第二階段,既是第一階段研究成果匯總與加強(qiáng),也是第三階段的數(shù)據(jù)資源保障。從學(xué)校層面看,數(shù)字西域平臺已為塔里木大學(xué)在西域研究領(lǐng)域帶來了良好的聲譽(yù),下一階段應(yīng)努力將其打造成為國內(nèi)西域研究的特色品牌。從更大的層面看,數(shù)字西域平臺占據(jù)了突出的地緣優(yōu)勢,可直接服務(wù)于國家“一路一帶”倡議、實(shí)現(xiàn)新疆工作總目標(biāo)和兵團(tuán)向南發(fā)展。
數(shù)字西域平臺的規(guī)劃體系包括,5年短期規(guī)劃,完成5個已規(guī)劃專題庫建設(shè),正式運(yùn)行并按權(quán)限原則對外開放;10年中長期規(guī)劃,新增“西域古籍專題庫”、“西域古地圖地理信息專題庫”、“西域當(dāng)代藝術(shù)專題庫”等,擴(kuò)充至8個專題庫。
(1)“平臺聚、分庫?!?。數(shù)據(jù)資源按不同的專題數(shù)據(jù)庫進(jìn)行組織,各專題數(shù)據(jù)庫的數(shù)據(jù)資源和目標(biāo)用戶由其主題決定,但專題數(shù)據(jù)庫形成集群,由數(shù)字西域服務(wù)平臺聚合在一起呈現(xiàn)給用戶。
(2)數(shù)據(jù)資源多樣性整合。除傳統(tǒng)的文獻(xiàn)、圖片和視頻外,研究西域歷史文化的資源還包括三維模型、遙感影像、空間矢量數(shù)據(jù)等。
(3)多重保障數(shù)據(jù)資源可持續(xù)更新。由塔里木大學(xué)西域文化研究院組織牽頭,以提供數(shù)據(jù)庫使用權(quán)限等方式聚集更多單位合作共建,促進(jìn)資源交換整合。面向個人用戶,數(shù)字西域平臺會采取嚴(yán)格的權(quán)限控制,實(shí)行資源互換和適當(dāng)收費(fèi)兩種方式,保障數(shù)字資源的可持續(xù)更新。
(4)人力資源整合,培養(yǎng)復(fù)合型人才。數(shù)字西域平臺建設(shè)是多學(xué)科、多領(lǐng)域?qū)<覍W(xué)者合作共贏的過程,應(yīng)借此契機(jī)培養(yǎng)復(fù)合型數(shù)據(jù)庫建設(shè)人才,避免知識不全面性對平臺發(fā)展的制約。
經(jīng)過對國內(nèi)8個西域歷史文化類數(shù)據(jù)庫的調(diào)查發(fā)現(xiàn),現(xiàn)有數(shù)據(jù)庫在選題建庫和系統(tǒng)功能等方面用戶滿意度較高,但在數(shù)據(jù)資源方面用戶滿意度較低,從而導(dǎo)致用戶整體滿意度差異較大,分析認(rèn)為其制約因素主要包括:缺少整合資源的組織機(jī)構(gòu)、商業(yè)驅(qū)動力不足、專業(yè)性與通俗性之間的矛盾、建設(shè)人才知識的不全面性等。在此基礎(chǔ)上,結(jié)合塔里木大學(xué)數(shù)字西域平臺的建設(shè)情況,提出四點(diǎn)建設(shè)策略,即:(1)“平臺聚、分庫?!钡慕ㄔO(shè)思路;(2)多源數(shù)據(jù)整合的技術(shù)手段;(3)可持續(xù)更新的運(yùn)營能力;(4)復(fù)合型的建庫人才。在未來的建設(shè)中,堅(jiān)持塔里木大學(xué)在平臺建設(shè)中主體地位,對服務(wù)平臺進(jìn)行關(guān)鍵技術(shù)的自主設(shè)計(jì)研發(fā),同時綜合利用自主研發(fā)、合作共建、委托企業(yè)搭建、購買重組等方式建設(shè)專題庫,通過多源數(shù)據(jù)融合技術(shù)、跨庫檢索技術(shù)改善兩者連接方式,以提高資源的利用效率和研究價(jià)值,并獲得優(yōu)質(zhì)的用戶體驗(yàn),為西域歷史文化研究提供專業(yè)、準(zhǔn)確、便捷的信息獲取源,也力爭成為塔里木大學(xué)在西域研究領(lǐng)域的特色品牌,最終服務(wù)于國家“一路一帶”倡議、實(shí)現(xiàn)新疆工作總目標(biāo)和兵團(tuán)向南發(fā)展。
致謝
本文在成文過程中,萬朝林老師提出了有意義的觀點(diǎn)及建議。作者在此表示衷心感謝。