張 洋,張方鋼,范忠勇,張曉紅,周 昕
(1.浙江自然博物館,浙江杭州 310014;2.杭州市市區(qū)河道監(jiān)管中心,浙江杭州 310008)
自然博物館植物標本數(shù)字化平臺的構(gòu)建與思考
張 洋1,張方鋼1,范忠勇1,張曉紅2,周 昕1
(1.浙江自然博物館,浙江杭州 310014;2.杭州市市區(qū)河道監(jiān)管中心,浙江杭州 310008)
根據(jù)館藏植物標本的特點,制定出一套適合的數(shù)字化工作流程,包括完善采集信息、分類鑒定、粘貼條形碼、拍攝照片及圖像處理及錄入信息等。數(shù)字化工作面臨工作量巨大、難度高、專業(yè)技術(shù)人才不足等問題,需要資金及時間保證,應(yīng)通盤考慮、穩(wěn)步推進。
自然博物館;植物標本;數(shù)字化;數(shù)字化平臺
文獻著錄格式:張洋,張方鋼,范忠勇,等.自然博物館植物標本數(shù)字化平臺的構(gòu)建與思考[J].浙江農(nóng)業(yè)科學(xué),2015,56(9):1520-1523.
DOI 10.16178/j.issn.0528-9017.20150959
“數(shù)字化”從英文Digitize翻譯過來,是“使數(shù)字化”的意思。我國學(xué)者陳宏京在其論著中對“數(shù)字化”的定義做出闡釋,數(shù)字化是“把信息用電磁介質(zhì),按二進制編碼的方式加以儲存和處理,把原先用紙張或化學(xué)感光材料記錄和存儲的事物藏品信息,轉(zhuǎn)變?yōu)橛糜嬎銠C存儲和處理的信息”[1]。植物標本是植物學(xué)工作者長期從事科研活動的積累和人類自然遺產(chǎn)的永久記錄之一,是研究物種的分布及其歷史、現(xiàn)狀、系統(tǒng)演化的證據(jù)[2]。植物標本作為保藏植物資源和植物信息的一種基本手段,為植物資源管理和利用提供了重要的科學(xué)依據(jù),是其他各種單純的文字記錄所不能取代的[3]。目前,國內(nèi)針對植物標本數(shù)字化的研究主要集中在高校及科研院所,專門針對自然博物館的植物標本數(shù)字化的研究幾無報道。本文分析自然博物館數(shù)字化工作的意義和必要性,介紹工作流程,思考和總結(jié)數(shù)字化過程中的問題與經(jīng)驗,旨在為國內(nèi)其他自然類博物館構(gòu)建植物標本數(shù)字化系統(tǒng)起到參考作用。
植物標本數(shù)字化工作的起始可以追溯到20世紀,澳大利亞走在前列,20世紀70年代中期開始了標本館標本的數(shù)字化工作[4]。20世紀八九十年代,數(shù)字技術(shù)和網(wǎng)絡(luò)信息技術(shù)興起并在短時間內(nèi)飛速發(fā)展,一批植物標本數(shù)字化平臺在構(gòu)建。由美國阿拉巴馬大學(xué)牽頭的美國東南部地區(qū)各小型標本館的植物標本信息系統(tǒng)SERFIS起始于80年代末;由美國加利福尼亞州大學(xué)Berkeley分校牽頭的美國西部地區(qū)加利福尼亞植物標本館標本管理系統(tǒng)SMASCH起始于90年代初,都致力于建立中小標本館共享數(shù)據(jù)庫,以及致力于數(shù)據(jù)庫的標準化及網(wǎng)絡(luò)化的工作。英國愛丁堡皇家植物園的PANDORA于1986年開始研制,經(jīng)過十多年不斷的改進,現(xiàn)已成為可包含由標本采集到文獻資料幾乎無所不包的應(yīng)用軟件[5]。
進入21世紀,全球植物標本數(shù)字化工作空前發(fā)展。據(jù)粗略估計,保藏在世界各大標本館和研究機構(gòu)的標本達25~30億份,估計有5%~10%已被數(shù)字化[6];互聯(lián)網(wǎng)的發(fā)展,使大量數(shù)字化的標本信息可以被訪問。著名的哈佛大學(xué)植物標本館收藏的生物標本現(xiàn)已超過500萬份,是目前世界上收藏標本數(shù)量最多的十大標本館之一。截至2015年3月,館藏標本數(shù)據(jù)庫系統(tǒng)中包含超過526 467份植物標本檔案信息和10萬份維管植物、苔蘚植物模式標本的相關(guān)文獻資料。除美國外,歐洲許多國家的標本數(shù)據(jù)庫也具有相當(dāng)規(guī)模。荷蘭國家植物標本館在組建后不久,在實體標本館的基礎(chǔ)之上又建立起荷蘭虛擬植物博物館(NHN),目前NHN中已有350 000號植物標本完成了數(shù)字化[7]。全球生物多樣性信息網(wǎng)絡(luò)(GBIF)作為全球最有影響、最大的生物多樣性信息數(shù)據(jù)庫和服務(wù)機構(gòu),目前有超過100個國家和機構(gòu)作為成員加入,超過4.6億條(截至2014年7月)數(shù)據(jù)在全球免費共享,其中有經(jīng)緯度記錄的有花植物標本信息達2 700萬份。
據(jù)粗略估計,我國數(shù)百個標本館共保存植物標本約1 700萬份,涵蓋中國全部植物物種和世界物種約5萬種[8]。在國家自然科學(xué)基金和美國科學(xué)基金的資助下,我國中山大學(xué)植物標本館于1994年與美國阿拉巴馬大學(xué)合作研制植物標本數(shù)據(jù)庫; 1997年,在國家自然科學(xué)基金的資助下,中山大學(xué)又與廣西植物研究所標本館聯(lián)合研制共享標本數(shù)據(jù)庫,數(shù)據(jù)庫當(dāng)時已錄入近1萬份標本資料[5]。2004年,以中科院標本館為主體,包括部分高校共同參與的“中國數(shù)字植物標本館”(Chinese Virtual Herbarium,簡稱CVH)開始啟動。2007年,最新的中國數(shù)字植物標本館建成,人們通過網(wǎng)絡(luò)就可以查詢到植物的標本、生長地、圖像、鑒定信息等相關(guān)內(nèi)容。截至2015年3月,從CVH網(wǎng)站上了解到,數(shù)字化標本庫已經(jīng)收錄有約331萬份植物標本,其中167萬份標本帶有照片,180萬份標本帶有地標數(shù)據(jù)。
2.1 目的
2.2 意義
2.2.1 對博物館標本深入研究有重要意義
全球化是當(dāng)今社會的發(fā)展趨勢,博物館館藏資源屬于社會共有財富,需要實現(xiàn)全球化共享以發(fā)揮其最大作用。這是時代賦予博物館的新的使命——將珍貴而又豐富的文化種子播散到世界的每一個角落[8]。標本數(shù)據(jù)輸入網(wǎng)絡(luò)平臺,不僅能實現(xiàn)世界植物研究的資源共享,更能使館藏標本與國際國內(nèi)研究接軌。數(shù)字化使這些標本得到更加廣泛的應(yīng)用,如傳統(tǒng)分類學(xué)修訂,名錄和鑒定手冊的編輯,植物志的編纂,地理分布圖的繪制,物種多樣性空間格局和動態(tài)的分析,生活史和物候?qū)W的研究,珍稀瀕危物種的保護生物學(xué),外來入侵物種的管理等[4]。
2.2.2 對博物館標本的管理有重要意義
平臺建立之后,可對館藏植物標本進行詳盡統(tǒng)計和科學(xué)管理,能將各個科、屬包含的標本數(shù)量的數(shù)字精確到“個”。對于館藏標本較少的科可重點采集或征集,提高館藏標本的存儲量,彌補館藏植物標本的不足,提升藏品質(zhì)量。同時,采自不同地區(qū)的標本數(shù)量也可統(tǒng)計,以便對不同地區(qū)植物標本有針對性地采集或征集,也可增加標本的地域豐富性。此外,有翔實的數(shù)據(jù)為依據(jù),選擇那些與其他單位進行交換的復(fù)份標本將不會盲目。
2.2.3 是博物館數(shù)字化的重要組成部分
進入21世紀,國內(nèi)各類博物館的數(shù)字化建設(shè)發(fā)展迅猛。早在“十五”計劃期間,我國政府已經(jīng)將標本資源作為國家重點自然科技資源,并立項對生物標本資源進行標準化采集、整理整合,在此基礎(chǔ)上構(gòu)建國家級虛擬博物館,實現(xiàn)資源的社會共享。藏品的數(shù)字化能推動博物館的數(shù)字化進程,擴大博物館的服務(wù)功能,為博物館標本收藏與管理研究開辟新的領(lǐng)域,并為這一領(lǐng)域的拓展提出新的思路和途徑。
3.觀察組和對照組患者病情復(fù)發(fā)情況:2組CP患者定期隨訪1年,觀察組復(fù)發(fā)2例,復(fù)發(fā)率1.4%;對照組復(fù)發(fā)15例,復(fù)發(fā)率10.9%。觀察組CP患者病情復(fù)發(fā)率顯著低于對照組,差異有統(tǒng)計學(xué)意義(P<0.05)。
3.1 浙江自然博物館植物標本館現(xiàn)狀
浙江自然博物館植物標本館建立于1929年,館藏標本6萬余份;被國際植物分類學(xué)會注冊認可,國際代碼為ZM。所藏標本主要為浙江省內(nèi)高等植物蠟葉標本,以及江西、四川、廣西、云南等省份的標本。本館館藏的蕨類植物標本采用秦仁昌分類系統(tǒng),種子植物標本采用恩格勒系統(tǒng),置于密集柜存放。浙江自然博物館自2004年起用至今的藏品管理系統(tǒng),為“億博”博物館綜合管理信息系統(tǒng)。主要欄目有藏品搜集、藏品登錄、綜合信息、文檔管理、賬務(wù)管理、資料查看、變動申請、庫房管理、綜合統(tǒng)計、物種信息等。
目前,本館植物標本管理面臨一些問題:蠟葉標本屬于易損易耗藏品,頻繁的查閱使用,會導(dǎo)致館藏標本不同程度受到損壞,研究價值相應(yīng)降低。此外,我館的“億博”藏品管理系統(tǒng)也有不足之處。比如,“億博”統(tǒng)計的是每個“號”的標本情況,但是一個“號”內(nèi)標本的份數(shù)是沒有記錄的;再如,采集信息不全和缺乏照片給管理者與使用者造成不便。這些問題的存在使得構(gòu)建植物標本數(shù)字化平臺,成為目前本館非常必要的工作。
3.2 植物標本數(shù)字化平臺構(gòu)建的方法
“浙江自然博物館植物標本數(shù)字化與共享”項目是科技部“國家標本資源共享平臺”項目(NSII)支持下的“植物標本資源共享子平臺”(CVH)課題之一。于2014年初開始,根據(jù)館藏植物標本的特點,制定出一套適合的工作流程(圖1)。
圖1 植物標本數(shù)字化平臺構(gòu)建流程圖
3.2.1 完善采集信息
一份合格且有保存價值的植物標本,應(yīng)包括植物標本本身、標本館標記、采集記錄、鑒定記錄等4大方面。采集信息包含采集人、采集號、采集日期、地點、生境、海拔、習(xí)性、植物高度、葉、花、果等簡單特征及科名、種名、用途等重要信息,完善采集記錄成為數(shù)字化工作中首要的、必需的前期工作。
3.2.2 分類鑒定
先由植物分類學(xué)專家將所有標本逐一、無遺漏地進行分類鑒定,保證絕大多數(shù)標本鑒定到種的水平。
3.2.3 粘貼條形碼
條形碼可謂每份植物標本的身份證,也是數(shù)字化平臺建成后用于標本管理、查找的有效編碼。
3.2.4 拍攝照片及圖像處理
照片拍攝是標本數(shù)字化中關(guān)鍵的步驟,影像信息在數(shù)字化平臺構(gòu)建中具有非常特殊的價值。拍攝植物蠟葉標本所用的器材包括:數(shù)碼相機、變焦鏡頭、翻拍架、閃光燈等。
拍照采用RAW格式,得到最原始的照片,可作為原始圖像文件的永久性備份格式,以便日后之需。照片拍攝完成后需要后期處理,利用photoshop或者faststone viewer軟件,將RAW格式的照片轉(zhuǎn)換為JPG格式(圖2),并用條碼號重命名照片,使照片與錄入信息相對應(yīng)。
圖2 已經(jīng)拍攝的植物蠟葉標本照片
3.2.5 信息錄入電腦
標本信息的錄入由專門的錄入人員完成,采用中科院北京植物所的Ginko V 3.0系統(tǒng),實現(xiàn)信息錄入電腦。
標本數(shù)字化工作任務(wù)繁重,需要一定財力支持。一般自然類博物館的館藏植物標本總量龐大,導(dǎo)致了工作量的巨大。如館藏植物標本數(shù)量為6萬件,僅拍攝照片一步環(huán)節(jié)為例,以每天拍300張照片為平均值,6萬份標本需要拍攝200 d。加上前期準備、后期圖片處理、錄入電腦,平臺初步建成至少需要2~3年。期間,聘請分類專家、拍攝人員、錄入人員等,勞務(wù)支出較大。時間的投入,經(jīng)費以及人力物力的保證,是構(gòu)建好平臺的基礎(chǔ)。
標本數(shù)字化工作是一項有難度、要求嚴的長期性工作,應(yīng)通盤考慮,穩(wěn)步推進。浙江自然博物館保存的6萬份植物標本,采集時間從1929年至今逾85年的跨度,采集地點分布全省乃至全國不同地區(qū);標本采集人員所做的原始采集記錄的方式各有不同,一些歷史較久遠的標本,其標簽上大量的手寫字體不僅需要辨認,更需依賴于植物學(xué)背景知識,這大大增加了標本信息完善工作的難度,對信息轉(zhuǎn)錄工作人員及后續(xù)的錄入人員有較高的要求。其他自然類博物館也面臨同樣問題,所以在平臺構(gòu)建過程中,不能貪多求快,應(yīng)該在保證質(zhì)量的前提下,穩(wěn)步推進。
數(shù)字化平臺建設(shè)離不開人才隊伍的建設(shè),掌握分類學(xué)知識的專家和信息技術(shù)的人才是標本數(shù)字化的強有力支持。工作中要進行標本鑒定,首先需要專業(yè)的植物分類學(xué)鑒定專家。標本照片拍攝,圖像后期處理、保存、管理,信息錄入等工作環(huán)節(jié)涉及多方面的技術(shù),如攝像技術(shù)、燈光控制技術(shù)、圖像處理技術(shù)、圖像格式轉(zhuǎn)化技術(shù)和保存技術(shù)等等,需要信息技術(shù)人才。合理利用各類人才,標本數(shù)字化工作才能順利開展,同時,平臺構(gòu)建也需要各類人才通力合作才能完成。
植物標本數(shù)字化工作可為其他館藏藏品的數(shù)字化提供借鑒。自然類博物館館藏標本門類齊全,珍品薈萃,一般除植物標本外還包含獸類、鳥類、魚類、兩棲類、爬行類、昆蟲及其他無脊椎動物標本,以及古生物化石、礦石標本等眾多類別。植物標本數(shù)字化平臺的構(gòu)建,不僅為國內(nèi)其他自然類博物館構(gòu)建植物標本數(shù)字化平臺起到表率作用,而且能夠為其他門類標本的未來數(shù)字化工作提供經(jīng)驗與參考。
[1] 陳宏京.數(shù)字化博物館的原理與方法[M].單機版.上海:復(fù)旦大學(xué)出版社,2002.
[2] 林春蕊,劉演,何成新,等.廣西植物標本館標本數(shù)字化信息統(tǒng)計與分析[J].廣西植物,2008,28(2):278-284.
[3] 孫權(quán),周廣柱,李竹林,等.薔薇科(Rosaceae)植物標本及其數(shù)字化處理技術(shù)研究[J].沈陽農(nóng)業(yè)大學(xué)學(xué)報:社會科學(xué)版,2014,16(3):353-357.
[4] 王利松,陳彬,紀力強,等.生物多樣性信息學(xué)研究進展[J].生物多樣性,2010,18(5):429-443.
[5] 李鳴光,繆汝槐,Xu Zhaoran.植物標本數(shù)據(jù)庫與生物多樣性研究[G]//面向21世紀的中國生物多樣性保護.北京:中國林業(yè)出版社,2000.
[6] Soberon J.Linking biodiversity information sources[J]. Trends in Ecology and Evolution,1999,14:291.
[7] 矯貴松.關(guān)于我國自然博物館生物標本數(shù)字化的方法研究[D].長春:東北師范大學(xué),2008.
[8] 傅立國.中國植物標本館索引[M].北京:中國科學(xué)技術(shù)出版社,1993.
(責(zé)任編輯:張瑞麟)
S 184;S 126
A
0528-9017(2015)09-1520-04
2015-07-12
張 洋(1983-),女,河北保定人,館員,碩士,主要從事植被生態(tài)學(xué)和植物分類學(xué)研究工作。E-mail:zhangy@ zmnh.com。