敖雪峰
(北京師范大學 歷史學院, 北京 100875)
?
影像史料數據庫建設研究初探
敖雪峰
(北京師范大學歷史學院, 北京100875)
史料是歷史學研究的基礎,搜集整理史料,建立數字史料數據庫,已經成為現代史料學的重要任務。以影像方式保存下來的歷史資料是學習和研究歷史的重要資源。搜集整理影像史料并構建相應的數字影像史料數據庫,成為現代史料學發(fā)展的必然,也是史料庫建設的新趨勢。該文在國內外史料數據庫研究現狀和存在問題的基礎上,結合北京師范大學歷史影像實驗室“近現代世界重大歷史事件影像史料庫”建設的實踐成果,針對影像史料數據庫建設過程中的史料搜集問題進行了分析,并就具體問題提出了相應的解決方案建議。
史料;實驗室;影像;數據庫
史料是歷史學研究的源泉。著名的近現代史家傅斯年說過“史料即史學”[1],也就是說歷史學研究的基礎其實是對史料的搜集、整理與運用。傅斯年認為只要把材料整理好,則事實自然顯明了[2]。也就是說應把史學研究建立在踏踏實實地挖掘史料上,而不是空泛的思考上。包含圖片和視頻在內的歷史影像,作為傳統文字媒介的補充,是記錄,傳承,表現歷史的新型重要媒介。以影像方式保存下來的歷史資料是學習和研究歷史的重要資源,而影像作為一種載體,是近現代史料得以保存和傳承的重要方式,已有的史料也可以通過數字化的方式以影像形式繼續(xù)保存?zhèn)鞒?。因此,真實的歷史影像無疑成為信息時代下史料的重要組成,是佐證歷史史實的有力根據。通過對影像史料進行搜集整理并構建相應的數字史料數據庫成為史料學發(fā)展的必然,也是史料庫建設的新趨勢。影像史料庫建設問題不同于一般的史料數據庫建設,由于其傳播媒介的新穎特性與歷史學的年代久遠特性之間存在的巨大差異,導致影像史料的搜集變得困難。而影像史料搜集的渠道具有隨意性和不正規(guī)性,因此導致史料的辨?zhèn)未嬲?、史料來源時間、創(chuàng)建者等問題都變得撲朔迷離。而在后期數據庫軟件系統構建過程中,由于存儲的多為圖片和視頻等多媒體格式,因此資源的格式標準、命名規(guī)則等問題也變得更加復雜。作為典型的多媒體數據庫系統,超越文本關鍵詞檢索的基于內容的檢索方法也是該過程中需要考慮的[3]。北京師范大學歷史影像實驗室,在倡導影像實踐教學之余,一直致力于歷史影像史料數據庫的建設工作。本文在對影像史料數據庫系統進行研究的基礎上,針對以上具體問題提出了一系列具體解決方案。并在“近現代世界重大歷史影像史料數據庫”建設項目實踐過程中,驗證了這些解決方案的可行性。
隨著信息時代的飛速發(fā)展,人類社會的方方面面,包括學習和研究都發(fā)生了巨大的變革[4]。信息資源變得極大豐富,其中的數字化史料也作為傳統史料的重要補充,充斥在大量的微機、電子存儲設備以及網絡上,這對于基于史料的史學研究來說,其途徑和方法都受到舉足輕重的影響。傳統史學家“上天入地下黃泉,動手動腳找材料”的研究模式已經悄然發(fā)生改變,史學家憑借信息檢索技術可通過電腦獲取部分或者全部數字史料資源,佐證自己的史學論點。
在國際上,數字史料數據庫建設工程已經非常成熟,很多著名機構都建立了針對特定史段、特定歷史類別的史料數據庫。比如,研究世界古代史的學者們所熟知的洛布古典叢書數據庫[5]。該數據庫提供重要的希臘和拉丁文學作品,供訪問者下載和在線瀏覽,作品涵蓋內容廣泛,其中包含史詩、抒情詩、悲劇和喜劇、歷史、哲學以及宗教文化等,是研究世界古代史及古典學的重要史料來源。同時,該數據庫對大部分入庫的書籍提供了原始和英文翻譯兩種文本版式,從而方便來自不同地方的研究者。還有,以色列亞德韋希姆大屠殺紀念館與美國谷歌公司合作,把世界最大規(guī)模的大屠殺史料上傳互聯網,同時,公眾還可以經由相關網絡組件與該大屠殺網絡史料數據庫進行互動交流。例如,口述自己的歷史故事,發(fā)表評論,提供關于大屠殺的文件資料等,從而促進以色列大屠殺史料庫的進一步完善[6]。再如,國外很多相關網站都提供兩次世界大戰(zhàn)的史料數據庫[7-10],其中包含有關兩次世界大戰(zhàn)的文字史料、圖片史料、口述史料等眾多史料信息,這些都是研究世界大戰(zhàn)的研究者寶貴的史料來源。
在國內,隨著信息技術的快速發(fā)展,近年來各種各樣的數字史料數據庫也層出不窮。比如,著名的《四庫全書》[11]《中國基本古籍庫》[12]《二十五史》[13]等,均是歷史學術圈內耳熟能詳的電子史料庫,不僅為中國古代歷史學習者和研究者提供了寶貴史料來源,而且方便用戶快速查詢、瀏覽相關史料,極大提升了學習和研究效率。由首都師范大學、南京師范大學、四川師范大學、鞍山師范學院4所師范院校與北京國學時代文化傳播有限公司共同研制的大型古籍專題數據庫——《中國古代文學史電子史料庫》[14],共收入從先秦到清代的中國文學典籍600多部,總字數達1億5千多萬,是研究古達文學史的重要數字化史料來源。臺灣大學圖書館與國民黨黨史館合作,進行史料檔案微縮拍攝與數字化作業(yè),并建置“中國國民黨史料數據庫”。數據庫內容包括“特種檔案”“漢口檔案”“近代人物書札”“中央前五部檔案”等類別,并可依人名、地名、年代、出生地等條件進行檢索,方便查找數據[15]。由北京大學圖書館聯合清華大學、南開大學、云南師范大學高校圖書館共同完成的“西南聯大史料數據庫”項目[16],建成了目錄集中、資源分布式的聯合型特色庫,并形成了長期共建共享的建設機制和服務機制,總數據量近2萬條,資料齊全、內容豐富,涵蓋了西南聯大教育思想、教育精神、西南聯大人物、中國教育史等諸多領域,可供學者和研究人員進行學術研究,具有重大現時意義和學術研究價值。
雖然國內外史料數據庫建設成果都頗為豐厚,但綜觀起來,也存在一定的問題。主要問題在于史料數據庫的基本史料數據還停留在傳統史料界定模式中。在信息技術被引入歷史學以前,傳統史料可概括為4大類:第一類為書報,包括歷史記錄、歷史著作、文獻匯編和史部以外的群籍;第二類為文件,包括政府文件、團體文件和私人文件;第三類為實物,包括生產工具、生活資料和歷史事件的遺跡;第四類為口碑,包括回憶錄、調查記錄、群眾傳說和文藝作品[17]。現有的史料數據庫基本上都是由這幾類傳統史料的數字元文件構成。在信息多媒體技術和影音技術蓬勃發(fā)展的當代,影像史料作為傳統史料的重要補充,已經成為歷史學研究不可或缺的重要的基礎史料來源,但史料數據庫建設工程還是針對傳統的史料,并沒有將具有有力佐證歷史史實意義的影像史料納入史料數據庫的基本數據范疇,這就使得影像史料數據庫的研究工作和建設工作都相對滯后。影像史料庫不同于傳統的歷史文獻史料數據庫,其中包含圖片和視頻格式的多媒體數據文件。這些多媒體數據文件本身具有格式多樣、文件復雜、數據量大的特點,而且現有的影像史料具有分布不均、命名隨意、無規(guī)則性等弊病。這些現實問題的存在都為影像史料的搜集與整理,相應數據庫的建立、瀏覽和檢索增加了難度。
與傳統史料數據庫不同的是,影像史料數據庫針對的是以圖像和視頻存儲格式為主的歷史資料。如今歷史文獻資料已經浩如煙海。相比文字史料的繁榮景象,記錄真實歷史場景的圖片和視頻要稀少得多;而在本來就為數不多的大集合里,還有相當一部分被相關機構收藏壟斷,普通學者能夠訪問到的只占很少一部分;另外由于研究者本身的信息檢索技術水平有限,即使面對面向大眾公開的影像史料,研究者想要獲取也是束手無策。
3.1影像形式的歷史資料稀少
攝影技術于19世紀40年代才開始被發(fā)明[18],這意味著只有19世紀40年代之后發(fā)生的歷史事件和場景才有可能以圖像形式存世,因此影像史料所能涵蓋的史段被限制在19世紀40年代到當代的這個史段內?,F有為數不多的影像史料庫建設工作,基本上都是針對近現代史或當代史展開,而對于更早的史段則顯得有心無力。至于有關更早史段的圖像或視頻資料,大多是由后人根據文字史料進行藝術創(chuàng)造加工而成。這些人為創(chuàng)作的影像資料能否真正被稱作史料還有待商榷,影像資料的歷史性和藝術性鑒定是另外一個話題,在本文中不作分析。歷史時間久遠的特性與現代影音多媒體技術的新穎性存在天然的鴻溝,這使得影像史料的搜集被限定在特定的史段內。
在攝影技術發(fā)明之后,可以利用影像設備將相關歷史人物或者歷史事件的現實場景進行采集,這在以前是無法想象的。但是即使夢想終于得以變成現實,這種機會也是極其罕見的。特別是年代越久遠,相關的影像資料越匱乏。年代久遠的歷史缺乏影像記錄,主要由兩個原因決定:首先,由于技術的成熟度還遠遠不夠,人們的意識也處于萌芽階段,導致采取影像記錄史實的方式本身具有意識上和技術上的局限性,僅有及其少量的歷史史實在特殊的機遇之下通過影像的方式被記錄下來;其次,由于早期的影像存儲條件有限,在進入數字時代以前,照片和視頻以膠片方式保存[18],早期的膠片備份無法做到長期保存,這也導致很多老照片和舊視頻處于破損毀壞,甚至消失的狀態(tài)。
由于意識薄弱,技術缺乏,加之后期保存手段落后,針對年代久遠的歷史照片和視頻極其稀少,這也是我們前期搜集工作無法逾越的障礙。針對影像資料匱乏的問題,雖然無法從根本上給予解決,但是可以通過圖像復原技術和視頻修復技術等對破損的影像進行修復再現。目前的圖像復原技術主要針對數字圖像[19],可以將早期膠片圖像先進行數字化處理,然后通過數字圖像修復技術對原始影像進行還原。另外,研究者應時刻懷抱憂患意識和緊迫感,對于即將損毀的珍稀影像能夠做到及時搶救;否則,隨著時間的流逝,此問題只會變得愈加嚴峻。對嚴格的史料界定范圍來說,原始歷史影像資料的集合已經確定,已無任何延拓發(fā)展的可能。但是如果可以擴大影像史料的定義范圍,將部分后人對于之前歷史進行藝術再加工而成的影像,如畫像、紀錄片、電視和電影等也稱作影像史料的話,那么可以通過推動歷史影像創(chuàng)作來豐富完善相關影像史料的規(guī)模。
3.2相關機構的壟斷性收藏
隨著攝影技術的日益革新和成熟,人們利用照片和錄像的方式來記錄當下正在發(fā)生的歷史的意識和興趣也大大加強,關于近現代史段的影像資料變得豐富起來,且越接近當代史段,相關歷史影像資料愈加豐富。特別是1946年發(fā)明計算機以來,照片和視頻也漸漸脫離膠片存儲時代,朝著數字時代蓬勃發(fā)展[20]。數碼照相機和數碼攝像機的發(fā)明使得影像采集工作變得易如反掌,進一步促進了影像多媒體技術的飛速發(fā)展[21]。影像作為一種記錄媒介,逐漸成為一種與書寫文字互相抗衡的重要載體。近現代的許多重大歷史事件,如兩次世界大戰(zhàn)和蘇聯解體等,除了諸多的文字記述,還有為數眾多的照片和影像資料提供強有力的佐證。雖然關于近現代史段的影像資料本身比較豐富,但是由于存儲不當,損毀而消失的也不在少數。特別是大量珍貴的史實影像被少部分影視機構和檔案館等機構獨占,普通的研究者無法企及。研究者如果想要接觸相關史料,需要具備巨大的財力和強大的人脈關系。對于專注于學術的史學研究項目而言,可供支配的經費是極其有限的,而且從事研究的學者本身慣于孤燈暗影,也無可利用的社交關系,這些現實因素使得影像史料搜集工作變得異常困難。
針對相關機構對歷史影像資料進行壟斷性收藏的問題,如何有效規(guī)避,要從兩個方面進行考慮。一方面,可以呼吁政府對于史學研究機構,在政策上或財力上給予更大力度的支持,幫助研究機構從收藏機構獲取其所需要的影像資料;另一方面,相關研究機構也可以擴大自己的社會影響力,尋求與資料擁有方的合作機會,通過溝通協商的方式從對方獲取相關影像資料。而對于史學研究者個人,也要盡量擺脫傳統的孤身奮戰(zhàn)的研究模式,認識到合作才是解決問題的途徑,創(chuàng)造必要的社交資源,不至于面對影像史料收藏方一籌莫展。
3.3信息檢索技術限制
排除由于硬性因素無法訪問的影像史料,目前普通研究者可以接觸的影像資料大都保存在歷史圖書、圖片集、視音頻出版物、網絡圖片數據庫、網絡視頻數據庫、相關機構服務器以及個人服務器上。針對紙質的歷史圖書和圖片集,一般可在研究機構的圖書館或檔案館中查找,與普通紙質文獻圖書的檢索過程無異,不會對史學研究者造成太大的困擾。但是這部分保存的圖片資源還是占少數,而且無法承載歷史視頻資源。視音頻出版物可在市面上購置,技術上沒有困難,但是真正出版發(fā)行的關于史實記載的視音頻非常稀少。大多數歷史圖片及歷史視頻都以比較零散的狀態(tài)分布在網絡上。從浩如煙海的網絡資源中,檢索出與自己研究主題契合,提供佐證史論觀點的影像史料,不僅需要扎實的史料分析能力,更需要較強的多媒體信息檢索技能。但是縱觀國內史學界,史學研究人才大多信息技術水平欠缺,專業(yè)信息檢索技能尤其缺乏。首先,影像資料檢索及獲取工作本身的技術難度較大,對于普通的史學研究工作者來說掌握起來比較困難;其次,傳統史學研究工作者對于新興技術不重視,有些甚至還有抵觸情緒,提升信息水平的意識比較薄弱。
要解決信息檢索技術限制帶來的搜集困難,需對傳統歷史學研究者灌輸跨學科研究的觀念,讓他們意識到現代數字技術與歷史學研究之間的密切關系,從而讓其從主觀上接受現代信息技術的重要性,努力操練,加強自身的影像資料以及數字資料的技術能力。研究機構應積極為樂于接受新技術的研究者提供必要的培訓,幫助其盡快提升相關信息技能。當然,史學工作者也可以與技術工作者一塊合作,將自己的需求告訴技術工作者,技術工作者則根據史學工作者提供的關鍵詞對相關影像資料進行檢索、掃描或下載等工作。但是,這樣的合作是否能夠成功,還建立在技術工作者的史學修為上。如果技術工作者沒有相關的史學素養(yǎng),可能根本無法理解史學工作者的研究需求,也達不到預期的檢索效果。
本文針對歷史影像史料數據庫建設過程中的史料搜集問題展開分析探討,在史料搜集實踐過程中,發(fā)現主要存在原始影像資料匱乏,所有權機構對原始影像資料的壟斷以及影像資料檢索和獲取技術較難3個問題,并針對這3個具體問題進行了分析和相關解決方案的探討。通過分析研究,提出研究者需要努力提升多媒體信息檢索以及影像修復等相關技術水平,同時積極尋求與所有權機構的合作,或者申請上級部門的支持,盡量將搜集過程中的困難降到最低。
[1]李勇.作為史學雙翼的史料與理論——— 重讀翦伯贊《歷史哲學教程》《史料與史學》[J]. 淮北師范大學學報(哲學社會科學版), 2011,32(3):8-11.
[2]謝勤亮. 影像與歷史: “影視史學”及其實踐與試驗[J]. 現代傳播, 2007(2):79-83.
[3]王璐, 胡麗文. 基于內容的圖像檢索方法[J]. 現代情報, 2005(7):138-140.
[4]張鳳英.當代史料數據庫的建設[J].衡陽師范學院學報:社會科學版, 2000,21(1):106-108.
[5]顧鈞. 用古籍拯救世道人心——洛布古典叢書百年[J].博覽群書, 2011(6):53-55.
[6]京華時報. 以色列數字化大屠殺史料[EB/OL]. (2011-01-28). http://epaper.jinghua.cn/html/2011-01/28/content_627613.htm.
[7]Michael Duffy . First World War.com[EB/OL].[2014-12-23].http://firstworldwar.com.
[8] A&E Television Networks . World War I - Battles, Facts, Videos & Pictures[EB/OL].[2014-12-23]. http://www.history.com/topics/world-war-i .
[9] A&E Television Networks . World War II - Battles, Facts, Videos & Pictures[EB/OL].[2014-12-23]. http://www.history.com/topics/world-war-ii.
[10]SECONDWORLDWAR.CO.UK.Second World War[EB/OL].[2014-12-23]. http://secondworldwar.co.uk.
[11]汪受寬,劉鳳強. 《四庫全書》研究的回顧與思考[J]. 史學史研究, 2005(1):62-66.
[12]毛建軍. 《中國基本古籍庫 》的特色與啟示——兼談古籍全文數據庫的標準與規(guī)范[J].管理學刊, 2009, 22(1):104-106.
[13]南開大學組合數學研究中心,天津永川軟件技術有限公司.二十五史全文檢索系統(網絡版)[EB/OL].[2014-12-23] .http://202.114.65.57/net25.
[14]金辛. 《中國古代文學史電子史料庫》簡介[J]. 南京師范大學文學院學報, 2004(2):23.
[15]中國臺灣大學圖書館,國民黨黨史館. “國民黨史料數據庫”[J].數字與縮微影像,2008(2):38.
[16]北京大學圖書館.西南聯大史料庫[EB/OL].[2014-12-23].http://localsev.lib.pku.edu.cn/lianda/home/index.asp.
[17]黃海霞.史料與歷史教學[J]. 教育教學論壇,2013(14):128-129.
[18]平占斌.意外的發(fā)現與發(fā)明[J]. 發(fā)明與創(chuàng)新,2009(4):17.
[19]鄭慧穎.圖像修復和視頻修復算法的研究[D].長春:吉林大學,2009.
[20]李劍峰.計算機發(fā)明之前的計算[N].電腦報,2014-4-14(14).
[21]趙欣,張亮.開啟數字影像時代數碼相機及CCD發(fā)明的故事[J] .數字通信,2006(18):46-51.
Initial Exploration of the Construction of Imagery History Materials
AO Xuefeng
(School of History, Beijing Normal University, Beijing 100875, China)
History materials are the fundamental of the research in history discipline. It has become an important task to search and sort history materials and construct relative history material databases. The history materials which are stored in imagery form are important resources for studying and researching history. Searching and sorting imagery history materials and constructing relative databases are not only becoming necessary in the development in modern studying of history materials, but also the new trends of constructing history materials databases. This paper analyzed the problems of searching history materials and proposed corresponding solutions to these problems, combining the practical achievements of historiophoty laboratory, based on the research status at home and abroad,
history materials;laboratory;images and videos;databases
G482.0
A
10.3969/j.issn.1672-4550.2016.01.058
-------------------- 2015-01-08;修改日期: 2015-03-19
中央高?;究蒲袠I(yè)務費專項資金(105579GK)。
敖雪峰(1984-),碩士,講師,主要從事影像史學,教育技術與歷史教學方面的工作。