趙新
摘要:古籍?dāng)?shù)字化是數(shù)字出版系統(tǒng)工程的重要組成部分,《儒藏》工程是中國與韓、日、越諸國進(jìn)行古籍文獻(xiàn)密切合作的成功范例。古籍自身的文本特性以及古籍整理出版的目的,決定古籍?dāng)?shù)字化宜采取優(yōu)先服務(wù)學(xué)術(shù)研究的價(jià)值理念。該價(jià)值取向也決定古籍?dāng)?shù)字化技術(shù)系統(tǒng)的建構(gòu)方向,必須改變過去單純以“求全率”與“求準(zhǔn)率”為標(biāo)準(zhǔn)的檢索功能,轉(zhuǎn)變?yōu)檎嬲匝芯空邽槿∠虻母叨酥悄軝z索系統(tǒng)。古籍?dāng)?shù)字化從學(xué)術(shù)研究走向文化普及,必須充分發(fā)揮“1人機(jī)結(jié)合”的優(yōu)勢(shì),推進(jìn)學(xué)術(shù)研究和數(shù)字技術(shù)雙方的合作。
關(guān)鍵詞:古籍?dāng)?shù)字化;價(jià)值理念;文化普及
在十幾年前的中國出版界,數(shù)字出版還是一個(gè)充滿爭(zhēng)議性的話題,歷史悠久的印刷技術(shù)似乎造就了我們更倚重書本的傳統(tǒng)。麥克盧漢說,今天的加速度趨向于全方位,經(jīng)濟(jì)的任何一部分感受到加速發(fā)展的時(shí)候,其余的部分必然群起效法。當(dāng)前,電子技術(shù)變革的總體前景非常清晰,加速度仍將持續(xù)下去,這已不可阻擋。世界圖書市場(chǎng)數(shù)字化依然在加速推進(jìn),而且隨著習(xí)慣于“讀屏?xí)r代”的消費(fèi)群體的快速成長、盜版和免費(fèi)資源的日益泛濫以及傳統(tǒng)出版營銷成本的逐年走高等多種因素的沖擊,傳統(tǒng)紙質(zhì)出版正面臨著艱難的轉(zhuǎn)型。目前擺在人們眼前的已經(jīng)是如何去做、如何做得更好的問題了。
古籍的數(shù)字化當(dāng)然也無法置身事外。古籍?dāng)?shù)字化關(guān)注的首要問題是紙質(zhì)圖書,特別是古籍會(huì)消亡嗎?美國達(dá)恩頓教授戲謔地說,我們制造的信息遠(yuǎn)遠(yuǎn)超過能夠完成的數(shù)字化信息。他例舉“谷歌圖書搜索計(jì)劃”有八個(gè)方面的技術(shù)難題很難被克服,其中最為主要的難題是盡管屏幕上顯示的掃描圖片正確無誤,但是還是不能抓住該書的關(guān)鍵,比如紙張材質(zhì)、印刷質(zhì)量和裝訂風(fēng)格的“感受”以及體驗(yàn)一本書所釋放出來的特別“氣味”,是任何電子書都無法提供的。所以,古籍的電子圖片遠(yuǎn)比不上觸摸原書來得興奮。中國古籍文本的特定形式——字體、開本、版式、裝幀、紙張材質(zhì)、印刷質(zhì)量、裝訂風(fēng)格、邊欄、天頭、地腳、書耳、行款、版心、魚尾甚至?xí)捻撨呑⒌榷际俏谋咀陨碚w結(jié)構(gòu)的一部分,這在文獻(xiàn)研究及版本考證等方面呈現(xiàn)的知識(shí)信息尤為重要,成為一種表達(dá)古籍文本意義的獨(dú)特結(jié)構(gòu)。比如說,西方采用羊皮裝訂成冊(cè),是橫向的閱讀方式;中國削竹成冊(cè),編定成卷,左右展開,形成的是上下排列、從右到左的閱讀習(xí)慣,進(jìn)而形成了東方民族式的裝幀風(fēng)格。對(duì)于上述問題,治中國書史的名家錢存訓(xùn)、張秀民、潘吉星諸位先生都有過詳盡的研究,此不贅述。紙質(zhì)古籍具有獨(dú)特的文化品位,某些物理形態(tài)是電子書無法提供或呈現(xiàn)出來的,比起電腦屏幕,許多人更喜歡紙上閱讀。故此,可以說紙質(zhì)古籍不會(huì)消失,它將會(huì)與數(shù)字出版共生。
2003年,楊牧之先生以文淵閣《四庫全書》電子版具有信息容量巨大、檢索快捷方便等優(yōu)勢(shì)為例,主張古籍?dāng)?shù)字化,認(rèn)為這是古籍整理發(fā)展的趨勢(shì),順應(yīng)這種變化是時(shí)代向古籍整理工作提出的新要求。這充分說明出版界的有識(shí)之士已認(rèn)識(shí)到古籍?dāng)?shù)字化是歷史發(fā)展的趨勢(shì)。從某種程度上說,中國古籍特別有利于建立大型的歷史文獻(xiàn)數(shù)據(jù)庫,我們有積存數(shù)千年浩如煙海的文獻(xiàn)典籍可以作為數(shù)字出版的內(nèi)容,且東亞地區(qū)長時(shí)期通行漢語,我們的優(yōu)勢(shì)表現(xiàn)得特別突出。《儒藏》精華編以收錄464種在中國學(xué)術(shù)思想上具有代表性的儒家典籍文獻(xiàn)為主,選收韓國、日本、越南歷史上以漢文著述的重要儒學(xué)著作100余種,共計(jì)339冊(cè),約2.5億字。四國古籍文獻(xiàn)均通用漢字,語種比較單一,更有利于聯(lián)合建立大型的歷史文獻(xiàn)電子文本數(shù)據(jù)庫和高效快捷的檢索系統(tǒng)。
尤其需要說明的是,古籍?dāng)?shù)字化與傳統(tǒng)紙質(zhì)出版在文本內(nèi)容以及目標(biāo)人群上并無根本差異,只是在使用文本的工具層面發(fā)生了變化。古籍?dāng)?shù)字化以古籍整理出版的內(nèi)容為基礎(chǔ)和前提,其目的與任務(wù)應(yīng)該與古籍整理出版的目的與任務(wù)協(xié)調(diào)一致,即主要還是服務(wù)于學(xué)術(shù)研究。目前甚至在未來很長一段時(shí)間內(nèi),這種狀況仍然不會(huì)改變,這表明古籍?dāng)?shù)字化必須采取優(yōu)先服務(wù)于學(xué)術(shù)研究的價(jià)值理念。
許逸民先生詳細(xì)地說明“中國古籍”的定義,認(rèn)為古籍的主體部分指的是1911年辛亥革命以前主要用漢文編撰出版的圖書。古籍文獻(xiàn)產(chǎn)生的歷史文化語境,一言以蔽之,主要是產(chǎn)生于并服務(wù)于傳統(tǒng)的知識(shí)精英群體。單說古籍呈現(xiàn)的文字內(nèi)容形式,如沈望舒先生說中國古籍最大的缺陷是整體表現(xiàn)形式上同現(xiàn)代讀者有隔膜,文字語言存在障礙。問題是歷史造成的,中國語言和文字的形、音、義都有時(shí)代的特點(diǎn),古今語言有—定差異。正如宋代朱熹所說:“當(dāng)時(shí)百姓都曉得者,有今時(shí)老師宿儒之所不曉?!保ā吨熳诱Z類》卷七十八)歷代語言可能所指事物古今不同,語法古今不同,特別是五四新文化運(yùn)動(dòng)以來,白話文深入人心,讀古籍者漸少。古籍的繁體豎排不加標(biāo)點(diǎn),古漢語語法、字詞義表達(dá)方式和現(xiàn)代漢語不同,對(duì)各類典故的生疏,客觀上縮小了讀者范圍。古代典籍自身的特點(diǎn),決定了古籍整理出版與其他圖書出版之間的差異,古籍整理出版工作,可以分為三個(gè)層次:第一層次,影印或數(shù)字化保存古籍;第二層次,供科研和教學(xué)人員使用;第三層次,給一般讀者閱讀。但是古籍整理主要是通過適當(dāng)?shù)姆绞?,使傳世的文獻(xiàn)典籍為當(dāng)代或未來的學(xué)術(shù)文化服務(wù)。金克木先生認(rèn)為整理古籍的目的有二:一是為專家和半專家(非本行的專家),一是為一般人和青少年,后一項(xiàng)還得加一個(gè)必不可少的前提條件:教育內(nèi)容和方法的改革能使將來的本國語文水平提高而不降低,不至于只會(huì)講“拜拜”而不懂“告辭”。古籍?dāng)?shù)字化服務(wù)群體主要是學(xué)術(shù)研究者,今后古籍?dāng)?shù)字化優(yōu)先解決的目標(biāo)取向仍是學(xué)術(shù)研究群體,這種分清先后秩序的工作理念尤其重要,實(shí)際上關(guān)涉建立古籍?dāng)?shù)字化技術(shù)系統(tǒng)的方向性問題。
古籍?dāng)?shù)字化以學(xué)術(shù)研究為優(yōu)先取向,就必須使其技術(shù)系統(tǒng)設(shè)計(jì)真正轉(zhuǎn)移到研究者本位上來,建立以學(xué)術(shù)研究為取向的古籍?dāng)?shù)據(jù)庫。二十多年來,中國古籍?dāng)?shù)字化的道路基本上是通過兩條路線進(jìn)行的:一條是利用計(jì)算機(jī)對(duì)古籍進(jìn)行揭示,建立古籍的書目數(shù)據(jù)庫,提供給讀者檢索使用;另一條是利用計(jì)算機(jī)對(duì)古籍的內(nèi)容進(jìn)行數(shù)字化并提供一些相關(guān)的知識(shí)工具,使讀者不僅能通過計(jì)算機(jī)閱讀古籍,而且能夠通過磁盤、光盤和網(wǎng)絡(luò)進(jìn)行傳播。顯然,這種數(shù)字化系統(tǒng)的設(shè)計(jì)并沒有考慮到使用者——尤其是研究者的需求,以致直到現(xiàn)在絕大多數(shù)研究者認(rèn)為檢索系統(tǒng)只能幫他們找資料,而不能幫忙整理或分析資料。故此,臺(tái)灣學(xué)者提出的“數(shù)位人文”概念對(duì)我們具有啟發(fā)意義,“數(shù)位人文”就是結(jié)合大量的數(shù)位材料,運(yùn)用資訊科技來從事人文研究。以研究為取向的系統(tǒng)在數(shù)字資料運(yùn)用上扮演了關(guān)鍵角色,只有建立起一個(gè)功能強(qiáng)大的系統(tǒng),使用者才能更自由地以自己研究所需去觀察史料,發(fā)掘史料間的脈絡(luò),展開自己的論述。臺(tái)灣學(xué)者項(xiàng)潔、翁稷安以“拼圖”和“積木”的思維說明傳統(tǒng)數(shù)字出版和以研究為取向的數(shù)字出版的不同:一片片拼圖雖然看似可以分開,但一定要合在一起才有意義,而其拼湊的方法只有一種,就是設(shè)計(jì)者給出的圖像;積木則大不相同,它可以依照使用者各種不同的想法和需要,拼造出各式各樣的組合。以研究為導(dǎo)向的系統(tǒng),便是能讓使用者可以更自由、更方便地去做出各種符合其研究需要的組合。試以《儒藏》精華編的數(shù)字化為例,隨著圖書電子版的逐漸推廣,版權(quán)問題得到解決,《儒藏》精華編在版本上線后存在的問題也會(huì)逐漸減少。可以采用“文本帶圖式”,即圖像版和文本版相結(jié)合,以提供精準(zhǔn)的校點(diǎn)文本為主,兼具原始底本和各種校本圖像。圖像版可以盡量保存底本與校本的原貌,使紙本古籍的原貌(包括物理形態(tài))盡量呈現(xiàn)出來。這樣,文本版和圖像版共存于同一環(huán)境之中,擴(kuò)大了傳統(tǒng)印刷版本的容量,使底本與不同校本在一個(gè)濃密的語境信息網(wǎng)絡(luò)中相互鏈接,交叉相連,形成了所謂“超文本”網(wǎng)絡(luò),每種古籍的內(nèi)容及價(jià)值都可以在多個(gè)層面上得到實(shí)現(xiàn),可以在校書過程中實(shí)現(xiàn)善本與各本互校,解決校對(duì)質(zhì)量問題和一些疑難問題,甚至發(fā)現(xiàn)許多新問題。這樣的“超文本”系統(tǒng)也必然存在開放的、具有各種不同鏈接可能的多元脈絡(luò),檢索系統(tǒng)也將會(huì)盡量開發(fā)出各版本之間的各種關(guān)聯(lián),并建立觀察脈絡(luò)的環(huán)境,讓檢索者或使用者可以自由地將檢索成果制訂成一個(gè)有意義或有問題意識(shí)的文件集,并提供各種方法讓使用者進(jìn)行文本間脈絡(luò)的觀察。
《儒藏》精華編最具特色之處是對(duì)于文本版的處理,計(jì)算機(jī)技術(shù)在此發(fā)揮了巨大作用。這其中有三大關(guān)鍵因素:首先,《儒藏》具有一套成熟規(guī)范的《儒藏》出版體例。文本版各個(gè)圖書部件在字體、字號(hào)、層級(jí)、排列次序等細(xì)節(jié)上都有細(xì)致入微的規(guī)定。其次,《儒藏》精華編是專收儒家文獻(xiàn)的典籍,種類單純,比較利于建立細(xì)致的文本分析功能、關(guān)鍵詞檢索、超文本鏈接等信息單元。最后,《儒藏》精華編文本內(nèi)容具有精準(zhǔn)性?!度宀亍肪幾肱c整理采用了簡(jiǎn)明校勘加現(xiàn)代標(biāo)點(diǎn)的排印方式,這樣做不僅避免了與已經(jīng)出版的一系列大型影印叢書的重復(fù),更重要的是迎合了人文與科技進(jìn)一步融合互動(dòng)的趨勢(shì)?!度宀亍肪A編數(shù)字化系統(tǒng)研究平臺(tái)的楊心就是建立以研究為導(dǎo)向的智能檢索系統(tǒng)。過去以“求準(zhǔn)率”或“求全率”作為評(píng)判系統(tǒng)的指標(biāo)可能僅僅是一個(gè)起點(diǎn),《儒藏》精華編數(shù)字化檢索系統(tǒng)不單是被動(dòng)地提供查找功能,且具有主動(dòng)開創(chuàng)新議題的能力?!度宀亍窋?shù)字檢索系統(tǒng)首先考慮到所收錄的儒家經(jīng)典的自身特性,量身定做出儒家經(jīng)典所需要的檢索系統(tǒng),充分吸收學(xué)界研究儒家典籍文獻(xiàn)的優(yōu)秀成果,形成一個(gè)具有開放性、多重脈絡(luò)的搜索系統(tǒng),可以嘗試將各種研究資源庫如知網(wǎng)、萬方等數(shù)據(jù)庫資源鏈接起來,形成研究資料豐富的“超文本”鏈接,在數(shù)據(jù)與數(shù)據(jù)之間建立有機(jī)聯(lián)系,進(jìn)行數(shù)據(jù)的深度加工與開發(fā),形成學(xué)術(shù)資源群,從而不斷挖掘出新的研究脈絡(luò)或方向,構(gòu)建起學(xué)術(shù)研究的整體大環(huán)境,以充分實(shí)現(xiàn)學(xué)術(shù)研究與數(shù)字技術(shù)的互動(dòng),形成“人機(jī)結(jié)合”的對(duì)話過程。
下面談古籍?dāng)?shù)字化的文化普及工作。達(dá)恩頓教授曾設(shè)想“電子書”可以設(shè)計(jì)成金字塔狀的多層次結(jié)構(gòu),讀者可以根據(jù)自身需要采用不同層次的閱讀方式和研究方式。這種思路不失為一種好的設(shè)想。金良年先生認(rèn)為古代知識(shí)精英文化如何將經(jīng)典大書轉(zhuǎn)化為通俗文化也值得我們深思。古籍?dāng)?shù)字化的文化普及工作,仍然需要學(xué)術(shù)研究不斷推陳出新,并努力將經(jīng)典通俗化。當(dāng)然,這也非常需要數(shù)字技術(shù)的進(jìn)步。紙質(zhì)印刷品有天然的局限性,比如強(qiáng)迫讀者接受它的形式、結(jié)構(gòu)與空間,這些物質(zhì)形態(tài)的局限性限制了讀者自由地參與進(jìn)去。而在數(shù)字環(huán)境下,物質(zhì)形態(tài)的局限將會(huì)很快被克服,讀者不僅可以對(duì)文本進(jìn)行各種操作(如編索引、加注、拷貝、分解、重組、移位等),甚至還可能參與合寫。退一步講,讀者隨時(shí)隨地都有可能介入文本,修改之,重寫之,將它們變成自己的東西。未來古籍?dāng)?shù)字化的資源也可以非?!皞€(gè)性化和私人化”的方式讓讀者參與到文本建構(gòu)或?qū)W習(xí)中去。這樣或許可以實(shí)現(xiàn)數(shù)百人同時(shí)在線閱讀—本古書或眾口品評(píng)同一句古話,古籍?dāng)?shù)字化也可能由此成為滿足大眾興趣愛好的“公共花園”。