牛津英語大辭典(以下簡稱OED),是牛津大學(xué)出版社(以下簡稱OUP)的品牌產(chǎn)品,自1884年出版至今已經(jīng)有130多年的歷史,不僅極大地增強(qiáng)了牛津大學(xué)出版社的品牌和學(xué)術(shù)出版影響力,也成為OUP迄今為止運(yùn)轉(zhuǎn)時(shí)間最長、最成功的學(xué)術(shù)項(xiàng)目之一。它的每次技術(shù)變革都為世界出版界和辭典使用者所矚目,其數(shù)字化轉(zhuǎn)型發(fā)展的成功實(shí)踐也為業(yè)界提供了有益啟示,值得認(rèn)真研究借鑒。
一、OED的數(shù)字化發(fā)展歷程
在130多年的時(shí)間里,OED的數(shù)字化發(fā)展經(jīng)歷了三個(gè)重要階段:光盤版、在線版和智能編輯系統(tǒng)。隨著技術(shù)變革,從書稿到出書的線性化模式被徹底顛覆,OED成為基于多任務(wù)平臺(tái)、內(nèi)容整合與鏈接,能實(shí)現(xiàn)網(wǎng)上信息接入與檢索的高速數(shù)字信息傳遞系統(tǒng)。
第一階段 :光盤版(CD-ROM)(1982~1992)
OED當(dāng)時(shí)面臨的主要挑戰(zhàn)是如何為學(xué)者、用戶及出版社創(chuàng)造更大的價(jià)值;同時(shí),還要解決50年版權(quán)即將到期的問題。為此,它采取的主要辦法是,整合增補(bǔ)版與第一版的內(nèi)容,將增補(bǔ)版中的詞條加入合適的位置,為讀者提供便利的同時(shí)保護(hù)第一版版權(quán)。
首先是把兩種文本的全部內(nèi)容電子化,再利用新技術(shù)把兩部分文件整合到一起進(jìn)行編輯。文本標(biāo)記采用當(dāng)時(shí)比較創(chuàng)新的標(biāo)準(zhǔn)通用標(biāo)示語言(SGML),由錄入員輸入一個(gè)約含15種主要結(jié)構(gòu)標(biāo)簽的混合體系(如:中心詞、發(fā)音、詞源、詞義分節(jié)、例證、例證日期、作者等)和較低水平的傳統(tǒng)排版標(biāo)記(如:以斜體標(biāo)記各種不同標(biāo)簽或引文格式)。在這個(gè)階段,讀者可以搜索全文和一些主要元素,包括中心詞、發(fā)音、詞源、含義和例證等。
第二階段: 在線版(1992~2005)
OED開始啟動(dòng)第三版修訂計(jì)劃,更新并修訂每一詞條,不僅收錄19世紀(jì)語言的變更,同時(shí)也收錄了新例證、新學(xué)術(shù)、新思想及新項(xiàng)目,如《中古英語辭典》(Middle English Dictionary)等。為支持這一方案,OED調(diào)整了相應(yīng)的工作內(nèi)容和流程,設(shè)立了一個(gè)OED在線出版發(fā)行項(xiàng)目,并與高線出版社(HighWire Press)開展合作。高線出版社采用Java和Perl程序語言把這些源文件保存在一個(gè)Sybase數(shù)據(jù)庫中,采用定制化的Verity K2搜索引擎來搜索文章,通過“SGML至HTML”樣式表和轉(zhuǎn)換程序生成頁面。
2000年3月,OED在線版正式上線。像許多其他采用SGML源文件的出版商一樣,OUP選擇以內(nèi)聯(lián)GIF圖片來呈現(xiàn)這些字符,還委托制作了2,500幅手繪插圖以顯示1,000個(gè)左右的特殊字符;設(shè)計(jì)方面,創(chuàng)建了一個(gè)既易于使用又涵蓋印刷版本所有特征的界面設(shè)計(jì)。
第三階段: 辭典編輯管理系統(tǒng)Pasadena(2005年以后)
OED在數(shù)字化以來開發(fā)了內(nèi)部編輯系統(tǒng),直接保障了項(xiàng)目的高效順利執(zhí)行,先后經(jīng)歷了“整合、出版發(fā)行和更新系統(tǒng)”(OEDIPUS)和第二代編輯系統(tǒng)TESS/TED,到第三代編輯系統(tǒng)Pasadena的時(shí)候,逐漸成熟。
第一代OEDIPUS系統(tǒng)使編輯可以訪問辭典數(shù)據(jù),校對(duì)詞條以實(shí)現(xiàn)即時(shí)核對(duì),并且可以對(duì)文本完整性進(jìn)行檢查和控制,對(duì)存在明顯錯(cuò)誤的條目進(jìn)行編輯變更。
第二代編輯系統(tǒng)適用于開放系統(tǒng),如:X-windows、Unix操作系統(tǒng)等,此外,還創(chuàng)建了與TESS系統(tǒng)相連的新的文本編輯器TED。用戶可以在辭典中檢索并編輯任何詞條,增強(qiáng)了用戶與編輯的互動(dòng)性。
第三代編輯系統(tǒng)針對(duì)用戶需求,盡可能整合所有編輯功能。除數(shù)據(jù)庫、搜索界面和詞條編輯外,系統(tǒng)還包含辭典瀏覽器,允許向內(nèi)部用戶和經(jīng)授權(quán)的遠(yuǎn)程用戶顯示詞條;通過外部檢索從詞條中提取圖書館檢索和問題請求,并在完成時(shí)把上述內(nèi)容返回詞條編輯。
隨著新系統(tǒng)的出現(xiàn),OUP第一次決定改變OED詞條結(jié)構(gòu),使編輯可以不再必須按照字母排序進(jìn)行修訂,而是關(guān)注查詢次數(shù)最多的詞匯以及最新的資料,也可以按照詞條的主題設(shè)置進(jìn)行修訂。這一系統(tǒng)的使用,極大地提高了編輯的工作效率,也使OED真正實(shí)現(xiàn)了為全世界用戶服務(wù),收到了良好的效果。
二、OED數(shù)字化轉(zhuǎn)型成功的主要原因
1.離不開卓有成效的項(xiàng)目管理
項(xiàng)目管理是OED數(shù)字化轉(zhuǎn)型成功的關(guān)鍵。在OED第二版項(xiàng)目開始時(shí),由項(xiàng)目總監(jiān)負(fù)責(zé)編寫總體項(xiàng)目規(guī)劃,確定項(xiàng)目的主要工作、相互關(guān)系、各活動(dòng)需花費(fèi)的時(shí)間,以及各活動(dòng)所需的人力、設(shè)備和資金。這些活動(dòng)具體包括:數(shù)據(jù)轉(zhuǎn)換、初步校對(duì)工作、機(jī)讀文本的計(jì)算機(jī)開發(fā)和自動(dòng)處理、在屏幕上編輯詞條、長條校樣排版、最終校對(duì)工作和最終頁面排版,所有工作內(nèi)容都制定了詳細(xì)的計(jì)劃。
1984年10月,項(xiàng)目組起草了一份《用戶需求聲明》,列出項(xiàng)目的目標(biāo)和計(jì)算機(jī)系統(tǒng)應(yīng)執(zhí)行的操作;1985年7月,計(jì)算機(jī)團(tuán)隊(duì)公布了一份系統(tǒng)設(shè)計(jì)大綱,完成計(jì)算機(jī)系統(tǒng)的初步設(shè)計(jì)之后,構(gòu)建和運(yùn)行該系統(tǒng)所需的時(shí)間被加入計(jì)劃,并制定了規(guī)定各項(xiàng)工作完成時(shí)間的嚴(yán)格“記錄計(jì)劃”:出版發(fā)行期限定于1989年3月。這在OED歷史上是第一次在項(xiàng)目運(yùn)營中采用規(guī)劃軟件來監(jiān)測項(xiàng)目運(yùn)行的時(shí)間和費(fèi)用。
為支持項(xiàng)目編輯,OED以史無前例的規(guī)模來編纂項(xiàng)目規(guī)程,每一步都撰寫了詳細(xì)的操作手冊,包括校對(duì)手冊、整合手冊、發(fā)音檢查手冊和鍵盤輸入手冊等。在項(xiàng)目的后續(xù)階段繼續(xù)使用這一方法,編寫了普通培訓(xùn)手冊、計(jì)算機(jī)系統(tǒng)使用手冊、特殊詞條或詞條部分編輯手冊,以及最特別的書目原則手冊。隨著OED2輔助文本的出版發(fā)行,還特別編寫了綜合參考書目、初步措施和項(xiàng)目歷史。正是由于對(duì)這些項(xiàng)目實(shí)施了卓有成效的科學(xué)管理,才保證了OED項(xiàng)目的順利實(shí)施。
2. 離不開與技術(shù)公司的緊密合作
由于意識(shí)到自己的優(yōu)勢是把握內(nèi)容,OUP沒有再設(shè)立技術(shù)部門,而是通過項(xiàng)目招標(biāo),在不同階段選擇專業(yè)技術(shù)公司進(jìn)行合作。例如,在20世紀(jì)80年代開始啟動(dòng)將紙質(zhì)內(nèi)容轉(zhuǎn)化為電子文本時(shí),選擇了當(dāng)時(shí)熟悉字典編排和標(biāo)引規(guī)則的國際電腦印刷公司ICC;后來選擇IBM英國公司和加拿大的滑鐵盧大學(xué)共同開發(fā)相應(yīng)的處理電子文本,并允許機(jī)讀訪問的程序;1990年,又委托荷蘭軟件公司AND開發(fā)具有搜索功能的OED2的光盤版。1999年,為開發(fā)OED在線版,選擇與斯坦福大學(xué)圖書館的網(wǎng)絡(luò)出版商高線出版社合作,2000年3月正式上線后主機(jī)仍然由高線出版社托管,以便處理相關(guān)技術(shù)問題。為提高編輯工作效率,更有效地修訂內(nèi)容,選擇法國軟件公司IDM來開發(fā)新的編輯出版管理系統(tǒng)Pasadena。
3.離不開編輯人員的快速適應(yīng)
在專項(xiàng)培訓(xùn)項(xiàng)目結(jié)束后,Pasadena系統(tǒng)于2005年6月15日正式上線。OUP決定不同時(shí)使用新舊編輯系統(tǒng),并按照順序組織編輯工作:一是全面關(guān)閉舊版系統(tǒng)(有序暫停工作);二是開展正式的Pasadena培訓(xùn)項(xiàng)目(包括專業(yè)課堂教學(xué)、詳細(xì)用戶指南培訓(xùn)和專項(xiàng)培訓(xùn)練習(xí));三是安排短暫的適應(yīng)期,讓編輯在安全的測試環(huán)境中使用新版軟件;四是轉(zhuǎn)移至在線系統(tǒng),按預(yù)定的工作量恢復(fù)工作。
在隨后幾年中,這套系統(tǒng)保持了較高的穩(wěn)定性,使編輯人員很快適應(yīng)了工作流信息和辭典數(shù)據(jù)相互分離、書目引用脫離詞條編輯的設(shè)計(jì)模式。幾乎所有人員在經(jīng)過培訓(xùn)后都能使用新版系統(tǒng)來恢復(fù)原有的編輯工作。短短3個(gè)月內(nèi),新版系統(tǒng)的編輯使用評(píng)分便超越了舊版系統(tǒng)的最高分。
三、對(duì)我國工具書數(shù)字化轉(zhuǎn)型發(fā)展的啟示
我國的工具書數(shù)字化轉(zhuǎn)型中,行動(dòng)比較早的出版機(jī)構(gòu)有商務(wù)印書館的“工具書在線”,上海世紀(jì)出版集團(tuán)的“工具書在線”和中國大百科全書出版社的《中國大百科全書》網(wǎng)絡(luò)版。這些項(xiàng)目由于各種原因,還在探索之中,沒有獨(dú)自走出一片藍(lán)天。而同方知網(wǎng)作為內(nèi)容集成平臺(tái),延攬大量的工具書進(jìn)入平臺(tái),實(shí)現(xiàn)了逐年上升的贏利勢頭。綜觀我國現(xiàn)有的工具書產(chǎn)品,大多只是紙質(zhì)產(chǎn)品的電子化或封閉的數(shù)據(jù)庫化,不能實(shí)現(xiàn)外鏈和跨庫檢索,沒有實(shí)現(xiàn)協(xié)同編纂,用戶體驗(yàn)與需求之間的差距較大。與OED相比,我國的工具書數(shù)字化轉(zhuǎn)型還有很長的路要走。認(rèn)真總結(jié)OED的發(fā)展歷程,吸取其寶貴經(jīng)驗(yàn)是非常有意義的。
1.決策前瞻,投入持續(xù)
在OED發(fā)展的每個(gè)關(guān)鍵時(shí)期,OUP都能從長遠(yuǎn)角度出發(fā)進(jìn)行決策。20世紀(jì)80年代初,當(dāng)計(jì)算機(jī)技術(shù)處于初級(jí)階段,很多人還不知道計(jì)算機(jī)為何物的時(shí)候,OUP就提出將OED文本電子化并進(jìn)行數(shù)字化標(biāo)引,從而為OED2的推出及光盤版和OED在線奠定了堅(jiān)實(shí)的基礎(chǔ)。OED2出版不久,很快又著眼于第三版,更新并修訂每一詞條,不僅收錄19世紀(jì)語言的變更,同時(shí)收錄新證據(jù)、新學(xué)術(shù)、新思想及主要新項(xiàng)目。1994年左右,設(shè)立OED在線出版發(fā)行項(xiàng)目,使用戶可以在線利用第二版的完整內(nèi)容。2000年3月起,每一季度在網(wǎng)上發(fā)行OED3的一個(gè)章節(jié);同時(shí)為了使在線發(fā)行成為可能,OED部門進(jìn)行重組,以保證OED的內(nèi)容不斷得到更新。2010年12月,OED在線版上線10年后,又在新平臺(tái)啟動(dòng)了全新改版后的網(wǎng)站。正是這些前瞻性的決策和持續(xù)的投入,使OED經(jīng)過一個(gè)多世紀(jì)的培育和完善,依然保持了蓬勃的生命力和影響力。
工具書在數(shù)字化時(shí)代依然有強(qiáng)大的生命力,但決不能固步自封,要增強(qiáng)前瞻意識(shí),主動(dòng)適應(yīng)新技術(shù)的發(fā)展潮流,始終以用戶需求為中心,及時(shí)進(jìn)行前瞻性的決策,并能夠持續(xù)不斷地投入,只有這樣才能保持產(chǎn)品的吸引力,為用戶創(chuàng)造更大的價(jià)值。
2.兼顧社會(huì)效益和經(jīng)濟(jì)效益
只有始終保持產(chǎn)品的活力,吸引用戶使用,才能擁有更多的用戶群體。OUP對(duì)OED的投入是巨大的,首先是出于社會(huì)責(zé)任的考慮。雖然OED在線版的訂閱收入持續(xù)增加,但這些收入并不能補(bǔ)償開發(fā)運(yùn)營的成本。2000年制作出版的OED第三版總成本高達(dá)5500萬美元。2010年OED在線版網(wǎng)站做了全部更新和排版,制作成本顯著增加。同時(shí),為保證在線版每季度一次更新,還配備了大約75名全職編輯處理相關(guān)的詞條、釋義及例證;產(chǎn)品營銷上也有相應(yīng)的人力投入。但是,在OED建成大的語料庫以后,OUP從中衍生出一系列小的獨(dú)立產(chǎn)品,包括精編本OED等,另外開發(fā)的一些編輯軟件不僅適用于OED,工具書部門的其他編輯也可以使用這些成果。這在一定程度上促進(jìn)了OUP辭典、工具書的發(fā)展,帶動(dòng)了其他產(chǎn)品的銷售,取得了良好的經(jīng)濟(jì)效益,從而實(shí)現(xiàn)了社會(huì)效益和經(jīng)濟(jì)效益的平衡。
辭書與一般出版物相比,負(fù)有更重要的社會(huì)責(zé)任,不能一味追求經(jīng)濟(jì)效益,但由此實(shí)現(xiàn)的衍生品的經(jīng)濟(jì)價(jià)值是不可小視的,如果運(yùn)營得當(dāng),完全可以實(shí)現(xiàn)“兩個(gè)效益”的平衡。對(duì)國內(nèi)出版社來說,如何全面衡量、把握產(chǎn)品所能帶來的社會(huì)效益和經(jīng)濟(jì)效益,妥善處理好二者的關(guān)系,對(duì)辭書在數(shù)字化轉(zhuǎn)型發(fā)展的大背景下持續(xù)健康發(fā)展至關(guān)重要。
未來工具書的發(fā)展面臨著很多挑戰(zhàn)和機(jī)遇。一方面,互聯(lián)網(wǎng)新進(jìn)入者層出不窮,比如維基百科、谷歌、必應(yīng)辭典等,國內(nèi)的百度百科、互動(dòng)百科、有道辭典等,他們充分利用了最新的搜索技術(shù)、大數(shù)據(jù)分析、社會(huì)化媒體推廣等,實(shí)現(xiàn)了傳統(tǒng)辭書無法實(shí)現(xiàn)的功能,滿足了用戶的需求。另一方面,移動(dòng)互聯(lián)網(wǎng)以及移動(dòng)終端的廣泛普及,為辭書的發(fā)展帶來了廣闊的發(fā)展空間。如何借鑒OED的發(fā)展經(jīng)驗(yàn),把握數(shù)字化的新機(jī)遇,圍繞如何更好地滿足用戶智能化、個(gè)性化的使用需求,制定正確的數(shù)字化策略,是值得我國傳統(tǒng)工具書出版者深思的問題。
(林曉芳,中國新聞出版研究院對(duì)外合作交流中心主任、副編審)
參考文獻(xiàn):
① Simon Winchester,The meaning of Everything the story of the Oxford English Dictionary,2003,New York,Oxford University Press
② Mike Letts,the Seybold report on internet publishing,2000.5,http:// ukcatalogue.oup.com
③ 《牛津英語大辭典》將全面改為網(wǎng)絡(luò)版,2010年8月31日,中國新聞網(wǎng) http://www.chinanews.com/cul/2010/08-31/2501357.shtml
④ 牛津英語大辭典印刷版或停印http://learning.sohu.com/20101008/ n275470359.shtml,2010年10月08日,搜狐教育
⑤ 牛津大學(xué)出版社OED項(xiàng)目內(nèi)部報(bào)告