●傅 ?。ㄉ虾D書館,上海 200031)
數(shù)字傳媒時代在提供給人們新的生活方式的同時,也悄悄改變著人們傳統(tǒng)的閱讀習(xí)慣。針對這種變化,出版業(yè)界的數(shù)字復(fù)合出版應(yīng)運而生。數(shù)字復(fù)合出版指的是對文獻(xiàn)內(nèi)容的多媒體出版,其中包括對文獻(xiàn)同一內(nèi)容“用多種符號復(fù)合表達(dá)、用多種媒體復(fù)合表達(dá)、用多種傳播載體復(fù)合表達(dá)、用多種傳媒形態(tài)復(fù)合表達(dá)、用多種顯示終端和制作技術(shù)復(fù)合表達(dá)等多個方面。”[1]
2008年4月,“國家數(shù)字復(fù)合出版系統(tǒng)工程”在多方努力下正式啟動,該工程作為數(shù)字出版的重點工程,已被明確列入《國家“十一五”時期文化發(fā)展規(guī)劃綱要》和《新聞出版業(yè)“十一五”發(fā)展規(guī)劃》。作為21世紀(jì)數(shù)字環(huán)境下新聞出版業(yè)的“748工程”,數(shù)字復(fù)合出版系統(tǒng)工程意義重大,不僅在出版內(nèi)容上,而且在閱讀方式、內(nèi)容傳播方面都將會促進(jìn)數(shù)字產(chǎn)業(yè)的發(fā)展,并帶動產(chǎn)業(yè)鏈上相關(guān)產(chǎn)業(yè)的發(fā)展。
數(shù)字復(fù)合出版系統(tǒng)工程內(nèi)容可簡單概括為:“一系列標(biāo)準(zhǔn)規(guī)范、兩部分研究內(nèi)容、五類應(yīng)用示范、六大技術(shù)平臺、九項關(guān)鍵技術(shù)、十六個子項目?!盵2]
(1)在數(shù)字復(fù)合出版系統(tǒng)工程研發(fā)中,標(biāo)準(zhǔn)化建設(shè)工作處于該工程的重要位置,是該工程的基礎(chǔ)性工作。標(biāo)準(zhǔn)體系由標(biāo)識類標(biāo)準(zhǔn)、復(fù)合文檔結(jié)構(gòu)化類標(biāo)準(zhǔn)、元數(shù)據(jù)類標(biāo)準(zhǔn)等十大類標(biāo)準(zhǔn)組成。
(2)數(shù)字復(fù)合出版系統(tǒng)研究內(nèi)容分為核心研究內(nèi)容和關(guān)聯(lián)研究內(nèi)容兩部分。核心研究內(nèi)容包括六大技術(shù)平臺的建設(shè),即:數(shù)字復(fù)合出版采編管理平臺、全媒體資源服務(wù)平臺、內(nèi)容制作平臺、多渠道出版發(fā)布平臺、政府監(jiān)督平臺和出版物DOI/CDOI管理與服務(wù)平臺。關(guān)聯(lián)研究內(nèi)容包括:生產(chǎn)過程全流程數(shù)字版權(quán)保護(hù)解決方案,補字、超大字符集的應(yīng)用,全媒體經(jīng)營管理技術(shù)支撐平臺,全媒體應(yīng)用整合平臺和數(shù)字復(fù)合出版可擴(kuò)展體系五部分。
(3)數(shù)字復(fù)合出版系統(tǒng)共性技術(shù)的研發(fā)涉及九項關(guān)鍵技術(shù):元數(shù)據(jù)、結(jié)構(gòu)化信息、知識點標(biāo)注技術(shù),面向生產(chǎn)過程的數(shù)字版權(quán)保護(hù)體系,痕跡保留以及版本管理技術(shù),科技內(nèi)容排版技術(shù),并行組版技術(shù),自動化排版技術(shù),版式和流式相統(tǒng)一的多元發(fā)布技術(shù),DOI,暗紋和二維碼編碼、嵌入、解析技術(shù),出版選題的輔助決策分析。
(4)在數(shù)字復(fù)合出版系統(tǒng)工程建設(shè)全過程中,進(jìn)行系統(tǒng)分類集成與應(yīng)用示范。對開發(fā)完成的各項共性軟件工具進(jìn)行集成與二次開發(fā),并在科技圖書、百科全書/辭書工具書(包括年鑒等)、教育圖書、各類期刊、報紙等五類不同類型的出版領(lǐng)域,遴選符合本系統(tǒng)實施條件的出版單位進(jìn)行典型示范。
數(shù)字復(fù)合出版系統(tǒng)工程以出版業(yè)為立足點,以打造出版新業(yè)態(tài)為目的,因此在工程實施過程中或多或少會對產(chǎn)業(yè)鏈上相關(guān)領(lǐng)域產(chǎn)生一定的影響。處于產(chǎn)業(yè)鏈下游的圖書館是受惠其中還是直面沖擊,是值得圖書館人深思的問題。
長期以來,圖書館一直被認(rèn)為是信息資源收集、加工、保存并提供利用的最佳機(jī)構(gòu)。然而,隨著互聯(lián)網(wǎng)的發(fā)展和技術(shù)環(huán)境的變化,網(wǎng)絡(luò)信息資源的動態(tài)性、分布性、多元性和無序性等特點,使信息的查找和檢索變得越來越困難。如何對多元化的信息進(jìn)行合理的描述、組織、序化,如何使信息資源在全社會范圍內(nèi)達(dá)成統(tǒng)一則是近十年來圖書館界研究的重要課題。
圖書館對文獻(xiàn)的揭示是依據(jù)文獻(xiàn)已有信息進(jìn)行客觀性描述,且各個圖書館會根據(jù)需要對文獻(xiàn)進(jìn)行深淺不同程度的揭示,由此導(dǎo)致針對同一文獻(xiàn)會產(chǎn)生不同的書目數(shù)據(jù)狀況。雖然國內(nèi)已經(jīng)形成幾大聯(lián)機(jī)聯(lián)合編目中心,成員館可以在所屬中心內(nèi)進(jìn)行數(shù)據(jù)的共建共享,使數(shù)據(jù)的揭示標(biāo)準(zhǔn)在一定程度上有所規(guī)范,但目前幾大中心之間還未能就數(shù)據(jù)的著錄規(guī)范達(dá)成統(tǒng)一標(biāo)準(zhǔn),距離文獻(xiàn)信息資源的全國統(tǒng)一還有很大一段差距。
數(shù)字復(fù)合出版系統(tǒng)工程的實施無疑將對數(shù)據(jù)著錄規(guī)范的統(tǒng)一產(chǎn)生重要的影響。文獻(xiàn)在生產(chǎn)之時就自動提取書目記錄所需的元數(shù)據(jù),按標(biāo)準(zhǔn)化格式供全社會使用,即對文獻(xiàn)實行自動編目,從源頭對數(shù)據(jù)的生產(chǎn)進(jìn)行有序化。圖書館在獲得文獻(xiàn)的同時,也獲得了最基礎(chǔ)的編目信息,這將大大提高編目的速度,使文獻(xiàn)能夠盡快地被讀者使用。
同時,對元數(shù)據(jù)的處理也不再局限于文獻(xiàn)生成以后,而是從文獻(xiàn)生成之時開始。這樣各個圖書館便可以在拿到文獻(xiàn)的同時得到同樣標(biāo)準(zhǔn)的元數(shù)據(jù),很大程度上緩解了由于數(shù)據(jù)著錄標(biāo)準(zhǔn)不統(tǒng)一而產(chǎn)生的問題,使今后對規(guī)范的研究有了統(tǒng)一的起點,也使全社會的信息標(biāo)準(zhǔn)化進(jìn)程邁向一個新的高度。
自動編目從根本上改變了編目模式,變圖書館的“描述性編目”為出版社的“標(biāo)識性編目”,即在圖書印前電子文本上進(jìn)行編目處理。具體操作是對其中的屬性數(shù)據(jù)進(jìn)行標(biāo)識,而不是描述。[3]文獻(xiàn)編目工作也不再由圖書館的采編部門來完成,而是前移至上游出版社在文獻(xiàn)產(chǎn)生的過程中自動生成。這雖然從源頭規(guī)范了數(shù)據(jù)生產(chǎn),改變了信息生產(chǎn)的無序狀態(tài),有利于文獻(xiàn)信息資源的有序整合。但這一看似新技術(shù)環(huán)境下產(chǎn)業(yè)環(huán)節(jié)優(yōu)化整合的方法卻給圖書館帶來了巨大的沖擊:
(1)編目人員角色的重新定位。當(dāng)我們從全國范圍內(nèi)的數(shù)據(jù)規(guī)范化中看到希望而倍受鼓舞的同時,也應(yīng)對占據(jù)采編部門大半壁江山的編目工作及其從業(yè)人員進(jìn)行重新定位。在信息量激增的時代,信息爆炸使得文獻(xiàn)信息資源的檢索越來越復(fù)雜,在美國,許多專家呼吁,應(yīng)當(dāng)以“圖書館員的思維方式”對信息資源進(jìn)行管理??梢姡幠抗ぷ髡叩呢S富經(jīng)驗及其所從事的工作對信息資源的組織的重要作用。自動編目的數(shù)據(jù)雖然可以使讀者在最短時間內(nèi)獲取目標(biāo)文獻(xiàn),但卻無法在文獻(xiàn)檢索過程中提供完整而全面的數(shù)據(jù)。優(yōu)秀的圖書館員應(yīng)當(dāng)在自動編目的基礎(chǔ)上,對數(shù)據(jù)進(jìn)行進(jìn)一步的結(jié)構(gòu)性編目,以滿足讀者知識搜索的要求。
(2)現(xiàn)有理論發(fā)展方向的轉(zhuǎn)變。伴隨著編目的對象從紙質(zhì)文獻(xiàn)向電子文獻(xiàn)、網(wǎng)絡(luò)資源乃至實體藏品的拓展,圖書館對編目規(guī)則的研究從AACR2(英美編目規(guī)則第二版)、FRBR(書目記錄的功能需求)、RDA(資源描述和檢索)發(fā)展到FRAD(規(guī)范數(shù)據(jù)的功能需求)、FRSAR(主題規(guī)范記錄的功能需求)。雖然在數(shù)據(jù)規(guī)范方面的研究已經(jīng)取得了很大的成績,但所有這些規(guī)則都是在客觀性描述的前提下產(chǎn)生的,從本質(zhì)上看還是將文獻(xiàn)實體作為著錄的客觀依據(jù)的規(guī)范。面對自動編目的產(chǎn)生,這些規(guī)范都將無法發(fā)揮原先應(yīng)有的作用。因為,自動編目是在文獻(xiàn)生產(chǎn)過程中對其中的屬性數(shù)據(jù)進(jìn)行標(biāo)識,對待出版的圖書必須具有哪些屬性、輸出哪些屬性、輸出的格式等進(jìn)行規(guī)定,這對現(xiàn)有編目理論提出了挑戰(zhàn)。在這種情況下圖書館需要針對標(biāo)識性編目制定新的編目原則,這將是未來編目理論的一大發(fā)展方向。
總體上看,自動編目系統(tǒng)的設(shè)計思想可簡單概括為對圖書的印前電子文本用XML語言描述的DC元數(shù)據(jù)加注結(jié)構(gòu)標(biāo)簽,使線性文件轉(zhuǎn)換為數(shù)據(jù)庫文件,從而達(dá)到一次錄入生成兩種產(chǎn)品(圖書館機(jī)讀目錄、圖書)的目的。這一轉(zhuǎn)換過程是通過簡化CNMARC字段,限制字段指示符的選擇性定義以達(dá)到MARC與DC元數(shù)據(jù)的匹配來實現(xiàn)的。
但正如CIP數(shù)據(jù)一樣,該系統(tǒng)雖然能夠產(chǎn)生基本的書目數(shù)據(jù),滿足圖書館能夠把書借出去的初級要求,但該系統(tǒng)的設(shè)計思想忽略了其產(chǎn)品的使用者對知識組織的需要,而這恰是圖書館對數(shù)據(jù)的深層次的揭示的優(yōu)勢,即為讀者提供更全面、更準(zhǔn)確的文獻(xiàn)檢索。[4]要完成圖書館深層揭示文獻(xiàn)外部與內(nèi)容特征的要求,還需依賴于基于形式化表達(dá)的本體論的知識組織模式。以本體作為知識組織的技術(shù)和方法,將實現(xiàn)基于語義的知識檢索,使讀者在搜索目標(biāo)文獻(xiàn)時準(zhǔn)確而全面地獲得數(shù)據(jù),這也將是未來編目工作的努力方向。
站在圖書館的立場上看待數(shù)字復(fù)合出版系統(tǒng)工程,一方面要認(rèn)真分析工程中與改善圖書館服務(wù)質(zhì)量、提升圖書館核心競爭力緊密相關(guān)的技術(shù)要點;另一方面也要在錯綜復(fù)雜的技術(shù)環(huán)境中保持清醒的頭腦,存有憂患意識,面對挑戰(zhàn),尋求出路。
圖書館與出版社的合作早已如火如荼地展開。以中版通與國家圖書館在“網(wǎng)上樣書庫”的合作為例,該項目旨在數(shù)據(jù)共建共享方面縮短書目數(shù)據(jù)面世的時間,使圖書館可以與出版社同時拿到編制完整的MARC數(shù)據(jù),從而節(jié)省數(shù)據(jù)編制加工時間,及時地為讀者提供新書借閱服務(wù)。在編目工作前移至出版社以后,圖書館與出版社將在此基礎(chǔ)上進(jìn)行更廣范圍和更深層次的合作。
(1)在標(biāo)準(zhǔn)制訂上的合作。商務(wù)印書館信息中心主任劉成勇在接受采訪時指出,從產(chǎn)業(yè)鏈來看,數(shù)字出版與數(shù)字圖書館是源和流的關(guān)系,是內(nèi)容生產(chǎn)和使用的關(guān)系。作為出版業(yè)下游的圖書館來說,它是數(shù)字出版產(chǎn)品的直接使用者,但顯然在我國,數(shù)字出版要落后于數(shù)字圖書館的發(fā)展。我國數(shù)字圖書館的發(fā)展已有10多年歷程,但數(shù)字復(fù)合出版才剛剛起步。因此,數(shù)字復(fù)合出版在標(biāo)準(zhǔn)制定上可以借鑒或參考數(shù)字圖書館的一些現(xiàn)有標(biāo)準(zhǔn),以避免上游數(shù)字出版與下游數(shù)字圖書館形成的標(biāo)準(zhǔn)體系不相容的情況發(fā)生。[5]在制訂標(biāo)準(zhǔn)的過程中上下游應(yīng)相互借鑒,相互合作,共同推進(jìn)信息標(biāo)準(zhǔn)化的進(jìn)程。
(2)數(shù)字版權(quán)方面的合作。從數(shù)字圖書館目前的發(fā)展現(xiàn)狀來看,圖書館也存在著與數(shù)字出版合作的必要性,這主要體現(xiàn)在電子資源的版權(quán)問題上。2006年7月1日起施行的《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》第七條規(guī)定:“圖書館、檔案館、紀(jì)念館、博物館、美術(shù)館等可以不經(jīng)著作權(quán)人許可,通過信息網(wǎng)絡(luò)向本館館舍內(nèi)服務(wù)對象提供本館收藏的合法出版的數(shù)字作品和依法為陳列或者保存版本的需要以數(shù)字化形式復(fù)制的作品,不向其支付報酬,但不得直接或者間接獲得經(jīng)濟(jì)利益。當(dāng)事人另有約定的除外?!痹摋l例排除了數(shù)字圖書館的合理使用權(quán),完全確立了權(quán)利人的網(wǎng)絡(luò)傳播權(quán),使得數(shù)字圖書館的上傳、下載、設(shè)置鏈接、館藏文獻(xiàn)開發(fā)、自身數(shù)據(jù)庫建設(shè)均受到不同程度的影響。而走出這一困境的最佳路徑就是要加強(qiáng)與出版社的合作,一方面在技術(shù)層面上加強(qiáng)電子資源的知識產(chǎn)權(quán)保護(hù)力度,另一方面在與出版社的合作中,將電子資源納入出版物版權(quán)交易的談判中,以內(nèi)容的方式獲得出版物的版權(quán),從根本上解決數(shù)字復(fù)合出版在圖書館層面發(fā)生的瓶頸問題。針對前者,國家數(shù)字復(fù)合出版系統(tǒng)工程中關(guān)于“生產(chǎn)過程的數(shù)字版權(quán)保護(hù)體系,痕跡保留以及版本管理技術(shù)”將是在電子出版物知識產(chǎn)權(quán)保護(hù)方面邁出的重要一步。
當(dāng)編目工作前移至出版社以后,編目人員何去何從不得不成為圖書館要思考的問題之一。早在2008年1月美國國會圖書館便在其發(fā)布的《書目控制的未來報告》中建議利用供應(yīng)鏈中前端可以獲得的書目數(shù)據(jù),減少重復(fù)工作,提高書目生產(chǎn)的效率。但該報告對編目人員今后的發(fā)展方向并沒有給出具體定位和建議。
將圖書館的工作簡單概括為收集信息、整理信息和傳遞信息并不為過。圖書館曾經(jīng)在對以紙質(zhì)印刷文獻(xiàn)為主的文獻(xiàn)編目中取得豐碩的成果。近年來,圖書館界對元數(shù)據(jù)、知識組織、本體、語義萬維網(wǎng)、機(jī)器可理解等方面的研究扮演著領(lǐng)軍人物的角色,并在關(guān)于分類法和情報檢索系統(tǒng)的研究中也已經(jīng)取得了豐碩的成果,這為編目人員從對文獻(xiàn)信息的揭示到對知識信息的組織的角色轉(zhuǎn)換奠定了基礎(chǔ)。數(shù)字復(fù)合出版系統(tǒng)工程中的結(jié)構(gòu)化信息和知識點標(biāo)注技術(shù)將給予我們新的啟發(fā)。數(shù)字復(fù)合出版系統(tǒng)中的結(jié)構(gòu)化信息和知識點標(biāo)注技術(shù)允許讀者深入到文獻(xiàn)內(nèi)部就知識塊進(jìn)行檢索。針對不同的讀者,可以設(shè)立不同的知識元體系,建立不同的知識元數(shù)據(jù)庫,這能夠大大降低檢索結(jié)果的信息冗余度,減少時間耗費,推進(jìn)知識普及,加快知識創(chuàng)新。如果對專業(yè)作品在編輯加工過程中加上對知識的結(jié)構(gòu)化加工,則在出版?zhèn)鹘y(tǒng)作品的同時還可出版帶知識標(biāo)引的作品,后者則可進(jìn)入相應(yīng)的知識數(shù)據(jù)庫,提供按需知識服務(wù)。[1]這將從根本上提高知識搜索效率,滿足不同讀者對于不同知識塊中的搜索,使圖書館成為用戶獲得有效、全面資源的知識庫。
數(shù)字復(fù)合出版系統(tǒng)工程的推出將在很大程度上增加數(shù)字文獻(xiàn)的館藏比例,解決文獻(xiàn)資源的電子化成本和版權(quán)的問題。
網(wǎng)絡(luò)化的今天,圖書館面臨的編目對象已不再局限于印刷型文獻(xiàn)和電子圖書,圖書館、博物館、檔案館之間的試驗性合作已經(jīng)開展,對信息資源的揭示已深入到實體藏品層面。而對網(wǎng)絡(luò)資源和實體藏品的數(shù)字化則是數(shù)字復(fù)合出版系統(tǒng)尚未涉及的,圖書館應(yīng)抓住這方面的發(fā)展契機(jī),加強(qiáng)在稀有資源和特色資源上的數(shù)字化進(jìn)程,將稀有和僅有資料 的發(fā)現(xiàn)作為優(yōu)先考慮的工作,優(yōu)化稀有和僅有資料的編目工作,建立可行的和靈活的編目操作規(guī)范,共享這部分資料的元數(shù)據(jù)。[6]在基于三館合作的實體資源組織方面,圖書館應(yīng)繼續(xù)扮演領(lǐng)軍人的角色,進(jìn)一步促進(jìn)理論和規(guī)范的發(fā)展。
數(shù)字復(fù)合出版是我國出版業(yè)的一次印刷技術(shù)革命,其不僅是出版業(yè)的飛躍發(fā)展,更關(guān)系到整個產(chǎn)業(yè)鏈的升級和變革。圖書館在面對這種機(jī)遇與挑戰(zhàn)時,應(yīng)盡快地適應(yīng)新的規(guī)則所帶來的變化,對于編目人員自身來講,要充分做好這方面的知識準(zhǔn)備,加深、加強(qiáng)數(shù)字復(fù)合出版、知識組織等技術(shù)、理論的理解和研究;對整個圖書館來說,則要加強(qiáng)與上下游產(chǎn)業(yè)鏈之間的合作,在變化中找準(zhǔn)圖書館獨特的發(fā)展方向,在網(wǎng)絡(luò)傳媒飛速發(fā)展的今天,尋求圖書館基業(yè)長青的生命要訣。
[1]田勝立.數(shù)字復(fù)合出版催生出版新業(yè)態(tài)[J].出版科學(xué),2008(2):5-8.
[2]《國家數(shù)字復(fù)合出版系統(tǒng)工程》標(biāo)準(zhǔn)研制工作方案(征求意見稿)[EB/OL].[2009-12-01].http://www.epublab.com.
[3]陳源蒸.論“標(biāo)識性編目”[J].數(shù)字圖書館論壇,2007(6):36-40.
[4]蔣小耘.ECIP自動編目軟件系統(tǒng)設(shè)計思想的探討——兼與張麗娟等同志商榷[J].圖書館雜志,2005(11):18-20.
[5]洪黎明.數(shù)字出版與數(shù)字圖書館的互動——訪商務(wù)印書館信息中心主任劉成勇[N].人民郵電報, 2008-12-10 (6).
[6]美國國會圖書館.書目控制的未來報告[EB/OL].(2007-11-30).http://www.loc.gov/bibliographic_future/news/draft_report.html.