姜占峰
內(nèi)容資源數(shù)字化是出版業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型升級過程中的基礎(chǔ)性工作。筆者結(jié)合人民交通出版社(以下簡稱交通社)5年來內(nèi)容資源數(shù)字化建設(shè)的具體實(shí)踐,圍繞“選擇哪些資源數(shù)字化”“怎么數(shù)字化”及“如何做好保障”三個(gè)核心問題,對如何有效開展內(nèi)容資源數(shù)字化工作提出思路和解決方案。
一、統(tǒng)籌規(guī)劃 確立建設(shè)目標(biāo)
出版企業(yè)要從用戶需求出發(fā),結(jié)合本單位實(shí)際,確立內(nèi)容資源數(shù)字化建設(shè)目標(biāo)。即:用戶導(dǎo)向,統(tǒng)一思路,明確重點(diǎn),厘清職責(zé),形成資源采集、加工、存儲(chǔ)、管理和發(fā)布一體化的數(shù)字資源建設(shè)業(yè)務(wù)流程,為產(chǎn)品開發(fā)、銷售和用戶服務(wù)奠定基礎(chǔ)。
按照這一思路,交通社確立了適應(yīng)本單位實(shí)際的內(nèi)容資源數(shù)字化建設(shè)目標(biāo),并重點(diǎn)在規(guī)范數(shù)據(jù)加工、制定加工標(biāo)準(zhǔn)、做好資源規(guī)劃和嚴(yán)格資源管理4個(gè)方面做好基礎(chǔ)工作。通過市場比價(jià)和競爭性談判,出版社確定了5家定點(diǎn)數(shù)據(jù)加工廠商,自主研發(fā)了元數(shù)據(jù)標(biāo)準(zhǔn)、存儲(chǔ)標(biāo)準(zhǔn)和結(jié)構(gòu)化標(biāo)準(zhǔn),制定了排版廠上交電子文檔規(guī)范格式和內(nèi)容資源管理辦法,確定了資源建設(shè)的重點(diǎn)、核心和切入點(diǎn),提高和規(guī)范了數(shù)字內(nèi)容資源的質(zhì)量。
通過近5年的數(shù)字化加工,交通社已積累建設(shè)8000余種可直接面向用戶提供閱讀服務(wù)的高品質(zhì)電子書、120余萬個(gè)交通專業(yè)詞條等高質(zhì)量的數(shù)字內(nèi)容資源,開發(fā)推出了數(shù)據(jù)庫、U閱通等數(shù)字產(chǎn)品,上線了悅通網(wǎng)、交通標(biāo)準(zhǔn)服務(wù)網(wǎng)等數(shù)字出版平臺(tái)。
建立內(nèi)容資源矩陣是比較好的資源建設(shè)規(guī)劃方式,有利于出版企業(yè)梳理資源現(xiàn)狀,明確建設(shè)路徑和切入點(diǎn)。
二、量力而行 明晰建設(shè)路徑
1.明確資源獲取途徑
在開展資源數(shù)字化之前,出版企業(yè)應(yīng)首先對本單位現(xiàn)有數(shù)字內(nèi)容資源的存放環(huán)境、數(shù)量、質(zhì)量(完整性、準(zhǔn)確性、及時(shí)性)、格式及存在的問題等,進(jìn)行排查、梳理和總結(jié)。在此基礎(chǔ)上,通過以下4種途徑來進(jìn)行內(nèi)容資源建設(shè):
(1)自主建設(shè):主要通過對存量資源的外包數(shù)據(jù)加工和增量資源的外包開發(fā)制作兩種方式完成。
(2)作者提供:借助協(xié)同編輯系統(tǒng),從選題策劃開始到交稿的全過程,由作者提供相關(guān)內(nèi)容素材,并取得授權(quán)。
(3)外部購買:從滿足資源的完整性、權(quán)威性需求出發(fā),通過版權(quán)交易方式,購買相關(guān)內(nèi)容資源。
(4)交換引進(jìn):通過虛擬積分、信用等級等方式授予用戶一定的資源使用權(quán),換取用戶上傳資源,并取得授權(quán)。
2.選取適合的切入點(diǎn)
(1)能較快產(chǎn)生效益的資源可優(yōu)先。具體包括可直接產(chǎn)生經(jīng)濟(jì)效益的資源、間接為紙質(zhì)圖書做增值服務(wù)的資源、可以提升圖書產(chǎn)品競爭力的資源、能滿足用戶一定需求的資源。
(2) 數(shù)字化工序容易的資源可優(yōu)先。包括制作原版原式數(shù)字內(nèi)容資源、收集數(shù)字化素材、易于拆分的內(nèi)容資源。
(3)核心的、重點(diǎn)的資源可優(yōu)先。包括企業(yè)獨(dú)有的有充分競爭力的資源、有常銷價(jià)值的資源、符合戰(zhàn)略發(fā)展方向的資源。
(4)基礎(chǔ)好的資源包可優(yōu)先。包括電子文檔保存質(zhì)量高、完整、版本新、版權(quán)無爭議且易于維護(hù)更新的資源。
交通社在選擇數(shù)字內(nèi)容資源建設(shè)的切入點(diǎn)上,以數(shù)字出版項(xiàng)目建設(shè)為抓手,把重點(diǎn)放在最核心的資源建設(shè)上。
3.制作適用的數(shù)字內(nèi)容資源
(1)優(yōu)先滿足用戶的需求。從用戶需求角度出發(fā),滿足用戶對產(chǎn)品功能的需求。
(2)確定適合的數(shù)字化加工顆粒度。針對不同資源類型,結(jié)合用戶需求,分別加工成雙層PDF、單層PDF、XML、試題、條目等不同類型的數(shù)字內(nèi)容資源。
(3)根據(jù)用戶閱讀需求,確定要加工的數(shù)字內(nèi)容格式,分別加工成PDF、EPUB、MOBI、TXT、video、movie、tif等不同格式的內(nèi)容資源。
三、規(guī)范實(shí)施 確保建設(shè)質(zhì)量
1.資源建設(shè),標(biāo)準(zhǔn)先行
資源數(shù)字化之前,要注意建立或選擇相應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn)、分類標(biāo)準(zhǔn)、知識(shí)體系、加工標(biāo)準(zhǔn)、排版文件與封面文件交付標(biāo)準(zhǔn)、質(zhì)量標(biāo)準(zhǔn)、存儲(chǔ)標(biāo)準(zhǔn)、結(jié)構(gòu)化標(biāo)準(zhǔn)、數(shù)據(jù)架構(gòu)標(biāo)準(zhǔn)(DTD)和資源管理標(biāo)準(zhǔn)等,作為數(shù)字化加工的規(guī)范要求。
2.分類標(biāo)引,規(guī)范加工
(1)對已制作完畢的數(shù)字內(nèi)容,按專業(yè)屬性進(jìn)行分類和標(biāo)引工作。
(2)對不同種類數(shù)字資源提出對應(yīng)的技術(shù)加工要求。如要把圖書數(shù)字化加工成雙層矢量PDF文件,技術(shù)要求如下:
像素:彩色圖片不低于600dpi,普通黑白圖片或灰度圖片不低于 300dpi;
糾偏:校正的圖像允許的傾斜度不大于1度;
去污:干凈、整潔和美觀;
識(shí)別準(zhǔn)確率:差錯(cuò)率不高于萬分之三;
完整性:源文件統(tǒng)一,避免缺頁少頁多頁現(xiàn)象;
一致性:頁碼順序100%正確,文本和圖像對應(yīng)一致等。
(3)在數(shù)字化加工前,針對不同種類內(nèi)容資源,應(yīng)確定不同的元數(shù)據(jù)規(guī)范。主要包括:圖書元數(shù)據(jù)、目次元數(shù)據(jù)、作者元數(shù)據(jù)、文章源數(shù)據(jù)、單頁元數(shù)據(jù)、附件元數(shù)據(jù)、腳注元數(shù)據(jù)、圖片元數(shù)據(jù)、視頻元數(shù)據(jù)、音頻元數(shù)據(jù)、參考文獻(xiàn)元數(shù)據(jù)、管理元數(shù)據(jù)、表格元數(shù)據(jù)、公式元數(shù)據(jù)等。
3.細(xì)致檢查,嚴(yán)格驗(yàn)收
對存量資源進(jìn)行數(shù)字化,應(yīng)在規(guī)定的抽檢范圍內(nèi)就文字、圖像、關(guān)聯(lián)關(guān)系、版式文件、流式文件等存在的差錯(cuò)進(jìn)行計(jì)算,并對交付的以下數(shù)據(jù)資料的完整性、準(zhǔn)確性進(jìn)行檢查,最后形成質(zhì)檢驗(yàn)收報(bào)告。包括:原始資料、加工規(guī)格、加工質(zhì)量、加工周期、交付方式、交付日期、存儲(chǔ)介質(zhì)、命名規(guī)則、數(shù)據(jù)實(shí)體、交付報(bào)告、交付清單、交付接收單、質(zhì)檢報(bào)告等。
4.人員齊備,制度保障
出版企業(yè)在數(shù)字化轉(zhuǎn)型過程中,首先要配備的人員就是資源數(shù)字化專職人員,包括資源建設(shè)管理人員、質(zhì)量檢查人員及驗(yàn)收人員。同時(shí),還應(yīng)建立相應(yīng)的管理制度,包括電子文檔管理辦法、內(nèi)容資源管理辦法、資源建設(shè)合同管理辦法、數(shù)字加工廠商管理辦法、內(nèi)容資源管理辦法等。
當(dāng)然,在內(nèi)容資源建設(shè)過程中,還一定要注意加工的內(nèi)容資源要求版權(quán)有效、內(nèi)容權(quán)威、內(nèi)容更新及時(shí)等。數(shù)字化后的內(nèi)容資源,像食品一樣有保質(zhì)期。若無法在一定時(shí)間內(nèi)形成服務(wù)能力,則投入資源數(shù)字化的時(shí)間、精力和金錢很可能就付之東流。因此,選擇用戶需要的、有效益的、核心的和易做的資源數(shù)字化,應(yīng)是出版企業(yè)在實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型升級過程中首要做好的基礎(chǔ)工作。(作者單位系人民交通出版社)