文 / 沈水榮 人民出版社
隨著信息技術(shù)革命的深入發(fā)展,人類(lèi)進(jìn)入了一個(gè)知識(shí)爆炸的時(shí)代,知識(shí)加速增長(zhǎng)積累與人的閱讀學(xué)習(xí)能力有限之間的矛盾日顯突出,知識(shí)資源的低效率使用和浪費(fèi)日趨嚴(yán)重。于是,人們采用以信息化為代表的現(xiàn)代科技手段,對(duì)知識(shí)信息進(jìn)行大規(guī)模地加工處理,生產(chǎn)出一系列更加便于人們閱讀學(xué)習(xí)的數(shù)字化、網(wǎng)絡(luò)化產(chǎn)品,大幅度提高知識(shí)信息的使用價(jià)值。由此正在帶來(lái)一個(gè)新型產(chǎn)業(yè)的興起,這就是現(xiàn)代知識(shí)資源開(kāi)發(fā)產(chǎn)業(yè)。
自從人類(lèi)發(fā)明文字,形成了知識(shí)積累,就有了開(kāi)發(fā)利用知識(shí)資源的現(xiàn)象。但知識(shí)資源開(kāi)發(fā)的規(guī)模和深度,依賴(lài)于承載和利用知識(shí)的物質(zhì)技術(shù)條件的發(fā)展。隨著物質(zhì)技術(shù)的條件逐步改進(jìn),人類(lèi)知識(shí)積累越來(lái)越豐富,人的閱讀學(xué)習(xí)越來(lái)越需要借助外部物質(zhì)條件而進(jìn)行,也就越來(lái)越有必要把知識(shí)作為一種資源進(jìn)行開(kāi)發(fā)利用。如,我國(guó)古代就有文獻(xiàn)編目、圖書(shū)編纂;近現(xiàn)代出版中有“編、印、發(fā)”;圖書(shū)館有“采、編、典、借”,等等,這些都是由于知識(shí)積累到一定程度,為了幫助人們更加方便地閱讀使用知識(shí)所進(jìn)行的工作、形成的行業(yè),都有知識(shí)資源開(kāi)發(fā)的性質(zhì)。但以往時(shí)代由于知識(shí)資源開(kāi)發(fā)的規(guī)模和深度也很有限,人們沒(méi)有提出“知識(shí)資源開(kāi)發(fā)”這個(gè)概念。
隨著信息化時(shí)代的到來(lái),與計(jì)算機(jī)技術(shù)相伴隨,人類(lèi)用于承載和利用知識(shí)的物質(zhì)技術(shù)條件又一次產(chǎn)生了革命性演變,知識(shí)信息的儲(chǔ)存、處理、傳播、應(yīng)用等大大突破了時(shí)間、空間的限制,其效率無(wú)數(shù)倍地大幅提高,從而使知識(shí)總量開(kāi)始以不可思議的幾何級(jí)數(shù)增長(zhǎng)和積累,知識(shí)資源的大規(guī)模深度開(kāi)發(fā)成為必然。據(jù)聯(lián)合國(guó)教科文組織對(duì)全世界4000本雜志研究發(fā)現(xiàn):十九世紀(jì),每隔50年知識(shí)更新一次;到了第二次世界大戰(zhàn)的時(shí)候,知識(shí)更新的周期縮短到15年;上世紀(jì)九十年代以后則縮短到3到4年。出版物是知識(shí)增長(zhǎng)的一個(gè)重要標(biāo)志。我國(guó)出版圖書(shū)總量1990年約8萬(wàn)種,2012年達(dá)到約40萬(wàn)種,22年間增長(zhǎng)了5倍。與上述關(guān)于知識(shí)增長(zhǎng)速度的預(yù)測(cè)基本吻合。
這些數(shù)據(jù)和預(yù)測(cè)表明,人類(lèi)已經(jīng)淹沒(méi)在自己創(chuàng)造的知識(shí)海洋中。尷尬的是,人的閱讀能力卻極為有限。于是,這些人類(lèi)文明的精華,要么被束之高閣、落滿(mǎn)歲月的塵埃,要么大量堆積在庫(kù)房?jī)?nèi),最終銷(xiāo)毀。近年來(lái),人民出版社為承建國(guó)家重大項(xiàng)目“中國(guó)共產(chǎn)黨思想理論資源數(shù)據(jù)庫(kù)”,從國(guó)家版本圖書(shū)館等有關(guān)方面,對(duì)確定范圍內(nèi)的黨政類(lèi)圖書(shū)進(jìn)行調(diào)查,發(fā)現(xiàn)建國(guó)以來(lái)出版的此類(lèi)圖書(shū)大約100萬(wàn)冊(cè),但長(zhǎng)期以來(lái),這些圖書(shū)資源存在著“低效率”使用的問(wèn)題。據(jù)抽樣調(diào)查,這100萬(wàn)種書(shū)中,目前一般書(shū)店和網(wǎng)站上比較容易買(mǎi)到的實(shí)體書(shū)只有約1‰,也就是還有999‰被塵封在倉(cāng)庫(kù)里,有不少已經(jīng)被打成了紙漿,許多出版不到10年的圖書(shū)已經(jīng)尋無(wú)下落。
可見(jiàn),知識(shí),已經(jīng)如同深藏地下的石油、天然氣一樣,成為一種需要大力開(kāi)采、開(kāi)發(fā),才能發(fā)揮效用的寶貴資源。
歷史上每一次信息技術(shù)的革命,都使得人類(lèi)大大拓展了知識(shí)加工、傳播和利用廣度和深度?!罢Z(yǔ)言”的產(chǎn)生,帶來(lái)了人類(lèi)聲音信息的語(yǔ)義化、規(guī)范化,使得人類(lèi)的經(jīng)驗(yàn)、知識(shí)可以面對(duì)面地相互交流,共同享用?!拔淖帧钡漠a(chǎn)生使人類(lèi)的語(yǔ)言向符號(hào)化、標(biāo)準(zhǔn)化、存儲(chǔ)化、通用化方向發(fā)展,使知識(shí)可以超越時(shí)空的限制而傳遞和利用。“紙”的發(fā)明,使人們有了方便記錄文字、圖像等知識(shí)信息的載體,使得知識(shí)加工整理、傳播和利用的數(shù)量、質(zhì)量大幅度提高?!坝∷⑿g(shù)”發(fā)明后,文字、圖像的等知識(shí)信息大量復(fù)制、存儲(chǔ)、傳遞成為可能,知識(shí)在全世界范圍內(nèi)實(shí)現(xiàn)了更為廣泛地傳播和利用。
現(xiàn)代以信息技術(shù)為代表的新技術(shù)革命,為知識(shí)資源開(kāi)發(fā)利用準(zhǔn)備好了一切物質(zhì)技術(shù)條件。計(jì)算機(jī)技術(shù)使文字、圖像、聲音等知識(shí)信息數(shù)碼化、虛擬化,它與現(xiàn)代通訊技術(shù)、傳感技術(shù)、復(fù)印技術(shù)、機(jī)讀技術(shù)、縮微技術(shù)、聲像技術(shù)、新材料技術(shù)等相結(jié)合,使知識(shí)加工、傳播、使用在更廣泛、更深入的程度上得到迅速發(fā)展。
2.1 信息儲(chǔ)存海量化。儲(chǔ)存器從磁盤(pán)、光盤(pán),發(fā)展到閃速存儲(chǔ)器、固態(tài)硬盤(pán)等,目前容量最大的硬盤(pán)已經(jīng)能達(dá)到1000—2000gb的容量。在可以預(yù)見(jiàn)的未來(lái),納米儲(chǔ)存、磁盤(pán)冗余陣列技術(shù)、云儲(chǔ)存技術(shù)、DNA硬盤(pán)等更高數(shù)量級(jí)儲(chǔ)存技術(shù)將逐步走向市場(chǎng)。DNA硬盤(pán) 1克存儲(chǔ)量將等于300萬(wàn)張CD。
2.2 信息處理自動(dòng)化??梢越柚嚓P(guān)技術(shù),將計(jì)算機(jī)、復(fù)印機(jī)、打字機(jī)、終端機(jī)、縮微機(jī)、聲象設(shè)備、光電、電磁、自動(dòng)控制設(shè)備、印刷裝訂設(shè)備、編輯翻譯設(shè)備,用光纖、電纜、衛(wèi)星、微波、電子線路連接起來(lái),實(shí)現(xiàn)信息的自動(dòng)記錄、整理、存貯、交流和利用。可以進(jìn)行分類(lèi)自動(dòng)化、主題標(biāo)引自動(dòng)化、信息編碼自動(dòng)化、信息著錄自動(dòng)化等。
2.3 信息傳遞瞬間化。無(wú)線互聯(lián)網(wǎng)、有線互聯(lián)網(wǎng)、衛(wèi)星通信,以及即時(shí)通訊軟件、數(shù)字傳輸、數(shù)字電視等手段,使知識(shí)信息在地球任何地點(diǎn)之間、地球與太空之間傳遞的距離概念幾乎不復(fù)存在。即使是超大容量數(shù)據(jù)傳播、高分辨率音視頻和圖片文件傳輸也越來(lái)越十分便捷,甚至人類(lèi)在遙遠(yuǎn)的太空可以為地球上的幾億人同時(shí)授課,進(jìn)行互動(dòng)交流。
2.4 信息展現(xiàn)融合化。信息化聲像技術(shù)、模擬語(yǔ)音技術(shù)、三維動(dòng)畫(huà)技術(shù)、物聯(lián)網(wǎng)技術(shù)等,可以把同一主題的文字與圖像、聲音、視頻、動(dòng)畫(huà)以及直接來(lái)自自然源頭的信息有機(jī)融合起來(lái),創(chuàng)作成一部作品,在同一終端同一屏幕展現(xiàn)給讀者。這是一種更加客觀真實(shí)、生動(dòng)具體,全方位、多角度地反映和揭示事物的方式。幾千年前,人類(lèi)把對(duì)客觀世界的認(rèn)知抽象成文字進(jìn)行交流;現(xiàn)今,多種形式信息的融合化展現(xiàn),又將使人類(lèi)回歸到對(duì)客觀世界直接認(rèn)知的狀態(tài)中去,這是一種人類(lèi)認(rèn)識(shí)世界方式的螺旋式上升。
2.5 信息保護(hù)永久化。隨著縮微技術(shù)的發(fā)展,以及DNA儲(chǔ)存等技術(shù)成果的誕生,并逐步投入應(yīng)用,電子數(shù)據(jù)難以長(zhǎng)久保存的問(wèn)題也有望迎刃而解。信息化縮微技術(shù)可以將數(shù)據(jù)保存幾百年。英國(guó)一個(gè)研究小組研發(fā)的“DNA硬盤(pán)”,有可能使文件保存時(shí)長(zhǎng)達(dá)數(shù)千年,比紙質(zhì)書(shū)保存的時(shí)間還要長(zhǎng)。這樣,信息化手段無(wú)論對(duì)于知識(shí)信息的加工、處理、傳遞、利用,還是保存,都有可能達(dá)到十分完美的程度,為現(xiàn)代知識(shí)的開(kāi)發(fā)利用提供了前所未有的巨大空間。
信息技術(shù)條件下知識(shí)資源開(kāi)發(fā)圍繞實(shí)現(xiàn)知識(shí)資源的深度加工、高效利用,在國(guó)內(nèi)外產(chǎn)業(yè)實(shí)踐中形成了以下一些方面的基本形式:
3.1 知識(shí)存在規(guī)?;_(kāi)發(fā)。傳統(tǒng)技術(shù)條件下,一柜之中只能架起幾百本書(shū),一囊之內(nèi)只能裝載幾十本書(shū),一桌之上只能展開(kāi)幾本書(shū),一掌之中只能翻閱一本書(shū),讀書(shū)只能一本一本地讀。作品的分散存放、傳播和使用,導(dǎo)致了原本應(yīng)該緊密聯(lián)系的知識(shí)之間相互隔離,影響了知識(shí)的使用效率。現(xiàn)代信息化技術(shù)條件下,經(jīng)過(guò)規(guī)?;_(kāi)發(fā),方寸之間可以同時(shí)承載和傳播幾萬(wàn)、幾十萬(wàn)甚至更多的作品,讀者可以把成千上萬(wàn)本書(shū)捆綁到一起,作為一本書(shū)來(lái)讀。不同作品之中知識(shí)的關(guān)聯(lián)性大大增強(qiáng),知識(shí)傳播和使用效益大大提高。作品資源規(guī)?;_(kāi)發(fā)的主要工作,就是通過(guò)解決著作權(quán)、尋找相關(guān)版本等工作,大量收集各種介質(zhì)的作品,進(jìn)行統(tǒng)一格式和標(biāo)準(zhǔn)的數(shù)字化并建成資源庫(kù),使其形成一定的規(guī)模。規(guī)?;灰俗非蠹媸詹⑿?、通吃天下(實(shí)際也做不到),而應(yīng)當(dāng)突出重點(diǎn),按照一定的主題、知識(shí)體系、質(zhì)量標(biāo)準(zhǔn),比較系統(tǒng)完整而有代表性地將相關(guān)作品收集入庫(kù)。如人民出版社圍繞黨的兩大理論成果以及反映“重大理論創(chuàng)新、重大歷史事件、重大戰(zhàn)略舉措、重要?dú)v史人物”的線索,系統(tǒng)完整地將優(yōu)秀作品和有代表性作品收集入庫(kù),使數(shù)據(jù)庫(kù)覆蓋了黨的思想理論領(lǐng)域所有主要著作文獻(xiàn)和知識(shí)點(diǎn)。
3.2 知識(shí)表現(xiàn)融合化開(kāi)發(fā)。紙質(zhì)出版條件下,知識(shí)在一個(gè)作品中只能以比較單一的文字或圖像等形式表現(xiàn)出來(lái),人們對(duì)知識(shí)的接受和理解受到極大的限制。知識(shí)表現(xiàn)融合化開(kāi)發(fā),就是采用多媒體技術(shù),把圖書(shū)、文章、圖片、音視頻、動(dòng)畫(huà)以及來(lái)自自然源頭的知識(shí)信息融合起來(lái)展現(xiàn),幫助讀者全方位、多角度感知和了解世界。一部融合化作品的開(kāi)發(fā)是一個(gè)復(fù)雜的創(chuàng)作過(guò)程,需要確定主題,整體構(gòu)思,撰寫(xiě)腳本,采集、篩選、剪裁素材,開(kāi)發(fā)軟件,標(biāo)引知識(shí)單元,等等,把多種知識(shí)表現(xiàn)形式的單元鏈接起來(lái),制作成一個(gè)數(shù)字化閱讀產(chǎn)品。目前一些廠家已經(jīng)生產(chǎn)出這樣的融合式電子書(shū)產(chǎn)品,這些產(chǎn)品通過(guò)方寸之間的輕松點(diǎn)擊,可以感知多種形式的知識(shí)信息,達(dá)到更好認(rèn)知世界、掌握知識(shí)的效果。人民出版社計(jì)劃開(kāi)發(fā)一套名為“中國(guó)共產(chǎn)黨思想理論庫(kù)書(shū)”的融合式產(chǎn)品,將毛澤東、鄧小平、江澤民、胡錦濤同志主要著作中的主要知識(shí)點(diǎn)(預(yù)計(jì)共13萬(wàn)個(gè))與相關(guān)的其他圖書(shū)、文章、錄像、圖片、歌曲等作品相鏈接,使這些重要著作成為整個(gè)理論數(shù)據(jù)庫(kù)多媒體展現(xiàn)的中心平臺(tái)。
3.3 知識(shí)授受微距化開(kāi)發(fā)。知識(shí)的傳授和接受之間存在空間距離和時(shí)間距離。傳統(tǒng)紙質(zhì)出版條件下,一個(gè)作品編輯完成后,需要通過(guò)排版、印刷、倉(cāng)儲(chǔ)、運(yùn)輸、門(mén)店等環(huán)節(jié),到達(dá)讀者手中,這中間存在漫長(zhǎng)時(shí)空距離。而在現(xiàn)代信息化條件下,一個(gè)作品完成后,一點(diǎn)鼠標(biāo)即可從授者的桌面到達(dá)受者的桌面,幾乎消滅了知識(shí)傳遞的時(shí)間距離和空間距離。這種變革對(duì)于提高知識(shí)使用效率的作用和意義是無(wú)可估量的。知識(shí)授受微距化開(kāi)發(fā)的主要工作,首先,要建設(shè)適合知識(shí)信息傳遞的信息化通道,當(dāng)前特別要注重建立起能夠瞬間傳遞大容量、高清化、實(shí)時(shí)化信息的通道;其次,要開(kāi)發(fā)閱讀軟件,這些軟件既要能夠有效地防止盜版,又要能夠滿(mǎn)足各種格式、標(biāo)準(zhǔn)文字信息的展現(xiàn)閱讀,還能夠用于融合式產(chǎn)品的閱讀使用。第三,要加強(qiáng)數(shù)據(jù)建設(shè),通過(guò)數(shù)碼化加工,使所有知識(shí)信息以數(shù)字代碼的形態(tài)存在,并且具有多種標(biāo)準(zhǔn)和格式,能夠適用于各種硬件和軟件條件下的傳播。第四,要加強(qiáng)標(biāo)準(zhǔn)建設(shè),在數(shù)字化、網(wǎng)絡(luò)化等知識(shí)傳播領(lǐng)域形成全國(guó)統(tǒng)一,并與國(guó)際接軌的標(biāo)準(zhǔn),使知識(shí)信息在傳遞過(guò)程中暢通無(wú)阻。
3.4 知識(shí)發(fā)現(xiàn)瞬間化開(kāi)發(fā)。知識(shí)的檢索發(fā)現(xiàn),歷來(lái)是人們?yōu)樘岣咧R(shí)應(yīng)用效率著力研究解決的一個(gè)重要問(wèn)題。傳統(tǒng)紙質(zhì)書(shū)條件下,人們檢索發(fā)現(xiàn)一個(gè)知識(shí)點(diǎn),幾乎都需要依照“相關(guān)圖書(shū)館(資料室)→相關(guān)圖書(shū)類(lèi)型→相關(guān)圖書(shū)→相關(guān)章節(jié)”這樣一個(gè)秩序費(fèi)力尋找。該過(guò)程不僅緩慢,而且其終點(diǎn)一般只能是“章節(jié)”。經(jīng)過(guò)信息化技術(shù)開(kāi)發(fā)的知識(shí)資源,一個(gè)小小檢索框加關(guān)鍵詞,就可以省去紙質(zhì)出版條件下的一切檢索過(guò)程,而且使檢索的對(duì)象從章節(jié)檢索發(fā)展到以語(yǔ)句為單位的知識(shí)點(diǎn)檢索。這是文獻(xiàn)檢索史上的一個(gè)飛躍。知識(shí)發(fā)現(xiàn)瞬間化開(kāi)發(fā)要做的工作,除了依賴(lài)于信息化通道,首先,要對(duì)知識(shí)資源進(jìn)行高質(zhì)量的數(shù)字化。根據(jù)知識(shí)資源本身的特點(diǎn)、用途以及相關(guān)媒體的技術(shù)特點(diǎn),采用相應(yīng)的標(biāo)準(zhǔn)、格式對(duì)作品資源進(jìn)行數(shù)字化。作品數(shù)碼化有不同的深度,以一本文字作品為例,人民出版社從6個(gè)層面上對(duì)圖書(shū)進(jìn)行了編碼:每個(gè)文字編碼、每個(gè)語(yǔ)段編碼、每個(gè)章節(jié)編碼、每頁(yè)作品編碼、每件作品編碼、每個(gè)作品體系編碼。作品數(shù)碼化開(kāi)發(fā)越深,知識(shí)資源的用途就越大。其次,對(duì)數(shù)字化的作品資源進(jìn)行結(jié)構(gòu)化加工。按一定的邏輯結(jié)構(gòu),特別是按學(xué)科體系、用戶(hù)需求和使用習(xí)慣,在數(shù)據(jù)庫(kù)中對(duì)作品資源進(jìn)行有序存放和展現(xiàn)。同樣的知識(shí)信息排列結(jié)構(gòu)不同,形成的產(chǎn)品也不同;結(jié)構(gòu)化程度越高,越能實(shí)現(xiàn)知識(shí)元素相互之間的關(guān)聯(lián),越有利于實(shí)現(xiàn)閱讀求知方式的智能化。知識(shí)資源結(jié)構(gòu)化與非結(jié)構(gòu)化相比,其使用價(jià)值可以以幾何級(jí)數(shù)增長(zhǎng)。人民出版社對(duì)近20000本黨政類(lèi)圖書(shū)的電子數(shù)據(jù),按照邏輯體系、發(fā)展歷程、知識(shí)點(diǎn)關(guān)聯(lián)三種方式進(jìn)行分類(lèi)排序,展現(xiàn)出整個(gè)理論體系的內(nèi)在有機(jī)聯(lián)系,每一部作品都不僅僅是一個(gè)獨(dú)立的個(gè)體,而是被放到完整的理論體系中來(lái)展現(xiàn)和傳播。第三,碎片化加工。采用現(xiàn)代標(biāo)引技術(shù)以及詞庫(kù)開(kāi)發(fā)技術(shù)等,把作品加工成以段落、句子等為單位存在的元素,并通過(guò)相應(yīng)的軟件,使讀者可以快捷方便地檢索使用。碎片化難在語(yǔ)義化,即使檢索出來(lái)的文字碎片具有一定的含義或主題。近年來(lái),人民出版社在承建“中國(guó)共產(chǎn)黨思想理論資源數(shù)據(jù)庫(kù)”的過(guò)程中開(kāi)創(chuàng)了機(jī)器標(biāo)引加入適當(dāng)人工的辦法,研發(fā)成功了“人民金典語(yǔ)義查詢(xún)系統(tǒng)”,把黨的思想理論文獻(xiàn)加工成近億個(gè)可供準(zhǔn)確查詢(xún)的知識(shí)點(diǎn),使文字檢索的語(yǔ)義準(zhǔn)確率達(dá)到了70—95%準(zhǔn)確率。
3.5 知識(shí)學(xué)習(xí)互動(dòng)化開(kāi)發(fā)。也就是使承載知識(shí)的網(wǎng)絡(luò)化產(chǎn)品帶有讀者之間互動(dòng)交流功能。傳統(tǒng)紙質(zhì)書(shū)是一個(gè)承載知識(shí)的獨(dú)立產(chǎn)品,其本身不存在與人交流的功能?,F(xiàn)代信息技術(shù)條件下,可以通過(guò)開(kāi)發(fā),使網(wǎng)絡(luò)化閱讀軟件上附帶相應(yīng)通信功能,人們可以用于向特定或廣大的其他讀者推送自己的認(rèn)識(shí)和見(jiàn)解,與對(duì)方進(jìn)行交流,相互學(xué)習(xí)提高。知識(shí)學(xué)習(xí)互動(dòng)化開(kāi)發(fā),除了需要利用良好的通信條件,還需要通過(guò)挖掘用戶(hù)的需求,對(duì)作品資源進(jìn)行特定加工,開(kāi)發(fā)出相應(yīng)的互動(dòng)軟件?!?/p>