文玉鋒 徐姣姣 周文杰
(1.西北師范大學(xué)商學(xué)院 甘肅蘭州 730070)
知識(shí)組織的目標(biāo)是對(duì)蘊(yùn)藏于文獻(xiàn)等記錄資源中的知識(shí)元素加以結(jié)構(gòu)化表征,以形成有助于知識(shí)交流和傳播的體系和工具。 古籍文獻(xiàn)是民族記憶得以傳承的主要媒介,也是形成具有本民族特色文化、知識(shí)傳承體系的關(guān)鍵。 在中華民族悠久的歷史發(fā)展進(jìn)程中,閃爍著先民智慧光芒的文化、文明與知識(shí)元素,蘊(yùn)藏于卷帙浩繁的古籍文獻(xiàn)之中。 中國(guó)文化史上,曾產(chǎn)生了很多卓有影響的文獻(xiàn)資源收集、整理、編目的成果,《六經(jīng)》《七略》《四庫(kù)全書(shū)》 堪稱(chēng)其中的杰出代表。黨的二十大報(bào)告強(qiáng)調(diào),堅(jiān)持和發(fā)展馬克思主義,必須同中華優(yōu)秀傳統(tǒng)文化相結(jié)合。在人類(lèi)社會(huì)步入數(shù)字化、智能化的今天,秉承文獻(xiàn)資源整理的悠久歷史傳統(tǒng),結(jié)合先進(jìn)的信息技術(shù)與計(jì)算平臺(tái),實(shí)現(xiàn)古籍文獻(xiàn)內(nèi)容結(jié)構(gòu)的表征與知識(shí)元素的序化組織,對(duì)于落實(shí)二十大精神,推進(jìn)國(guó)家文化數(shù)字化戰(zhàn)略,充分發(fā)揮傳統(tǒng)文化在中國(guó)式現(xiàn)代化進(jìn)程中的思想支撐具有顯而易見(jiàn)的重要作用?;诖?,本文旨在對(duì)傳統(tǒng)的古籍文獻(xiàn)信息組織方法進(jìn)行評(píng)述的基礎(chǔ)上,針對(duì)古籍文獻(xiàn)內(nèi)部結(jié)構(gòu)表征的理論基礎(chǔ)與實(shí)現(xiàn)路徑加以探討,以期對(duì)古籍文獻(xiàn)知識(shí)組織提供參照。
無(wú)論中外,文獻(xiàn)分類(lèi)與書(shū)目控制的理論與實(shí)踐都源遠(yuǎn)流長(zhǎng)。在中國(guó)古代,遠(yuǎn)至春秋時(shí)期孔子及弟子對(duì)《詩(shī)》《書(shū)》《禮》《易》《樂(lè)》《春秋》六經(jīng)的分類(lèi)整理,再至漢代劉向父子編成“最早的分類(lèi)目錄”[1]57——《七略》,又至清朝乾隆年間修成的《四庫(kù)全書(shū)》,都體現(xiàn)了通過(guò)書(shū)目“濃縮知識(shí)系統(tǒng)”[1]57的努力。近現(xiàn)代以來(lái),《中國(guó)圖書(shū)館分類(lèi)法》《美國(guó)國(guó)會(huì)圖書(shū)館分類(lèi)法》及《杜威十進(jìn)制分類(lèi)法》作為廣為采用的文獻(xiàn)分類(lèi)體系,對(duì)人類(lèi)文化資源的序化整理發(fā)揮了舉足輕重的作用。
文獻(xiàn)分類(lèi)體系是對(duì)古籍文獻(xiàn)加以序化整理的基本工具。 借助于各種分類(lèi)法、主題法及類(lèi)似工具,圖檔博等各類(lèi)專(zhuān)業(yè)機(jī)構(gòu)對(duì)文獻(xiàn)資源進(jìn)行了有效的結(jié)構(gòu)化和體系化呈現(xiàn),從而極大地提高了文獻(xiàn)資源的利用效率,客觀上加速了人類(lèi)文明的發(fā)展進(jìn)程。在過(guò)去一個(gè)多世紀(jì)的時(shí)間里,以公共圖書(shū)館為代表的“社會(huì)設(shè)計(jì)的信息空間”[2]4更是借由有效的信息組織方法與成果,基于所擁有的館藏資源,有效滿足了普羅大眾的知識(shí)、信息需求,從而成為啟蒙民智、促進(jìn)知識(shí)信息交流的關(guān)鍵社會(huì)性制度設(shè)計(jì)。
應(yīng)用分類(lèi)原理,對(duì)古籍文獻(xiàn)展開(kāi)信息組織具有重要的意義。 首先,對(duì)文獻(xiàn)資源加以分類(lèi),本身就是一種知識(shí)生產(chǎn)的行為。 應(yīng)用分類(lèi)法對(duì)文獻(xiàn)進(jìn)行序化整理的最終結(jié)果,是形成一幅人類(lèi)整體樣貌的完整“全景圖”。經(jīng)過(guò)分類(lèi)整理而形成的文獻(xiàn)書(shū)目體系,高度凝練了人類(lèi)既往的文化與知識(shí)累積成果,并以最直觀的方式提供給讀者,從而不但從一定程度上消除了文化傳承存續(xù)中斷之虞,也使文明發(fā)展的成果最大程度地接近于人們的認(rèn)知,擴(kuò)大了文化傳播的“底座”;其次,借助于文獻(xiàn)分類(lèi),人類(lèi)首次獲得了關(guān)于文明成果和科學(xué)知識(shí)全貌的整體性認(rèn)識(shí)。 在缺乏完善的文獻(xiàn)分類(lèi)體系的時(shí)代,即使博學(xué)多識(shí)的杰出學(xué)者窮經(jīng)皓首,也常常僅得人類(lèi)文化浩瀚總體中的滄海一粟。借助于系統(tǒng)化的文獻(xiàn)分類(lèi)工具,學(xué)者們得以直接面向文獻(xiàn)資源整體,從文化、文明與知識(shí)的全局出發(fā),展開(kāi)新的知識(shí)創(chuàng)造;普羅大眾則有機(jī)會(huì)通過(guò)文獻(xiàn)分類(lèi)工具的指引,有的放矢地選擇符合自己認(rèn)知需求的文獻(xiàn)資源加以閱讀,以?shī)蕵?lè)身心、發(fā)展心智。此外,文獻(xiàn)分類(lèi)體系還對(duì)發(fā)現(xiàn)人類(lèi)知識(shí)體系中的薄弱點(diǎn),對(duì)同種文明的發(fā)展歷程進(jìn)行追蹤考據(jù),以及對(duì)不同文明的文獻(xiàn)資源進(jìn)行比較分析等諸方面具有重要作用。
以分類(lèi)法為肇始,對(duì)文獻(xiàn)信息展開(kāi)的序化整理工作對(duì)人類(lèi)文明的傳承做出了重要貢獻(xiàn)。然而,如果站在更宏觀的角度看,應(yīng)用分類(lèi)法展開(kāi)的古籍文獻(xiàn)序化整理方法也存在著諸多顯而易見(jiàn)的局限性。
首先,傳統(tǒng)的古籍文獻(xiàn)分類(lèi)方法側(cè)重于對(duì)文獻(xiàn)宏觀特征的描述與揭示(如經(jīng)、史、子、集四部),很少能夠深入到文獻(xiàn)的內(nèi)容層次。由此產(chǎn)生的弊端是,基于分類(lèi)法雖然可以形成比較系統(tǒng)全面的書(shū)目體系,但這些書(shū)目體系本身能夠?yàn)樽x者提供新的知識(shí)增益卻非常有限。 典型的例證是,雖然七略、四庫(kù)等形式的書(shū)目體系曾被中國(guó)傳統(tǒng)知識(shí)分子賦予了“門(mén)徑之學(xué)”的重任,但僅僅通過(guò)這些類(lèi)目而直接達(dá)成治學(xué)之道,顯然可行性較低。
其次,基于分類(lèi)法而形成的書(shū)目體系是一種先驗(yàn)式的靜態(tài)文獻(xiàn)信息組織方式。 由于這種信息組織方式是依據(jù)事先確定的類(lèi)目展開(kāi)序化、整理,因此,難以將分類(lèi)體系之外的文獻(xiàn)有效納入進(jìn)來(lái)。 也就是說(shuō),一旦出現(xiàn)新的文獻(xiàn)類(lèi)型(或者出現(xiàn)原有文獻(xiàn)類(lèi)型之間相互交叉的現(xiàn)象),則原有的分類(lèi)體系不得不“便宜行事”;或者不得不“削足適履”,讓文獻(xiàn)去被動(dòng)適應(yīng)類(lèi)目;或者模糊原有類(lèi)目的邊界,使類(lèi)目勉為其難地“符合”文獻(xiàn)的特征。
第三,應(yīng)用分類(lèi)法展開(kāi)文獻(xiàn)信息組織的前提是,待序化整理的文獻(xiàn)必須是一個(gè)完整的單元(如一本書(shū))。也就是說(shuō),對(duì)于局部文獻(xiàn),分類(lèi)法通常根本無(wú)法顧及。一般情況下,古籍文獻(xiàn)的主體確實(shí)是以一個(gè)整體單元的形式呈現(xiàn)的,但很多情況下,一些局部性、片斷性的文獻(xiàn)(如篇章)對(duì)于研究者及時(shí)捕捉相關(guān)研究信息也至關(guān)重要。為此,從文獻(xiàn)書(shū)目體系使用者的角度看,在篇章(基于更小的文獻(xiàn)片斷)層次上對(duì)古籍文獻(xiàn)加以序化整理,潛在的價(jià)值很大,但分類(lèi)法顯然難以企及。另外,有些古籍文獻(xiàn)本身就是以片斷的方式存在。如簡(jiǎn)牘是記錄秦漢政治、經(jīng)濟(jì)、社會(huì)、文化、軍事的重要文化資源,但由于簡(jiǎn)牘的存在形態(tài)本身就是片斷式的,因此,傳統(tǒng)的文獻(xiàn)書(shū)目體系基本都沒(méi)有涉及到對(duì)此類(lèi)文獻(xiàn)資源的序化整理。然而,簡(jiǎn)牘中記載的那些鮮活的社會(huì)生活與管理場(chǎng)景,恰恰是反映數(shù)千年前中國(guó)社會(huì)實(shí)際狀況最直觀的第一手證據(jù),其文化價(jià)值可能并不亞于成體系的史書(shū)文獻(xiàn)或其目錄體系。
第四,分類(lèi)法對(duì)文獻(xiàn)信息資源特征的揭示主要是從管理者視角出發(fā)的,在文獻(xiàn)內(nèi)部蘊(yùn)藏的豐富內(nèi)容如何主動(dòng)對(duì)接讀者的知識(shí)結(jié)構(gòu)方面,分類(lèi)法常常無(wú)能為力。由此造成的結(jié)果是,文獻(xiàn)類(lèi)目的編制的確極大地促進(jìn)了文獻(xiàn)資源“藏”的全面性和系統(tǒng)性,也從一定程度上提升了文獻(xiàn)資源“用”的效率,但如果要基于文獻(xiàn)類(lèi)目而直接促進(jìn)文獻(xiàn)資源被用戶所吸收、接納、消化,則分類(lèi)法顯然力有不逮。 事實(shí)上,基于傳統(tǒng)分類(lèi)法而構(gòu)建文獻(xiàn)類(lèi)目體系并展開(kāi)服務(wù)的傳統(tǒng)模式,在一定程度上已經(jīng)導(dǎo)致了圖檔博等記錄資源管理機(jī)構(gòu)的“客戶粘性”①客戶粘性是一個(gè)源自工商管理領(lǐng)域的術(shù)語(yǔ),主要指客戶對(duì)于品牌或產(chǎn)品的忠誠(chéng)、信任與良性體驗(yàn)等結(jié)合起來(lái)形成的依賴(lài)程度和再消費(fèi)期望程度。不斷淡化,由記錄資源知識(shí)信息要素的管理者與開(kāi)發(fā)者逐漸淪為記錄資源載體的“看門(mén)人”,從而不可避免地削弱了圖情檔機(jī)構(gòu)、專(zhuān)業(yè)和學(xué)科的生命力,乃至于造成圖檔博相關(guān)行業(yè)、專(zhuān)業(yè)和學(xué)科的生存危機(jī)。
總之,盡管分類(lèi)法在古籍文獻(xiàn)的序化整理方面已發(fā)揮了重要的作用,但其局限性也顯而易見(jiàn)。著眼于克服這些薄弱點(diǎn),不斷有研究者呼吁,對(duì)于文獻(xiàn)信息的序化整理,應(yīng)該從文獻(xiàn)單元走向知識(shí)單元。
很多研究者都意識(shí)到了傳統(tǒng)文獻(xiàn)分類(lèi)方法的局限性,而呼吁文獻(xiàn)資源的序化整理轉(zhuǎn)向知識(shí)組織。文獻(xiàn)分類(lèi)與知識(shí)組織之間存在一些比較明顯的區(qū)別。如王子舟指出,從組織方法上看,文獻(xiàn)單元的組織方法較為單一,而知識(shí)單元的組織方法則復(fù)雜多樣。當(dāng)人們將客觀知識(shí)組織成一個(gè)有序的集合時(shí),如果以文獻(xiàn)單元為集合的基本組分,那么組織方法則主要是依文獻(xiàn)單元的內(nèi)容屬性(類(lèi)別、主題)或形式屬性(題名、責(zé)任者)來(lái)進(jìn)行的;如果以知識(shí)單元為基本組分,情況就有所不同。知識(shí)單元的屬性特征多種多樣,遠(yuǎn)比文獻(xiàn)單元豐富,故其組織方法也更為復(fù)雜多變[3]126。
文獻(xiàn)分類(lèi)與知識(shí)組識(shí)之間的區(qū)別, 事實(shí)上源于文獻(xiàn)單元和知識(shí)單元之間的不同。一般來(lái)說(shuō),文獻(xiàn)單元指“專(zhuān)門(mén)記錄和傳遞有知識(shí)的人工載體單元”[3]121。對(duì)于知識(shí)單元的認(rèn)識(shí),我國(guó)學(xué)者經(jīng)歷了一個(gè)較長(zhǎng)時(shí)期的討論過(guò)程。 早在1980 年,趙紅洲就曾提出:知識(shí)單元是已經(jīng)獲得科學(xué)共同體認(rèn)同的、堪稱(chēng)“粒子”形態(tài)的科學(xué)概念,它是科學(xué)的細(xì)胞,科學(xué)大廈的磚塊。大量的知識(shí)單元經(jīng)過(guò)重組, 按一定思路可凝聚成知識(shí)纖維,知識(shí)纖維又可在更高層次上組成復(fù)雜的知識(shí)系統(tǒng)[4]。 王通訊指出,“所謂知識(shí)單元,系指知識(shí)系列的一些基本‘概念’。不同的知識(shí)系列之間,可能有相同的知識(shí)單元。 但是一個(gè)知識(shí)系列的形成與規(guī)范化,主要體現(xiàn)在它具有一批與其他系列不同的知識(shí)單元”。 “知識(shí)單元組成一個(gè)個(gè)的知識(shí)系列,一個(gè)個(gè)的知識(shí)系列又組成整個(gè)知識(shí)體系”[5]。張德芳認(rèn)為,知識(shí)單元是寓藏于出版單元(某一文獻(xiàn))之中的,一個(gè)出版單元可能貯含一個(gè)以上的知識(shí)單元。“科學(xué)知識(shí)單元是科學(xué)勞動(dòng)的產(chǎn)品,是在對(duì)事物、實(shí)物、現(xiàn)象、過(guò)程等零散信息的基礎(chǔ)上,經(jīng)過(guò)系統(tǒng)歸納、分析、整理,能夠反映其本質(zhì)規(guī)律的概念、定理或定律”[6]。 馬費(fèi)成認(rèn)為,數(shù)據(jù)單元也可稱(chēng)知識(shí)單元,它是由各種事實(shí)、概念和數(shù)值等組成的[7]。王子舟則把知識(shí)單元定義為,客觀知識(shí)系統(tǒng)中有實(shí)際意義的基本單位,并指出所謂“有實(shí)際意義”,指知識(shí)單元是一個(gè)明確的語(yǔ)詞概念、科學(xué)定理等,而每一個(gè)知識(shí)單元都可以歸入某個(gè)知識(shí)系統(tǒng),并成為該知識(shí)系統(tǒng)的基本單位[3]123。
從古籍文獻(xiàn)序化整理的角度看,基于文獻(xiàn)單元與知識(shí)單元而展開(kāi)序化整理會(huì)產(chǎn)出截然不同的結(jié)果。 基于文獻(xiàn)單元的分類(lèi)法雖然能夠產(chǎn)生出系統(tǒng)化的書(shū)目體系,卻無(wú)法充分揭示文獻(xiàn)的內(nèi)容與主題,由此而使文獻(xiàn)資源的使用者常常產(chǎn)生“望其門(mén)墻”卻無(wú)法“入其宮者”之惑。 用戶面對(duì)分類(lèi)體系卻無(wú)法達(dá)成認(rèn)知需求的滿足,這顯然是導(dǎo)致傳統(tǒng)圖檔博機(jī)構(gòu)“客戶粘性”降低的重要原因。 為此,古籍文獻(xiàn)等信息資源組織管理方式需要在發(fā)揮分類(lèi)法既有優(yōu)勢(shì)的前提下,盡可能克服其局限。 主題法的應(yīng)用,正是對(duì)這一趨勢(shì)的響應(yīng)。近年來(lái),針對(duì)古漢語(yǔ)實(shí)體歧義[8]、數(shù)字化古籍資源的語(yǔ)義描述模型與元數(shù)據(jù)[9]、中文古籍?dāng)?shù)字化成果輔助人文學(xué)術(shù)研究功能[10]、數(shù)字人文背景下數(shù)字化古籍的深度開(kāi)發(fā)利用[11]等問(wèn)題,研究者已展開(kāi)了大量研究,為知識(shí)單元的古籍文獻(xiàn)序化整理奠定了基礎(chǔ)。
在分類(lèi)法得到廣泛應(yīng)用的同時(shí),圖檔博領(lǐng)域不斷發(fā)展其他類(lèi)型的信息組織方案,主題法便是其中最主要的代表。 分類(lèi)法主要是依據(jù)學(xué)科分類(lèi)等先驗(yàn)的外部屬性對(duì)文獻(xiàn)資源加以分類(lèi)、序化,顯然屬于上文所述的文獻(xiàn)單元層次的信息組織。 沿著主題法路向展開(kāi)的序化整理則與此形成了鮮明對(duì)比。 具體表現(xiàn)在,由于主題詞直接對(duì)接文獻(xiàn)的內(nèi)容層面,因此借助于主題詞展開(kāi)的信息組織針對(duì)的是文獻(xiàn)資源的內(nèi)容單元,而非分類(lèi)法所依據(jù)的學(xué)科等外部特征屬性。從這個(gè)角度看,主題法反映了信息組織方式由形式特征向內(nèi)容要素轉(zhuǎn)化所付出的努力。 也正是因?yàn)橹黝}法試圖從文獻(xiàn)主題提煉、歸納和概括的角度展開(kāi)信息組織工作,因此更切近于文獻(xiàn)內(nèi)含知識(shí)單元的組織和揭示。 總之,與分類(lèi)法相比,基于主題法展開(kāi)的信息組織更接近于知識(shí)單元的序化整理。 對(duì)圖書(shū)館等專(zhuān)事知識(shí)信息資源序化整理的機(jī)構(gòu)而言,無(wú)論是分類(lèi)法還是主題法,都沿用了索引式的思路,其主要目標(biāo)都是為讀者提供一些文獻(xiàn)關(guān)鍵特征的線索。簡(jiǎn)言之,二者都把為用戶提供檢索工具作為信息組織的基本目標(biāo)。然而,由于主題法更側(cè)重于內(nèi)容的揭示,因此,基于主題法而形成的信息組織產(chǎn)品,不僅具備查詢(xún)功能,也為用戶展開(kāi)文獻(xiàn)資源內(nèi)容層次的分析與加工提供了契機(jī)。從這個(gè)意義上說(shuō),主題法比分類(lèi)法更接近于知識(shí)組織。
“為人找書(shū)、為書(shū)找人”一直是圖書(shū)館等專(zhuān)業(yè)信息資源管理機(jī)構(gòu)的基本業(yè)務(wù)活動(dòng)目標(biāo),而分類(lèi)法和主題法則是達(dá)成此目標(biāo)的關(guān)鍵工具。為此,以分類(lèi)法和主題法為主體的信息組織一直被視為圖書(shū)館學(xué)、情報(bào)學(xué)等學(xué)科的核心知識(shí)。 然而,在數(shù)智化的時(shí)代,信息資源的存在形態(tài)已大大突破了“書(shū)”的范疇,而讀者對(duì)于信息資源的認(rèn)知需求也遠(yuǎn)遠(yuǎn)跨越了“文獻(xiàn)檢索”的傳統(tǒng)邊界。面對(duì)用戶更多元、更具動(dòng)態(tài)性的認(rèn)知需求,如何從知識(shí)單元的描述、揭示、表征和組織入手,幫助用戶高效率地實(shí)現(xiàn)個(gè)體認(rèn)知結(jié)構(gòu)與客觀知識(shí)世界之間的契合,已成為數(shù)智時(shí)代信息管理者展開(kāi)文獻(xiàn)資源序化整理的首要關(guān)切。 最近數(shù)年來(lái)方興未艾的數(shù)字人文研究無(wú)疑是對(duì)古籍文獻(xiàn)等信息資源加以細(xì)粒度、全景化知識(shí)組織的順應(yīng)、承接與光大。
除去直接應(yīng)用主題詞表展開(kāi)信息組織外,聚類(lèi)方法及關(guān)聯(lián)規(guī)則的使用也已成為知識(shí)組織者有效的探索工具。到目前為止,來(lái)自不同領(lǐng)域的研究者都對(duì)此展開(kāi)了大量探索。在國(guó)內(nèi),楊善林等應(yīng)用知識(shí)聚類(lèi)與知識(shí)分類(lèi)的方法將醫(yī)學(xué)的多維術(shù)語(yǔ)梳理了多項(xiàng)類(lèi)別并補(bǔ)充到知識(shí)庫(kù),形成了檢驗(yàn)規(guī)則、手術(shù)規(guī)則等約6000 多類(lèi)(條)[12]。苗蕾等應(yīng)用聚類(lèi)分析與分類(lèi)評(píng)價(jià)的方法研究了湖南省可持續(xù)發(fā)展實(shí)驗(yàn)區(qū),得出了該區(qū)域的發(fā)展格局與領(lǐng)域優(yōu)勢(shì)[13]。 侯西龍等借助關(guān)聯(lián)數(shù)據(jù)的技術(shù)方法構(gòu)建了非遺知識(shí)組織與關(guān)聯(lián)數(shù)據(jù)集,建立了非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集與知識(shí)服務(wù)平臺(tái)[14]。唐旭麗等利用知識(shí)關(guān)聯(lián)方法解決了金融知識(shí)表示及風(fēng)險(xiǎn)識(shí)別問(wèn)題[15]。王臨科等利用知識(shí)聚類(lèi)的方法研究了知識(shí)主題社區(qū)、用戶興趣模型、主題多樣性等相關(guān)領(lǐng)域[16];在國(guó)外,Skevakis 等在領(lǐng)域知識(shí)組織中通過(guò)關(guān)聯(lián)規(guī)則幫助博物館館藏資源實(shí)現(xiàn)了語(yǔ)義交互等[17]。Aminpour 等通過(guò)知識(shí)聚類(lèi)的方法證實(shí)了來(lái)自不同資源用戶群體的智慧優(yōu)于那些更同質(zhì)的群體[18]。 Kohli等系統(tǒng)研究了知識(shí)關(guān)聯(lián)、知識(shí)分類(lèi)等方法,解決了電子病歷卡的機(jī)器可讀性問(wèn)題[19]。 上述諸多研究中,聚類(lèi)分析與關(guān)聯(lián)規(guī)則的使用可被視為一種建立在主題法基礎(chǔ)上的知識(shí)組織嘗試。迄今為止,此方面的研究成果雖然層出不窮,但尚未形成完善的知識(shí)組織方案。特別是面對(duì)卷帙浩繁的古籍文獻(xiàn),如何通過(guò)大規(guī)模、全景式的知識(shí)組織,復(fù)現(xiàn)古代社會(huì)經(jīng)濟(jì)、政治、文化的整體樣貌,還原人類(lèi)文明基因的本來(lái)面目,探索人類(lèi)科學(xué)、文化與思潮演化的共同特征與一般規(guī)律,顯然具有無(wú)可比擬的價(jià)值。
綜上所述,與分類(lèi)法相比,基于主題法及與其關(guān)聯(lián)的聚類(lèi)分析、關(guān)聯(lián)規(guī)則等方法展開(kāi)的信息資源序化整理方案顯然更貼近于知識(shí)組織的要義,但這不意味著傳統(tǒng)的主題詞表及相關(guān)工具已為文獻(xiàn)信息組織提供了完善的解決方案。恰恰相反,就古籍文獻(xiàn)而言,真正的知識(shí)組織與其說(shuō)尚處于早期的探索階段,毋寧說(shuō)還沒(méi)有找到真正恰當(dāng)?shù)睦碚摶A(chǔ)與有效可行的實(shí)踐解決方案。
本文中,已經(jīng)詳細(xì)闡釋了文獻(xiàn)分類(lèi)與知識(shí)組織之間存在諸多區(qū)別。然而,如果回歸到抽象的理論層次,則二者具有相通性。概括而言,由科學(xué)哲學(xué)家波普爾(Karl Popper)所發(fā)展的“世界3”理論可被視為文獻(xiàn)分類(lèi)與知識(shí)組織的共同理論基礎(chǔ)。 波普爾認(rèn)為,“世界3”指科學(xué)思想、詩(shī)的思想以及藝術(shù)作品的世界[20],是一個(gè)與客觀物質(zhì)世界(即“世界”)和主觀精神世界(即“世界”)一樣,具有客觀實(shí)在性與獨(dú)立自主性的世界[21-22]。 通常情況下,“世界3”又被稱(chēng)之為客觀知識(shí)的世界。英國(guó)情報(bào)學(xué)家布魯克斯指出,客觀的知識(shí)世界是由語(yǔ)言、藝術(shù)、科學(xué)、技術(shù)等所有被人類(lèi)貯存起來(lái)或傳播到地球各地的人工產(chǎn)物所記錄下來(lái)的人類(lèi)精神產(chǎn)物,它體現(xiàn)在文獻(xiàn)以及音樂(lè)、藝術(shù)、科學(xué)技術(shù)等人工產(chǎn)物中[23]。 于良芝認(rèn)為,在圖書(shū)館情報(bào)學(xué)領(lǐng)域,客觀知識(shí)是指以語(yǔ)言、文字、圖像等符號(hào)表達(dá)的、記錄在實(shí)物載體(如書(shū)本、磁盤(pán))上的知識(shí)[2]5。
立足于“世界3”的理論視角,自20 世紀(jì)80 年代以來(lái),圖書(shū)館情報(bào)學(xué)領(lǐng)域的研究者逐步形成共識(shí),認(rèn)為文獻(xiàn)組織的實(shí)質(zhì)就是一種知識(shí)組織[3]129。 研究者已針對(duì)知識(shí)組織若干問(wèn)題展開(kāi)了深入系統(tǒng)的討論。如劉迅早在1985 年就提出,圖書(shū)館學(xué)應(yīng)向“知識(shí)工程”轉(zhuǎn)變,把知識(shí)組織作為圖書(shū)館學(xué)的一個(gè)重要領(lǐng)域[24]。王知津和王樂(lè)指出,將知識(shí)組織等同于文獻(xiàn)的分類(lèi)、標(biāo)引、編目、文摘、索引等一系列整序活動(dòng),這是狹義的知識(shí)組織;而將知識(shí)因子(知識(shí)結(jié)點(diǎn))有序化和知識(shí)關(guān)聯(lián)(結(jié)點(diǎn)間的聯(lián)系)網(wǎng)絡(luò)化,這是廣義的知識(shí)組織。廣義的知識(shí)組織包含了狹義的知識(shí)組織,因?yàn)閭€(gè)體文獻(xiàn)也可視為是知識(shí)因子[25]。 蔣永福則指出,“知識(shí)組織是指為促進(jìn)或?qū)崿F(xiàn)主觀知識(shí)客觀化和客觀知識(shí)主觀化而對(duì)知識(shí)客體所進(jìn)行的諸如整理、加工、引導(dǎo)、揭示、控制等一系列組織化過(guò)程及其方法”[26]。 王子舟指出,隨著知識(shí)社會(huì)的來(lái)臨,“知識(shí)組織”已漸成知識(shí)社會(huì)學(xué)、知識(shí)管理、人工智能、教育學(xué)等多種學(xué)科共同使用的科學(xué)概念[3]129。
迄今為止, 圖書(shū)館情報(bào)學(xué)領(lǐng)域內(nèi)外的研究者對(duì)文獻(xiàn)分類(lèi)與知識(shí)組織的內(nèi)涵及二者之間的關(guān)系展開(kāi)了廣泛討論。綜合而言,這些觀點(diǎn)大致可以概括為兩個(gè)方面:首先,文獻(xiàn)分類(lèi)與知識(shí)組織既緊密聯(lián)系又存在區(qū)別;其次,知識(shí)組織高于文獻(xiàn)分類(lèi),是圖書(shū)館職業(yè)未來(lái)發(fā)展的方向。 從古籍文獻(xiàn)序化整理的角度出發(fā),本文認(rèn)為,文獻(xiàn)分類(lèi)與知識(shí)組織在本質(zhì)上都是對(duì)記錄資源的結(jié)構(gòu)化,但文獻(xiàn)分類(lèi)是一種基于文獻(xiàn)載體形式特征而展開(kāi)的記錄資源整序,而知識(shí)組織則是一種基于古籍文獻(xiàn)的內(nèi)容要素而展開(kāi)的整序。 二者共同以“世界3”的結(jié)構(gòu)揭示為目標(biāo),但卻在具體的記錄資源體系中分別針對(duì)著不同的層次。 從文獻(xiàn)分類(lèi)到知識(shí)組織,恰恰體現(xiàn)了“世界3”的物化形態(tài)——記錄資源體系——明晰的層級(jí)結(jié)構(gòu),因而需要運(yùn)用文獻(xiàn)分類(lèi)或知識(shí)組織等不同方法加以整序。
圖書(shū)館情報(bào)學(xué)領(lǐng)域的諸多學(xué)者都對(duì)知識(shí)組織的本質(zhì)進(jìn)行了闡釋。布魯克斯認(rèn)為,知識(shí)組織的本質(zhì),是要研究情報(bào)對(duì)認(rèn)識(shí)主體的知識(shí)結(jié)構(gòu)作用的機(jī)制[1]26。社會(huì)認(rèn)識(shí)論的創(chuàng)立者謝拉認(rèn)為,社會(huì)是由那些為了共同目標(biāo)和滿足共同需要而在一起工作的人們組成的,圖書(shū)館及其書(shū)目系統(tǒng)是一個(gè)社會(huì)機(jī)關(guān),記載的是人類(lèi)的知識(shí)信息,書(shū)目的職能就是濃縮人類(lèi)發(fā)明的記錄通訊的那部分知識(shí),并將這些知識(shí)傳遞給社會(huì)的不同需要者[1]52。 然而,承載著客觀知識(shí)的文獻(xiàn)本身,兼具實(shí)體和內(nèi)容兩個(gè)要素。 這意味著,知識(shí)的組織不僅需要關(guān)注作為物理實(shí)體的文獻(xiàn),也需關(guān)注作為智力結(jié)晶的作品(intellectual work)?!白髌贰边@一概念提出于20 世紀(jì)中葉,被用來(lái)指一個(gè)作者的特定智力成果?;谶@一概念,于良芝教授提出,“圖書(shū)館文獻(xiàn)加工處理的實(shí)質(zhì)是對(duì)文獻(xiàn)中包含的知識(shí)與信息(recorded knowledge or information)的組織整理。圖書(shū)館對(duì)文獻(xiàn)的分類(lèi)事實(shí)上是對(duì)作為智力成果的作品的分類(lèi);圖書(shū)館對(duì)文獻(xiàn)的揭示報(bào)道事實(shí)上是對(duì)其智力成果的報(bào)道。圖書(shū)館職業(yè)活動(dòng)的對(duì)象首先是作品,其次才是文獻(xiàn)實(shí)體”[2]10。
王子舟曾指出:“就本質(zhì)而言, 知識(shí)組織的內(nèi)在機(jī)制是對(duì)人腦記憶機(jī)制的一種模擬。 人腦的記憶有識(shí)記、保持、再現(xiàn)三個(gè)環(huán)節(jié)(即信息的編碼、存儲(chǔ)、提?。?,知識(shí)組織也如是。記憶的第一環(huán)節(jié)是‘識(shí)記’,包括視覺(jué)識(shí)記、聽(tīng)覺(jué)識(shí)記、視聽(tīng)識(shí)記,知識(shí)組織也有這些方式;記憶的中間環(huán)節(jié)‘保持’包括空間保持、系列保持、聯(lián)想保持、網(wǎng)絡(luò)保持、更替保持等方式,知識(shí)組織也在使用這些方式;記憶的保持會(huì)有‘遺忘’,知識(shí)組織則會(huì)有‘遺漏’;記憶的第三環(huán)節(jié)是‘再現(xiàn)’,體現(xiàn)為再認(rèn)與回憶,知識(shí)組織的‘再現(xiàn)’體現(xiàn)在檢索與輸出。 當(dāng)然,在人工智能領(lǐng)域里,知識(shí)組織已經(jīng)發(fā)展出專(zhuān)家系統(tǒng)這樣高級(jí)的形式,但這種形式本質(zhì)上仍是對(duì)人腦機(jī)制的一種模仿。 在飛速發(fā)展的信息技術(shù)的支持下,未來(lái)的知識(shí)組織形式將呈現(xiàn)對(duì)人腦記憶機(jī)制、 思維機(jī)制交互模仿的趨向”[3]131。 蔣永福則認(rèn)為,“知識(shí)組織的實(shí)質(zhì)是以滿足人類(lèi)的客觀知識(shí)主觀化的需要為目的、針對(duì)客觀知識(shí)的無(wú)序化狀態(tài)所實(shí)施的一系列有序化組織活動(dòng)”[27]。
在謝拉(Jesse Shera)將個(gè)體與社會(huì)“智力”發(fā)展進(jìn)行類(lèi)比的基礎(chǔ)上,周文杰提出了社會(huì)認(rèn)識(shí)層次論,以期揭示圖書(shū)館職業(yè)和信息資源序化整理的本質(zhì)。按照社會(huì)認(rèn)識(shí)層次論,經(jīng)過(guò)整序后的“世界3”可被視為社會(huì)的“認(rèn)知結(jié)構(gòu)”。 社會(huì)認(rèn)知結(jié)構(gòu)得以完善的重要體現(xiàn),就是對(duì)人類(lèi)對(duì)科學(xué)知識(shí)本身不斷進(jìn)行序化、組織,從而使社會(huì)認(rèn)識(shí)向著更高級(jí)的方向發(fā)展[28]。 對(duì)于古籍文獻(xiàn)而言,圖書(shū)館職業(yè)既需要從書(shū)籍等物質(zhì)載體本身的外部屬性入手分類(lèi)與組織,更需要從作品中的“智力成份”等更加本質(zhì)的因素入手,以便從內(nèi)容要素的層次對(duì)其內(nèi)在結(jié)構(gòu)做出更加接近于其本質(zhì)的表征。 之于前者《六經(jīng)》《七略》《四庫(kù)全書(shū)》古籍文獻(xiàn)的分類(lèi)、整序的傳統(tǒng)方法就是典型例證;之于后者,則恰恰是對(duì)古籍文獻(xiàn)中“知識(shí)成份”的揭示,是知識(shí)組織的本質(zhì)所在。
從知識(shí)組織的角度來(lái)看,無(wú)論在圖書(shū)館職業(yè)領(lǐng)域內(nèi)部還是外部,關(guān)于記錄資源知識(shí)成份的整序組織都還在探索的路上。這種探索,既包括圖書(shū)館職業(yè)采用分類(lèi)語(yǔ)言、主題描述以及基于文獻(xiàn)內(nèi)容特征的編碼等方式開(kāi)展的努力,也包括計(jì)算機(jī)等領(lǐng)域開(kāi)展的知識(shí)圖譜、語(yǔ)義網(wǎng)絡(luò)及知識(shí)發(fā)現(xiàn)等方面的研究和實(shí)踐。 種種跡象表明,由于諸多因素的局限,真正從“知識(shí)成份”角度開(kāi)展記錄資源的組織與表征還停留在一個(gè)充滿不確定性的初始階段,但著眼于挖掘古籍文獻(xiàn)等記錄資源在社會(huì)認(rèn)知中的更大作用,這種知識(shí)組織方式將具有巨大的理論潛力和應(yīng)用價(jià)值。當(dāng)前,面對(duì)古籍文獻(xiàn)數(shù)字化程度的急速加深,數(shù)字人文、計(jì)算語(yǔ)言學(xué)等新型數(shù)據(jù)密集型研究范式的興起,對(duì)古籍文獻(xiàn)展開(kāi)知識(shí)組織,不僅適逢其時(shí),而且十分必要。
古籍文獻(xiàn)是優(yōu)秀傳統(tǒng)文化的主要載體。 為挖掘優(yōu)秀的文化基因,提高古籍文獻(xiàn)的使用效率和效益,本文從知識(shí)組織的角度,對(duì)古籍文獻(xiàn)的序化整理的歷史脈絡(luò)、現(xiàn)實(shí)特征和未來(lái)轉(zhuǎn)向進(jìn)行了理論分析。整體而言,分類(lèi)法作為古籍文獻(xiàn)序化整理的肇始,對(duì)于文化的傳承與傳播做出了積極的貢獻(xiàn)。然而,分類(lèi)法限于靜態(tài)特征的揭示,因此,面對(duì)數(shù)智化的時(shí)代要求,暴露了諸多局限和不足。 與分類(lèi)法相比,主題法更接近于知識(shí)單元層次的文獻(xiàn)序化整理,但迄今并沒(méi)有形成完善、可行的知識(shí)組織方案。鑒于古籍文獻(xiàn)在文化復(fù)興和民族自信中的重要作用,本文從“世界3”角度討論了古籍文獻(xiàn)知識(shí)組織的理論基礎(chǔ)和本質(zhì)屬性,以便為圖檔博領(lǐng)域內(nèi)外的研究者深入挖掘古籍文獻(xiàn)這一文化瑰寶中的優(yōu)秀文化元素提供啟示。
基于本文所闡釋的主要理論主張,在后續(xù)研究中,我們將進(jìn)一步展開(kāi)實(shí)踐探析,立足于上文所解析的理論基礎(chǔ),應(yīng)用自然語(yǔ)言處理等技術(shù)手段,對(duì)具有代表性的中華傳統(tǒng)古籍文獻(xiàn)展開(kāi)知識(shí)計(jì)算等基礎(chǔ)性工作,以便為古籍文獻(xiàn)知識(shí)組織由理論走向?qū)嵺`提供切實(shí)可行的解決方案。