李 雷,張亞茹
(1西安醫(yī)學院圖書館,陜西 西安 710021;2.中國人民解放軍第451醫(yī)院,陜西 西安 710054)
知識組織并非脫離了信息組織而存在,而是信息組織發(fā)展到一定階段的產(chǎn)物。知識組織工具對自然語言的控制大致用兩種方式,一是建立知識結(jié)構(gòu),二是控制詞匯,用戶能夠以最簡單、快捷的方式獲得所有符合需求的相關(guān)文獻資源。從廣義上來說,凡是對自然語言進行了控制并有利于提高檢索效率的工具,無論其控制范圍、控制手段及類表的規(guī)模程度,都可以統(tǒng)稱為知識組織工具。
知識組織(Knowledge Organization,簡稱KO)是在圖書館學、情報學的分類系統(tǒng)和敘詞表研究的基礎(chǔ)上發(fā)展起來的。知識組織的目標是序化知識,從而提供知識?!爸R組織”一詞,1929年由美國著名圖書館學家、分類法專家布利斯在其著作《知識組織和科學系統(tǒng)》、《圖書館的知識組織》中首先提出來的。著名圖書館學家謝拉也分別于1965年和1966年出版了《圖書館與知識組織》、《文獻與知識組織》兩部論著,對圖書館的知識組織表現(xiàn)及作用進行了初步研究。1989年在德國法蘭克福成立了“國際知識組織協(xié)會”(ISKO),并多次以知識組織為主題召開學術(shù)研討會,對知識組織的各個領(lǐng)域進行深入探討。1993年,《國際分類法》期刊改名為《知識組織》,專門刊載有關(guān)知識組織的研究成果。在我國,對知識組織的研究歷史并不長,所以其理論與方法體系均不成熟。也正因為此,目前對知識組織問題的研究是當前圖書情報界的一個熱點問題。
知識組織工具,也稱知識組織系統(tǒng)或者知識組織體系(Knowledge Organization Systems,簡稱KOS),是目前國內(nèi)外研究的熱點。知識組織系統(tǒng)是各種對人類知識結(jié)構(gòu)進行表達和有組織的闡述的語義工具(Semantic Tools)的統(tǒng)稱。包括傳統(tǒng)圖書館建立在文獻單元基礎(chǔ)上的分類法、標題表、敘詞表以及更泛指的情報檢索語言、標引語言,也包括網(wǎng)絡(luò)時代建立在概念單元或只是單元基礎(chǔ)上的概念地圖(Concept-Maps)、語義網(wǎng)(Semantic Networks)、概念本體(Ontologies)等。知識組織系統(tǒng)的功能主要通過對信息資源的組織、檢索與導(dǎo)航,發(fā)揮用戶與信息資源間的中介作用。知識組織已經(jīng)成為信息科學中一個重要的研究領(lǐng)域,一些重要的國際會議都針對知識組織領(lǐng)域成立了專門工作組。如國際數(shù)字圖書館聯(lián)合會議(JCDL)、歐洲數(shù)字圖書館會議(ECDL)、都柏林核心與元數(shù)據(jù)應(yīng)用國際會議(DCMA)等。從歷次會議的研究主題來看,分類表、敘詞表及知識本體等成為該領(lǐng)域的研究熱點。
分類表是以組織人類知識資源即圖書館館藏資源為主要目的,是一種根據(jù)資源內(nèi)容屬性對資源進行分門別類、系統(tǒng)地組織和揭示的方法。其主要特征是覆蓋人類全部知識門類、帶有標記符號和使用復(fù)雜。分類表強調(diào)的是概念之間的層級聚合與類別體系。
分類表在網(wǎng)絡(luò)環(huán)境下的發(fā)展主要表現(xiàn)為類表電子化、組織網(wǎng)絡(luò)資源、提供新的用途等。分類表的電子化,一是有利于使用,可直接檢索相關(guān)類目,類表和類目之間可以超文本進行橫向鏈接,類表的體積問題不再引人關(guān)注。二是有利于與其他類表兼容,從而同時使用,也有利于類表更新。圖書分類表用于組織網(wǎng)絡(luò)資源并提供資源的瀏覽雖取得了不少進展,但是必然會有一定的局限性,主要還是受限于圖書分類表的知識結(jié)構(gòu)。網(wǎng)絡(luò)資源表現(xiàn)出更多的靈活性和多元化,除了用來直接組織網(wǎng)絡(luò)資源外,還具有作為知識庫、結(jié)構(gòu)庫來編制新的知識組織工具的潛能。如機構(gòu)Taxonomy的編制。
網(wǎng)絡(luò)化的敘詞表聯(lián)機顯示是敘詞表在網(wǎng)絡(luò)環(huán)境下應(yīng)用的主要形式之一。我們可將應(yīng)用于網(wǎng)絡(luò)信息組織的敘詞表歸納為兩種類型:一是僅供選擇詞匯使用,獨立于檢索系統(tǒng)之外,通過選定的檢索詞作為檢索入口詞,不直接鏈接資源。二是敘詞表嵌入在檢索系統(tǒng)之中,作為檢索系統(tǒng)的一部分,直接使用選中詞鏈接相關(guān)資源。這種方法更符合用戶查找資源的易用性和便利性需求。網(wǎng)絡(luò)環(huán)境下敘詞表的作用可以提供超文本導(dǎo)航,輔助用戶檢索,減少用戶選擇檢索詞的負擔,從而提高檢索效率。
網(wǎng)絡(luò)技術(shù)的出現(xiàn)使得網(wǎng)絡(luò)直接出版和使用的敘詞表越來越多,敘詞表由標引工具逐漸發(fā)展為一種檢索工具,成為網(wǎng)絡(luò)版數(shù)據(jù)庫檢索和元數(shù)據(jù)標引中不可缺少的一部分。與圖書分類表一樣,敘詞表也用來組織網(wǎng)絡(luò)資源,可以用來作為主題網(wǎng)關(guān)的標引詞匯和瀏覽知識結(jié)構(gòu),還可以用來作為新的知識組織工具的詞庫或詞間關(guān)系庫。比如機構(gòu)Taxonomy和本體的編制。
Taxonomy作為一種知識組織工具,由分類結(jié)構(gòu)、概念語詞兩個元素組成,描述內(nèi)容對象的概念語詞被組織成一個等級結(jié)構(gòu)。Taxonomy可應(yīng)用于各種環(huán)境和支持各種用途。如檢索提問處理、檢索結(jié)果優(yōu)化、源信息自動分類等。但它更常用于企業(yè)、機構(gòu)的知識分類和網(wǎng)站的瀏覽、導(dǎo)航。它與企業(yè)的知識管理、知識庫的建設(shè)密切相關(guān),也是網(wǎng)站信息構(gòu)建的重要組成部分。支持瀏覽是Taxonomy的一項重要功能,Taxonomy一詞就是以分類為基本手段支持瀏覽功能的各種工具如主題指南等的統(tǒng)稱體系的依據(jù)。在信息組織領(lǐng)域,Taxonomy特指對信息對象的分類組織。
Semantic Web是繼萬維網(wǎng)之后的新一代網(wǎng)絡(luò),體現(xiàn)了一種新的知識組織方法。Semantic Web又稱語義網(wǎng),是由全球信息網(wǎng)聯(lián)盟的蒂姆·伯納斯-李(Tim buerners-Lee)在1998年提出的一個概念。其核心是:通過給全球信息網(wǎng)上的文檔(如:HTML)添加能夠被計算器所理解的語義(Meta data),從而使整個因特網(wǎng)成為一個通用的信息交換媒介。語義網(wǎng)是由比現(xiàn)今成熟的網(wǎng)絡(luò)搜索引擎更加行之有效的、更加意義廣泛的,并且自動聚集和搜集信息的文檔組成的。Semantic Web和Web 2.0的區(qū)別的是,Semantic Web著重于網(wǎng)絡(luò)本身,體現(xiàn)一種網(wǎng)絡(luò)標準和語言,而Web 2.0更著重于提倡用戶參與的網(wǎng)絡(luò)服務(wù)方式。Semantic Web最基本的元素就是語義聯(lián)結(jié),可以提升萬維網(wǎng)以及其互聯(lián)的資源的可用性和有效性。Semantic Web中的概念意義比我們所理解的傳統(tǒng)知識組織工具涵蓋的概念要寬泛很多。它是基于知識點、信息點,而不是基于館藏或文獻,包括任何可成為知識點和信息點的概念。Semantic Web之所以能夠?qū)崿F(xiàn)知識點、信息點之間的鏈接,就是因為它提供了概念之間的關(guān)系。這種關(guān)系比敘詞表中的詞間語義關(guān)系要復(fù)雜很多,一是它表達了概念之間的具體關(guān)系,而不是籠統(tǒng)的等同、等級、相關(guān)關(guān)系。其次,它提供的概念之間的關(guān)系是網(wǎng)狀的,從理論上來說,概念和概念之間存在著各種可能的關(guān)系。
Ontology一詞來自于哲學領(lǐng)域,是對某一知識領(lǐng)域的概念化描述和說明。1991年Neches等人將Ontology定義為“給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及利用這些術(shù)語和關(guān)系構(gòu)成詞匯外延的規(guī)則”。1998年Studer等人提出:“Ontology是共享概念模型的明確的形式化規(guī)范說明?!边@一定義已被多數(shù)人所認同。這里包含4層意思:“概念模型”(Conceptualifation)指通過客觀世界中一些現(xiàn)象的相關(guān)概念而得到的模型;“明確”(Explicit)指所使用的概念及其約束都有明確的定義。Ontology可以理解為是Semantic Web理念的具體應(yīng)用和增強,和Semantic Web一樣,它包括概念和概念之間的關(guān)系,是計算機可理解和操作的。但Ontology對概念之間關(guān)系展示的方式不同,并增加了其他元素來增強它的用途功能。有專家貼切地將Ontology描述為結(jié)合了Taxonomy和敘詞表的特點。Ontology首先將概念(entities)劃分為類型(classes),在以分類為主干的骨架下,揭示概念之間的關(guān)系。同時 Ontology還包括規(guī)則(rules)和定理(axioms),從而具備了推理的功能。Ontology也被描述為是Taxonomy和推理規(guī)則的結(jié)合。在用途方面,和Taxonomy一樣,Ontology一般針對某一特定領(lǐng)域或范圍。由于它主要是基于概念的,而不是某一館藏或文獻庫,因而在使用上有了更大的潛力,可用于兼容或整合不同系統(tǒng)。同時Ontology的推理功能使得它的用途超出了信息檢索的范疇,可用于回答問題、機器翻譯,企業(yè)模塊化、和數(shù)據(jù)挖掘等。
Topic maps是以圖形方式來展示某一資源庫的知識結(jié)構(gòu)從而提供信息的檢索。Topic maps改變了傳統(tǒng)意義上的匹配檢索模式。傳統(tǒng)知識組織工具主要用于標引階段,所包含的知識結(jié)構(gòu)對用戶來說,是隱形的。用戶面對的是一個輸入界面,為了檢索到理想的信息資源,需要構(gòu)建出合適的、與標引詞或符號相匹配的提問。在對資源庫知識結(jié)構(gòu)一無所知的情況下,圖書分類表和Taxonomies雖然也用于揭示資源庫的知識結(jié)構(gòu),但主要是類聚資源、提供資源的瀏覽而不是檢索。而Topic maps揭示信息資源的主題概念,并將主題概念作了鏈接,展示了整個資源庫的知識結(jié)構(gòu),使用戶可以在瀏覽關(guān)于該資源庫的知識結(jié)構(gòu)圖的前提下進行信息資源的檢索。Semantic Web和Ontology也具備提供該功能的潛力。但由于Topic maps采用了圖形技術(shù),以及在組成上更為簡單,因而更突出和具有優(yōu)勢。Topic maps由三個基本元素組成:主題(topics)、關(guān)系(associations)、鏈接的信息資源(occurrences)。主題也就是概念,可供檢索的信息點、知識點,也是經(jīng)受控的標引詞。關(guān)系是不同主題之間的關(guān)系,這種關(guān)系與敘詞表、Semantic Web、Ontology中的詞間語義關(guān)系不同。敘詞表、Semantic Web、Ontology反映的概念之間的關(guān)系是抽象、一般性的,Topic maps中主題之間的關(guān)系是具體的,類似于元數(shù)據(jù)中的關(guān)系型字段,同時,Topic maps還包含其他元素來細化這三個基本元素和描述信息資源。
數(shù)字化和網(wǎng)絡(luò)化是新知識組織工具應(yīng)用于網(wǎng)絡(luò)環(huán)境的前提與基礎(chǔ)。采用數(shù)據(jù)庫方式存儲和表示,便于對知識組織工具的訪問和管理,也便于將其與相應(yīng)的電子資源集成在一起。由于組織對象的數(shù)字化和網(wǎng)絡(luò)技術(shù)的應(yīng)用,知識組織工具組織文獻資源的功能在淡化,揭示信息資源內(nèi)容特征的功能在強化。新知識組織工具主要是基于概念,而不是館藏文獻,從而強化了知識組織工具的應(yīng)用潛力。
標準化是實現(xiàn)知識組織工具之間交流與互換的基石。國際上一直極為重視KOS標準化。2004年W3C發(fā)布的SKOS推薦標準,是一個基于語義網(wǎng)技術(shù)表示受控詞表及其他知識組織工具的概念框架。它具有簡潔、靈活、通用、易擴展以及與語義網(wǎng)及傳統(tǒng)圖書情報領(lǐng)域聯(lián)系緊密的特點。對于促進受控詞表在網(wǎng)絡(luò)環(huán)境下的使用有重要意義。
互操作性指的是兩個或兩個以上的系統(tǒng)相互使用已被交換信息的能力。就其本質(zhì)而言,互操作性是對異質(zhì)實體(包括異種體系結(jié)構(gòu)、異種操作系統(tǒng)、異種網(wǎng)絡(luò)和異種語言等)中可獲得資源的透明調(diào)用的能力。在這一領(lǐng)域當前關(guān)注的焦點及發(fā)展趨勢是將多類型、多語種的知識組織體系通過相互映射集成整合在一起,并可被用于多個不同系統(tǒng),實現(xiàn)異地跨系統(tǒng)的瀏覽與檢索。例如我們所知道的,現(xiàn)在有些工作已經(jīng)可以在Semantic Web和Topic maps之間進行互操作。
可視化是圖形可視化工具方式顯示知識組織系統(tǒng)的結(jié)構(gòu)。可視化工具主要包括:概念圖、思維導(dǎo)圖、認知地圖、語義網(wǎng)絡(luò)、思維地圖等。通過圖形可視化的方式展示本體中的網(wǎng)狀結(jié)構(gòu)的知識。其可視化檢索系統(tǒng)能夠?qū)⒈倔w中的類層次、屬性、實例等語義關(guān)系以圖形的方式直觀顯示,實現(xiàn)可視化語義檢索。
傳統(tǒng)的知識組織工具都采用規(guī)范的科學語言,針對某一領(lǐng)域進行知識組織。能夠高效利用這些工具的通常是該領(lǐng)域內(nèi)的專家。而新的知識組織工具采用更接近人類自身的自然語言來描述知識,將知識的建設(shè)由某個專業(yè)領(lǐng)域推廣到更廣闊的社會范圍,讓更多的人參與到知識體系的構(gòu)建之中,有效地促進知識資源的共建。
隨著技術(shù)和經(jīng)濟的發(fā)展,人類對于世界的認識逐步深入,所掌握的知識無時無刻不在發(fā)生變化。為了迎合知識的動態(tài)性,知識組織工具必須是一個開放系統(tǒng),可以隨著知識的改變對相關(guān)概念進行實時更新,對知識點進行添加、刪除和修改。Ontology滿足了這樣的要求。這也是Ontology之所以能夠在知識組織中得以快速發(fā)展的一個重要因素。
[1]周寧.信息組織(第二版)[M].武漢:武漢大學出版,2004:15-20.
[2]司莉.KOS在網(wǎng)絡(luò)信息組織中的應(yīng)用與發(fā)展[M].武漢:武漢大學出版社,2007:4-13.
[3]司莉,舒欣.國外網(wǎng)絡(luò)知識組織系統(tǒng)研究現(xiàn)狀與發(fā)展趨勢[J].圖書情報知識,2008(12):82-85.
[4]李景,錢平.敘詞表與本體的區(qū)別與聯(lián)系[J].中國圖書館學報,2004(1):36-39.
[5]Horrocks,I.Ontologies and semantic web.Communication of The ACM,2008(12):58-67.
[6]劉植惠.本體(Ontology)與語義網(wǎng)(Semantic Web)(J).重慶圖情研究,2006(3):1-4.
[7]Zeng,L.Knowledge organization system(KOS).Knowledge Organization,2008,35(2-3):160-183.