畢 貞, 向 禹
(1.中南大學(xué) 檔案技術(shù)研究所,湖南 長沙 410083; 2.中南大學(xué) 信息安全與大數(shù)據(jù)研究院,湖南 長沙 410083)
檔案標(biāo)引是檔案工作中的一項基礎(chǔ)而重要的內(nèi)容,隨著一些手工操作環(huán)節(jié)被計算機(jī)所取代,標(biāo)引工作常常被忽視。不管是傳統(tǒng)檔案工作,還是現(xiàn)代檔案工作,甚至電子文件及電子檔案的標(biāo)引工作依然重要。在“互聯(lián)網(wǎng)+”和大數(shù)據(jù)時代,研究檔案標(biāo)引,對檔案信息檢索效率起著至關(guān)重要的作用。
檔案標(biāo)引按照檢索體系區(qū)分為主題標(biāo)引和分類標(biāo)引。兩種方式有相似的地方也有各自的特點,需要從各個角度進(jìn)行分析,評判一個標(biāo)引方法好壞的標(biāo)準(zhǔn)就是依據(jù)檢索效率,即使兩種方法各有優(yōu)缺點,無法徹底比較出好壞,但通過比性分析,可以在具體情況的時候運用合適的標(biāo)引方法。
從《檔案管理學(xué)》中分別得到主題標(biāo)引與分類標(biāo)引的含義,往縱向延伸出這兩類標(biāo)引更具體的劃分,根據(jù)定義可以直觀的看出主題標(biāo)引與分類標(biāo)引的區(qū)別。
主題標(biāo)引是對檔案內(nèi)容進(jìn)行主題分析,賦予主題詞標(biāo)識的過程。它在檔案檢索中有兩項任務(wù):一是從檔案文獻(xiàn)中分析、提取有關(guān)某一主題的檔案信息;二是將得出的主題概念,按照主題詞表標(biāo)出主題詞。主題標(biāo)引從采用標(biāo)引語言是否規(guī)范的角度來區(qū)分,有自由標(biāo)引、受控標(biāo)引、混合標(biāo)引(半受控半自由標(biāo)引)。自由標(biāo)引又稱非控標(biāo)引,是指使用自然語言中的詞,即檔案材料中出現(xiàn)或從未出現(xiàn)的未經(jīng)規(guī)范的自由詞進(jìn)行標(biāo)引。受控標(biāo)引,是指嚴(yán)格根據(jù)主題詞表中的規(guī)范化的主題詞進(jìn)行標(biāo)引?;旌蠘?biāo)引,是指在標(biāo)引時除使用主題詞表中規(guī)范化的主題詞外,也同時使用一些未規(guī)范化的自由詞、關(guān)鍵詞來標(biāo)引。
檔案分類標(biāo)引是將檔案文獻(xiàn)進(jìn)行主題分析,賦予分類標(biāo)識的過程。分類標(biāo)引根據(jù)標(biāo)引的程度又分為整體分類標(biāo)引、全面分類標(biāo)引、分類互見標(biāo)引。所謂整體分類標(biāo)引,就是對一份文件、一個案卷,只給一個分類號,概括標(biāo)引。全面分類標(biāo)引的含義是指一份文件或者案卷有若干主題,依據(jù)所屬類目分別給分類號。分類互見標(biāo)引,指一份文件或者一個案卷論述的主題涉及幾個類目,標(biāo)出一個主要的類號之后,再在其他類目中作重復(fù)整體標(biāo)引,標(biāo)出的類號,稱為互見分類號。
由此可見,主題標(biāo)引與分類標(biāo)引都是根據(jù)一定的標(biāo)引依據(jù)來進(jìn)行標(biāo)引工作的,兩者都是將檔案主題進(jìn)行分析之后再進(jìn)行標(biāo)引,前者的依據(jù)是主題詞,后者的依據(jù)是檔案內(nèi)容的主題分類號。
標(biāo)引既然是一個工作過程,那么必然有程序。通過圖1、圖2的流程圖將主題標(biāo)引和分類標(biāo)引程序中的每一步驟進(jìn)行對照,得出結(jié)論。
圖1 主題標(biāo)引流程
圖2 分類標(biāo)引流程
仔細(xì)分析圖1和圖2 之后,發(fā)現(xiàn)主題標(biāo)引與分類標(biāo)引程序的第二步和最后一步都是一樣的(第二步都是對主題分析,最后一步都是將得到的結(jié)果進(jìn)行審查),可見在對檔案進(jìn)行標(biāo)引時,都必須運用到主題分析這一步,證明了閱讀文件、了解主題是所有標(biāo)引工作中必不可少的一部分;在最后都進(jìn)行審核查對是為了證實前面標(biāo)引結(jié)果的正確性,使結(jié)果更為嚴(yán)謹(jǐn)。而在第一步程序中,主題標(biāo)引是要閱讀文件,了解文件的主題;分類標(biāo)引則需要慎重選擇好采用何種分類表,國家檔案局制定了《中國檔案分類法》,它包括了中華人民共和國檔案分類表、新民主主義檔案分類表、民國檔案分類表,在分類工作進(jìn)行之前就要從這幾個分類表中選擇最合適的分類表取用。這個步驟非常重要,如果沒有選擇出最合適、最正確的表,直接會影響到后面標(biāo)引工作的進(jìn)行。至于中間幾個過程,雖然看起來含義不一樣,實際上將類名和主題詞當(dāng)成標(biāo)識符號一樣看待的話,這兩種方式除了第一步,標(biāo)引流程大致相同。只是分類標(biāo)引的前提——選擇分類表,是充分必要條件。
標(biāo)引工作必須按照規(guī)則制定的標(biāo)準(zhǔn)來進(jìn)行,違背了規(guī)則那么工作將變得沒有意義。對主題標(biāo)引和分類標(biāo)引的基本規(guī)則進(jìn)行分析也是對比兩種方法的主要依據(jù),根據(jù)標(biāo)引的規(guī)則可以看出標(biāo)引工作的本質(zhì)。
標(biāo)引必須持客觀態(tài)度;核心是揭示文件或案卷論述的主要事物或問題;選定的主題詞必須是正式主題詞;必須使用詞表中最專指的主題詞標(biāo)引;當(dāng)詞表中找不到最專指的主題詞時,則應(yīng)選用最直接相關(guān)的兩個或者兩個以上的主題詞進(jìn)行組配標(biāo)引。
檔案分類標(biāo)引必須依據(jù)《中國檔案分類法》及其分類原則,辨清類目的確切含義,不能脫離類目之間的聯(lián)系和類目注釋的限定來孤立地理解類目的含義;檔案標(biāo)引的內(nèi)容必須是檔案文件中論述較為具體的,切勿標(biāo)引過度或者標(biāo)引不足;分類標(biāo)引必須符合專指性要求,選出最切合的類目,給予正確的分類號;分類標(biāo)引應(yīng)能為利用者提供必要書錄像的檢索途徑,多主題的情況下,每個主題都應(yīng)該要有分類號(最多三個);最后是保持一致性,在無法歸類的情況下歸入最相似的類目。
綜上所述,主題標(biāo)引和分類標(biāo)引的基本規(guī)則在理論上相似。都是對具體內(nèi)容具體分析,一切原則都必須與事實相符,這些規(guī)則都服務(wù)于保持標(biāo)引結(jié)果的準(zhǔn)確性,在實在無法給出標(biāo)引結(jié)果的情況下,找出相似的或者有親密聯(lián)系的主題詞(類目)進(jìn)行標(biāo)引,聯(lián)系具有普遍性,任何事物都處于普遍聯(lián)系之中,整個世界是相互聯(lián)系的統(tǒng)一整體,所以標(biāo)引結(jié)果具有理論性。但無論是主題標(biāo)引還是分類標(biāo)引,所有標(biāo)引的基本規(guī)則都圍繞“實事求是”展開。
如若一份檔案只有一個主題,那么標(biāo)引方法就很簡單明了,只需要將這一個主題找出來然后對應(yīng)相應(yīng)的主題詞表或者分類表進(jìn)行標(biāo)引。但是現(xiàn)在的檔案在大多數(shù)情況下可能不止有一個主題詞,那么就需要用一定的方法進(jìn)行標(biāo)引。
涉及到多主題的檔案時,主題標(biāo)引運用到了概念限定組配和概念相交組配兩種方法,概念限定組配通過主題詞間存在的語義關(guān)系和語法關(guān)系,一個概念用一個或者多個主題詞,限定概念與被限定概念之間有并列關(guān)系,不能存在相交關(guān)系?!百Y本主義國家”這一主題概念,就是通過“資本主義”這個主題概念和“國家”這個主題概念次進(jìn)行限定組配,使概念專指度更高。概念相交組配,是幾個主題詞具有概念交叉關(guān)系,而這幾個主題詞的外延又能找到交叉點或者有重合的部分,譬如說,“女人”與“學(xué)者”這兩個概念進(jìn)行組配,會得到“女性學(xué)者”這一專指程度更高的概念。
假如不同的方面來論述同一個主題,那么將會按照分散和集中的要求錄入相應(yīng)的類目。多主題的情況下(按照情況選出最切合的三個主題,分別選出第一主題,第二主題和第三主題,不超過三個),主題是并列關(guān)系的話,那就給每一個主題都給予分類號;主題是從屬關(guān)系的話,主題應(yīng)該分清上下關(guān)系,選出最上位的主題,并給予分類號;還有幾種可能,假如主題間的關(guān)系是因果關(guān)系,一般應(yīng)該標(biāo)引結(jié)果方面所屬類目的分類號;若幾個主題論述是受影響關(guān)系的話,則按受影響的主題賦予分類號。如果幾個主題是論述理論與應(yīng)用的關(guān)系的,則應(yīng)用所屬類目賦予分類號。
主題標(biāo)引在遇到多個主題詞時用的標(biāo)引方法是將概念進(jìn)行組配,涉及到的是主題詞的語義關(guān)系和邏輯性質(zhì);分類標(biāo)引遇到同樣的情況時,考慮的更多的是主題詞之間的關(guān)系。在多主題條件下,兩者都會利用運用到多標(biāo)識符號的方法,但是方法又不大相同。前者側(cè)重概念,后者側(cè)重關(guān)系。
主題標(biāo)引的靈活性較強(qiáng),因為其方法使用的依據(jù)為主題詞,在該方法的使用過程中,主題詞表會因為更多新事物、新學(xué)科、新研究的出現(xiàn)而增、刪、改,不受結(jié)構(gòu)的限制,檢索者能通過標(biāo)引上的主題詞直接、客觀地了解到檔案的主要內(nèi)容,專指性是它的主要特性。但是可能會有主題分析會產(chǎn)生誤差、主題詞組配容易出錯、不規(guī)范用詞比較泛濫等問題出現(xiàn),就導(dǎo)致了標(biāo)引結(jié)果準(zhǔn)確率的降低。該如何避免這些問題呢?首先可以對自由詞進(jìn)行規(guī)范化處理,無論是自動標(biāo)引還是人工標(biāo)引,都要進(jìn)行自由詞的登記。建立自由詞詞表,逐步確定自由詞詞性和語義關(guān)聯(lián)關(guān)系,加強(qiáng)管理。在進(jìn)行自然語言與檔案語言之間的轉(zhuǎn)換時,要遵循主題詞表的原則,使轉(zhuǎn)換過程更具有原則性。最后,還需要更進(jìn)一步地完善主題詞表,在新事物、新學(xué)科、新研究出現(xiàn)的時候,積極主動去了解,不一定要等到這種新主題詞匯在檔案中出現(xiàn)再考慮是否添加到主題詞表,要有預(yù)見性,可以提前做準(zhǔn)備。當(dāng)然,也要注重主題詞表中對主題詞質(zhì)量的控制,選出的主題詞必須要有理論依據(jù)來支撐。
分類標(biāo)引具有較高的適應(yīng)性,它既可以適應(yīng)標(biāo)引文件,也適應(yīng)利用者檢索,而且也適應(yīng)組織目錄、檔案的排架。但是它著眼于事物的方面,研究和確定它屬于什么范疇以及它與事物之間的縱橫關(guān)系,強(qiáng)調(diào)系統(tǒng)性,能反映事物的共同方面。所以它只強(qiáng)調(diào)系統(tǒng)性,專指性不強(qiáng)。在分類標(biāo)引工作過程中可能因為程序的第一步——確定使用何種分類表的錯誤,而導(dǎo)致后面的程序都往錯誤的方向發(fā)展,所以,檔案標(biāo)引人員不僅要非常了解《中國檔案分類法》,熟悉每一個分類表的列類標(biāo)準(zhǔn)和列類原則、方法、類目、含義,還要對一些類目劃分和排列的隱含規(guī)則還有類目隱含內(nèi)容有所了解和掌握。才能按照分析出來的主題,從分類表中找出最合適的類目。在日常生活中,有的檔案并沒有那么“單純”,牽扯到幾個門類或者在一個門類中的多個問題,這不僅僅要反映出主要類目,其他的相關(guān)類目也要反映出來,這樣才能為利用者提供較多的檢索途徑和達(dá)到充分反映的要求。分類標(biāo)引看似簡單操作,其實也需要靈活多變的思維來進(jìn)行標(biāo)引工作。分類標(biāo)引的深度應(yīng)該適可而止,不能標(biāo)引過深也不可標(biāo)引過淺。
綜上所述,主題標(biāo)引和分類標(biāo)引雖然有共性,都圍繞尋找主題詞展開工作,方法思路也大致相同,但是二者在標(biāo)引文獻(xiàn)所用的標(biāo)識符號、方法側(cè)重、功能等方面也存在著根本的差別。主題標(biāo)引具有直觀性、靈活性、專指性的特點,對于檔案檢索來說,精確度高,有利于對有特殊性質(zhì)檔案的檢索。分類標(biāo)引具有結(jié)構(gòu)性、間接性、嚴(yán)密性等特點,對于標(biāo)引和檢索來說,容易掌握,易標(biāo)易檢,便于族性檢索。它比較適用于計算機(jī)認(rèn)讀方式的標(biāo)引工作,特別是數(shù)據(jù)庫表的標(biāo)引工作。既然主題標(biāo)引和分類標(biāo)引之間既有共性又有特性,于是有的學(xué)者提出如果能把兩者的優(yōu)點相互結(jié)合、各取所長,作出主題標(biāo)引和分類標(biāo)引一體化的假設(shè)?,F(xiàn)在看來,需要考慮的因素較多,一體化的假設(shè)能否被證明還有待考究。