檔案網(wǎng)站信息資源組織與利用項(xiàng)目組
(南京大學(xué)信息管理學(xué)院,江蘇南京,210093)
隨著我國檔案網(wǎng)站的體系和布局日趨合理,檔案網(wǎng)站信息資源的種類和數(shù)量急劇增長。 然而,檔案網(wǎng)站建設(shè)水平不同,提供的功能和服務(wù)質(zhì)量參差不齊,檔案網(wǎng)站的優(yōu)化問題日益突出。 國家社科基金項(xiàng)目“ 檔案網(wǎng)站信息資源組織與利用” 就是涉及檔案網(wǎng)站優(yōu)化的重要課題。 作為研究的理論基礎(chǔ),首先要對檔案網(wǎng)站信息資源的范圍及組織的概念進(jìn)行界定,確定檔案信息資源組織的對象和組織活動(dòng)的內(nèi)容,并以此為基礎(chǔ)展開研究。
檔案網(wǎng)站信息資源有廣義和狹義之分: 廣義的檔案網(wǎng)站信息資源是指檔案網(wǎng)站提供的所有信息,不僅包括庫藏檔案實(shí)體數(shù)字化的信息,也包括檔案網(wǎng)站建設(shè)方面的技術(shù)信息。 總體上可以分為基本信息、形式信息、內(nèi)容信息和功能信息四種類型;狹義的檔案網(wǎng)站信息資源是檔案實(shí)體數(shù)字化的產(chǎn)物,包括館藏?cái)?shù)字化檔案、現(xiàn)行文件、特色檔案及編研成果。 廣義和狹義的檔案網(wǎng)站信息資源的關(guān)系如圖1 所示,本課題將以狹義的檔案網(wǎng)站信息資源為主要研究對象。
檔案網(wǎng)站信息資源組織,可以定義為:根據(jù)用戶的利用需求,結(jié)合檔案網(wǎng)站信息資源的特點(diǎn),以檔案網(wǎng)站的各類信息資源為對象,利用先進(jìn)的技術(shù),按照一定的原則、規(guī)范及標(biāo)準(zhǔn),優(yōu)化檔案網(wǎng)站信息資源的分類、 檢索和揭示,提供有序的、動(dòng)態(tài)的、實(shí)用的檔案信息資源利用方式的過程。 這一概念可以分為幾個(gè)層次:
檔案網(wǎng)站用戶的利用需求是檔案網(wǎng)站信息資源整合的依據(jù)。 用戶的需求既可以是特定的、 個(gè)體的利用需求,也可以是一般性的、群體的利用需求。 由于信息資源組織的本質(zhì)是要更好地滿足用戶利用需要,因此用戶需求是檔案網(wǎng)站信息資源組織最重要的依據(jù)。
檔案網(wǎng)站信息資源的四個(gè)種類(館藏?cái)?shù)字化檔案、現(xiàn)行文件、特色檔案及編研成果)有很明顯的特征,針對不同的檔案網(wǎng)站信息資源內(nèi)容,應(yīng)當(dāng)選擇不同的方法和原則進(jìn)行組織。
圖1 廣義和狹義的檔案網(wǎng)站信息資源
檔案網(wǎng)站信息資源組織的對象分為微觀、中觀和宏觀三個(gè)層次。 其中微觀層面的對象是單個(gè)檔案網(wǎng)站的信息資源;中觀層面的對象是兩個(gè)或兩個(gè)以上的檔案網(wǎng)站之間的信息資源;宏觀層面是一定行政區(qū)域或?qū)I(yè)范圍內(nèi)檔案網(wǎng)站之間的信息資源。
主要指技術(shù)方面的標(biāo)準(zhǔn)和規(guī)范,即檔案網(wǎng)站信息資源組織原則、方法以及所涉及的技術(shù)規(guī)范、標(biāo)準(zhǔn)等。
檔案網(wǎng)站信息資源組織的核心是解決分類問題,在資源分類組織上,提供更加多樣、滿足用戶需要的信息資源分類方式。 在優(yōu)化信息資源分類的基礎(chǔ)上,通過先進(jìn)的標(biāo)引與檢索技術(shù),提供方便快捷的檢索服務(wù),將結(jié)果呈現(xiàn)在網(wǎng)站前臺(tái),提供更加符合用戶需要的信息資源,提高利用效率。 組織的內(nèi)容過程呈“ H 型”(如圖2 所示)。
有序化指信息的分類聚合符合一定的邏輯規(guī)律;動(dòng)態(tài)指組織工作是一個(gè)完整的可循環(huán)的過程,組織的結(jié)果不是一成不變的;實(shí)用是指組織的結(jié)果應(yīng)當(dāng)滿足用戶的實(shí)際需要。 組織的結(jié)果既可以是一個(gè)提供檢索利用的平臺(tái),也可以是對原有網(wǎng)站資源的優(yōu)化,應(yīng)當(dāng)根據(jù)組織層次的不同,選擇相應(yīng)的呈現(xiàn)方式。由于網(wǎng)絡(luò)環(huán)境下檔案資源不再受時(shí)間和空間的限制,其分類方式也更加靈活多樣,與以往一種資源只可以分到一個(gè)類別不同,網(wǎng)絡(luò)資源可以根據(jù)內(nèi)容劃分到不同類別中,方便從不同角度進(jìn)行檢索。 例如,根據(jù)歷史研究學(xué)者對檔案網(wǎng)站利用的需要,將使用頻率較高的資源整理分類,為資源添加更多的著錄標(biāo)引字段。
要界定檔案網(wǎng)站信息資源組織的概念,必須將其與其他幾個(gè)相關(guān)概念進(jìn)行辨析,劃分其與類似概念之間的區(qū)別。
有學(xué)者將網(wǎng)絡(luò)信息資源組織定義為對網(wǎng)上的各種概念、數(shù)據(jù)(包括聲音、圖像、軟件等)、事實(shí)、文獻(xiàn)等,通過分析、標(biāo)引(分類的和語詞的)、著錄(信息特征的描述)、鏈接(把相關(guān)的信息加以聯(lián)系)、排序、存儲(chǔ)等手段,形成一個(gè)有序的、便于用戶理解和查詢的信息系統(tǒng),這個(gè)系統(tǒng)揭示知識(shí)的整體聯(lián)系和相關(guān)知識(shí)間的聯(lián)系[1]。 因此,網(wǎng)絡(luò)信息資源組織的對象是以數(shù)字化形式記錄,以多媒體形式表達(dá),分布式存儲(chǔ)在網(wǎng)絡(luò)計(jì)算機(jī)磁介質(zhì)、光介質(zhì)以及各類通信介質(zhì)上,并通過計(jì)算機(jī)網(wǎng)絡(luò)通信方式進(jìn)行傳遞和再現(xiàn)出來的檔案信息[2]。 而本課題組研究的對象——檔案網(wǎng)站信息資源是狹義上理解的檔案網(wǎng)絡(luò)信息資源,前者是后者的主要組成部分,兩者涵蓋的信息資源類型相同、 技術(shù)上相互借鑒,但范圍不同、呈現(xiàn)形式不同。
具體來說,在內(nèi)容類型劃分上,檔案網(wǎng)站信息資源與網(wǎng)絡(luò)檔案信息資源均可分為館藏?cái)?shù)字化檔案、 現(xiàn)行文件、特色檔案、編研成果四類,兩者有一定的共同之處;從技術(shù)上講,檔案網(wǎng)站信息組織所運(yùn)用的分類組織法、主題組織法、 元數(shù)據(jù)組織法和知識(shí)本體組織法等,都是網(wǎng)絡(luò)信息組織所涉及的組織方法。 而在內(nèi)容范圍和呈現(xiàn)形式上,網(wǎng)絡(luò)檔案信息資源除了包括檔案網(wǎng)站信息資源以外,還包括各種網(wǎng)絡(luò)數(shù)據(jù)庫、聯(lián)機(jī)目錄、超媒體等,范圍較檔案網(wǎng)站信息資源更廣,呈現(xiàn)形式更加多樣,而檔案網(wǎng)站信息資源主要指以網(wǎng)站形式呈現(xiàn)的庫藏實(shí)體檔案的數(shù)字化產(chǎn)物。
圖2 檔案網(wǎng)站信息資源組織的內(nèi)容過程
在國家檔案局科技項(xiàng)目“ 檔案網(wǎng)站信息資源普查與整合研究” 成果報(bào)告中,將檔案信息資源整合的概念表述為:“ 根據(jù)檔案用戶的利用需求,結(jié)合檔案網(wǎng)站信息資源的特點(diǎn),利用先進(jìn)的技術(shù),按照一定的原則、規(guī)范及標(biāo)準(zhǔn),實(shí)現(xiàn)一定范圍內(nèi)的檔案網(wǎng)站信息資源的抓取與優(yōu)化,并組織成一個(gè)集關(guān)聯(lián)性、動(dòng)態(tài)性和實(shí)用性于一體的有機(jī)整體或統(tǒng)一的利用平臺(tái)”[3]。 而本研究在“ 檔案網(wǎng)站信息資源組織” 與“ 檔案網(wǎng)站信息資源整合” 兩者的關(guān)系問題上,項(xiàng)目組成員經(jīng)過多次討論,得到三種層面的結(jié)果。
3.2.1 相似關(guān)系,結(jié)果不同
認(rèn)為組織和整合的區(qū)別主要體現(xiàn)在結(jié)果上。 檔案網(wǎng)站信息資源組織和整合在目的、 對象和依據(jù)上都是相同的,但是組織和整合的結(jié)果略有不同。 整合后的單位一定是一個(gè)更大的整體或者系統(tǒng),組織后的單位可能比整合后的單位要小,但組織比整合的程序更復(fù)雜。
3.2.2 包含關(guān)系,層次不同
這一觀點(diǎn)認(rèn)為“ 整合” 與“ 組織”的區(qū)別不僅限于結(jié)果,二者是屬于基礎(chǔ)層次與高級層次的關(guān)系,而在誰包含誰這一問題上,展開了分歧。
一方面,檔案網(wǎng)站信息資源整合就是把內(nèi)部和外部所涉及的全部資源,利用各種信息處理技術(shù)、各種手段,為用戶組織內(nèi)部和外部提供服務(wù)。 這就為檔案網(wǎng)站信息資源組織提供了一個(gè)基礎(chǔ)平臺(tái)。 檔案網(wǎng)站信息資源組織就是在整合的基礎(chǔ)上再進(jìn)行二次處理,進(jìn)一步向用戶提供更方便快捷的服務(wù)。 因此從這個(gè)角度來說,組織包含了整合,整合為組織提供了基礎(chǔ)。
另一方面,整合的結(jié)果更加具有外在展示性,更偏向前臺(tái);而檔案網(wǎng)站信息資源組織的結(jié)果不是直接形成檢索利用的平臺(tái),較于整合更具有基礎(chǔ)性和后臺(tái)性。 從這個(gè)角度看,組織為整合提供了基礎(chǔ),整合包含了組織。
3.2.3 交叉關(guān)系,側(cè)重點(diǎn)不同
結(jié)合上述兩種觀點(diǎn),再次深化討論,項(xiàng)目組趨向于用交叉關(guān)系來表述“ 組織” 和“ 整合” 兩個(gè)概念之間的關(guān)系,認(rèn)為兩者有交叉部分,但側(cè)重點(diǎn)不同。
雖然信息整合和信息組織的目的、對象、依據(jù)是相同的,且都會(huì)涉及到事物要素之間的重組,但是整合偏重于信息外在形式的展示和集成,更多時(shí)候是將分散、獨(dú)立的信息集合成一個(gè)統(tǒng)一的系統(tǒng)或平臺(tái);而組織偏重于打破信息內(nèi)在各要素之間的結(jié)構(gòu),根據(jù)不同的需求進(jìn)行分類組合,使之有序化。 基于不同的側(cè)重點(diǎn),兩者的結(jié)果也會(huì)有所不同,整合的結(jié)果是一個(gè)集成系統(tǒng)或平臺(tái),組織的結(jié)果是經(jīng)過優(yōu)化的分類重組。
檔案網(wǎng)站信息資源顯然是以檔案網(wǎng)站為對象的,檔案網(wǎng)站的信息資源相對于其他網(wǎng)站信息資源而言,具有明顯的特征:首先,內(nèi)容的專業(yè)性更強(qiáng)。 檔案網(wǎng)站上的大部分資源是數(shù)字化的檔案、現(xiàn)行文件、特色檔案和編研成果,內(nèi)容相對統(tǒng)一,可以進(jìn)行明顯的分類。 其次,主體的區(qū)域性更明顯。 目前檔案網(wǎng)站的建設(shè)主體基本是各級各類檔案局(館),所以檔案網(wǎng)站也有很明顯的區(qū)域性。 最后,用戶群體的特殊性更突出。檔案網(wǎng)站不同于綜合性網(wǎng)站,它的用戶群體以檔案工作者、檔案學(xué)者、歷史學(xué)者為主,他們對檔案網(wǎng)站的利用需求有很明顯的區(qū)分。
因此,在定義檔案網(wǎng)站信息資源組織的概念時(shí),需要考慮到檔案網(wǎng)站內(nèi)容特征的特殊性,避免將廣義上的信息資源組織的概念與方法直接套用在本研究中。在描述概念時(shí),應(yīng)強(qiáng)調(diào)以檔案網(wǎng)站上的各類信息資源為對象,結(jié)合檔案網(wǎng)站的內(nèi)容特征進(jìn)行分析、選擇、處理、序化。
傳統(tǒng)檔案整理是指按照一定的原則對檔案實(shí)體進(jìn)行系統(tǒng)分類、 組合、排列、編號和基本編目,使之有序化的過程。 在概念上與檔案網(wǎng)站信息資源組織非常相似。 對兩者進(jìn)行比較,將其聯(lián)系和區(qū)別表現(xiàn)出來,有助于理解檔案網(wǎng)站信息資源組織的內(nèi)涵。
4.1.1 目的相同。傳統(tǒng)檔案整理和檔案信息資源組織的目的都是為了實(shí)現(xiàn)檔案資源的有序化,提高檢索效率,更好地為用戶提供利用服務(wù)。
4.1.2 過程類似。傳統(tǒng)檔案整理包括了分類、組合、排架的過程,檔案網(wǎng)站信息資源組織的本質(zhì),就是把相互獨(dú)立的、 分散的檔案網(wǎng)站信息資源進(jìn)行分類、組合,從無序到有序的過程。
4.2.1 對象不同。檔案整理以館藏檔案實(shí)體資源為對象,包括紙質(zhì)檔案、光盤檔案、聲像檔案、照片檔案等;而檔案信息資源組織以數(shù)字化的館藏信息資源為組織對象。
4.2.2 原則不同。傳統(tǒng)整理工作基于來源原則,根據(jù)原有的整理基礎(chǔ)開展工作,以保持文件之間的歷史聯(lián)系,便于保管和利用;檔案網(wǎng)站信息資源組織以滿足用戶的利用需求為原則,利用現(xiàn)代技術(shù)挖掘檔案的價(jià)值。 結(jié)合數(shù)字資源的特色,一份文件不一定只能被歸為一類,可以被劃分到不同的類別當(dāng)中,不受空間的限制,因此,網(wǎng)站信息資源可以形成以來源、事由、年代等多種維度的資源體系。
4.2.3 范圍不同。傳統(tǒng)檔案整理的對象范圍一般僅包括接收進(jìn)館的檔案實(shí)體資源;而檔案網(wǎng)站信息資源組織的范圍包括微觀、中觀、宏觀三個(gè)層面,內(nèi)容更加廣泛,層次更多。
4.2.4 技術(shù)條件不同。 傳統(tǒng)檔案整理一般都是人工操作;檔案網(wǎng)站信息資源組織則更加依賴現(xiàn)代技術(shù),比如數(shù)據(jù)庫技術(shù)、數(shù)據(jù)存儲(chǔ)和壓縮技術(shù)、數(shù)據(jù)挖掘等。
4.2.5 結(jié)果不同。傳統(tǒng)檔案整理的直接結(jié)果是檔案排架,形成檔案庫;檔案網(wǎng)站信息資源組織的結(jié)果則更加多樣化,表現(xiàn)在檢索的智能化、檔案利用便利化、檔案服務(wù)的豐富等等。
如果說檔案網(wǎng)站信息資源整合是由傳統(tǒng)檔案編研工作發(fā)展而來,那么檔案網(wǎng)站信息資源組織則是由傳統(tǒng)檔案整理工作發(fā)展而來。
檔案網(wǎng)站信息資源組織以傳統(tǒng)整理工作為基礎(chǔ)。 組織的實(shí)質(zhì)是檔案整理工作,庫藏資源是檔案網(wǎng)站信息資源的主要來源,檔案信息資源數(shù)字化需要依靠庫藏資源數(shù)字化前的基礎(chǔ)工作,這當(dāng)中自然包括了檔案整理工作。 然而,檔案網(wǎng)站信息資源組織并不是簡單的整理工作,它結(jié)合了現(xiàn)代技術(shù),更加注重實(shí)現(xiàn)檢索效率的提高和跨空間時(shí)間的共享利用。
檔案網(wǎng)站信息資源組織是傳統(tǒng)整理工作的升華發(fā)展。 檔案網(wǎng)站信息資源組織技術(shù)的提高,可以為傳統(tǒng)的檔整理案工作提供新的方法和技術(shù),使整理工作得到進(jìn)一步的發(fā)展和完善,檔案網(wǎng)站信息資源組織以用戶為中心的原則,也將轉(zhuǎn)變傳統(tǒng)整理工作線性化流程化的工作模式,為傳統(tǒng)檔案工作注入新的血液。
[1]王本欣.網(wǎng)絡(luò)信息資源組織研究[J].圖書館學(xué)研究,2004(5):48-50。
[2]曾娜.網(wǎng)絡(luò)檔案信息資源組織研究[J].檔案學(xué)通訊,2010(1):45-49。
[3]吳建華、方燕平.檔案網(wǎng)站信息資源及其整合概念的界定——“檔案網(wǎng)站信息資源普查與整合研究”系列論文之一[J].檔案學(xué)通訊,2009(5):52-55。