羅 鏗
(嘉應學院 圖書館,廣東 梅州 514015)
當前,隨著信息環(huán)境和用戶信息行為的不斷變化,使得灰色文獻的建設開始逐漸成為國內圖書館的核心業(yè)務之一。2018 年12 月7 日,東莞召開了第一屆全國灰色文獻開發(fā)與利用年會,在年會上宣讀并通過了《灰色文獻開發(fā)利用東莞宣言》和《關于成立灰色文獻開發(fā)利用聯盟倡議書》,就圖書館在灰色文獻開發(fā)利用過程中的地位與責任,以及如何發(fā)揮應有作用問題進行了解答,提出圖書館應該成為灰色文獻建設的承載者和組織者,發(fā)揮中堅和骨干的作用[1]。國內圖書館界于八十年代初就展開對灰色文獻的研究,從灰色文獻的含義、開發(fā)模式、建設方法都有了一定的研究基礎,并逐步進行灰色文獻建設的實踐活動。但國內的灰色文獻資源建設還是存在一定的問題,與國外發(fā)達國家相比,我國灰色文獻資源建設工作在文獻特征、建設背景、制度保障等方面存在較大差距[2]。尤其是在建設模式方面,缺乏一定的合作機制,多體現為單打獨斗,條塊分割,不成系統,造成建設質量不高、應用性不強。為了更具有現實參考意義,本文擬采取案例分析的方法,對當前灰色文獻的價值挖掘和建設模式進行歸納總結,并結合已有的灰色文獻研究成果,在對一個案例進行分析的基礎上,就如何多維度挖掘及呈現灰色文獻價值進行研究分析,以期為灰色文獻的開發(fā)工作提供有益的參考和借鑒。
灰色文獻的術語產生于70 年代的西方文獻情報學界,通常稱其為“非常規(guī)文獻”、“難以獲得”的文獻和“非定型文獻”等[3]。當前,主流的觀點分別從灰色文獻的流通和來源角度以及側重于灰色文獻的出版特征角度對灰色文獻進行定義,前者強調灰色文獻來源的復雜性和流通范圍的有限性;后者強調灰色文獻出版方式的不可控性和傳播形態(tài)的非常規(guī)性。對灰色文獻的研究,國內方面,筆者通過CNKI 數據庫,利用“灰色文獻”作為主題進行檢索后,采取文獻調研方法分析發(fā)現,高校圖書館和公共圖書館是國內“灰色文獻”主要的研究機構,研究主題重點在于探究高校圖書館或公共圖書館對灰色文獻的資源、體系建設、開發(fā)利用,以及對網絡灰色文獻、重點學科、機構知識庫和特色館藏方面的資源建設、開發(fā)利用,CNKI“灰色文獻”主題文獻可視化分析見圖1。國內研究的學科方法以圖書情報、計算機技術、新聞傳播以及檔案、博物館等為主要學科。進一步通過限定年代發(fā)現,當前,灰色文獻的數字化研究成為國內近期主要研究方向。國外方面,閔超等利用文本挖掘技術對國外專業(yè)會議論文進行定量分析發(fā)現:國外在國家層面和機構層面擁有穩(wěn)定的灰色文獻研究群體;文獻服務、電子灰色文獻(e-GL)和知識庫等方向是重點的研究主題;文獻計量方法尤其是引文分析方法是灰色文獻的主要研究手段;國外灰色文獻在科技、經濟、環(huán)境、教育和公共衛(wèi)生等領域的研究和利用較為頻繁[4]。
圖1 CNKI“灰色文獻”主題文獻的可視化分析
本研究采用單案例(個案)研究方法。相關的研究表明,采用單案例(個案)研究適用于解決有關“如何”和“怎么樣”的問題[5],并且可以通過提供豐富的數據和材料進行支撐[6],適合解釋特定現象背后復雜、動態(tài)的深層次問題[7]。本研究旨在探索灰色文獻的價值挖掘及開發(fā)模式問題,研究信息開發(fā)機構如何實現對灰色文獻的多維度價值挖掘和呈現,采用單案例研究方法將有助于對在灰色文獻的價值發(fā)現和開發(fā)模式中存在的深層次問題展開深入剖析。
單案例研究需要遵循典型性原則,也就是說要求選擇與研究現象高度相關的典型案例。此外所選案例的數據可獲得性也是一項重要的因素,其關乎能否提供豐富的數據支撐進行案例分析。根據上述原則和因素,本研究選擇臺灣大陸同鄉(xiāng)會文獻數據庫作為案例分析的研究對象。
臺灣大陸同鄉(xiāng)會文獻數據庫建設項目是在中國社會科學院和中華全國臺灣同胞聯誼會的支持下,由社會科學文獻出版社于2013 年開始與臺灣出版機構合作,著手開展同鄉(xiāng)會文獻的收集整理工作。截至2016 年10 月,已完成52 種、4958 期、約3.2 億字的文獻資源收集工作,共涉及 18 個省份。數據庫悉數收錄臺灣大陸同鄉(xiāng)會文獻資源,以省份為基本單位建設不少于18 個子庫,并從期刊、主題、人物、專題4 個維度,對同鄉(xiāng)會文獻資源進行整體展示和分類展示[8]。本研究選擇臺灣大陸同鄉(xiāng)會文獻數據庫為案例理由如下:首先是其具有代表性和典型性,有一定的影響力。臺灣大陸同鄉(xiāng)會文獻包含赴臺人員撰寫的人物回憶、紀念文集、歷史掌故、家鄉(xiāng)禮俗、藝文時評和學術論文等,內容涉及政治、經濟、文化等諸多方面,具有較高史料價值和文獻價值,也是兩岸文化同根、一個中國的明證。其次是其具備很高的參考價值。筆者所處的廣東省梅州地區(qū),海外華僑眾多,范圍遍布歐洲、美洲以及東南亞各國,其同鄉(xiāng)會刊物資料同樣非常豐富,因此研究分析本案例對筆者以后對此類灰色文獻進行采集、整理及開發(fā)方面具有很大的實踐參考價值。此外,該數據庫平臺已可以在網絡進行訪問,用于進行相關分析的數據可獲得性高。
本文的數據收集方法包括網絡調查、二手資料收集、電話、郵件咨詢等。主要的數據來源包括:新聞媒體報道、網站分析、相關研究文獻、網絡調查等。本文根據收集的數據,結合相關文獻調研資料進行分析。
灰色文獻資源的組織開發(fā)模式可分為集中、分散、分布以及集成服務模式[9]等,見表1。“臺灣大陸同鄉(xiāng)會文獻數據庫”整個項目的實施由社會科學文獻出版社牽頭組建的“臺灣大陸同鄉(xiāng)會文獻匯編”學術委員會指導下進行。委員會吸納了來自臺灣“中研院”近代史研究所、中國社會科學院近代史研究所、北京大學、廈門大學、華僑大學、臺灣佛光大學、臺灣逢甲大學、臺灣大通書局、臺灣花木蘭出版社、社會科學文獻出版社等機構的知名專家學者擔任委員。學術委員會的主要任務是對臺灣大陸同鄉(xiāng)會文獻價值做深度挖掘,并對“臺灣大陸同鄉(xiāng)會文獻匯編”項目進行學術指導和遠景規(guī)劃,社會科學文獻出版社則與臺灣地區(qū)出版機構合作,進行同鄉(xiāng)會文獻的收集整理,并負責對整個項目的數字化加工服務進行委托招標采購。由此可見,“臺灣大陸同鄉(xiāng)會文獻數據庫”項目的信息組織開發(fā)比較符合“分布—集成服務”的混合模式,具有統一標準、協調管理、分散采集、集中開發(fā)、平臺集中服務等特點。
表1 灰色文獻的組織開發(fā)模式
信息資源分類是指,根據信息資源的內容屬性和其他特征,將各種類型的資源分門別類地、系統地進行組織和揭示的方法??茖W合理的信息資源分類是信息組織、深度開發(fā)、檢索、共享和交換的基礎,是信息資源管理和開發(fā)利用的重要前提。實現對信息資源的一致性組織和規(guī)范化,是解決信息資源“是什么、有什么、在哪兒、誰能得到、以什么方式得到”等問題的根本手段[10]。因此,本文主要從分類體系特征和類目結構兩個方面對“臺灣大陸同鄉(xiāng)會文獻數據庫”進行信息資源分類體系分析。
1.分類體系特征
“臺灣大陸同鄉(xiāng)會數據庫”在資源導航中顯示了其分類體系。網站地圖界面按照欄目所包含的信息內容劃分為“期刊縱覽”、“主題聚焦”、“杰出人物”、“特色專題”、“同鄉(xiāng)會”、“學術委員會”等版塊。從網站的頁面結構和上下級類目頁面跳轉關系來看,“臺灣大陸同鄉(xiāng)會文獻數據庫”呈現明顯樹形結構的信息分類體系特征:利用層層篩選、逐級展開的形式提供信息,類目間除了父類目與子類目之間的縱向隸屬關系外,還提供橫向的邏輯關系。詳見圖2。
圖2 “臺灣大陸同鄉(xiāng)會文獻數據庫”的樹形結構
2.類目結構分析
在類目劃分上,“臺灣大陸同鄉(xiāng)會文獻數據庫”根據同鄉(xiāng)會刊物的欄目設置和內容主題情況,分別按主題分類法和體系分類法的原則進行類目劃分。以廣東省子庫為例,其共收錄廣東旅臺同鄉(xiāng)會創(chuàng)辦的《廣東文獻》、《臺北市梅縣同鄉(xiāng)會會刊》、《嘉應五屬年刊》等8 種文獻,首先按照總庫的大類劃分標準統一劃分為“期刊縱覽”、“主題聚焦”、“杰出人物”和“特色專題”等四個大類。然后根據這些期刊的欄目設置和內容特征,分別按照體系劃分和主題劃分的原則進行類目設置,如“期刊縱覽”將同鄉(xiāng)會期刊所包括的所有文獻期刊作為二級類目列出,保證每種期刊的相對獨立性,從而方便用戶按各種期刊的年、卷、期進行查找。而“主題聚焦”和“特色專題”則按主題劃分原則設置二級類目,便于用戶通過主題內容查找信息。詳見表2。分類體系復雜性方面,從“臺灣大陸同鄉(xiāng)會文獻數據庫”中大類到最底層類目所經過的層數看,基本上跳轉的層數為三層或是四層,如廣東庫收錄的一篇文章“趣談廣東新姑爺”就按“主題聚焦——文學藝術——鄉(xiāng)野趣聞”層級進行劃分。由此可見其分析體系并不復雜,便于用戶按類目層級查找信息。類目的縱向交叉性方面,屬于同一信息但隸屬不同的類目情況比較普遍。調查發(fā)現,其四個大類間均存在大量的信息縱向交叉現象,如廣東庫收錄的刊載于《廣東文獻》第4 期的一篇文章“粵籍華僑在緬甸”,就分別被劃分在“期刊縱覽”和“主題聚焦”兩個大類下,并且在“主題聚焦”大類中,又同時被劃分在“兩岸交流——海峽兩岸”、“海峽形式——國際瞭望”、“史料譜乘——歷史集萃”、“文學藝術——往事夙文”等四個類目下。這種類目間的縱向交叉關系無疑有利于用戶多角度獲得信息。
表2 “臺灣大陸同鄉(xiāng)會文獻數據庫”廣東省子庫類目表
(續(xù)上頁表2)
“臺灣同鄉(xiāng)會文獻數據庫”通過組建的學術委員會保證了對同鄉(xiāng)會文獻的多維度價值的深度挖掘和全面開發(fā),具有學術的權威性和資源利用的普適性。分析“臺灣大陸同鄉(xiāng)會文獻數據庫”發(fā)現,其實現多維度價值的形式主要有以下幾點:一是通過圖像掃描、ORC 文字識別等信息技術對同鄉(xiāng)會文獻進行數字化開發(fā),實現檔案價值(原版同鄉(xiāng)會刊物的電子文檔保存)和文獻價值(同鄉(xiāng)會文獻刊物的數字化閱讀)的開發(fā)。在數字化的基礎上,根據同鄉(xiāng)會文獻的內容特征和主題類型,通過提煉關鍵詞、主題詞等相關數據,利用內容標引和數據關聯技術,從歷史價值(如史料譜乘、人物春秋)、社會價值(如兩岸交流、經教衛(wèi)文)、智庫價值(如海峽形勢)和學術價值(如史料譜乘、學術專欄、文獻動態(tài))等多個角度,實現對文獻的多主題聚焦開發(fā)。最后結合各個省份同鄉(xiāng)會文獻的內容特色和資源豐富程度,實現對各省份的人物類和獨具特色類資源的特色化主題開發(fā)。
“臺灣同鄉(xiāng)會文獻數據庫”通過綜合各個省份的同鄉(xiāng)會刊物的欄目設置和內容特征方面形成具有4 個一級大類,16 多個二級類目,60 多個三級類目,構建了主題類型豐富、類目設置相對科學、完善的分類體系,從而最大限度地實現了對同鄉(xiāng)會刊物資源的深度開發(fā)。在此基礎上,“臺灣同鄉(xiāng)會文獻數據庫”還提供了較為豐富的信息呈現形式。如提供了同鄉(xiāng)會刊物按年卷期進行原刊的圖片瀏覽形式,不僅實現了利用數字化保存原始檔案文獻的目的,還方便用戶從檔案利用角度瀏覽同鄉(xiāng)會文獻刊物的原貌。如提供在線數字化閱讀和數字文獻的下載保存方式,從而方便用戶通過網絡進行數字化閱讀和下載等。
1.基于多元化的信息加工和呈現,實現文獻信息價值的增值
在“臺灣同鄉(xiāng)會文獻數據庫”的后續(xù)開發(fā)中,可以針對各省份同鄉(xiāng)會文獻的相關主題內容,利用現代化的信息技術進行多元化的信息加工和呈現,以實現對同鄉(xiāng)會文獻的增值化開發(fā):如對經歷重大歷史事件、知名人物等的后人或相關人員進行口述歷史的影音視頻制作;對刊載其中的蘊含豐富人文價值、社會價值和歷史檔案價值的主題內容進行影視作品開發(fā),如制作風俗人情的專題紀錄片,合作創(chuàng)作抗戰(zhàn)主題、或故土懷念主題的電視劇、電影等文藝作品;對于反映相關戰(zhàn)役等歷史進程的相關事件利用3D 虛擬技術進行虛擬動畫制作演示等融合多種媒體類型的多元信息資源開發(fā)。
2.挖掘數據資源,實現數據共享和合作共建
通過多方合作、共建共享的資源建設模式是當前灰色文獻資源建設的發(fā)展趨勢[11],如由麥吉爾大學和圖書館成功合作的數字人文項目“明清婦女著作”(MQWW)數據庫就通過下面兩種方式實現共享共建:一是通過微軟Access 數據庫系統,在線更新并免費提供“明清婦女著作”數據庫的全部著作信息、詩詞信息、詩人信息等數據庫元數據,方便研究人員利用ArcGIS 和SPSS 等數字人文軟件工具進行數據分析;二是與中國歷代人物傳記資料庫(CBDB)進行合作,將中國歷代人物傳記資料庫納入明清婦女著作的資料,為明清婦女著作資料庫中的所有人物建立永久ID,并且相互間建立系統互通性,方便使用者跨系統使用。因此,利用灰色文獻開發(fā)項目與大學、科研機構和檔案館、博物館等機構就相關的項目領域挖掘諸如圖表數據、元數據、本體知識等數據資源進行數據共享和合作共建,不僅可以優(yōu)化和整合分散的灰色文獻資源,還是實現灰色文獻價值延伸的有效途徑之一。