吳群
(南京工程學院 圖書館,江蘇 南京 211167)
高校機構(gòu)知識庫構(gòu)架探究
吳群
(南京工程學院 圖書館,江蘇 南京 211167)
機構(gòu)知識庫是學術(shù)研究機構(gòu)依托互聯(lián)網(wǎng)而建成的一種學術(shù)文獻數(shù)據(jù)庫,文章分析了高校建立機構(gòu)知識庫的意義及優(yōu)勢,并就如何構(gòu)建高校機構(gòu)知識庫進行探討。
機構(gòu)知識庫;開放存取
1.機構(gòu)知識庫的概念
機構(gòu)知識庫(IR,Institutional Repository)是基于開放存取(OA,Open Access)的理念,學術(shù)研究機構(gòu)依托互聯(lián)網(wǎng)將本機構(gòu)成員所產(chǎn)生的各種數(shù)字化內(nèi)容進行收集、整理、組織、標識、索引,以開放性和互操作性為原則,實現(xiàn)對數(shù)字學術(shù)資源的永久保存和廣泛傳播而運行的一種信息資源管理和服務(wù)系統(tǒng)。美國SPARC資深顧問Raym Crow則認為機構(gòu)知識庫是收集并保存單個或數(shù)個大學、科研機構(gòu)知識資源的數(shù)字化資源集合。[1]筆者認為,機構(gòu)知識庫是以網(wǎng)絡(luò)為依托,以收集、整理、保存、檢索和提供利用為目的,以本機構(gòu)成員在工作過程中所創(chuàng)造的各種數(shù)字化產(chǎn)品為內(nèi)容的學術(shù)文獻數(shù)據(jù)庫。
2.機構(gòu)知識庫的特點
(1)機構(gòu)性。IR的建設(shè)主體和收藏的地域界限是特定的機構(gòu),即它的建立和運行是以機構(gòu)為軸心和主線的,在這一點上區(qū)別于學科或?qū)n}的知識庫。這里的機構(gòu)既可以是實體的,如一個大學或研究機構(gòu),也可以是虛擬的,如虛擬聯(lián)合實驗室等。
(2)多樣性。由于許多IR僅提供一個學術(shù)信息交流平臺,對其中具體交流的信息只有內(nèi)容質(zhì)量或格式上的限制,而沒有形式方面的限制,所以IR收藏的資源類型多樣,有正式發(fā)表的學術(shù)著作,也有尚未發(fā)表的預印本;有人文社會科學的內(nèi)容,也有自然科學的內(nèi)容。[2]從出版的形式上看,IR主要包括機構(gòu)內(nèi)產(chǎn)生的科學成果如:學術(shù)報告、技術(shù)報告、工作報告、學術(shù)論文、會議論文、多媒體和視聽資料、課程資料、教學課件、實驗數(shù)據(jù)等。
(3)互操作性和開放性。這也是機構(gòu)庫的優(yōu)越性,要保證與其他機構(gòu)知識庫之間的互操作,保證知識庫中的內(nèi)容能夠被機構(gòu)之外的用戶方便地訪問和使用,并且能夠有效地存取其他機構(gòu)的知識庫的內(nèi)容。
(4)積累性和永久性。IR中所收錄的知識資源是長期保存且不斷累積的,這就保障了IR資源的完整性與系統(tǒng)性,并可永久獲取,IR以此來實現(xiàn)知識的記憶與傳承。
除了以上四點之外,數(shù)字化與網(wǎng)絡(luò)化、內(nèi)容的學術(shù)性、綜合性與動態(tài)性、社區(qū)驅(qū)動與聚集等也是機構(gòu)庫的獨特表現(xiàn)。
1.有效捕獲并永久保存數(shù)字化學術(shù)資源
高校教師與科研人員普遍運用計算機處理各種信息,從而產(chǎn)生了大量的原生數(shù)字化學術(shù)知識產(chǎn)品,它們是各高校和科研機構(gòu)重要的學術(shù)資源。而這些學術(shù)資源大都保存在個人或者院系的電腦上,個人電腦的存儲容量有限,這些原生數(shù)字信息資源就會隨著時間的流逝而丟失。隨著計算機存儲技術(shù)的發(fā)展,若干年后,可能不為新的軟件支持,因此,需要為這些原生數(shù)字信息資源提供一個永久保存的安全場所。另外,把分散的學術(shù)資源有效集中起來,把不同格式的數(shù)據(jù)按照統(tǒng)一標準格式進行加工整理、集中存儲、統(tǒng)一管理,為以后用戶方便快捷地利用奠定基礎(chǔ)。
2.實現(xiàn)學術(shù)資源的開放獲取
在校園聯(lián)網(wǎng)的環(huán)境下,利用高校IR中豐富的教學信息資源可以提升教學效果。學生可以利用IR中的課件進行學習,教師可以通過IR進行交流,完善教學課件和教學方法。由于各高校之間、各院系之間、各教研室、實驗室的物理位置和科研活動的相互獨立,造成彼此對相互之間的研究情況和研究成果互不了解,在教學、科研的溝通與交流上存在障礙。構(gòu)建IR可將各高校、各院系、各教研室、實驗室、個體研究者的相關(guān)資料和學術(shù)研究成果存儲下來,在一個共用的網(wǎng)絡(luò)平臺上發(fā)布,同時提供無障礙瀏覽與檢索,這樣可以進一步促進相互間的學術(shù)交流,提高教學質(zhì)量和科研水平。
3.擴大機構(gòu)的影響力,提升知名度
IR不僅可促進學術(shù)交流,促進學術(shù)機構(gòu)教學、科研水平的提升,更為重要的是,它能展示學術(shù)機構(gòu)的綜合實力,集中反映學術(shù)機構(gòu)的科研水平,展示其在科學研究、技術(shù)應(yīng)用、教育教學、經(jīng)濟和社會發(fā)展等方面的成就,這些學術(shù)成果可以通過互聯(lián)網(wǎng)免費下載,提高學術(shù)成果的被引用率,從而提升這個機構(gòu)的知名度。[3]對于想要提高影響力的高校來說,建立IR無疑是一個好辦法。
1.利用校內(nèi)的網(wǎng)絡(luò)資源
校園網(wǎng)是一個具有寬帶通路和交互功能的專業(yè)性局域網(wǎng),具有教學、科研、管理和通訊等功能,它使我國高等教育管理向智能化方向發(fā)展。目前我國的高校校園網(wǎng)已成為了國家信息網(wǎng)絡(luò)的重要組成部分,在學術(shù)信息資源、人力資源、研發(fā)能力等方面具有明顯的優(yōu)勢。[4]
高校的IR一般都設(shè)在校園的局域網(wǎng)內(nèi),便于高校的科研人員向本機構(gòu)提交學術(shù)研究成果以及在知識庫內(nèi)瀏覽、下載學術(shù)信息。
2.利用高校豐富的智力產(chǎn)品
高校不但是一個培養(yǎng)高級人才的機構(gòu),還是一個學術(shù)研發(fā)中心。高校內(nèi)產(chǎn)生的大量原生數(shù)字化學術(shù)知識產(chǎn)品,例如:已發(fā)表或未發(fā)表的期刊論文、學位論文、會議論文、科技報告、數(shù)據(jù)庫、重要學術(shù)會議的演示文稿、科研項目數(shù)據(jù)資料及具有學術(shù)價值的多媒體資料等,這些都是高校重要的學術(shù)資源。但是,這些學術(shù)資源還分散在廣大教學和科研人員手中,沒有得到系統(tǒng)、完整的保存,學術(shù)交流和應(yīng)用狀況也不盡如人意。通過建立高校IR,能為系統(tǒng)、完整地保存這些學術(shù)資源提供一個安全場所,完整展示其學術(shù)研究成果,并能給本校乃至全球的用戶提供一個交流與溝通的平臺。
3.利用高校圖書館豐富的數(shù)字化信息資源收集管理的經(jīng)驗
高校圖書館員具有熟練的專業(yè)技術(shù)和獨特的專業(yè)服務(wù)意識,特別是在高校數(shù)字圖書館的建設(shè)中積累了豐富的經(jīng)驗,最適合承擔IR的建設(shè)及對其內(nèi)容實施長期保存的工作,能夠最有效地對知識信息進行組織、加工、發(fā)布,其元數(shù)據(jù)標引、各種資源的整合、各類型文獻信息的檢索和發(fā)布均已形成了規(guī)范。其與數(shù)據(jù)庫提供商形成的長期的、全面的良性合作關(guān)系,有利于資源的整合和應(yīng)用。
1.前期準備工作
首先,要考察已經(jīng)構(gòu)建IR的高校,學習他們成功的方法和經(jīng)驗,針對本機構(gòu)特點進行需求分析,并調(diào)查所在高校當前學術(shù)論著、作品的發(fā)表和存儲方式,計算機網(wǎng)絡(luò)及其IT設(shè)備資源狀況。其次,在全面掌握相關(guān)情況的前提下,要制定嚴密科學的IR建設(shè)規(guī)劃。在規(guī)劃中,要確立一支高水準的建設(shè)管理團隊,主要包括:領(lǐng)導者、用戶服務(wù)人員、系統(tǒng)技術(shù)人員、法律咨詢?nèi)藛T。領(lǐng)導者主要負責項目的推進以及任務(wù)的合理分配工作;用戶服務(wù)人員主要負責與用戶的溝通和技術(shù)支持,特別是對IR內(nèi)容提供者的技術(shù)支持,主要包括IR系統(tǒng)的用戶管理、用戶培訓(包括圖書館員、IR內(nèi)容提供者和終端用戶的培訓)、協(xié)調(diào)管理IR內(nèi)容的提交等;系統(tǒng)技術(shù)人員主要負責IR系統(tǒng)的技術(shù)方面的工作,主要包括IR系統(tǒng)開發(fā)、各種技術(shù)問題的管理、系統(tǒng)技術(shù)培訓等;法律咨詢?nèi)藛T主要負責解決IR建設(shè)中的法律問題。[5]最后,要根據(jù)IR的建設(shè)規(guī)劃明確資金的落實,要取得學校領(lǐng)導和相關(guān)職能部門(教務(wù)處、科研處、研究生處等)的理解和支持,以保證IR建設(shè)的順利進行。
2.內(nèi)容建設(shè)
建設(shè)IR的重點和難點就是內(nèi)容建設(shè),主要包括信息資源的收集,即內(nèi)容獲取將是困擾機構(gòu)庫發(fā)展的最大難題,科研人員與教師的參與是成功的關(guān)鍵。這就需要我們從以下幾個方面來著手,使IR的內(nèi)容建設(shè)及質(zhì)量控制有所保障。
(1)廣泛宣傳
目前國內(nèi)大部分用戶對IR還不甚了解,即使是對IR有所了解的人,同樣存在各種疑慮。因此,有必要積極宣傳,使教師與科研人員提高對IR的認知度和認可度。如荷蘭的“科學奶酪”項目,就是為了提升高校教職工對機構(gòu)知識庫的參與和認同。我們的具體做法可如下:高??稍谛@網(wǎng)首頁設(shè)立專欄,使用戶在訪問校園網(wǎng)站時即可了解到相關(guān)知識,也可在日常的用戶培訓、文獻檢索課中介紹有影響力的IR及其使用方法。
(2)內(nèi)容來源保障
加拿大的M.Kathleen Shearer指出:“資源提供者的輸入行為和機構(gòu)知識庫的利用率是決定機構(gòu)知識庫成功的兩個重要因素”,[6]可見內(nèi)容的來源是機構(gòu)知識庫內(nèi)容建設(shè)的重點之一,筆者認為可通過以下三個政策措施使內(nèi)容的來源有所保障。
1)實施強制提交政策。通過科研處、研究生院等主要學術(shù)成果產(chǎn)出單位出臺相關(guān)強制提交政策:如研究生院可規(guī)定所有研究生必須向IR提交學位論文,科研處可規(guī)定所有科研人員及工作人員必須按時將科研成果及業(yè)務(wù)工作資料及時交到IR,所有科研項目結(jié)題必須向IR提交課題成果等。強制政策是在建設(shè)IR最初階段最為直接、有效的一種方式。比如,丹麥要求大學將其科學出版物都提交到丹麥的“國家科研數(shù)據(jù)庫”中;比利時的機構(gòu)倉儲的倡導者向國會議員建議讓IR成為權(quán)威機構(gòu)決定給大學不同投資的唯一參考標準。
2)實施協(xié)助提交政策。主要應(yīng)用在學術(shù)機構(gòu)內(nèi)部,存儲管理機構(gòu)收集到作者的知識成果并跟作者直接聯(lián)系,獲得作者的許可,由機構(gòu)代為把作者的知識成果上傳到IR,包括知識成果的整理、格式的轉(zhuǎn)換、提交的程序完成等。
3)實施自愿提交政策。用戶通過“自存檔”形式將自己的研究成果通過IR提交平臺,提交到本機構(gòu)知識庫,并且對研究成果進行元數(shù)據(jù)標引??梢宰杂傻叵驇炖锾峤蛔约河袃r值的學術(shù)成果,并可以免費在庫中檢索和下載其他用戶的文章,也可以對文章發(fā)表自己的看法。
(3)內(nèi)容質(zhì)量保障
在構(gòu)建IR過程中為了避免毫無價值的信息混入機構(gòu)知識庫中,影響IR主體的參與,必須建立包括內(nèi)容質(zhì)量和元數(shù)據(jù)質(zhì)量在內(nèi)的IR質(zhì)量控制機制,并對不同類型的信息資源有不同的質(zhì)量評定方法。如在院系中選擇學科專家組成審查小組進行實質(zhì)內(nèi)容審查。建立校內(nèi)成果專家評審或同行評議制度,確保IR的學術(shù)質(zhì)量。
(4)數(shù)據(jù)標準化保障
標準規(guī)范是IR建設(shè)的生命,IR建設(shè)者應(yīng)根據(jù)不同提交方式設(shè)專人(學科館員、院系聯(lián)絡(luò)人)審查元數(shù)據(jù),并完善提交表單設(shè)計,如可增設(shè)分類表和主題詞表鏈接、實時給出反饋信息和修正建議等。
3.構(gòu)建工具及技術(shù)
根據(jù)國際組織OSI(Open Society Institute)提供的一份指南,目前比較成熟的IR軟件主要有DSpace、Eprints、Fedora等。這些軟件都可以免費下載、升級和重新分發(fā),并且嚴格遵循OAI元數(shù)據(jù)收割協(xié)議OAI-PMH2.0版。[7]
DSpace是一個開放源碼的軟件平臺,由麻省理工學院圖書館(MIT)和惠普實驗室(HP)聯(lián)合開發(fā),最新版本為DSpace1.2。DSpace的代碼均用Java語言編寫,可以運行于所有UNIX系統(tǒng),采用對象—關(guān)系型數(shù)據(jù)庫管理系統(tǒng)PostgreSOL管理相關(guān)數(shù)據(jù),使用DC元數(shù)據(jù)標準,且具有完備的元數(shù)據(jù)體系,包括管理元數(shù)據(jù)、結(jié)構(gòu)元數(shù)據(jù)和描述元數(shù)據(jù)。DSpace有三個界面,分別服務(wù)于系統(tǒng)管理員、資源提交者和查找信息的終端用戶,具有很強的靈活性和可定制性。目前已有51個國家的307家機構(gòu)使用DSpace系統(tǒng)。我國廈門大學圖書館、浙江大學圖書館、香港大學等機構(gòu)正在使用該系統(tǒng)構(gòu)建自己的IR。
Eprints是最早的IR構(gòu)建工具,也是第一個遵循OAI協(xié)議的IR軟件,由英國南安普頓大學開發(fā),最新版本為Eprints2.3。Eprints代碼用Perl語言編寫,運行于Linux、GNU或Solaris系統(tǒng),采用MySQL數(shù)據(jù)庫管理系統(tǒng),它的元數(shù)據(jù)格式也是DC。Eprints可自動完成提交資源的完整性檢驗,并備有緩沖區(qū),使提交的資源在正式進入知識庫前受到編輯的檢驗。目前已有248個知識庫使用Eprints軟件,Eprints成為眾多IR軟件系統(tǒng)中使用最多、分布最廣的軟件。
Fedora系統(tǒng)由弗吉尼亞大學和康奈爾大學共同開發(fā)實施,當前版本為Fedora TM2.0。Fedora代碼是用Java語言編寫, 運行于 Windows2000、NT、XP、Solaris和 Linux系統(tǒng),也是采用MySQL數(shù)據(jù)庫管理系統(tǒng)。Fedora的內(nèi)容均是使用元數(shù)據(jù)編碼與傳輸標準 (METS)的擴展版本存儲的,每個對象都有一個DC記錄,可以供OAI收割器獲取元數(shù)據(jù)。
[1]李楓林,趙雪芹,胡吉明.機構(gòu)知識庫:開放獲取的有效實現(xiàn)形式[J].情報雜志,2007(6).
[2]薛青林.國內(nèi)機構(gòu)知識庫建設(shè)的問題和對策[J].圖書館建設(shè),2009(5).
[3]袁順波,董文鴛,李賓.西方機構(gòu)庫研究的現(xiàn)狀及啟示[J].圖書館雜志,2006(8).
[4]楊勇,張建中.機構(gòu)知識庫的構(gòu)建與高校圖書館的工作創(chuàng)新[J].圖書館理論與實踐,2009(1).
[5]連書勤,熊莉君.試論如何構(gòu)建高校機構(gòu)知識庫[J].科技廣場,2009(6).
[6]宛玲,蘇娜,厲志紅.大學機構(gòu)知識庫組織管理問題研究[J].圖書情報工作,2008(4).
[7]徐速.機構(gòu)知識庫[J].圖書館理論與實踐,2008(1).
(編輯:金冉)
G258.6
A
1673-8454(2011)05-0030-03