摘要:高校機構知識庫只有嚴把學術信息資源質(zhì)量關,才能體現(xiàn)自身服務功能與優(yōu)勢。文章對高校機構知識庫的內(nèi)涵與特點進行分析,研究影響機構知識庫學術信息資源質(zhì)量的因素,以及設計信息質(zhì)量控制標準的方法,提出高校機構知識庫學術信息資源的分階段質(zhì)量控制策略。
關鍵詞:機構知識庫;信息資源;質(zhì)量控制
中圖分類號:G251文獻標識碼:A
DOI:10.13897/j.cnki.hbkjty.2020.0022
[HJ2.2mm]互聯(lián)網(wǎng)技術的進步改變了學術交流環(huán)境,信息傳輸更為便捷,科研人員不再局限于以紙質(zhì)文獻為載體開展學術交互,而是傾向于借助各類信息技術,以多元化的渠道促進學術信息資源傳播。數(shù)字學術的日益繁榮,使得數(shù)字化學術資源規(guī)模不斷擴大,數(shù)字化智力產(chǎn)品層出不窮,這在給學者帶來更多可借鑒信息的同時,也使得網(wǎng)絡環(huán)境下學術資源的分布更加無序,迫切需要信息機構做好學術信息資源組織、整理與存儲工作,確保數(shù)字化學術資產(chǎn)得到合理利用。機構知識庫又稱為機構典藏庫,是由信息機構為滿足信息檢索、采集、長期存儲等需求,創(chuàng)建的集成多種數(shù)字化產(chǎn)品,以供廣大用戶使用的知識庫[1]。機構知識庫是開放獲取運動的產(chǎn)物,有助于數(shù)字化學術信息資源的長期保存,為科研人員高效獲取學術信息提供了平臺。筆者以國內(nèi)外研究文獻為對象,以主題詞檢索的方式,從中國知網(wǎng)、萬方、維普等網(wǎng)站獲取相關文獻,輔以聚類分析工具,客觀分析國內(nèi)外機構知識庫的研究進展,了解機構知識庫的理論、應用軟件、建設實例等問題?;诖?,本文歸納了高校機構知識庫的特點,研究學術信息資源的質(zhì)量控制策略,旨在解決學術信息資源的科學管理與利用問題,促進機構知識庫理論的豐富與發(fā)展。
1 高校機構知識庫的內(nèi)涵與特點分析
隨著開放獲取運動的深入推進,作為收集、存儲、共享學術資源的數(shù)據(jù)庫,機構知識庫已經(jīng)被眾多高校與科研機構關注與應用。
1.1 機構知識庫的內(nèi)涵
機構知識庫(簡稱IR),是機構知識管理的可靠來源,是促進學術資源共享的平臺。國內(nèi)一些學者認為,IR是采集、存儲單個或多個高校的知識資源的數(shù)據(jù)庫,在學術交流體系變革中發(fā)揮著重要作用[2]。通過分析國內(nèi)外對機構知識庫的定義,可以將其劃分為兩類,CARL認為IR是對多個機構科研人員所創(chuàng)造智力產(chǎn)品的采集與整合,以保障內(nèi)外部終端用戶的無障礙使用,側重強調(diào)其開放、學術與機構性[3];柯平等認為IR是面向公眾開放的促進知識產(chǎn)品傳播共享的系統(tǒng),側重強調(diào)其服務性[4]。筆者更傾向于第二種觀點。
1.2 高校機構知識庫的特點
如今國內(nèi)高校正在緊鑼密鼓地開展機構知識庫建設工作,越來越多高校學者提高了對開放獲取的參與度,以圖書館為主體的機構知識庫建設體系也得到不斷完善。統(tǒng)計表明,截至2017年底,在CALIS網(wǎng)站登記的高校機構知識庫超過40家,在開放存取知識庫目錄(Directory of Open Access Repositories, 簡稱Open DOAR)注冊的高校機構知識庫超過12家。高校機構知識庫主要為本校師生提供服務,建設目標之一是完成對本機構學術信息資源的采集與積累,實現(xiàn)知識成果的長期存儲,為科研人員使用提供便利。它具有開放性、學術性、互操作性等特點,所采集的數(shù)字化資源學術性較強,提供了互操作框架,可以讓用戶利用互聯(lián)網(wǎng)不受限制地訪問電子資源,在一定程度上改善了學術交流環(huán)境,提升了學術機構的整體競爭力。
1.3高校機構知識庫的運作流程
作為高校投入人力、物力與財力,為師生提供學術資源開放存取的場所,IR體現(xiàn)了高校的價值與特色[5]。掌握高校機構知識庫的運作流程,是開展學術資源質(zhì)量控制的起點,如圖1所示。首先,科研人員登陸機構知識庫注冊,并提交對應的科研成果等學術資源。然后系統(tǒng)自動對這些資源進行質(zhì)量評價,系統(tǒng)設置學科帶頭人有權推薦優(yōu)質(zhì)的學術資源,同行之間也可以采用公開交流和評價的方式,綜合分析提交學術資源的質(zhì)量,系統(tǒng)會對這些評價進行綜合排序,提取高質(zhì)量的學術資源。技術人員則會事先編寫用于保障學術資源規(guī)范化的元數(shù)據(jù),并將這些數(shù)據(jù)分類納入元數(shù)據(jù)庫中。最后系統(tǒng)根據(jù)元數(shù)據(jù)標準和綜合評議結果,將符合要求的學術資源加入機構知識庫中。
2 影響高校機構知識庫學術信息資源質(zhì)量的因素分析
通過對我國機構知識庫網(wǎng)站的調(diào)研分析,發(fā)現(xiàn)目前我國高校機構知識庫雖然逐漸增多,但普遍缺乏質(zhì)量控制標準,學術特色不足,自然失去了對用戶的吸引力[6]。要想做好質(zhì)量控制工作,就有必要了解影響高校機構知識庫的因素,為制定質(zhì)量控制策略提供依據(jù)。
2.1 存儲成果的價值
高校機構知識庫要想體現(xiàn)學術特色,其存儲的信息資源不僅需要具有學術價值,也要體現(xiàn)豐富性、全面性與可用性。高校不僅是教學機構,也是科研機構,這就要求機構知識庫存儲的學術資源既要體現(xiàn)學校辦學特色,體現(xiàn)重點學科建設優(yōu)勢,也要對教學、科研活動具有參考借鑒價值。對機構知識庫存儲資源的來源、類型、存儲形式等,也有必要做出明確的規(guī)定。這是因為不同來源與形態(tài)的學術資源,在質(zhì)量上存在較大差異,也在一定程度上決定著知識庫整體學術資源質(zhì)量的高低[7]。查全率是體現(xiàn)開放獲取程度的標志,根據(jù)中科院機構知識庫網(wǎng)絡平臺的統(tǒng)計數(shù)據(jù)顯示,截至2018年8月,作為起步較早的高校機構知識庫,中國人民大學IR的查全率僅為39%[8]。資源采集不全面,全文獲取率低,存儲資源比例失調(diào),無法發(fā)揮學術資源傳播共享渠道的作用,極大限制了國內(nèi)IR的發(fā)展。
2.2 提交與審核者的資質(zhì)
當開展某項工作或活動時,相關主體必須具備對應的資質(zhì)[9]。高校機構知識庫的建設,需要考慮學術資源提交者與審核人員這兩類主體的資質(zhì)。為了采集機構內(nèi)成員具有價值的學術資源,高??蓪①Y源提交者限定為本校師生,要求他們保障提交成果的規(guī)范、真實與原創(chuàng)性,具備獨立承擔責任的能力,不侵犯他人合法權益。而對于審核人員而言,其組成必須是學科專家、學科館員或經(jīng)驗豐富的研究人員,要求具備學科專業(yè)知識,掌握信息技術,能夠熟練制定學術資源質(zhì)量控制策略,能夠識別提交資源的學術價值與真實性。然而基于機構知識庫的開放性特點,使得在線提交的用戶較多,知識庫采集的資源數(shù)量龐大,提交過程中普遍缺乏實質(zhì)性審核,這就難以保障信息質(zhì)量。
2.3 政策標準與內(nèi)容維護
機構知識庫在建立后需要做好管理、維護與優(yōu)化工作,以保障存儲內(nèi)容的可持續(xù)利用,避免發(fā)生數(shù)據(jù)丟失等意外。我國目前尚缺乏與機構知識管理相關的政策,導致高校機構知識庫在建設過程中標準與規(guī)范缺失[10]。有的高校機構知識庫缺乏科學的管理制度,對后期管理投入不足,導致對學術資源的管理混亂,也影響到用戶的使用效果。隨著社會環(huán)境、國家政策、高??蒲蟹妒降葍?nèi)外部因素的變化,用戶對高校機構知識庫的需求也在隨之變化。對機構知識庫內(nèi)容的維護與更新,是維持知識庫資源豐富、可用性的必要手段。但一些高校機構知識庫缺乏專人管理,對學術資源的維護與更新滯后,沒有及時修正不符合標準的元數(shù)據(jù),沒有刪除侵權內(nèi)容或過時信息,極大影響到知識庫的使用功能。
3 高校機構知識庫學術信息資源質(zhì)量控制標準的設計
對高校機構知識庫進行質(zhì)量控制,根據(jù)存儲學術信息資源設計對應的管理標準,是高校管理者促進機構知識庫不斷完善,提高數(shù)字化資源管理水平的必要環(huán)節(jié)。
3.1 形式內(nèi)容質(zhì)量控制標準
對機構成員提交的信息進行形式內(nèi)容審核,涉及是否符合采集范圍、是否符合內(nèi)容格式標準、是否重復提交等方面。每個機構知識庫可以根據(jù)自身建設實際,合理規(guī)定采集存儲學術資源的內(nèi)容范圍。但機構知識庫對提交范圍的標準設計并不是固定的,而是根據(jù)高校學科建設情況、用戶需求變化趨勢而變化的[11]。例如,我校圖書館以服務教育科研為主,為了保障知識庫學術資源的合理配置,需將教學科研資料作為采集主體,減少檔案、期刊等資料的采集。若提交的學術信息符合要求,還需要進一步判斷是否重復提交,最后對資源類型、文件格式等進行審核。由于終端用戶使用軟件的差異,機構知識庫管理者可以擬定針對常見應用軟件的格式標準,以方便用戶下載與使用。
3.2 學術內(nèi)容質(zhì)量控制標準
高校機構知識庫對學術信息內(nèi)容的質(zhì)量審核,需要委托學術專家從學術規(guī)范、學術價值等角度開展,或者隨機委派同一領域的學科帶頭人參與學術內(nèi)容質(zhì)量評定,這是保障機構知識庫整體學術水平的重要措施。根據(jù)不同機構知識庫的特色,每個知識庫在學術資源采集范圍與質(zhì)量審核方面不存在共性,因此對學術質(zhì)量評價標準的設計,需要管理者根據(jù)實際情況擬定。高校機構知識庫不僅需要延續(xù)傳統(tǒng)的同行審議模式,設計符合要求的同行學術評價標準,也需要邀請更多學科專家參與其中,不斷對學術資源質(zhì)量評價指標進行修改完善,保障納入真實、優(yōu)質(zhì)的學術信息資源,提高學者對機構知識庫價值的認同度。
3.3 元數(shù)據(jù)質(zhì)量控制標準
元數(shù)據(jù)用于描述信息資源的基本屬性,方便從大量數(shù)據(jù)中提取內(nèi)容特征,保障不同資源的互操作性與長期存儲。元數(shù)據(jù)包括描述性、管理性、結構性等多種類型,高校機構知識庫必須要明確不同元數(shù)據(jù)的互操作標準,并建立對應的元數(shù)據(jù)庫[12]。機構成員在自行提交學術信息資源過程中,對其提交內(nèi)容的元數(shù)據(jù)描述,也多為提交者自行輸入的,這就不可避免會出現(xiàn)元數(shù)據(jù)標準不統(tǒng)一的問題。為此,機構知識庫管理者要設置統(tǒng)一的元數(shù)據(jù)規(guī)范,明確可使用的元數(shù)據(jù)范圍,保障輸入的標準化,避免拼寫錯誤等細節(jié)問題。機構知識庫管理者也要根據(jù)通用的元數(shù)據(jù)標準,做好元數(shù)據(jù)的編輯、審核與更新工作。
4 高校機構知識庫學術信息資源的質(zhì)量控制策略
對學術信息資源的質(zhì)量控制,貫穿于高校機構知識庫建設全過程中。為了保障學術信息資源質(zhì)量控制效果,筆者結合機構知識庫存儲實際與運營流程,采用分階段質(zhì)量控制方法,制定資源提交階段、審核階段、使用階段的對應策略,建構了學術信息資源質(zhì)量控制模型,以全方位保障機構知識庫的資源質(zhì)量(如圖2所示)。
4.1 資源提交階段
高校機構知識庫需要事先對外發(fā)布學術信息提交政策,讓機構成員了解上傳要求,進而根據(jù)規(guī)范提交學術成果。在提交者的身份審核方面,除了允許本??蒲腥藛T提交學術資源,也可以鼓勵在校大學生上傳優(yōu)秀學術成果,保障不遺漏任何有價值的信息。例如,中科院文獻情報中心機構知識庫(NSL OpenIR)規(guī)定符合內(nèi)容提交范圍規(guī)定的人員,在NSL OpenIR中注冊并獲得提交授權,就可以提交內(nèi)容。提交者應該保障學術信息的規(guī)范、完整與真實性,符合特定的存儲格式,提交后不得隨意更改。機構管理者則應該具有元數(shù)據(jù)編輯與管理能力,能夠預測元數(shù)據(jù)使用中存在的問題,并制定對應的元數(shù)據(jù)操作規(guī)范指南,方便提交者閱讀并依規(guī)操作。同時采用開源軟件平臺,設定系統(tǒng)可以識別的資源類型與范圍,明確資源文檔格式要求,做好提交資源的存儲與備份工作,保障不因為軟硬件環(huán)境的改變,引發(fā)學術信息資源損壞或無法讀取的尷尬。
4.2 資源審核階段
對于已經(jīng)提交的學術信息資源,機構知識庫管理人員要進行嚴格的質(zhì)量審核,借助各種智能化工具提高審核的可靠性。資源提交涉及文檔上傳、元數(shù)據(jù)錄入等步驟,而這兩個操作也是質(zhì)量審核的重點。為了保障元數(shù)據(jù)錄入的便利與準確性,管理者要設置一些控制程序,如減少錄入步驟、自動生成日期、設置可供選擇的規(guī)范化錄入字段等,以減少錄入工作量,提高學術資源提交效率。對提交學術資源的質(zhì)量審核,主要是做好元數(shù)據(jù)與文件格式的質(zhì)量控制工作,及時發(fā)現(xiàn)提交過程中存在的錯誤,以內(nèi)容提交表達的形式呈現(xiàn)審核結果,要求提交者予以修改更正,保障提交的內(nèi)容符合規(guī)范。
4.3 資源使用階段
高校機構知識庫對已經(jīng)收錄的學術信息資源,需要定期進行維護與更新,及時刪除不符合要求的資源,對保密期限已過的特色資源進行開放共享,對接收到新版本的存儲資源,要合理處理舊版本,根據(jù)需要選擇是否保留或刪除。這個階段涉及元數(shù)據(jù)、學術內(nèi)容與知識版權等方面的質(zhì)控,除了采用同行隨機審議的方式,還需要知識庫管理者做好用戶數(shù)據(jù)采集工作,了解既有資源的查看、下載與使用率,并將用戶使用情況作為評價學術資源質(zhì)量的指標之一。管理者也要承擔對存儲資源格式規(guī)范性、鏈接有效性等內(nèi)容的定期檢查工作,保障開放共享的資源不涉及版權糾紛,或者保證得到原作者授權后方可傳播,對于質(zhì)量審核的最終結果要及時反饋給提供者,以便其結合需要進行修改和完善。
5 結語
機構知識庫是開放獲取運動的產(chǎn)物,是體現(xiàn)高校學術資源特色的重要平臺。如今國內(nèi)高校機構知識庫蓬勃發(fā)展,為廣大學術工作者獲取信息提供了便利。而在機構知識庫建設過程中,應該全方位考慮質(zhì)量控制問題,制定科學的學術信息資源質(zhì)量控制指標,建立常態(tài)化存儲資源質(zhì)量控制機制,總結分析學術信息資源質(zhì)量方面的問題,掌握用戶的需求變化情況,這是保障機構知識庫良性運作的基礎,也是提高用戶信任度的必要途徑。
參考文獻
[1]劉丹.機構知識庫元數(shù)據(jù)質(zhì)量控制方法研究[J].圖書館學研究,2018(4):59-66.
[2]劉文云,岳麗欣,馬伍翠,等.政府數(shù)據(jù)開放保障機制在數(shù)據(jù)質(zhì)量控制中的應用研究[J].情報理論與實踐,2018(4):21-27.
[3]魏瑞斌,陳丹丹,琚興.高校機構知識庫的應用研究[J].知識管理論壇,2013(5):3-12.
[4]柯平,王穎潔:機構知識庫的發(fā)展研究[J].圖書館論壇,2006(6):243-248.
[5]趙潔潔,詹華清,介鳳.高校機構知識庫學術評價功能研究[J].圖書館雜志,2017,36(9):20-25.
[6]陳林華.我國高校機構知識庫開放存取政策研究[J].湘潭大學,2018.
[7]司莉,莊曉喆.我國高校科研數(shù)據(jù)機構庫聯(lián)盟的建設需求調(diào)查與分析[J].圖書館,2017(7):19-26.
[8]萬文娟,吳高.我國機構知識庫內(nèi)容建設問題與策略分析[J].圖書館,2013(1):110-113.
[9]賈宏.高校機構資源庫元數(shù)據(jù)質(zhì)量控制研究[J].南陽師范學院學報,2017(2):65-67.
[10]劉書凱,陳冬梅,欒冠楠.創(chuàng)客教育實踐對創(chuàng)新圖書館信息素養(yǎng)教育內(nèi)容的啟示[J].圖書情報工作,2016,60(1):52-55.
[11]曹樹金,古婷驊,馬翠嫦.圖情領域機構知識庫可聚合性分析[J].圖書情報知識,2016(6):95-106.
[12]孫薇.E-Research環(huán)境下機構知識庫學術信息資源的質(zhì)量控制研究[J].圖書館學刊,2016(2):30-32.
作者簡介:陳旭(1980-),男,福建醫(yī)科大學圖書館助理館員。研究方向:信息資源及學科服務。