喬楊
(鄭州輕工業(yè)學(xué)院,河南鄭州 45002)
高校圖書館特色自建數(shù)據(jù)庫評價方法應(yīng)用研究
喬楊
(鄭州輕工業(yè)學(xué)院,河南鄭州 45002)
本文結(jié)合鄭州輕工業(yè)學(xué)院自建數(shù)據(jù)庫現(xiàn)狀,基于AHP層次分析法與模糊綜合評判法,從數(shù)據(jù)庫數(shù)量、數(shù)據(jù)庫質(zhì)量、檢索方便程度、界面友好程度、查全與查準(zhǔn)率、更新頻率、滿足程度和收錄內(nèi)容是否全面等進行了初步評價分析,為自建數(shù)據(jù)庫建設(shè)項目評價體系提供一些參考性建議。
圖書館;自建數(shù)據(jù)庫;AHP;綜合模糊評價方法
信息存儲和呈現(xiàn)模式的改變,如何綜合利用計算機技術(shù)、網(wǎng)絡(luò)技術(shù)以及信息技術(shù),結(jié)合各種豐富的館藏資源和自建數(shù)據(jù)庫,為師生提供學(xué)習(xí)和教學(xué)科研服務(wù),已成為高校圖書館信息資源服務(wù)的目標(biāo)之一。高校師生對圖書館信息資源的需求飛速增長,高校圖書館特色數(shù)據(jù)庫建設(shè)已成為信息資源建設(shè)的重要內(nèi)容之一。除上述獲得信息資源形式外,自建數(shù)據(jù)庫作為信息資源的補充完善,也加快了建設(shè)的步伐,成為高校圖書館信息資源的主要來源。自建數(shù)據(jù)庫指圖書館根據(jù)本館的特殊館藏或特殊需要自行開發(fā)建設(shè)的數(shù)據(jù)庫,也就是自建數(shù)據(jù)庫。對高校而言,其主要內(nèi)容包括自行開發(fā)書目、期刊目錄、文摘、論文、具有學(xué)科特色的專題全文數(shù)據(jù)庫等不同內(nèi)容形式。高校圖書館自建特色數(shù)據(jù)庫成為信息資源數(shù)字化工作的重要組成部分,很多高校圖書館投入大量的人力物力進行自建數(shù)據(jù)庫建設(shè),來積累圖書館信息資源數(shù)字化建設(shè)的經(jīng)驗,構(gòu)建具有鮮明的專業(yè)特色、讀者用戶使用方便、操作簡易,實用性強的專業(yè)自建數(shù)據(jù)信息資源。同時發(fā)掘有價值的、具有保護性的地域文化與特色資源,為廣大師生服務(wù)。
有關(guān)信息資源評價指標(biāo)體系建設(shè)方面研究在中國有一些成果,有關(guān)信息資源的評價方法也不斷提出,這些信息資源的評價及主要評價方法包括定量評價、定性評價、定量評價和定性與定量相結(jié)合的綜合評價方法。如,根據(jù)評價標(biāo)準(zhǔn)、指標(biāo)體系來進行定性和半定量的主體評價方法,根據(jù)用戶使用調(diào)查、數(shù)據(jù)資源利用情況統(tǒng)計分析、數(shù)據(jù)資源性價的比為主的定量評價方法。評價人員專業(yè)熟練程度,如何獲得評價指標(biāo)問題等問題,都很大程度的影響著評價質(zhì)量、評價方法的選擇,而評價的過程和評價參與人員影響著評價的結(jié)果。
在國外,通過在線搜索SDOS、Springer Link、Kluwer及Google搜索引擎等自建數(shù)據(jù)數(shù)據(jù)庫評價相關(guān)研究可以看出,國外對自建數(shù)據(jù)數(shù)據(jù)庫評價相關(guān)研究,對電子期刊數(shù)據(jù)庫評價與利用統(tǒng)計研究相對較早,與國內(nèi)相比研究內(nèi)容也不盡相同,側(cè)重點主要包括:一是側(cè)重數(shù)據(jù)庫的選擇評價研究。如:電子期刊方面,國外學(xué)者認為針對電子期刊的不同特點,可以依然采用印刷型期刊的相關(guān)選擇評價標(biāo)準(zhǔn),構(gòu)建出自身獨特的選擇評價標(biāo)準(zhǔn),可以突出電子期刊評價的可及性和可用性;部分國外學(xué)者認為除了評價內(nèi)容外還可以增加評價檢索界面以及檢索功能等方面。二是對電子期刊數(shù)據(jù)庫的利用統(tǒng)計分析方面研究。在國外,圖書館很注重電子期刊的利用、統(tǒng)計分析工作,很多研究從不同角度對使用數(shù)據(jù)進行定量的統(tǒng)計分析,來研究電子期刊的使用對圖書館的對用戶需求滿足程度、經(jīng)費分配情況、不同讀者用戶行為上的差異、投資效益等問題。三是對評價項目方面的研究,這方面的典型研究有:ARL New Measures Initiative(美國研究圖書館協(xié)會新測評研究計劃)。
上述國內(nèi)外研究綜述分析說明,國內(nèi)的自建數(shù)據(jù)庫信息資源的評價研究偏向于理論體系,如:評價指標(biāo)體系建立方法,評價方法和評價的策略等。國外研究對信息資源質(zhì)量的驗證多是通過績效評價來進行的,達到增強對信息資源質(zhì)量的管理的水平目的,國外評價指標(biāo)研究在注重理論體系的同時注重指標(biāo)體系在實踐中的指導(dǎo),注重指標(biāo)體系在實際中的應(yīng)用情況,而非只是利用某個指標(biāo)體系進行定性分析或定量評價。
3.1 層次分析法(AHP)
層次分析法——Analytic Hierarchy Process(AHP)T.L.saaty教授于20世紀(jì)70年代末提出的一種多層次權(quán)重解析法。該方法綜合定性與定量分析方法來進行分析,用數(shù)量形式處理表達用戶的主觀判斷,從而確定系統(tǒng)的權(quán)重值在各指標(biāo)中的比重,具有可靠性、時效性、簡明適用性等特點。AHP方法利用多目標(biāo)綜合評價和網(wǎng)絡(luò)系統(tǒng)理論的方法,將決策總體進行了層次分解,包括目標(biāo)、主準(zhǔn)則、分準(zhǔn)則等層次,根據(jù)不同的分層來聚集評價對象的多項指標(biāo)信息,以從宏觀整體上來認識評價對象的好壞。這種方法大大降低了評價中的不確定因素,即簡化了評價過程中的系統(tǒng)分析與計算工作,又保持了決策者在思維決策和過程原則一致。該方法適用于不能全部量化處理的管理問題,是一種確定權(quán)重的科學(xué)方法。
3.2 綜合模糊評價法的概念
模糊反映在概念形成過程中外延的不分明性,指客觀事物差異的中間過渡中“不分明性”或“亦此亦彼性”。模糊綜合評價方法是綜合評價方法的一種,它利用模糊關(guān)系原理來定量化那些邊界不清、不易定量的因素,把模糊數(shù)學(xué)作為基本點。在《信息與控制》中的論文“模糊集合”(美國加利福尼亞大學(xué),1965,扎德A.Zadeh)中提出用“隸屬函數(shù)”的概念來描述現(xiàn)象差異的中間過渡,由此誕生了模糊數(shù)學(xué)學(xué)科。該評價方法首先利用構(gòu)造等級模糊子集的方法,量化反映被評價事物的模糊指標(biāo),再利用模糊變換的原理對各指標(biāo)進行綜合整理。該方法評價結(jié)果以向量的形式給出,該向量是一個模糊子集,能夠較為準(zhǔn)確地刻劃了事物本身的模糊狀況,提供比其它方法更詳細的評價信息。綜合評判方法具有較強的適用性,既適用于又可用于客觀指標(biāo)的綜合評判又適用于主觀指標(biāo)的綜合評價。通過模糊綜合評價的過程來解決的評價指標(biāo)的可綜合性問題,而無需專門處理。
3.3 AHP-綜合模糊評價方法
層次分析法是系統(tǒng)工程中對非定量事件作定量分析的一種簡便方法,也是對人們主觀判斷做客觀描述的一種有效辦法,其基本思想是根據(jù)分析對象的性質(zhì)和決策或評價的總目標(biāo),把總體現(xiàn)象中的各種影響因素通過劃分相互聯(lián)系的有序?qū)哟问怪畻l理化。而模糊綜合評價法利用模糊理論在處理不確定性問題上的優(yōu)越性,在數(shù)據(jù)標(biāo)準(zhǔn)化處理方面取得好的效果。該綜合評價法則既結(jié)合多種評價法的優(yōu)點,又盡量避免了它們各自的缺點,從而取得了較好的效果。
本項目將把評價指標(biāo)限定在自建數(shù)據(jù)庫系統(tǒng)建設(shè)過程中考慮,首先考慮的是自建數(shù)據(jù)庫的讀者利用率,采用AHP-模糊綜合評價模型,并結(jié)合鄭州輕工業(yè)學(xué)院自建數(shù)據(jù)庫項目的實際情況,提出自建數(shù)據(jù)庫系統(tǒng)建設(shè)評價指標(biāo)并對其進行初步分析。解決自建數(shù)據(jù)庫評價中的評價指標(biāo)的權(quán)重確定問題、評價過程中的定性問題以及模糊性現(xiàn)象的處理,以及其他各種因素對評價問題的影響,將定性評價與定量計算有機的結(jié)合起來。給出自建數(shù)據(jù)庫評價指標(biāo)并對其進行初步分析,分析目前關(guān)于自建數(shù)據(jù)庫建設(shè)中存在的關(guān)鍵問題,并給出解決這些問題的基本策略,為自建數(shù)據(jù)庫建設(shè)項目評價體系提供一些參考性建議。鄭輕院圖書館所建的還不少數(shù)據(jù)庫的選題還停留在教師論著成果、學(xué)生學(xué)位論文、隨書光盤資源等傳統(tǒng)數(shù)據(jù)庫模式上,沒有充分發(fā)揮學(xué)校的學(xué)科優(yōu)勢和館藏優(yōu)勢。
我們以鄭輕院圖書館的5個自建數(shù)據(jù)庫為研究對象,采用主成分分析方法來分析評價自建數(shù)據(jù)庫,分別以數(shù)據(jù)庫質(zhì)量、數(shù)據(jù)庫數(shù)量、界面友好程度、檢索方便程度、更新頻率、查全率、查準(zhǔn)率、滿足程度為具體指標(biāo),對現(xiàn)有的建設(shè)過程中出現(xiàn)問題進行剖析,找出問題的解決辦法,奠定了進一步開發(fā)和利用特色自建數(shù)據(jù)庫基礎(chǔ)。
4.1 AHP-綜合模糊評價的數(shù)據(jù)來源
AHP-綜合模糊評價調(diào)查包括了數(shù)據(jù)庫質(zhì)量,數(shù)據(jù)庫數(shù)量、界面友好程度、檢索方便程度、更新頻率、查全率、查準(zhǔn)率、滿足程度等內(nèi)容,AHP-綜合模糊評價的數(shù)據(jù)來源于隨機調(diào)查的本校教師60人,本校研究生60人,本科生300人,調(diào)查問卷共420份,其中收回395份,有效填表370份。調(diào)查對象是信息庫,學(xué)位論文庫等5個自建特色數(shù)據(jù)庫。
4.2 AHP-綜合模糊評價方法應(yīng)用
4.2.1 因素論域U的確定
U={u1,u2,……,un},U:因素論域,Un:n個評價指標(biāo),該方法首先要確定評價的指標(biāo)體系,解決用哪些指標(biāo)Un和哪些方面去評價客觀對象。
4.2.2 評價等級論域V的確定
V={v1,v2,……,vm},V:評價等級集合、決策集,被評對象對應(yīng)各評價等級隸屬程度并通過這個模糊向量表示出來,體現(xiàn)評價的模糊特性,不同的等級對應(yīng)不同模糊子集。評價等級個數(shù)m一般在4和9之間,m大于9會增加語義區(qū)分時間和難度,很難得到對象的等級歸屬,m小于4則達不到模糊綜合評價的質(zhì)量要求,所以故m的選擇應(yīng)在4和9之間。
4.2.3 通過單因素方式評價因素,構(gòu)建模糊關(guān)系矩陣R
模糊關(guān)系矩陣R表示影響因素與評價對象之間的“合理關(guān)系”,是因素集U和評價集V間的一種模糊關(guān)系。在模糊關(guān)系矩陣R中,第因素素rij代表某個被評事物從因素ui來看對vj等級模糊子集的隸屬度。模糊向量(ri1,ri2,…,rim)用來刻畫一個被評事物在某個因素ui方面的表現(xiàn)。
4.2.4 評價因素權(quán)向量確定
由于各因素的影響在總體表現(xiàn)的比重不同,n個評價因素對被評價事物也不是同等的重要。所以在模糊綜合評價中,首先要在合成之前要確定模糊權(quán)向量:A=(a1,a2,……,an),元素ai表示因素ui對模糊子集的隸屬度。權(quán)向量可以用∑ai=1,(ai≥0,i= 1,2,……,n)來表示。
4.2.5 模糊綜合評價結(jié)果向量合成
利用合適的算法合成模糊權(quán)向量A與各被評事物的R,并得到各被評事物的模糊綜合評價結(jié)果向量B。向量B中的bj是由A與R的第j列利用合適的算法計算得出,bj是被評事物從系統(tǒng)上來講對等級模子集vj的隸屬程度。
4.2.6 分析模糊綜合評價結(jié)果向量
模糊綜合評價結(jié)果組成了一個模糊向量,該向量給出了更豐富的信息,表示了被評對象對各等級模糊子集間的隸屬程度如何。假設(shè)存在多個類型相同的被評價對象,要進一步區(qū)分處模糊綜合評價的等級,那么可以利用模糊合成的結(jié)果來計算每個評價對象,得出綜合得分,然后根據(jù)該得分來比較多個評價對象的好壞。
通過AHP-綜合模糊評價分析得到5個自建數(shù)據(jù)庫,分別是:鄭州輕工業(yè)學(xué)院信息庫,鄭州輕工業(yè)學(xué)院學(xué)生推薦書全文閱讀數(shù)據(jù)庫,鄭州輕工業(yè)學(xué)院學(xué)位論文庫,鄭州輕工業(yè)學(xué)院教師著作全文閱讀和數(shù)字文庫。反映了讀者對數(shù)據(jù)庫的真實評價,在所有指標(biāo)中,評價的權(quán)重如表1所示。
表1 評價指標(biāo)中評價的權(quán)重
通過表1可以看出,權(quán)重結(jié)果與抽樣調(diào)查得到的整體打分評價是基本一致,因此,可以得出上述6個指標(biāo)可以初步作為評價自建數(shù)據(jù)庫的整體狀態(tài),達到很高的可信度。另外從調(diào)查表看出,總體評價得分值較低,也說明自建數(shù)據(jù)庫存在一些問題,有待進一步完善。
4.3 自建數(shù)據(jù)庫建設(shè)的思考
從前節(jié)綜述分析可以看出,許多的研究內(nèi)容涉及到了自建數(shù)據(jù)庫方面,尤其是特色數(shù)據(jù)庫建設(shè)的研究方面,出現(xiàn)了很多研究文獻。在該項目中,在自建數(shù)據(jù)庫方面(尤其是特色數(shù)據(jù)庫建設(shè))還存在一些問題。雖然說是特色數(shù)據(jù)庫建設(shè),但數(shù)據(jù)庫具有特色的內(nèi)容量較少,數(shù)據(jù)庫內(nèi)容的深層次加工不足,特色數(shù)據(jù)庫內(nèi)容分散,數(shù)據(jù)庫即時量可以滿足,但還不夠全面,低級重復(fù)內(nèi)容較多,數(shù)據(jù)庫內(nèi)容更新遲緩,實時性差等問題,這些都影響了自建數(shù)據(jù)庫的建設(shè)的效益,關(guān)鍵問題還可以概括為:
(1)信息資源調(diào)查分析---深入調(diào)查和分析信息資源的具體來源,統(tǒng)計分析數(shù)據(jù)庫信息資源的分布、數(shù)量、質(zhì)量、出版商、版權(quán)狀況等詳細信息,由此得出信息資源的收集和處理實施方案。另外,數(shù)據(jù)源的收集要全面。因為數(shù)據(jù)質(zhì)量從某種意義上說就是數(shù)據(jù)庫的質(zhì)量,數(shù)據(jù)是數(shù)據(jù)庫的核心。因此,數(shù)據(jù)的全面收集也是數(shù)據(jù)庫建設(shè)中重要環(huán)節(jié)之一。其目標(biāo)是數(shù)據(jù)庫信息資源收集的信息要完整和權(quán)威。
(2)數(shù)據(jù)庫附加值分析——要注重數(shù)據(jù)庫的附加值,注重對文獻的深加工而形成信息資源。例如,可以進一步的圖書館自建數(shù)據(jù)庫的內(nèi)容數(shù)據(jù)進行進一步的組織、整理和加工,從而提高文獻在質(zhì)量和數(shù)量的附加價值和應(yīng)用效果,形成數(shù)量與品質(zhì)上的優(yōu)勢,從而提高數(shù)據(jù)庫的附加值。
(3)功能點調(diào)查分析——編制功能需求調(diào)查表,對本校師生進行調(diào)查,通過對問卷的統(tǒng)計分析和挖掘,結(jié)合資源建設(shè)單位的技術(shù)力量,確定信息資源組織形式和預(yù)期實現(xiàn)的功能。分析數(shù)據(jù)庫信息資源的具體內(nèi)容,結(jié)合本高校的具體情況進行需求分析,確定系統(tǒng)使用群體,用戶群體可以按照所學(xué)專業(yè)、性別、年級、愛好等形式來劃分。
本文在國內(nèi)外自建數(shù)據(jù)庫評價狀況調(diào)查的基礎(chǔ)上,分析了自建數(shù)據(jù)庫評價指標(biāo)存在的問題,根據(jù)自建數(shù)據(jù)庫評價原則,確定高校圖書館自建數(shù)據(jù)庫評價的基本原則及主要評價內(nèi)容及方法。項目結(jié)合鄭州輕工業(yè)學(xué)院自建數(shù)據(jù)庫現(xiàn)狀,基于AHP層次分析法與模糊綜合評判法,從數(shù)據(jù)庫數(shù)量、數(shù)據(jù)庫質(zhì)量、檢索方便程度、界面友好程度、查全與查準(zhǔn)率、更新頻率、滿足程度和收錄內(nèi)容是否全面等進行了初步評價分析,為自建數(shù)據(jù)庫建設(shè)項目評價體系提供一些參考性建議。
由于任何評價都包含一定的主觀活動,這兩種方法雖然在模型的構(gòu)建與方法的選擇應(yīng)用方面,大大減少了人為因素,但也包含了專家的選擇與判斷主觀活動,所以,在評價過程專家的選擇、判斷、喜好等都不可避免的影響評價的結(jié)果,如何權(quán)衡這幾個因素之間的關(guān)系,這也是下一步的研究方向。
本文系河南省教育廳科學(xué)技術(shù)研究重點項目“基于云計算的圖書館數(shù)字參考咨詢創(chuàng)新服務(wù)模式研究”(編號:13A870370)以及河南省科技廳軟科學(xué)研究計劃項目“高校圖書館特色數(shù)據(jù)庫建設(shè)與共享研究”(編號:132400411150)系列成果之一。
G250
A
1003-5168(2014)04-0255-03