劉學(xué)平
(濰坊學(xué)院,山東 濰坊 261061)
館藏數(shù)字資源聚合理論體系研究探賾
劉學(xué)平
(濰坊學(xué)院,山東 濰坊 261061)
探賾?zhàn)^藏數(shù)字資源聚合理論的目的在于,使其形成完整的理論體系,為聚合實(shí)踐提供強(qiáng)有力的指導(dǎo)。在分析館藏數(shù)字資源聚合概念內(nèi)涵、概念理論分析框架、多學(xué)科視角下概念理論的基礎(chǔ)上,認(rèn)為館藏數(shù)字資源聚合要以共享理論、集群理論、共生理論、長尾理論、認(rèn)知語言學(xué)理論、評價學(xué)理論為基礎(chǔ)引導(dǎo),以網(wǎng)絡(luò)分析方法理論、分眾分類方法理論、計量學(xué)方法理論、本體方法理論、關(guān)聯(lián)數(shù)據(jù)分析方法理論、共現(xiàn)分析方法理論為理論分析工具,融合關(guān)聯(lián)數(shù)據(jù)發(fā)布理論、語義聚焦爬蟲理論、網(wǎng)頁抓取理論、索引理論、語義網(wǎng)理論、聚合機(jī)制理論的技術(shù)理論支撐,實(shí)現(xiàn)資源超網(wǎng)絡(luò)語義模式、資源類型模式、資源作者合作模式、資源元數(shù)據(jù)互操作模式、資源選題模式等聚合模式理論的實(shí)踐展現(xiàn),凸顯理論引進(jìn)與本土化、理論新理念與研究新視覺、理論催生性與相關(guān)性發(fā)展的理論超越。
館藏數(shù)字資源;聚合理論體系;理論發(fā)展超越
數(shù)字時代,讀者在被館藏數(shù)字資源里的科學(xué)實(shí)驗(yàn)數(shù)據(jù)、統(tǒng)計數(shù)據(jù)、元數(shù)據(jù)等“大數(shù)據(jù)”包圍的同時,又處在自然信息、社會信息、新生信息、老化信息等信息的“海洋”之中。盡管如此,讀者仍苦于難覓想要的資源。盡管檢索系統(tǒng)為讀者提供了搜尋的手段,互聯(lián)網(wǎng)為檢索提供了更大的平臺,數(shù)據(jù)融合、信息資源整合為檢索提供了更多的內(nèi)容,但讀者仍是疲于應(yīng)對數(shù)字資源的快速增長。[1]因而以滿足讀者對快速增長館藏數(shù)字資源需求而發(fā)展起來的資源整合,已從傳統(tǒng)的文獻(xiàn)層面、記錄層面轉(zhuǎn)向更加碎片化的知識間關(guān)聯(lián)聚合的高級層面。實(shí)踐證明,資源聚合成為數(shù)據(jù)融合、資源整合等研究的延伸,是未來資源研究的發(fā)展方向。學(xué)者對此研究與館藏數(shù)字資源聚合的實(shí)踐探索相比,其理論建構(gòu)遠(yuǎn)遠(yuǎn)落后于人們對實(shí)踐的熱衷。眾所周知,館藏數(shù)字資源的聚合,一方面,聚合的實(shí)踐需要理論指引。沒有理論指導(dǎo)的聚合實(shí)踐,只能是一種低層次的重復(fù)勞動,無法實(shí)現(xiàn)突破、創(chuàng)新和發(fā)展。同時,理論研究滯后于聚合的實(shí)踐,則會制約聚合實(shí)踐的發(fā)展,因而,聚合要進(jìn)行突破和創(chuàng)新,就必須用相關(guān)的理論作支撐。另一方面,聚合理論的發(fā)展需要理論體系。當(dāng)前,聚合理論研究的分散、不成體系,使聚合實(shí)踐活動受到了來自各方面的質(zhì)疑。因而,聚合理論的完善和發(fā)展已成為一個不可回避的關(guān)鍵問題,迫切需要從理論提升的高度,對源自各個方面、各種類型和各種層次的聚合理論加以概括、總結(jié)、凝練和上升,形成完善的聚合理論體系。[2]至此,從多理論視角探索館藏數(shù)字資源聚合理論,提出其發(fā)展的理論體系,用以指導(dǎo)館藏數(shù)字資源聚合的實(shí)踐,使其產(chǎn)生質(zhì)的飛躍,顯得十分必要和及時。
1.概念內(nèi)涵。聚合是指兩個或多個個體通過某種聯(lián)系形成聚合體的過程,館藏數(shù)字資源(數(shù)據(jù)庫資源——書目數(shù)據(jù)庫、學(xué)術(shù)論文數(shù)據(jù)庫、特色數(shù)據(jù)庫、專業(yè)數(shù)據(jù)庫圖片數(shù)據(jù)庫等;外采資源——CNKI、ACS、IEEE等;流動網(wǎng)絡(luò)資源——新聞、消息以及定期管理和更新的政務(wù)、服務(wù)信息等[3]聚合是一種創(chuàng)造性的融合和重組資源的過程,它不同于傳統(tǒng)信息組織與物理的資源整合,它有語義關(guān)聯(lián)之意,是在數(shù)字資源內(nèi)部與資源之間建立有針對性的、適宜的語義關(guān)聯(lián)標(biāo)簽,通過此標(biāo)簽的內(nèi)容反映出特定資源的語義關(guān)聯(lián)特征,實(shí)現(xiàn)計算機(jī)對特定資源特征的識別與信息內(nèi)容的理解,并通過本體、關(guān)聯(lián)數(shù)據(jù)、分眾分類法、社會網(wǎng)絡(luò)分析、計量學(xué)等方法和技術(shù),[4]對其從時間上聚合過去、現(xiàn)在及未來,從空間上聚合不同區(qū)域和不同專業(yè)領(lǐng)域館藏資源,使分散無序、相對獨(dú)立的館藏數(shù)字資源重新組織為一個新的有機(jī)整體,以滿足讀者對資源語義關(guān)聯(lián)的需求。它在使資源具備交互性、專業(yè)性、層次性、復(fù)合性、關(guān)聯(lián)性等特點(diǎn)的同時,凸顯資源“歸于整,理為序、求其真”的聚合功效。
2.概念理論分析框架。由于館藏數(shù)字資源聚合涵蓋數(shù)據(jù)融合、資源整合集成等內(nèi)容,因而在理論上存在一個多序列、多層級的概念體系,實(shí)踐上受到本體性因素和條件性因素的制約,由此建構(gòu)出包括本體論、領(lǐng)域論、條件論和發(fā)展論的理論分析框架為:本體論主要研究館藏數(shù)字資源聚合概念的內(nèi)涵、起源、性質(zhì)、特征、作用等;領(lǐng)域論主要探討?zhàn)^藏數(shù)字資源聚合的種類、范圍;條件論主要討論館藏數(shù)字資源聚合的制約因素;發(fā)展論主要研究館藏數(shù)字資源聚合的運(yùn)行狀況、成功經(jīng)驗(yàn)、存在問題及其規(guī)律。把握館藏數(shù)字資源聚合理論分析框架,將為其聚合實(shí)踐提供理論指導(dǎo)基礎(chǔ)。
3.多學(xué)科視角下的概念理論。概念內(nèi)涵決定其理論不能單純歸屬某個學(xué)科,它以多學(xué)科理論的綜合體,對其運(yùn)行的特征、演變規(guī)律和聚合模型進(jìn)行指引,它在契合館藏數(shù)字資源分布式、多元化、智能化發(fā)展趨勢的同時,對其實(shí)用性與前瞻性進(jìn)行預(yù)測和指導(dǎo)。[5]體現(xiàn)為:生態(tài)學(xué)關(guān)注聚合資源的生態(tài)環(huán)境與生態(tài)系統(tǒng)平衡;組織學(xué)關(guān)注資源與資源之間的關(guān)聯(lián)與組織;方法論關(guān)注資源的多樣性、完整性和系統(tǒng)性;系統(tǒng)論關(guān)注資源的整體與部分、結(jié)構(gòu)與功能之間關(guān)系的處理與融合;哲學(xué)終極關(guān)懷關(guān)注能為讀者獲取數(shù)字資源提供多大的空間自由度;倫理學(xué)關(guān)注資源聚合的版權(quán)利益平衡;社會學(xué)關(guān)注為讀者提供普遍服務(wù);經(jīng)濟(jì)學(xué)關(guān)注資源聚合的成本與效益保障;服務(wù)學(xué)關(guān)注讀者能否參入到資源聚合過程;法學(xué)關(guān)注資源聚合法律制度的保障與實(shí)現(xiàn)。這為我們從多個側(cè)面認(rèn)知館藏數(shù)字資源聚合提供了理論來源。
聚合的理論來源和創(chuàng)造性融合與資源重組的聚合過程,決定館藏數(shù)字資源聚合涉及的基礎(chǔ)理論是一個綜合交叉的理論體系。
1.共享理論。共享理論實(shí)質(zhì)是資源的共建、共知、共享,共建與共知是共享基礎(chǔ),共享又能很好地引導(dǎo)共建,同時共享需要多種形式來實(shí)現(xiàn),聚合便是其中一種。首先,館藏數(shù)字資源聚合是基于資源共享理念形成和發(fā)展的。資源共享理念是資源聚合產(chǎn)生的動機(jī)。資源共享能使圖書館原來的倉儲積累、備用資源的基本結(jié)構(gòu)轉(zhuǎn)變?yōu)檫x擇積累、目標(biāo)資源的提供模式,而在資源聚合框架里這種模式可得以實(shí)現(xiàn)。所以說,由資源共享理念推生的資源聚合是對館藏數(shù)字資源建設(shè)的最大貢獻(xiàn)。其次,館藏數(shù)字資源聚合是實(shí)現(xiàn)資源共享的有效組織方式。數(shù)字資源的異質(zhì)異構(gòu),形成了資源之間的差異,資源聚合是建立在資源的優(yōu)化組合與合理配置基礎(chǔ)之上的聚合形式,它借助資源優(yōu)勢互補(bǔ),使得資源獲得某種質(zhì)和量的放大效應(yīng),[6]從而形成一種資源擴(kuò)充效果。
2.集群理論。集群理論是通過互聯(lián)網(wǎng)和合作協(xié)議,把數(shù)字資源的機(jī)構(gòu)與組織按照一定模式集中在特定虛擬區(qū)域內(nèi),對各資源機(jī)構(gòu)中分散獨(dú)立的數(shù)字資源進(jìn)行統(tǒng)一處理和邏輯聚合,用統(tǒng)一的界面,為用戶提供一站式集成服務(wù)。而館藏數(shù)字資源聚合是在資源整合的基礎(chǔ)上,對資源數(shù)據(jù)進(jìn)行深度挖掘,提取出隱藏在資源數(shù)據(jù)之中的新資源,在聚合中融入知識和智慧,產(chǎn)生知識溢出效應(yīng)。它謀求資源之間聚合,以彌補(bǔ)資源自身的不足,強(qiáng)調(diào)資源高度集中、重視新技術(shù)應(yīng)用、實(shí)現(xiàn)資源增值。凸顯資源1+1>2的協(xié)同效應(yīng)。[7]它與資源集群理論指導(dǎo)思想正適切。
3.共生理論。共生理論源于生物學(xué),意指“不同種屬的生物按某種物質(zhì)聯(lián)系共同生活”。它由共生單元、共生模式和共生環(huán)境三要素構(gòu)成,共同進(jìn)化、共同適應(yīng)、共同發(fā)展是共生的本質(zhì)。共生的過程是共生單元采取合作性競爭的方式,通過同類資源的共享和異類資源的互補(bǔ)實(shí)現(xiàn)共生單元功能的重新分工和定位,最終達(dá)到一體化共生的理想模式。[8]而這個模式正好與館藏數(shù)字資源聚合共享的理念相一致。在館藏數(shù)字資源聚合中,如果把層次不同和類型異構(gòu)館藏數(shù)字資源共享看成一個共生體時,那么,各個資源就成為一個個的共生單元。根據(jù)共生理論,一方面,共生單元之間必定存在一個聯(lián)系的紐帶,不同館藏資源之間的這種聯(lián)系紐帶主要體現(xiàn)在資源之間的隱性關(guān)聯(lián)和互補(bǔ)兩個方面。另一方面,共生關(guān)系形成過程中,共生伙伴的選擇并不是隨機(jī)的,而是表現(xiàn)出一定的規(guī)律性,任何共生單元都會優(yōu)先選擇能力強(qiáng)、匹配性好的共生單元作為共生對象。這一規(guī)律為館藏數(shù)字資源聚合的路徑提供了依據(jù);共生模式是指共生單元之間相互作用的方式,“一體化共生、多樣化組合”是館藏數(shù)字資源聚合共生模式。一體化共生是為實(shí)現(xiàn)各資源自身優(yōu)勢,借助共生界面,通過資源之間的隱性聯(lián)系,對資源采取全方位聚合合,實(shí)現(xiàn)資源的自由流動以及信息和品牌共享的基礎(chǔ)。多樣化組合是指館藏數(shù)字資源盡可能多樣化,在差異的資源之間實(shí)現(xiàn)資源組合的互補(bǔ)性,增強(qiáng)資源的吸引力。創(chuàng)造整體競爭優(yōu)勢,獲得1+1=∞的效果;共生環(huán)境是共生單元以外的一切影響因素的總和,是共生關(guān)系存在發(fā)展的外生條件。館藏數(shù)字資源聚合的共生環(huán)境是指為促進(jìn)數(shù)字資源聚合所推出的政策、投入的資金、制定的制度以及建立的機(jī)制等。
4.長尾理論。館藏數(shù)字資源的長尾現(xiàn)象表現(xiàn)在10%的資源占全館90%資源使用率,80%的讀者只利用了全館20%的資源等。資源聚合對長尾現(xiàn)象不能采用傳統(tǒng)的“取頭截尾”做法,因?yàn)樘幵诜植己竺娴?0%的資源以其龐大的總量對總體起著不可低估的作用,完全忽略是不合理的。為了不丟棄“尾部”,長尾理論主張應(yīng)有盡有,但考慮成本、空間等限制,做到數(shù)字資源完全聚合是不可能的。權(quán)威數(shù)據(jù)庫收集的資源雖然多,但價格昂貴。既然做不到“全盤照收”,根據(jù)長尾理論對尾部信息總量優(yōu)勢的重要性論斷,[1]資源聚合要從中提取有用的知識,努力做到信息提煉“簡而不漏”,即簡化信息但不丟失重要信息。
5.認(rèn)知語言學(xué)理論。認(rèn)知語言學(xué)是一門研究語言的普遍原則和人的認(rèn)知規(guī)律之間關(guān)系的語言學(xué)流派,主要研究領(lǐng)域包括認(rèn)知語義學(xué)和認(rèn)知語法。將認(rèn)知語言學(xué)作為館藏資源聚合語義化理論體系中的一部分,是因?yàn)檎Z義化的目標(biāo)是希望機(jī)器能夠識別人們說話的深層語義,而不是字義,認(rèn)知語言學(xué)則提供了從字、詞開始解剖的語義。它涉及概念結(jié)構(gòu)、語義結(jié)構(gòu)、語義表征、語義構(gòu)建、體驗(yàn)性、概念化這6個概念,這6個概念完整地體現(xiàn)了館藏資源聚合語義化的全過程,即構(gòu)建概念、構(gòu)建關(guān)系、構(gòu)建概念關(guān)系、形式化。[2]也就是說,認(rèn)知語言學(xué)理論為館藏資源聚合語義化構(gòu)建過程提供了理論基礎(chǔ)。
6.評價學(xué)理論。評價學(xué)是一門實(shí)踐科學(xué),其理論體系包括基于學(xué)科(針對評價學(xué)本身)的理論體系、基于應(yīng)用(針對評價學(xué)的應(yīng)用領(lǐng)域)的理論體系和基于過程的理論體系。而這三種理論正好貫穿于館藏數(shù)字資源聚合的全過程,因?yàn)橐淮瓮暾木酆线^程至少需要經(jīng)過資源分類效果是否良好、資源提取效果是否良好、資源關(guān)聯(lián)效果是否良好、聚合形式效果是否良好4次評價過程,每一次評價都需要設(shè)計一套評價體系,即為館藏數(shù)字資源聚合質(zhì)量評價方案。而后進(jìn)行的評價信息收集、評價結(jié)果分析、評價過程控制,只需按照評價學(xué)基本方法和技術(shù)逐步進(jìn)行即可。[2]因此,評價學(xué)理論為館藏數(shù)字資源聚合質(zhì)量提供了理論保障。
按照聚合過程數(shù)字資源再組織動態(tài)演化所體現(xiàn)出的資源因需而由大變小、語義化程度由弱到強(qiáng)、形態(tài)在語法、語義和語用之間轉(zhuǎn)化、不同知識單元之間的多元化關(guān)聯(lián)、關(guān)聯(lián)的方式是直接的還是間接的、是顯現(xiàn)的還是潛在的等特征,[4]館藏數(shù)字資源聚合主要方法理論如下:
1.網(wǎng)絡(luò)分析方法理論。網(wǎng)絡(luò)分析的目標(biāo)是用機(jī)器來處理海量資源,最終形成一個資源關(guān)聯(lián)的強(qiáng)強(qiáng)網(wǎng)絡(luò),基本原理是讓計算機(jī)能夠理解資源,解決計算機(jī)與讀者間的資源溝通問題。館藏資源聚合的最終目的也是實(shí)現(xiàn)網(wǎng)絡(luò)分析,因此,網(wǎng)絡(luò)分析資源組織原理是館藏資源聚合最核心的理論。按照此理論,可將資源網(wǎng)絡(luò)看成是由知識單元(知識關(guān)聯(lián)網(wǎng)絡(luò)中的知識節(jié)點(diǎn))、知識關(guān)聯(lián)(知識節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系)、知識群落(依據(jù)關(guān)聯(lián)關(guān)系劃分的知識單元的集合,而不同知識群落之間的交叉關(guān)聯(lián)則構(gòu)成多維立體的知識關(guān)聯(lián)網(wǎng)絡(luò)體系)構(gòu)成的三元組。網(wǎng)絡(luò)分析法在聚合過程中主要是圍繞資源網(wǎng)絡(luò)的中心性、群聚性、關(guān)聯(lián)性三個維度展開。中心性主要用于衡量節(jié)點(diǎn)在整個資源網(wǎng)絡(luò)中的地位和影響力;群聚性主要用于實(shí)現(xiàn)節(jié)點(diǎn)分類和定位,用于資源網(wǎng)絡(luò)結(jié)構(gòu)和層級劃分;關(guān)聯(lián)性主要用于判斷資源網(wǎng)絡(luò)節(jié)點(diǎn)間關(guān)系以及節(jié)點(diǎn)的重要程度。[9]通過這三個維度,將不同資源的關(guān)聯(lián)特征或不同資源間建立的網(wǎng)絡(luò)進(jìn)行整合、提取,并按讀者的需求組織資源,主要體現(xiàn)在以館藏數(shù)字資源的內(nèi)、外部特征(如關(guān)鍵詞、作者、主題、出版機(jī)構(gòu))為基礎(chǔ),通過作者互引關(guān)系分析、作者合作關(guān)系分析、作者-關(guān)鍵詞分析等關(guān)系分析,[10]實(shí)現(xiàn)相關(guān)資源的聚合。
2.分眾分類方法理論。分眾分類法是“以讀者為中心基于大眾一致意見而產(chǎn)生的分類體系”,用戶依據(jù)知識結(jié)構(gòu)、情感體驗(yàn)、個人喜好等賦予數(shù)字資源特征標(biāo)識,研究人員通過標(biāo)識規(guī)范、統(tǒng)計和聚類等挖掘數(shù)字資源之間的關(guān)聯(lián)關(guān)系,從而擴(kuò)大讀者標(biāo)注和檢索的范圍。分眾分類法的主體主要是互聯(lián)網(wǎng)普通讀者,在數(shù)字資源聚合過程中,用戶不需要借助專業(yè)人員、技術(shù)或工具的幫助,就可獨(dú)立完成數(shù)字資源聚合任務(wù)。分眾分類法“以讀者為中心”,從三個維度“讀者、資源和標(biāo)簽”對資源進(jìn)行劃分,采用標(biāo)簽過濾技術(shù)、標(biāo)簽分類技術(shù)、標(biāo)簽推薦技術(shù),依托R語言、Wordle、tagCloud發(fā)生器、ImageChef等工具,[4]實(shí)現(xiàn)數(shù)字資源的再組織與聚合。
3.計量學(xué)方法理論。計量學(xué)包括文獻(xiàn)計量學(xué)、信息計量學(xué)、知識計量學(xué)。文獻(xiàn)計量是利用數(shù)理統(tǒng)計等方法對相關(guān)文獻(xiàn)的數(shù)量特征進(jìn)行統(tǒng)計,通過數(shù)據(jù)描述的方式揭示文獻(xiàn)資源的分布特征及變化規(guī)律的定性和定量相結(jié)合的數(shù)字資源聚合方法。[4]信息計量學(xué)是采用數(shù)學(xué)、統(tǒng)計學(xué)等各種定量方法,對資源信息在交流過程中的信息進(jìn)行組織、存儲、分布、傳遞、利用等定量描述和統(tǒng)計;知識計量學(xué)是對知識存量和流量、知識分配與轉(zhuǎn)移、知識生產(chǎn)和應(yīng)用、知識投入和產(chǎn)出、知識價值和價格等方面進(jìn)行的計量研究。[2]館藏數(shù)字資源聚合過程,需要多次用到計量學(xué)理論和方法。文獻(xiàn)是館藏資源的一種,文獻(xiàn)計量學(xué)的研究對象就是文獻(xiàn),館藏資源聚合的對象同樣包括文獻(xiàn),這種聯(lián)系造成了文獻(xiàn)計量學(xué)成為館藏資源聚合的一部分。用信息計量學(xué)方法得到的詞頻、著者數(shù)、出版者數(shù)、被引頻次等測度數(shù)字,也是館藏資源聚合能夠使用的量化結(jié)果。用知識計量學(xué)方法得到的資源深層語義信息和信息之間的定量關(guān)系,則是館藏資源聚合時可利用的重要內(nèi)容。可見,在館藏數(shù)字資源聚合過程中,計量學(xué)的理論和方法為聚合提供的不僅僅是聚合的對象,還提供了定量資源關(guān)系的確切方法和手段,為館藏資源的深度聚合提供了量化支撐。
4.本體方法理論。本體是指對共享概念模型的規(guī)范化、形式化和明確化的說明,其強(qiáng)調(diào)領(lǐng)域中的本質(zhì)概念以及概念之間的關(guān)聯(lián)關(guān)系。[4]在本體中,概念之間、實(shí)例對象之間存在著各種復(fù)雜語義關(guān)系,如等級關(guān)系、等同關(guān)系、相似關(guān)系、相關(guān)關(guān)系、互操作關(guān)系等。通過對不同領(lǐng)域的資源集合構(gòu)建領(lǐng)域本體,利用語義映射機(jī)制實(shí)現(xiàn)異構(gòu)資源和系統(tǒng)之間的語義關(guān)聯(lián),就可以實(shí)現(xiàn)異構(gòu)的、不同類型資源的深度聚合[9]。本體是構(gòu)建數(shù)字資源關(guān)聯(lián)最理想的方法之一。
5.關(guān)聯(lián)數(shù)據(jù)分析方法理論。關(guān)聯(lián)數(shù)據(jù)是指共享、連接各類數(shù)據(jù)、信息和知識的一種資源組織方式,它克服了本體的領(lǐng)域局限性,實(shí)現(xiàn)了各類數(shù)據(jù)的無縫鏈接。其本質(zhì)在于為各類分布的、異構(gòu)的數(shù)據(jù)建立語義關(guān)聯(lián),[9]表現(xiàn)為:基于機(jī)構(gòu)資源的關(guān)聯(lián)、基于學(xué)者資源的關(guān)聯(lián)、基于主題資源的關(guān)聯(lián)、基于知識資源的關(guān)聯(lián)、基于文獻(xiàn)資源的關(guān)聯(lián)、基于讀者需求資源的關(guān)聯(lián)以及研究主體(機(jī)構(gòu)學(xué)者等)、研究客體(主題知識點(diǎn))、研究載體(文獻(xiàn)、期刊)交叉資源的關(guān)聯(lián)等。這些關(guān)聯(lián),從單一維度到多元維度,使得數(shù)字資源再組織的新體系能夠根據(jù)讀者不同的資源需求設(shè)定出與之相適應(yīng)的維度[4],拓寬了傳統(tǒng)意義上資源再組織的視角,更易滿足讀者的多樣化需求。它在對分布式異構(gòu)資源進(jìn)行組織、集成、關(guān)聯(lián)并提供關(guān)聯(lián)訪問的同時,為館藏數(shù)字資源聚合提供了得天獨(dú)厚的優(yōu)勢。
6.共現(xiàn)分析方法理論。共現(xiàn)分析理論是一種時空相關(guān)分析方法,是采用定量化的方法來分析資源中因特征項的共同出現(xiàn)所產(chǎn)生的文獻(xiàn)之間的內(nèi)容關(guān)聯(lián)。一般而言,共現(xiàn)的特征項之間一定存在著某種關(guān)聯(lián),關(guān)聯(lián)程度可用共現(xiàn)頻次來測度。通過共現(xiàn)分析可以從多個維度挖掘和揭示隱含在資源中的各類知識信息單元的內(nèi)容關(guān)聯(lián)和邏輯關(guān)聯(lián)。共現(xiàn)分析通常包括共詞分析、耦合分析、同被引分析和合作分析等。目前,研究較多的是二重共現(xiàn),即兩個文獻(xiàn)特征項的共現(xiàn)。[9]如果將共現(xiàn)現(xiàn)象擴(kuò)展到三重或者更多,則其揭示的關(guān)聯(lián)關(guān)系和邏輯聯(lián)系會更加豐富,其價值也會更大。
聚合的方法需要與之匹配技術(shù)作支持,主要的技術(shù)理論如下:
1.關(guān)聯(lián)數(shù)據(jù)發(fā)布技術(shù)理論。關(guān)聯(lián)數(shù)據(jù)發(fā)布技術(shù)是一種先進(jìn)且簡單易行的數(shù)據(jù)組織與發(fā)布技術(shù),技術(shù)優(yōu)勢是:統(tǒng)一資源標(biāo)識符;標(biāo)識名稱標(biāo)準(zhǔn)化;提供標(biāo)準(zhǔn)格式的有用信息;提供相互關(guān)聯(lián)的標(biāo)識名稱。[3]此技術(shù)是實(shí)現(xiàn)館藏數(shù)字資源聚合中書目數(shù)據(jù)關(guān)聯(lián)化、資源關(guān)聯(lián)服務(wù)、關(guān)聯(lián)結(jié)構(gòu)化查詢、資源智能檢索等聚合的關(guān)鍵技術(shù)。
2.語義聚焦爬蟲技術(shù)理論。此技術(shù)分為資源目標(biāo)的定義和描述、策略的分析與制定、頁面語義標(biāo)注和分析三步完成。首先以事先遴選好的URL作為種子樣本來決定爬行的起點(diǎn),從而達(dá)到對爬蟲為發(fā)現(xiàn)新目標(biāo)頁面URL而進(jìn)行漫游的深度控制和引導(dǎo)。其次采用傳統(tǒng)的深度優(yōu)先、廣度優(yōu)先和啟發(fā)式搜索等策略,對提取到的URL列表進(jìn)行鏈接排序和下載,得到不含任何語義關(guān)聯(lián)信息的數(shù)據(jù)和相關(guān)的元數(shù)據(jù)。最后對得到的資源進(jìn)行分析和分類,從語義化的網(wǎng)頁或文件格式中如URL文件、OWL文件、XTM文件、XML文件、嵌入相關(guān)語義標(biāo)記如RDFa、Microdata的HTML和XHTML文件中提取和分離出語義標(biāo)注信息。常采用的方法是編寫自定義的解析程序或者采用語義分離器RDF API等。對非語義化標(biāo)注的網(wǎng)頁文檔,則通過一些自動化語義標(biāo)注軟件或人工輔助標(biāo)注方式補(bǔ)充語義信息,[11]實(shí)現(xiàn)對獲取到相關(guān)實(shí)體數(shù)據(jù)和元數(shù)據(jù)語義標(biāo)注的完善,最終根據(jù)語義標(biāo)注信息完成發(fā)現(xiàn)新知識的資源聚合。
3.網(wǎng)頁抓取技術(shù)理論。由于館藏數(shù)字資源主要以網(wǎng)頁的形式存在,所以頁面資源的抓取至關(guān)重要。網(wǎng)頁抓取主要是html頁面的抓取和分析,配合htmlconnector即網(wǎng)頁連接器一起使用,抓取雙層鏈接并保存頁面內(nèi)容。常見的抓取方法有三種,一是url地址中包含分頁信息;二是通過asp.net開發(fā)的網(wǎng)站分頁控件,通過post方式提交分頁信息到后臺代碼;三是翻頁過程中找不到頁碼信息,[12]只能用代碼模擬手動翻頁,然后抓取。
4.索引技術(shù)理論。索引技術(shù)貫穿于資源聚合的整個過程,包括結(jié)構(gòu)索引和內(nèi)容索引。結(jié)構(gòu)索引:以網(wǎng)頁中的頁面和鏈接作為索引的節(jié)點(diǎn)和邊的有向圖,有了節(jié)點(diǎn)和邊的有向圖就可以對超鏈接創(chuàng)建索引。內(nèi)容索引:內(nèi)容索引主要是web頁面的文本資源,[12]是在資源挖掘時查詢內(nèi)容相關(guān)度的主要方法。
5.語義網(wǎng)技術(shù)理論。語義網(wǎng)技術(shù)是解決數(shù)字資源語義描述、構(gòu)建資源之間語義關(guān)聯(lián)關(guān)系的技術(shù)。館藏數(shù)字資源聚合所涉及的語義網(wǎng)技術(shù)主要包括語義描述標(biāo)準(zhǔn)和本體。語義描述標(biāo)準(zhǔn)規(guī)定了網(wǎng)絡(luò)資源的語義描述方式,為資源間的聚合提供了統(tǒng)一的語義接口,包括 RDF、RDFS等模式,SKOS、LCSH等公共詞表以及XML、OWL等置標(biāo)語言。本體主要用于對館藏內(nèi)外部資源進(jìn)行語義重組,其中,對內(nèi)部資源進(jìn)行語義描述的本體有 MarcOnt、BIBO、OAI-ORE、FRBR等。對外部資源進(jìn)行語義描述的本體有FOAF、EVENT、DBpedia Ontology等。[13]
6.聚合機(jī)制技術(shù)理論。館藏數(shù)字資源聚合機(jī)制技術(shù)主要包括數(shù)據(jù)倉庫聚合機(jī)制技術(shù)、封裝器聚合機(jī)制技術(shù)、A-gent聚合機(jī)制技術(shù)等。數(shù)據(jù)倉庫聚合機(jī)制技術(shù)是將海量的館藏網(wǎng)絡(luò)數(shù)字資源按主題、學(xué)科的方式建模并存儲在同一數(shù)據(jù)倉庫內(nèi)進(jìn)行集中管理,從而將分散異構(gòu)數(shù)據(jù)庫進(jìn)行無縫鏈接,剔除相關(guān)數(shù)據(jù)庫內(nèi)的重復(fù)信息后,給讀者提供一站式地訪問館藏數(shù)字資源的平臺。此技術(shù)是一種物理集成的聚合技術(shù),它通過一致的方式將異質(zhì)異構(gòu)的資源統(tǒng)一集中存儲起來,有利于實(shí)施更加深人、復(fù)雜的數(shù)據(jù)挖掘、資源發(fā)現(xiàn)等資源聚合;封裝器聚合機(jī)制技術(shù)是一種虛擬的資源聚合技術(shù),此技術(shù)無需真正存儲需要聚合資源,同時又能很好地解決資源聚合問題,它能克服異質(zhì)異構(gòu)資源難以集中存儲的不利因素,以統(tǒng)一的形式將聚合過的結(jié)果提供給讀者,更加適應(yīng)館藏數(shù)字資源信息量大、更新快等特點(diǎn),[14]它是目前提高館藏數(shù)字資源聚合質(zhì)量的主流技術(shù);Agent聚合機(jī)制技術(shù)是將聚合框架中的主要功能模塊封裝為A-gent的技術(shù),主要有讀者A-gent技術(shù)、資源Agent技術(shù)和代理方Agent技術(shù)三種。讀者Agent技術(shù)負(fù)責(zé)維護(hù)讀者信息、方便讀者與聚合系統(tǒng)進(jìn)行交互,資源Agent技術(shù)將信息資源按照聚合系統(tǒng)的表示形式進(jìn)行描述和轉(zhuǎn)換,代理方Agent技術(shù)負(fù)責(zé)將從讀者Agent發(fā)出的查詢請求與所要查詢的資源Agent進(jìn)行匹配,各Agent之間進(jìn)行通信、交互和合作,使聚合系統(tǒng)能更加適應(yīng)館藏數(shù)字資源異構(gòu)性及分布性的特點(diǎn),從而有效地實(shí)現(xiàn)資源聚合[14]。可見,以Agent作為核心模塊,可以增強(qiáng)館藏數(shù)字資聚合的靈活性。
聚合模式是使資源以什么樣的方式呈現(xiàn),它解決的是資源的采集與處理(資源問題)、資源基礎(chǔ)設(shè)施(技術(shù)問題)、資源分析與應(yīng)用(利用問題)三個核心問題。聚合模式包括多層次、多類型、多方式,主要有以下幾種:
1.資源超網(wǎng)絡(luò)語義聚合模式。超網(wǎng)絡(luò)是由多個網(wǎng)絡(luò)關(guān)聯(lián)而成的網(wǎng)絡(luò),它可以同時描述同質(zhì)事物以及異質(zhì)事物間的聯(lián)系。由于館藏數(shù)字資源是由多個網(wǎng)絡(luò)關(guān)聯(lián)(超網(wǎng)絡(luò))而成的資源,因而可運(yùn)用超網(wǎng)絡(luò)聚合模式,對資源中涉及的人、知識、載體之間的語義關(guān)系(等級關(guān)系、屬性關(guān)系、等同關(guān)系、相關(guān)關(guān)系、引用關(guān)系、論述關(guān)系等)進(jìn)行分析,形成基于語義關(guān)系的數(shù)字資源聚合模式。此模式從下至上分為基礎(chǔ)層、描述層、聚合層和應(yīng)用層共4個層次,基礎(chǔ)層是各種類型的文獻(xiàn)數(shù)據(jù)、知識數(shù)據(jù)和讀者數(shù)據(jù),此層利用自動化語義標(biāo)注系統(tǒng)進(jìn)行自動標(biāo)注,從中提取人、知識、載體等知識要素信息;描述層主要實(shí)現(xiàn)對不同類型的數(shù)字資源及知識要素的結(jié)構(gòu)化描述和存儲,采用XML語言描述數(shù)字資源超網(wǎng)絡(luò)中各節(jié)點(diǎn)和要素間的語義關(guān)系,方便計算機(jī)之間的互操作和搜索引擎細(xì)粒度化的查找與匹配;聚合層通過語義關(guān)系提取,對數(shù)字資源超網(wǎng)絡(luò)中人、知識和載體要素,從等級關(guān)系、等同關(guān)系、屬性關(guān)系、相關(guān)關(guān)系、引用關(guān)系、論述關(guān)系等語義關(guān)系角度進(jìn)行關(guān)聯(lián)映射和資源聚合;應(yīng)用層面向終端讀者,讀者通過簡潔的檢索界面輸入查詢項,系統(tǒng)自動分析查詢項并進(jìn)行語義計算和匹配,以可視化的方式將計算結(jié)果輸出,[15]同時給出供讀者控制的參數(shù)選項,方便讀者調(diào)整和優(yōu)化檢索結(jié)果。
2.資源類型聚合模式。此模式包括數(shù)據(jù)聚合、信息聚合、知識聚合。數(shù)據(jù)聚合是對異質(zhì)異構(gòu)數(shù)據(jù)庫資源在邏輯上或物理上有機(jī)地集中,提供統(tǒng)一的表示和操作,以解決多種異構(gòu)數(shù)據(jù)資源的互聯(lián)與共享。它分為網(wǎng)格聚合、跨庫檢索聚合、中介模式聚合三種方式;信息聚合是通過一定的標(biāo)準(zhǔn)和技術(shù)實(shí)現(xiàn)異構(gòu)異質(zhì)資源信息物理或邏輯上的集中與互聯(lián)互通,實(shí)現(xiàn)多種資源的“一站式”檢索,但并沒有對資源對象之間的關(guān)系進(jìn)行有效揭示和組織;知識聚合則是對資源中的內(nèi)在概念及概念之間的關(guān)系進(jìn)行表征。本體技術(shù)的發(fā)展,為知識聚合提供了強(qiáng)有力的工具,本體是知識聚合的核心。[16]知識聚合是資源聚合的高級階段,也是資源聚合的最終目標(biāo)。
3.資源作者合作聚合模式。此方式是通過對某一領(lǐng)域內(nèi)資源作者合作進(jìn)行分析,揭示該領(lǐng)域內(nèi)的研究團(tuán)體、核心作者以及研究的主題。分為作者合作關(guān)系聚合和機(jī)構(gòu)合作關(guān)系聚合。作者合作關(guān)系聚合是把相關(guān)作者的知識信息聚合在一起,用網(wǎng)絡(luò)分析法分析資源作者之間的關(guān)系,揭示資源網(wǎng)絡(luò)中的主要成員和個體之間的復(fù)雜關(guān)系;機(jī)構(gòu)合作關(guān)系聚合是利用網(wǎng)絡(luò)分析法對相關(guān)資源信息進(jìn)行挖掘。把具有合作關(guān)系的機(jī)構(gòu)確認(rèn)網(wǎng)絡(luò)的節(jié)點(diǎn),在此基礎(chǔ)上確定資源機(jī)構(gòu)合作的關(guān)系,構(gòu)造機(jī)構(gòu)合作的矩陣,對所呈現(xiàn)的機(jī)構(gòu)合作網(wǎng)絡(luò)進(jìn)行相應(yīng)的分析,[17]聚合成一個相互聯(lián)系而產(chǎn)生不同影響的機(jī)構(gòu)資源網(wǎng)絡(luò)。此模式能夠揭示作者合作交流的資源信息,向讀者提供更加精準(zhǔn)、全面的信息。
4.資源元數(shù)據(jù)互操作模式。元數(shù)據(jù)互操作方式有:映射、復(fù)用與集成、互操作協(xié)議、關(guān)聯(lián)數(shù)據(jù)等。映射是指兩個元數(shù)據(jù)標(biāo)準(zhǔn)的元素之間直接轉(zhuǎn)換,通過一對一、一對多、多對一及多對多等多種映射方式解決語義互換及統(tǒng)一檢索問題;復(fù)用與集成:當(dāng)映射模式無法有效滿足已賦值的元數(shù)據(jù)互操作需求時,就需要借助復(fù)用與集成等方式實(shí)現(xiàn)不同文化機(jī)構(gòu)的元數(shù)據(jù)記錄的整合。復(fù)用與集成的實(shí)現(xiàn)途徑以METS和RDF兩種方式為主、多種方式并用;互操作協(xié)議:要實(shí)現(xiàn)對參建機(jī)構(gòu)分布式異構(gòu)平臺的跨庫檢索,可以借助元數(shù)據(jù)互操作協(xié)議方式來實(shí)現(xiàn)。目前被廣泛應(yīng)用的元數(shù)據(jù)互操作協(xié)議有OAI-PMH,Z39.50,ZING等;關(guān)聯(lián)數(shù)據(jù):關(guān)聯(lián)數(shù)據(jù)是將數(shù)字資源的每個元素用RDF三元組的形式表示,聚合時只需在兩個系統(tǒng)的元數(shù)據(jù)之間建立匹配點(diǎn),[18]實(shí)現(xiàn)不同數(shù)據(jù)集之間的關(guān)聯(lián),實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的元數(shù)據(jù)互操作。
5.資源選題聚合模式。資源選題聚合模式是針對資源某一領(lǐng)域內(nèi)的選題進(jìn)行聚合,包括多題選做、專題精做、舊題新做、一題多做。多題選做是對資源選題進(jìn)行取舍,“取”哪些與讀者需求相契合、有傳承價值、學(xué)術(shù)價值的資源選題?!吧帷蹦男┡c讀者需求相背離、一般性的、重復(fù)性的平庸化資源選題;專題精做是實(shí)施精品戰(zhàn)略,在資源選題的精度和深度上狠下功夫,集中優(yōu)勢力量對某個專業(yè)領(lǐng)域的資源選題進(jìn)行精耕細(xì)作,打造出一批不可被替代的或替代程度很低的資源,從而獲得“人無我有,人有我精”的資源獨(dú)特競爭優(yōu)勢;舊題新做是回頭看,聚合挖掘舊的資源選題,賦予舊資源以新意義,使其重新煥發(fā)出活力和生命力,贏得讀者的認(rèn)可;一題多做是以資源聚合為依托,對同一資源選題進(jìn)行不同媒介形式如網(wǎng)頁、影品、游戲互動、專業(yè)數(shù)據(jù)庫等方向的延伸開發(fā),[19]形成資源選題的多次開發(fā)、多媒體互動發(fā)展的綜合效應(yīng)。
在大數(shù)據(jù)和云計算背景下,館藏數(shù)字資源突破了傳統(tǒng)的資源整合、集成等研究局限,出現(xiàn)了突破和創(chuàng)新,向數(shù)字資源的聚合方向發(fā)展,因而其理論發(fā)展也凸顯出超越性。
1.聚合理論的引進(jìn)與本土化研究的結(jié)合。資源聚合的出現(xiàn),雖然帶有很深的西方移植痕跡,但其發(fā)展的方向是本土化研究,因而學(xué)者對西方研究成果的引進(jìn),是在在系統(tǒng)總結(jié)西方主要聚合理論的基礎(chǔ)上,結(jié)合中國的實(shí)際,引進(jìn)了西方一些諸如聚合資源說、聚合資源關(guān)系說、聚合資源差異說等資源聚合理論研究成果,并指出這些理論的共性在于:視資源聚合為一種現(xiàn)存的狀況。其差異性在于:對資源聚合概念的理解、對資源聚合對象的把握與資源聚合的價值取向等方面存在分歧與差異。引進(jìn)理論與土化研究的有機(jī)結(jié)合是館藏數(shù)字資源聚合理論發(fā)展超越的關(guān)鍵所在。
2.聚合理論新理念的出現(xiàn)與研究視覺的創(chuàng)新。館藏數(shù)字資源聚合是一種主觀體驗(yàn)、社會制度、現(xiàn)實(shí)狀態(tài)和理想追求,是大數(shù)據(jù)時代特有的現(xiàn)象。隨著研究的不斷深入,出現(xiàn)了理論創(chuàng)新:社會資本理論。由大數(shù)據(jù)時代引發(fā)而出現(xiàn)的社會資本新理論,將館藏數(shù)字資源聚合理論融入了一個全新理念。該理論從新的角度引導(dǎo)館藏數(shù)字資源聚合理論研究的新內(nèi)容,出現(xiàn)了諸如資源聚合成本節(jié)約、資源聚合信任、資源聚合嵌入等理論研究新視野;生產(chǎn)組織形式理論。館藏數(shù)字資源聚合不僅僅是一種資源重組織現(xiàn)象,更是一種社會生產(chǎn)組織形式。我們知道,一種新的社會生產(chǎn)組織形式的產(chǎn)生和發(fā)展,必然帶來整個社會整體結(jié)構(gòu)和觀念的變遷。筆者認(rèn)為,館藏數(shù)字資源聚合正是這樣一種新的社會生產(chǎn)組織形式,它需要更寬廣的理論作支撐;負(fù)面影響理論。目前對館藏數(shù)字資源聚合的論述幾乎都是正面的,對于它的負(fù)面影響關(guān)注不夠,這是不正夠的。因此,未來研究需要拓展廣度和深度,明確聚合理論的發(fā)展與館藏數(shù)字資源聚合之間是否存在著負(fù)面影響,如果存在,存在的條件是什么、具體的作用機(jī)制是什么、理論依據(jù)又是什么。[6]這些問題有待于以后進(jìn)一步研究。
3.聚合理論催生性的凸顯。由聚合理論創(chuàng)新引導(dǎo)的館藏數(shù)字資源聚合,由于其具有的特殊性,將催生一批適應(yīng)館藏數(shù)字資源聚合發(fā)展的專業(yè)技術(shù)人才,如資源數(shù)據(jù)分析師、圖書數(shù)據(jù)分析師等。分析師的出現(xiàn),將館藏數(shù)字資源聚合從基礎(chǔ)性分析、推測性分析提高到更加成熟的預(yù)測性分析上。推測性分析是根據(jù)資源的連貫性、概率性、相關(guān)類推原則等對資源發(fā)展進(jìn)行定性推測,目前館藏數(shù)字資源聚合大多采用這種定性推測。預(yù)測性分析則是分析館藏數(shù)字資源集合以識別其趨勢,并通過建立模型進(jìn)行預(yù)測,發(fā)現(xiàn)資源之間的相關(guān)關(guān)系,[20]從而準(zhǔn)確預(yù)測資源發(fā)展方向,及時為聚合提供解決問題方案。
4.聚合理論相關(guān)性的超越。盡管館藏數(shù)字資源聚合涉及很多理論,但這些理論并不是孤立的指導(dǎo)資源聚合,他們之間有相關(guān)性。“相關(guān)性”是指兩個或者兩個以上變量的取值之間存在某種規(guī)律性。這就是說,如果找到某個現(xiàn)象的良好關(guān)聯(lián)物,相關(guān)關(guān)系就可以幫助我們捕捉現(xiàn)在和預(yù)測未來。這種通過洞察細(xì)理論之間相關(guān)性的分析方法,為館藏數(shù)字資源聚合理論打開了一扇新窗戶。按照這樣的思路,未來館藏資源聚合可以在常規(guī)理論指導(dǎo)下,結(jié)合理論之間的相關(guān)關(guān)系,從原有的靜態(tài)理論指導(dǎo)向動態(tài)理論拓展,提供更加精準(zhǔn)的理論跟蹤。[20]聚合理論的相關(guān)性將成為今后館藏數(shù)字資源聚合理論研究的新領(lǐng)域,它能幫助我們走出對直覺、經(jīng)驗(yàn)、常規(guī)邏輯推斷、因果關(guān)系分析等傳統(tǒng)思維路徑的依賴,將思維拓展飛躍到從眾多指導(dǎo)館藏數(shù)字資源聚合理論中不斷發(fā)現(xiàn)新指導(dǎo)理論的視野。
館藏數(shù)字資源聚合理論,不僅引領(lǐng)著聚合的路徑和發(fā)展方向,而且在其實(shí)踐研究中呈現(xiàn)出理論整合與理論創(chuàng)新,形成新的理論研究領(lǐng)域,指導(dǎo)館藏數(shù)字資源聚合形態(tài)豐富多彩,立體化多層面地為讀者提供多角度多層次服務(wù)。本文在學(xué)者研究的基礎(chǔ)上,對館藏數(shù)字資源聚合的理論體系進(jìn)行了分析與構(gòu)建,旨在為其理論研究的繼續(xù)和深入提供新思路、新視角,真正將館藏數(shù)字資源聚合的理論研究推向多學(xué)科、多領(lǐng)域、多維度、多視角、多方法的交叉融合。本文只是初步研究的嘗試,相信隨著學(xué)者研究的深入,館藏數(shù)字資源聚合理論的研究必將出現(xiàn)質(zhì)的飛躍。
[1]牛奉髙.數(shù)字文獻(xiàn)資源高維聚合模型研究[D].武漢:武漢大學(xué), 2014.
[2]樓雯館.藏資源語義化理論體系研究[J].圖書館學(xué)研究,2015,(2): 35-40.
[3]陳德容.基于關(guān)聯(lián)數(shù)據(jù)的圖書館數(shù)據(jù)發(fā)布及數(shù)據(jù)服務(wù)[J].圖書館工作與研究,2015,(2):25-27,43.
[4]畢強(qiáng),尹長余,滕廣青等.數(shù)字資源聚合的理論基礎(chǔ)及其方法體系建構(gòu)[J].情報科學(xué),2015,33(1):9-14,24.
[5]賀興,艾芊,余志文等.電力生態(tài)系統(tǒng)視角下的電網(wǎng)演變及電力系統(tǒng)聚合理論[J].電力系統(tǒng)保護(hù)與控制,2014,42(22):100-107.
[6]劉學(xué)平.理論視野內(nèi)多類型集群圖書館發(fā)展的理性認(rèn)識[J].圖書館理論與實(shí)踐,2012,(2):52-57.
[7]肖希明,李碩.信息集群理論和公共數(shù)字文化資源整合[J].圖書館,2015,(1):1-4,11.
[8]董淵,孫紅莉,程結(jié)晶.基于共生理論的高校數(shù)字化教學(xué)資源共享策略研究[J].南昌教育學(xué)院學(xué)報,2014,(4):52-55.
[9]陳蘭杰,侯鵬娟.數(shù)字文獻(xiàn)資源關(guān)聯(lián)關(guān)系揭示方法研究[J].圖書館,2015,(2):41-45.
[10]王雨.基于社會網(wǎng)絡(luò)分析的數(shù)字圖書館資源聚合研究[D].長春:吉林大學(xué),2014.
[11]王思麗,劉巍,祝忠明等.語義化的知識資源發(fā)現(xiàn)方法探析[J].圖書館學(xué)研究,2014,(9):2-6.
[12]許微.基于知識發(fā)現(xiàn)機(jī)制的企業(yè)決策支持系統(tǒng)構(gòu)建研究[D].湖南:湘潭大學(xué),2013.
[13]劉曉娟,黃海晶,尤斌.語義網(wǎng)技術(shù)在圖書館數(shù)字資源深度聚合中的應(yīng)用[J].圖書館雜志,2015,(6):76-82.
[14]伏琰.基于云計算的數(shù)字資源整合技術(shù)研究[J].農(nóng)業(yè)圖書情報學(xué)刊,2015,27(4):21-24.
[15]畢強(qiáng),王傳清,李潔.基于語義的數(shù)字資源超網(wǎng)絡(luò)聚合研究[J].情報科學(xué),2015,33(3):8-12.
[16]肖希明,唐義.國外多領(lǐng)域數(shù)字資源整合研究進(jìn)展[J].中國圖書館學(xué)報,2013,(4):26-35.
[17]李星星.館藏資源深度聚合及應(yīng)用研究[D].武漢:華中師范大學(xué)信息管理學(xué)院,2013.
[18]肖希明,田蓉.國外公共數(shù)字文化資源整合的現(xiàn)狀與發(fā)展趨勢[J].國家圖書館學(xué)刊,2014,(5):48-56.
[19]周乾隆.中小出版社選題資源整合四種模式[N].中國新聞出版報,2015-04-01(4).
[20]吳敏慧.大數(shù)據(jù)與圖書館信息服務(wù)新構(gòu)想[J].圖書館理論與實(shí)踐,2015,(2):14-16.
On the Theoretical System of Library Digital Resources Aggregation
Liu Xue-ping
(Library of Weifang University,Weifang 261061)
Study on Library Digital Resources aggregation theory aims to,form a complete theoretical system,and provide strongguidance for the practice of polymerization.Byanalyzingthe concept ofthe collection ofdigital resources,conceptual framework,concept theoryfrommulti discipline perspective,we think the collection ofdigital resources should be basicallyguided bysharingtheory,cluster theory,symbiosis theory,the longtail theory,cognitive linguistics theory and evaluation theory,use etwork analysis method,theory of classification method,theory of measurement method,ontology method theory,correlation data analysis method and the theory of Co-occurrence analysis method for theoretical analysis tools,and be supported byFusion elated data publishingtheory,semantic focused crawler theory,web crawling theory,index theory,semantic web theory,and aggregation mechanism theory,so as to put the theory of aggregation pattern such as resource super network semantic pattern,resource type mode,resource author cooperation mode,resource metadata interoperabilitymodel,resource selection model intopractice and tohighlight theoretical introduction and localization,newideas and research on the theoryofnewvision,theoretical birth and correlation theoretical transcendence ofdevelopment.
collection ofdigital resources;aggregation theory;theoretical development
G251
A
1671-4288(2016)03-0111-06
責(zé)任編輯:孫延波
2016-04-23
山東省社科規(guī)劃項目“數(shù)字圖書館資源語義關(guān)聯(lián)可視化實(shí)現(xiàn)研究”(15CTQJ01);山東省文化廳項目“圖書館服務(wù)公共數(shù)字文化的創(chuàng)新模式研究”(1506327);濰坊市科學(xué)技術(shù)發(fā)展計劃軟科學(xué)項目“生態(tài)理念下濰坊文化生態(tài)發(fā)展路徑研究”(項目號:2015RKX049)階段性成果。
劉學(xué)平(1964-),男,山東諸城人,濰坊學(xué)院圖書館副研究館員。