關(guān)系搜索引入圖書館檢索服務(wù)的可行性分析

2019-12-20 08:47:30盛艾

卷宗 2019年33期

關(guān)鍵詞：引入

盛艾

摘要：本文首先基于現(xiàn)有的關(guān)系搜索產(chǎn)品來對關(guān)系搜索的基本理念進(jìn)行了討論。其次，重點從圖書館檢索服務(wù)引入關(guān)系搜索后可以產(chǎn)生的良好效果著手，探究了關(guān)系搜索引入圖書館檢索服務(wù)的可行性，最后基于當(dāng)前圖書館檢索當(dāng)中運用關(guān)系搜索可能存在的問題，思考了如何引入關(guān)系搜索。

關(guān)鍵詞：關(guān)系搜索;圖書館檢索服務(wù);引入

基金項目：本文系國家社科基金藝術(shù)學(xué)項目“音樂色彩通感可視化和交互藝術(shù)研究”（項目編號：16BF088）研究成果

本文系中國美術(shù)學(xué)院項目“藝術(shù)（設(shè)計）學(xué)科國際學(xué)術(shù)文獻(xiàn)資源置備策略與檢索應(yīng)用引導(dǎo)研究”編號（900036351784/053）研究成果。

書籍是傳承人類知識的重要途徑，在新世紀(jì)由于進(jìn)入數(shù)字時代，傳統(tǒng)意義上的圖書館也走向了數(shù)字圖書館，圖書館的信息資源服務(wù)模式發(fā)生了非常巨大的變化，當(dāng)然也因為數(shù)字化造成圖書館的信息檢索服務(wù)面臨著巨大的挑戰(zhàn)。海量的藏書乃至海量的數(shù)字化圖書如何檢索是一個值得思考的問題。

1 關(guān)系搜索

所謂關(guān)系搜索是通過搜索引擎關(guān)鍵字組合搜索并獲得特定對象間關(guān)系的一種搜索方法。比如人立方搜索引擎，這個是典型的關(guān)系搜索引擎。只需要在人立方搜索中給出一個關(guān)鍵詞，比如姚明，瞬間就可以給出姚明的關(guān)系網(wǎng)絡(luò)，在這個關(guān)系網(wǎng)絡(luò)當(dāng)中甚至有李宇春（因為在網(wǎng)絡(luò)上出現(xiàn)過這么一個調(diào)侃的網(wǎng)絡(luò)語——人都說李宇春是姚明的妹妹）。所以關(guān)系搜索也可以叫人肉搜索，大部分關(guān)系搜索引擎的最主要功能都是搜人，隨便輸入一個人物，進(jìn)入搜索，里面就有關(guān)于該人物的關(guān)系網(wǎng)絡(luò)、網(wǎng)頁、咨詢、簡介等等，甚至功能強大的能夠連很多隱私的內(nèi)容都能展示出來。當(dāng)然這其中的真假不好評論。因為關(guān)系搜索本質(zhì)還是一種自動的搜索網(wǎng)頁，其信息來源多數(shù)都是網(wǎng)站的新聞報道，社區(qū)論壇、博客連接等等，只要一個人曾經(jīng)在網(wǎng)絡(luò)上評論過某個名人，就有極大的可能被自動搜索到，不管這個人和某個名人的關(guān)系是否是真的。這跟搜索引擎的基礎(chǔ)技術(shù)、爬蟲技術(shù)有關(guān)，爬蟲技術(shù)說白了就是一種信息抓取技術(shù)，而抓取的信息通常來自互聯(lián)網(wǎng)的一些公開的知名網(wǎng)站。當(dāng)然關(guān)系搜索與百度這些不同的地方就在于關(guān)系搜索基本都是用來搜索人與人之間的關(guān)系的。

以人立方來論相關(guān)研究指出該搜索引擎是通過算法自動計算出人名、地名以及一些其他名稱的關(guān)系的可能性，并且自動抓取出來，形成一個社會關(guān)系圖景，在這一社會關(guān)系圖景當(dāng)中包含有人物、地點、機構(gòu)等關(guān)鍵的信息要素，人立方將人物作為信息檢索的邏輯起點，然后用算法來給抓取到相關(guān)信息進(jìn)行級別分類，組建索引目錄并保存下來，然后在關(guān)系圖景當(dāng)中將搜索對象的相關(guān)信息之間的關(guān)系展示出來。

關(guān)系搜索實際上相當(dāng)于是一種關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘，用海量的數(shù)據(jù)來支撐關(guān)聯(lián)規(guī)則，用數(shù)學(xué)上的概念來論，即非空集合X和非空集合Y不相交，假設(shè)X->Y，那么兩個非空集合可以構(gòu)筑一條關(guān)聯(lián)規(guī)則。在這個規(guī)則當(dāng)中如果明確了置信度、支持度以及提升度，則可以確定有用的數(shù)據(jù)。

2 圖書館檢索服務(wù)應(yīng)用關(guān)系搜索的可行性

圖書館檢索服務(wù)應(yīng)用關(guān)聯(lián)搜索實際上可行的，而且可以極大地改善圖書館的檢索服務(wù)。

首先關(guān)聯(lián)搜索可以為讀者提供全新的閱讀服務(wù)方式。在數(shù)字時代，圖書館也已經(jīng)基本形成了一種關(guān)系搜索的形式，但在關(guān)系搜索當(dāng)中主要提供的是書籍作者的一些基本信息，缺少對文字內(nèi)容的索引，相對來說關(guān)系搜索還比較狹隘。而隨著數(shù)字圖書館的推進(jìn)，現(xiàn)在一個圖書館當(dāng)中的藏書包括數(shù)字化的文獻(xiàn)資料是海量的，尤其是數(shù)字化資源更是遠(yuǎn)遠(yuǎn)超過圖書館的館藏。那么為讀者提供更加好的閱讀體驗，將關(guān)系搜索引入進(jìn)來，將眾多文獻(xiàn)的創(chuàng)作者、文獻(xiàn)的部分內(nèi)容、文獻(xiàn)來源以及關(guān)聯(lián)的相關(guān)信息等等利用起來，可以為讀者提供更加便捷的信息查閱途徑。

其次，關(guān)系搜索可以增加讀者閱讀資料時的信息獲取途徑?，F(xiàn)在大部分圖書館的信息獲取途徑都可以利用檢索系統(tǒng)來完成，包括書籍文獻(xiàn)資料查閱、借閱以及歸還大部分情況下都可以利用檢索系統(tǒng)來完成。但目前圖書館所使用的檢索系統(tǒng)大部分都是目錄檢索系統(tǒng)，即給予書籍或文獻(xiàn)資料一個文件號，該文件號包含館藏的具體位置信息、借閱信息等。但是大部分資料都是獨立的，讀者只能不斷嘗試使用不同的關(guān)鍵詞來進(jìn)行檢索新的信息，從便捷性上來說要差一些。因此如果可以通過引入關(guān)系搜索，想必可以將圖書館的檢索變得更加便捷，可增強用戶體驗。

再次，關(guān)系搜索可以為圖書館的檢索服務(wù)提供全文識別的便捷途徑，依托圖書館的資源，可以文獻(xiàn)的全部信息進(jìn)行分析，包括題名、創(chuàng)作者、機構(gòu)等等，只需要一個關(guān)鍵詞就可以知曉幾乎所有與文獻(xiàn)資料有關(guān)的信息。這種方式實現(xiàn)的是基于內(nèi)容的檢索，是對圖書館檢索系統(tǒng)簡單的目錄檢索的一種突破。在關(guān)系搜索的幫助下，可以形成以人為邏輯起點的檢索關(guān)系圖，在這個關(guān)系圖當(dāng)中所有的信息一目了然。引入關(guān)系搜索后，人物關(guān)系圖可以讓更多的文獻(xiàn)資料展示出來，比如人物所有的著作，其所在機構(gòu)的人物在相同研究領(lǐng)域所作出的研究成果，研究所參考的一些文獻(xiàn)資料等等，當(dāng)文獻(xiàn)被引用到其他相似研究中，關(guān)系圖隨之變化。

最后，關(guān)系圖的形成非常有助于相似研究圈的形成，圈子這個概念在任何一個領(lǐng)域都是存在的，互聯(lián)網(wǎng)上尤其強調(diào)圈子。圖書館檢索服務(wù)引入關(guān)系搜索，可以促進(jìn)研究圈子的形成，同一個領(lǐng)域的作者會因為關(guān)系搜索而匯聚在一個圈子當(dāng)中，為讀者提供更加多維度，更小力度的研究知識。而圈子當(dāng)中所形成的研究成果，基本上就可以算是一個領(lǐng)域的知識體系。

3 圖書館檢索服務(wù)應(yīng)用關(guān)系搜索需要解決的問題

3.1 去娛樂化

圖書館的檢索主要是建立在館藏上的，用戶如果需要圖書館檢索服務(wù)，對信息的準(zhǔn)確性有客觀的要求，不管是查閱紙質(zhì)的資料還是查閱數(shù)字資源都要求搜索出來的結(jié)果具有真實性，準(zhǔn)確性。特別是對于需要數(shù)字資源的用戶，一般所需求的搜索結(jié)果基本上都是研究成果、文獻(xiàn)資料，在關(guān)系搜索中還需要將這些研究成果和文獻(xiàn)資料所引用的相似文獻(xiàn)展示出來，進(jìn)而讓用戶可以獲得更多的資源。因此在圖書館檢索服務(wù)當(dāng)中引入關(guān)系搜索關(guān)鍵一點是要去娛樂化。

3.2 信息真實性

對于普通網(wǎng)民而言，其在網(wǎng)絡(luò)上所使用的關(guān)系搜索具有更強的娛樂性，所搜索得出的人物關(guān)系是否真實以及關(guān)系的密切度需要考證，對于用戶而言需要自己去考慮和判斷搜索結(jié)果的真實性。因為互聯(lián)網(wǎng)上的關(guān)系搜索以人為節(jié)點，信息來源通常都是網(wǎng)絡(luò)上的新聞、微博微信等等，它需要分析海量的數(shù)據(jù)來找出人與人之間的復(fù)雜社會關(guān)系，但是因為現(xiàn)在技術(shù)的局限性，并不能真實的呈現(xiàn)出一個人的關(guān)系狀態(tài)，特別是人名重復(fù)這個問題，現(xiàn)階段如何解決同命不同人這一問題還是比較難的一個問題。

3.3 全文識別難點

目前來說，關(guān)系搜索還是一個比較新的理念，在圖書館檢索服務(wù)當(dāng)中要引入關(guān)系搜索，關(guān)鍵點是要實現(xiàn)全文識別，這樣才能保證關(guān)系搜索能夠發(fā)揮出應(yīng)有價值。但是目前要完成館藏資源全文識別，技術(shù)、人員、設(shè)備等方面都存在很多阻礙需要解決。

上述幾個問題不解決，圖書館檢索服務(wù)單純引入關(guān)系搜索可能會出現(xiàn)水土不服的現(xiàn)象，所以為了更好地發(fā)揮關(guān)系搜索的作用，先期可以考慮現(xiàn)在人名和人名關(guān)系比較集中的部分來應(yīng)用關(guān)系搜索，比如題名、作者、作者單位、文獻(xiàn)摘要、文獻(xiàn)關(guān)鍵詞及參考文獻(xiàn)等，應(yīng)當(dāng)可以在初期取得一定的效果。

4 圖書館檢索服務(wù)引入關(guān)系搜索的思考

按上文給出的應(yīng)用思路，圖書館在辦理讀書卡時已經(jīng)掌握了一定讀者的信息，而且每一位辦理了讀書卡的讀者都有一個唯一的身份標(biāo)識，而這個標(biāo)識在圖書館檢索服務(wù)當(dāng)中可以作為關(guān)系搜索的基礎(chǔ)，只要讀者用身份標(biāo)識認(rèn)證登錄圖書館網(wǎng)站，圖書館檢索服務(wù)系統(tǒng)就可以根據(jù)該身份標(biāo)識下讀者的閱讀喜好（一般需要讀者長期使用，由系統(tǒng)判定讀者的文獻(xiàn)檢索歷史和閱讀行為進(jìn)而構(gòu)建出讀者個人的閱讀信息庫）來推送相應(yīng)的文獻(xiàn)資料。

在圖書館的服務(wù)當(dāng)中也應(yīng)當(dāng)由此進(jìn)行一定的創(chuàng)新，為讀者提供更為多樣性的服務(wù)，構(gòu)建讀者檔案庫后，圖書館人員可以更加方便地了解讀者的閱讀信息，將這一檔案庫作為原始數(shù)據(jù)庫，利用數(shù)據(jù)挖掘、數(shù)據(jù)分析等歸納某一類讀者的閱讀行為特點，打造一個閱讀圈子，進(jìn)而提供有針對性的服務(wù)。比如說歸納了一類喜好進(jìn)店閱讀的讀者，那么就根據(jù)讀者在圖書館中留下的信息記錄來分析他們的閱讀行為，進(jìn)而可以有目的地打造經(jīng)典閱讀室，并結(jié)合讀者閱讀時間以及地點來進(jìn)行針對性服務(wù)。

5 結(jié)束語

綜上所述，關(guān)系搜索以人為邏輯節(jié)點，尋找的是人與人之間的社會關(guān)系。讀者也是人，利用關(guān)系搜索來優(yōu)化圖書館檢索服務(wù)應(yīng)當(dāng)具有可行性和必要性。但因為目前關(guān)系搜索受技術(shù)所限，在圖書館檢索服務(wù)當(dāng)中運用可能會出現(xiàn)水土不服，所以目前還應(yīng)進(jìn)一步思考如何去利用關(guān)系搜索。

參考文獻(xiàn)

[1]劉忠寶，賈君枝，趙文娟，等.數(shù)字圖書館跨媒體檢索技術(shù)研究[J].圖書館論壇，2014，（12）：94-97，封3.

[2]周佳駿.數(shù)字文獻(xiàn)中特殊實體的增強型WEB搜索引擎模型[J].圖書館論壇，2013，33（2）：111-115.

[3]封麗，胡曉輝，沈軍威，等.圖書館知識共享模型構(gòu)建研究[J].情報探索，2015，（12）：119-122.

[4]申曉娟，李丹，王秀香，等.略論圖書館資源整合與檢索系統(tǒng)的發(fā)展——以國家圖書館“文津”搜索系統(tǒng)為例[J].圖書情報工作，2013，57（18）：38-43，60.