盛艾
摘 要:本文首先基于現(xiàn)有的關(guān)系搜索產(chǎn)品來對關(guān)系搜索的基本理念進(jìn)行了討論。其次,重點從圖書館檢索服務(wù)引入關(guān)系搜索后可以產(chǎn)生的良好效果著手,探究了關(guān)系搜索引入圖書館檢索服務(wù)的可行性,最后基于當(dāng)前圖書館檢索當(dāng)中運用關(guān)系搜索可能存在的問題,思考了如何引入關(guān)系搜索。
關(guān)鍵詞:關(guān)系搜索;圖書館檢索服務(wù);引入
基金項目:本文系國家社科基金藝術(shù)學(xué)項目“音樂色彩通感可視化和交互藝術(shù)研究”(項目編號:16BF088)研究成果
本文系中國美術(shù)學(xué)院項目“藝術(shù)(設(shè)計)學(xué)科國際學(xué)術(shù)文獻(xiàn)資源置備策略與檢索應(yīng)用引導(dǎo)研究”編號(900036351784/053)研究成果。
書籍是傳承人類知識的重要途徑,在新世紀(jì)由于進(jìn)入數(shù)字時代,傳統(tǒng)意義上的圖書館也走向了數(shù)字圖書館,圖書館的信息資源服務(wù)模式發(fā)生了非常巨大的變化,當(dāng)然也因為數(shù)字化造成圖書館的信息檢索服務(wù)面臨著巨大的挑戰(zhàn)。海量的藏書乃至海量的數(shù)字化圖書如何檢索是一個值得思考的問題。
1 關(guān)系搜索
所謂關(guān)系搜索是通過搜索引擎關(guān)鍵字組合搜索并獲得特定對象間關(guān)系的一種搜索方法。比如人立方搜索引擎,這個是典型的關(guān)系搜索引擎。只需要在人立方搜索中給出一個關(guān)鍵詞,比如姚明,瞬間就可以給出姚明的關(guān)系網(wǎng)絡(luò),在這個關(guān)系網(wǎng)絡(luò)當(dāng)中甚至有李宇春(因為在網(wǎng)絡(luò)上出現(xiàn)過這么一個調(diào)侃的網(wǎng)絡(luò)語——人都說李宇春是姚明的妹妹)。所以關(guān)系搜索也可以叫人肉搜索,大部分關(guān)系搜索引擎的最主要功能都是搜人,隨便輸入一個人物,進(jìn)入搜索,里面就有關(guān)于該人物的關(guān)系網(wǎng)絡(luò)、網(wǎng)頁、咨詢、簡介等等,甚至功能強大的能夠連很多隱私的內(nèi)容都能展示出來。當(dāng)然這其中的真假不好評論。因為關(guān)系搜索本質(zhì)還是一種自動的搜索網(wǎng)頁,其信息來源多數(shù)都是網(wǎng)站的新聞報道,社區(qū)論壇、博客連接等等,只要一個人曾經(jīng)在網(wǎng)絡(luò)上評論過某個名人,就有極大的可能被自動搜索到,不管這個人和某個名人的關(guān)系是否是真的。這跟搜索引擎的基礎(chǔ)技術(shù)、爬蟲技術(shù)有關(guān),爬蟲技術(shù)說白了就是一種信息抓取技術(shù),而抓取的信息通常來自互聯(lián)網(wǎng)的一些公開的知名網(wǎng)站。當(dāng)然關(guān)系搜索與百度這些不同的地方就在于關(guān)系搜索基本都是用來搜索人與人之間的關(guān)系的。
以人立方來論相關(guān)研究指出該搜索引擎是通過算法自動計算出人名、地名以及一些其他名稱的關(guān)系的可能性,并且自動抓取出來,形成一個社會關(guān)系圖景,在這一社會關(guān)系圖景當(dāng)中包含有人物、地點、機構(gòu)等關(guān)鍵的信息要素,人立方將人物作為信息檢索的邏輯起點,然后用算法來給抓取到相關(guān)信息進(jìn)行級別分類,組建索引目錄并保存下來,然后在關(guān)系圖景當(dāng)中將搜索對象的相關(guān)信息之間的關(guān)系展示出來。
關(guān)系搜索實際上相當(dāng)于是一種關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘,用海量的數(shù)據(jù)來支撐關(guān)聯(lián)規(guī)則,用數(shù)學(xué)上的概念來論,即非空集合X和非空集合Y不相交,假設(shè)X->Y,那么兩個非空集合可以構(gòu)筑一條關(guān)聯(lián)規(guī)則。在這個規(guī)則當(dāng)中如果明確了置信度、支持度以及提升度,則可以確定有用的數(shù)據(jù)。
2 圖書館檢索服務(wù)應(yīng)用關(guān)系搜索的可行性
圖書館檢索服務(wù)應(yīng)用關(guān)聯(lián)搜索實際上可行的,而且可以極大地改善圖書館的檢索服務(wù)。
首先關(guān)聯(lián)搜索可以為讀者提供全新的閱讀服務(wù)方式。在數(shù)字時代,圖書館也已經(jīng)基本形成了一種關(guān)系搜索的形式,但在關(guān)系搜索當(dāng)中主要提供的是書籍作者的一些基本信息,缺少對文字內(nèi)容的索引,相對來說關(guān)系搜索還比較狹隘。而隨著數(shù)字圖書館的推進(jìn),現(xiàn)在一個圖書館當(dāng)中的藏書包括數(shù)字化的文獻(xiàn)資料是海量的,尤其是數(shù)字化資源更是遠(yuǎn)遠(yuǎn)超過圖書館的館藏。那么為讀者提供更加好的閱讀體驗,將關(guān)系搜索引入進(jìn)來,將眾多文獻(xiàn)的創(chuàng)作者、文獻(xiàn)的部分內(nèi)容、文獻(xiàn)來源以及關(guān)聯(lián)的相關(guān)信息等等利用起來,可以為讀者提供更加便捷的信息查閱途徑。
其次,關(guān)系搜索可以增加讀者閱讀資料時的信息獲取途徑?,F(xiàn)在大部分圖書館的信息獲取途徑都可以利用檢索系統(tǒng)來完成,包括書籍文獻(xiàn)資料查閱、借閱以及歸還大部分情況下都可以利用檢索系統(tǒng)來完成。但目前圖書館所使用的檢索系統(tǒng)大部分都是目錄檢索系統(tǒng),即給予書籍或文獻(xiàn)資料一個文件號,該文件號包含館藏的具體位置信息、借閱信息等。但是大部分資料都是獨立的,讀者只能不斷嘗試使用不同的關(guān)鍵詞來進(jìn)行檢索新的信息,從便捷性上來說要差一些。因此如果可以通過引入關(guān)系搜索,想必可以將圖書館的檢索變得更加便捷,可增強用戶體驗。
再次,關(guān)系搜索可以為圖書館的檢索服務(wù)提供全文識別的便捷途徑,依托圖書館的資源,可以文獻(xiàn)的全部信息進(jìn)行分析,包括題名、創(chuàng)作者、機構(gòu)等等,只需要一個關(guān)鍵詞就可以知曉幾乎所有與文獻(xiàn)資料有關(guān)的信息。這種方式實現(xiàn)的是基于內(nèi)容的檢索,是對圖書館檢索系統(tǒng)簡單的目錄檢索的一種突破。在關(guān)系搜索的幫助下,可以形成以人為邏輯起點的檢索關(guān)系圖,在這個關(guān)系圖當(dāng)中所有的信息一目了然。引入關(guān)系搜索后,人物關(guān)系圖可以讓更多的文獻(xiàn)資料展示出來,比如人物所有的著作,其所在機構(gòu)的人物在相同研究領(lǐng)域所作出的研究成果,研究所參考的一些文獻(xiàn)資料等等,當(dāng)文獻(xiàn)被引用到其他相似研究中,關(guān)系圖隨之變化。
最后,關(guān)系圖的形成非常有助于相似研究圈的形成,圈子這個概念在任何一個領(lǐng)域都是存在的,互聯(lián)網(wǎng)上尤其強調(diào)圈子。圖書館檢索服務(wù)引入關(guān)系搜索,可以促進(jìn)研究圈子的形成,同一個領(lǐng)域的作者會因為關(guān)系搜索而匯聚在一個圈子當(dāng)中,為讀者提供更加多維度,更小力度的研究知識。而圈子當(dāng)中所形成的研究成果,基本上就可以算是一個領(lǐng)域的知識體系。
3 圖書館檢索服務(wù)應(yīng)用關(guān)系搜索需要解決的問題
3.1 去娛樂化
圖書館的檢索主要是建立在館藏上的,用戶如果需要圖書館檢索服務(wù),對信息的準(zhǔn)確性有客觀的要求,不管是查閱紙質(zhì)的資料還是查閱數(shù)字資源都要求搜索出來的結(jié)果具有真實性,準(zhǔn)確性。特別是對于需要數(shù)字資源的用戶,一般所需求的搜索結(jié)果基本上都是研究成果、文獻(xiàn)資料,在關(guān)系搜索中還需要將這些研究成果和文獻(xiàn)資料所引用的相似文獻(xiàn)展示出來,進(jìn)而讓用戶可以獲得更多的資源。因此在圖書館檢索服務(wù)當(dāng)中引入關(guān)系搜索關(guān)鍵一點是要去娛樂化。
3.2 信息真實性
對于普通網(wǎng)民而言,其在網(wǎng)絡(luò)上所使用的關(guān)系搜索具有更強的娛樂性,所搜索得出的人物關(guān)系是否真實以及關(guān)系的密切度需要考證,對于用戶而言需要自己去考慮和判斷搜索結(jié)果的真實性。因為互聯(lián)網(wǎng)上的關(guān)系搜索以人為節(jié)點,信息來源通常都是網(wǎng)絡(luò)上的新聞、微博微信等等,它需要分析海量的數(shù)據(jù)來找出人與人之間的復(fù)雜社會關(guān)系,但是因為現(xiàn)在技術(shù)的局限性,并不能真實的呈現(xiàn)出一個人的關(guān)系狀態(tài),特別是人名重復(fù)這個問題,現(xiàn)階段如何解決同命不同人這一問題還是比較難的一個問題。
3.3 全文識別難點
目前來說,關(guān)系搜索還是一個比較新的理念,在圖書館檢索服務(wù)當(dāng)中要引入關(guān)系搜索,關(guān)鍵點是要實現(xiàn)全文識別,這樣才能保證關(guān)系搜索能夠發(fā)揮出應(yīng)有價值。但是目前要完成館藏資源全文識別,技術(shù)、人員、設(shè)備等方面都存在很多阻礙需要解決。
上述幾個問題不解決,圖書館檢索服務(wù)單純引入關(guān)系搜索可能會出現(xiàn)水土不服的現(xiàn)象,所以為了更好地發(fā)揮關(guān)系搜索的作用,先期可以考慮現(xiàn)在人名和人名關(guān)系比較集中的部分來應(yīng)用關(guān)系搜索,比如題名、作者、作者單位、文獻(xiàn)摘要、文獻(xiàn)關(guān)鍵詞及參考文獻(xiàn)等,應(yīng)當(dāng)可以在初期取得一定的效果。
4 圖書館檢索服務(wù)引入關(guān)系搜索的思考
按上文給出的應(yīng)用思路,圖書館在辦理讀書卡時已經(jīng)掌握了一定讀者的信息,而且每一位辦理了讀書卡的讀者都有一個唯一的身份標(biāo)識,而這個標(biāo)識在圖書館檢索服務(wù)當(dāng)中可以作為關(guān)系搜索的基礎(chǔ),只要讀者用身份標(biāo)識認(rèn)證登錄圖書館網(wǎng)站,圖書館檢索服務(wù)系統(tǒng)就可以根據(jù)該身份標(biāo)識下讀者的閱讀喜好(一般需要讀者長期使用,由系統(tǒng)判定讀者的文獻(xiàn)檢索歷史和閱讀行為進(jìn)而構(gòu)建出讀者個人的閱讀信息庫)來推送相應(yīng)的文獻(xiàn)資料。
在圖書館的服務(wù)當(dāng)中也應(yīng)當(dāng)由此進(jìn)行一定的創(chuàng)新,為讀者提供更為多樣性的服務(wù),構(gòu)建讀者檔案庫后,圖書館人員可以更加方便地了解讀者的閱讀信息,將這一檔案庫作為原始數(shù)據(jù)庫,利用數(shù)據(jù)挖掘、數(shù)據(jù)分析等歸納某一類讀者的閱讀行為特點,打造一個閱讀圈子,進(jìn)而提供有針對性的服務(wù)。比如說歸納了一類喜好進(jìn)店閱讀的讀者,那么就根據(jù)讀者在圖書館中留下的信息記錄來分析他們的閱讀行為,進(jìn)而可以有目的地打造經(jīng)典閱讀室,并結(jié)合讀者閱讀時間以及地點來進(jìn)行針對性服務(wù)。
5 結(jié)束語
綜上所述,關(guān)系搜索以人為邏輯節(jié)點,尋找的是人與人之間的社會關(guān)系。讀者也是人,利用關(guān)系搜索來優(yōu)化圖書館檢索服務(wù)應(yīng)當(dāng)具有可行性和必要性。但因為目前關(guān)系搜索受技術(shù)所限,在圖書館檢索服務(wù)當(dāng)中運用可能會出現(xiàn)水土不服,所以目前還應(yīng)進(jìn)一步思考如何去利用關(guān)系搜索。
參考文獻(xiàn)
[1]劉忠寶,賈君枝,趙文娟,等.數(shù)字圖書館跨媒體檢索技術(shù)研究[J].圖書館論壇,2014,(12):94-97,封3.
[2]周佳駿.數(shù)字文獻(xiàn)中特殊實體的增強型WEB搜索引擎模型[J].圖書館論壇,2013,33(2):111-115.
[3]封麗,胡曉輝,沈軍威,等.圖書館知識共享模型構(gòu)建研究[J].情報探索,2015,(12):119-122.
[4]申曉娟,李丹,王秀香,等.略論圖書館資源整合與檢索系統(tǒng)的發(fā)展——以國家圖書館“文津”搜索系統(tǒng)為例[J].圖書情報工作,2013,57(18):38-43,60.