李志明
(九江學(xué)院,332005)
信息爆炸時(shí)代,優(yōu)良的文獻(xiàn)搜索系統(tǒng)可使文獻(xiàn)信息有序化,方便用戶快速、準(zhǔn)確找到所需信息,無論是對信息服務(wù)提供者,還是用戶,都至關(guān)重要。讀秀學(xué)術(shù)搜索與文津搜索系統(tǒng)就是文獻(xiàn)信息搜索系統(tǒng)中的佼佼者。兩者有效地整合了豐富的文獻(xiàn)類型,收錄了海量的元數(shù)據(jù),提供了多途徑的文獻(xiàn)獲取方式,檢索快速、準(zhǔn)確、全面。為了用戶更好地使用文獻(xiàn)信息搜索系統(tǒng),也為了開發(fā)者更好地完善文獻(xiàn)信息搜索系統(tǒng),本文對這兩種文獻(xiàn)信息搜索系統(tǒng)做了詳細(xì)的比較研究。
讀秀學(xué)術(shù)搜索系統(tǒng)(以下簡稱“讀秀”)是由海量全文數(shù)據(jù)及元數(shù)據(jù)組成的超大型數(shù)據(jù)庫。其以260萬種中文圖書、10億頁全文資料為基礎(chǔ),為用戶提供深入內(nèi)容的章節(jié)和全文檢索,部分文獻(xiàn)的原文試讀,以及高效查找、獲取各種文獻(xiàn)類型學(xué)術(shù)資源的一站式檢索,周到的參考咨詢服務(wù),是一個(gè)真正意義上的學(xué)術(shù)搜索引擎及文獻(xiàn)服務(wù)平臺(tái)[1]。
文津搜索系統(tǒng)(以下簡稱“文津”)是國家數(shù)字圖書館的資源搜索門戶,也是數(shù)字資源服務(wù)利用的集中體現(xiàn)。該系統(tǒng)整合了國家圖書館和地方圖書館的眾多數(shù)字資源,匯聚60多個(gè)資源庫、近2億條數(shù)據(jù)的海量文獻(xiàn)信息。建立了分布式索引,提供了一個(gè)高效的、擁有良好用戶體驗(yàn)且精準(zhǔn)權(quán)威的元數(shù)據(jù)統(tǒng)一搜索平臺(tái),讀者通過它對各類資源進(jìn)行“一站式”檢索,可快速地獲取到所需內(nèi)容,享受到便捷的應(yīng)用服務(wù)。支持在線閱讀和分享功能,用戶可以根據(jù)個(gè)人權(quán)限,瀏覽更多的信息。通過登錄認(rèn)證,為讀者提供多種個(gè)性化服務(wù),包括查看檢索歷史、設(shè)定搜索習(xí)慣等,使檢索更具個(gè)人特色[2]。
名稱 讀秀文津內(nèi)容搜索類型、搜索框、熱門關(guān)鍵詞、圖書被引用情況報(bào)告(2012)、把讀秀設(shè)為主頁、聯(lián)系我們、網(wǎng)上客服、用戶反饋、常見問題、使用幫助、使用感受、首頁、服務(wù)中心、退出搜索類型、搜索框、高級(jí)檢索、整合檢索、搜索熱詞榜、國圖首頁、個(gè)人中心、登錄、注冊、意見反饋、幫助
首頁面是否簡潔、明了、友好,影響到搜索系統(tǒng)是否受讀者青睞。讀秀與文津首頁都是簡潔、明了的一站式檢索系統(tǒng),都有熱門關(guān)鍵詞。但讀秀有十大熱門關(guān)鍵詞,而文津搜索熱詞榜不僅按日、周、總有不同的十大熱門關(guān)鍵詞,還有十大熱點(diǎn)閱讀、十大人氣資源庫、關(guān)鍵詞云圖。兩者在友好性方面都有使用幫助等服務(wù),但讀秀有網(wǎng)上在線客服,可即時(shí)解決讀者使用過程中的問題,還有視頻講解演示和PPT演示,形象生動(dòng),前者友好性更勝一籌。
名稱 讀秀文津文獻(xiàn)類型及其分類知識(shí)、圖書、期刊、報(bào)紙、電子書、講座、專利、標(biāo)準(zhǔn)、視頻、人物、詞條、詞典、學(xué)位論文、會(huì)議論文、課程、文檔、考試輔導(dǎo)、博客、論壇、網(wǎng)頁、圖片、電影、音樂、新聞、虛擬咨詢?nèi)俊D書、古文獻(xiàn)、論文、期刊報(bào)紙、多媒體、縮微文獻(xiàn)、文檔、詞條
文獻(xiàn)信息搜索系統(tǒng)的文獻(xiàn)類型是否豐富,關(guān)系到讀者檢索結(jié)果是否豐富、全面。兩者都收錄了圖書、期刊、報(bào)紙、學(xué)位論文、會(huì)議論文、文檔、詞條、圖片、音頻、視頻,前者還收錄了專利、標(biāo)準(zhǔn)、人物、課程、考試輔導(dǎo)、博客、論壇、網(wǎng)頁、新聞,后者則收錄了圖書中的古代圖書和縮微文獻(xiàn)。
分類方面,讀秀有25個(gè)一級(jí)分類類目,沒有二級(jí)類目,有交叉,更切合讀者的使用習(xí)慣;而文津分為9個(gè)一級(jí)類目,19個(gè)二級(jí)類目,也有交叉,但相對專業(yè)。
名稱 讀秀文津內(nèi)容 單條件檢索、二次檢索、高級(jí)檢索、專業(yè)檢索、聚合檢索、相關(guān)檢索單條件檢索、二次檢索、高級(jí)檢索、聚合檢索、相關(guān)檢索、整合檢索
兩者都有單條件檢索、二次檢索、高級(jí)檢索、聚合檢索、相關(guān)檢索等方式,此外,前者有專業(yè)檢索,適合專業(yè)人員使用,后者有整合檢索,對所有館藏文獻(xiàn)進(jìn)行了梳理、展示和整合。
檢索項(xiàng)的多少關(guān)系到對文獻(xiàn)信息的揭示程度,也關(guān)系到讀者的檢索效果,即讀者掌握的文獻(xiàn)的相關(guān)信息與檢索項(xiàng)的匹配程度及讀者的選擇度。兩者對收錄不同的文獻(xiàn)類別所提供的檢索項(xiàng)不同,下邊對兩者收錄相同類型文獻(xiàn)的檢索項(xiàng)進(jìn)行比較。
4.2.1 初級(jí)檢索
讀秀文津圖書 全部字段、書名、作者、主題詞、叢書名、目次 全部字段、題名、責(zé)任者、關(guān)鍵詞、出版商、ISSBN期刊 全部字段、標(biāo)題、作者、刊名、關(guān)鍵詞、作者單位 全部字段、題名、責(zé)任者、關(guān)鍵詞、刊名報(bào)紙 全部字段、標(biāo)題、作者、來源、全文、關(guān)鍵詞 全部字段、題名、責(zé)任者、關(guān)鍵詞、報(bào)紙名學(xué)位論文 全部字段、標(biāo)題、作者、授予單位、關(guān)鍵詞、導(dǎo)師 全部字段、題名、責(zé)任者、關(guān)鍵詞會(huì)議論文 全部字段、標(biāo)題、作者、關(guān)鍵詞、會(huì)議名稱 全部字段、題名、責(zé)任者、關(guān)鍵詞文檔 全部、DOC、PDF、PPT、XLS、TXT、其他格式 全部字段、題名、發(fā)布者、關(guān)鍵詞、責(zé)任者詞條 全部字段 全部字段、題名多媒體 全部字段、視頻名稱、簡介、字幕、關(guān)鍵詞 全部字段、題名、責(zé)任者、出版商、關(guān)鍵詞
兩者收錄所有文獻(xiàn)類型都有全部字段,即檢索詞可以出現(xiàn)在任何檢索項(xiàng),可以滿足沒有任何檢索知識(shí)或檢索目的不明確的用戶。圖書方面,兩者都有書名、作者,前者還有主題詞、叢書名、目次,后者有關(guān)鍵詞、出版商、ISSBN,前者體現(xiàn)出了規(guī)范和搜索深入的特點(diǎn),后者更符合用戶使用習(xí)慣。期刊方面,兩者都有標(biāo)題、作者、刊名、關(guān)鍵詞,前者還有作者單位。報(bào)紙方面,兩者都有題名、責(zé)任者、關(guān)鍵詞、報(bào)紙名,前者還有全文。學(xué)位論文方面,兩者都有題名、責(zé)任者、關(guān)鍵詞,前者還有授予單位、導(dǎo)師。會(huì)議論文方面,兩者都有題名、責(zé)任者、關(guān)鍵詞,前者還有會(huì)議名稱。文檔方面,前者選擇不同文檔格式,在任意檢索項(xiàng)內(nèi)搜索,沒有具體的檢索項(xiàng),而后者有題名、發(fā)布者、關(guān)鍵詞、責(zé)任者。詞條方面,前者沒有具體檢索項(xiàng),而后者有題名。多媒體方面,兩者都有題名、關(guān)鍵詞,前者還有簡介、字幕,后者還有責(zé)任者、出版商。由此可見,在初級(jí)檢索的檢索項(xiàng)上,讀秀相對豐富,但文津也有自己特點(diǎn)。另外,兩者在選擇檢索項(xiàng)后,前者有檢索項(xiàng)與檢索詞的精確和模糊兩種匹配模式可供選擇,而后者沒有。
4.2.2 高級(jí)檢索
讀秀文津圖書 書名、作者、主題詞、出版社、ISBN、分類、中圖分類號(hào)、出版年期刊 全部字段、標(biāo)題、作者、刊名、關(guān)鍵詞、作者單位、內(nèi)容摘要、年期全部字段、題名、責(zé)任者、關(guān)鍵詞、出版商、ISSBN、出版年全部字段、題名、責(zé)任者、關(guān)鍵詞、刊名、年報(bào)紙 全部字段、篇名、副篇名、作者、來源、日期范圍 全部字段、題名、責(zé)任者、關(guān)鍵詞、報(bào)紙名、年學(xué)位論文 全部字段、標(biāo)題、作者、關(guān)鍵詞、授予單位、年度 全部字段、題名、責(zé)任者、關(guān)鍵詞、年會(huì)議論文 全部字段、標(biāo)題、作者、關(guān)鍵詞、會(huì)議名稱、年 全部字段、題名、責(zé)任者、關(guān)鍵詞、年
兩者都有高級(jí)檢索方式的文獻(xiàn)類型有圖書、期刊、報(bào)紙、學(xué)位論文、會(huì)議論文。對各類型文獻(xiàn)的檢索項(xiàng)進(jìn)行比較:圖書類,兩者都有書名、作者、出版社、ISBN、出版年,前者還有主題詞、分類及中圖分類號(hào),后者則有關(guān)鍵詞。期刊類,兩者都有標(biāo)題、作者、刊名、關(guān)鍵詞、年,前者還有作者單位、內(nèi)容摘要、期。報(bào)紙類,兩者都有題名、責(zé)任者、報(bào)紙名、年,前者還有副題名、日期,后者有關(guān)鍵詞。學(xué)位論文類,兩者都有標(biāo)題、作者、關(guān)鍵詞、年度,前者還有授予單位。會(huì)議論文類,兩者都有題名、作者、關(guān)鍵詞、年,前者還有會(huì)議名稱。綜上,在高級(jí)檢索的檢索項(xiàng)上,讀秀比較豐富,揭示文獻(xiàn)信息更全面。
4.2.3 高級(jí)檢索邏輯組配關(guān)系及添加檢索項(xiàng)的數(shù)量
讀秀文津圖書期刊報(bào)紙學(xué)位論文會(huì)議論文只有邏輯與的組配關(guān)系,最多8個(gè)檢索項(xiàng)組配有邏輯或與非組配關(guān)系,最多7個(gè)檢索項(xiàng)組配有邏輯或與非組配關(guān)系,最多三個(gè)檢索項(xiàng)組配有邏輯或與非組配關(guān)系,最多5個(gè)檢索項(xiàng)組配
高級(jí)檢索能提高檢索的效率,即提高查全率和查準(zhǔn)率,檢索效率的高低取決于檢索系統(tǒng)的邏輯組配關(guān)系及組配檢索項(xiàng)的數(shù)量。圖書類,讀秀只有邏輯與組配關(guān)系,有8個(gè)檢索項(xiàng)可供選擇,期刊有邏輯或與非3種組配關(guān)系,最多7個(gè)檢索項(xiàng)選擇,報(bào)紙、學(xué)位論文、會(huì)議論文有邏輯或與非3種組配關(guān)系,最多5個(gè)檢索項(xiàng)選擇,而文津所有文獻(xiàn)類型都有邏輯或與非的組配關(guān)系,最多可3個(gè)檢索項(xiàng)組配。前者檢索項(xiàng)更豐富,檢索效率會(huì)大大提高,后者則相對較弱。
聚類方式是縮小檢索范圍的一種方式,使檢索結(jié)果更精準(zhǔn)。兩者無論什么文獻(xiàn)類型都有年代的聚合方式。讀秀根據(jù)文獻(xiàn)的特點(diǎn)有相對應(yīng)的聚合方式,文津所有文獻(xiàn)的聚合方式都是一樣的,但有前者所沒有的全文聚合、語種聚合、來源數(shù)據(jù)庫聚合。
名稱 讀秀文津圖書 類型、年代、學(xué)科、作者期刊 類型、年代、學(xué)科、期刊刊名報(bào)紙 年代、報(bào)紙名學(xué)位論文 年代、學(xué)位授予單位、學(xué)位級(jí)別、學(xué)科會(huì)議論文 年代、學(xué)科指定類型、全文、年份、著者、語種、來源數(shù)據(jù)庫
在文獻(xiàn)詳細(xì)信息方面,兩者差不多,但各有特點(diǎn)。讀秀更趨向讀者的閱讀習(xí)慣,信息相對單薄;文津系統(tǒng)相對專業(yè)性強(qiáng),信息更豐富。如圖書類,兩者都有封面頁、題名、作者、頁數(shù)、出版地、出版社、出版時(shí)間、ISBN、中圖分類號(hào)、提要、獲取方式、相關(guān)資源信息,前者還有價(jià)格、主題詞、分類名稱、參考文獻(xiàn)格式、試讀、評(píng)論信息,后者則有來源數(shù)據(jù)庫、分享到、關(guān)鍵詞、語種、版本、目次、延伸檢索信息;期刊類,兩者都有篇名、作者、刊名、年期、頁碼、ISSN、分享到、相關(guān)資源(本期的其它文章、相關(guān)文章、本周熱門文章)、獲取途徑信息,前者還有參考文獻(xiàn)格式信息,后者則有來源數(shù)據(jù)庫、關(guān)鍵詞、語種、中圖分類號(hào)、延伸檢索信息。
另外,兩者雖都有相關(guān)資源、獲取方式、分享到信息,但其中包括的具體內(nèi)容是不一樣的,前者的相關(guān)資源特指某一類文獻(xiàn)范圍內(nèi)的,而后者指本搜索系統(tǒng)所包含的所有類型文獻(xiàn);前者獲取全文的方式有本館電子全文在線閱讀或下載、文獻(xiàn)傳遞、相似文檔下載、按需印刷、文獻(xiàn)互助、館際互借、推薦購買、在線試讀等方式,后者只有文獻(xiàn)傳遞與在線閱讀方式;前者可以將檢索記錄信息分享到55種網(wǎng)絡(luò)媒體上,而后者只能分享到新浪微博和騰訊微博上。
作為文獻(xiàn)信息搜索系統(tǒng),讀者使用的最終目的是在線閱讀或下載所需全文,因此,僅有好的檢索功能還不能滿足讀者需求,更需要與圖書館的各種資源系統(tǒng),如OPAC及各種電子圖書數(shù)據(jù)庫進(jìn)行無縫對接,實(shí)現(xiàn)電子圖書與紙質(zhì)圖書的互查。目前實(shí)現(xiàn)的只是從信息搜索系統(tǒng)到OPAC的鏈接,沒有實(shí)現(xiàn)OPAC到文獻(xiàn)信息搜索系統(tǒng)的鏈接,電子圖書也只實(shí)現(xiàn)了與本公司的對接,并且數(shù)據(jù)更新是人工的,不是兩個(gè)系統(tǒng)無縫對接。與各種期刊、報(bào)紙、學(xué)位論文、會(huì)議論文、標(biāo)準(zhǔn)、專利等電子資源數(shù)據(jù)庫,目前也只實(shí)現(xiàn)了單向鏈接,滿足不了讀者檢索其他數(shù)據(jù)庫中相類似的數(shù)據(jù)。在這方面,讀秀與文津系統(tǒng)都要做很大的改進(jìn)。
為了滿足讀者日益?zhèn)€性化的需求,文獻(xiàn)信息搜索系統(tǒng)應(yīng)該提供按照學(xué)科、作者、興趣愛好、熱詞、年代等特點(diǎn)進(jìn)行檢索結(jié)果或數(shù)據(jù)庫記錄定制,定制之后提供RSS、郵件等方式推送,即使讀者不進(jìn)入本搜索系統(tǒng),也能享受到方便、快捷的服務(wù)。目前,讀秀有收藏和導(dǎo)出檢索結(jié)果功能,文津沒有此功能,兩者在個(gè)性化服務(wù)方面都有很大的改進(jìn)空間。
[1]讀秀學(xué)術(shù)搜索系統(tǒng)[EB/OL].http://www.duxiu.com,2013-08-13.
[2]文津搜索系統(tǒng)[EB/OL].http://find.nlc.gov.cn ,2013-08-13.
[3]李志明.谷歌、百度、讀秀三大中文圖書搜索引擎比較及啟示[J].圖書館工作與研究,2009,(8).