全文檢索
- 達(dá)夢(mèng)數(shù)據(jù)庫(kù)全文檢索系統(tǒng)研究
的發(fā)展進(jìn)步。全文檢索作為海量信息數(shù)據(jù)庫(kù)中不可缺失的重要檢索技術(shù),不僅幫助用戶在海量信息數(shù)據(jù)庫(kù)上建立起全文索引,還可以幫助用戶快速的對(duì)文本信息進(jìn)行高效的檢索。達(dá)夢(mèng)數(shù)據(jù)庫(kù)是我國(guó)優(yōu)秀的大型高性能數(shù)據(jù)庫(kù)管理系統(tǒng)之一,這款具有完全自主知識(shí)產(chǎn)權(quán)的數(shù)據(jù)庫(kù)系統(tǒng)在高性能、高可用性、高安全性上投入了大量的研究成本。但在此數(shù)據(jù)庫(kù)系統(tǒng)上建立全文索引時(shí)仍存在一些問(wèn)題,如索引膨脹率高,在對(duì)索引進(jìn)行填充時(shí)耗時(shí)較長(zhǎng)等問(wèn)題。全文檢索技術(shù)較為復(fù)雜且綜合性較高,它涉及文本預(yù)處理、文檔解析、分詞
數(shù)碼世界 2020年10期2020-11-16
- 眾創(chuàng)資源分享平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)
:資源分享;全文檢索;智能推薦文章編號(hào):2095-2163(2019)04-0216-05 中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)志碼:A0 引 言信息過(guò)載已經(jīng)成為當(dāng)前互聯(lián)網(wǎng)迅猛發(fā)展中不容忽視的一個(gè)重要問(wèn)題,由此則導(dǎo)致用戶想要精準(zhǔn)獲取資源就顯得尤為困難。在此背景下,本系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)了搜索與推薦兩種資源相關(guān)的服務(wù)。在算法方面,常見的推薦算法主要有基于內(nèi)容的推薦與基于協(xié)同過(guò)濾的推薦。而對(duì)于協(xié)同過(guò)濾推薦算法,又可將其分為3種,即:基于用戶的協(xié)同過(guò)濾、基于物品的協(xié)同過(guò)
智能計(jì)算機(jī)與應(yīng)用 2019年4期2019-09-12
- 文本大數(shù)據(jù)分析技術(shù)在鐵路行車安全領(lǐng)域的應(yīng)用研究
域文本數(shù)據(jù)的全文檢索、特征提取等文本大數(shù)據(jù)分析關(guān)鍵技術(shù)進(jìn)行研究。最后以某鐵路局集團(tuán)公司的事故故障追蹤報(bào)告為樣本,進(jìn)行事故故障報(bào)告的全文檢索、故障詞云展示及關(guān)聯(lián)性分析,取得了良好效果。關(guān)鍵詞:大數(shù)據(jù);非結(jié)構(gòu)化;行車安全;事故故障;全文檢索;文本挖掘引言隨著鐵路信息化的不斷發(fā)展,已相繼建成車、機(jī)、工、電、輛等各專業(yè)安全監(jiān)測(cè)/監(jiān)控系統(tǒng)近60余個(gè),產(chǎn)生和存儲(chǔ)了PB級(jí)的文本、圖紙、視頻、圖像、聲音等多種類型的監(jiān)控/監(jiān)測(cè)數(shù)據(jù)。鐵路安全領(lǐng)域迎來(lái)了大數(shù)據(jù)時(shí)代,由于傳統(tǒng)數(shù)據(jù)
- 企業(yè)網(wǎng)站靜態(tài)頁(yè)面生成與全文檢索技術(shù)研究
成技術(shù)和站內(nèi)全文檢索技術(shù)的原理和實(shí)現(xiàn)方式。[關(guān)鍵詞] 企業(yè)網(wǎng)站;靜態(tài)頁(yè)面生成;全文檢索doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 03. 053[中圖分類號(hào)] TP311? ? [文獻(xiàn)標(biāo)識(shí)碼]? A? ? ? [文章編號(hào)]? 1673 - 0194(2019)03- 0131- 030? ? ? 引? ? 言企業(yè)網(wǎng)站是用戶了解企業(yè)的一個(gè)重要窗口,它可為企業(yè)提供信息發(fā)布、產(chǎn)品宣傳、數(shù)據(jù)采集以及電子商務(wù)等功
中國(guó)管理信息化 2019年3期2019-03-16
- 基于Lucene的全文檢索的研究及實(shí)現(xiàn)
用。關(guān)鍵詞:全文檢索;Lucene;中文分詞;Web實(shí)現(xiàn)中圖分類號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1009-3044(2018)11-0095-03Lucene是一個(gè)開源全文檢索工具包,它具有優(yōu)異的索引結(jié)構(gòu)和良好的系統(tǒng)架構(gòu),提供了靈活的API函數(shù)接口和可以定制的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),以實(shí)現(xiàn)具體的全文檢索功能。Lucene完全由Java JDK開發(fā)而成,沒(méi)有用到任何第三方開發(fā)包,因此,Lucene也具有良好的跨平臺(tái)特性。文章對(duì)Lucene進(jìn)行了研究和分析,以
電腦知識(shí)與技術(shù) 2018年11期2018-07-28
- 基于Lucene的全文檢索的研究及實(shí)現(xiàn)
用。關(guān)鍵詞:全文檢索;Lucene;中文分詞;Web實(shí)現(xiàn)中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)10-0092-03Lucene是一個(gè)開源全文檢索工具包,它具有優(yōu)異的索引結(jié)構(gòu)和良好的系統(tǒng)架構(gòu),提供了靈活的API函數(shù)接口和可以定制的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),以實(shí)現(xiàn)具體的全文檢索功能。Lucene完全由Java JDK開發(fā)而成,沒(méi)有用到任何第三方開發(fā)包,因此,Lucene也具有良好的跨平臺(tái)特性。文章對(duì)Lucene進(jìn)行了研究和分析,以
電腦知識(shí)與技術(shù) 2018年10期2018-06-02
- 實(shí)名制校園安保服務(wù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)
名認(rèn)證技術(shù)和全文檢索技術(shù)設(shè)計(jì)實(shí)現(xiàn)了實(shí)名制校園安保服務(wù)平臺(tái)。經(jīng)測(cè)試,平臺(tái)具有對(duì)校內(nèi)人員的信息管控、校園保衛(wèi)人員的實(shí)時(shí)調(diào)度、安保工作智能管理等功能,信息檢索響應(yīng)速度快,系統(tǒng)安全性能好,適合數(shù)字化校園安全保衛(wèi)建設(shè)需要。關(guān)鍵詞: 校園安保服務(wù);教育電子身份號(hào)(EEID); 實(shí)名認(rèn)證;全文檢索Abstract:Aiming at the problem of the real-name network service requirements and the inf
智能計(jì)算機(jī)與應(yīng)用 2018年2期2018-05-23
- 基于MySQL的中文全文搜索研究
用系統(tǒng)都通過(guò)全文檢索技術(shù)來(lái)提高系統(tǒng)的檢索效率。MySQL5.7.6之后內(nèi)置了n-gram parser全文檢索插件,用來(lái)支持中文分詞,實(shí)現(xiàn)中文全文檢索,能夠支持百萬(wàn)級(jí)數(shù)據(jù)的檢索。該文將針對(duì)全文索引創(chuàng)建的注意事項(xiàng)、中文全文檢索的特點(diǎn)和應(yīng)用進(jìn)行簡(jiǎn)單的介紹。關(guān)鍵詞:n-gram parser;FULLTEXT INDEX;全文檢索中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)32-0007-02全文搜索通常用于基于WEB的應(yīng)用程
電腦知識(shí)與技術(shù) 2017年32期2017-12-15
- 基于Lucene全文檢索技術(shù)的優(yōu)化探討
為優(yōu)秀的開源全文檢索工具已被廣泛應(yīng)用于各種搜索引擎。文章通過(guò)對(duì)全文檢索原理與Lucene工具架構(gòu)的研究,從優(yōu)化內(nèi)存索引、索引壓縮處理、優(yōu)化磁盤索引等方面探討Lucene檢索效率的優(yōu)化。實(shí)驗(yàn)結(jié)果證明,通過(guò)優(yōu)化內(nèi)存索引、索引壓縮處理等方法可以有效地提高全文檢索的效率。關(guān)鍵詞: 全文檢索; Lucene; 倒排索引; 檢索優(yōu)化中圖分類號(hào):TP393.08 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-828(2017)11-16-04Research on the opt
計(jì)算機(jī)時(shí)代 2017年11期2017-11-18
- Oracle數(shù)據(jù)庫(kù)全文檢索性能研究
cle數(shù)據(jù)庫(kù)全文檢索性能研究龔建華(國(guó)防信息學(xué)院,武漢430010)隨著全文檢索應(yīng)用場(chǎng)景越來(lái)越多,更加需要了解數(shù)據(jù)庫(kù)全文檢索的性能。介紹Oracle數(shù)據(jù)庫(kù)全文檢索的設(shè)置方法,然后加載測(cè)試數(shù)據(jù),對(duì)全文檢索和模糊查詢的性能進(jìn)行比對(duì)測(cè)試,最后對(duì)全文檢索的查全能力和查詢速度進(jìn)行詳細(xì)分析。數(shù)據(jù)庫(kù);全文檢索;模糊查詢0 引言隨著信息社會(huì)的不斷發(fā)展,獲取信息比過(guò)去任何時(shí)候都變得更加容易,人們?cè)谂龅揭呻y問(wèn)題時(shí)會(huì)主動(dòng)查詢信息,查詢信息的頻率比過(guò)去高出了很多倍。生產(chǎn)生活中涌現(xiàn)
現(xiàn)代計(jì)算機(jī) 2016年27期2016-10-29
- 基于公安業(yè)務(wù)的全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
于公安業(yè)務(wù)的全文檢索系統(tǒng)能夠有效地滿足這個(gè)需求。文章首先對(duì)全文檢索技術(shù)進(jìn)行簡(jiǎn)要的介紹,對(duì)業(yè)務(wù)需求進(jìn)行了深入分析,重點(diǎn)進(jìn)行了全文檢索系統(tǒng)的數(shù)據(jù)分析和功能模塊設(shè)計(jì)。關(guān)鍵詞:全文檢索;公安信息化;公安業(yè)務(wù)全文檢索是現(xiàn)代信息檢索技術(shù)的一個(gè)非常重要的分支,它是處理非結(jié)構(gòu)化數(shù)據(jù)的強(qiáng)大工具,也是搜索引擎的核心技術(shù)之一。全文檢索是以文本數(shù)據(jù)為主要處理對(duì)象,根據(jù)數(shù)據(jù)資料的內(nèi)容而不是外在特征實(shí)現(xiàn)的信息檢索手段。全文檢索就是指計(jì)算機(jī)索引程序通過(guò)掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建
無(wú)線互聯(lián)科技 2015年20期2016-03-05
- 基于World Wind Java的海底電纜管道業(yè)務(wù)管理信息系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)*
理信息平臺(tái);全文檢索海底電纜管道是通信、電力和油氣等資源的重要輸送載體,隨著我國(guó)海洋產(chǎn)業(yè)的發(fā)展,海洋電纜管道無(wú)論從數(shù)量還是長(zhǎng)度上都取得了迅猛的發(fā)展。目前已在渤海、黃海、東海、南海鋪設(shè)大量油氣管線,總長(zhǎng)度近萬(wàn)公里[1]。面對(duì)大量的海底管線審批及管理數(shù)據(jù),我國(guó)海洋行政主管部門迫切需要一個(gè)業(yè)務(wù)系統(tǒng)來(lái)完成數(shù)據(jù)的集成管理以及三維地理信息可視化展示,為管理決策提供支持。本文基于World Wind Java三維地理信息平臺(tái)、Wicket Web開發(fā)框架、Lucene全
海岸工程 2015年2期2015-12-21
- 基于Lucene的多種排序方式的實(shí)現(xiàn)
文實(shí)現(xiàn)了其在全文檢索中多種方式的排序應(yīng)用,并在項(xiàng)目開發(fā)中得到了較好的呈現(xiàn)。關(guān)鍵詞:Lucene;Java;全文檢索;排序中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)17-0054-02The Implementation of a Variety of Sorting Methods Based on LuceneHU Hai-bin(Experiment Center, China West Normal Univer
電腦知識(shí)與技術(shù) 2015年17期2015-09-11
- 全文檢索引擎Lucene系統(tǒng)模型與應(yīng)用研究
爆炸式增長(zhǎng),全文檢索技術(shù)是提高信息檢索效率的有效方法。Lucene是一個(gè)采用Java編寫的全文搜索引擎框架,它運(yùn)用了面向?qū)ο蟮脑O(shè)計(jì)思想,提供了豐富的API。對(duì)Lucene的系統(tǒng)結(jié)構(gòu)、索引流程、索引機(jī)制進(jìn)行了詳細(xì)分析,對(duì)應(yīng)用Lucene引擎搭建全文搜索系統(tǒng)的關(guān)鍵問(wèn)題進(jìn)行了研究。關(guān)鍵詞:全文檢索;Lucene;倒排索引;分詞DOIDOI:10.11907/rjdk.151168中圖分類號(hào):TP319文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào)文章編號(hào):16727800(2015)
軟件導(dǎo)刊 2015年6期2015-06-24
- 基于自然語(yǔ)言理解的在線答疑系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
理算法,基于全文檢索匹配技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)限定領(lǐng)域內(nèi)的在線答疑系統(tǒng)。實(shí)例運(yùn)行結(jié)果表明,系統(tǒng)可靠性較高,且答疑效果較為明顯,達(dá)到了預(yù)期目標(biāo)。關(guān)鍵詞: 自然語(yǔ)言理解; 語(yǔ)義相似度; 全文檢索; 在線答疑系統(tǒng)中圖分類號(hào):TP399 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2015)05-10-03Abstract: The similarity calculation based on natural language understanding is
計(jì)算機(jī)時(shí)代 2015年5期2015-05-30
- 汽車產(chǎn)業(yè)標(biāo)準(zhǔn)化信息管理系統(tǒng)的關(guān)鍵技術(shù)研究
ucene的全文檢索技術(shù),基于JACOB的文檔受控技術(shù)以及基于JBPM的業(yè)務(wù)流程管理技術(shù)。關(guān)鍵詞:汽車產(chǎn)業(yè);標(biāo)準(zhǔn)化信息管理;工作流;全文檢索中圖分類號(hào):TP315 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)07-0152-03Abstract: This paper has analyzed the importance of the standardization of automobile industry. According to t
電腦知識(shí)與技術(shù) 2015年7期2015-05-08
- 全文檢索引擎技術(shù)在電子病歷中的應(yīng)用
建立電子病歷全文檢索系統(tǒng)。系統(tǒng)通過(guò)實(shí)際數(shù)據(jù)測(cè)試表明,該檢索方法準(zhǔn)確率較高、檢索速度快。關(guān)鍵詞:電子病歷 全文檢索 XML中圖分類號(hào):R197.324 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2014)12-0089-021 引言隨著信息化技術(shù)的飛速發(fā)展,計(jì)算機(jī)技術(shù)越來(lái)越多地應(yīng)用到了醫(yī)療領(lǐng)域。近年來(lái)醫(yī)療行業(yè)大力加強(qiáng)信息化建設(shè),建立和完善以電子病歷為核心的醫(yī)院信息系統(tǒng)。電子病歷作為臨床信息的載體以及醫(yī)院信息系統(tǒng)的核心構(gòu)成了醫(yī)療衛(wèi)生決策等系統(tǒng)的基礎(chǔ)。目前很
數(shù)字技術(shù)與應(yīng)用 2014年12期2015-05-04
- 基于云計(jì)算的知識(shí)管理系統(tǒng)
知識(shí)重構(gòu) 全文檢索 云計(jì)算 非結(jié)構(gòu)化數(shù)據(jù)庫(kù)隨著互聯(lián)網(wǎng)絡(luò)的發(fā)展、人們對(duì)知識(shí)獲取方式及知識(shí)用途的改變。傳統(tǒng)出版方式無(wú)法滿足讀者需求,因而相應(yīng)的讀者市場(chǎng)逐漸流失。解決上述問(wèn)題需要對(duì)現(xiàn)有出版行業(yè)進(jìn)行重新整合,并改進(jìn)出版方式?;谠朴?jì)算的知識(shí)管理系統(tǒng)通過(guò)軟件系統(tǒng)將知識(shí)出版、知識(shí)服務(wù)商進(jìn)行了整合,從而達(dá)到行業(yè)整合,使整個(gè)行業(yè)能緊密合作、急時(shí)響應(yīng)用戶的需求。同時(shí)通過(guò)互聯(lián)網(wǎng)及電子閱讀方式,進(jìn)行低成本、快速傳播,滿足人們個(gè)性化、良好閱讀體驗(yàn)、知識(shí)資產(chǎn)管理、知識(shí)再創(chuàng)造需求。
電子技術(shù)與軟件工程 2014年16期2014-10-29
- 基于雙層PDF和Lucene技術(shù)的全文檢索研究與實(shí)現(xiàn)
、創(chuàng)建索引和全文檢索等實(shí)現(xiàn)過(guò)程來(lái)闡述相關(guān)技術(shù)的研究和運(yùn)用。以建設(shè)全文數(shù)據(jù)庫(kù)為基礎(chǔ),研究結(jié)構(gòu)化信息與非結(jié)構(gòu)化數(shù)據(jù)的合并管理,對(duì)目錄數(shù)據(jù)和全文數(shù)據(jù)的同步索引,基于Lucene技術(shù),實(shí)現(xiàn)檔案管理系統(tǒng)的一站式智能化檔案全文檢索,提升檔案查全率。〔關(guān)鍵詞〕雙層PDF;全文檢索;檔案管理;Lucene〔中圖分類號(hào)〕TP391〔文獻(xiàn)標(biāo)識(shí)碼〕B〔文章編號(hào)〕1008-0821(2014)06-0075-04由于檔案的憑證性、惟一性和不可替代性,導(dǎo)致用戶和檔案行業(yè)更注重查全率
現(xiàn)代情報(bào) 2014年6期2014-08-18
- 基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
KySou的全文檢索系統(tǒng)的分析與優(yōu)化肖捷(東莞理工學(xué)院 計(jì)算機(jī)學(xué)院,廣東東莞 523808)全文檢索是基于Web的信息搜索的關(guān)鍵技術(shù),文章從基于KySou的全文檢索系統(tǒng)的實(shí)現(xiàn)機(jī)制入手,深入分析了全文檢索系統(tǒng)的工作原理、系統(tǒng)組成及API接口設(shè)計(jì),并就全文檢索系統(tǒng)的優(yōu)化進(jìn)行探討,包括索引過(guò)程優(yōu)化和搜索過(guò)程優(yōu)化。KySou;全文檢索;索引優(yōu)化;搜索優(yōu)化全文檢索是一個(gè)非常有效的信息檢索技術(shù),它極大地提高了從海量數(shù)據(jù)中查找特定信息的效率。隨著Internet的飛速發(fā)
東莞理工學(xué)院學(xué)報(bào) 2014年3期2014-07-12
- 基于Lucene的全文檢索管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
ucene的全文檢索管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)何萍 (成都信息工程學(xué)院圖書館,四川成都 610225)李凡 (成都信息工程學(xué)院計(jì)算機(jī)學(xué)院,四川成都 610225)全文檢索是各種信息系統(tǒng)實(shí)現(xiàn)對(duì)各種繁多的電子文檔進(jìn)行分析處理的基礎(chǔ),而依賴于數(shù)據(jù)庫(kù)的全文檢索功能存在許多局限性。Lucene是一種基于純Java技術(shù)的輕量級(jí)的文本索引和查詢引擎,幾乎適合于任何需要全文檢索的應(yīng)用。設(shè)計(jì)了一個(gè)基于Lucene技術(shù)的全文檢索管理系統(tǒng)(id XMS)。全文檢索管理系統(tǒng)(id XMS
- 全文檢索的原理與實(shí)現(xiàn)探討
文主要在介紹全文檢索的概念和原理的基礎(chǔ)上,論述了全文檢索的幾種主要技術(shù),并給出了逆向最大分詞法的具體實(shí)現(xiàn)。〔關(guān)鍵詞〕全文檢索;搜索引擎;中文分詞〔中圖分類號(hào)〕TP31 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2009)07-0138-03Discussion on Principle and Implementation of Full Text SearchMan Peng(Computer Center,Changchun Universit
現(xiàn)代情報(bào) 2009年7期2009-10-13
- 用JSP調(diào)用Lucene包來(lái)實(shí)現(xiàn)全文檢索
:介紹了實(shí)現(xiàn)全文檢索的三個(gè)組件(Tomcat、JSP、Lucene)對(duì)應(yīng)全文檢索系統(tǒng)結(jié)構(gòu).給出了具體實(shí)現(xiàn)的運(yùn)作流程和主要部分的核心代碼及相應(yīng)說(shuō)明。關(guān)鍵詞:Tomcat+JSP+Lucene運(yùn)作流程核心代碼說(shuō)明中圖分類號(hào)TP311.56文獻(xiàn)標(biāo)識(shí)碼B文章編號(hào):1002-2422(2007)03-0029-021Tomcat+JSP+Lvcene1.1Tomcat的Web服務(wù)器Web服務(wù)器是在網(wǎng)絡(luò)中為實(shí)現(xiàn)信息發(fā)布、資料查詢、數(shù)據(jù)處理等諸多應(yīng)用搭建基本平臺(tái)的服務(wù)器
智能計(jì)算機(jī)與應(yīng)用 2007年3期2007-07-05
- 古籍電子化與中國(guó)古代文史研究
四部叢刊》;全文檢索;數(shù)據(jù)庫(kù)[摘要]古籍電子化對(duì)中國(guó)古代文史研究具有重要意義,目前已出現(xiàn)了文淵閣《四庫(kù)全書》電子版原文及全文檢索版等多家古籍電子化工程及數(shù)據(jù)庫(kù),涉及了中國(guó)大陸以及香港、臺(tái)灣地區(qū)的多家專業(yè)網(wǎng)站,中國(guó)大陸的全文檢索版《四庫(kù)全書》和《四部叢刊》乃是當(dāng)今世界中國(guó)古籍電子化的制高點(diǎn),代表了古籍電子化發(fā)展的正確方向。[中圖分類號(hào)]G252.7[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1671—511X(2004)02—0111—04
東南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版) 2004年2期2004-03-09