孫廣路 易成岐 郎非
摘要:為了改進(jìn)傳統(tǒng)的文本檢索技術(shù)存在檢索文件格式種類單一,索引大數(shù)據(jù)量文件速度慢,甚至造成內(nèi)存溢出等問題,基于Lucene系統(tǒng)及相關(guān)技術(shù),研究了基于合并因子的多種格式文件索引技術(shù),并在此基礎(chǔ)上構(gòu)建了中文文本信息檢索系統(tǒng),實驗分析表明,本系統(tǒng)有效地實現(xiàn)了多種格式文件檢索功能,通過合并因子的設(shè)定有效提高了索引速度,系統(tǒng)可靠性高。
關(guān)鍵詞:文本檢索;合并因子;多種格式文件索引
中圖分類號:TM391.3文獻(xiàn)標(biāo)志碼:A文章編號:1007-2683(2012)02-0001-04