徐競
(赤峰市醫(yī)院, 內(nèi)蒙古 赤峰 024000)
隨著移動(dòng)互聯(lián)網(wǎng)的普及與應(yīng)用,許多三甲醫(yī)院均推出了智能手機(jī)APP與PC端的自助掛號系統(tǒng)[1]。病患用戶通過檢索醫(yī)院的醫(yī)療資源與專家醫(yī)生的人事檔案選擇合適的醫(yī)療服務(wù),準(zhǔn)確、快速地檢索出專家醫(yī)生的檔案是其中最基礎(chǔ)、最關(guān)鍵的部分[2-3]。
醫(yī)院人才的專業(yè)性強(qiáng)、人才流動(dòng)性大、人事信息檢索頻率高,隨著醫(yī)院信息化建設(shè)與移動(dòng)互聯(lián)網(wǎng)的接入,使得當(dāng)前的人事檔案信息已經(jīng)無法滿足應(yīng)用需求[4]。把人事檔案信息化管理與醫(yī)院行政檔案、醫(yī)護(hù)人員績效考評管理有效地對接,能夠?yàn)獒t(yī)護(hù)人員績效考評提供依據(jù),能夠促進(jìn)醫(yī)護(hù)人員的工作效率與積極性,并且能夠?yàn)榛颊哂脩魩碛行У呐袛嘁罁?jù)[5]。
目前的醫(yī)院人事信息搜索系統(tǒng)主要基于關(guān)鍵字搜索[6],并未有效地利用搜索內(nèi)容的信息[7],如果患者用戶搜索某個(gè)專家醫(yī)生或者某個(gè)病癥,則系統(tǒng)直接返回與關(guān)鍵字匹配的醫(yī)生文檔信息,如果該醫(yī)生掛號滿員或者無法滿足用戶的時(shí)間要求,則會(huì)降低用戶的滿意度。因此,為醫(yī)院人事信息搜索系統(tǒng)增加關(guān)聯(lián)性信息[8]與自動(dòng)推薦功能[9]是醫(yī)院信息化建設(shè)的發(fā)展方向。
本文提出了一種基于模糊理論[10]的醫(yī)院人事檔案信息推薦系統(tǒng),該系統(tǒng)利用了相關(guān)反饋技術(shù)[11],提取用戶的操作特征并且預(yù)測用戶的興趣,此外,為文檔、用戶、檢索任務(wù)建立基于關(guān)鍵詞頻率的配置文件,從而提高檢索的效率。最終,基于公開的文檔數(shù)據(jù)集進(jìn)行了仿真實(shí)驗(yàn),結(jié)果證明本算法獲得了較好的檢索結(jié)果,并且產(chǎn)生了相關(guān)性較高的推薦列表。
本算法基于相關(guān)反饋與模糊理論。將相關(guān)反饋?zhàn)鳛橛脩舻牟樵內(nèi)蝿?wù)、用戶、文檔配置文件的主要數(shù)據(jù)源。用戶配置文件將用戶的興趣建模,文檔配置文件包含了不同用戶檢索某個(gè)文檔所使用的不同關(guān)鍵字,任務(wù)配置文件包含了不同用戶完成同一個(gè)任務(wù)所使用的不同關(guān)鍵字。將每個(gè)任務(wù)、用戶、文檔建模為配置文件中關(guān)鍵字的加權(quán)組合,然后與用戶查詢的關(guān)鍵字比較,通過計(jì)算各個(gè)配置文件的關(guān)鍵字權(quán)重來搜索與用戶查詢最相關(guān)的信息。
用戶的檢索目標(biāo)具有不一致性,所以醫(yī)院人事檔案檢索系統(tǒng)的相關(guān)反饋具有較高的不確定性,而處理好相關(guān)反饋的不確定性是提高推薦效果的關(guān)鍵。本文采用模糊理論處理相關(guān)反饋的不確定性。本算法的總體結(jié)構(gòu),如圖1所示。
圖1 本算法的總體結(jié)構(gòu)
共包含6個(gè)階段。階段1:收集相關(guān)反饋;階段2:預(yù)測文檔的相關(guān)性;階段3:模糊化任務(wù)、用戶與文檔配置文件;階段4:計(jì)算關(guān)鍵詞權(quán)重;階段5:產(chǎn)生加權(quán)的推薦列表。
在檢索系統(tǒng)的上層設(shè)計(jì)了一個(gè)模塊來捕獲用戶的相關(guān)反饋信息,如圖2所示。
圖2 收集相關(guān)反饋的過程
相關(guān)反饋信息包含隱式參數(shù)、顯式參數(shù)、用戶查詢與互動(dòng)特征。隱式參數(shù)包括:訪問時(shí)間戳、頁面訪問時(shí)長、鼠標(biāo)點(diǎn)擊數(shù)量、手機(jī)屏幕滑動(dòng)、鼠標(biāo)滾動(dòng)等,顯式參數(shù)則是用戶對檢索結(jié)果的滿意度評價(jià),查詢信息包括:查詢內(nèi)容、查詢時(shí)間戳等?;?dòng)特征則主要是某個(gè)文檔是否被用戶打開閱讀。
使用線性預(yù)測模型與線性回歸分析,根據(jù)隱式反饋參數(shù)計(jì)算訪問文檔的相關(guān)性,如表1所示。使用R2評估驗(yàn)證模型的準(zhǔn)確率。具體步驟如下:
步驟①:將隱式參數(shù)與顯式參數(shù)分類。
步驟②:對隱式參數(shù)與顯式參數(shù)進(jìn)行相關(guān)分析,識別出對用戶反饋具有明顯意義的隱式參數(shù),通過排除與顯式相關(guān)性沒有關(guān)系的隱式參數(shù),由此可降低參數(shù)的數(shù)據(jù)維度。本文使用IBM-SPSS-Statistics Version 22軟件[12]自動(dòng)地實(shí)現(xiàn)相關(guān)性分析。IBM-SPSS-Statistics Version 22軟件[12]的相關(guān)性分析結(jié)果,如表1所示。
表1 IBM-SPSS-Statistics Version 22軟件的相關(guān)性分析結(jié)果
對于顯式相關(guān)性有明顯意義的隱式參數(shù)包括:頁面停留時(shí)間、鼠標(biāo)點(diǎn)擊數(shù)量、手機(jī)屏幕點(diǎn)擊數(shù)量。將這些隱式參數(shù)用于步驟③的分析處理中。
步驟③:根據(jù)隱式參數(shù)預(yù)測訪問文檔的相關(guān)性級別,使用線性回歸模型分析、計(jì)算預(yù)測值,線性回歸的回歸模型包括三個(gè)參數(shù):系數(shù)β(未知參數(shù)),預(yù)測器X(獨(dú)立變量),目標(biāo)Y(依賴變量),一個(gè)線性回歸模型可定義,為式(1)[13]:
Y≈f(X,β)
(1)
估計(jì)值可定義為E(Y|X)=f(X,β),一般多線性回歸模型具有N個(gè)獨(dú)立變量與一個(gè)依賴變量[13],為式(2)。
(2)
式中Y′為依賴變量的預(yù)測值,β0為截距,βi為變量系數(shù),Xi為自變量,N為獨(dú)立變量數(shù)量。
步驟②的候選隱式參數(shù)作為回歸分析的預(yù)測器,搜索隱式參數(shù)與顯式參數(shù)的線性相關(guān)性關(guān)系。分析的結(jié)果,如表2所示。
將顯著度≥0.05的變量作為預(yù)測模型的預(yù)測器。將表2中的結(jié)果代入式(2),顯式相關(guān)性級別的線性預(yù)測模型變?yōu)槭?3)。
Y′=0.395+X1×0.069+X2×0.013+X3×0.113 (3)
然后,對式(3)進(jìn)行歸一化處理,為式(4)。
(4)
采用一個(gè)自適應(yīng)模糊方案創(chuàng)建任務(wù)、用戶、文檔的配置文件,構(gòu)建3個(gè)配置文件的方法分別在2.1、2.2、2.3小節(jié)詳細(xì)描述。
將任務(wù)、用戶與文檔3個(gè)配置文件總結(jié)為統(tǒng)一的關(guān)鍵字權(quán)重指標(biāo)。對于檢索任務(wù)Sy,如果用戶Uk使用關(guān)鍵字ti檢索文檔Dg,那么對于ti的統(tǒng)一化權(quán)重為Wiykg,統(tǒng)一權(quán)重考慮了關(guān)鍵字與3個(gè)配置文件的總體相關(guān)性。該階段共有4步:
步驟①:提取模糊規(guī)則。
使用Mendel Wang方法[14]為輸入變量與輸出變量建立模糊邏輯的關(guān)系,如圖3所示,本文采用三角隸屬函數(shù)。三個(gè)參數(shù){a,b,c}即可確定三角隸屬函數(shù)的形狀,三角隸屬函數(shù)定義,為式(5)。
(5)
式中參數(shù){a,b,c}決定了三角形隸屬函數(shù)3個(gè)角點(diǎn)的x坐標(biāo)。
最終建立“IF…THEN…”的模糊規(guī)則。假設(shè)B是模糊邏輯標(biāo)記{L,M,H}(低、中、高),則模糊規(guī)則定義為:
B(WX1),B(WX2),B(WX3)→B(Rh)
(6)
該式表示將X1,X2,X33個(gè)參數(shù)的權(quán)重輸出為統(tǒng)一的三角模糊值。
圖3 輸入變量與輸出變量建立模糊邏輯的關(guān)系(x軸為三角模糊函數(shù)的輸入值,y軸為三角模數(shù)函數(shù)的輸出值)
步驟②:壓縮模糊規(guī)則。
本方案使用模糊支持度與規(guī)則的可靠性來評估規(guī)則的置信度,規(guī)則的模糊支持度計(jì)算為規(guī)則的支持度與觸發(fā)強(qiáng)度的乘積,規(guī)則的支持度則計(jì)算為數(shù)據(jù)模式的覆蓋率,規(guī)則的觸發(fā)強(qiáng)度評估了該規(guī)則與輸入模式匹配的概率。
規(guī)則的模糊支持度可識別出與最頻繁數(shù)據(jù)模式共生的唯一規(guī)則,模糊支持度是可擴(kuò)展的。本方案采用模糊支持度將模糊規(guī)則庫壓縮為唯一的規(guī)則集,采用文獻(xiàn)[15]的方法計(jì)算模糊支持度:
(7)
規(guī)則的置信度度量了該規(guī)則與數(shù)據(jù)模式的緊密性,置信度在0~1之間,置信度為1說明該規(guī)則是輸出集的唯一模式?;谖墨I(xiàn)[16]計(jì)算規(guī)則的置信度:
(8)
步驟③:規(guī)則權(quán)重的計(jì)算。
計(jì)算模糊支持度與規(guī)則置信度的乘積來度量規(guī)則的模糊權(quán)重:
scWi=scFuzzSup×scConf
(9)
為M個(gè)規(guī)則分配模糊權(quán)重:
B(WX1),B(WX2),B(WX3)→B(Rh)[scWi]
(10)
模糊權(quán)重度量了建模數(shù)據(jù)中每個(gè)規(guī)則的質(zhì)量,可用來對輸出集進(jìn)行排列。使用模糊權(quán)重來提取最相關(guān)的規(guī)則模式,選擇scWi值最高的模式建立模糊系統(tǒng)。
步驟④:計(jì)算統(tǒng)一的關(guān)鍵詞權(quán)重
模糊規(guī)則包含3個(gè)輸入變量{Wsytez,Wuktez,Wdgtez},將三個(gè)權(quán)重總結(jié)為統(tǒng)一的權(quán)重Wiykg,然后將Wiykg值傳遞至下一階段處理。
根據(jù)新的用戶查詢與參數(shù)集(Vh,ti,Sy,Uk,Dg,Wiykg)創(chuàng)建一個(gè)推薦的人事文檔與專家醫(yī)生列表。采用第一階段的方法對新用戶進(jìn)行處理,提取關(guān)鍵字。然后,搜索查詢關(guān)鍵字的參數(shù)集,獲得匹配的文檔與專家醫(yī)生。
如果查詢的關(guān)鍵字在參數(shù)集中出現(xiàn),那么則認(rèn)為該查詢與對應(yīng)文檔匹配,然后,計(jì)算匹配關(guān)鍵字的平均權(quán)重,按照權(quán)重的高低將結(jié)果降序排列,最終,將推薦結(jié)果返回給用戶。
使用相關(guān)反饋創(chuàng)建用戶的配置文件,配置文件中每個(gè)用戶表示為一個(gè)加權(quán)關(guān)鍵詞的集合,表示用戶的興趣。具體步驟如下:
步驟①:選擇用戶查詢的文檔集合Q。
步驟②:選擇所有的用戶集U。
步驟③:通過用戶Uk創(chuàng)建的查詢選擇查詢Q的子集ΩUk。
步驟④:對集合ΩUk的查詢進(jìn)行預(yù)處理,然后通過文獻(xiàn)[16]算法變換為一個(gè)候選的關(guān)鍵詞集合。
步驟⑤:計(jì)算每個(gè)關(guān)鍵詞的頻率度量、分布式關(guān)鍵詞頻率(DTF)、文檔頻率(DF)與反向文檔頻率(IDF),然后將每個(gè)集合ΩUk的各個(gè)指標(biāo)歸一化處理。
使用這些頻率度量來計(jì)算一個(gè)文檔集合中的關(guān)鍵詞頻率,DTF反應(yīng)了用戶查詢集中關(guān)鍵詞的頻率域分布狀態(tài),DF表示了集合Q中包含該關(guān)鍵詞的查詢頻率。最終,歸一化的關(guān)鍵詞分布頻率(NDTF)定義:
NDTFi=(TFi/DFi)/(Maxj(TFj/DFj))
式中TFi為查詢集ΩUk中關(guān)鍵詞ti的頻率,DFi為ΩUk中包含關(guān)鍵詞ti的查詢數(shù)量(i,j=1~M),其中M為集合ΩUk中關(guān)鍵詞的數(shù)量。
歸一化文檔頻率(NDF)的計(jì)算方法為:
NDFi=DFi/MaxjDFj
式中DFi為查詢集合ΩUk中包含關(guān)鍵詞ti的查詢數(shù)量。
IDF表示查詢集合Q中關(guān)鍵詞的頻率,歸一化反向文檔頻率(NIDF)定義為下式):
NIDFi=IDFi/MaxjIDFj,IDFi=Log(N/ni)
式中N是Q中查詢的總數(shù)量,ni是Q中包含關(guān)鍵詞ti的查詢數(shù)量。
步驟⑥:將3個(gè)輸入變量的明確值作模糊化處理,全部映射為模糊集,NDF與NIDF有3個(gè)邏輯標(biāo)簽,NTDF有兩個(gè)邏輯標(biāo)簽,輸出變量TW共有6個(gè)模糊集。
步驟⑦:采用文獻(xiàn)[18]的18個(gè)“IF…THEN…”模糊規(guī)則,建立關(guān)鍵詞ti的模糊權(quán)重,搜索具有高NDF、高NIDF值、低NDTF值的關(guān)鍵詞。
步驟⑧:采用加權(quán)平均法(重心法)對步驟⑦的輸出TW做解模糊化處理,獲得每個(gè)關(guān)鍵詞的明確權(quán)重值TWUkti。
步驟⑨:將關(guān)鍵詞ti與權(quán)重TWUkti加入配置文件中。
任務(wù)配置文件中將每個(gè)任務(wù)表示為一個(gè)加權(quán)關(guān)鍵詞的集合,權(quán)重反應(yīng)了每個(gè)關(guān)鍵詞與搜索任務(wù)之間的相關(guān)性。具體步驟如下:
步驟①:選擇用戶查詢的文檔集合Q。
步驟②:選擇所有任務(wù)S的集合。
步驟③:通過用戶查詢創(chuàng)建查詢集合Q的一個(gè)子集ΩSy。
步驟④:對集合ΩSy的查詢進(jìn)行預(yù)處理,然后通過文獻(xiàn)[16]算法變換為一個(gè)候選的關(guān)鍵詞集合。
步驟⑤:計(jì)算每個(gè)關(guān)鍵詞的頻率度量、分布式關(guān)鍵詞頻率(DTF)、文檔頻率(DF)與反向文檔頻率(IDF),然后將每個(gè)集合ΩSy的各個(gè)指標(biāo)歸一化處理。
步驟⑥:將3個(gè)輸入變量的明確值作模糊化處理,全部映射為模糊集,與2.1小節(jié)的步驟⑥相同。
步驟⑦~⑨:與2.1小節(jié)的步驟⑦~⑨相同。
在文檔配置文件中,每個(gè)文檔表示為一個(gè)加權(quán)術(shù)語的集合有被用戶使用來檢索文檔相關(guān)性與他們的任務(wù)。權(quán)重反映了每個(gè)術(shù)語與文檔的相關(guān)性。以下是具體步驟:
步驟①:選擇用戶查詢的文檔集合Q。
步驟②:選擇訪問的文檔集合D。
步驟③:通過用戶查詢創(chuàng)建文檔集合Q的一個(gè)子集ΩDg。
步驟④:對集合ΩDg的查詢進(jìn)行預(yù)處理,然后通過文獻(xiàn)[16]算法變換為一個(gè)候選的關(guān)鍵詞集合。
步驟⑤:計(jì)算每個(gè)關(guān)鍵詞的頻率度量、分布式關(guān)鍵詞頻率(DTF)、文檔頻率(DF)與反向文檔頻率(IDF),然后將每個(gè)集合ΩDg的各個(gè)指標(biāo)歸一化處理。
步驟⑥:將三個(gè)輸入變量的明確值作模糊化處理,全部映射為模糊集,與2.1小節(jié)的步驟⑥相同。
步驟⑦~⑨:與2.1小節(jié)的步驟⑦~⑨相同。
采用公開的文檔檢索數(shù)據(jù)集TREC Enterprise Track-2007[19]進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集共包含370 715個(gè)文檔,數(shù)據(jù)集大小為4.2 GB,包含了不同的文檔類型,例如:html文件、text文件、pdf文件等。本系統(tǒng)基于開源軟件搭建,由以下幾個(gè)部分組成:Apache Solr[20]、Apache Tika[21]、Hadoop[22],Hadoop是分布式計(jì)算的開源框架,Tika是分析與采集不同類型文檔的開源軟件,Solr是企業(yè)級ISR服務(wù)器的開源軟件。本實(shí)驗(yàn)系統(tǒng)的總體架構(gòu),如圖4所示。
圖4 實(shí)驗(yàn)的推薦系統(tǒng)總體架構(gòu)
隨機(jī)地邀請了35個(gè)用戶參與實(shí)驗(yàn),每個(gè)用戶根據(jù)自己的需求檢索。
3.2.1 線性預(yù)測模型驗(yàn)證
使用R2指標(biāo)驗(yàn)證模型的準(zhǔn)確率,R2指標(biāo)是一個(gè)廣泛使用的統(tǒng)計(jì)模型準(zhǔn)確率度量指標(biāo),R2的計(jì)算方法為式(11)。
(11)
線性預(yù)測模型的R2指標(biāo)結(jié)果,如圖5所示。
預(yù)測的R2指標(biāo)為92.3%,可通過提高相關(guān)反饋的相關(guān)性提高模型的R2指標(biāo)值。
圖5 本系統(tǒng)預(yù)測值與實(shí)際值的擬合圖
3.2.2 檢索算法的性能比較分析
為了評估總的推薦性能,將本算法與其他兩個(gè)檢索算法進(jìn)行比較,兩個(gè)算法分別為標(biāo)準(zhǔn)Solr搜索系統(tǒng)[20]與基于語義的企業(yè)檢索系統(tǒng)Lucid。兩個(gè)系統(tǒng)都是基于Solr的搜索平臺(tái),區(qū)別在于第一個(gè)算法使用標(biāo)準(zhǔn)變化索引,第二個(gè)算法則使用語義索引。
精度與召回率是評估信息檢索性能的兩個(gè)重要標(biāo)準(zhǔn),精度與召回率可評估系統(tǒng)檢索相關(guān)文檔的能力,檢索系統(tǒng)的精度定義,為式(12)。
P=|Ra|/|A|
(12)
式中Ra是檢索的相關(guān)文檔數(shù)量,A是檢索文檔的總數(shù)量,包含檢索出的所有文檔。
召回率評估了系統(tǒng)代表所有相關(guān)文檔的能力,R定義,為式(13)。
R=|Ra|/|Rm|
(13)
式中Ra是檢索相關(guān)文檔的數(shù)量,Rm是文檔集中相關(guān)文檔的總數(shù)量。
3個(gè)檢索算法獲得的結(jié)果,如表3所示。
表3 三個(gè)檢索算法獲得的精度與召回率結(jié)果
標(biāo)準(zhǔn)Solr系統(tǒng)的平均P值為0.004 28,說明該系統(tǒng)檢索了大量不相關(guān)的文檔。基于語義搜索的Lucid算法P值是0.029 8,明顯地高于標(biāo)準(zhǔn)Solr系統(tǒng),本算法的平均P值為0.071,明顯地改進(jìn)了檢索準(zhǔn)確率。換句話說,本算法有效地減少了搜索結(jié)果中不相關(guān)文檔的數(shù)量,說明本算法加強(qiáng)了相關(guān)文檔的檢索準(zhǔn)確率。
根據(jù)式(12),增加相關(guān)文檔的數(shù)量或者減少非相關(guān)文檔的數(shù)量均可能導(dǎo)致P值增加,本算法設(shè)計(jì)了基于模糊規(guī)則的配置文件,提高了對相關(guān)文檔的過濾效果。
為了提高醫(yī)院人事文檔信息檢索系統(tǒng)的檢索模糊性與多樣性,設(shè)計(jì)了一種基于模糊理論與相關(guān)反饋的醫(yī)療信息推薦系統(tǒng)。本算法收集用戶的隱式相關(guān)反饋與顯式相關(guān)反饋,使用線性預(yù)測模型與線性回歸分析基于隱式反饋參數(shù)分析文檔的相關(guān)性,根據(jù)隱式參數(shù)預(yù)測訪問文檔的相關(guān)性級別,使用線性回歸模型分析、計(jì)算相關(guān)性的預(yù)測值,采用一個(gè)自適應(yīng)模糊方案創(chuàng)建任務(wù)、用戶、文檔的配置文件,根據(jù)新的用戶查詢與相關(guān)性參數(shù)集創(chuàng)建一個(gè)推薦的人事文檔與專家醫(yī)生列表。將本算法與其他近期的檢索算法進(jìn)行比較,本算法設(shè)計(jì)了基于模糊規(guī)則的配置文件,提高了對相關(guān)文檔的過濾效果。
[1] 黃健,王玨,卞壽峰,等. 上海市部分醫(yī)院一站式服務(wù)系統(tǒng)使用現(xiàn)狀的調(diào)查與分析[J]. 中國衛(wèi)生資源, 2015(3):185-187.
[2] 歐石燕,唐振貴,蘇翡斐. 面向信息檢索的術(shù)語服務(wù)構(gòu)建與應(yīng)用研究[J]. 中國圖書館學(xué)報(bào), 2016, 42(2):32-51.
[3] 王元卓,賈巖濤,劉大偉,等. 基于開放網(wǎng)絡(luò)知識的信息檢索與數(shù)據(jù)挖掘[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(2):456-474.
[4] 李蕤. 新形勢下中醫(yī)醫(yī)院人才培養(yǎng)的重點(diǎn)[J]. 山西財(cái)經(jīng)大學(xué)學(xué)報(bào), 2015(s1):167-168.
[5] 宋兵,盧建華,丁強(qiáng),等. 醫(yī)院近10年人才流失現(xiàn)狀分析與思考[J]. 海南醫(yī)學(xué), 2015, 26(19):2941-2944.
[6] 劉喜平,萬常選,劉德喜,等. 空間關(guān)鍵詞搜索研究綜述[J]. 軟件學(xué)報(bào), 2016, 27(2):329-347.
[7] 韓軍,范舉,周立柱. 一種語義增強(qiáng)的空間關(guān)鍵詞搜索方法[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(9):1954-1964.
[8] Geng Runian, Dong Xiangjun, Zhang Ping,等. Mining weighted frequent patterns using local graph linking information利用局部圖關(guān)聯(lián)信息挖掘加權(quán)頻繁模式*[J]. 計(jì)算機(jī)應(yīng)用研究, 2008, 25(9):2687-2691.
[9] 聶曉,翟小兵. 改進(jìn)ART算法在數(shù)據(jù)庫自動(dòng)知識推薦中的應(yīng)用[J]. 科技通報(bào), 2015(4):215-217.
[10] 徐軍,鐘元生,朱文強(qiáng). 一種基于直覺模糊理論的多維信任傳遞模型[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2015, 36(12):2714-2718.
[11] 曹斌,彭宏杰,侯晨煜,等. 基于用戶隱性反饋與協(xié)同過濾相結(jié)合的電子書籍推薦服務(wù)[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2017, 38(2):334-339.
[12] Kirkpatrick L A, Feeney B C. A Simple Guide to IBM SPSS Statistics for Version 20.0[J]. 2012.
[13] 蘇變萍,曹艷平.基于灰色系統(tǒng)理論的多元線性回歸分析[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識, 2006, 36(8):219-222.
[14] Wang L X, Mendel J M. Generating fuzzy rules by learning from examples. IEEE Trans Syst Man Cybern[J]. IEEE Transactions on Systems Man & Cybernetics, 1992, 22(6):1414-1427.
[15] Wu D, Mendel J M, Joo J. Linguistic summarization using IF-THEN rules[C]// IEEE International Conference on Fuzzy Systems. IEEE, 2010:1-8.
[16] Ishibuchi H, Yamamoto T. Rule Weight Specification in Fuzzy Rule-Based Classification Systems[J]. IEEE Transactions on Fuzzy Systems, 2005, 13(4):428-435.
[17] Porter M F. An algoritm for suffix stripping[J]. Program Electronic Library & Information Systems, 2006, 14(3):130-137.
[18] Schiaffino S, Amandi A. Intelligent User Profiling[M]// Artificial Intelligence An International Perspective. Springer Berlin Heidelberg, 2009:193-216.
[19] Bailey P, Vries A P D, Craswell N, et al. Overview of the TREC 2007 Enterprise Track.[C]// Sixteenth Text Retrieval Conference, Trec 2007, Gaithersburg, Maryland, Usa, November. 2007:947-954.
[20] Serafini A. Apache Solr Beginner's Guide[J]. Packt Publishing, 2013.
[21] Burgess A B, Mattmann C A. Automatically classifying and interpreting polar datasets with Apache Tika[C]// IEEE International Conference on Information Reuse and Integration. IEEE Computer Society, 2014:863-867.
[22] 朱珊,艾麗華. 基于Hadoop的大規(guī)模圖像存儲(chǔ)與檢索[J]. 計(jì)算機(jī)與現(xiàn)代化, 2017(6):61-66.