查準(zhǔn)率
- 基于機(jī)器學(xué)習(xí)的迭代式數(shù)據(jù)均衡分區(qū)算法研究
布,將查全率、查準(zhǔn)率和數(shù)據(jù)分區(qū)均衡性作為評(píng)價(jià)指標(biāo)。其中,查全率能夠反映算法分區(qū)結(jié)果的全面性,查全率越高,檢測(cè)和識(shí)別少數(shù)類別樣本的效果越好,即表示本文算法性能越好。計(jì)算公式為(14)式(14)中,TP表示數(shù)據(jù)正確分區(qū)數(shù)量,FN表示數(shù)據(jù)錯(cuò)誤分區(qū)數(shù)量。查準(zhǔn)率是衡量算法分區(qū)結(jié)果的準(zhǔn)確率,指的是將某一類別樣本分為真正屬于該類別樣本中的比例。查準(zhǔn)率越高,表示本文算法在分辨不同類別上具有較高的準(zhǔn)確性和可靠性。其計(jì)算公式為(15)式(15)中,FP表示錯(cuò)標(biāo)為正樣本的負(fù)樣本
微型電腦應(yīng)用 2023年12期2024-01-12
- 基于優(yōu)化的YOLOv5模型的車輛檢測(cè)與分類研究
)、檢測(cè)速率、查準(zhǔn)率和查全率四項(xiàng)指標(biāo)對(duì)不同模型檢測(cè)的結(jié)果進(jìn)行評(píng)價(jià)與分析[5]。表2是改進(jìn)前后的兩種網(wǎng)絡(luò)結(jié)構(gòu)經(jīng)過(guò)深度學(xué)習(xí)訓(xùn)練后,所得到的模型的平均精度(IoU≥0.5)和每秒幀數(shù)。從表2中可以看出,基于YOLOv5模型平均檢測(cè)精度可達(dá)93.8%,傳輸速度為53.1 f/s,而改進(jìn)后的OPYOLOv5可以獲得高達(dá)95.7%的mAP,且傳輸速率也有了提升,可達(dá)到60.5 f/s。對(duì)于5種分類的車型而言,卡車和自行車的mAP效果提升最明顯,分別提高了7.0%和2.
交通科技與管理 2022年20期2022-11-07
- 基于卷積神經(jīng)網(wǎng)絡(luò)的環(huán)狀CFRP圖像缺陷檢測(cè)研究
缺陷的召回率、查準(zhǔn)率和F1值得到顯著提高。1 圖像預(yù)處理1.1 圖像擴(kuò)增在工業(yè)生產(chǎn)中,CFRP缺陷圖像數(shù)據(jù)集規(guī)模小,而卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量的圖像數(shù)據(jù),為此本文采用增加或降低對(duì)比度以及翻轉(zhuǎn)、旋轉(zhuǎn)90°和180°的方法進(jìn)行圖像擴(kuò)增。本文數(shù)據(jù)的缺陷類別分別是聚膠、夾雜、氣孔和裂紋,共4類。把這4類的數(shù)據(jù)共同作為含有缺陷的數(shù)據(jù)集,與不含有缺陷的數(shù)據(jù)一起輸入LeNet-5網(wǎng)絡(luò)進(jìn)行二分類訓(xùn)練。1.2 圖像變換本文利用X射線數(shù)字?jǐn)z影技術(shù)對(duì)環(huán)狀CFRP零件進(jìn)行成像,
機(jī)械設(shè)計(jì)與制造工程 2022年9期2022-10-19
- 變工況刀具破損監(jiān)測(cè)的半監(jiān)督增量學(xué)習(xí)方法
A、查全率R、查準(zhǔn)率P和F得分F1:(18)(19)(20)(21)其中:正確率衡量的是模型正確識(shí)別所有樣本的能力;查全率衡量的是模型正確識(shí)別正類(即少數(shù)的破損樣本)的能力;查準(zhǔn)率衡量的是模型正確識(shí)別負(fù)類(即多數(shù)的正常樣本)的能力;F得分是查全率和查準(zhǔn)率的調(diào)和平均值,綜合衡量模型的查全率和查準(zhǔn)率。3.3 破損檢測(cè)結(jié)果根據(jù)測(cè)試樣本的檢測(cè)結(jié)果,按樣本采集的順序逐個(gè)增加樣本,計(jì)算樣本量增加時(shí)模型的正確率、查準(zhǔn)率、查全率和F得分,并繪制各評(píng)價(jià)指標(biāo)的變化趨勢(shì),如圖7
計(jì)算機(jī)集成制造系統(tǒng) 2022年9期2022-10-11
- 基于LightGBM的氣象數(shù)據(jù)質(zhì)量控制方法研究*
再綜合查全率和查準(zhǔn)率選取閾值,最后獲得氣象數(shù)據(jù)質(zhì)量控制的檢測(cè)模型。將LightGBM算法引入氣象數(shù)據(jù)質(zhì)控中,能夠充分發(fā)揮算法與多維氣象數(shù)據(jù)的優(yōu)勢(shì),有效利用多維度數(shù)據(jù)之間存在的相關(guān)性,完成對(duì)某種氣象要素的預(yù)測(cè),達(dá)到質(zhì)量控制的目的。圖3 基于LightGBM的質(zhì)控算法流程圖3.2 異常數(shù)據(jù)氣象數(shù)據(jù)質(zhì)量控制的本質(zhì)是時(shí)間序列的異常檢測(cè),常見的時(shí)間序列異常有4種類型:(a)附加性異常;(b)革新性異常;(c)暫時(shí)性異常;(d)移位性異常,如圖4所示。模擬4種異常數(shù)值
海峽科學(xué) 2022年7期2022-09-01
- 基于情感計(jì)算與深度學(xué)習(xí)的彈幕文本敏感詞識(shí)別方法
效果。4.3 查準(zhǔn)率對(duì)比查準(zhǔn)率是被正確識(shí)別的樣本數(shù)與被識(shí)別樣本總數(shù)之比。設(shè),識(shí)別出的敏感詞為TP,未識(shí)別出的敏感詞為FP,查準(zhǔn)率公式如下:(6)傳統(tǒng)方法與本文方法的敏感詞查準(zhǔn)率的對(duì)比結(jié)果,如圖4所示。圖4 查準(zhǔn)率對(duì)比通過(guò)分析圖4發(fā)現(xiàn),傳統(tǒng)方法的查準(zhǔn)率偏低,原因是敏感詞識(shí)別過(guò)程中拆分較復(fù)雜,對(duì)識(shí)別結(jié)果干擾較大。而本文方法具有較高的查準(zhǔn)率,基本能夠保持在92%以上。4.4 識(shí)別時(shí)間對(duì)比2種方法的敏感詞匯識(shí)別時(shí)間見圖5,通過(guò)分析可發(fā)現(xiàn),隨著數(shù)據(jù)量的增加,傳統(tǒng)方法
常州工學(xué)院學(xué)報(bào) 2022年3期2022-07-12
- 面向變電設(shè)備金屬銹蝕檢測(cè)的分層嵌套標(biāo)注方法
點(diǎn),引入了新的查準(zhǔn)率、召回率定義.1 相關(guān)工作自AlexNet[11]在ImageNet 大賽上展現(xiàn)優(yōu)異成績(jī)后,利用CNN 進(jìn)行特征提取并進(jìn)行圖像分類的方式得到了快速發(fā)展,廣泛應(yīng)用于各種領(lǐng)域的圖像識(shí)別、目標(biāo)檢測(cè).針對(duì)金屬銹蝕檢測(cè),目前以CNN為核心的目標(biāo)檢測(cè)模型中最具是代表性是Faster RCNN 和YOLO,它們通過(guò)預(yù)定義不同尺寸形狀的anchor 來(lái)檢測(cè)不同尺寸形狀的目標(biāo)區(qū)域,可以同時(shí)解決分類和定位的問(wèn)題.目標(biāo)檢測(cè)模型的訓(xùn)練效果高度依賴于足量的和高質(zhì)
- 基于顏色網(wǎng)絡(luò)圖像檢索方法設(shè)計(jì)及應(yīng)用探討
。1.2.1 查準(zhǔn)率1.2.2 查全率查準(zhǔn)、查全率分別從準(zhǔn)確性和全面性兩個(gè)方面評(píng)價(jià)了系統(tǒng)的有效性。理論上說(shuō)是兩者的比例越大越好,但是這兩者又是矛盾體,所以本次系統(tǒng)就要求盡量使查準(zhǔn)率和查全率達(dá)成平衡。1.3 圖像檢索系統(tǒng)性能測(cè)試1.3.1 系統(tǒng)優(yōu)越性測(cè)試為了突出顏色圖像檢索技術(shù)的優(yōu)越性,選擇了更為客觀的評(píng)價(jià)方式(查準(zhǔn)率大?。赐ㄟ^(guò)檢驗(yàn)檢索圖像是否屬于同一類別進(jìn)行判定兩幅圖像是否為相似的圖像。本文從3 個(gè)圖像類別中共選擇了5幅圖像作為查詢圖像,合計(jì)15 幅圖
普洱學(xué)院學(xué)報(bào) 2021年6期2022-01-14
- 基于人工智能技術(shù)的圖書館信息檢索模型
精度、查全率、查準(zhǔn)率、查全率/查準(zhǔn)率曲線作為模型檢索性能測(cè)試指標(biāo)。用Q與R分別表示用戶查詢信息以及相關(guān)文檔集,|R|與A分別表示集合內(nèi)文檔數(shù)量以及檢索后返回的文檔集合,|A|與|Ra|分別表示文檔集合的總數(shù)量以及文檔集合R與文檔集合A內(nèi)存在相同文檔的數(shù)量,可得查全率B以及查準(zhǔn)率C,公式如下:查準(zhǔn)率/查全率曲線是指查全率以及查準(zhǔn)率分別為橫軸以及縱軸時(shí)所獲取的曲線。檢索精度是指實(shí)際檢索相關(guān)文檔數(shù)與全部檢索獲取文檔總數(shù)之比。2.3 測(cè)試結(jié)果輸入測(cè)試詞語(yǔ)時(shí),統(tǒng)計(jì)所
電子設(shè)計(jì)工程 2021年14期2021-07-30
- 智能電網(wǎng)中基于知識(shí)圖譜的語(yǔ)義搜索算法
搜索算法提高了查準(zhǔn)率和召回率。1 系統(tǒng)概述構(gòu)建知識(shí)圖譜是KGSS 算法的核心。用3 元組模型式中:E={e1,e2,…,en}為實(shí)體集合;R={r1,r2,…,rm}為實(shí)體間的關(guān)系集合;S為三元組集合S?E×R×E。采用如圖1 所示的系統(tǒng)架構(gòu)。將配電網(wǎng)中知識(shí)抽取出來(lái),利用封裝器(Wrapper)對(duì)數(shù)據(jù)進(jìn)行封裝。例如將電力行業(yè)標(biāo)準(zhǔn)、設(shè)備使用說(shuō)明,設(shè)備維護(hù)記錄,人員信息等知識(shí)進(jìn)行抽?。?-8],進(jìn)行數(shù)據(jù)封裝;再獲取知識(shí),即通過(guò)數(shù)據(jù)清洗、實(shí)體識(shí)別、實(shí)體清岐以及實(shí)
實(shí)驗(yàn)室研究與探索 2021年4期2021-05-29
- 基于機(jī)器視覺(jué)和卷積神經(jīng)網(wǎng)絡(luò)的軌道表面缺陷檢測(cè)方法
進(jìn)行了檢測(cè),但查準(zhǔn)率和召回率不夠高,距離實(shí)際應(yīng)用相差較遠(yuǎn)。本文提出一種基于機(jī)器視覺(jué)和卷積神經(jīng)網(wǎng)絡(luò)的軌道表面缺陷檢測(cè)方法。首先應(yīng)用灰度化、分割ROI(Region of Interest)、圖像形態(tài)學(xué)變換以及概率霍夫變換等機(jī)器視覺(jué)方法對(duì)圖像中的軌道進(jìn)行智能識(shí)別;然后通過(guò)中值濾波[11]和雙邊濾波[12]剔除圖像中的噪聲信息,并結(jié)合Canny算法[13],順次應(yīng)用閾值法和離散法去除偽邊緣,提取軌道的真正邊緣;最后,基于卷積神經(jīng)網(wǎng)絡(luò)建立高效的軌道表面形態(tài)分類器[
鐵道學(xué)報(bào) 2021年4期2021-05-13
- 直流XLPE電纜局部放電模式識(shí)別技術(shù)研究
用后體現(xiàn)出識(shí)別查準(zhǔn)率的缺陷,造成此現(xiàn)象的主要原因?yàn)獒槍?duì)其放電行為特征的提取不精準(zhǔn)。由此可見,傳統(tǒng)技術(shù)中存在的問(wèn)題已經(jīng)逐漸顯露出來(lái),為此,本文以直流XLPE 電纜局部放電模式為例,針對(duì)其識(shí)別技術(shù)加以優(yōu)化設(shè)計(jì),致力于從根本上提高其識(shí)別查準(zhǔn)率。1 直流XLPE電纜局部放電模式識(shí)別技術(shù)1.1 提取局部放電行為特征在局部放電模式識(shí)別中,必須預(yù)先提取局部放電行為特征。基于行為特征的實(shí)時(shí)性特點(diǎn),通過(guò)時(shí)域、頻域和時(shí)頻三類,提取其行為特征,并以幾何特征、空間、方向、匹配特征
電子技術(shù)與軟件工程 2021年3期2021-04-20
- 基于云計(jì)算的海量大數(shù)據(jù)智能清洗系統(tǒng)設(shè)計(jì)
5%以上的數(shù)據(jù)查準(zhǔn)率和召回率。關(guān)鍵詞: 云計(jì)算; 海量大數(shù)據(jù); 智能清洗系統(tǒng); 云聚類; 查準(zhǔn)率; 召回率中圖分類號(hào): TN02?34? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)03?0116?05Design of intelligent cleaning system for massive data based on cloud c
現(xiàn)代電子技術(shù) 2020年3期2020-08-04
- 基于技術(shù)特征的科技查新文獻(xiàn)檢索策略思考
兩組實(shí)驗(yàn)的平均查準(zhǔn)率。實(shí)驗(yàn)文獻(xiàn)資源為7000條,在果樹栽培的各細(xì)分領(lǐng)域,選取果樹栽培、施肥、修剪、水分等10個(gè)提問(wèn)詞,對(duì)10個(gè)提問(wèn)詞進(jìn)行初步探索,獲得提示詞的相關(guān)文獻(xiàn)共600條[8]。檢索任務(wù)在CNKI實(shí)際檢索平臺(tái)上進(jìn)行,當(dāng)完成第一個(gè)檢索動(dòng)作時(shí),根據(jù)其技術(shù)特征,設(shè)置實(shí)驗(yàn)初始值,設(shè)置單框檢索場(chǎng)獨(dú)立為74.5%,場(chǎng)依存為68.9%,多框檢索場(chǎng)獨(dú)立為18.3%,場(chǎng)依存為1.5%。實(shí)驗(yàn)中,改變兩組實(shí)驗(yàn)檢出的相關(guān)文檔數(shù),比較不同數(shù)量下的查準(zhǔn)率。第一組對(duì)比結(jié)果如下圖所
電子元器件與信息技術(shù) 2020年11期2020-04-14
- 基于一種新的級(jí)聯(lián)分類器的目標(biāo)檢測(cè)系統(tǒng)
器可以有效提高查準(zhǔn)率。關(guān)鍵詞: 目標(biāo)檢測(cè); 級(jí)聯(lián)分類器; MB?LBP; SIFT; SURF; 查準(zhǔn)率中圖分類號(hào): TN911.1?34; TP75 ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)01?0048?05An object detection system based on a new cascade classifierXIONG Kailong1,
現(xiàn)代電子技術(shù) 2020年1期2020-03-03
- 不平衡數(shù)據(jù)集的分類研究在醫(yī)療數(shù)據(jù)方面的應(yīng)用
將整體分類率、查準(zhǔn)率、召回率、f1-度量和auc 值作為模型分類效果的評(píng)價(jià)指標(biāo)。如表1所示,根據(jù)混淆矩陣可以得到以下指標(biāo),準(zhǔn)確率度量的是所有預(yù)測(cè)樣本當(dāng)中預(yù)測(cè)正確的比例,但是在面對(duì)不平衡數(shù)據(jù)集的時(shí)候,準(zhǔn)確率作為最重要的評(píng)價(jià)指標(biāo)[6],就會(huì)缺乏合理性,計(jì)算公式Accuracy=(TP+TN)/(TP+FN+FP+TN)。查準(zhǔn)率主要度量所有預(yù)測(cè)為正類的樣本當(dāng)中,被判斷正確的一個(gè)比例值,計(jì)算公式Precision=TP/(TP+FP)。召回率主要度量正類樣本當(dāng)中會(huì)
電子技術(shù)與軟件工程 2020年9期2020-02-01
- 基于遷移學(xué)習(xí)及特征融合的現(xiàn)勘圖像檢索算法
刑偵現(xiàn)勘圖像的查準(zhǔn)率方面是有效的。還有一種兩層體系現(xiàn)勘圖像檢索框架,該框架首先計(jì)算現(xiàn)勘圖像數(shù)據(jù)庫(kù)對(duì)應(yīng)的特征數(shù)據(jù)庫(kù),預(yù)先訓(xùn)練一個(gè)可實(shí)現(xiàn)多語(yǔ)義分類的支持向量機(jī)分類器模型[5]。在提交檢索圖像后,支持向量機(jī)(support vector machine, SVM)根據(jù)圖像特征自動(dòng)判定其語(yǔ)義類別,然后在僅包含該語(yǔ)義的圖像庫(kù)上進(jìn)行匹配檢索。實(shí)驗(yàn)結(jié)果表明,該方法在多個(gè)檢索指標(biāo)上優(yōu)于按例查詢(query by example, QBE)的方法,其檢索時(shí)間約為QBE方法的
西安郵電大學(xué)學(xué)報(bào) 2019年4期2019-11-25
- 基于卷積神經(jīng)網(wǎng)絡(luò)和重排序的農(nóng)業(yè)遙感圖像檢索
序結(jié)果計(jì)算類別查準(zhǔn)率,根據(jù)查詢圖像的類別權(quán)重和類別查準(zhǔn)率計(jì)算加權(quán)類別查準(zhǔn)率,最后根據(jù)加權(quán)類別查準(zhǔn)率對(duì)圖像類別進(jìn)行排序,并根據(jù)排序結(jié)果對(duì)初始檢索結(jié)果進(jìn)行重排序,從而得到最終的檢索結(jié)果。試驗(yàn)結(jié)果表明:該檢索方法在PatternNet數(shù)據(jù)集中平均查準(zhǔn)率達(dá)到97.56%,平均歸一化調(diào)整后的檢索秩達(dá)到0.020 1;在UCM_LandUse數(shù)據(jù)集中平均查準(zhǔn)率達(dá)到93.67%,平均歸一化調(diào)整后的檢索秩達(dá)到0.049 2,較之其他遙感圖像檢索方法下降0.2358,降幅超
農(nóng)業(yè)工程學(xué)報(bào) 2019年15期2019-09-24
- 結(jié)合加權(quán)Schatten-p范數(shù)與3D全變分的前景檢測(cè)
高的,查全率與查準(zhǔn)率也處于最優(yōu)或次優(yōu)狀態(tài)。由此可知,所提模型在動(dòng)態(tài)背景、惡劣天氣等復(fù)雜場(chǎng)景中能有效提高運(yùn)動(dòng)目標(biāo)的提取精確度,且提取的前景目標(biāo)視覺(jué)效果較好。關(guān)鍵詞:?低秩稀疏分解;前景檢測(cè);加權(quán)Schatten-p范數(shù);3D全變分中圖分類號(hào):TP391.4文獻(xiàn)標(biāo)志碼:A文章編號(hào):1001-9081(2019)04-1170-06Abstract: In view of the fact that the low rank and sparse methods
計(jì)算機(jī)應(yīng)用 2019年4期2019-08-01
- 基于分塊sim-min-Hash的近似圖像檢索
明,PsmH在查準(zhǔn)率、查全率和速度方面都大大強(qiáng)于min-Hash以及sim-min-Hash。并且PsmH更加容易實(shí)現(xiàn),只要在sim-min-Hash算法的基礎(chǔ)上,增加分塊大小和重疊門限兩個(gè)參數(shù)的設(shè)置即可。3.2 PsmH算法來(lái)比較圖像相似性的實(shí)現(xiàn)過(guò)程設(shè)一共有i幅圖像,首先將每幅圖像被分為p個(gè)相等的矩形區(qū)域(p1,p2,…,pp),每個(gè)區(qū)域就被稱為一個(gè)分塊。然后,對(duì)每個(gè)分塊分別進(jìn)行提取SIFT描述子,并對(duì)所有SIFT描述子集合,進(jìn)行K-means聚類,而不
計(jì)算機(jī)應(yīng)用與軟件 2019年7期2019-07-15
- 面向短文本分類的特征提取與算法研究
價(jià)指標(biāo):精度、查準(zhǔn)率、查全率與F1值。在二分類問(wèn)題中,根據(jù)樣本真實(shí)類別與模型預(yù)測(cè)結(jié)果的組合定義真正例(True Positive,TP)、假正例(False Positive,FP)、真反例(True Negative,TN)、假反例(False Negative,FN),分類結(jié)果混淆矩陣如表2所示[9]。表2 分類結(jié)果混淆矩陣3.2.1 精度精度是分類正確的樣本數(shù)在總樣本數(shù)中的比例。精度acc定義為:(4)精度是分類任務(wù)中最常用、最基本但同時(shí)也是最重要的
網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2019年5期2019-05-27
- 基于Gamma隸屬度的車輛圖像檢索算法
檢索的要求,但查準(zhǔn)率較低。運(yùn)用非均勻量化、三角形和梯形模糊隸屬度對(duì)車輛圖片顏色進(jìn)行量化,可在歐氏距離和加權(quán)距離相似度量下,對(duì)車輛圖像庫(kù)進(jìn)行檢索[9];將Vague集引入模糊量化,通過(guò)梯形隸屬度函數(shù)得到任意顏色在模糊區(qū)域的Vague隸屬度值,根據(jù)歐式距離得到相似圖像[10]。上述隸屬度函數(shù)在對(duì)顏色進(jìn)行分類時(shí),區(qū)間寬度是由人為設(shè)置,具有較大的主觀性。為了提高基于顏色特征的車輛圖像檢索的準(zhǔn)確率,本文提出一種基于Gamma隸屬度的車輛圖像檢索算法。利用廣義直方圖提
西安郵電大學(xué)學(xué)報(bào) 2019年1期2019-05-05
- 多方強(qiáng)隱私保護(hù)記錄鏈接方法*
到高查全率和高查準(zhǔn)率,主要源自于如下兩方面:一方面,分塊后還會(huì)生成過(guò)多真實(shí)情況下并不匹配的候選記錄組,造成額外的計(jì)算代價(jià);另一方面,分塊后損失真實(shí)匹配的記錄組,未對(duì)其進(jìn)行匹配計(jì)算。而已有PPRL中的匹配方法大多適應(yīng)于兩個(gè)數(shù)據(jù)方間的記錄鏈接,而多個(gè)數(shù)據(jù)方間的匹配方法[6-10]均不能同時(shí)達(dá)到強(qiáng)隱私性和高效性。強(qiáng)隱私保護(hù)記錄鏈接可完全防止攻擊方的攻擊,而現(xiàn)有的多方強(qiáng)隱私保護(hù)下的匹配方法均具有很高的匹配計(jì)算代價(jià),導(dǎo)致匹配時(shí)間過(guò)長(zhǎng),使其不適用于大數(shù)據(jù)環(huán)境下的記錄鏈
計(jì)算機(jī)與生活 2019年3期2019-04-18
- 海量圖書館檔案信息的快速檢索方法
信息的查全率和查準(zhǔn)率。因此,提出一種基于模糊集的海量圖書館檔案信息快速檢索方法。利用多個(gè)向量代表檔案信息的對(duì)象,建立特征向量模型對(duì)圖書館檔案信息進(jìn)行處理,需要在數(shù)據(jù)庫(kù)中對(duì)檔案信息的語(yǔ)義索引和語(yǔ)義特征向量進(jìn)行處理。在對(duì)圖書館檔案信息處理完成的基礎(chǔ)上,計(jì)算索引項(xiàng)在檔案信息中的頻率,并且計(jì)算索引項(xiàng)的大小來(lái)決定檔案信息項(xiàng)位置的權(quán)重,對(duì)圖書館檔案信息檢索式進(jìn)行量化和劃分,并建立權(quán)重向量,獲得檔案信息向量,利用檔案信息向量計(jì)算相似度函數(shù),最終實(shí)現(xiàn)模糊集的圖書館檔案信息
現(xiàn)代電子技術(shù) 2018年20期2018-10-24
- 中國(guó)最具影響力的綜合搜索引擎比較研究
能、響應(yīng)時(shí)間、查準(zhǔn)率、個(gè)性化服務(wù)等五個(gè)方面,對(duì)中國(guó)市場(chǎng)目前最具影響力的三種綜合搜索引擎百度、谷歌、360進(jìn)行比較研究,總結(jié)了三種搜索引擎的優(yōu)勢(shì)與不足,提出合理選擇搜索引擎的策略和提高檢索效率的技巧。關(guān)鍵詞:搜索引擎;數(shù)據(jù)庫(kù)更新;檢索功能;響應(yīng)時(shí)間;查準(zhǔn)率;個(gè)性化服務(wù)中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)17-0211-03Abstract: How to choose the best search engine
電腦知識(shí)與技術(shù) 2018年17期2018-09-13
- 基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)信息過(guò)濾系統(tǒng)設(shè)計(jì)
證,其查全率及查準(zhǔn)率的調(diào)和平均值較高,具有一定的優(yōu)勢(shì)。關(guān)鍵詞: 網(wǎng)絡(luò)信息過(guò)濾; 數(shù)據(jù)挖掘; 網(wǎng)絡(luò)安全; 數(shù)據(jù)采集; 調(diào)和平均值; 查準(zhǔn)率中圖分類號(hào): TN711?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)16?0051?04Abstract: Network information filtering is of great significance in improving network security perf
現(xiàn)代電子技術(shù) 2018年16期2018-08-21
- 基于動(dòng)態(tài)用戶畫像的信息推薦研究①
,所以這里選用查準(zhǔn)率作為驗(yàn)證標(biāo)準(zhǔn).3.3 實(shí)驗(yàn)結(jié)果推薦列表長(zhǎng)度對(duì)多用戶平均查準(zhǔn)率具有較大的影響,如果取值太則小無(wú)法說(shuō)明推薦方法的可行性,取值過(guò)大會(huì)造成結(jié)果難以預(yù)估[2](查準(zhǔn)率可能偏大也可能偏小).圖2為推薦列表長(zhǎng)度與查準(zhǔn)率的關(guān)系:圖2 查準(zhǔn)率測(cè)試列表長(zhǎng)度的實(shí)驗(yàn)條件是優(yōu)化過(guò)的,所以查準(zhǔn)率可能較高.經(jīng)過(guò)多次試驗(yàn)最后設(shè)定列表長(zhǎng)度為100,那么兩種推薦方式的查準(zhǔn)率和時(shí)間序列的關(guān)系如圖3所示.圖3 查準(zhǔn)率對(duì)比從圖中可以看出,在時(shí)間序列的一開始,BDUPR的查準(zhǔn)率并
計(jì)算機(jī)系統(tǒng)應(yīng)用 2018年6期2018-06-14
- 視頻檢索中的鏡頭邊界檢測(cè)方法研究
高了視頻檢索的查準(zhǔn)率和查全率,但依然可以進(jìn)一步改進(jìn)。視頻檢索,對(duì)視頻進(jìn)行鏡頭分割是第一步。對(duì)視頻進(jìn)行邊界檢測(cè),將視頻從檢測(cè)到的邊界處依次分割開,形成一個(gè)個(gè)獨(dú)立鏡頭的過(guò)程即為鏡頭分割。鏡頭的轉(zhuǎn)換方式分為突變鏡頭和漸變鏡頭兩種。突變鏡頭算法包括:基于直方圖的鏡頭切變檢測(cè)方法、基于像素比較的鏡頭邊界檢測(cè)方法、基于邊緣檢測(cè)的鏡頭邊界檢測(cè)方法和基于壓縮視頻的鏡頭邊界檢測(cè)方法。漸變鏡頭算法包括:雙閾值法[1]、模型法、聚類和模糊聚類法。文獻(xiàn)[2]提出了基于多特征的視頻
沈陽(yáng)理工大學(xué)學(xué)報(bào) 2018年6期2018-03-20
- 基于詞嵌入語(yǔ)義的精準(zhǔn)檢索式構(gòu)建方法
無(wú)關(guān)文獻(xiàn),導(dǎo)致查準(zhǔn)率較低。[方法/過(guò)程]針對(duì)這兩類問(wèn)題,本文提出使用詞嵌入這一新穎的文本數(shù)據(jù)化表現(xiàn)形式,一方面通過(guò)語(yǔ)義分析對(duì)檢索關(guān)鍵詞進(jìn)行擴(kuò)充從而提高查全率;另一方面通過(guò)發(fā)現(xiàn)語(yǔ)義異常點(diǎn)來(lái)提高查準(zhǔn)率。[結(jié)果/結(jié)論]本文將該方法應(yīng)用于人工智能領(lǐng)域中深度學(xué)習(xí)方向上的文獻(xiàn)檢索式構(gòu)建,實(shí)驗(yàn)結(jié)果表明該方法能在一定程度上提高檢索的查全率和查準(zhǔn)率。〔關(guān)鍵詞〕 深度學(xué)習(xí);詞嵌入;查準(zhǔn)率;查全率;檢查式構(gòu)建DOI:10.3969/j.issn.1008-0821.2018.1
現(xiàn)代情報(bào) 2018年11期2018-01-07
- 大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
文本信息挖掘的查準(zhǔn)率,而且具有較強(qiáng)的可擴(kuò)展性。關(guān)鍵詞: 大數(shù)據(jù); 文本信息; 信息挖掘; 查準(zhǔn)率中圖分類號(hào): TN911.1?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)23?0123?04Abstract: The text information mining is helpful to improve the efficiency of text information retrieval and utilizat
現(xiàn)代電子技術(shù) 2017年23期2017-12-20
- 基于CNN特征和標(biāo)簽信息融合的圖像檢索
高了圖像檢索的查準(zhǔn)率。卷積神經(jīng)網(wǎng)絡(luò); CNN特征; 標(biāo)簽; 圖像檢索0 引 言隨著Internet的高速發(fā)展,圖像信息快速增長(zhǎng),如何從海量的數(shù)字圖像集合中快速提取有價(jià)值的內(nèi)容已經(jīng)成為人們的迫切需求[1]?;趦?nèi)容的圖像檢索(CBIR)應(yīng)運(yùn)而生,它是一門直接從查詢圖像的底層特征(如顏色、形狀、紋理等)出發(fā),通過(guò)特征匹配,在圖像庫(kù)中找出與之相似的圖像,從而實(shí)現(xiàn)檢索的技術(shù)。幾十年來(lái),盡管研究者們進(jìn)行了廣泛的研究,獲得了大量的成果,但仍有一個(gè)難題阻礙著CBIR系統(tǒng)
- 利用RNNLM面向主題的特征定位方法*
征定位相比較,查準(zhǔn)率提高8.61%和2.61%,表明該方法具有較優(yōu)的查準(zhǔn)率。軟件特征定位;軟件演化;RNNLM;主題建模1 引言特征定位(feature location)[1]也被稱為概念定位(concept location)[2-3]或者軟件偵測(cè)(software reconnaissance)[4],是程序理解領(lǐng)域一個(gè)重要的組成部分[5-6]。該研究旨在建立特征與源代碼之間映射關(guān)系,而特征(features)[1]是指可被定義和評(píng)估的軟件功能屬性。
計(jì)算機(jī)與生活 2017年10期2017-10-12
- 基于上下文敏感的貝葉斯網(wǎng)絡(luò)及方向關(guān)系的遙感圖像檢索
,并具有較高的查準(zhǔn)率和檢索效率,可滿足用戶的需求。圖像檢索; 上下文敏感的貝葉斯網(wǎng)絡(luò)(CSBN); 方向關(guān)系; 平均高頻信號(hào)強(qiáng)度(AHFSS); 雙重語(yǔ)義檢索0 引言由于圖像空間分辨率的不斷提高,遙感圖像海量數(shù)據(jù)管理、訪問(wèn)及應(yīng)用的難度變得越來(lái)越大,因此,如何在大型數(shù)據(jù)庫(kù)中進(jìn)行高效的圖像檢索成為研究的難點(diǎn)[1-2]?;趦?nèi)容的圖像檢索,是指用戶提交樣本圖像,借助色調(diào)、紋理和形狀等低層特征,在數(shù)據(jù)庫(kù)中檢索出具有相同或相似內(nèi)容圖像的過(guò)程[3]; 但由于人類與計(jì)算
自然資源遙感 2017年3期2017-09-21
- 基于潛語(yǔ)義主題加強(qiáng)的跨媒體檢索算法
檢索文本的平均查準(zhǔn)率為57.0%,比典型相關(guān)性分析(CCA)、SM(Semantic Matching)、SCM(Semantic Correlation Matching)算法的平均查準(zhǔn)率分別提高了35.1%、34.8%、32.1%。實(shí)驗(yàn)結(jié)果表明LSTR算法能有效地提高跨媒體檢索的平均查準(zhǔn)率??缑襟w檢索;潛語(yǔ)義主題;多分類邏輯回歸;后驗(yàn)概率;正則化0 引言當(dāng)前,現(xiàn)實(shí)世界中的很多應(yīng)用都涉及多模態(tài)文件,在多模態(tài)文件里信息由不同模態(tài)的數(shù)據(jù)組成,例如一篇新聞文章
計(jì)算機(jī)應(yīng)用 2017年4期2017-06-27
- 面向開源軟件的演化確認(rèn)方法*
會(huì)使用查全率和查準(zhǔn)率作為衡量指標(biāo),并通過(guò)這兩個(gè)指標(biāo)來(lái)對(duì)輸出結(jié)果進(jìn)行評(píng)價(jià)[40]。定義2Recall表示查全率,correct代表所需查找的演化文件,retrieved代表使用本文方法查找出來(lái)的文件,則查全率的定義為:查全率,也稱為召回率,是指檢出的相關(guān)文獻(xiàn)量與檢索系統(tǒng)中相關(guān)文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)檢出相關(guān)文獻(xiàn)能力的尺度。定義3 Precision表示查準(zhǔn)率,correct代表所需查找的演化文件,retrieved代表使用本文方法查找出來(lái)的文件,則
計(jì)算機(jī)與生活 2017年4期2017-04-17
- 高校圖書館資源發(fā)現(xiàn)系統(tǒng)中文檢索性能比較分析
時(shí)間、查全率、查準(zhǔn)率、重復(fù)率等指標(biāo)的分析,反映檢索結(jié)果能在多大程度上滿足用戶的需求。傳統(tǒng)意義上的響應(yīng)時(shí)間是指從用戶發(fā)出檢索指令,到檢索系統(tǒng)返回檢索結(jié)果所需要的時(shí)間,響應(yīng)時(shí)間與用戶的檢索體驗(yàn)密切相關(guān)。一般而言,響應(yīng)時(shí)間越短,用戶負(fù)擔(dān)越小,用戶體驗(yàn)也相對(duì)越好。查全率和查準(zhǔn)率由J.W.Perry和A.Kent提出[3]。查全率是用于刻畫檢索系統(tǒng)在執(zhí)行某一檢索指令時(shí),檢出相關(guān)文獻(xiàn)能力的一種指標(biāo),傳統(tǒng)的計(jì)算方法是指檢索出的相關(guān)信息量與系統(tǒng)中所有相關(guān)信息量的比值[4]
國(guó)家圖書館學(xué)刊 2016年6期2017-01-04
- 基于小波方向波變換和灰度共生矩陣的紋理圖像檢索
檢索效果,平均查準(zhǔn)率有較大的提高.圖像檢索;小波方向波變換;灰度共生矩陣;特征提取在基于內(nèi)容的圖像檢索系統(tǒng)中,提取圖像的特征是一關(guān)鍵步驟,而合適的特征向量可以有效地提高圖像檢索的精確度,那么如何有效地表示圖像信息就成為圖像特征提取的關(guān)鍵問(wèn)題.為了尋找有效的圖像信息表示方法,眾多研究者提出了一些能夠提供圖像的稀疏表示的多尺度幾何分析方法[1-5],其中基于整數(shù)格的完全重構(gòu)和臨界采樣的多方向各向異性變換——方向波變換(directionlet transfor
- 一種新的基于矢量量化的圖像檢索算法
驗(yàn)比較查全率和查準(zhǔn)率,找到較為滿意的門限值,使檢索算法更加完善。實(shí)驗(yàn)結(jié)果表明,該算法能有效地提高圖像檢索精準(zhǔn)度。HSI空間圖像特征矢量量化門限值0 引 言隨著信息技術(shù)的發(fā)展,生活中不斷地生成大量的圖片,它們都是無(wú)序的、無(wú)索引的。目前,我們面臨的一個(gè)問(wèn)題就是如何從這些海量的圖片里快速而準(zhǔn)確地檢索到我們想要查詢的圖片。因此,基于內(nèi)容的圖像檢索成為了當(dāng)下一個(gè)研究的熱點(diǎn)?;贑BIR[1]技術(shù)主要依據(jù)圖像所具有顏色(灰度)、紋理、形狀、空間關(guān)系等特征[2],提取這
計(jì)算機(jī)應(yīng)用與軟件 2016年3期2016-09-26
- 基于臨床領(lǐng)域本體的語(yǔ)義信息檢索模型研究
模型在查全率和查準(zhǔn)率上效率較低,在臨床領(lǐng)域本體的基礎(chǔ)上,通過(guò)分析和討論了改進(jìn)的概念間語(yǔ)義相似度和相關(guān)度混合計(jì)算方法,提出基于臨床領(lǐng)域本體的語(yǔ)義信息檢索模型。實(shí)驗(yàn)結(jié)果表明,該混合計(jì)算方法是可行性的,能有效提高語(yǔ)義信息檢索模型的查準(zhǔn)率。關(guān)鍵詞:臨床領(lǐng)域本體;語(yǔ)義相似度計(jì)算;信息檢索模型;查全率;查準(zhǔn)率1概述在網(wǎng)絡(luò)技術(shù)和信息技術(shù)飛速發(fā)展的今天,信息資源飛速增長(zhǎng),用戶更多關(guān)注的是如何在海量的信息資源中快速高效地獲取所需要的知識(shí)。傳統(tǒng)的Web服務(wù)是通過(guò)關(guān)鍵字或關(guān)鍵字
常州工學(xué)院學(xué)報(bào) 2016年2期2016-06-13
- 一種軟件演化活動(dòng)波及效應(yīng)混合分析方法
析范圍,提高了查準(zhǔn)率.為驗(yàn)證方法的有效性,對(duì)開源軟件jEdit分別使用動(dòng)態(tài)、靜態(tài)、基于文本、基于歷史演化知識(shí)和混合分析方法進(jìn)行波及效應(yīng)分析.通過(guò)比對(duì)實(shí)驗(yàn)結(jié)果,表明混合波及效應(yīng)分析方法具有較好的綜合性能.關(guān)鍵詞波及效應(yīng)分析;動(dòng)態(tài)波及效應(yīng)分析;基于領(lǐng)域知識(shí)的降噪;演化活動(dòng)最小完備集;關(guān)聯(lián)規(guī)則挖掘確定演化活動(dòng)潛在影響范圍的過(guò)程稱之為波及效應(yīng)分析[1].波及效應(yīng)分析是可追蹤性分析(traceability analysis)、演化代價(jià)估計(jì)(evolving cos
計(jì)算機(jī)研究與發(fā)展 2016年3期2016-04-27
- 基于SVD的經(jīng)編賈卡織物圖像檢索*
,引入查全率和查準(zhǔn)率的概念。查全率和查準(zhǔn)率是判斷檢索效果的常用方法。查準(zhǔn)率是指返回的結(jié)果中相關(guān)圖像的數(shù)目和已檢索出的圖像數(shù)目之間的比值;查全率是指返回的結(jié)果中相關(guān)圖像與所有相關(guān)圖像的數(shù)目之間的比值。分別定義為:圖2 中,(a)、(c) 表示 SVD 圖像檢索的結(jié)果,(b)、(d)表示顏色直方圖檢索結(jié)果。根據(jù)圖2可見,本文算法有良好的檢索效果。比較第一組實(shí)驗(yàn)圖(a)和(b),對(duì)于SVD圖像檢索,顯示的12幅圖像中,有9幅圖像與原織物圖像相似,查準(zhǔn)率為75%,
網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2015年19期2015-09-21
- 查詢擴(kuò)展技術(shù)在跨語(yǔ)言信息檢索中的應(yīng)用
檢索性能,使用查準(zhǔn)率和查全率兩個(gè)指標(biāo)來(lái)衡量。查準(zhǔn)率是指檢出的相關(guān)文檔與檢出文檔總數(shù)的比值,查全率是指檢出的相關(guān)文檔與相關(guān)文檔總數(shù)的比值[13]。查準(zhǔn)率用來(lái)衡量系統(tǒng)的檢索精度,查全率用來(lái)衡量系統(tǒng)檢出相關(guān)文檔的能力。實(shí)驗(yàn)運(yùn)行環(huán)境如下:CPU:Intel Pentium Dual-Core E5200、內(nèi)存:4GB、硬盤:希捷250GB、操作系統(tǒng):Windows 7 Ultimate。實(shí)驗(yàn)所用的檢索文檔全部來(lái)源于新華網(wǎng),共計(jì)300篇英文文檔,內(nèi)容涵蓋科技、健康、
現(xiàn)代計(jì)算機(jī) 2015年2期2015-05-15
- 淺議電子信息檢索
都能達(dá)到較高的查準(zhǔn)率和查全率,獲得滿意的效果。1 聯(lián)機(jī)信息檢索因此,多年來(lái)DIALOG系統(tǒng)一直是我國(guó)科技查新工作中的主要檢索工具,同時(shí)也是國(guó)內(nèi)科技、經(jīng)濟(jì)信息檢索服務(wù)中利用率最高的國(guó)際聯(lián)機(jī)檢索系統(tǒng)。在進(jìn)行國(guó)際聯(lián)機(jī)檢索時(shí),一般可采取下列幾個(gè)步驟:1.1 先試檢摸底國(guó)際聯(lián)機(jī)檢索前最好先對(duì)相應(yīng)的檢索刊物進(jìn)行手工試檢,或利用因特網(wǎng)搜索相關(guān)信息,了解專業(yè)文獻(xiàn)分布情況,初步估算文獻(xiàn)量,以便確定相應(yīng)的聯(lián)機(jī)檢索方案;手檢(或因特網(wǎng)搜索)摸底有助于準(zhǔn)確地掌握專業(yè)用詞,以提高下
電子世界 2015年18期2015-03-26
- 二維最大熵模型在圖像分類算法中的應(yīng)用研究
算法具有更高的查準(zhǔn)率.視覺(jué)詞袋; 二維最大熵; 圖像分類; 樣本直方圖伴隨大數(shù)據(jù)時(shí)代的到來(lái),數(shù)字圖像數(shù)量呈指數(shù)級(jí)增長(zhǎng),如何讓計(jì)算機(jī)自動(dòng)理解圖像內(nèi)容,盡可能準(zhǔn)確理解圖像所表達(dá)的含義,即圖像分類技術(shù),一直是計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)、模式識(shí)別等領(lǐng)域的研究熱點(diǎn)之一.一套完整的圖像分類系統(tǒng)包含如下兩個(gè)模塊:底層特征的表達(dá)和分類器的訓(xùn)練.其中,底層特征的表達(dá)又可細(xì)分為底層特征的選擇和提取、特征空間的聚類和相似性度量這幾個(gè)步驟.視覺(jué)詞袋((bag of visual wor
- 綜合顏色塊的直方圖圖像檢索算法
算法具有較好的查準(zhǔn)率和查全率,對(duì)色塊明顯的圖像檢索效果尤其顯著.圖像檢索; 顏色直方圖; 顏色塊; 特征向量伴隨著數(shù)字信息化和因特網(wǎng)技術(shù)的普及,數(shù)字圖像資源的增長(zhǎng)速度越來(lái)越快.要對(duì)大規(guī)模的并且正在不斷增加的圖像集進(jìn)行人工的自由文本描述就顯得力不從心,不能適應(yīng)網(wǎng)絡(luò)多媒體信息檢索的要求.90年代以后,基于內(nèi)容的圖像檢索(CBIR)技術(shù)應(yīng)運(yùn)而生,從圖像自身內(nèi)容信息的角度來(lái)檢索圖像庫(kù)[1-2].圖像特征的提取與描述是該技術(shù)的基礎(chǔ),目前主要采用圖像的底層視覺(jué)特征(如
- 具有旋轉(zhuǎn)不變性的輪胎紋理特征提取
表示所給方法的查準(zhǔn)率為47.5%,優(yōu)于小波變換算法的35.5%和曲波變換算法的41.17%。輪胎花紋紋理特征;曲波變換;能量分布;圖像檢索刑事犯罪現(xiàn)場(chǎng)和交通事故現(xiàn)場(chǎng)的輪胎痕跡是一種重要的案情線索,若能從龐大的數(shù)據(jù)庫(kù)中快速準(zhǔn)確地找出與之匹配的目標(biāo)圖像,對(duì)于幫助警方破案十分重要。有效的輪胎紋理特征提取方法是快速查找目標(biāo)圖像的關(guān)鍵。紋理特征反映了圖像灰度值的變化,是圖像的重要底層特征之一,是物體材料本身自有特性,不隨外界改變而改變[1]。輪胎花紋圖像具有紋理復(fù)雜
西安郵電大學(xué)學(xué)報(bào) 2015年6期2015-02-27
- 基于T-Graph算法的主題爬蟲研究
對(duì)通用網(wǎng)絡(luò)爬蟲查準(zhǔn)率低、信息冗余大等缺點(diǎn),主題網(wǎng)絡(luò)爬蟲應(yīng)運(yùn)而生。主題爬行算法主要分為基于內(nèi)容分析的主題相關(guān)性算法和基于鏈接結(jié)構(gòu)的主題相關(guān)性算法兩大類?;趦?nèi)容分析的主題相關(guān)性算法有Best First Search、Fish Search以及Shark Search等算法,這類算法只注重文本內(nèi)容在主題搜索上的重要性,忽略了Web超鏈接結(jié)構(gòu)的作用,易出現(xiàn) “隧道”問(wèn)題?;阪溄咏Y(jié)構(gòu)的主題相關(guān)性算法主要有PageRank算法和HITS算法,這類算法只考慮了鏈接
計(jì)算機(jī)工程與設(shè)計(jì) 2014年9期2014-12-23
- 基于三種顏色分量歸一化累積直方圖的圖像檢索系統(tǒng)設(shè)計(jì)
,主要使用的是查準(zhǔn)率和查全率兩個(gè)指標(biāo)。查準(zhǔn)率的含義是在一次查詢過(guò)程中,系統(tǒng)返回查詢結(jié)果中相關(guān)圖像的數(shù)目占所有返回?cái)?shù)目的比例;查全率則指系統(tǒng)返回查詢結(jié)果中相關(guān)圖像的數(shù)目占圖像庫(kù)中所有相關(guān)圖像數(shù)目的比例。用戶在評(píng)價(jià)查詢結(jié)果時(shí),可以預(yù)先確定某些圖像作為查詢的相關(guān)圖像,然后根據(jù)系統(tǒng)返回的結(jié)果來(lái)計(jì)算查準(zhǔn)率和查全率。這兩個(gè)指標(biāo)的值越高說(shuō)明檢索方法的效果越好。本文采用了微軟商品圖像庫(kù),其中存入了5000幅商品圖像,取出500張作為檢索圖片,分成了4類,每類50張圖片,檢
電子測(cè)試 2014年5期2014-11-15
- 基于關(guān)鍵詞的云計(jì)算語(yǔ)義文本自適應(yīng)分類
,稱為知識(shí)點(diǎn)的查準(zhǔn)率[4],記為:其中,B表示人工判斷不是關(guān)鍵詞而機(jī)器判斷是關(guān)鍵詞的數(shù)量。定義4人工提取和自動(dòng)提取均判斷為關(guān)鍵詞的數(shù)量與人工提取和自動(dòng)提取均判斷為關(guān)鍵詞的數(shù)量、人工提取為關(guān)鍵詞而自動(dòng)提取為非關(guān)鍵詞的數(shù)量之和的比值,稱為召回率[4],記為:其中,C表示人工判斷是關(guān)鍵詞而機(jī)器判斷不是關(guān)鍵詞的數(shù)量。定義5查準(zhǔn)率與召回率的乘積的2倍與2個(gè)和的比值稱為查準(zhǔn)率P和召回率R的調(diào)和[4],記為:其中,P為查準(zhǔn)率;R為召回率。定義6節(jié)點(diǎn)查準(zhǔn)率P和召回率R的調(diào)
計(jì)算機(jī)工程 2014年7期2014-09-29
- 基于顏色特征和空間特征的圖像檢索
各個(gè)查全率下的查準(zhǔn)率,來(lái)獲取平均查準(zhǔn)率。通過(guò)公式(2)計(jì)算圖片之間的差異,將檢索結(jié)果進(jìn)行排序,越靠前則與待檢索圖片的相似度越高。圖1為大象和馬的檢索結(jié)果,可見排在前50位的檢索結(jié)果正確率較高,算法對(duì)于恐龍和花檢索效果更佳。檢索結(jié)果混雜了形狀相近的其他分類的圖像,這是由于該方法使用灰度圖進(jìn)行檢索,雖然保留了圖像的結(jié)構(gòu)特征,但顏色特征不足。圖1 基于分塊的搜索結(jié)果文中使用的查準(zhǔn)率分為兩種情況:確定查全率的查準(zhǔn)率和確定檢出結(jié)果數(shù)量的查準(zhǔn)率,第一種情況的查準(zhǔn)率為其
成都信息工程大學(xué)學(xué)報(bào) 2014年5期2014-01-05
- 基于Nutch的頁(yè)面排序算法研究
果的效果通常由查準(zhǔn)率來(lái)衡量查找過(guò)濾不相關(guān)文檔的能力,本實(shí)驗(yàn)重點(diǎn)檢查排序算法改進(jìn)后的查準(zhǔn)率,即前N個(gè)查詢結(jié)果中和查詢相關(guān)的網(wǎng)頁(yè)數(shù)與N的比率。本實(shí)驗(yàn)將一些食品安全的網(wǎng)站(中國(guó)食品安全網(wǎng)、擲出窗外等)首頁(yè)地址作為Nutch爬蟲的入口地址集合,總共爬取了11 275張網(wǎng)頁(yè),把這些網(wǎng)頁(yè)作為實(shí)驗(yàn)文檔集。對(duì)Nutch網(wǎng)頁(yè)排序算法改進(jìn)之后,通過(guò)在搜索頁(yè)面輸入查詢?cè)~,進(jìn)行Nutch改進(jìn)前后查準(zhǔn)率和排序效果的對(duì)比實(shí)驗(yàn)。在實(shí)驗(yàn)中選擇了食品安全方面的4個(gè)關(guān)鍵字進(jìn)行搜索。對(duì)每十條記
- 一種基于匿名區(qū)域變換的位置隱私保護(hù)方法
性能分析本節(jié)從查準(zhǔn)率、查詢開銷、匿名性3個(gè)方面來(lái)衡量本文算法的性能。其中,查準(zhǔn)率用來(lái)衡量服務(wù)器的服務(wù)質(zhì)量,采用用戶查詢結(jié)果所占實(shí)際用戶查詢結(jié)果的比例來(lái)表示;查詢開銷即用戶采用匿名區(qū)域變換算法所用時(shí)間開銷和通信開銷;匿名性用攻擊者所能推斷的用戶隱私區(qū)域大小來(lái)衡量。5.1 查準(zhǔn)率定義 3 對(duì)任意Node∈CR(匿名區(qū)域)進(jìn)行范圍查詢,假設(shè)Node1, Node2,… ,N oden進(jìn)行范圍查詢返回的區(qū)域分別為C1, C2,… ,Cn,則位置訪問(wèn)服務(wù)器返回的結(jié)果
計(jì)算機(jī)工程 2013年1期2013-09-29
- 基于空間金字塔的鏡頭檢測(cè)
文獻(xiàn)在查全率和查準(zhǔn)率上都有很大的提高。3 空間金字塔3.1 分塊空間金字塔空間金字塔是一種考慮圖像的全局像素信息的方法。文獻(xiàn)[5]使用的是如圖1所示的空間金字塔方法。圖1 空間金字塔及各層量化信息從圖1可以看出,隨著層數(shù)的增加,分的小塊越來(lái)越多、越來(lái)越細(xì),考慮的位置信息越來(lái)越多,相對(duì)地,每一塊的像素信息直方圖的劃分會(huì)越來(lái)越粗糙。算法如下:圖像 f(x,y)在單個(gè)維度上像素所屬塊的位置確定為:其中a表示行和列分的塊數(shù)(本文中要求行和列分的塊數(shù)相同),widt
計(jì)算機(jī)工程與應(yīng)用 2013年11期2013-08-04
- 基于最大相似類別和位置熵的三維模型融合檢索方法
準(zhǔn)則實(shí)驗(yàn)結(jié)果用查準(zhǔn)率-查全率曲線、平均查準(zhǔn)率、前 50%查全率上的平均查準(zhǔn)率、BEP、R-Precision、和最近鄰檢索精度來(lái)評(píng)價(jià)檢索性能[10]。其中查準(zhǔn)率-查全率曲線比較全面地描述了檢索性能,是較重要的一種性能評(píng)價(jià)標(biāo)準(zhǔn)。其他每種指標(biāo)各有側(cè)重點(diǎn),一種指標(biāo)評(píng)價(jià)算法某一方面的優(yōu)劣,如最近鄰檢索精度表示當(dāng)返回檢索結(jié)果數(shù)為1時(shí)的正確率;R-Precision表示返回模型數(shù)為( ni表示與查詢模型相關(guān)的模型數(shù))時(shí)的查準(zhǔn)率;BEP表示返回模型數(shù)為時(shí)的查全率;平均查
圖學(xué)學(xué)報(bào) 2013年5期2013-03-16
- 基于顏色特征的電視圖像檢索
方法有很多,如查準(zhǔn)率與查全率法、排序值評(píng)法、ANMRR法[4]等,但比較常用的還是查準(zhǔn)率與查全率法。查準(zhǔn)率與查全率是較為直觀且具有通用性的檢索性能客觀評(píng)價(jià)指標(biāo)。查全率是指一次檢索后,返回用戶的檢索結(jié)果中有效結(jié)果的數(shù)目和數(shù)據(jù)庫(kù)中存儲(chǔ)的與該分類圖像總數(shù)之比。查準(zhǔn)率是在該次檢索后,返回用戶的檢索結(jié)果中有效結(jié)果的數(shù)目同返回用戶的圖片數(shù)目之比。查準(zhǔn)率的數(shù)學(xué)定義為查全率的數(shù)學(xué)定義為式中:a代表正確檢索出的相關(guān)圖像數(shù)目;b代表檢索出的無(wú)關(guān)圖像;c代表漏檢的相關(guān)圖像數(shù)目;
電視技術(shù) 2012年8期2012-06-25
- 中國(guó)石油石化專利信息平臺(tái)三級(jí)導(dǎo)航的開發(fā)和運(yùn)用
“查全率”與“查準(zhǔn)率”,優(yōu)先考慮“查準(zhǔn)率”,“查準(zhǔn)率”達(dá)到70%以上;2)將明顯的誤中使用“邏輯非”去掉;3)三級(jí)導(dǎo)航類別相互關(guān)聯(lián)的,原則上去重;4)關(guān)鍵詞與IPC分類(國(guó)際專利分類)相結(jié)合的方法,將每一類命中量控制在500篇上下為佳;小類分得是否準(zhǔn)確要在檢索過(guò)程驗(yàn)證,命中量過(guò)低考慮部分小類之間需要并項(xiàng);5)命中量高,檢索條件從嚴(yán);命中量低,檢索條件從寬;6)命中量過(guò)高,如數(shù)量達(dá)到千條以上,則考慮將該類目上調(diào)至二級(jí)導(dǎo)航,將其類別細(xì)化或?qū)Ψ诸惡蟮臄?shù)據(jù)采集采用
科技傳播 2012年14期2012-02-01
- 基于刻面分類的ERP構(gòu)件檢索
檢索的查全率和查準(zhǔn)率,并且有較好的檢索效率。2 刻面分類技術(shù)介紹刻面分類檢索方法[2-3]是通過(guò)反映構(gòu)件本質(zhì)特性的視角(刻面)對(duì)構(gòu)件進(jìn)行精確的分類。一個(gè)刻面分類模式由一組描述構(gòu)件本質(zhì)特性的刻面組成,每個(gè)刻面從不同的側(cè)面對(duì)構(gòu)件庫(kù)中的構(gòu)件進(jìn)行分類。每個(gè)刻面由一組術(shù)語(yǔ)組成,稱為術(shù)語(yǔ)空間,描述子由不同的刻面中不同術(shù)語(yǔ)組成,用來(lái)描述構(gòu)件庫(kù)中特定的構(gòu)件。通過(guò)用戶構(gòu)造描述子形成查詢條件,在構(gòu)件庫(kù)中檢索符合條件的構(gòu)件,這樣對(duì)于用戶來(lái)說(shuō)可以直觀的從不同角度指明待檢索的構(gòu)件,
中國(guó)新技術(shù)新產(chǎn)品 2010年10期2010-09-08
- 具有孤立項(xiàng)過(guò)濾的信息檢索查詢?cè)~的分析方法
法無(wú)法有效提高查準(zhǔn)率的問(wèn)題,提出了一種孤立項(xiàng)過(guò)濾的信息檢索查詢?cè)~分析方法,該方法根據(jù)詞匯相似度較高的查詢?cè)~對(duì)之間具有強(qiáng)可替代性這一事實(shí),從查詢?cè)~及其實(shí)例中分解出查詢內(nèi)的孤立項(xiàng)和文檔內(nèi)的孤立項(xiàng),在分析查詢?cè)~臨近性之前預(yù)先進(jìn)行孤立項(xiàng)過(guò)濾,使之不參與QTP統(tǒng)計(jì)量的計(jì)算,由此減小了過(guò)分強(qiáng)調(diào)臨近性對(duì)查準(zhǔn)率的影響,實(shí)驗(yàn)結(jié)果表明,對(duì)于詞匯相似度差異比較顯著的查詢,進(jìn)行孤立項(xiàng)過(guò)濾的查詢?cè)~臨近性分析方法的平均檢索精確度比傳統(tǒng)分析方法提高14%。
西安交通大學(xué)學(xué)報(bào) 2009年8期2009-09-18