• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      宮頸細(xì)胞圖像的特征選擇與分類(lèi)識(shí)別算法研究

      2019-01-10 07:31董娜趙麗常建芳吳愛(ài)國(guó)
      關(guān)鍵詞:特征選擇特征提取

      董娜 趙麗 常建芳 吳愛(ài)國(guó)

      摘? ?要:為了提高宮頸細(xì)胞識(shí)別速度,以最少的特征數(shù)量獲得最高的識(shí)別準(zhǔn)確率,運(yùn)用分類(lèi)與回歸樹(shù)算法(Classification and Regression Trees,CART)進(jìn)行特征的選擇,并采用粒子群算法(Particle Swarm Optimization,PSO)對(duì)分類(lèi)器支持向量機(jī)(Support Vector Machine,SVM)進(jìn)行優(yōu)化,形成了PSO-SVM分類(lèi)算法對(duì)細(xì)胞進(jìn)行分類(lèi). 使用Herlev數(shù)據(jù)集對(duì)文中提出的算法進(jìn)行驗(yàn)證. 通過(guò)CART特征選擇方法,成功地從20個(gè)特征中提取出9個(gè)更具代表性的特征,并且二分類(lèi)和七分類(lèi)的準(zhǔn)確率均達(dá)到99%以上. 并引入其他幾種宮頸癌細(xì)胞的分類(lèi)識(shí)別算法進(jìn)行仿真比較,結(jié)果表明,本文算法在特征數(shù)目較少的情況下識(shí)別準(zhǔn)確率依然具有明顯優(yōu)勢(shì),從而驗(yàn)證了該算法的有效性. 所述方法有效降低了人工特征選擇的難度,在減少了識(shí)別用時(shí)的情況下,依然保證了細(xì)胞的識(shí)別準(zhǔn)確率與之前幾乎無(wú)異,為宮頸癌疾病診斷提供了一套有效的方法框架.

      關(guān)鍵詞:特征提取;特征選擇;CART;PSO-SVM;宮頸細(xì)胞檢測(cè)

      中圖分類(lèi)號(hào):TP18? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A

      Research on Feature Selection and Classification

      Recognition Algorithm of Cervical Cell Image

      DONG Na?,ZHAO Li,CHANG Jianfang,WU Aiguo

      (School of Electrical Automation and Information Engineering,Tianjin University,Tianjin 300072,China)

      Abstract:In order to improve the recognition speed of cervical cell and obtain the highest recognition accuracy with the least number of features,this paper innovatively uses the Classification and Regression Trees(CART) algorithm to select features,and then the Particle Swarm Optimization(PSO) algorithm is used to optimize the Support Vector Machine(SVM). Therefore,the PSO-SVM classification algorithm is formed to classify the cells. This paper uses the Herlev dataset to verify the validity of the proposed algorithm. Through the CART feature selection method,9 representative features are successfully extracted from 20 features,and the accuracy of two classifications and seven classifications are above 99%. Further,this paper introduces several other classification and recognition algorithms of cervical cancer cells for simulation comparison. It can be founds that the recognition accuracy of this algorithm is obviously superior when the number of features is small,which indicates that the proposed algorithm is effective. The method effectively reduces the difficulty of artificial feature selection,and ensures that the recognition accuracy of the cells is almost the same as before when the recognition time is reduced. Thus,the proposed algorithm provides an effective method for the diagnosis of cervical cancer diseases.

      Key words:feature extraction;feature selection;CART;PSO-SVM;cervical cell detection

      根據(jù)全球的病理報(bào)告顯示,宮頸癌的發(fā)病率逐年增加,每年的新增患者達(dá)到50多萬(wàn). 一些發(fā)達(dá)國(guó)家定期對(duì)婦女進(jìn)行宮頸篩查,有效地降低了宮頸癌的發(fā)病率[1].目前最傳統(tǒng)的方法是通過(guò)人工閱片檢查是否患有宮頸癌,然而這種方法識(shí)別效率低,準(zhǔn)確率不高. 即使使用圖像處理的方法對(duì)宮頸細(xì)胞進(jìn)行識(shí)別,也需要提取大量的細(xì)胞特征,冗余的特征不僅會(huì)造成識(shí)別速度緩慢,也容易對(duì)識(shí)別效果產(chǎn)生影響.

      分割是細(xì)胞識(shí)別的基礎(chǔ),根據(jù)分割結(jié)果可以提取細(xì)胞的各類(lèi)特征. 癌變細(xì)胞與正常細(xì)胞在顏色、形態(tài)等方面具有很大差異,細(xì)胞病理學(xué)專(zhuān)家就是通過(guò)觀察細(xì)胞的顏色、形狀、大小等特征對(duì)細(xì)胞進(jìn)行判定.

      細(xì)胞的特征主要是依據(jù)細(xì)胞病理學(xué)專(zhuān)家的診斷經(jīng)驗(yàn)來(lái)提取的. 因此,選擇的細(xì)胞特征,既要滿足醫(yī)師的診斷經(jīng)驗(yàn),又要以計(jì)算機(jī)理解的方式輸入. 文獻(xiàn)[2]對(duì)宮頸細(xì)胞特征提取進(jìn)行了詳細(xì)的分析,提取了87個(gè)細(xì)胞特征. 并非所有特征都是有效特征,特征數(shù)量過(guò)多或過(guò)少,對(duì)分類(lèi)精度都有影響,因此,選出最有用的特征,以最少的特征獲得最高的準(zhǔn)確率才是關(guān)鍵[3].

      宮頸細(xì)胞圖像識(shí)別的最終目的是判定該細(xì)胞是否為癌細(xì)胞,經(jīng)過(guò)分類(lèi)器的訓(xùn)練,可以準(zhǔn)確地將細(xì)胞分為正常細(xì)胞和癌細(xì)胞. 盡管現(xiàn)有分類(lèi)器種類(lèi)較多,但是SVM因操作簡(jiǎn)單,分類(lèi)準(zhǔn)確率高而受到廣大學(xué)者關(guān)注.

      為了緩解高維細(xì)胞特征導(dǎo)致的欠擬合,并提高宮頸細(xì)胞診斷的效率和準(zhǔn)確率,本文提出了一種基于CART特征選擇的宮頸細(xì)胞分類(lèi)方法. 首先提取宮頸細(xì)胞的顏色特征、形態(tài)特征和紋理特征共20個(gè)特征,然后進(jìn)行特征選擇,選定9個(gè)特征進(jìn)行訓(xùn)練,最后將SVM與 PSO算法結(jié)合起來(lái),形成PSO-SVM分類(lèi)器,從而實(shí)現(xiàn)宮頸細(xì)胞的正確分類(lèi).

      1? ?宮頸細(xì)胞的特征提取

      特征提取是從細(xì)胞圖片中尋找有效的特征. 樣本差異越明顯,則有效特征的差異越明顯. 有些特征可以通過(guò)肉眼觀察,如顏色、大小等,有些則需要進(jìn)行一定的變換,如直方圖、紋理等. 一般情況下主要從以下3個(gè)方面提取特征:

      1)顏色特征. 主要指細(xì)胞核或細(xì)胞質(zhì)的顏色. 細(xì)胞在染色之后,細(xì)胞核和細(xì)胞質(zhì)會(huì)變成不同的顏色,因此更便于觀察. 一般情況下顏色特征的提取主要是基于RGB 顏色[4-5].此外,HSI 顏色空間也應(yīng)用相對(duì)廣泛[6-8]. RGB顏色特征主要是提取Red、Green、Blue 3個(gè)顏色空間上的數(shù)值特征,如均值、方差、能量,熵等.

      2)形態(tài)特征. 此特征的參數(shù)提取種類(lèi)較多,

      Jantzen等[9]對(duì)宮頸細(xì)胞進(jìn)行仔細(xì)地觀察后,提出20個(gè)特征,其中包括面積、周長(zhǎng)[10-11]以及圓形度等. 此外,其他特征用來(lái)描述細(xì)胞,如核質(zhì)比等[11-12].

      3)紋理特征. 在提取細(xì)胞的紋理特征時(shí),灰度共生矩陣[13]是常用的方法,該方法提取的特征主要是對(duì)比度、能量、熵等. Walker等[14-15]利用灰度共生矩陣實(shí)現(xiàn)了宮頸細(xì)胞的分類(lèi). 趙暉等[16]用灰度共生矩陣求出6個(gè)紋理特征,再對(duì)其進(jìn)行歸一化,在細(xì)胞分類(lèi)中取得了較好的結(jié)果. Plissiti等[17]采用局部二進(jìn)制模式特征,來(lái)分析宮頸細(xì)胞的紋理特征.

      本文算法的流程圖如圖1所示.

      綜合以上顏色特征、紋理特征和形態(tài)特征,本文共選擇了20個(gè)特征,匯總?cè)绫?所示.

      雖然表1所含的20個(gè)特征中有部分特征的名稱(chēng)相同,如顏色特征和紋理特征中的能量和熵,但是兩者意義不同,它們分別從不同的角度來(lái)定義,因此各自起著一定作用.

      2? ?宮頸細(xì)胞的特征選擇

      特征選擇即選擇出最具代表性的特征. Liu等[18]對(duì)特征選擇做出總結(jié),選擇一組最優(yōu)的特征子集,該特征子集需保證元素個(gè)數(shù)最少,既降低特征空間維數(shù),又保證細(xì)胞識(shí)別的準(zhǔn)確率. 因此本文選擇CART算法對(duì)數(shù)據(jù)進(jìn)行降維處理,其本質(zhì)是對(duì)特征空間進(jìn)行二元?jiǎng)澐?,即進(jìn)行二叉樹(shù)分裂. 二叉樹(shù)分裂有標(biāo)量屬性分裂和連續(xù)屬性分裂. 標(biāo)量屬性是指進(jìn)行分裂的條件為不等于某個(gè)值. 連續(xù)屬性是指進(jìn)行分裂的條件為不大于某個(gè)值 ,如 取相鄰兩個(gè)屬性中間值. 圖2為標(biāo)量屬性和連續(xù)屬性進(jìn)行分裂時(shí)的示意圖.

      為了保證分類(lèi)效果,需要確定選擇哪種特征屬性. 為了衡量各個(gè)特征的重要性,CART采用Gini指數(shù)觀察分裂時(shí)的不純度. Gini指數(shù)計(jì)算公式如下:

      Gini(t) = 1 - [p(ck|t)]2? ? ? ? ? ?(1)

      式中:t為決策樹(shù)的節(jié)點(diǎn);ck為第k個(gè)樣本的個(gè)數(shù);p為概率.

      觀察該計(jì)算公式,發(fā)現(xiàn)Gini指數(shù)的實(shí)質(zhì)是1與類(lèi)別ck的概率平方和的差值,即反映了樣本的不確定程度. Gini指數(shù)通過(guò)計(jì)算特征對(duì)每個(gè)節(jié)點(diǎn)上觀測(cè)值的異質(zhì)性的影響,觀察特征的重要性. 該值越大表示該特征越重要,因此應(yīng)該選擇具有較大Gini指數(shù)的特征. 假設(shè)父節(jié)點(diǎn)對(duì)應(yīng)的樣本集合為D,CART選擇特征A分裂為兩個(gè)子節(jié)點(diǎn),對(duì)應(yīng)集合為DL與DR,分裂后的Gini指數(shù)定義如下:

      G(D,A)=Gini(DL)+Gini(DR)(2)

      式中:·表示樣本集合的記錄數(shù)量.

      本文采用該算法將20個(gè)特征分別進(jìn)行特征選擇,二分類(lèi)的比較結(jié)果如圖3所示.

      觀察二分類(lèi)的結(jié)果,可以發(fā)現(xiàn)一共有兩種衡量指標(biāo):Mean decrease in accuracy和Mean decrease in Gini index. Mean decrease in accuracy指去掉該特征后實(shí)驗(yàn)結(jié)果準(zhǔn)確率的下降量. 假設(shè)把特征20去掉,分類(lèi)準(zhǔn)確率降低11.05%,因此該值越大表示該特征越重要. Mean decrease in Gini index是計(jì)算特征對(duì)每個(gè)節(jié)點(diǎn)觀測(cè)值的異質(zhì)性的影響,該值越大也表示該特征越重要.

      本文對(duì)七分類(lèi)進(jìn)行特征選擇,比較結(jié)果如圖4所示.

      觀察圖3和圖4,可以發(fā)現(xiàn)七分類(lèi)的特征性能表現(xiàn)與二分類(lèi)近乎一致. 對(duì)細(xì)胞而言無(wú)論是二分類(lèi)還是七分類(lèi),正常細(xì)胞之間的差異和異常細(xì)胞之間的差異是很小的,二分類(lèi)中正常細(xì)胞與異常細(xì)胞之間的差異就類(lèi)似于七分類(lèi)中正常柱狀上皮細(xì)胞與輕度癌變細(xì)胞之間的差異,因此特征的表現(xiàn)能力相似.

      為了對(duì)特征的重要性進(jìn)行排序,以便觀察每個(gè)特征,本文對(duì)20個(gè)特征的表現(xiàn)能力進(jìn)行了排序,更為直觀的準(zhǔn)確率表示如圖5所示.

      觀察圖5可以發(fā)現(xiàn),前6個(gè)特征中兩種分類(lèi)情況的Gini系數(shù)性能表現(xiàn)一致. 七分類(lèi)中每個(gè)特征的Gini系數(shù)比二分類(lèi)大,因?yàn)殡S著分類(lèi)類(lèi)別數(shù)目的增加,類(lèi)別之間細(xì)微的差異就使得某個(gè)特征發(fā)揮了作用. 另外,七分類(lèi)中特征6的表現(xiàn)能力沒(méi)有特征2和4表現(xiàn)好,但是在二分類(lèi)中其表現(xiàn)能力較好,因此其重要性是可以確定的. 綜合考慮每個(gè)特征的表現(xiàn)能力,本文選擇前9個(gè)特征送入分類(lèi)器進(jìn)行訓(xùn)練.

      以下為20個(gè)特征在Mean decrease in accuracy的表現(xiàn),具體情況如圖6所示.

      圖6中,20個(gè)特征在Mean decrease in accuracy和Mean decrease in Gini index中的表現(xiàn)近乎一致. 雖然個(gè)別順序有所改變,但整體上特征性質(zhì)改變不大. Gini系數(shù)是CART進(jìn)行特征選擇的重要依據(jù),因此本文著重分析該系數(shù)的變化. 通過(guò)觀察圖6可以發(fā)現(xiàn),特征20所占的比重最大,效果較為明顯,其次是特征16,依次類(lèi)推. 觀察特征4及之后特征可以發(fā)現(xiàn),這些特征的縮減對(duì)Gini系數(shù)的影響并不大,因此綜合兩類(lèi)情況,本文選擇特征1、2、4、5、6、12、15、16、20共9個(gè)特征作為選擇后的特征,即均值,方差,峰態(tài),能量,熵,粗糙度,周長(zhǎng),面積,核質(zhì)比,進(jìn)行后續(xù)的分類(lèi)器訓(xùn)練.

      3? ?PSO-SVM分類(lèi)器訓(xùn)練

      對(duì)于線性不可分的樣本,SVM通過(guò)將其映射到一個(gè)高維的線性空間,使其線性可分,并且加入了核函數(shù)的使用,既減少了計(jì)算的復(fù)雜性,又減少了維數(shù)災(zāi)難[19-20]. 雖然傳統(tǒng)的SVM模型效果不錯(cuò),但是求解最優(yōu)化問(wèn)題依然效果欠佳,如參數(shù)的選取. 本文引入了PSO算法優(yōu)化SVM的超參數(shù),構(gòu)建PSO-SVM模型,通過(guò)全局尋優(yōu),尋找更好的分類(lèi)效果.

      PSO的數(shù)學(xué)描述[21]為:假設(shè)搜索空間是M維,粒子數(shù)為n,其中第i個(gè)粒子的位置表示為xi = (xi1,xi2,…,xiM),i = 1,2,…,n,把xi帶入目標(biāo)函數(shù)就可以算出適應(yīng)度值fit,根據(jù)適應(yīng)度值的大小可以判斷該粒子的好壞. 第i個(gè)粒子的飛行速度為vi = (vi1,vi2,…,viM),搜索到的最優(yōu)位置為pi = (pi1,pi2,…,piM),所有粒子群搜到的最優(yōu)位置為pg=(pg1,pg2,…,pgM),當(dāng)兩個(gè)最優(yōu)位置都找到時(shí),每個(gè)粒子可以根據(jù)更新公式來(lái)更新自己的位置和速度.

      為了實(shí)現(xiàn)全局尋優(yōu),需要將本文的數(shù)據(jù)分為3部分(訓(xùn)練集、測(cè)試集和驗(yàn)證集). 具體的PSO-SVM算法如下:

      1)在初始狀態(tài)下根據(jù)經(jīng)驗(yàn)初步確定懲罰因子c和徑向基函數(shù)參數(shù)σ的取值范圍.

      2)PSO初始化. 初始化算法的參數(shù),一般情況下,搜索空間設(shè)置為2維,粒子數(shù)為 20~50. 隨機(jī)初始化粒子參數(shù)并形成粒子群,隨機(jī)生成粒子的開(kāi)始速度,并確定參數(shù)pbest和gbest,pbest設(shè)置為粒子的當(dāng)前位置,gbest為所有粒子中最好的粒子的當(dāng)前位置.

      3)加入訓(xùn)練集訓(xùn)練SVM,用適應(yīng)度函數(shù)計(jì)算每個(gè)粒子的適應(yīng)度值fit,并隨時(shí)更新第i個(gè)粒子的最優(yōu)位置pi和所有粒子的最優(yōu)位置pg,如果某個(gè)粒子當(dāng)前適應(yīng)度高于pbest,則新的適應(yīng)度值取代pbest,如果所有粒子當(dāng)前適應(yīng)度值高于gbest,則當(dāng)前最優(yōu)位置的適應(yīng)度值取代gbest. 對(duì)c和σ進(jìn)行迭代尋優(yōu),從而獲取最優(yōu)參數(shù)c和σ的值.

      4)觀察訓(xùn)練集訓(xùn)練結(jié)果是否滿足精度,是則繼續(xù)向下進(jìn)行;否則轉(zhuǎn)向步驟3).

      5)加入驗(yàn)證集觀察訓(xùn)練結(jié)果,并計(jì)算誤差和適應(yīng)度函數(shù),如果算法達(dá)到結(jié)束條件,繼續(xù)向下進(jìn)行;否則,對(duì)粒子的速度和位置進(jìn)行更新,并返回3)繼續(xù)向下進(jìn)行. 算法的終止條件是達(dá)到分類(lèi)精度或迭代次數(shù).

      6)至此,就可保證得到了適應(yīng)度最優(yōu)的粒子信息,加入測(cè)試集進(jìn)行測(cè)試,輸出分類(lèi)結(jié)果即可.

      如圖7所示,為PSO訓(xùn)練SVM的流程圖.

      經(jīng)過(guò)以上算法,得到使SVM誤差最小的參數(shù)c和σ的最優(yōu)值.

      4? ?宮頸細(xì)胞的準(zhǔn)確率比較

      本文采用十折交叉驗(yàn)證對(duì)917張Herlev數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,即每次選擇數(shù)據(jù)集中的9份作為訓(xùn)練集,剩下的1份作為測(cè)試集,共進(jìn)行10次. 其中分別進(jìn)行了20個(gè)特征和9個(gè)特征的分類(lèi)器訓(xùn)練,訓(xùn)練效果如表2所示.

      在二分類(lèi)中,20個(gè)特征的識(shí)別準(zhǔn)確率為99.89%,9個(gè)特征的識(shí)別準(zhǔn)確率為99.78%. 七分類(lèi)中,20個(gè)特征的識(shí)別準(zhǔn)確率為99.56%,9個(gè)特征的識(shí)別準(zhǔn)確率為99.35%. 在特征數(shù)目減少的過(guò)程中,細(xì)胞識(shí)別的準(zhǔn)確率幾乎沒(méi)有發(fā)生變化,識(shí)別所消耗的時(shí)間卻得到了有效地降低. 二分類(lèi)的運(yùn)行時(shí)間減少了3 s左右,七分類(lèi)的識(shí)別時(shí)間減少了9 s左右.

      確定了9個(gè)特征后,將9個(gè)特征放進(jìn)PSO-SVM進(jìn)行二分類(lèi)和七分類(lèi)的訓(xùn)練,其準(zhǔn)確率如表3和表4所示.

      表3中,1個(gè)正常細(xì)胞被識(shí)別為異常細(xì)胞,1個(gè)異常細(xì)胞被識(shí)別為正常細(xì)胞. 表4中,有4個(gè)正常柱狀細(xì)胞被識(shí)別輕度癌變細(xì)胞,2個(gè)輕度病變細(xì)胞被識(shí)別為正常柱狀細(xì)胞. 對(duì)病人而言,實(shí)際意義上的七分類(lèi)識(shí)別錯(cuò)誤個(gè)數(shù)只有2個(gè),將正常細(xì)胞識(shí)別為癌細(xì)胞不會(huì)對(duì)患者造成真正的傷害,因此識(shí)別準(zhǔn)確率為99.78%,與二分類(lèi)幾乎一致.

      為了證實(shí)所提算法的有效性,本文同時(shí)采用了主成分回歸分析(PCR)、主成分分析(PCA)-PSO-SVM、核主成分分析(KPCA)-PSO-SVM、最小冗余最大相關(guān)(MRMR)[22]-PSO-SVM和ReliefF[23]-PSO-SVM共5種方法作為對(duì)照. 并且,本文采用均方根誤差(Root Mean Square Error,RMSE)、平均絕對(duì)誤差(Average Absolute Error,AAE)和最大絕對(duì)誤差(Maximal Absolute Error,MAE)、準(zhǔn)確率(Accuracy,ACC)、敏感度(Sensitivity,SEN)和特異度(Specificity,SPE)作為模型性能評(píng)價(jià)指標(biāo),其中RMSE和ACC為主要的評(píng)價(jià)指標(biāo).

      RMSE =? ? ? ? (3)

      AAE = yi - [y][^]i? ? ? ?(4)

      MAE = max(yi - [y][^]i)? ? ? ?(5)

      式中:yi為第i個(gè)樣本的真實(shí)值;[y][^]i為第i個(gè)樣本的估計(jì)值;N為測(cè)試集的樣本個(gè)數(shù).

      本文在將特征數(shù)降維為9個(gè)的基礎(chǔ)上對(duì)各個(gè)評(píng)價(jià)指標(biāo)進(jìn)行統(tǒng)計(jì),各個(gè)算法表現(xiàn)性能如表5、表6所示.

      觀察6個(gè)評(píng)價(jià)指標(biāo)可以發(fā)現(xiàn),在宮頸癌細(xì)胞的二分類(lèi)和七分類(lèi)研究中,本文提出的特征選擇方法的性能指標(biāo)最優(yōu),即本文的CART模型具有較高的準(zhǔn)確性,且各類(lèi)性能指標(biāo)均優(yōu)于對(duì)照實(shí)驗(yàn)方法. 本文算法的準(zhǔn)確率比KPCA算法高出3%左右,比PCR高出30%,靈敏度和特異度也均為最高.

      觀察表5和表6可以發(fā)現(xiàn),本文算法的RMSE和AAE均為最低. 本文的評(píng)價(jià)指標(biāo)為均方根誤差和平均絕對(duì)誤差,誤差越小,分布越均勻,識(shí)別錯(cuò)誤的可能性越小,識(shí)別越穩(wěn)定. MAE為最大絕對(duì)誤差,在二分類(lèi)中,如果識(shí)別出現(xiàn)錯(cuò)誤,MAE值只能為1,在七分類(lèi)中,該值具有不確定性. 該值越大,證明該算法的不穩(wěn)定性越大,在ReliefF算法中MAE值為5,識(shí)別中出現(xiàn)了將第一類(lèi)正常細(xì)胞識(shí)別為第六類(lèi)異常細(xì)胞的情況. 而本文MAE值為1,即只在第三類(lèi)正常細(xì)胞和第四類(lèi)異常細(xì)胞之間識(shí)別出現(xiàn)誤差,但仍保證了較高的識(shí)別精度,因此也體現(xiàn)了本文識(shí)別算法的優(yōu)異性.

      為了更加全面地驗(yàn)證本文算法的有效性,本文列舉了其它幾種算法的特征選擇數(shù)目以及分類(lèi)準(zhǔn)確率,具體的比較結(jié)果如表7所示.

      在其它6種算法中,文獻(xiàn)[26]識(shí)別準(zhǔn)確率為98.98%,特征數(shù)為11個(gè),本文識(shí)別算法準(zhǔn)確率比其高了1%左右,特征數(shù)少用2個(gè),效果較為明顯. 從文獻(xiàn)[9]和[24]中可以看出,特征數(shù)多識(shí)別效果不一定高. 文獻(xiàn)[27]和[28]中雖然選擇了相同的9種特征,識(shí)別準(zhǔn)確率卻比本文算法低了6%和4%,因此特征數(shù)目的選擇不僅要準(zhǔn)確反映細(xì)胞的差異,還要具有較高的準(zhǔn)確率. 綜合7種算法的識(shí)別準(zhǔn)確率和特征數(shù),本文算法能夠以最少的特征數(shù)實(shí)現(xiàn)最高的準(zhǔn)確率,識(shí)別效果較好,對(duì)于人工智能識(shí)別癌細(xì)胞的推廣具有極大的價(jià)值.

      5? ?結(jié)? ?論

      針對(duì)目前宮頸細(xì)胞識(shí)別過(guò)程中出現(xiàn)的特征冗余和準(zhǔn)確率低的問(wèn)題,本文建立了基于CART特征選擇算法的宮頸細(xì)胞分類(lèi)識(shí)別模型,從20個(gè)特征中選擇了9個(gè)有效的特征,建立了PSO-SVM模型進(jìn)行細(xì)胞的分類(lèi),使得細(xì)胞識(shí)別的準(zhǔn)確率達(dá)到了99%以上. 為了驗(yàn)證本文算法的有效性,引入了RMSE、AAE等評(píng)價(jià)指標(biāo),并與其它分類(lèi)方法進(jìn)行比較,結(jié)果表明,本文算法不僅提取了更加精準(zhǔn)有效的特征,而且實(shí)現(xiàn)了較高的識(shí)別準(zhǔn)確率. 該研究結(jié)果有效地提高了二分類(lèi)和七分類(lèi)的識(shí)別效率,同時(shí)對(duì)于降低宮頸癌的誤診率有良好的應(yīng)用價(jià)值.

      參考文獻(xiàn)

      [1]? ? FERLAY J,SOERJOMATARAM I,DIKSHIT R,et al. Cancer in cadence and mortality worldwide:sources,methods and major patterns [J]. International Journal of Cancer,2015,136(5):359—386.

      [2]? ? 洪繼光,成德信,于光普. 細(xì)胞圖像的特征描述[J]. 信息與控制,1983,12(2):28—33,45.

      HONG J G,CHENG D X,YU G P. Characteristics of cell image [J]. Information and Control,1983,12(2):28—33,45. (In Chinese)

      [3]? ? 段潔,胡清華,張靈均,等. 基于鄰域粗糙集的多標(biāo)記分類(lèi)特征選擇算法[J].計(jì)算機(jī)研究與發(fā)展. 2015,52(1):56—65.

      DUAN J,HU Q H,ZHANG L J,et al. Multi-label classification feature selection algorithm based on neighborhood rough set [J]. Computer Research and Development,2015,52(1):56—65. (In Chinese)

      [4]? ? NUNOBIKI O,SATO M,TANIGUCHI E,et al. Color image analysis of cervical neoplasia using RGB computer color specification [J]. Analytical and Quantitative Cytology and Histology,2002,24(5):289—294.

      [5]? ? VIJAYASHREE R,RAO K. A semi-automated morphometric assessment of nuclei in pap smears using image[J]. Journal of Evolution of Medical and Dental Sciences,2015,4 (53):63—70.

      [6]? ? 張勇. 一種有效的白細(xì)胞圖像彩色空間序貫分割方法[J]. 西安交通大學(xué)學(xué)報(bào),1998,32(8):52—56.

      ZHANG Y. An effective segmentation method for color space of white blood cell image [J]. Journal of Xi′an Jiaotong University,1998,32(8):52—56. (In Chinese)

      [7]? ? 花蕾,葉玉坤. 基于知識(shí)的肺癌早期細(xì)胞診斷系統(tǒng)[J]. 計(jì)算機(jī)應(yīng)用研究,2000,17(2):90—92.

      HUA L,YE Y K. Knowledge-based early cell diagnosis system for lung cancer [J]. Journal of Computer Applications,2000,17(2):90—92. (In Chinese)

      [8]? ? 陸新泉,李寧,陳世福. 形態(tài),顏色特征及神經(jīng)網(wǎng)絡(luò)在肺癌細(xì)胞識(shí)別中的應(yīng)用研究[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2001,13(1):87—92.

      LU X Q,LI N,CHEN S F. Application of morphology,color features and neural network in recognition of lung cancer cells [J]. Journal of Computer-Aided Design & Computer Graphics,2001,13(1):87—92. (In Chinese)

      [9]? ? JANTZEN J,NORUP J,DOUNIAS G,et al. Pap-smear benchmark data for pattern classification [J]. Nature Inspired Smart Information Systems (NiSIS 2005),2005:1—9.

      [10]? HALLINAN J,JACKWAY P. Detection of malignancy associated changes in thionin stained cervical cells [J]. Digital Image Computing and Applications,1995,27(5):426—431.

      [11]? PLISSITI M E,NIKOU C. A review of automated techniques for cervical cell image analysis and classification [M]. Netherlands:Biomedical Imaging and Computational Modeling in Biomechanics,2013:1—18.

      [12]? CHEN Y F,HUANG P C,LIN K C,et al. Semi-automatic segmentation and classification of pap smear cells [J]. Biomedical and Health Informatics,2014,18(1):94—108.

      [13]? HARALICK R M,SHANMUGAM K,DINSTEIN I H. Textural features for image classification [J]. Systems,Man and Cybernetics,1973, 12(6):610—621.

      [14]? WALKER R F, JACKWAY P, LOVELL B,et al. Classification of cervical cell nuclei using morphological segmentation and textural feature extraction[C]//Conference on Intelligent Information Systems. New Zealand:IEEE, 1994:297—301.

      [15]? WALKER R F, JACKWAY P T, LOVELL B. Cervical cell classification via co-occurrence and Markov random field features[C]//Proceedings of Digital Image Computing:Techniques and Applications. Australia Brisbane:IEEE, 1995:294—299.

      [16]? 趙暉,鮑莉,梁光明,等. 基于綜合灰度共生矩陣的顯微細(xì)胞圖像紋理研究[J].自動(dòng)化技術(shù)與應(yīng)用,2005,23(10):27—29.

      ZHAO H, BO L, LIANG G M,et al. Research on microscopic cell image texture based on integrated gray level co-occurrence matrix [J]. Automation Technology and Application, 2005, 23(10):27—29. (In Chinese)

      [17]? PLISSITI M E,NIKOU C,CHARCHANTI A. Automated detection of cell nuclei in Pap smear images using morphological reconstruction and clustering [J]. Information Technology in Biomedicine, 2011, 15(2):233—241.

      [18]? LIU H,MOTODA H. Feature selection for knowledge discovery and data mining[M]. Netherlands:Kluwer Academic Publishers, Springer Science & Business Media,1998:1—15.

      [19]? 孫磊,陳陽(yáng),黃洋文,等. 支持向量機(jī)算法對(duì)鼻咽癌與正常鼻咽細(xì)胞株拉曼光譜分析[J],光譜學(xué)與光譜分析,2013,33(6):1566—1569.

      SUN L, CHEN Y, HUANG Y W,et al. Raman spectroscopy analysis of nasopharyngeal carcinoma and normal nasopharyngeal cell line by support vector machine algorithm[J]. Spectroscopy and Spectral Analysis, 2013, 33 (6):1566—1569. (In Chinese)

      [20]? 張問(wèn)銀,金寧德,劉印鋒,等. 基于支持向量機(jī)的CD4細(xì)胞圖像識(shí)別方法[J].計(jì)算機(jī)工程與科學(xué),2009,31(7):150—152.

      ZHANG W Y, JIN N D, LIU Y F,et al. Image recognition method based on support vector machine for CD4 cells [J]. Computer Engineering and Science,2009,31(7):150—152. (In Chinese)

      [21]? 張英杰,許偉,湯龍波,等. 基于滾動(dòng)時(shí)間窗的PSO-LSSVM的通信基站能耗建模[J]. 湖南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017, 44(2):122—128.

      ZHANG Y J, XU W, TANG L B,et al. Modeling of communication base station energy consumption based on PSO-LSSVM based on rolling time window [J].Journal of Hunan University (Natural Sciences),2017,44(2):122—128. (In Chinese)

      [22]? PENG H, LONG F, DING C. Feature selection based on mutual information criteria of max-dependency,max-relevance,and min- redundancy[J]. Pattern Analysis & Machine Intelligence IEEE Transactions, 2005, 27(8):1226—1238.

      [23]? KONONENKO I,?IMEC E,ROBNIK-?IKONJA M. Overcoming the myopia of inductive learning algorithms with relieff [J]. Applied Intelligence,1997,7(1):39—55.

      [24]? EDWIN J M, ALLWIN S. Nominated texture based cervical cancer classification[J]. Computational and Mathematical Methods in Medicine,2015,2015:1—10.

      [25]? KANGKANA B, MANISH CB, LIPI B. Automated classification of Pap smear images to detect cervical dysplasia [J]. Computer Methods and Programs in Biomedicine,2017,138:31—47.

      [26]? ZHAO M,WU A G. Automatic screening of cervical cells using block image processing[J]. BioMedical Engineering OnLine, 2016,15(1):14—33.

      [27]? SAJEENA T A,JEREESH A S. Automated cervical cancer detection through RGVF segmentation and SVM classification[C]// International Conference on Computing & Network Communications. Kauai,Hawai:IEEE,2016:16—19.

      [28] CHANKONG T,THEERA-UMPON N,AUEPHANWIRIYANKUL S. Automatic cervical cell segmentation and classification in Pap smears[J]. Computer Methods Programs in Biomedicine,2014, 113(2):539—556.

      猜你喜歡
      特征選擇特征提取
      基于MED—MOMEDA的風(fēng)電齒輪箱復(fù)合故障特征提取研究
      基于曲率局部二值模式的深度圖像手勢(shì)特征提取
      基于智能優(yōu)化算法選擇特征的網(wǎng)絡(luò)入侵檢測(cè)
      故障診斷中的數(shù)據(jù)建模與特征選擇
      reliefF算法在數(shù)據(jù)發(fā)布隱私保護(hù)中的應(yīng)用研究
      一種多特征融合的中文微博評(píng)價(jià)對(duì)象提取方法
      静海县| 右玉县| 从化市| 海丰县| 东台市| 泰和县| 肇源县| 贵南县| 盐边县| 东莞市| 武胜县| 酒泉市| 枞阳县| 定兴县| 甘南县| 株洲县| 莱芜市| 孟连| 鞍山市| 手游| 上蔡县| 青神县| 城固县| 龙里县| 江城| 高雄县| 雷波县| 浦县| 武安市| 临漳县| 阜新市| 宁乡县| 普定县| 临邑县| 共和县| 乌兰察布市| 宣化县| 根河市| 斗六市| 章丘市| 嵊州市|