張九妹 杜建軍 姚宗碧 田 蕾
1(寧夏回族自治區(qū)人民醫(yī)院信息中心,銀川 750021;
2(寧夏工商職業(yè)技術(shù)學(xué)院,銀川 750021)
高血壓、腦血管硬化、冠狀動脈粥樣硬化等心腦血管疾病,是目前我國老年人死亡和致殘的主要原因,而這類疾病損傷的組織水平首先是在微循環(huán)和微血管層次的變化。眼底視網(wǎng)膜微血管是人體惟一可以非創(chuàng)傷性直接觀察的較深層的微血管,它的改變程度與高血壓、糖尿病等疾病的病程、嚴(yán)重程度及愈后情況等密切相關(guān)??紤]到眼底疾病診斷的客觀性、重要性及大批量眼底普查的需要,對眼底圖像的自動篩查提出了迫切要求。然而,目前計算機輔助診斷(computer aided diagnosis,CAD)在眼科的應(yīng)用還很少,因此,嘗試開發(fā)眼底圖像CAD系統(tǒng),利用計算機視覺再解釋醫(yī)學(xué)圖像的內(nèi)涵,為醫(yī)生做出正確的影像學(xué)診斷提供幫助,在提升眼底疾病診治水平方面,有著重大的臨床應(yīng)用價值和經(jīng)濟價值。本研究針對目前現(xiàn)狀,充分利用圖像的統(tǒng)計特性,基于二維主成分分析法(2-dimensional principal component analysis,2DPCA)[1]、支持向量機 (support vector machine,SVM)[2-4]和K近鄰聚類準(zhǔn)則(K nearest-neighbor clustering criterion,KNN)[5],設(shè)計并實現(xiàn)了一個眼底圖像異常篩查系統(tǒng)。
所研究的視網(wǎng)膜圖像來自于眼底熒光造影系統(tǒng),該硬件系統(tǒng)由眼底照相機、視頻適配器、CCD攝像頭、視頻信號解碼器、圖像采集卡、圖像監(jiān)視器及PC工作站組成,其組成框圖如圖1所示。
系統(tǒng)采用的是日本TOPCON公司的TRC250 V/50 VT型眼底照相機,這種照相機的視角為20°~50°。CCD攝像頭輸出標(biāo)準(zhǔn)彩色信號,經(jīng)視頻解碼后,分為3路(R,G,B)基色信號送入圖像采集卡。圖像采集卡把圖像信號進行A/D量化為數(shù)字圖像,保存在圖像卡中,微機可以對圖像卡中的圖像信息作進一步的處理。另外,圖像采集卡還可以將計算機處理后的圖像通過D/A轉(zhuǎn)化為模擬信號,在圖像監(jiān)視器上顯示出來。
圖1 系統(tǒng)的硬件組成框圖Fig.1 The hardware diagram of the system
正常眼底的解剖結(jié)構(gòu)有視乳頭、黃斑、視神經(jīng)盤和視網(wǎng)膜血管系統(tǒng)等等。在眼底圖像處理中,視網(wǎng)膜血管系統(tǒng)是評估處理效果的重要指標(biāo)之一,也是診斷糖尿病視網(wǎng)膜病變、高血壓視網(wǎng)膜病變等疾病需要測量的重要參數(shù)之一。
實際應(yīng)用中,顏色和灰度信息通常是判斷眼底正常與否的重要因素;又由于眼底成像的過程中要受照相機視角(20°~50°)變化的影響,在提取特征時要充分考慮特征對顏色(或灰度)的敏感性和對旋轉(zhuǎn)的不變性。而直方圖作為最常用的表達特征的方法,它對目標(biāo)的平移和旋轉(zhuǎn)、部分遮擋不變,且直方圖歸一化后還使得尺度不變。直方圖也適合描述紋理區(qū)域的內(nèi)容,可反映不同灰度在整幅圖像中所占的比例,且特別適于描述那些難以進行自動分割的圖像。因此,采用灰度直方圖作為眼底圖像的一種歸一化表示。但直方圖的缺點是它沒有包含任何空間域信息。當(dāng)不同圖像有相同直方圖時,可能引起錯誤。一種更好的辦法是在圖像中分割目標(biāo)以提取空間/形狀信息,并滿足不變性。研究中,發(fā)現(xiàn)眼底圖像中血管和黃斑區(qū)的亮度較高,正常眼底中這些亮度較高區(qū)域的面積和其它區(qū)域面積的相對比值基本不變;而對于異常病變眼底,受出血點、局部病變等影響,血管、黃斑等較亮區(qū)域會被侵蝕,因此圖像的明、暗區(qū)域比值會有變化,表現(xiàn)出與正常眼底的明顯不同。綜合考慮顏色、灰度等圖像整體信息和上述明暗區(qū)域表達的局部信息,本研究提出一種混合表示的圖像特征的方法,首先利用經(jīng)典的OTSU法[2](大津法,也稱最大類間方差法)將眼底圖像粗分為明區(qū)域和暗區(qū)域兩部分,再利用圖像明區(qū)域和暗區(qū)域的灰度直方圖同圖像的整體灰度直方圖混合來表示眼底圖像。這樣既考慮了圖像的局部區(qū)域特征,又考慮了圖像的整體特征,能夠描述一些重要的空間關(guān)系,從而有利于提高檢索的精度。
基于Matlab實現(xiàn)的的眼底圖像CAD系統(tǒng)框圖如圖2所示。在訓(xùn)練過程中,讀入正常和異常眼底圖片各30張,作為正負(fù)樣本構(gòu)建訓(xùn)練集。在圖像預(yù)處理部分,首先提取眼底造影圖像的明部分直方圖(由血管等較亮像素構(gòu)成)、暗部分直方圖(由其它較暗像素構(gòu)成)和整個圖像的顏色直方圖,并分別進行歸一化處理,之后再將這3類直方圖組合成一個混合向量表示原圖像的特征;其次,再用二維主成分分析法來提取非線性的有效特征并形成圖像的特征庫,同時降低樣本中的噪聲成分;最后,為了獲得滿意的檢索精度和推廣性能,利用線性支持向量機和最近鄰聚類準(zhǔn)則構(gòu)建兩分類器,并采用“留一交叉驗證法”得到最佳分類模型。留一法源于K重交叉驗證法,就是將N個樣本置亂,然后均勻分成K份,輪流選擇其中K-1份訓(xùn)練,剩余的一份做驗證,計算預(yù)測誤差平方和,最后把K次的預(yù)測誤差平方和再做平均,作為選擇最優(yōu)模型結(jié)構(gòu)的依據(jù)。若K取N,就是留一法(leave one out,LOO)。在進行圖片識別時,圖片間的相似性依靠最小化每個被測圖像到分類超平面的決策距離來度量,而該決策距離采用SVM[3-5]對KPCA加權(quán)后的距離,這與傳統(tǒng)的歐式距離和馬氏距離等不同,是本研究的創(chuàng)新之處。
訓(xùn)練好分類器后,可以測試出分類器的分類正確率,接著就可以進行輔助診斷應(yīng)用。這時,隨便打開一個文件夾中的任意一張感興趣的眼底圖片,系統(tǒng)都可以自動進行識別判讀,具體識別過程為:待識別的圖像經(jīng)過預(yù)處理并利用2 DPCA提取其圖像特征,將之與圖像的特征庫進行匹配,得出匹配結(jié)果。
圖2 眼底圖像CAD系統(tǒng)框圖Fig.2 The block diagram of the retinal image CAD system
實驗采用軟件:Vista系統(tǒng),MatlabR2007 b編程;硬件:Pentium2.0 GHz CPU,2 GB內(nèi)存。由于沒有標(biāo)準(zhǔn)的眼底圖像數(shù)據(jù)庫,實驗樣本由寧夏自治區(qū)人民醫(yī)院眼科提供?;叶妊鄣讏D片的格式為JPG,尺寸為768像素×576像素。
實驗中選取由專家預(yù)先標(biāo)注好的正常、異常圖片共60幅作為訓(xùn)練樣本。其中正常眼底圖片包括左、右眼的不同角度的照片共30張,部分樣本如圖3所示;異常眼底圖片包括視網(wǎng)膜中央靜脈阻塞(central retinal vein occlusion,CRVO)、視網(wǎng)膜靜脈阻塞激光治療后(retinal vein occlusion,treated with laser photocoagulation)、息肉狀脈絡(luò)膜血管病變(polypoidal choroidal vasculopathy,PCV)、濕性黃斑變性(wet macular degeneration,wet AMD)、黃斑缺損(macular coloboma)等圖片共計30幅,部分訓(xùn)練樣本如圖4所示。
圖3 正常眼底訓(xùn)練樣本示例。(a)正常左眼眼底(直視);(b)正常左眼眼底(轉(zhuǎn)動后);(c)正常右眼眼底Fig.3 The examples of normal training samples.(a)Normal image of left fundus(looking straight ahead);(b)Normal image of left fundus(left eye moved);(c)Normal image of right fundus
圖4 異常眼底訓(xùn)練樣本示例。(a)視網(wǎng)膜靜脈阻塞(激光治療后);(b)息肉狀脈絡(luò)膜血管病變;(c)濕性黃斑變性Fig.4 The examples of abnormal training samples.(a)Retinal vein occlusion,treated with laser photocoagulation;(b)Polypoidal choroidal vasculopathy;(c)Wet macular degeneration
利用SVM算法訓(xùn)練分類器[6]后,就可以直接用該程序進行眼底圖像識別篩查。該程序用于判讀圖像的界面如圖5所示,只需找到需要判讀的圖片,系統(tǒng)即會自動識別。
系統(tǒng)識別結(jié)果如圖6,對正常眼底圖片的判讀結(jié)果是“正常眼底”,如圖中(a)所示;對病變眼底的判讀結(jié)果是“異常眼底”,如圖中(b)所示。系統(tǒng)識別結(jié)果與專家標(biāo)注結(jié)果完全一致。
實驗中通過該系統(tǒng)對120張(60張正常眼底和60張異常眼底)已做過標(biāo)識的眼底圖片進行異常篩查實驗。實驗中的有關(guān)數(shù)據(jù)見表1。實驗表明,該系統(tǒng)的正確識別率為98.33%(識別正確率=識別正確的樣本總數(shù) /測試樣本總數(shù))。
實驗表明,該系統(tǒng)具有很好的小樣本學(xué)習(xí)推廣能力,可用于異常眼底的篩查。
圖5 打開需判讀圖片的界面Fig.5 The interface to open the pictures that needs to be interpreted
圖6 系統(tǒng)識別結(jié)果。(a)正常眼底的識別結(jié)果;(b)異常眼底的識別結(jié)果Fig.6 The recognition results of the system.(a)The recognition results of normal fundus image;(b)The recognition results of abnormal fundus image
表1 實驗數(shù)據(jù)及測試結(jié)果Tab.1 The experimental data and test results
充分利用圖像的統(tǒng)計特性,基于2DPCA和SVM技術(shù)實現(xiàn)了一個眼底圖像異常提示系統(tǒng)。該系統(tǒng)操作便捷,性能穩(wěn)定,可靠性高。而且該系統(tǒng)是一個開放的系統(tǒng),具有很好的擴展性。程序中用來進行正常和異常兩分類,如果想擴充其分類類別數(shù),只需增加相應(yīng)數(shù)目的訓(xùn)練樣本類便可。然而,實驗中存在誤判情況。觀察誤判的圖片,是因為沒有類似的圖片參與訓(xùn)練,所以進一步改進系統(tǒng)性能的方法是將被誤判的樣本當(dāng)作訓(xùn)練樣本充實到CAD系統(tǒng)的訓(xùn)練樣本集中,從而不斷地完善系統(tǒng)模型的性能。
另外,如果在診斷出異常的情況下,還能細(xì)分出異常所屬的病種,或者直接進行多分類判讀,系統(tǒng)將更加具有實用價值,這將是本課題今后的研究方向。近來一些研究進展,如李士清等探討了高度近視黃斑病變的類型及熒光素眼底血管造影(fundus fluorescein angiography,F(xiàn)FA)特征,將高度近視黃斑病變分為6種類型(漆樣裂紋性黃斑病變,新生血管性高度近視黃斑病變,漆樣裂紋性黃斑出血,高度近視性Fuchs斑,高度近視性黃斑萎縮,高度近視性黃斑裂孔等)[7]。如果有標(biāo)注好的分類圖片做訓(xùn)練,該系統(tǒng)也可以用來進行高度近視黃斑病變6種類型的判讀。這樣的系統(tǒng)有望在今后工作中實現(xiàn)。
[1]Yang Jian,Zhang D,F(xiàn)rangi A F,et al.Two-dimensional PCA:a new approach to appearance-based face representation andrecognion [J].IEEE Trans PAMI,2004,26(1):131-137.
[2]Vapnik VN.The nature of statistical learning theory[M].(2ndEdition).NewYork:Springer-Verlag,2000:17-180.
[3]Vapnik V N.An overview of statistical learning theory[J].IEEE Trans on Neural Network,1999,10(5):988-999.
[4]Vapnik V N.Statistical learning theory[M].New York,John Willey &Sons,1998:493-506.
[5]Dudar O,Hart PE,Stork DG.李冬宏,姚天翔,譯.Pattern Classification[M].(2ndEdition).北京:機械工業(yè)出版社,2004:174-187.
[6]潘晨,閆相國,鄭崇勛,等.用于彩色圖像分割的支持向量機的快速訓(xùn)練[J].模式識別與人工智能,2005,18(4):392-398.
[7]李士清,文峰.高度近視黃斑病變分類及眼底血管造影特征分析[J]. 眼科新進展,2007,2(27):113-115.