楊瑋婕, 徐建瑜
(寧波大學(xué) 信息科學(xué)與工程學(xué)院,浙江 寧波 315211)
?
基于改進(jìn)型AdaBoost網(wǎng)絡(luò)模型的斑馬魚(yú)胚胎血管識(shí)別
楊瑋婕, 徐建瑜
(寧波大學(xué) 信息科學(xué)與工程學(xué)院,浙江 寧波 315211)
基于圖像特征與改進(jìn)型AdaBoost網(wǎng)絡(luò)模型,對(duì)斑馬魚(yú)節(jié)間血管的識(shí)別進(jìn)行了研究。對(duì)3組斑馬魚(yú)胚胎熒光圖像訓(xùn)練集的節(jié)間血管進(jìn)行正負(fù)樣本選取,使用Haar-like特征圖提取圖像特征,通過(guò)AdaBoost網(wǎng)絡(luò)模型對(duì)所提取的特征訓(xùn)練形成級(jí)聯(lián)分類器,根據(jù)識(shí)別效果,調(diào)整改進(jìn)網(wǎng)絡(luò)的系數(shù)得到改進(jìn)型級(jí)聯(lián)分類器,最終實(shí)現(xiàn)了節(jié)間血管的精確識(shí)別和統(tǒng)計(jì)。實(shí)驗(yàn)結(jié)果表明:對(duì)于節(jié)間血管提取的準(zhǔn)確率和識(shí)全率分別達(dá)到了93.8 %和91.1 %,說(shuō)明該算法檢測(cè)準(zhǔn)確率高,對(duì)不同組別圖像均有穩(wěn)定的檢測(cè)效果。
節(jié)間血管識(shí)別; 斑馬魚(yú); AdaBoost; 特征提取
對(duì)于藥物試驗(yàn)效果的判斷,常依據(jù)斑馬魚(yú)胚胎發(fā)育完好的節(jié)間血管根數(shù)[1]。在如今批量化的實(shí)驗(yàn)需求之下,自動(dòng)化分析斑馬魚(yú)實(shí)驗(yàn)圖像成為研究熱點(diǎn)之一[2]。因此,通過(guò)圖像特征自動(dòng)提取并計(jì)算出斑馬魚(yú)節(jié)間血管根數(shù),具有很重要的實(shí)用意義。
現(xiàn)有的圖像目標(biāo)提取算法很多,其中成熟運(yùn)用的研究有以下幾種:1)基于平均間距提取肌間骨算法[3],通過(guò)設(shè)定圖像中目標(biāo)的平均間距和目標(biāo)間隔參數(shù),提取圖像目標(biāo),算法的執(zhí)行效率高;2)方向梯度直方圖結(jié)合主成分分析(principal component analysis,PCA)組成的聯(lián)探測(cè)器檢測(cè)圖像中的血紅細(xì)胞[4],可以有效地將圖像中識(shí)別目標(biāo)與類似識(shí)別目標(biāo)的其余前景物體分開(kāi);3)基于“支持向量機(jī)(support vector machine,SVM)+Gabor小波”人臉檢測(cè)系統(tǒng),算法先降維去除重復(fù)信息,用人臉與濾波器卷積提取特征,具有較高的識(shí)別率[5]。上述方法由于提取目標(biāo)目的和圖像限制的原因,僅適用于單個(gè)或者少量目標(biāo)的提取,而對(duì)于斑馬魚(yú)節(jié)間血管的提取,一幅圖片中提取目標(biāo)數(shù)量較多,要求不僅能準(zhǔn)確地提取目標(biāo),還要盡可能地將所有目標(biāo)都提取出來(lái)。
本文通過(guò)結(jié)合Haar-like特征提取和改進(jìn)型AdaBoost算法,提取熒光斑馬魚(yú)胚胎圖像中的節(jié)間血管,選取了不同實(shí)驗(yàn)條件下獲取的圖像作為測(cè)試集,以識(shí)別的準(zhǔn)確率和目標(biāo)的識(shí)全率作為判斷算法性能的依據(jù)。
基于Haar-like特征圖提取特征結(jié)合改進(jìn)型AdaBoost神經(jīng)網(wǎng)絡(luò)的目標(biāo)血管識(shí)別算法,流程如圖1。
首先,針對(duì)斑馬魚(yú)胚胎熒光圖像序列進(jìn)行隨機(jī)篩選,選出訓(xùn)練樣本和測(cè)試樣本;接著根據(jù)節(jié)間血管進(jìn)行正、負(fù)樣本選??;然后使用Haar-like特征圖提取樣本特征,再通過(guò)改進(jìn)型AdaBoost神經(jīng)網(wǎng)絡(luò)對(duì)所提取的特征訓(xùn)練形成級(jí)聯(lián)分類器;之后使用分類器對(duì)測(cè)試圖像實(shí)現(xiàn)目標(biāo)識(shí)別,并根據(jù)識(shí)別結(jié)果判斷分類器分類效果是否滿意,若不滿意,則調(diào)整AdaBoost的改進(jìn)系數(shù)k直至識(shí)別效果達(dá)到滿意;最后自動(dòng)統(tǒng)計(jì)識(shí)別出的節(jié)間血管數(shù)量。
2.1 Haar-like特征圖[6~8]
使用如圖2所示矩形特征圖描述斑馬魚(yú)胚胎熒光圖像特征,其中Haar-like矩形特征的特征值根據(jù)白色矩形像素和與黑色矩形像素和之差得到[9]。
圖2 矩形特征圖
2.2 使用特征圖計(jì)算像素值
圖像黑色像素計(jì)算方法如下:1)計(jì)算圖像的積分圖,其中圖像每一點(diǎn)的像素值用i(x,y)表示,每一個(gè)像素點(diǎn)的像素值用I(x,y)表示,通過(guò)式(1)可計(jì)算得到I(x,y)
(1)
對(duì)圖像的行和列進(jìn)行循環(huán)累加計(jì)算可以得出待檢測(cè)圖像的積分圖值。2)使用積分圖計(jì)算Haar特征值,由式(2),式(3)對(duì)行和列累加
s(x,y)=s(x,y-1)+i(x,y)
(2)
I(x,y)=I(x,y-1)+s(x,y)
(3)
式(2)中的域s(x,y)為列積分,點(diǎn)(x,y)的值不包含在s(x,y)中,待檢測(cè)圖像初始條件為s(x,-1)=0,I(-1,y)=0。
通常,從樣本中提取的Haar-like特征的規(guī)模巨大,因此,使用Haar-like樣本特征檢測(cè)節(jié)間血管的主要問(wèn)題是使用有效特征學(xué)習(xí)分類功能。選擇一種機(jī)器學(xué)習(xí)方法通過(guò)不斷訓(xùn)練,根據(jù)特征的作用進(jìn)行權(quán)重賦值,可以解決上述問(wèn)題。
AdaBoost分類算法可以整合弱分類器BP神經(jīng)網(wǎng)絡(luò)的分類結(jié)果,并根據(jù)結(jié)果賦予不同權(quán)重實(shí)現(xiàn)更好的分類效果。具有最主要的有2個(gè)優(yōu)勢(shì):1)訓(xùn)練的錯(cuò)誤率上界,隨著迭代次數(shù)的增加,會(huì)逐漸下降;2)即使訓(xùn)練次數(shù)再多,也不會(huì)出現(xiàn)過(guò)擬合的問(wèn)題。AdaBoost算法原理的過(guò)程可以由圖3表示。
圖3 AdaBoost工作原理
傳統(tǒng)的AdaBoost方法[10~12]每輪迭代均會(huì)對(duì)權(quán)值進(jìn)行調(diào)整,增加分類正確的分類器權(quán)值,減小錯(cuò)誤分類的權(quán)值[13],但這種更新規(guī)則對(duì)一些不常見(jiàn)樣本,訓(xùn)練時(shí)會(huì)分配比較大的權(quán)重而產(chǎn)生過(guò)配現(xiàn)象[14]。根據(jù)AdaBoost算法的原理,對(duì)權(quán)值更新規(guī)則以及弱分類器的加權(quán)參數(shù)進(jìn)行了改進(jìn):首先在每一輪的訓(xùn)練過(guò)程中定義一個(gè)閾值0,同時(shí)依據(jù)樣本是否錯(cuò)分和當(dāng)前狀態(tài)的權(quán)值是否大于0來(lái)更新樣本的權(quán)值,從而極大程度地避免過(guò)配現(xiàn)象。最后根據(jù)式(4)、式(5)進(jìn)行優(yōu)化改進(jìn)[15]
(4)
(5)
式中 r為所有被正確識(shí)別的弱分類器樣本權(quán)重之和;ker為r的增函數(shù);εt為第t次迭代的錯(cuò)誤率。通過(guò)不斷調(diào)整k的值改變?nèi)醴诸惼鳈?quán)重比例,從而更好地訓(xùn)練特征分類器。
本文使用OpenCV庫(kù)對(duì)基于改進(jìn)AdaBoost方法進(jìn)行實(shí)驗(yàn),并對(duì)結(jié)果分析研究?;诟倪M(jìn)型AdaBoost的斑馬魚(yú)節(jié)間血管提取過(guò)程分為2個(gè)步驟:1)樣本的訓(xùn)練;2)對(duì)加載的分類器進(jìn)行檢測(cè)。基本流程如圖4所示。
圖4 測(cè)試圖像節(jié)間血管的分類流程
5.1 實(shí)驗(yàn)數(shù)據(jù)采集
實(shí)驗(yàn)所使用的斑馬魚(yú)胚胎圖像由杭州環(huán)特生物科技有限公司提供。共對(duì)3組斑馬魚(yú)圖像進(jìn)行了測(cè)試,分別為對(duì)照組、溶劑組以及陽(yáng)性藥物組。每組分別有100張圖像,共計(jì)300張,不同處理組別斑馬魚(yú)胚胎圖如圖5所示。在每組圖像中隨機(jī)取出80張用于截取正、負(fù)樣本訓(xùn)練分類器,余下20張用于目標(biāo)識(shí)別算法測(cè)試。
節(jié)間血管與非血管部分識(shí)別過(guò)程為,截取圖中完整的血管部分作為正樣本,同時(shí)截取圖片其余部分作為負(fù)樣本,正、負(fù)樣本圖片大小盡量保持相近。在實(shí)驗(yàn)過(guò)程中共截取了460組正樣本和1 360組負(fù)樣本,圖6為部分正、負(fù)樣本截取結(jié)果示例。研究過(guò)程中,為減少數(shù)據(jù)量并保證輸入圖像的細(xì)節(jié)信息,將正、負(fù)樣本圖像統(tǒng)一通過(guò)插值計(jì)算轉(zhuǎn)換為20×50的圖像。
圖5 3種不同處理組別斑馬魚(yú)圖像
圖6 正、負(fù)樣本截取結(jié)果
5.2 算法測(cè)試
通過(guò)Haar-like特征圖提取數(shù)據(jù)集給定的20像素×50像素樣本,得到圖像正、負(fù)樣本特征的總數(shù)量為392 019。
經(jīng)過(guò)特征提取后,使用AdaBoost特征分類器對(duì)特征進(jìn)行訓(xùn)練,得出一個(gè)由不同權(quán)重弱分類器組合得到的強(qiáng)分類器。使用分類器分別對(duì)3組實(shí)驗(yàn)組,每組20幅圖像,共60幅斑馬魚(yú)胚胎熒光圖像加載檢測(cè),圖7為3個(gè)組別中隨機(jī)一組的檢測(cè)結(jié)果。
圖7 斑馬魚(yú)胚胎圖像節(jié)間血管提取結(jié)果
為了更好地判斷提取結(jié)果,定義了以下2種比率:
1)準(zhǔn)確率,被標(biāo)定的血管中真正的節(jié)間血管數(shù)量與算法認(rèn)為血管總數(shù)量之比;
2)識(shí)全率,被標(biāo)定的血管中真正的節(jié)間血管數(shù)量與圖中斑馬魚(yú)節(jié)間本身的血管總數(shù)的比例。
實(shí)驗(yàn)自動(dòng)計(jì)數(shù)結(jié)果分別為24,20和5,與識(shí)別結(jié)果一致。實(shí)驗(yàn)中發(fā)現(xiàn),根據(jù)改進(jìn)算法調(diào)節(jié)參數(shù)值時(shí),會(huì)出現(xiàn)檢測(cè)的準(zhǔn)確率和識(shí)全率無(wú)法同時(shí)得到滿足的情況,所以,為了保證算法的穩(wěn)健性和魯棒性,往往要均衡考慮兩方面的效果而進(jìn)行各自的舍棄,得到兩個(gè)方面均較為理想的結(jié)果。
5.3 識(shí)別效果對(duì)比分析
本文通過(guò)對(duì)比文獻(xiàn)[3]提出的方向梯度直方圖特征描述結(jié)合級(jí)聯(lián)探測(cè)器,以及文獻(xiàn)[16]提出的基于小波和PCA特征融合分類檢測(cè)算法,對(duì)同樣的測(cè)試圖像序列進(jìn)行節(jié)間血管的提取計(jì)數(shù)。3種算法處理結(jié)果如表1。
表1 本文算法與其他算法對(duì)比 %
通過(guò)表1可以得出:本文算法在2種判斷算法的指標(biāo)均表現(xiàn)優(yōu)異,達(dá)到了兩者兼顧的效果。但是由于實(shí)驗(yàn)圖像數(shù)量的原因,訓(xùn)練特征不足,3種算法均未能達(dá)到極高的準(zhǔn)確率以及識(shí)全率。實(shí)際應(yīng)用中,一次實(shí)驗(yàn)往往可得到上千甚至上萬(wàn)的實(shí)驗(yàn)結(jié)果圖像,因此,本文的算法具有極強(qiáng)的應(yīng)用意義,原因如下:1)隨著圖像數(shù)量的增多,可提取的特征隨之增多,則識(shí)別準(zhǔn)確性必然會(huì)提高;2)由于數(shù)量龐大,對(duì)于每幅圖的識(shí)別準(zhǔn)確性要求不會(huì)非??量?,只需能達(dá)到不同組別之間的定性分析,從而判斷藥物對(duì)斑馬魚(yú)胚胎的影響即可。
提出了一種基于Haar-like特征檢測(cè)和改進(jìn)型AdaBoost分類器提取斑馬魚(yú)胚胎熒光圖像的節(jié)間血管算法。針對(duì)圖像提取目標(biāo),將目標(biāo)部分認(rèn)定為正樣本,其余部分劃分為負(fù)樣本,選擇以像素級(jí)特征提取方案,即Haar-like特征圖算法提取圖像特征,使用改進(jìn)型AdaBoost分類算法調(diào)節(jié)參數(shù)閾值對(duì)批量檢測(cè)圖片進(jìn)行加載檢測(cè),并對(duì)提取的目標(biāo)即節(jié)間血管進(jìn)行計(jì)數(shù)。實(shí)驗(yàn)結(jié)果表明:算法識(shí)別精度高,且識(shí)全率也得到了足夠的保證,有很強(qiáng)的應(yīng)用價(jià)值。但算法本身仍有待深入改進(jìn)的空間,例如,本文只針對(duì)同一方向拍攝的斑馬魚(yú)圖像,若圖像方向不確定時(shí)效果是否仍然良好,或者如果圖中出現(xiàn)多條魚(yú)時(shí),算法是否依然有效,針對(duì)這些問(wèn)題,今后將做更進(jìn)一步的研究工作。
[1] 趙 洋,顏妙虹,白殊同,等.過(guò)山楓有效成分南蛇藤素和扁蒴藤素對(duì)斑馬魚(yú)節(jié)間血管生成的抑制作用研究[J].中藥新藥與臨床藥理,2013,24(6):537-540.
[2] 彭蘊(yùn)茹,韋英杰,等.基于斑馬魚(yú)模型的藥物毒性研究進(jìn)展與中藥毒性研究新策略[J].中草藥,2017,48 (1):17-30.
[3] 費(fèi)曉行.斑馬魚(yú)肌間骨的自動(dòng)提取[D].南京:南京理工大學(xué),2009.
[4] Zhang Z,Ong L L S,Fang K,et al.Image classification of unlabeled malaria parasites in red blood cells[C]∥2016 IEEE 38th Annual International Conference of the Engineering in Medicine and Biology Society,IEEE,2016:3981-3984.
[5] 葉 超.基于Gabor小波和SVM的人臉識(shí)別算法研究[D].太原:中北大學(xué),2014.
[6] Papageorgiou C P,Oren M,Poggio T.A general framework for object detection[C]∥1998 Sixth International Conference on IEEE Computer Vision,1998:555-562.
[7] Lienhart R,Maydt J.An extended set of Haar-like features for rapid object detection[C]∥ 2002 Proceedings of International Conference on Image Processing,IEEE,2002:1.
[8] Liao S,Jain A K,Li S Z.A fast and accurate unconstrained face detector[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,38(2):211-223.
[9] Zheng L,He X,Samali B,et al.An algorithm for accuracy enhancement of license plate recognition[J].Journal of Computer & System Sciences,2013,79(2):245-255.
[10] 嚴(yán) 玥,嚴(yán) 實(shí),楊永斌,等.Adaboost集成BP神經(jīng)網(wǎng)絡(luò)在火電廠SO2濃度檢測(cè)中的應(yīng)用[J].傳感器與微系統(tǒng),2016,35(9):148-151.
[11] Kong K K,Hong K S.Design of coupled strong classifiers in AdaBoost framework and its application to pedestrian detection [J].Pattern Recognition Letters,2015,68:63-69.
[12] 徐 前,趙德安,趙建波.基于改進(jìn)的AdaBoost算法的人臉檢測(cè)與定位[J].傳感器與微系統(tǒng),2010,29(1):94-97.
[13] 糜元根,陳丹馳,季 鵬.基于幾何特征與新Haar特征的人臉檢測(cè)算法[J].傳感器與微系統(tǒng),2017,36(2):154-157.
[14] 劉曉芳,夏哲雷,王孝衛(wèi).AdaBoost人臉檢測(cè)算法的改進(jìn)[J].電視技術(shù),2014,38(15):213-216.
[15] 王 毅,王創(chuàng)新,盧 進(jìn),等.基于HSV模型和改進(jìn)AdaBoost算法的車牌檢測(cè)[J].電子科技,2015,28(2):107-111.
[16] 葉 超,姚竹亭.基于小波變換的人臉識(shí)別方法[J].電子世界,2014(4):201-202.
徐建瑜,女,通訊作者,碩士,副教授,碩士生導(dǎo)師,主要從事圖像處理方面的研究工作,E—mail:xujianyu@nbu.edu.cn。
Recognition of blood vessels in image of zebrafish embryo based on improved AdaBoost network model
YANG Wei-jie, XU Jian-yu
(College of Information Science and Engineering,Ningbo University,Ningbo 315211,China)
Based on image feature and improved AdaBoost network model,recognition of zebrafish interstitial blood vessels of is studied.Positive and negative samples are selected from training set of three zebrafish embryo fluorescence image groups,and Haar-like feature maps are used to extract features.According to the recognition effect,adjust the coefficient of the improved network to obtain the improved cascade classifier.Accurate identification and statistics of the interstitial blood vessels are obtained.Experimental results show that the accuracy and efficiency of interstitial blood vessels extraction are 93.8 % and 91.1 % respectively,which indicates that the algorithm has high detection accuracy rate and has stable detection effect on different image groups.
interstitial blood vessels recognition; zebrafish; improved AdaBoost; feature extraction
10.13873/J.1000—9787(2017)08—0141—04
2017—06—27
TP 391.41
A
1000—9787(2017)08—0141—04
楊瑋婕(1993 -),女,碩士研究生,主要研究方向?yàn)樯飯D像處理,E—mail:yangwejie416@163.com。