林 麗,劉 新,朱俊臻,馮輔周
〈無(wú)損檢測(cè)〉
基于卷積神經(jīng)網(wǎng)絡(luò)的超聲紅外熱圖像分類(lèi)
林 麗1,劉 新1,朱俊臻2,馮輔周2
(1. 大連交通大學(xué) 機(jī)車(chē)車(chē)輛工程學(xué)院,遼寧 大連 116000;2. 陸軍裝甲兵學(xué)院車(chē)輛工程系,北京 100072)
在超聲紅外熱像技術(shù)應(yīng)用中,從紅外熱圖像來(lái)判斷被測(cè)對(duì)象是否含有裂紋,通常需要先基于人工經(jīng)驗(yàn),從紅外熱圖像中提取特征再采用某種模式識(shí)別方法進(jìn)行分類(lèi),裂紋的識(shí)別與定位過(guò)程繁瑣且識(shí)別率較低。為此,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)技術(shù)的超聲紅外熱圖像裂紋檢測(cè)與識(shí)別方法,其特點(diǎn)是可以直接從超聲紅外圖像中學(xué)習(xí)特征進(jìn)而實(shí)現(xiàn)是否含有裂紋紅外熱圖像的分類(lèi)。通過(guò)實(shí)驗(yàn)得到的含裂紋和不含裂紋金屬平板試件的紅外熱圖像,建立卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)圖像中是否含有裂紋進(jìn)行分類(lèi),研究結(jié)果表明,參數(shù)優(yōu)化后的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)超聲紅外熱圖像的有無(wú)裂紋分類(lèi)準(zhǔn)確率達(dá)到98.7%。
卷積神經(jīng)網(wǎng)絡(luò);超聲紅外檢測(cè);圖像識(shí)別;圖像分類(lèi)
科技快速發(fā)展,計(jì)算機(jī)性能得到大幅提升,深度學(xué)習(xí)作為一種實(shí)現(xiàn)人工智能的強(qiáng)大技術(shù),在圖像視頻、語(yǔ)音處理等領(lǐng)域獲得了大量成果,對(duì)各個(gè)領(lǐng)域都產(chǎn)生了廣泛的影響。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)作為深度學(xué)習(xí)中極為重要的模型,自2012年以來(lái)極大地推進(jìn)了圖像分類(lèi)、識(shí)別和理解技術(shù)的發(fā)展。曾平平等人[1]將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到水果圖像分類(lèi)中并取得了較好的識(shí)別率。林明旺等人[2]將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于魚(yú)類(lèi)圖像識(shí)別分類(lèi),識(shí)別率達(dá)到了96.24%。張安安等人[3]將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于軸承故障模式的識(shí)別中,該方法較其他方法分類(lèi)準(zhǔn)確率提高了4.26%。當(dāng)然,卷積神經(jīng)網(wǎng)絡(luò)的影響不僅僅局限于圖像處理,通過(guò)與其他技術(shù)的結(jié)合,卷積神經(jīng)網(wǎng)絡(luò)也在用于圍棋程序AlphaGo、語(yǔ)音識(shí)別和機(jī)器翻譯軟件等各種應(yīng)用系統(tǒng),推動(dòng)了人工智能的空前發(fā)展[4]。
本文依據(jù)卷積神經(jīng)網(wǎng)絡(luò)的特性提出了一種利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)超聲紅外熱圖像分類(lèi)的技術(shù)從而實(shí)現(xiàn)對(duì)裂紋的檢測(cè)與分類(lèi),本方法將超聲紅外檢測(cè)所得的圖像輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)對(duì)其識(shí)別分類(lèi),并對(duì)多種網(wǎng)絡(luò)的識(shí)別率進(jìn)行對(duì)比,以確定最優(yōu)方案。
卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu)為5部分,分別為輸入層(Input Layer)、交替分布的卷積層(Convolution Layer)和池化層(Pooling Layer)、全連接層(Fully Connected Layer,F(xiàn)C)和輸出層(Output Layer)[5]。
輸入的圖像為矩陣形式,卷積層對(duì)應(yīng)的卷積運(yùn)算是此矩陣與參數(shù)矩陣在卷積層中做卷積操作的過(guò)程。參數(shù)矩陣也被稱(chēng)作卷積核,不同的卷積核能夠提取到圖像中的不同特征。卷積核的每個(gè)元素與被卷積圖像對(duì)應(yīng)位置相乘,再求和。通過(guò)卷積核的不斷移動(dòng),就會(huì)產(chǎn)生新的圖像,該圖像完全由卷積核在各個(gè)位置時(shí)的乘積求和的結(jié)果組成。卷積網(wǎng)絡(luò)中的卷積核參數(shù)是通過(guò)反向傳播中不斷優(yōu)化訓(xùn)練出來(lái)的,卷積核除了可以學(xué)習(xí)到類(lèi)似于橫向邊緣、縱向邊緣,還可以學(xué)習(xí)到任意角度邊緣甚至檢測(cè)顏色、紋理等信息[5]。
池化層主要的作用是下采樣,通過(guò)去掉特征圖(feature map)中不重要的樣本,進(jìn)一步減少參數(shù)數(shù)量。池化的方法很多,常用的是最大池化(max pooling)與平均池化(mean pooling)。最大池化實(shí)際上就是在×的樣本中取最大值,作為采樣后的樣本值。平均池化就是取其平均值作為采樣后的樣本值。池化層可降低數(shù)據(jù)維度,避免過(guò)擬合、增強(qiáng)局部感受野以及提高平移不變性。
全連接層的作用是搭建特征提取到分類(lèi)的橋梁。全連接層將學(xué)習(xí)到的特征空間里的特征參數(shù)映射到樣本的標(biāo)記空間里。特征向量的長(zhǎng)度對(duì)應(yīng)分類(lèi)的類(lèi)別數(shù)。由于此特征向量里的值是將經(jīng)過(guò)多個(gè)卷積層、池化層以及激活函數(shù)所獲得的圖像特征進(jìn)行高度提純后得到的,所以這個(gè)特征向量具有高層的特征信息,即包含了輸入圖像經(jīng)過(guò)各種操作的所有特征的組合信息,這些信息就是圖像中最具有特點(diǎn)的特征,這樣就可以通過(guò)這些信息輸出圖像具體所屬類(lèi)別的概率值對(duì)圖像進(jìn)行分類(lèi)。
2.1.1 紅外熱成像無(wú)損檢測(cè)技術(shù)的原理
超聲紅外熱像技術(shù)采用超聲脈沖作為激勵(lì)源,注入被測(cè)對(duì)象的振動(dòng)能量傳播至裂紋、分層等接觸界面類(lèi)型缺陷區(qū)域時(shí),缺陷區(qū)域因摩擦生熱、塑性變形等產(chǎn)生熱量,使機(jī)械能轉(zhuǎn)化為熱能,產(chǎn)生的熱量以熱波的形式向試件表面?zhèn)鲗?dǎo),從而通過(guò)熱像儀獲取表面溫度分布來(lái)判斷被測(cè)對(duì)象內(nèi)部或表面缺陷[6]。
超聲紅外熱像技術(shù)發(fā)揮了超聲和紅外熱像技術(shù)的優(yōu)點(diǎn)。利用超聲在傳播路徑上因缺陷等不均勻結(jié)構(gòu)引起超聲的附加衰減,使缺陷局部溫度升高,同時(shí)利用紅外照相機(jī)以較大的視場(chǎng)顯示被檢測(cè)物體的表面溫度分布,而不必考慮超聲源與缺陷之間的相對(duì)方位和距離。由此,采用紅外熱像技術(shù)進(jìn)行缺陷檢測(cè)的特點(diǎn)是不受材料的幾何結(jié)構(gòu)及材質(zhì)的限制,可以實(shí)現(xiàn)非接觸、大面積的檢測(cè),具有可靠性強(qiáng)、靈敏度高、檢測(cè)速度快和使用方便等優(yōu)點(diǎn)[7]。
2.1.2 系統(tǒng)組成
課題組自主設(shè)計(jì)搭建了一套超聲紅外熱像無(wú)損檢測(cè)實(shí)驗(yàn)臺(tái)并編寫(xiě)一套超聲紅外無(wú)損檢測(cè)系統(tǒng)軟件,實(shí)現(xiàn)軟件及硬件上的實(shí)驗(yàn)要求,并實(shí)現(xiàn)激勵(lì)與圖像信號(hào)采集的同步控制。實(shí)驗(yàn)臺(tái)主要由超聲激勵(lì)裝置、圖像采集裝置及導(dǎo)軌等輔助裝置組成,如圖1所示。
圖1 超聲紅外熱像無(wú)損檢測(cè)實(shí)驗(yàn)臺(tái)
圖像采集裝置采用美國(guó)FLIR公司生產(chǎn)的T640型紅外熱像儀,主要用于實(shí)現(xiàn)采集對(duì)象表面的溫度場(chǎng)信息。其采用非制冷微熱量紅外焦平面陣列,實(shí)現(xiàn)了整幅圖像所有像素點(diǎn)同時(shí)采集,有效避免了光機(jī)掃描式紅外熱像儀存在的同一幅圖像不同像素點(diǎn)采集時(shí)間有偏差的不足。該熱像儀可以提供T系列紅外熱像儀中最高的紅外圖像分辨率,為640pixel×480pixel,熱靈敏度優(yōu)于0.035℃,圖像采集幀頻為30Hz,鏡頭可實(shí)現(xiàn)120°上下翻轉(zhuǎn)。其自帶軟件FLIR-Research IR功能強(qiáng)大,可在同一場(chǎng)景下序列圖像中選定多個(gè)不同形狀區(qū)域,并繪制選定區(qū)域的平均溫度值、最高溫度值等相關(guān)溫度信息隨時(shí)間的變化曲線(xiàn),并實(shí)現(xiàn)簡(jiǎn)單的圖像處理功能。
本次實(shí)驗(yàn)數(shù)據(jù)采集的對(duì)象為金屬平板試件,分為有裂紋與無(wú)裂紋。在課題組搭建的試驗(yàn)臺(tái)上進(jìn)行金屬板的激勵(lì)采集實(shí)驗(yàn)??刂撇杉K端采用課題組自主開(kāi)發(fā)的系統(tǒng),可實(shí)現(xiàn)對(duì)紅外熱像儀及超聲換能器在自動(dòng)、手動(dòng)兩種情況下的同步控制,并可視實(shí)驗(yàn)需求對(duì)超聲激勵(lì)振幅、頻率、作用時(shí)間進(jìn)行快速調(diào)節(jié),在最短時(shí)間內(nèi)完成對(duì)待測(cè)件的有效檢測(cè)。
實(shí)驗(yàn)共進(jìn)行6組,每組實(shí)驗(yàn)對(duì)應(yīng)著不同的激勵(lì)參數(shù)或不同的激勵(lì)位置。激勵(lì)結(jié)束后實(shí)驗(yàn)采集系統(tǒng)會(huì)自動(dòng)生成對(duì)應(yīng)文件,然后通過(guò)FLIR-Research IR軟件生成CSV文件。
此次選取的實(shí)驗(yàn)數(shù)據(jù)為同側(cè)激勵(lì),獲得的圖像共有兩千多張,圖2給出了一張含裂紋缺陷的紅外熱圖像,圖中溫度較高的紅色圓點(diǎn)周?chē)鷧^(qū)域?qū)?yīng)著實(shí)際裂紋所在位置。
將實(shí)驗(yàn)所得的CSV文件輸入到軟件MATLAB中進(jìn)行圖像處理,選取所需的實(shí)驗(yàn)范圍,制作實(shí)驗(yàn)所需的數(shù)據(jù)集。最終實(shí)驗(yàn)圖像數(shù)據(jù)共2024張,含有裂紋和無(wú)裂紋各1012張,并將圖像像素尺寸大小先后設(shè)置為16×16、32×32、64×64、128×128。并分別進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)的建模與測(cè)試。
2.3.1 AlexNet網(wǎng)絡(luò)模型
本文采用深度學(xué)習(xí)框架Deep Network Designer構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)。Deep Network Designer是一個(gè)基于MATLAB的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)平臺(tái),與MATLAB軟件有著良好的兼容性。整個(gè)AlexNet[8]有8個(gè)需要訓(xùn)練的層,不包含局部響應(yīng)歸一化(Local Response Normalization,LRN)層和池化層,前5層是卷積層,后3層全連接層。此處用軟最大函數(shù)(Softmax)層替代最后一層全連接層,新的網(wǎng)絡(luò)模型依舊有8層,其中包含了5個(gè)卷積層(C1、C2、C3、C4、C5),2層全連接(F1、F2)和1個(gè)分類(lèi)層。使用重疊最大池化方法,池化核尺寸大于步長(zhǎng),使卷積層的輸出之間有重疊部分,提升了特征的豐富性。使用校正線(xiàn)性單元(Rectified Linear Unit,ReLU)作為激活函數(shù),并將其應(yīng)用于每個(gè)卷積層及全連接層的輸出之后,解決網(wǎng)絡(luò)較深時(shí)的梯度彌散問(wèn)題。在6、7兩個(gè)全連接層后使用丟失(Dropout)算法,隨機(jī)讓網(wǎng)絡(luò)的某些節(jié)點(diǎn)失去作用,減小過(guò)擬合,網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,網(wǎng)絡(luò)模型及參數(shù)如表1所示。
2.3.2 迭代次數(shù)的確定
迭代的過(guò)程是不斷擬合不斷逼近,迭代次數(shù)(epoch)過(guò)少會(huì)影響擬合效果。當(dāng)?shù)螖?shù)到達(dá)一定數(shù)量時(shí),擬合誤差接近收斂,不再減小,過(guò)高的迭代次數(shù)會(huì)不斷的增加實(shí)驗(yàn)的時(shí)間成本。所以選擇適當(dāng)?shù)牡螖?shù)能在得到最佳擬合效果的同時(shí)擁有最小的時(shí)間成本。
圖2 實(shí)驗(yàn)獲得的超聲紅外圖像
圖3 AlexNet網(wǎng)絡(luò)結(jié)構(gòu)
為測(cè)試最佳的迭代次數(shù),簡(jiǎn)化討論的復(fù)雜度,將迭代次數(shù)以外的其他參數(shù)設(shè)為固定值,應(yīng)用上述CNN網(wǎng)絡(luò)模型,設(shè)定最大迭代次數(shù)為30次,通過(guò)網(wǎng)絡(luò)的訓(xùn)練選取最佳的迭代次數(shù)。
2.3.3 網(wǎng)絡(luò)模型性能參數(shù)優(yōu)化
對(duì)AlexNet模型中可調(diào)參數(shù)進(jìn)行優(yōu)化,此處優(yōu)化的參數(shù)有兩個(gè),分別是網(wǎng)絡(luò)訓(xùn)練時(shí)批量尺寸(batchsize)以及在防止過(guò)擬合中使用的丟失比率。
批量尺寸即每次訓(xùn)練在訓(xùn)練集中取定量樣本訓(xùn)練,迭代過(guò)程以iteration作為單位,1個(gè)iteration等于使用批量尺寸個(gè)樣本訓(xùn)練一次,而迭代次數(shù)等于使用訓(xùn)練集中的全部樣本訓(xùn)練的次數(shù)。批量尺寸在卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,影響著網(wǎng)絡(luò)的訓(xùn)練速度和網(wǎng)絡(luò)最終的訓(xùn)練效果,當(dāng)批量尺寸選擇較大的時(shí)候,網(wǎng)絡(luò)訓(xùn)練收斂速度比較快,但同時(shí)由于權(quán)值調(diào)整次數(shù)減少會(huì)影響訓(xùn)練效果,批量尺寸選擇較小時(shí)則反之,所以,需要在較小的時(shí)間成本內(nèi)取得較好的網(wǎng)絡(luò)訓(xùn)練效果,那么就需要根據(jù)時(shí)間成本和訓(xùn)練效果的平衡來(lái)選擇合適的批量尺寸。
批量尺寸一般需要滿(mǎn)足可以整除全部樣本數(shù)據(jù)個(gè)數(shù),但實(shí)際訓(xùn)練中如果不能整除,網(wǎng)絡(luò)會(huì)自動(dòng)舍棄最后的余數(shù)部分?jǐn)?shù)據(jù),在樣本量較大的情況下不會(huì)影響整體的訓(xùn)練效果。AlexNet模型中批量尺寸一般為16的倍數(shù),所以實(shí)驗(yàn)中選擇批量尺寸大小依次為16,32,64,128;參數(shù)在MATLAB深度學(xué)習(xí)程序training Options下進(jìn)行調(diào)整;重復(fù)實(shí)驗(yàn)10次,取10次實(shí)驗(yàn)最終分類(lèi)正確率的平均值和訓(xùn)練所用時(shí)間的平均值為標(biāo)準(zhǔn),則二者隨批量尺寸的變化關(guān)系如表2所示。
由表2可以看出,批量尺寸選擇的越大,網(wǎng)絡(luò)訓(xùn)練時(shí)間就會(huì)越長(zhǎng);除了批量尺寸取16時(shí)的識(shí)別正確率較低,其余情況下識(shí)別率基本在97%左右,因?yàn)樵谂砍叽邕x擇的過(guò)小的時(shí)候,網(wǎng)絡(luò)收斂不穩(wěn)定,loss函數(shù)收斂動(dòng)蕩,導(dǎo)致在批量尺寸最小時(shí)有著最低的識(shí)別率。所以實(shí)際應(yīng)用中,在保證時(shí)間成本的情況下,選擇恰當(dāng)?shù)呐砍叽缈梢蕴岣呔W(wǎng)絡(luò)的識(shí)別正確率,有助于故障類(lèi)別的判斷。針對(duì)此次實(shí)驗(yàn)可以將批量尺寸選擇為32或者64。
表2 不同批量尺寸下的識(shí)別正確率和網(wǎng)絡(luò)訓(xùn)練時(shí)間
2012年,Alex、Hinton提出了AlexNet模型的同時(shí),用到了丟失算法,用于防止過(guò)擬合[8]。丟失算法的工作原理是在每次網(wǎng)絡(luò)訓(xùn)練中,通過(guò)忽略一定比例的特征檢測(cè)器,可以減少過(guò)擬合現(xiàn)象的發(fā)生。而丟失比率代表著忽略特征檢測(cè)器的比例,不同比例的忽略可以對(duì)過(guò)擬合現(xiàn)象有著不同的影響。參數(shù)與批量尺寸大小一樣可以在MATLAB深度學(xué)習(xí)程序training options下進(jìn)行調(diào)整。丟失比率從無(wú)到有一般可以選擇10種比率,分別為0到0.9,間隔為0.1。針對(duì)10種比率,重復(fù)10次實(shí)驗(yàn),取10次實(shí)驗(yàn)最終分類(lèi)正確率的平均值為標(biāo)準(zhǔn),識(shí)別正確率隨丟失比率變化的關(guān)系如表3、表4所示。
對(duì)批量尺寸32與64兩者分別進(jìn)行dropout比率的選取實(shí)驗(yàn),通過(guò)實(shí)驗(yàn),最終確定參數(shù)的選擇為批量尺寸選取64、dropout選取0.5、迭代次數(shù)為20次。
2.3.4 模型實(shí)驗(yàn)
實(shí)驗(yàn)平臺(tái)為WIN10系統(tǒng),仿真軟件為MATLAB2019b,GPU為GeForce GTX 1060 3G。將不同大小尺寸的圖像輸入到網(wǎng)絡(luò)中進(jìn)行訓(xùn)練識(shí)別,輸入到網(wǎng)絡(luò)中的圖像70%作為訓(xùn)練集,其余各15%為測(cè)試集和驗(yàn)證集。進(jìn)行10次實(shí)驗(yàn)取其均值,獲得的識(shí)別率如表5所示,其中某次訓(xùn)練的正確率和損失曲線(xiàn)如圖4所示,此次測(cè)試樣本的分類(lèi)結(jié)果如圖5所示。分類(lèi)結(jié)果圖5中的矩陣稱(chēng)為混淆矩陣,其中,橫軸表示實(shí)際情況,縱軸表示預(yù)測(cè)情況。最右下角方框中的百分比分別代表所有測(cè)試樣本分類(lèi)的正確率和錯(cuò)誤率,最后一行方框(除去最右下角方框中)的百分比分別代表每種圖像測(cè)試樣本分類(lèi)的正確率和錯(cuò)誤率[3]。此模型訓(xùn)練及分類(lèi)結(jié)果并未達(dá)到100%,與樣本集的數(shù)量大小有一定的關(guān)聯(lián),在實(shí)驗(yàn)條件允許的情況下增加數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),獲得的識(shí)別率一定會(huì)有所提高。
表3 批量尺寸32時(shí)不同丟失比率下的識(shí)別率
表4 批量尺寸64時(shí)不同丟失比率下的識(shí)別率
圖4 訓(xùn)練結(jié)果曲線(xiàn)
圖5 測(cè)試樣本分類(lèi)結(jié)果
表5 不同尺寸圖像識(shí)別率
由此可知圖像尺寸為64×64時(shí)識(shí)別率最高,達(dá)到98.7%且時(shí)間相對(duì)較少。
2.3.5 模型對(duì)比
為了驗(yàn)證此網(wǎng)絡(luò)模型的分類(lèi)識(shí)別的能力,將其與GoogLeNet[9]和ResNet[10]兩種CNN模型進(jìn)行對(duì)比,GoogLeNet和ResNet網(wǎng)絡(luò)模型分別是2014年和2015年世界ImageNet比賽的冠軍,網(wǎng)絡(luò)深度分別為22層和50層(卷積層加全連接層的數(shù)量)。使用與AlexNet相同的輸入,即相同的圖像樣本集,網(wǎng)絡(luò)訓(xùn)練參數(shù)也設(shè)置為相同,批量尺寸設(shè)置時(shí),GoogLeNet模型和AlexNet模型均可設(shè)置為64;ResNet模型訓(xùn)練時(shí)當(dāng)把批量尺寸設(shè)置為64會(huì)出現(xiàn)程序錯(cuò)誤的現(xiàn)象,所以本實(shí)驗(yàn)把模型批量尺寸統(tǒng)一設(shè)置為32,迭代次數(shù)為15。實(shí)驗(yàn)結(jié)果如表6所示。從表6可知,參數(shù)優(yōu)化后的AlexNet網(wǎng)絡(luò)模型有著最高的識(shí)別率且相對(duì)較少的網(wǎng)絡(luò)訓(xùn)練時(shí)間。
表6 各神經(jīng)網(wǎng)絡(luò)模型對(duì)比
針對(duì)超聲紅外熱圖像識(shí)別分類(lèi)需要先基于人工經(jīng)驗(yàn),從紅外熱圖像中提取特征再采用某種模式識(shí)別方法進(jìn)行裂紋的識(shí)別與定位,過(guò)程繁瑣且識(shí)別率較低。本文結(jié)合CNN在圖像特征自動(dòng)提取與圖像分類(lèi)識(shí)別中的廣泛應(yīng)用,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的超聲紅外熱圖像分類(lèi)技術(shù),其可應(yīng)用于金屬件(車(chē)軸等)裂紋的檢測(cè)與分類(lèi)識(shí)別。本文對(duì)多種網(wǎng)絡(luò)模型進(jìn)行對(duì)比,最終確定最優(yōu)方案。實(shí)驗(yàn)結(jié)果表明:參數(shù)優(yōu)化后的卷積神經(jīng)網(wǎng)絡(luò)AlexNet模型對(duì)超聲紅外熱圖像的分類(lèi)即對(duì)裂紋檢測(cè)與識(shí)別的技術(shù)是可行的,其識(shí)別率達(dá)到了98.7%。
[1] 曾平平, 李林升. 基于卷積神經(jīng)網(wǎng)絡(luò)的水果圖像分類(lèi)識(shí)別研究[J]. 機(jī)械設(shè)計(jì)與研究, 2019, 35(1): 23-26, 34.
ZENG Pingping, LI Linsheng . Classification and Recognition of Common Fruit Images Based on Convolutional Neural Network[J]., 2019, 35(1): 23-26, 34.
[2] 林明旺. 基于卷積神經(jīng)網(wǎng)絡(luò)的魚(yú)類(lèi)圖像識(shí)別與分類(lèi)[J]. 電子技術(shù)與軟件工程, 2017(6): 82-83.
LIN Mingwang. Fish image recognition and classification based on convolutional neural network[J]., 2017(6): 82-83.
[3] 張安安, 黃晉英, 冀樹(shù)偉, 等.基于卷積神經(jīng)網(wǎng)絡(luò)圖像分類(lèi)的軸承故障模式識(shí)別[J]. 振動(dòng)與沖擊, 2020, 39(4): 165-171.
ZHANG An’an, HUANG Jinying, JI Shuwei, et al. Bearing fault pattern recognition based on image classification with CNN[J]., 2020, 39(4): 165-171.
[4] 李玉鑑, 張婷, 單傳輝, 等. 深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)從入門(mén)到精通[M]. 北京: 機(jī)械工業(yè)出版社,2018.
LI Yujian, ZHANG Ting, SHAN Chuanhui, et al.[M]. Beijing: China Machine Press, 2018.
[5] 李彥冬, 郝宗波, 雷航. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)應(yīng)用, 2016, 36(9): 2508-2515, 2565.
LI Yandong, HAO Zongbo, LEI Hang. Survey of convolutional neural network[J]., 2016, 36(9): 2508-2515, 2565.
[6] 馮輔周, 張超省, 宋愛(ài)斌, 等. 超聲紅外熱像檢測(cè)中疲勞裂紋的檢出概率模型研究[J]. 紅外與激光工程, 2016, 45(3): 60-65.
FENG Fuzhou, ZHANG Chaosheng, SONG Aibin, et al. Probability of detection model for fatigue crack in ultrasonic infrared imaging[J]., 2016, 45(3): 60-65.
[7] 馮輔周, 張超省, 閔慶旭, 等. 超聲紅外熱像技術(shù)中金屬平板裂紋的生熱特性[J]. 紅外與激光工程, 2015, 44(5): 1456-14461.
FENG Fuzhou, ZHANG Chaosheng, MIN Qingxu, et al. Heating characteristics of metal plate crack in sonic IR imaging[J]., 2015, 44(5): 1456-14461.
[8] Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]//, 2012: 1106-1114.
[9] Szegedy C, LIU W, JIA Y, et al. Going deeper with convolutions[C]//2015:, 2015: 1-8.
[10] HE K, ZHANG X, REN S, et al. Deep Residual Learning for Image Recognition[EB/OL]. [2020-6-20]. https://arxiv.org/pdf/1512.03385.pdf.
Classification of Ultrasonic Infrared Thermal Images Using a Convolutional Neural Network
LIN Li1,LIU Xin1,ZHU Junzhen2,F(xiàn)ENG Fuzhou2
(1.,116000,;2.,,100072,)
In the application of ultrasonic infrared thermographic technology, it is usually necessary to extract features from infrared thermographic images based on artificial experience and then adopt a pattern recognition method to classify the cracks. The identification and positioning process of the cracks is complicated, and the recognition rate is low. Therefore, a method of crack detection and recognition in ultrasonic infrared thermal images based on convolutional neural network technology is proposed in this paper. Its feature is that the features can be directly learned from the ultrasonic infrared image to realize the classification of infrared thermal images containing cracks. Thesis through the research experiment of metal plate specimen of the crack in and do not contain infrared thermal images, the convolutional neural network model is established for whether the image contains crack classification, the results show that the parameter optimized convolution neural network model for ultrasonic infrared thermal images of crack classification accuracy rate reached 98.7%.
convolutional neural network; ultrasonic infrared detection; image recognition; image classification
TP391
A
1001-8891(2021)05-0496-06
2020-06-29;
2020-10-24.
林麗(1971-),女,副教授,博士,碩士生導(dǎo)師,主要從事列車(chē)故障診斷方面的研究。E-mail:julandalili@126.com。
馮輔周(1971-),男,教授,博士生導(dǎo)師,主要從事故障診斷與無(wú)損檢測(cè)技術(shù)研究。E-mail:fengfuzhou@tsinghua.org.cn。
國(guó)家自然科學(xué)基金(51875576);教育部重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金項(xiàng)目(EW201980445)。