周新華
摘要:隨著時(shí)代的發(fā)展,圖像識(shí)別技術(shù)作為人工智能領(lǐng)域中的一項(xiàng)核心技術(shù),在人們的工作和生活中發(fā)揮著越來(lái)越重要的作用。本文從圖像識(shí)別技術(shù)的基本原理出發(fā),分析了其在人工智能中的發(fā)展現(xiàn)狀,寄希望圖像識(shí)別技術(shù)能得到更廣泛的應(yīng)用。
關(guān)鍵詞:人工智能;圖像識(shí)別技術(shù);應(yīng)用
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)12-0172-02
圖像識(shí)別技術(shù)作為信息時(shí)期的一項(xiàng)重要技術(shù),其主要用途是通過(guò)計(jì)算機(jī)對(duì)相關(guān)的物理信息進(jìn)行識(shí)別,識(shí)別過(guò)程主要包含獲得信息、信息預(yù)處理、圖像特征分類、分類設(shè)計(jì)與決策等。目前,在人們的日常工作和生活中,通常會(huì)不經(jīng)意地接觸到圖像識(shí)別技術(shù),例如,指紋識(shí)別、條形碼的識(shí)別、人臉識(shí)別等[1]。且隨著時(shí)代的發(fā)展,科技的進(jìn)步,圖像識(shí)別技術(shù)在不斷演變過(guò)程中將具有更為廣闊的運(yùn)用空間,尤其是在安全檢查、產(chǎn)品質(zhì)量、信息搜集、醫(yī)療設(shè)備等各個(gè)領(lǐng)域,都需要圖像識(shí)別技術(shù)的參與,因此,圖像識(shí)別技術(shù)的深入研究,對(duì)社會(huì)的進(jìn)步和經(jīng)濟(jì)的發(fā)展都具有重要的意義。
1 圖像識(shí)別技術(shù)原理
圖像識(shí)別包括人類圖像識(shí)別和計(jì)算機(jī)圖像識(shí)別,人類圖像識(shí)別通常與計(jì)算機(jī)形式的圖像識(shí)別并無(wú)本質(zhì)區(qū)別,只是機(jī)器不會(huì)被人類所具備的聽(tīng)覺(jué)、視覺(jué)等感官差異所影響。人類的圖像識(shí)別不只依靠腦海中所存儲(chǔ)的圖像進(jìn)行辨認(rèn),其在進(jìn)行圖像識(shí)別過(guò)程中,還會(huì)依賴于圖像識(shí)別自身所具備的特征對(duì)其實(shí)施分類,并依據(jù)不同特征的類別,對(duì)圖像進(jìn)行處理。例如當(dāng)人們看到某張圖片的時(shí)候,大腦通常會(huì)依據(jù)存儲(chǔ)在腦海當(dāng)中已經(jīng)完成分類的圖片進(jìn)行識(shí)別,并查找腦海中已知相似的或者具有相似特征的圖片,由此完成對(duì)該圖像的識(shí)別[2]。通過(guò)計(jì)算機(jī)完成圖像識(shí)別的技術(shù)與人類的識(shí)別相似,也是依據(jù)分類以及提取相似特征,對(duì)多余的信息進(jìn)行排除的方式完成圖像識(shí)別。計(jì)算機(jī)所獲取的相關(guān)特征有時(shí)表現(xiàn)極為明顯,有時(shí)卻比較普通,其通常會(huì)對(duì)計(jì)算機(jī)所具備的識(shí)別速率造成一定影響。因此,通過(guò)計(jì)算機(jī)進(jìn)行視覺(jué)識(shí)別,圖像表現(xiàn)的內(nèi)容通常是以圖像的特征對(duì)其實(shí)施描述。
2 人工智能中圖像識(shí)別技術(shù)的應(yīng)用
2.1 神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)
神經(jīng)網(wǎng)絡(luò)式圖像的識(shí)別技術(shù)可以進(jìn)行圖像的識(shí)別,主要是因?yàn)槠淠軌驅(qū)ι窠?jīng)網(wǎng)絡(luò)的算法進(jìn)行應(yīng)用,而在圖像的識(shí)別中運(yùn)用神經(jīng)網(wǎng)絡(luò),首先要對(duì)有關(guān)圖像實(shí)施預(yù)處理,其預(yù)處理的方式包含真彩圖轉(zhuǎn)為灰度圖、灰度圖的放大以及旋轉(zhuǎn)、灰度圖實(shí)現(xiàn)歸一化等相關(guān)內(nèi)容。想要確保神經(jīng)網(wǎng)絡(luò)可以更有效對(duì)圖像進(jìn)行識(shí)別,還要根據(jù)圖像識(shí)別的具體領(lǐng)域以及對(duì)象,設(shè)計(jì)出具有針對(duì)性的神經(jīng)網(wǎng)絡(luò),該設(shè)計(jì)通常包含設(shè)計(jì)輸入層、隱含層、輸出層,以及選取初始權(quán)值、期望誤差等5方面[3]。具體表現(xiàn)為:1)在對(duì)輸入層進(jìn)行設(shè)計(jì)的時(shí)候,需要依據(jù)識(shí)別對(duì)象的具體需求,對(duì)求解的實(shí)際問(wèn)題以及數(shù)據(jù)的具體表示方式進(jìn)行確定,本次研究當(dāng)中,為了便于對(duì)神經(jīng)網(wǎng)絡(luò)的理解,輸入層的設(shè)計(jì)統(tǒng)一成為尺寸為16×16大小的圖像樣本,網(wǎng)絡(luò)輸入為256維;2)在對(duì)隱含層實(shí)施設(shè)計(jì)的時(shí)候,需要對(duì)隱含層的具體數(shù)目以及單元數(shù)進(jìn)行確定,當(dāng)前領(lǐng)域已經(jīng)對(duì)隱含層的具體神經(jīng)元數(shù)目進(jìn)行了明確,以確保誤差的精度得以有效降低。因此,對(duì)隱層數(shù)目進(jìn)行適當(dāng)?shù)脑黾?,就可以?duì)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)有效的設(shè)計(jì),而在對(duì)隱含層的單元數(shù)進(jìn)行選擇的時(shí)候,通常以經(jīng)驗(yàn)公式作為參考,其可以使神經(jīng)網(wǎng)絡(luò)出現(xiàn)較弱的泛化能力得以有效避免[4]。對(duì)樣本的識(shí)別率較低的問(wèn)題而言,公式當(dāng)中的M通常表示為輸出層的神經(jīng)元數(shù)目,N通常表示輸入層的神經(jīng)元數(shù)目。需要注意的是,對(duì)具有較小影響的隱含層的單元進(jìn)行刪除,能夠使神經(jīng)網(wǎng)絡(luò)所具備的性能得以有效提高,但是,該結(jié)構(gòu)的唯一缺陷就是需要花費(fèi)較長(zhǎng)的時(shí)間;3)在對(duì)輸出層進(jìn)行設(shè)計(jì)的時(shí)候,通常會(huì)選擇較多的輸出型,對(duì)神經(jīng)網(wǎng)絡(luò)實(shí)施設(shè)計(jì);4)在對(duì)初始權(quán)值進(jìn)行選取的時(shí)候,想要使神經(jīng)網(wǎng)絡(luò)在實(shí)際學(xué)習(xí)的時(shí)候具有良好的收斂,初始權(quán)值通常選擇為(-1,1)兩者間的隨機(jī)數(shù);5)在對(duì)期望誤差進(jìn)行選擇的時(shí)候,其通常需要對(duì)訓(xùn)練的時(shí)間以及預(yù)期的誤差值進(jìn)行參考,研究通常以0.001為研究的期望誤差值[5]。
神經(jīng)網(wǎng)絡(luò)完成相應(yīng)設(shè)計(jì)之后,就需要對(duì)神經(jīng)網(wǎng)絡(luò)實(shí)施訓(xùn)練,以此確保對(duì)圖像識(shí)別的需求進(jìn)行滿足。例如,研究中以MATLAB7.0當(dāng)中的newff函數(shù)進(jìn)行運(yùn)用,構(gòu)建相應(yīng)的兩層網(wǎng)絡(luò),該網(wǎng)絡(luò)通常包含輸出神經(jīng)元1個(gè)、輸入層16×16個(gè)、隱含層26個(gè)單元,學(xué)習(xí)的函數(shù)為learngdm,初始的學(xué)習(xí)速率通常為0.01-0.6,訓(xùn)練性能的函數(shù)為“mse”,訓(xùn)練的指標(biāo)為0.001,訓(xùn)練的最大循環(huán)為2500。通過(guò)對(duì)上文的神經(jīng)網(wǎng)絡(luò)完成設(shè)計(jì)以及訓(xùn)練之后,就需要對(duì)其實(shí)施運(yùn)用實(shí)驗(yàn),該實(shí)驗(yàn)當(dāng)中,通過(guò)神經(jīng)網(wǎng)絡(luò),對(duì)手寫的26個(gè)英文字母圖實(shí)施識(shí)別,表1為該實(shí)驗(yàn)的識(shí)別結(jié)果,由此可知,不同節(jié)點(diǎn)所具有的數(shù)目通常會(huì)對(duì)圖像識(shí)別所具備的識(shí)別率產(chǎn)生直接的影響。
2.2 非線性降維的圖像識(shí)別技術(shù)
對(duì)于計(jì)算機(jī)而言,其圖像的識(shí)別技術(shù)屬于異常高維的一種識(shí)別技術(shù)。不論圖像具備任何分辨率,其所形成的數(shù)據(jù)通常都是多維的,這就會(huì)對(duì)計(jì)算機(jī)實(shí)現(xiàn)有效的識(shí)別產(chǎn)生較大的困難。想要使計(jì)算機(jī)自身具備較有效的識(shí)別能力,最有效且直接的方式就是進(jìn)行降維。降維主要分為非線性降維以及線性降維[6]。例如,實(shí)施線性的奇異分析(LDA)以及主成分分析(PCA)等,就屬于線性的降維方式,其雖然具備易理解、簡(jiǎn)單的特點(diǎn),但是,以線性降維實(shí)施處理的屬于整體性的數(shù)據(jù)集合,所獲得為數(shù)據(jù)整個(gè)集合最佳的低維投影。通過(guò)驗(yàn)證,線性降維的方式,計(jì)算通常具有較高的復(fù)雜度,且占用的空間以及時(shí)間通常較多,這就會(huì)形成非線性的降維式圖像的識(shí)別技術(shù),其通常屬于較為有效、科學(xué)的非線性的提取方式。該技術(shù)不僅可以對(duì)圖像所具備的非線性結(jié)構(gòu)進(jìn)行發(fā)現(xiàn),而且還能夠在不破壞圖像自身結(jié)構(gòu)的前提下實(shí)施降維,以此使計(jì)算機(jī)式的圖像識(shí)別能夠在盡可能低的維度上實(shí)施,從而使圖像的識(shí)別速率得以有效提高[7]。例如,在對(duì)人臉進(jìn)行識(shí)別的系統(tǒng)中,通常會(huì)被圖像維度所影響,其不僅會(huì)使人類的識(shí)別系統(tǒng)通常需耗費(fèi)較多的時(shí)間,而且還會(huì)對(duì)計(jì)算機(jī)系統(tǒng)造成較嚴(yán)重的損壞,其主要是因?yàn)槿四樚幱诟呔暥瓤臻g的時(shí)候,會(huì)具有不均勻分布的特征所導(dǎo)致的,而非線性的降維識(shí)別技術(shù)在實(shí)現(xiàn)運(yùn)用后,人臉的圖形就能夠?qū)崿F(xiàn)有效的緊湊,從而使人臉的識(shí)別系統(tǒng)效果得到有效的提高。
3 結(jié)束語(yǔ)
綜上所述,圖像識(shí)別技術(shù)雖然在人工智能的應(yīng)用中屬于一種新興技術(shù),但是已經(jīng)在社會(huì)的各個(gè)領(lǐng)域發(fā)揮著越來(lái)越重要的作用。目前,我國(guó)已經(jīng)進(jìn)入信息化時(shí)代,只有讓人工智能技術(shù)和圖像處理技術(shù)得到不斷融合、發(fā)展,才能進(jìn)一步保障人民的財(cái)產(chǎn)安全,促使經(jīng)濟(jì)得到持續(xù)、有效發(fā)展。
參考文獻(xiàn):
[1] 張嘉豐.關(guān)于人工智能中圖像識(shí)別技術(shù)的研究[J].電子技術(shù)與軟件工程,2018(23):250-251.
[2] 呂萌.計(jì)算機(jī)人工智能識(shí)別技術(shù)類型及其應(yīng)用[J].電子技術(shù)與軟件工程,2018(20):249.
[3] 魯琴,孟瑤.基于互聯(lián)網(wǎng)的動(dòng)態(tài)圖像信息智能提取系統(tǒng)的設(shè)計(jì)[J].電視技術(shù),2018,42(09):47-51.
[4] 徐勤濤,楊自恒,朱偉男,等.基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)與方法探討[J].通訊世界,2018(07):100-101.
[5] 宋炯,柏松平,王燕華.基于人工智能的圖像識(shí)別技術(shù)探討[J].科技傳播,2018,10(01):106-107.
[6] 張瑞,趙秀峰.淺析用于監(jiān)控智能報(bào)警系統(tǒng)的圖像識(shí)別技術(shù)[J].中國(guó)新通信,2017,19(08):144.
[7] 周林妹.基于計(jì)算機(jī)圖像技術(shù)的系統(tǒng)識(shí)別技術(shù)應(yīng)用研究[J].信息系統(tǒng)工程,2016(10):35.
【通聯(lián)編輯:唐一東】