尹洪巖 宋磊 張春波
摘 要:本文主要對計(jì)算機(jī)智能圖像識別的算法進(jìn)行深入分析,并以此為基礎(chǔ)深入探討計(jì)算機(jī)智能圖像識別技術(shù)的應(yīng)用特點(diǎn)與過程,希望可以不斷擴(kuò)大計(jì)算機(jī)智能圖像識別技術(shù)的應(yīng)用范圍,進(jìn)而創(chuàng)造出更大的社會價值。
關(guān)鍵詞:計(jì)算機(jī);智能圖像識別;算法分析;技術(shù)應(yīng)用
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A DOI:10.3969/j.issn.1003-6970.2021.03.048
本文著錄格式:尹洪巖,宋磊,張春波.基于計(jì)算機(jī)智能圖像識別的算法與技術(shù)研究[J].軟件,2021,42(03):165-167+183
Research on Algorithms and Technologies Based on Computer Intelligent Image Recognition
YIN Hongyan, SONG Lei, ZHANG Chunbo
(Harbin Vocational & Technical College, Harbin? Heilongjiang? 150086)
【Abstract】:This article mainly conducts an in-depth analysis of the computer intelligent image recognition algorithm, and on this basis, in-depth discussion of the application characteristics and process of computer intelligent image recognition technology, hoping to continue to expand the application scope of computer intelligent image recognition technology, and then create greater social value.
【Key words】:computer;intelligent image recognition;analysis of algorithms;technology application
0 引言
計(jì)算機(jī)智能圖像識別技術(shù)可以深入分析圖像的本質(zhì)特征,并可以在識別圖像的過程中獲取圖像的數(shù)據(jù)信息,已經(jīng)在眾多領(lǐng)域起到較好的應(yīng)用效果。對計(jì)算機(jī)智能圖像的識別算法與識別技術(shù)進(jìn)行深入分析,還可以有效提高智能圖像識別技術(shù)的應(yīng)用質(zhì)量,進(jìn)而實(shí)現(xiàn)大范圍推廣?;谟?jì)算機(jī)的智能圖像識別技術(shù)具有精度高、信息量大等特點(diǎn),無論是在信息的采集、處理,還是信息的邊緣提取,都能發(fā)揮出重要作用。所以技術(shù)人員需要不斷優(yōu)化計(jì)算機(jī)智能圖像識別的算法與技術(shù),促使其能夠在更多領(lǐng)域創(chuàng)造出更大價值。
1 圖像識別技術(shù)的原理分析
圖像識別技術(shù)是一種十分熱門的前沿技術(shù),在圖像識別技術(shù)的支持下,過去很多難以解決的問題都可迎刃而解。計(jì)算機(jī)系統(tǒng)需要對圖像進(jìn)行細(xì)致的分析和處理,進(jìn)而收集到詳細(xì)的信息,以此來完成圖像識別。計(jì)算機(jī)智能圖像識別技術(shù)就是通過計(jì)算機(jī)判斷圖像的具體特征,然后在這些特征數(shù)據(jù)信息的幫助下完成對圖像的分析,因?yàn)樵谟?jì)算機(jī)系統(tǒng)中已經(jīng)存儲了大量的圖片信息,所以計(jì)算機(jī)只需要將數(shù)據(jù)庫中的信息與被處理圖片的信息進(jìn)行對比,就可完成對圖像的精準(zhǔn)識別。通俗的說,就是計(jì)算機(jī)需要以圖像的特征為基礎(chǔ)信息進(jìn)而完成圖像識別,這種技術(shù)類似于人眼識別圖像,都需要利用內(nèi)部的存儲信息對圖像進(jìn)行判斷,計(jì)算機(jī)智能圖像識別技術(shù)在應(yīng)用過程中,與人眼識別的過程相類似??茖W(xué)家通過大量研究得出:人眼在識別圖像時,最先關(guān)注的一定是圖像的顯著特征,例如在觀看到一座陌生的建筑時,人的眼睛首先會觀察到此座建筑物與其他建筑物的區(qū)別之處,諸如形狀、高度、標(biāo)志、弧度等,在抓住顯著特征之后才會仔細(xì)觀察與其他建筑物的共性特點(diǎn)。而計(jì)算機(jī)智能圖像識別技術(shù)在應(yīng)用過程中也需要判斷出圖像的顯著特征,因?yàn)樵趫D像中有著眾多的信息要素,如果計(jì)算機(jī)系統(tǒng)對這些要素進(jìn)行一一識別,不僅會浪費(fèi)大量時間,同時也會影響計(jì)算機(jī)的識別速度[1]。而基于主要信息的計(jì)算機(jī)智能識別技術(shù),在識別過程中可不斷提高對特殊要素的認(rèn)知能力,并可以對重要信息進(jìn)行存儲,進(jìn)而促使圖像識別技術(shù)更加智能。
2 計(jì)算機(jī)智能圖像識別技術(shù)的發(fā)展現(xiàn)狀
計(jì)算機(jī)智能圖像識別技術(shù)已經(jīng)實(shí)現(xiàn)了由文本圖像到數(shù)字圖像的過渡,對數(shù)字圖像進(jìn)行識別,可以最大程度的保證信息的完整性和真實(shí)性,為各個領(lǐng)域的圖像處理提供了更加實(shí)用的方法。現(xiàn)如今計(jì)算機(jī)智能圖像識別技術(shù)已經(jīng)廣泛應(yīng)用在宏觀事物和微觀事物的識別中,例如,在生物研究領(lǐng)域,技術(shù)人員可以在此項(xiàng)技術(shù)的幫助下對人體病毒細(xì)菌進(jìn)行深入研究;在交通領(lǐng)域,管理部門可以在此項(xiàng)技術(shù)的幫助下建立更加全面的交通監(jiān)控網(wǎng)絡(luò),進(jìn)而讓車輛信息的獲取變得更加容易;在進(jìn)行城市規(guī)劃時,技術(shù)人員也可以充分利用智能圖像識別技術(shù)來對城市的布局圖像進(jìn)行獲取,以此來對城市的道路規(guī)劃、功能區(qū)建設(shè)進(jìn)行具體分析。但是現(xiàn)如今隨著計(jì)算機(jī)水平的不斷進(jìn)步,計(jì)算機(jī)智能圖像識別技術(shù)也有著很大的上升空間,社會的各個行業(yè)對于圖像的識別精度、識別速度也有著更高要求。因?yàn)樵趯D像進(jìn)行識別的過程中,計(jì)算機(jī)需要處理十分龐大的數(shù)據(jù),所以若想提高識別精度和識別速度,技術(shù)人員就一定要加大圖像的特征提取、去除冗余信息等方面的研究力度,促使圖像智能識別技術(shù)的更好應(yīng)用。
3 計(jì)算機(jī)智能圖像識別的算法分析
計(jì)算機(jī)智能圖像識別在人工智能領(lǐng)域發(fā)揮著重要作用,能夠精準(zhǔn)的識別不同的對象與目標(biāo)?,F(xiàn)如今在人工智能領(lǐng)域最主要的智能圖像識別算法不外乎以下兩種:Hu不變矩算法與D-S證據(jù)推理算法等。
3.1 Hu不變矩算法
在智能圖像的識別算法中,Hu不變矩算法是最早應(yīng)用的算法之一,可以追溯到上世紀(jì)60年代初。算法原理是以圖像中的低階節(jié)歸一化中心矩的非線性組合構(gòu)成七個變量值,主要的算法過程如下所示:
用f(x,y)表示二維的數(shù)字圖像,那么可將圖像的階矩定義為:
定義(p+q)階中心距為:μpq=∑x∑y(x-x0)p(y-y0)q f(x,y),其中。
二維圖像的質(zhì)心坐標(biāo)(x0,y0),其中x0為水平方向上灰質(zhì)的質(zhì)心,y0則代表垂直方向上灰質(zhì)的質(zhì)心。然后定義(p+q)階歸一化中心矩:
其中,r=(p+q+2)/2,p+q=2,3,L。
3.2 D-S證據(jù)推理算法
在本質(zhì)上來說,計(jì)算機(jī)智能圖像識別技術(shù)是一種多源信息處理技術(shù),需要對數(shù)據(jù)進(jìn)行融合才能完成信息處理。D-S證據(jù)推理算法在的應(yīng)用原理是需要建立在非空集合Θ上,其中非空集合Θ又被稱之為鑒別框架,進(jìn)而來描述假設(shè)空間的元素集合[2],此框架對元素具有一定要求,要求元素之間應(yīng)當(dāng)互相排斥,通常用2Θ來表示由Θ的子集所構(gòu)成的冪集,然后在冪集中定義信任指派函數(shù):m(A)→[0,1],其中A表示框架中的任意一個子集,m(A)主要代表證據(jù)對A的支持程度,這也就說明m(A)必須滿足如下條件:m(?)=0,∑(A∈2Θ)m(A)=1,可以用信任函數(shù)Bel(A)=∑(B∈A)m(B)來表示對A的總信任度。在結(jié)合一定的組合規(guī)則,技術(shù)人員就可以得到兩個或兩個以上的置信函數(shù),然后利用正交和計(jì)算出新的置信函數(shù)。
4 計(jì)算機(jī)智能圖像識別的技術(shù)分析
在人工智能領(lǐng)域,智能圖像識別技術(shù)有著十分重要的應(yīng)用,能夠?qū)Ω黝悎D像進(jìn)行更加精準(zhǔn)的識別。計(jì)算機(jī)智能圖像識別技術(shù)在應(yīng)用過程中,首先需要在計(jì)算機(jī)系統(tǒng)中輸入將要被識別的圖像,然后利用相應(yīng)軟件對圖像進(jìn)行分析,進(jìn)而提取圖像的特點(diǎn),完成圖像分類。預(yù)處理是計(jì)算機(jī)智能圖像識別技術(shù)的關(guān)鍵步驟,預(yù)處理效果與圖像識別效果成正比關(guān)系。在預(yù)處理過程中,計(jì)算機(jī)系統(tǒng)首先會將圖像與背景圖分離,然后整體細(xì)化圖像的二值化,為后期的圖像處理奠定基礎(chǔ),最大程度的保證圖像的真實(shí)性,降低圖像中的虛假成分,對后期的圖像處理提供更加精準(zhǔn)的數(shù)據(jù)[3]。
4.1 優(yōu)勢分析
(1)計(jì)算機(jī)智能圖像識別技術(shù)能夠產(chǎn)生更多的信息量。需要識別的圖像經(jīng)過計(jì)算機(jī)系統(tǒng)的處理,就會在系統(tǒng)內(nèi)部產(chǎn)生大量的二維信息,但是如果此時計(jì)算機(jī)的配置與運(yùn)行速度無法滿足持續(xù)增多的二維信息的運(yùn)算要求,那么計(jì)算機(jī)系統(tǒng)的運(yùn)行能力就會受到限制。智能圖像識別在處理圖像的過程中,可以按照圖像的傳輸進(jìn)行識別,不僅能夠產(chǎn)生更多的信息量,同時也可保證信息量的及時傳遞,不會為計(jì)算機(jī)系統(tǒng)的運(yùn)行帶來影響。
(2)計(jì)算機(jī)智能圖像識別技術(shù)的精度更高。傳統(tǒng)的圖像處理技術(shù)在處理過程中通常是將圖像轉(zhuǎn)化成數(shù)字信息,所以也只能得到二維數(shù)的組合,這也就造成圖像的像素大多數(shù)小于32位,如果二維數(shù)超過32位,那么將超出技術(shù)的應(yīng)用范圍,也就不能完成對圖像的處理。而計(jì)算機(jī)智能圖像識別技術(shù)在獲取圖像信息時,可有效提高信息精度,進(jìn)而滿足不同用戶的需求。與此同時,智能圖像識別技術(shù)還可以精準(zhǔn)處理信息與圖像的關(guān)系,并最大程度的保證信息完整[4]。而且智能圖像處理技術(shù)幾乎能夠?qū)λ械膱D像進(jìn)行還原處理,因此應(yīng)用范圍十分廣泛。
(3)計(jì)算機(jī)智能圖像識別技術(shù)有著更強(qiáng)的關(guān)聯(lián)性。傳統(tǒng)的圖像處理技術(shù)需要利用計(jì)算機(jī)系統(tǒng),對需要處理的圖像進(jìn)行智能化識別,在這一過程中計(jì)算機(jī)系統(tǒng)需要具體分析不同圖像的特點(diǎn),同時將圖像壓縮,然后才能獲取圖像的本質(zhì)信息,并以信息特點(diǎn)的依據(jù)對圖像進(jìn)行分類,從而進(jìn)行像素匹配。如果輸入的圖像為3D圖像,那么計(jì)算機(jī)系統(tǒng)就無法精準(zhǔn)識別三維幾何圖像,需要重新測量,然后利用技術(shù)人員的經(jīng)驗(yàn)進(jìn)行關(guān)聯(lián)性假設(shè),進(jìn)而獲得需要的數(shù)據(jù)信息。在計(jì)算機(jī)智能圖像識別技術(shù)下,計(jì)算機(jī)可以直接引導(dǎo)3D景物,具有更強(qiáng)的關(guān)聯(lián)性,可有效解決3D圖像無法精準(zhǔn)獲得的問題。
(4)計(jì)算機(jī)智能圖像識別技術(shù)有著更高的靈活性。在處理圖像時,計(jì)算機(jī)智能圖像識別技術(shù)可以放大圖像,因此具有更高的靈活性,可有效處理各類復(fù)雜的圖形,例如天體圖、細(xì)胞圖等。而且通過技術(shù)的線性與非線性組合,圖像處理所獲得的數(shù)據(jù)將更加完整,再經(jīng)過編制后可有效除提高圖像清晰度。
4.2 計(jì)算機(jī)智能圖像的識別過程
(1)需要完成圖像的采集并進(jìn)行預(yù)處理。通常情況來說,計(jì)算機(jī)智能圖像識別技術(shù)在應(yīng)用過程中,不僅一些外在因素會影響識別效果,圖像本身的特性也會產(chǎn)生大小不一的影響。所以在圖像采集輸入過程中,需要結(jié)合多種目的全面采集圖像信息,爭取在獲得更加完整信息的同時進(jìn)一步提高信息的準(zhǔn)確性。這也就要求技術(shù)人員在對圖像進(jìn)行具體識別之前,一定要對圖像進(jìn)行預(yù)先處理,圖像的預(yù)處理是整個圖像識別過程的基礎(chǔ),甚至直接決定著圖像識別的可靠性[5]。
(2)圖像的邊緣提取。圖像的邊緣包含了圖像識別過程中所需要的大量信息,所謂的圖像邊緣,就是指圖像的顏色和亮度在某個方向上的變化組合。為了進(jìn)一步提高圖像識別的效果,技術(shù)人員在識別圖像之前需要有效提取圖像的邊緣信息。小波變換法、空間梯度法是目前最常用的邊緣提取方法,每種方法都有各自的優(yōu)勢和缺點(diǎn)。例如空間梯度法雖然具有更快的提取速度,但是提取過程并不穩(wěn)定,很容易受外界因素干擾,因此無法有效保證提取效果;小波變換法雖然具有更高的識別精度,提取效果相對理想,但是識別速度慢。因此現(xiàn)如今在提取圖像邊緣信息時,通常將兩種提取方法進(jìn)行結(jié)合使用,在強(qiáng)調(diào)提取速度的同時保證提取效果。
(3)區(qū)域分割。計(jì)算機(jī)智能圖像識別技術(shù)在應(yīng)用過程中,一些圖像的灰度和顏色相對接近,因此為了能夠更好的對圖像進(jìn)行識別,技術(shù)人員需要對圖像進(jìn)行區(qū)域分割。具體的分割方式包括:直接分割、間接分割與擴(kuò)充分割等,為了能夠?qū)崿F(xiàn)更好的分割效果,人員需要結(jié)合圖像的實(shí)際情況來具體選擇分割方式。
(4)定位目標(biāo)。在這一過程中,技術(shù)人員首先需要獲取目標(biāo)區(qū)域的相關(guān)數(shù)據(jù)信息,圈定目標(biāo)區(qū)域。在定位過程中,圖像的背景會對定位產(chǎn)生一定影響,背景越復(fù)雜那么目標(biāo)的定位難度就越大,為了精準(zhǔn)的圈定目標(biāo)區(qū)域,技術(shù)人員通常選擇利用邊緣構(gòu)件、顏色特征、紋理特征以及基本元素等進(jìn)行輔助定位。
5 計(jì)算機(jī)智能圖像識別技術(shù)的改進(jìn)方向
計(jì)算機(jī)智能圖像識別技術(shù)已經(jīng)在眾多領(lǐng)域創(chuàng)造出巨大價值,例如視頻跟蹤領(lǐng)域。Mean Shift算法是傳統(tǒng)識別技術(shù)的核心算法,此算法在計(jì)算過程中具有無需快速模式匹配與參數(shù)的特點(diǎn),計(jì)算相對簡單,但是在應(yīng)用過程中卻不能對系統(tǒng)進(jìn)行有效更新,同時對于核函數(shù)窗寬也不能改變其寬度,所以視頻圖像識別的精準(zhǔn)度也就無法有效提高,如果識別目標(biāo)的尺度發(fā)生了明顯變化,此算法就無法保證識別精度,甚至還有可能因此將目標(biāo)丟失。為了解決這一問題,真正提高計(jì)算機(jī)智能圖像識別技術(shù)的應(yīng)用效果,技術(shù)人員可以基于CamShift的視頻跟蹤算法改進(jìn)圖像識別技術(shù)。在計(jì)算機(jī)智能圖像識別技術(shù)應(yīng)用過程中,對顏色的感知是識別的基礎(chǔ),因?yàn)镽GB顏色空間有著十分敏感的光照亮度變化,在圖像識別過程中這種敏感性會對圖像識別帶來很大影響,計(jì)算機(jī)系統(tǒng)因此會可能造成對顏色信息的誤判,所以為了最大程度的提高識別精度,技術(shù)人員可以利用CamShift算法將圖像由RGB顏色空間轉(zhuǎn)變?yōu)镠SV顏色空間,進(jìn)而為后續(xù)的圖像處理奠定基礎(chǔ)。
為了促使計(jì)算機(jī)智能圖像識別技術(shù)創(chuàng)造出更大的社會價值,技術(shù)人員也需要將技術(shù)與人們的生活相結(jié)合,促使此項(xiàng)技術(shù)能夠在人們的生活與工作中發(fā)揮出重要作用。電子計(jì)算機(jī)、智能移動終端與嵌入式終端都能作為智能圖像識別技術(shù)的載體,所以技術(shù)人員也要促使圖像識別技術(shù)的落地,充分與人們的生活和工作相結(jié)合,進(jìn)一步提高我國人民的生活質(zhì)量。
6 結(jié)論
綜上所述,計(jì)算機(jī)智能圖像識別技術(shù)在眾多領(lǐng)域都有著十分廣泛的應(yīng)用,并且能夠創(chuàng)造出更高的使用價值。計(jì)算機(jī)智能圖像的計(jì)算方法是此項(xiàng)技術(shù)的核心,這也就需要技術(shù)人員必須算法進(jìn)行不斷優(yōu)化與創(chuàng)新,進(jìn)一步提高計(jì)算機(jī)智能圖像識別技術(shù)的應(yīng)用價值,而且工作人員也要掌握技術(shù)的應(yīng)用過程,確保技術(shù)在應(yīng)用過程中能夠?qū)D像進(jìn)行更加精準(zhǔn)的識別與處理。隨著科學(xué)技術(shù)的不斷進(jìn)步,計(jì)算機(jī)智能圖像識別技術(shù)在未來的發(fā)展過程中,也需要不斷完善創(chuàng)新,加大對技術(shù)的研究力度,促使技術(shù)能夠創(chuàng)造出更大的社會價值。
參考文獻(xiàn)
[1] 曾長雄.計(jì)算機(jī)智能圖像識別算法淺析[J].電子元器件與信息技術(shù),2020,4(3):61-63.
[2] 劉子豪.基于子空間和多特征融合的木材分類算法研究[D].杭州:浙江農(nóng)林大學(xué),2013.
[3] 陳理,粟衛(wèi)民,陳曉,等.計(jì)算機(jī)圖像識別的智能化處理技術(shù)瓶頸與突破[A].中國電力科學(xué)研究院,2016智能電網(wǎng)發(fā)展研討會論文集[C].中國電力科學(xué)研究院:北京市海淀區(qū)太極計(jì)算機(jī)培訓(xùn)中心,2016.
[4] 傅白璐.基于數(shù)據(jù)挖掘的女裝廓形流行趨勢智能分析預(yù)測系統(tǒng)研究[D].上海:東華大學(xué),2018.
[5] 潘國兵.無線膠囊內(nèi)窺鏡系統(tǒng)及內(nèi)窺圖像中出血智能識別研究[D].上海:上海交通大學(xué),2010.