趙佩佩
關(guān)鍵詞:計(jì)算機(jī);智能化;圖像識(shí)別技術(shù);原理;應(yīng)用
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)21-0109-03
計(jì)算機(jī)智能化圖像識(shí)別技術(shù)在日常生活中具有極高的應(yīng)用頻率,目前已得到交通、安防、軍事等諸多領(lǐng)域的應(yīng)用。該項(xiàng)技術(shù)以計(jì)算機(jī)系統(tǒng)為基礎(chǔ),對(duì)圖像進(jìn)行一系列的處理操作,能夠識(shí)別多種不同模式的目標(biāo)與對(duì)象。新形勢(shì)下,隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,智能化圖像識(shí)別技術(shù)的應(yīng)用水平也在不斷提高,能幫助人們更為高效便捷地獲取所需信息,提升人們決策和思考效率。計(jì)算機(jī)智能化圖像識(shí)別技術(shù)已應(yīng)用于我國諸多行業(yè)領(lǐng)域,發(fā)展迅速,進(jìn)一步加強(qiáng)相關(guān)技術(shù)研究具有重要現(xiàn)實(shí)意義。
1 計(jì)算機(jī)智能化圖像識(shí)別技術(shù)
1.1 概述
識(shí)別技術(shù)是一種綜合性技術(shù),充分融合計(jì)算機(jī)技術(shù)、識(shí)別技術(shù)及智能化技術(shù)的優(yōu)勢(shì),將輸入于計(jì)算機(jī)系統(tǒng)的圖像圖形信息轉(zhuǎn)化為系統(tǒng)能夠識(shí)別的數(shù)字信號(hào),實(shí)現(xiàn)對(duì)多源數(shù)據(jù)信息的高效處理,將其轉(zhuǎn)化為具有特征的信息,再進(jìn)行匹配、分類,最終實(shí)現(xiàn)識(shí)別處理目標(biāo),該項(xiàng)技術(shù)的運(yùn)用能夠顯著提高圖像處理質(zhì)量和效率[1]。其應(yīng)用流程可簡(jiǎn)要概括為圖像輸入、圖像預(yù)處理、提取特征、圖像分類、圖像匹配五個(gè)環(huán)節(jié)。在初始發(fā)展階段,計(jì)算機(jī)識(shí)別技術(shù)只能對(duì)一些較為簡(jiǎn)單的數(shù)字、文字信息處理,難以有效識(shí)別和處理復(fù)雜的圖像信息,隨著技術(shù)水平的不斷提高,逐漸能夠?qū)σ恍┖?jiǎn)要、特征單一的圖像信息進(jìn)行識(shí)別處理,目前該技術(shù)的智能化水平已顯著提高,能夠?qū)崿F(xiàn)對(duì)一些復(fù)雜的二維、三維圖像進(jìn)行有效識(shí)別處理。
計(jì)算機(jī)圖像識(shí)別技術(shù)對(duì)圖像的識(shí)別與人類感官類似,但是前者的識(shí)別能力更強(qiáng)、更高效。如指紋識(shí)別、面部識(shí)別、條形碼識(shí)別等,均為日常生活中計(jì)算機(jī)識(shí)別技術(shù)的應(yīng)用體現(xiàn),為人們生活帶來了諸多便利。計(jì)算機(jī)圖像識(shí)別技術(shù)既針對(duì)簡(jiǎn)單且普遍應(yīng)用的技術(shù),如智能手機(jī)的面部、指紋識(shí)別等,能夠避免煩瑣操作,有效提高使用效率;也針對(duì)一些高端識(shí)別的技術(shù),即使物體位置、角度、距離等發(fā)生變化,仍可有效識(shí)別處理,確保最終判斷結(jié)果的正確。
1.2 形式和類型
目前,計(jì)算機(jī)智能化圖像識(shí)別技術(shù)中最常用的為基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)和基于非線性降維的圖像識(shí)別技術(shù)[2]。前者采用神經(jīng)網(wǎng)絡(luò)算法,是人類采用人工模擬動(dòng)物神經(jīng)網(wǎng)絡(luò)方式的一種神經(jīng)網(wǎng)絡(luò)。在神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)中,目前遺傳算法結(jié)合BP 神經(jīng)網(wǎng)絡(luò)是最常用的一種模型,已在諸多領(lǐng)域應(yīng)用[3]。如智能汽車監(jiān)控系統(tǒng)中的拍照識(shí)別技術(shù),當(dāng)其他汽車從該位置經(jīng)過,檢測(cè)設(shè)備能夠及時(shí)反應(yīng)并發(fā)出預(yù)警信息,同時(shí)啟動(dòng)圖像采集裝置,獲取汽車的特征圖像,而針對(duì)車牌字符的識(shí)別,便采用了神經(jīng)網(wǎng)絡(luò)與模糊匹配兩種算法?;诜蔷€性降維的圖像識(shí)別技術(shù)屬于一種基于高維形式的識(shí)別技術(shù),無論圖片分辨率大小,生成的數(shù)據(jù)均具有多維性的特征,所以實(shí)際識(shí)別的難度較大。為了提高圖像識(shí)別性能,可采用隨圖像降維方法進(jìn)行識(shí)別。大多數(shù)情況下,將降維劃分為非線性和線性兩種形式,例如常用的線性降維便是主元分析(PCA) 和線性奇異分析(LDA) 等,具有簡(jiǎn)單、容易理解等優(yōu)勢(shì),運(yùn)用線性降維方式對(duì)數(shù)據(jù)集合進(jìn)行處理,所獲得的投影圖形使該數(shù)據(jù)集合的低維效果理想。實(shí)踐表明,采用這一線性降維策略具有一定的復(fù)雜性,且時(shí)間、空間等資源消耗嚴(yán)重,因此非線性降維的識(shí)別技術(shù)應(yīng)運(yùn)而生,該項(xiàng)技術(shù)采用非線性特征的提取方法,該方法能夠在不破壞圖像原有結(jié)構(gòu)的基礎(chǔ)上發(fā)現(xiàn)非線性結(jié)構(gòu),同時(shí)在低緯度也能夠有效識(shí)別圖像信息,效果確切。而人臉圖像識(shí)別系統(tǒng)多適用于高維數(shù)的識(shí)別,對(duì)計(jì)算機(jī)而言,其復(fù)雜性的提高必然導(dǎo)致處理難度增加。此外,統(tǒng)計(jì)識(shí)別、句法識(shí)別等也是計(jì)算機(jī)圖像識(shí)別技術(shù)的常用類型。
1.3 特征
圖像本身蘊(yùn)含豐富的數(shù)據(jù)信息,識(shí)別時(shí)需對(duì)其信息數(shù)據(jù)進(jìn)行比對(duì)分析,因此需要處理海量的數(shù)據(jù)。計(jì)算機(jī)智能化圖像識(shí)別技術(shù)相較于常規(guī)識(shí)別技術(shù)更具優(yōu)勢(shì),能夠提高識(shí)別信息的精確性,使獲取結(jié)果更接近真實(shí)情況,同時(shí)圖像不易受到外界環(huán)境因素的影響,提高其抗干擾性能。隨著科技水平的提高,計(jì)算機(jī)圖像識(shí)別技術(shù)的應(yīng)用也更為靈活,在圖像處理、轉(zhuǎn)換方面更為高效便捷,識(shí)別精確性明顯提高[4]。
1.4 實(shí)現(xiàn)過程
圖像識(shí)別的實(shí)現(xiàn)主要環(huán)節(jié)包括預(yù)處理-壓縮處理-提取處理。上述環(huán)節(jié)中,預(yù)處理是計(jì)算機(jī)圖像識(shí)別技術(shù)應(yīng)用中最關(guān)鍵的一環(huán),也是最為復(fù)雜、困難的一環(huán)。預(yù)處理時(shí)需要將一些沒有價(jià)值的數(shù)據(jù)信息去除,保留有價(jià)值信息,去除過程極易影響整體識(shí)別效果。圖像信息的預(yù)處理方法較多,如灰度化處理、二值化處理等?;叶然幚砟軌蚪Y(jié)合實(shí)際需求,將圖像中像素的灰度值按照相應(yīng)公式進(jìn)行處理,以保證成像效果[5]。二值化處理是一種操作便捷的預(yù)處理方法,將圖像中像素的灰度值設(shè)置在相應(yīng)區(qū)間,使圖像呈現(xiàn)效果為黑與白。去噪處理、輪廓提取也是常用的預(yù)處理手段,其中前者能夠去除噪聲等干擾信息,更加突出圖像內(nèi)容;后者注重目標(biāo)圖像邊緣輪廓信息,能夠通過其外觀、形狀或邊緣特征分析圖像信息。
壓縮處理是使用計(jì)算機(jī)圖像識(shí)別技術(shù)的主要環(huán)節(jié),能夠?qū)崿F(xiàn)對(duì)圖像多余信息的壓縮與刪減,在不影響可識(shí)別性的基礎(chǔ)上減少圖像占用空間,便于后期存儲(chǔ)和傳輸。圖像提取的目的在于對(duì)圖像的主要特征點(diǎn)進(jìn)行提取,如形狀、顏色、紋理及空間位置等[6]。
圖像特征的提取主要指在模式識(shí)別的過程中提取及選擇圖像特征,針對(duì)不同圖像的不同特點(diǎn),計(jì)算機(jī)采用相應(yīng)的方式進(jìn)行分離,提取可以區(qū)分的圖像特征。提取特征是否有效決定后續(xù)圖像能否被成功識(shí)別。
1.5 應(yīng)用優(yōu)勢(shì)
1) 精確性。過往,傳統(tǒng)計(jì)算機(jī)識(shí)別技術(shù)受到技術(shù)因素的限制,只能夠?qū)δM圖像進(jìn)行處理,將其轉(zhuǎn)化為二維數(shù)組,而智能化圖像識(shí)別技術(shù)能夠?qū)D像的像素轉(zhuǎn)化為32位,大大提升了圖像識(shí)別處理的精確度。
2) 表現(xiàn)性。使用智能化圖像識(shí)別技術(shù)時(shí),能夠全面分析對(duì)圖像處理造成影響的相關(guān)因素,如圖像在系統(tǒng)中的存儲(chǔ)情況、實(shí)際輸入中存在的故障問題等,及時(shí)消除相關(guān)影響因素,實(shí)現(xiàn)對(duì)圖像的精準(zhǔn)再現(xiàn)與還原,確保圖像通過智能化技術(shù)識(shí)別、處理后,像素等多個(gè)方面具有良好的表現(xiàn)性。
3) 靈活性。智能化圖像識(shí)別技術(shù)對(duì)圖像信息進(jìn)行處理時(shí),可以根據(jù)圖像實(shí)際對(duì)其進(jìn)行放大處理。圖像信息源于多個(gè)方面,無論是何種類型的信息均能夠在系統(tǒng)中進(jìn)行有效識(shí)別和處理,并根據(jù)數(shù)據(jù)類型、性質(zhì)對(duì)圖像信息進(jìn)行線性或非線性處理[7]。針對(duì)不同圖像信息進(jìn)行編碼操作后,能夠在系統(tǒng)中顯示圖像的灰度值,直觀、清晰地顯示圖像信息。
2 存在問題及解決對(duì)策
目前,計(jì)算機(jī)智能化圖像識(shí)別技術(shù)已在各領(lǐng)域廣泛應(yīng)用,但從整體上看,該項(xiàng)技術(shù)的應(yīng)用、研究仍處于初期發(fā)展階段,諸多重點(diǎn)技術(shù)尚未突破瓶頸。投入應(yīng)用的絕大多數(shù)識(shí)別技術(shù)只能夠?qū)崿F(xiàn)對(duì)簡(jiǎn)單圖像的識(shí)別處理,面對(duì)一些復(fù)雜圖像,需要識(shí)別處理的數(shù)據(jù)信息較多時(shí),往往效率不高,識(shí)別準(zhǔn)確性不佳。技術(shù)水平不高的主要因素之一為計(jì)算機(jī)軟硬件設(shè)備、設(shè)施尚不完善,對(duì)復(fù)雜圖像信息進(jìn)行識(shí)別時(shí),計(jì)算機(jī)系統(tǒng)的運(yùn)行處理速度難以滿足實(shí)際需求,從而導(dǎo)致圖像識(shí)別處理效率較低,精確度不佳。
針對(duì)時(shí)下常用的機(jī)器學(xué)習(xí)方法,尤其是以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的先進(jìn)學(xué)習(xí)方法,已得到人臉識(shí)別、自動(dòng)駕駛、機(jī)器人圖像識(shí)別等諸多領(lǐng)域的應(yīng)用,取得明顯成效。一些先進(jìn)的技術(shù)甚至能夠超出目前人類的識(shí)別水平,但是在深度學(xué)習(xí)取得明顯成效的同時(shí),將其應(yīng)用于實(shí)際卻存在諸多困難。首先,數(shù)據(jù)標(biāo)注方面存在問題,現(xiàn)如今深度學(xué)習(xí)方法需要運(yùn)用大量的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,但是實(shí)際上數(shù)據(jù)的獲取難度大,不僅包括個(gè)人隱私相關(guān)問題,如人臉數(shù)據(jù)等,同時(shí)問題對(duì)象本身數(shù)量較少,例如對(duì)珍稀保護(hù)動(dòng)物的識(shí)別等。另外,數(shù)據(jù)標(biāo)注工作耗時(shí)較長,需要消耗大量的精力和人力物力,因此對(duì)其在圖像識(shí)別領(lǐng)域的高效應(yīng)用造成嚴(yán)重阻礙。其次,算力問題。深度學(xué)習(xí)方法雖然能夠提高算法性能,但是其網(wǎng)絡(luò)運(yùn)算量龐大,因此將其部署在計(jì)算資源受限的設(shè)備上存在較大難度,所以針對(duì)一些算力具有局限性的應(yīng)用場(chǎng)景,如機(jī)器人、路面監(jiān)控、自動(dòng)駕駛等,圖像識(shí)別仍需要一些智能化水平較低、算力消耗較低的技術(shù)完成,對(duì)智能化圖像識(shí)別技術(shù)的發(fā)展造成嚴(yán)重阻礙。
解決對(duì)策:積極開發(fā)計(jì)算機(jī)軟硬件設(shè)備、設(shè)施,采用先進(jìn)的計(jì)算機(jī)系統(tǒng)為識(shí)別技術(shù)的應(yīng)用提供保障。同時(shí),技術(shù)研究的重點(diǎn)應(yīng)逐漸由二維圖像延伸至三維圖像,未來發(fā)展至多維圖像。通過技術(shù)創(chuàng)新,減少圖像質(zhì)量、環(huán)境等因素對(duì)識(shí)別技術(shù)應(yīng)用的影響,進(jìn)而有效提高識(shí)別效率和質(zhì)量。
3 計(jì)算機(jī)智能化圖像識(shí)別技術(shù)的應(yīng)用
3.1 交通領(lǐng)域
計(jì)算機(jī)智能化圖像識(shí)別技術(shù)應(yīng)用于交通領(lǐng)域,能夠有效檢測(cè)并識(shí)別路況信息及周圍車輛信息。因?yàn)榈缆方ㄔO(shè)工作的持續(xù)開展,很多駕駛?cè)藛T不了解路況,難以及時(shí)準(zhǔn)確地到達(dá)目的地,而計(jì)算機(jī)智能化圖像識(shí)別技術(shù)能夠?yàn)槠涮峁?shí)時(shí)的路況信息,幫助指引方向,確保駕駛安全性。該項(xiàng)技術(shù)不但能夠檢測(cè)道路信息,還能夠檢測(cè)周圍車輛,判斷車輛是否存在超速違規(guī)等情況,并及時(shí)處理相關(guān)問題,為道路的暢通運(yùn)行提供保障。
3.2 醫(yī)學(xué)領(lǐng)域
隨著醫(yī)療技術(shù)水平的提高,我國醫(yī)療行業(yè)發(fā)展迅速,越來越多的先進(jìn)器械、設(shè)備中采用了計(jì)算機(jī)智能化圖像識(shí)別技術(shù)。例如影像學(xué)檢查過程中,醫(yī)生能夠獲取全面、直觀、清晰的影像學(xué)圖像;再比如微創(chuàng)手術(shù)采用的導(dǎo)航技術(shù)、CT技術(shù)等,醫(yī)生能夠通過圖像清晰、直觀地了解患者病情,進(jìn)行針對(duì)性治療,保證治療效果。目前,醫(yī)院心電圖、彩超等影像學(xué)分析均采用計(jì)算機(jī)智能化圖像識(shí)別技術(shù),取得明顯成效。
3.3 安防領(lǐng)域
計(jì)算機(jī)智能化圖像識(shí)別技術(shù)應(yīng)用于安防領(lǐng)域,能夠有效避免人為因素導(dǎo)致的疏漏問題,其更為精準(zhǔn)、全面。目前視頻監(jiān)控系統(tǒng)應(yīng)用廣泛,分布復(fù)雜,人工分析處理不僅效率低下,還需要投入大量的人力、物力,受到人為因素的影響極易導(dǎo)致一些關(guān)鍵信息的疏漏、遺失。而通過運(yùn)用計(jì)算機(jī)智能化圖像識(shí)別技術(shù),能夠?qū)崿F(xiàn)對(duì)圖像信息的一體化識(shí)別、處理,運(yùn)用計(jì)算機(jī)系統(tǒng)全面收集圖像信息,提取信息特征,精確性更高,有效減少工作人員的工作量,提高工作效率。另外,相關(guān)信息能夠?yàn)槭鹿疏b定提供重要依據(jù)。
對(duì)安防監(jiān)控行業(yè)而言,近年來AI從云端向邊緣(終端設(shè)備)轉(zhuǎn)移的現(xiàn)象逐漸明顯。以具有AI智能識(shí)別技術(shù)的網(wǎng)絡(luò)攝像機(jī)(以下簡(jiǎn)稱AI攝像機(jī))為例,早期,監(jiān)控環(huán)境中的許多突發(fā)情況往往超出了AI攝像機(jī)數(shù)據(jù)庫和算法可以處理的范圍,即使后端圖像數(shù)據(jù)庫得到擴(kuò)展,仍然無法覆蓋所有方面,缺乏實(shí)時(shí)性。當(dāng)相機(jī)內(nèi)置AI芯片后,無論是智能識(shí)別還是自學(xué)習(xí)能力都大大提高,不僅降低了誤判率甚至超過了人眼可以識(shí)別的能力,而且可以更實(shí)時(shí)、更全面地應(yīng)對(duì)各種突發(fā)情況。
3.4 農(nóng)業(yè)領(lǐng)域
農(nóng)業(yè)是國民經(jīng)濟(jì)發(fā)展的重要基礎(chǔ),在我國發(fā)展體系中占據(jù)重要的地位,糧食產(chǎn)量對(duì)農(nóng)業(yè)發(fā)展有直接影響,因此提高糧食產(chǎn)量始終是重點(diǎn)研究問題。先進(jìn)科技在人們?nèi)粘Ia(chǎn)、生活中得到廣泛應(yīng)用,智慧農(nóng)業(yè)實(shí)現(xiàn)農(nóng)業(yè)與智能化、自動(dòng)化科技的有效融合,推動(dòng)其可持續(xù)發(fā)展。通過采用計(jì)算機(jī)智能化圖像識(shí)別技術(shù),能夠?qū)崟r(shí)分析植物、作物的生長情況,或者對(duì)病蟲害進(jìn)行分析,實(shí)現(xiàn)對(duì)種植情況的全景監(jiān)控,另外也可以用于農(nóng)產(chǎn)品的質(zhì)檢中,由此取得明顯成效[8]。
3.5 文藝領(lǐng)域
智能化圖像識(shí)別技術(shù)在文藝領(lǐng)域中的應(yīng)用主要體現(xiàn)在圖像等的識(shí)別處理,體現(xiàn)其藝術(shù)性。通過智能化識(shí)別系統(tǒng)有效過濾無價(jià)值信息,確保信息的匹配性。同時(shí),能夠按照相應(yīng)美學(xué)原理,合理調(diào)整圖像色彩,提高其審美價(jià)值,強(qiáng)化人們的視覺體驗(yàn)。
4 結(jié)束語
綜上所述,目前智能化圖像識(shí)別技術(shù)在我國諸多領(lǐng)域已得到廣泛應(yīng)用,但是該項(xiàng)技術(shù)仍存在一定不足,未來應(yīng)加大技術(shù)創(chuàng)新力度,持續(xù)深入研究,不斷提高技術(shù)應(yīng)用水平,擴(kuò)大應(yīng)用范圍。