吳妮真
(百色職業(yè)學(xué)院,廣西 百色 533000)
信息化時代的開啟,使得相關(guān)技術(shù)得到快速發(fā)展,尤其是與計算機有關(guān)的技術(shù),計算機視覺技術(shù)便是其中之一。該技術(shù)以計算機為載體,以圖像處理、傳感器等為核心,可在各個領(lǐng)域進行應(yīng)用,如航空航天、醫(yī)療、工業(yè)、教學(xué)、監(jiān)控等。文章就計算機視覺技術(shù)研究及發(fā)展趨勢展開分析。
計算機視覺技術(shù)又被稱為機器視覺技術(shù)(Machine Vision Technology),以下簡稱MVT,它是一門交叉學(xué)科,其中涵蓋諸多領(lǐng)域,如AI(人工智能)、Image Processing(圖像處理)等[1]。該技術(shù)以計算機作為載體,對人類的視覺功能進行模擬,提取圖像中的信息,經(jīng)過處理后用于檢測、控制等。信息量大、速度快是MVT 較為突出的特點。
現(xiàn)階段,在我國國民經(jīng)濟快速發(fā)展、社會不斷進步的背景下,人民的生活質(zhì)量已經(jīng)有了很大程度的提升,在信息時代的影響下,計算機網(wǎng)絡(luò)技術(shù)已經(jīng)深入普及到各家各戶,越來越多的普通社會民眾,感受到了計算機網(wǎng)絡(luò)信息數(shù)據(jù)收集處理技術(shù)發(fā)展帶來的便利。
隨著信息時代腳步的加快,信息電子技術(shù)以及網(wǎng)絡(luò)通信等技術(shù),已經(jīng)獲得了全面的發(fā)展,隨著信息技術(shù)的飛速發(fā)展,計算機視覺圖像技術(shù)的發(fā)展突飛猛進,這些技術(shù)在通常情況下,會被應(yīng)用在對人體內(nèi)部視覺系統(tǒng)進行圖像數(shù)據(jù)采集以及檢測圖像處理的過程中;將其與視覺技術(shù)高度融合可應(yīng)用到工業(yè)檢測儀器設(shè)備以及零件上的圖像處理方面,也有些技術(shù)會被應(yīng)用于對所需要采集的零件圖像數(shù)據(jù)進行深度多層次圖像處理中。
計算機視覺技術(shù),其本質(zhì)屬于可以讓計算機系統(tǒng)“看”的技術(shù)類型,這里的“看”,指得并不是通過人類的雙眼觀察,而是需要借助計算機系統(tǒng)進行“看”,就是讓計算機學(xué)會去“看”。在工作的進行過程中,需要借助攝影機、掃描儀、成像儀以及電腦等諸多設(shè)備儀器,用其替代人眼的觀看模式,對需要被檢測的對象,通過視覺感受進行識別、分析、測量以及檢測。該技術(shù)是現(xiàn)階段比較先進且發(fā)展速度比較快的信息技術(shù)類型。隨著各方面研究人員對計算機視覺技術(shù)的深入研究,計算機視覺技術(shù)已經(jīng)朝著更加完善的方向發(fā)展,在實際的應(yīng)用過程中,也正逐漸將圖像當(dāng)中的多維數(shù)據(jù)與人工數(shù)據(jù)進行進一步的融合,這樣可以進一步促進信息的處理以及分析工作,并能夠?qū)π袨檫M行一定程度的控制。
國外對MVT 的研究始于20 世紀(jì)60 年代,當(dāng)時美國麻省理工學(xué)院的羅伯茨教授,在自己的論文中,分析了從2D 圖像獲取3D 形狀信息的可能性,由此正式開啟機器視覺理論與實踐的研究。20 世紀(jì)70 年代,視覺計算理論的創(chuàng)始人D.Marr 與該領(lǐng)域內(nèi)的一眾學(xué)者經(jīng)過深入研究,創(chuàng)立出具有系統(tǒng)化特點的計算機視覺理論,為機器視覺的相關(guān)研究奠定了基礎(chǔ)。這對于MVT的發(fā)展具有里程碑意義,該理論的核心是依托2D 圖像恢復(fù)3D 幾何形狀。到80 年代后,國外在MVT 方面的研究不斷深入,從最初的實驗室向?qū)嶋H應(yīng)用方向轉(zhuǎn)移。進入90 年代,國外將MVT 廣泛應(yīng)用到工業(yè)環(huán)境領(lǐng)域中。發(fā)達(dá)國家的MVT 發(fā)展速度比較快,如歐美、日本等,他們對該技術(shù)的應(yīng)用也相對成熟,主要的應(yīng)用領(lǐng)域為半導(dǎo)體、電子等行業(yè)[2]。現(xiàn)如今,國外的MVT 逐步細(xì)化,整個技術(shù)被分為三個部分,即底層開發(fā)、二次開發(fā)、最終使用。其中底層開發(fā)是對相關(guān)系統(tǒng)的設(shè)計與構(gòu)建,在這方面取得成果的公司有德國的Siemens、美國的DVT、日本的歐姆龍等,他們在機器視覺軟硬件產(chǎn)品的開發(fā)中投入大量的人財物力;二次開發(fā)是利用各公司開發(fā)出來的機器視覺系統(tǒng),在滿足用戶需求的基礎(chǔ)上進行的專用系統(tǒng)開發(fā);最終使用是用戶在相應(yīng)的領(lǐng)域內(nèi)對成型的機器視覺系統(tǒng)進行運用。
我國對機器視覺這一概念的引入是在21 世紀(jì)初,截至目前,該技術(shù)仍然處于推廣普及階段。由于我國在機器視覺硬件、軟件等方面的開發(fā)能力并不是很強,從而使得國內(nèi)的MVT 與國外的MVT 之間存在一定的差距,致使相關(guān)產(chǎn)品的開發(fā)成本較高,并且效率比較低。國內(nèi)的研究院所、大專院校、相關(guān)企業(yè),在最近幾年里紛紛加大了對MVT 的研究力度,并將該技術(shù)應(yīng)用于工業(yè)現(xiàn)場,如電子制造業(yè)、半導(dǎo)體行業(yè)、制藥等。一些專家學(xué)者基于MVT 研發(fā)出產(chǎn)品缺陷檢測設(shè)備,該設(shè)備能夠?qū)|(zhì)量不合格的產(chǎn)品進行分揀。隨著MVT 的逐步完善,其在國內(nèi)的汽車制造業(yè)、新能源行業(yè)也得到一定的應(yīng)用?,F(xiàn)階段,我國的MVT 正在向多個領(lǐng)域及行業(yè)延伸。
目前我國計算機視覺技術(shù)在專利數(shù)量方面發(fā)展飛快,但在布局方面稍有不足。主要體現(xiàn)在以下幾方面:首先,計算機視覺在AI 方面占比較大。在人工智能中,計算機視覺相當(dāng)于人類的眼睛,屬于感知層中至關(guān)重要的一項核心技術(shù)。計算機視覺技術(shù)通過模擬生物視覺,針對捕捉到的圖像上的數(shù)據(jù)和信息實施跟蹤、識別以及檢測等,充分“分析”并“解讀”這些圖像?,F(xiàn)階段,這個技術(shù)已經(jīng)被大面積投入到銷售、安防、醫(yī)療和自動駕駛等行業(yè)應(yīng)用中,也是當(dāng)前人工智能技術(shù)中使用最廣的一項技術(shù)。不論是我國還是其他國家,計算機視覺都是AI 企業(yè)最集中的技術(shù)領(lǐng)域,在全世界AI 企業(yè)中計算機視覺技術(shù)比重約占40%。其次,我國申請AI 技術(shù)專利數(shù)量在世界居領(lǐng)先地位。根據(jù)AIIA 數(shù)據(jù)顯示,我國在2019 年申請的人工智能專利數(shù)量達(dá)到十萬項以上,穩(wěn)居全球第一;緊隨其后的是美國,專利數(shù)量在八萬項左右;英國、日本、澳大利亞和加拿大分別入圍世界人工智能技術(shù)專利申請數(shù)量前六國家。計算機視覺屬于人工智能方面的應(yīng)用技術(shù),比重為17.72%。再次,我國在計算機視覺技術(shù)專利申請方面發(fā)展速度飛快。立足于計算機視覺技術(shù)專利申請來源國分析,韓國、美國和日本申請數(shù)量相對穩(wěn)定,并且每年申請數(shù)量皆不超過700 件,但是我國在2010 年第一次在申請數(shù)量上超過上述三個國家,最近幾年申請量更是遠(yuǎn)遠(yuǎn)超過世界上其他國家。最后,我國在計算機視覺技術(shù)專利布局方面還稍有不足。雖然我國專利申請數(shù)量很多,但是在申請人前十的排名中并沒有我國申請人入選,在排名中前三位分別是富士通、佳能和三星電子。其中,日本專利申請人數(shù)量最集中也最多,我國申請人相對分散,沒有形成具有戰(zhàn)略意義的競爭大格局,還需要進一步深化專利布局方面的工作。
MVT 以自身所具備的功能和技術(shù)優(yōu)勢,在諸多領(lǐng)域中得到越來越廣泛的應(yīng)用,如教學(xué)、檢測、監(jiān)控等。
目前,很多中職院校都開設(shè)了自動控制類專業(yè)課程,在該課程的實踐教學(xué)中,可以對MVT 進行合理運用,由此能夠使學(xué)生提前接觸到該領(lǐng)域中的前沿技術(shù),掌握相關(guān)的知識,為AI 機器人的設(shè)計提供技術(shù)支撐,這對于學(xué)生創(chuàng)新能力的提升具有重要意義??稍谧詣涌刂祁愓n程的教學(xué)實踐中應(yīng)用MVT 完成嵌入式項目的開發(fā)。由于MVT 本身涵蓋的內(nèi)容比較多,所以在對圖像處理算法進行編寫時,應(yīng)采取有效的方法對算法進行簡化,減少繁瑣的數(shù)學(xué)公式。運用MVT 實施自動控制類課程教學(xué)時,可將整個教學(xué)過程細(xì)分為以下幾個實驗階段:演示、基礎(chǔ)性、綜合性。在演示實驗階段,可為學(xué)生演示MVT 中的圖像處理技術(shù)、模式識別技術(shù),包括相關(guān)的概念及算法等,軟件平臺可以選用MATLAB。通過演示,學(xué)生對MVT 有一個大致的了解,隨后便可開始基礎(chǔ)性試驗;在基礎(chǔ)性實驗階段,需要設(shè)置算法簡單的圖像處理技術(shù),使學(xué)生熟練掌握軟件平臺的運用,利用平臺完成圖像邊緣檢測,并采用程序編輯的方式,對RGB 彩圖進行灰度化處理[3];綜合性試驗的設(shè)置目的在于鞏固知識,使學(xué)生對所學(xué)的知識進行合理應(yīng)用,培養(yǎng)應(yīng)用能力??赏ㄟ^小組的形式完成實驗,各組可按照興趣選取項目。在教學(xué)領(lǐng)域中對MVT進行應(yīng)用,能夠培養(yǎng)學(xué)生的創(chuàng)新能力,有助于教學(xué)效率和質(zhì)量的提升。
為避免產(chǎn)品存在質(zhì)量缺陷,需要對產(chǎn)品進行缺陷檢測,在這一過程中,可以利用視覺傳感器對產(chǎn)品內(nèi)部缺陷進行成像,然后借助MVT 快速完成圖像處理,從而確定產(chǎn)品是否存在缺陷,如果有缺陷,則可對位置、類型及數(shù)量加以確定。MVT 在產(chǎn)品缺陷檢測中的應(yīng)用,能夠避免人為評定的主觀性差異,評價結(jié)果更加客觀,有助于產(chǎn)品質(zhì)量的提升。除此之外,利用MVT 系統(tǒng)對產(chǎn)品進行檢測,可以實現(xiàn)自動化,生產(chǎn)效率隨之提升,人力成本降低,經(jīng)濟效益得到大幅度提高。尤其是在一些比較危險的場合應(yīng)用MVT 系統(tǒng),能夠降低安全事故的發(fā)生幾率。通常情況下,產(chǎn)品的缺陷存在差異,具體體現(xiàn)在形狀、位置、尺寸等方面,由此使缺陷檢測成為一項比較復(fù)雜的工作,而此項工作與產(chǎn)品質(zhì)量密切相關(guān),所以必須予以重視。運用MVT 系統(tǒng)進行產(chǎn)品缺陷檢測,可以保證檢測結(jié)果的準(zhǔn)確性,整個檢測過程可細(xì)分為以下幾個步驟:對待檢測的產(chǎn)品圖像進行獲取,然后采用圖像處理技術(shù),去除其中的噪聲,增強對比度;借助圖像分割的方法,對缺陷區(qū)域進行檢測定位,利用相機采集產(chǎn)品的相關(guān)信息;憑借專業(yè)知識,對產(chǎn)品表征、缺陷特征進行提取;依托機器學(xué)習(xí)算法,實現(xiàn)缺陷分類[4]。
智慧交通概念的提出,使視頻監(jiān)控成為一項重要的內(nèi)容,在具體的監(jiān)控分析中,可對MVT 進行應(yīng)用,由此能夠?qū)σ曨l中的信息進行快速檢索和查詢,可為交通管理提供詳實、可靠的依據(jù)。在智慧交通領(lǐng)域中,可以通過視頻監(jiān)控對道路交通參數(shù)進行提取,同時還能識別各種交通事件,如車輛逆行、人群聚集等。利用背景減除等方法,能夠?qū)煌繕?biāo)進行檢測,據(jù)此可構(gòu)建車速和車距的交通流特征視覺測量模型,依托該模型,可以快速估算出交通流量、道路占用情況等,這樣便可對某一路段內(nèi)的交通擁堵程度進行識別,進而實現(xiàn)交通態(tài)勢預(yù)測,根據(jù)預(yù)測結(jié)果,配置紅綠燈,解決擁堵問題,確保通行順暢[5]。
通常情況下,在工業(yè)領(lǐng)域當(dāng)中,計算機視覺技術(shù)的應(yīng)用主要體現(xiàn)在圖像立體預(yù)處理系統(tǒng)技術(shù)方面,這種技術(shù)是對立體圖像資料進行數(shù)據(jù)分析和后處理,從其中自動提取繪制出各種符合要求的立體圖像,這種技術(shù)的應(yīng)用,在很大程度上能夠提升在圖像后續(xù)處理工作中各步驟的組織實施管理的效率,提供更大的方便,減少處理的工作量。在當(dāng)前計算機數(shù)字視覺圖像技術(shù)實際應(yīng)用過程中,實現(xiàn)了傳統(tǒng)圖像處理中的二維數(shù)值圖像邊緣化,與此同時,對圖像進行了高效的提取以及顯示,很大程度實現(xiàn)了圖像中預(yù)處理的視覺效果的提升。在經(jīng)過相對細(xì)致的分析以及檢測程序環(huán)節(jié)下,圖像的預(yù)處理結(jié)果將更加精準(zhǔn),這也將使計算機視覺技術(shù)在現(xiàn)代工業(yè)生產(chǎn)中展現(xiàn)出了更廣闊的市場應(yīng)用前景優(yōu)勢。
從目前的總體情況來看,MVT 在國內(nèi)諸多領(lǐng)域中的應(yīng)用越來越廣泛,除工業(yè)產(chǎn)業(yè)之外,還涉及航空航天、醫(yī)療等重要領(lǐng)域。為使MVT 的作用得以最大限度地發(fā)揮,未來一段時期,該技術(shù)應(yīng)朝著如下方向發(fā)展:
傳統(tǒng)的二維MVT 系統(tǒng)需要對三維空間進行壓縮,在實際應(yīng)用中發(fā)現(xiàn),該系統(tǒng)會受到以下因素的干擾,如物體的顏色、環(huán)境光等。由于檢測對結(jié)果的精確性和可靠性要求較高,所以該系統(tǒng)已經(jīng)無法滿足檢測需要。近年來,傳感器技術(shù)的發(fā)展速度相對較快,3D 傳感器的出現(xiàn),給三維MVT 系統(tǒng)提供了強有力的技術(shù)支撐,未來一段時期,三維機器視覺將會成為主流的發(fā)展趨勢,借助三維視覺系統(tǒng),機器人可對一堆物體中的任意物體的相關(guān)信息進行快速識別,如位置、方向等,可按照物體的實際情況,對方向進行調(diào)整,完成物體拾取,在滿足人機交互需求的前提下,提高生產(chǎn)效能。
嵌入式是一種專用的計算機系統(tǒng),可用于設(shè)備的控制和輔助操作,將嵌入式系統(tǒng)與MVT 有機結(jié)合到一起,便可構(gòu)成嵌入式機器視覺系統(tǒng),該系統(tǒng)具有如下特點:成本低、可靠性高、靈活方便、易于集成等。在未來一段時期,集成化、小型化的產(chǎn)品將會成為MVT 的主要發(fā)展方向之一。對于整個機器視覺行業(yè)而言,可對DSP 等處理器加以利用,將機器視覺系統(tǒng)嵌入芯片當(dāng)中,形成微型化產(chǎn)品,此類產(chǎn)品的用途非常廣泛,可植入任何位置,基本上不會受到限制。在嵌入式芯片功能不斷增強的前提下,微型化MVT 系統(tǒng)將會在PC 機領(lǐng)域中得到廣泛應(yīng)用,前景非常廣闊。
MVT 的價值體現(xiàn)在應(yīng)用方面,常規(guī)的MVT 系統(tǒng)可以產(chǎn)生大量的圖像,AI 技術(shù)的發(fā)展和圖像處理技術(shù)的完善,為MVT 產(chǎn)品智能化提供了支撐。未來一段時期,MVT 與AI 的融合將成為主要的發(fā)展趨勢,AI 將會使MVT 產(chǎn)品變得更加智能化,通過深度學(xué)習(xí),使產(chǎn)品能夠像人一樣進行思考,對環(huán)境進行感知,并從海量信息當(dāng)中,找出關(guān)鍵的特征,在較短的時間內(nèi)完成判斷。如,開發(fā)根據(jù)環(huán)境自主決策行動路徑和拾取姿態(tài)的視覺引導(dǎo)機器人等。
在實際的發(fā)展過程中,計算機視覺技術(shù)在視覺處理方面的先進性被凸顯得十分明顯,實際可以應(yīng)用的方面主要表現(xiàn)在:人臉識別、行人重識別、OCR 文字識別以及唇語識別方面。人臉識別是在面部特征信息的基礎(chǔ)上展開圖像身份認(rèn)證的計算機視覺處理技術(shù),可自動在圖像中檢測和跟蹤人臉,并對檢測到的人臉進行臉部識別。隨著這項技術(shù)的不斷發(fā)展,現(xiàn)階段開始加入紅外熱像技術(shù),經(jīng)過此技術(shù)的加成,人臉識別技術(shù)可以對紅外熱成像的圖像進行識別,并進行體溫測量。行人重識別屬于一種行人再識別技術(shù),是借助計算機視覺技術(shù)對圖像或者視頻的序列當(dāng)中是否存在特定行人的判斷技術(shù),屬于圖像檢索的子任務(wù),可用于目標(biāo)人物檢測檢索等場景。OCR 文字識別是應(yīng)用光學(xué)技術(shù)以及計算機技術(shù),對紙張上的文字進行打印或者讀取,同時也可以將其轉(zhuǎn)換成為計算機以及人都能夠理解的形式?,F(xiàn)階段,印刷字體的OCR 技術(shù)已經(jīng)相當(dāng)成熟,相應(yīng)的文字可識別性能已經(jīng)超過95%。就唇語識別而言,主要是應(yīng)用計算機視覺技術(shù),從連續(xù)圖像中對人說話過程中口型變化的提取,經(jīng)過唇語識別模型計算后能夠得出可能性最大的自然語言語句,除此之外,這項技術(shù)可在噪聲環(huán)境或無聲環(huán)境中輔助語音識別的相關(guān)應(yīng)用。
綜上所述,計算機視覺技術(shù)作為一項綜合性技術(shù),它的出現(xiàn)及其在各個領(lǐng)域中的應(yīng)用,為智能化和自動化的實現(xiàn)提供了支撐,通過識別與測控,可以快速完成事物的判別,大幅度提升了工作效率。未來一段時期,應(yīng)當(dāng)加大對計算機視覺技術(shù)的研究力度,除對現(xiàn)有的技術(shù)進行優(yōu)化改進外,還應(yīng)研發(fā)一些新的技術(shù),更好地為各個領(lǐng)域服務(wù)。