劉海艷 陸映峰
摘 要:社會(huì)經(jīng)濟(jì)體系在利用機(jī)械進(jìn)行生產(chǎn)的過程中,對(duì)于機(jī)械的識(shí)別、追蹤與測(cè)算能力有著較高的要求,為了進(jìn)一步提升機(jī)械的服務(wù)能力,滿足實(shí)際生產(chǎn)活動(dòng)中的使用需求。計(jì)算工作者以計(jì)算機(jī)視覺作為研究核心,將攝像機(jī)與計(jì)算機(jī)為基本框架,在機(jī)械當(dāng)中模擬出人類的視覺功能,完成識(shí)別、追蹤與測(cè)算等一系列工作。文章以計(jì)算機(jī)視覺作為研究中心,從多個(gè)維度出發(fā),對(duì)深度估算的方法進(jìn)行優(yōu)化,以期為后續(xù)技術(shù)研究與應(yīng)用工作的開展準(zhǔn)備條件。
關(guān)鍵詞:計(jì)算機(jī)視覺 深度估計(jì) 雙目視覺 單目視覺
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2018)02(a)-0037-02
計(jì)算機(jī)視覺要求相關(guān)技術(shù)體系運(yùn)行過程中,能夠從景物的二維圖像中獲取三維立體結(jié)構(gòu)與景物的基本屬性,并在這一過程中,對(duì)一幅或者多幅圖像中的信息進(jìn)行獲取,這一過程稱之為深度估計(jì)。在進(jìn)行深度估計(jì)的過程中,為了提升估計(jì)結(jié)果的準(zhǔn)確性,普遍使用主動(dòng)視覺與被動(dòng)視覺兩種方式,主動(dòng)視覺與被動(dòng)視覺是根據(jù)成像光源的差異來進(jìn)行區(qū)分的,主動(dòng)視覺是被測(cè)量的物體可以發(fā)出可控光束,而后對(duì)光束進(jìn)行獲取,形成最終的影像。被動(dòng)視覺不需要可控光源也可以進(jìn)行成像操作,因此應(yīng)用性相較于主動(dòng)視覺技術(shù)要更為廣泛,操作性更強(qiáng)?;谶@種情況,文章將計(jì)算機(jī)被動(dòng)視覺深度估計(jì)方法作為主要的研究對(duì)象,從多個(gè)維度出發(fā),以現(xiàn)有的技術(shù)為條件,對(duì)計(jì)算機(jī)視覺深度估計(jì)的方法進(jìn)行優(yōu)化與發(fā)展。
1 被動(dòng)視覺原理分析
被動(dòng)視覺作為被動(dòng)傳感器技術(shù)體系的重要分支,涵蓋了雙目立體視覺、運(yùn)動(dòng)視覺、描影視覺與聚焦法等集中不同的技術(shù)類型,由于被動(dòng)視覺不要求測(cè)量物體本身具有發(fā)光屬性,因此具有較強(qiáng)的實(shí)用性?,F(xiàn)階段被動(dòng)視覺被廣泛應(yīng)用于距離測(cè)量與3D景物恢復(fù)工作之中,借助于自身的技術(shù)優(yōu)勢(shì),被動(dòng)視覺可以使用多臺(tái)攝像機(jī)對(duì)同一目標(biāo)的兩幅照片進(jìn)行視差計(jì)算形成計(jì)算深度,通過這種方式最大程度地提升了被動(dòng)視覺測(cè)量的科學(xué)性與準(zhǔn)確性。但是從實(shí)際情況來看,被動(dòng)視覺所使用的雙目立體視覺、運(yùn)動(dòng)視覺、描影視覺等操作模式,雖然滿足了部分計(jì)算機(jī)視覺技術(shù)應(yīng)用工作的客觀要求,但是受到多種因素的影響,被動(dòng)視覺技術(shù)的應(yīng)用效果受到制約,難以發(fā)揮被動(dòng)視覺的技術(shù)優(yōu)勢(shì)[1]。對(duì)被動(dòng)視覺原理的全面分析,幫助技術(shù)人員進(jìn)一步理清被動(dòng)視覺估計(jì)的核心訴求,為后續(xù)計(jì)算機(jī)視覺深度估計(jì)活動(dòng)的開展創(chuàng)造了良好的外部環(huán)境,為后續(xù)計(jì)算機(jī)視覺技術(shù)體系的完善與發(fā)展提供了必要的技術(shù)支持。
2 深度估計(jì)在計(jì)算機(jī)視覺中實(shí)現(xiàn)所遵循的原則
計(jì)算機(jī)視覺深度估計(jì)活動(dòng)的有序開展,不僅需要技術(shù)人員對(duì)于計(jì)算機(jī)視覺深度估計(jì)的重難點(diǎn)進(jìn)行明晰,還需要從原則框架的角度出發(fā),對(duì)自身工作進(jìn)行梳理,以期完善計(jì)算機(jī)視覺深度估計(jì)工作實(shí)施的途徑與手段,構(gòu)建起科學(xué)高效的計(jì)算機(jī)視覺深度估計(jì)的全新模式。
2.1 計(jì)算機(jī)視覺深度估計(jì)要遵循科學(xué)性的原則。
計(jì)算機(jī)視覺深度估計(jì)體系的構(gòu)建,要充分體現(xiàn)科學(xué)性的原則,只有從科學(xué)的角度對(duì)計(jì)算機(jī)視覺深度估計(jì)活動(dòng)的主要流程、計(jì)算機(jī)視覺深度估計(jì)的基本要求以及計(jì)算機(jī)視覺深度估計(jì)的重難點(diǎn)進(jìn)行細(xì)致而全面的考量,才能夠最大限度地保證鄉(xiāng)村小學(xué)音樂教學(xué)課體系實(shí)踐操作模式滿足切實(shí)滿足使用要求,只有在科學(xué)精神、科學(xué)手段、科學(xué)理念的指導(dǎo)下,技術(shù)人員才能夠以現(xiàn)有的教學(xué)資源為基礎(chǔ),構(gòu)建計(jì)算機(jī)視覺深度估計(jì)新體系。
2.2 計(jì)算機(jī)視覺深度估計(jì)必須要遵循實(shí)用性的原則。
由于計(jì)算機(jī)視覺深度估計(jì)的內(nèi)容多樣,操作環(huán)節(jié)較多。為了適應(yīng)這一現(xiàn)實(shí)狀況,計(jì)算機(jī)視覺深度估計(jì)的相關(guān)操作之中,就要盡可能地增加計(jì)算機(jī)視覺深度估計(jì)方案的容錯(cuò)率,減少外部環(huán)境對(duì)計(jì)算機(jī)視覺深度估計(jì)活動(dòng)的影響[2]。降低操作的難度,使得在較短時(shí)間內(nèi),進(jìn)行批量操作,保證各個(gè)環(huán)節(jié)之中計(jì)算機(jī)視覺深度估計(jì)的順利開展。
3 深度估計(jì)在計(jì)算機(jī)視覺中實(shí)現(xiàn)的途徑與方法
深度估計(jì)在計(jì)算機(jī)視覺中的實(shí)現(xiàn)是一個(gè)全方位的過程,技術(shù)人員需要明確被動(dòng)視覺的技術(shù)原理,以科學(xué)性原則、實(shí)用性原則為基本框架。采取針對(duì)性的技術(shù)手段,構(gòu)建起計(jì)算機(jī)深度估計(jì)的有效方法,確保計(jì)算機(jī)視覺體系的有序構(gòu)建。
3.1 立體視覺技術(shù)的優(yōu)化
雙目立體視覺是人類獲取距離信息的主要方法,其主要用于解決二維投影圖像進(jìn)行三維結(jié)構(gòu)的轉(zhuǎn)化,在這一體系下,為了實(shí)現(xiàn)距離獲取的準(zhǔn)確性,需要在不同的位置進(jìn)行不同數(shù)量攝像機(jī)的設(shè)置、移動(dòng)或者旋轉(zhuǎn),通過這種方式來進(jìn)行圖像的獲取,并通過數(shù)學(xué)算法對(duì)多幅圖片的視差進(jìn)行計(jì)算,并在此基礎(chǔ)上形成三維坐標(biāo)[3]。具體原理如圖1所示。
在獲取信息的過程中,雙目立體視覺技術(shù)的視差與相機(jī)測(cè)量的深度成反比例管理,因此,只有在近距離測(cè)量的過程中,測(cè)量數(shù)據(jù)才具有可參考性,一旦測(cè)量距離超過一定的限度,測(cè)量數(shù)據(jù)的準(zhǔn)確性難以得到保證。為了應(yīng)對(duì)上述情況,發(fā)揮雙目立體視覺技術(shù)在深度估計(jì)中的重要性,技術(shù)人員需要在科學(xué)性原則的框架體系下,分析雙目立體視覺技術(shù)的各個(gè)環(huán)節(jié),借助于計(jì)算機(jī)技術(shù)將相機(jī)建模、特征提取、圖像匹配與深度計(jì)算進(jìn)行高度整合,充分發(fā)揮計(jì)算機(jī)在數(shù)據(jù)獲取、信息處理與三維坐標(biāo)構(gòu)建中的積極作用,通過計(jì)算機(jī)強(qiáng)大的計(jì)算能力,對(duì)雙目立體視覺獲取的坐標(biāo)進(jìn)行糾偏,防止坐標(biāo)體系計(jì)算過程中出現(xiàn)錯(cuò)誤,實(shí)現(xiàn)計(jì)算機(jī)被動(dòng)視覺的三維重建,促進(jìn)計(jì)算機(jī)視覺技術(shù)的健康快速發(fā)展。
3.2 運(yùn)動(dòng)視覺在計(jì)算機(jī)視覺中的實(shí)現(xiàn)
運(yùn)動(dòng)視覺借助于被測(cè)對(duì)象與攝像設(shè)備之間的相對(duì)運(yùn)動(dòng),構(gòu)建起三維表面信息體系。運(yùn)動(dòng)視覺以因分子分解的運(yùn)動(dòng)估算結(jié)構(gòu)為框架,研究不同時(shí)間段內(nèi)運(yùn)動(dòng)變化場(chǎng)景中,物體形狀、位置與運(yùn)動(dòng)信息的獲取。在運(yùn)動(dòng)視覺進(jìn)行三維信息獲取的過程中,需要技術(shù)人員從兩個(gè)維度入手,一個(gè)維度在于通過對(duì)多幅圖片進(jìn)行抽取特點(diǎn),建立起對(duì)應(yīng)的位置關(guān)系,另一個(gè)維度在于根據(jù)不同點(diǎn)之間的位置關(guān)系進(jìn)行函數(shù)關(guān)系的推定,形成物體的結(jié)構(gòu)表述與運(yùn)動(dòng)特性。為了進(jìn)一步發(fā)揮運(yùn)動(dòng)是覺得技術(shù)優(yōu)勢(shì),技術(shù)人員可以在實(shí)用性原則的基礎(chǔ)上,全面分析運(yùn)動(dòng)視覺的基本環(huán)節(jié),從對(duì)運(yùn)動(dòng)視覺技術(shù)操作的冗余環(huán)節(jié)入手,不斷進(jìn)行技術(shù)流程的優(yōu)化,在此基礎(chǔ)上,將數(shù)學(xué)算法融入到計(jì)算機(jī)視覺之中,形成數(shù)學(xué)表達(dá)形式,z=(Δx+XΔz)/[X(r31X+r32Y-r33)+(r11X+r12Y-r13)],其中,z為計(jì)算機(jī)視覺深度;Δx為測(cè)量物體的運(yùn)動(dòng)矢量變化;X、Y、r分別為被測(cè)算物體的三維坐標(biāo),通過構(gòu)建起科學(xué)的數(shù)學(xué)表達(dá)式,技術(shù)人員可以準(zhǔn)確便捷的進(jìn)行運(yùn)動(dòng)視覺數(shù)據(jù)信息的計(jì)算,發(fā)揮運(yùn)動(dòng)視覺估計(jì)方法的技術(shù)優(yōu)勢(shì)。
4 結(jié)語(yǔ)
計(jì)算機(jī)視覺深度估計(jì)方法在實(shí)踐中的應(yīng)用,需要技術(shù)人員從現(xiàn)階段技術(shù)發(fā)展的實(shí)際出發(fā),將被動(dòng)視覺作為研究核心,明確被動(dòng)視覺的技術(shù)原理。在此基礎(chǔ)上,以科學(xué)性原則、實(shí)用性原則為基本框架,以現(xiàn)有的技術(shù)手段為引導(dǎo),將雙目立體視覺技術(shù)與運(yùn)動(dòng)視覺技術(shù)為突破口,借助于數(shù)學(xué)表達(dá)式的形式,形成深度估計(jì)運(yùn)行模式,發(fā)揮深度估計(jì)方法的技術(shù)優(yōu)勢(shì),實(shí)現(xiàn)計(jì)算機(jī)視覺體系的合理化構(gòu)建,確保相關(guān)技術(shù)操作的有序開展。
參考文獻(xiàn)
[1] 秦彤.基于單幅散焦圖像的深度估計(jì)算法的研究[J].合肥工業(yè)大學(xué),2014.
[2] 薛松,王文劍.基于高斯-柯西混合模型的單幅散焦圖像深度恢復(fù)方法[J].計(jì)算機(jī)科學(xué),2017,44(1):32-36.
[3] 袁紅星,吳少群,安鵬,等.對(duì)象引導(dǎo)的單幅散焦圖像深度提取方法[J].電子學(xué)報(bào),2014,42(10):2009-2015.