劉正全,鄧亮
(常州星宇車燈股份有限公司,江蘇常州 213000)
目前人車交互方式以機(jī)械按鍵、旋鈕以及電容觸摸屏為主。這些輸入設(shè)備都存在一定的不足,輸入習(xí)慣和人本身的自然交流習(xí)慣存在差異?;谝曈X的手勢(shì)輸入可以克服上述問題,該技術(shù)的人車交互方式更自然更便捷,其次采用視頻輸入的形式可以進(jìn)行遠(yuǎn)距離和非接觸的控制。作者將闡述關(guān)于TOF(Time of Flight,飛行時(shí)間)技術(shù)[1]在人車手勢(shì)交互的具體應(yīng)用,同時(shí)與二維和三維視覺技術(shù)的手勢(shì)識(shí)別進(jìn)行綜合性能比較。
基于TOF的手勢(shì)識(shí)別技術(shù)是利用調(diào)制近紅外激光光源照亮手勢(shì)識(shí)別區(qū)域,成像陣列傳感器通過測(cè)量手勢(shì)照明和反射之間的相移并將其轉(zhuǎn)換成為手勢(shì)識(shí)別的距離深度信息。 圖1說明了TOF手勢(shì)識(shí)別的基本工作原理。照明光源由固態(tài)激光器或工作在近紅外(850 nm)的LED提供,該波長(zhǎng)在人眼可視光譜范圍之外。成像陣列傳感器可以對(duì)該波長(zhǎng)范圍的反射光進(jìn)行效應(yīng),同時(shí)將光量轉(zhuǎn)換為電能。進(jìn)入成像陣列傳感器的光線包含兩部分:環(huán)境分量和反射分量。手勢(shì)識(shí)別的距離深度信息主要依靠反射分量體現(xiàn)。 因此,環(huán)境分量過高會(huì)降低信噪比。
圖1 TOF手勢(shì)識(shí)別的基本工作原理
為了在車內(nèi)更好地檢測(cè)照明和反射光之間的相移,需要對(duì)連續(xù)方波光源進(jìn)行調(diào)制[2]。在這種方式下每次測(cè)量4個(gè)樣本,每個(gè)樣本之間相位間隔90°,利用照明和反射之間的相位角φ計(jì)算手勢(shì)識(shí)別的距離深度d,如圖2所示。
(1)
(2)
其中:c為光速;Q1、Q2、Q3和Q4為成像陣列傳感器采樣得到的電荷量。
圖2 連續(xù)方波光源調(diào)制檢測(cè)手勢(shì)識(shí)別的距離深度
基于TOF的手勢(shì)識(shí)別技術(shù)所提供的距離測(cè)量精度會(huì)直接對(duì)最終的識(shí)別正確率造成影響,所以需要對(duì)影響距離測(cè)量精度的因素進(jìn)行分析。成像陣列傳感器上像素點(diǎn)獲得的反射光亮度為L(zhǎng),偏移量為S,那么,連續(xù)方波光源調(diào)制檢測(cè)手勢(shì)識(shí)別的距離測(cè)量方差可以表示為式(3),其中cd為調(diào)制對(duì)比度,描述了成像陣列傳感器分離和收集光電子的能力。反射光亮度L是光功率的函數(shù)。 偏移量S是環(huán)境光和系統(tǒng)偏移量的函數(shù)。 從式(3)中可以推斷出反射光亮度、調(diào)制頻率和調(diào)制對(duì)比度是影響距離測(cè)量精度三大因素。
(3)
(4)
(5)
根據(jù)公式(3),增大反射光亮度、調(diào)制頻率和調(diào)制對(duì)比度三者的數(shù)值可以明顯提高手勢(shì)識(shí)別的距離測(cè)量精度,而環(huán)境光和系統(tǒng)偏移量會(huì)導(dǎo)致飽和并降低準(zhǔn)確性。在高頻下,由于硅的物理屬性,會(huì)使調(diào)制對(duì)比度衰減,所以調(diào)制頻率具有實(shí)際的上限[3]。如圖3所示,在TOF手勢(shì)識(shí)別人車交互系統(tǒng)中,采用多頻技術(shù)來兼顧測(cè)量精度和測(cè)量距離問題,使得在足夠的測(cè)量距離條件下獲得最佳的檢測(cè)精度。多頻技術(shù)是通過添加一個(gè)或多個(gè)調(diào)制頻率來工作,調(diào)制頻率低,測(cè)量距離較遠(yuǎn)測(cè)量精度較低;調(diào)制頻率高,測(cè)量距離較近測(cè)量精度較高。 每個(gè)調(diào)制頻率都將計(jì)算得到相應(yīng)的測(cè)量距離,實(shí)際手勢(shì)深度位置是由不同頻率的測(cè)量距離共同決定。
圖3 多調(diào)制頻率手勢(shì)距離深度測(cè)量原理
TOF技術(shù)應(yīng)用在手勢(shì)識(shí)別人車交互中,成像陣列傳感器可以提供每個(gè)像素點(diǎn)距離深度信息,并以灰度形式展現(xiàn),灰度值越高,手勢(shì)越接近成像陣列傳感器。目前多數(shù)手勢(shì)識(shí)別的機(jī)器視覺系統(tǒng)都是二維的,是一種經(jīng)濟(jì)高效的方法,圖像處理算法提取關(guān)鍵特征參數(shù),與數(shù)據(jù)庫進(jìn)行對(duì)比判斷。 但汽車車內(nèi)的照明條件比較復(fù)雜,手勢(shì)在不同的照明下陰影差異會(huì)使識(shí)別困難、正確率顯著降低,使用TOF成像陣列傳感器數(shù)據(jù)在很大程度上不受陰影的影響,因?yàn)檎彰髡{(diào)制紅外激光光源提供,距離深度信息是從相位測(cè)量中提取的,而不是圖像亮度本身。
三維視覺可以克服二維視覺手勢(shì)識(shí)別的許多問題,因?yàn)榫嚯x深度可以分離前景和背景。三維視覺手勢(shì)識(shí)別通常使用兩個(gè)間隔一定距離的相機(jī),可以計(jì)算每個(gè)圖像中的手勢(shì)位置。其中主要問題是在一幅圖像中給出一個(gè)點(diǎn),如何在另一個(gè)相機(jī)中找到匹配的點(diǎn),對(duì)應(yīng)關(guān)系的建立會(huì)直接影響手勢(shì)識(shí)別的可靠性。 解決對(duì)應(yīng)問題首先要涉及復(fù)雜的計(jì)算密集型算法,用于特征提取和匹配;其次, 特征提取和匹配需要顏色變化和足夠的亮度以獲得穩(wěn)健的相關(guān)性:所以這也就限制了在人車交互場(chǎng)景中的應(yīng)用。 TOF手勢(shì)識(shí)別沒有這個(gè)限制,因?yàn)樗灰蕾囉陬伾蚣y理來測(cè)量距離。TOF成像陣列傳感器使用距離作為特征,可以將臉部、手部和手指與圖像的其余部分分割開,因此可以實(shí)現(xiàn)手勢(shì)識(shí)別較高置信度。3種視覺系統(tǒng)在手勢(shì)識(shí)別應(yīng)用中的性能比較如表1所示。
表1 3種視覺系統(tǒng)在手勢(shì)識(shí)別應(yīng)用中的性能比較
基于TOF技術(shù),利用多頻調(diào)制紅外激光光源和成像陣列傳感器系統(tǒng),通過測(cè)量手勢(shì)照明和反射之間的相移并將其轉(zhuǎn)換成為距離深度信息,顯著提高了人車交互手勢(shì)識(shí)別的置信度。與二維和三維視覺技術(shù)別相比,TOF的手勢(shì)識(shí)別在系統(tǒng)整體成本上比較適中,集成度較高,結(jié)構(gòu)很緊湊,由識(shí)別算法所帶來的計(jì)算強(qiáng)度可以在嵌入式系統(tǒng)中實(shí)現(xiàn),同時(shí)在車內(nèi)環(huán)境下兼顧了檢測(cè)距離和測(cè)量精度兩個(gè)要求,并且靈活可調(diào),可以很好地來適應(yīng)不同應(yīng)用場(chǎng)景的需要,響應(yīng)時(shí)間也是3種視覺系統(tǒng)中最快的。另外,由于TOF的手勢(shì)識(shí)別系統(tǒng)具備自主式光源照明,距離深度信息是從相位測(cè)量中提取的,所以在弱光和強(qiáng)光環(huán)境下手勢(shì)識(shí)別的正確率均比二維和三維視覺要高。綜上所述,TOF技術(shù)在手勢(shì)識(shí)別人車交互應(yīng)用中具有獨(dú)特的優(yōu)勢(shì)與良好的發(fā)展前景。