李淑玉 呂爭
摘 要: 結(jié)合先進的激光技術(shù)和圖像處理技術(shù),利用三邊檢測原理判斷手動按鍵,開發(fā)出一套基于機器視覺的虛擬機關(guān)鍵盤,相較于其他模型,該鍵盤具有靈敏度高、成像效果好、識別精確等優(yōu)點。同時,虛擬鍵盤具有概念新穎、成本低廉、噪聲低、嚴格防水等優(yōu)點,適合在高強度作業(yè)和水汽較重的工控環(huán)境下使用。
關(guān)鍵詞: 計算機視覺方式; 圖像識別; 視覺處理算法; 三角測距原理; LLP技術(shù)
中圖分類號: TP 39 文獻標志碼: A 文章編號: 1671-2153(2015)06-0079-04
1 問題的提出
隨著信息化技術(shù)的發(fā)展,輕便、舒適、靈活已經(jīng)成為鍵盤設(shè)計的最優(yōu)目標,而傳統(tǒng)的鍵盤功能單一且攜帶麻煩。在這樣的背景下,本文擬設(shè)計了一種高性能的便攜式虛擬激光鍵盤[1]。它將運用移動電源、功放、超聲波技術(shù)實現(xiàn)額外功能,同時具有無菌無噪聲等功能。本研究將放棄傳統(tǒng)的供電方式,采用當前先進的移動電源技術(shù)供電,增強了鍵盤的可移動性和續(xù)航能力。設(shè)計的便攜式虛擬激光鍵盤將為人們外出旅游、辦公和從事無菌無噪聲科研等帶來了極大的方便。另外,由于在國內(nèi)該技術(shù)上處于空缺狀態(tài),所以本項目具有很好的市場前景。
2 系統(tǒng)方案
2.1 系統(tǒng)框圖
本研究基于視覺處理算法,全息投影技術(shù),借用三角測距原理和LLP技術(shù),采用了傳感器技術(shù)、無線通信技術(shù)、控制技術(shù)、數(shù)據(jù)庫技術(shù)、GUI系統(tǒng)UI元素碰撞技術(shù)、紅外技術(shù)、激光掃描技術(shù)、攝像頭處理技術(shù)、空間三維坐標處理技術(shù)、光學原理、濾波原理及鏡面反射技術(shù),以MATLAB仿真為手段和采用OpenCV數(shù)據(jù)處理來加速視覺運算代碼的開發(fā)[2],用PC處理來設(shè)計的低成本、高性能的虛擬激光鍵盤,如圖1所示。軟件流程如圖2所示。
2.2 激光虛擬鍵盤模型結(jié)構(gòu)
本文設(shè)計的激光虛擬鍵盤主要由線性不可見激光發(fā)射器、攝像頭采集器、鍵盤投影模組三部分組成,模型架構(gòu)如圖3所示。
本研究的工作流程,首先鍵盤投影磨具投影出虛擬鍵盤模型,通過紅外不可見光發(fā)送定位光束,當用戶敲擊鍵盤瞬間,攝像頭采集圖像參數(shù),并對圖像和目標進行識別[4]。通過識別轉(zhuǎn)換成坐標,系統(tǒng)識別坐標后調(diào)用坐標映射函數(shù)并發(fā)送按鍵命令[5],系統(tǒng)具體工作流程如圖4所示。
3 功能與指標
(1) 攝像頭模塊功能。采用USB接口,視角120度以上的CMOS攝像頭,可用于互動投影,多點觸摸。除了鏡頭有要求外,其他無特殊要求。本研究采用150°廣角攝像頭,具有極強的視角。
(2) 投射鍵盤畫面的激光器模塊功能。激光器模塊鍵盤大小要求要120度,650 nm激光組件。在實際使用過程中,激光組建應(yīng)當使得鍵盤平整,按鍵的大小均勻,以減少系統(tǒng)的誤判。
(3) 一字線激光模塊功能。本研究采用的一字線激光器是紅外波段,波長為808 nm,主要是為了濾掉可見光的干擾[6]。為減低其功率,提高鍵盤的可靠性,激光模塊采用的工作功率為50 W。本文采用直徑12 mm,長度40 mm,線發(fā)射角度為120度、60度、35度可選,激光類型為線裝。
(4) 紅外帶通濾光片。采用800~1100 nm高透,與紅外激光器配合測距可避免可見光的干擾,可使可見光400~760 nm截止。濾波片厚度2mm,配合廣角鏡頭合理使用,避免出現(xiàn)曝光和弱光現(xiàn)象,否則會使鍵盤亂踩點或者檢測不到點[7]。
(5) 功放模塊功能。系統(tǒng)集成mp3模塊。面板尺寸為寬80 mm,高40 mm,內(nèi)深50 mm,中心孔距為60 mm。其中功放為BTL輸出,還有FM功能,但需接一根天線,并切換MODE模式,其中AUX顯示當前工作狀態(tài),F(xiàn)M顯示當前收聽電臺。
(6) 移動電源模塊功能。采用帶有雙USB的5 V升壓板。5 V恒壓電源可作為充電輸入電源,電路板內(nèi)置鋰電池IC保護,具有過壓、過流、欠壓保護等。還自帶手電功能,連按兩下開關(guān)鍵即可啟動,再連按兩下開關(guān)鍵即可關(guān)閉。移動電源進入工作狀態(tài)時,藍色背光源被點亮,15 s后熄滅,按輕觸開關(guān)(on/off)一次,藍色背光源再次被點亮15 s,方便查看LCD顯示屏。
4 實施原理及過程
4.1 鍵盤功能的實現(xiàn)
4.1.1 鍵盤輸入事件的識別
虛擬鍵盤是基于三角測距原理,通過投射激光對目標物體進行檢測。測距過程中,通過一束激光照射目標物體,反射光被攝像頭捕捉到,利用三角測距原理[8],求出目標物體中被線激光照亮部分的坐標信息。在線性激光測距中,通過三角關(guān)系,容易求出被激光照亮部分,相對于激光發(fā)射口為原點、位于線激光組成平面內(nèi)的坐標P(x,y)。在本系統(tǒng)中,激光組成的平面可以等效于與桌面平行,故可以認為坐標點P(x,y)是位于桌面平面的,如圖5所示。
4.1.2 按鍵事件的判斷與產(chǎn)生
在虛擬鍵盤中,所有UI元素均對應(yīng)屏幕的坐標值。系統(tǒng)周期性判斷當前鼠標指針位置是否產(chǎn)生光斑。相較于UI系統(tǒng),在數(shù)據(jù)庫中需要建立投射鍵盤圖案中每個按鍵的坐標信息,然后查找指尖按下的坐標,從而判斷出坐標信息,其示意圖如圖6所示。
上述鍵盤功能實現(xiàn)過程需要涉及到兩個步驟:
(1) 通過三遍測距算出指尖按下的坐標,記為P(x,y)。
(2) 將映射點P(x,y)與數(shù)據(jù)庫中的坐標值進行對比,求出P(x,y)對應(yīng)的按鍵值。
4.2 虛擬鍵盤視覺方式與算法的具體實現(xiàn)
由于本研究的視覺處理部分都在PC上進行,因此使用了OpenCV庫來加速視覺運算代碼的開發(fā)。
4.2.1 攝像采集器鏡頭扭曲矯正
在本系統(tǒng)中,實際使用為廣角攝像頭,與普通攝像頭相比,廣角攝像頭采集圖像具有中心偏大,兩側(cè)偏小的特征,如圖7所示。
為了使得圖像坐標信息具有線性變化的特點,需要對采集的圖像進行處理,通常采用的高斯模型降噪[9],在程序中調(diào)用OpenCV庫函數(shù)對實際圖像進一步優(yōu)化,以達到攝像頭扭曲矯正的效果。
4.2.2 圖像興趣點提取
通過調(diào)用OpenCV庫函數(shù)中的cvFindCountours,對攝像頭中的光斑進行提取,通過提取光斑獲取圖像的興趣點,由于環(huán)境中光線的變化,因此存在高斯噪點,可以通過增加權(quán)重的方式來減少誤判,提高系統(tǒng)識別圖像興趣點的精度。
4.2.3 手指坐標計算和校正
通過手指光斑的相對位置,調(diào)用三邊測距算法,求得手指的具體相對位置P(x,y)。通過三次測距得知P點,通過P點的旋轉(zhuǎn)90°知道P的逆矩陣。同時通過上述介紹的公式算出逆矩陣與原來矩陣的誤差精度,再通過平滑取值抹除誤差較大的點,得到手指的正確坐標,即是手指在桌面投影的實際坐標,如圖8所示。
5 特色與創(chuàng)新點
(1) 本研究在設(shè)計的原理上具有創(chuàng)新性:采用基于計算機視覺方式識別、判斷和產(chǎn)生鍵盤事件。
(2) 相對傳統(tǒng)鍵盤,該鍵盤無菌,方便用于無菌場合,且噪音少,可廣泛用于公共場合,該鍵盤工作穩(wěn)定、便于調(diào)試,可方便使用在工作環(huán)境條件差(例如化工生產(chǎn))的場合。
(3) 本研究采用當前先進的移動電源技術(shù)供電,增強了鍵盤的可移動性和續(xù)航能力。
(4) 線激光測距的采用,提高了按鍵事件的判斷和效率。
(5) 集合了視覺算法、三角測距、LLP技術(shù)多點觸摸定位、功放、升壓、超聲波等技術(shù),具有廣泛的應(yīng)用價值。
(6) 該鍵盤可以測出手指對桌面的“壓力”,在繪畫板產(chǎn)生不同粗細的圖像。
(7) 采用的線激光測距,有利于檢測指尖的位置和判斷是否產(chǎn)生鍵盤事件。
6 結(jié) 論
基于機器視覺的虛擬激光鍵盤,結(jié)合機器視覺處理的OpenCV庫,以及三點定位算法,實現(xiàn)了虛擬鍵盤的模型建造。在研究虛擬鍵盤過程中,預(yù)先通過MATLAB仿真,對設(shè)計過程中遇到的問題進行了提前模擬,有效的指導(dǎo)了模型的建造過程,本系統(tǒng)具有成本低廉,識別精確度高等優(yōu)點,其模型具有推廣價值。
參考文獻:
[1] 陳士凱.自制低成本3D激光掃描測距儀(3D激光雷達),第一部分[J/OL]. (2012-02-06)[2015-07-20]. http://www.hobbypress.cn/bencandy.php?fid-182-id-7309-page-1.htm.
[2] 布拉德斯基. 學習opencv[M]. 北京:清華大學出版社,2009.
[3] 譚浩強. C++程序設(shè)計[M]. 北京:清華大學出版社,2010.
[4] 張國云,郭龍源,吳健輝. 計算機視覺與圖像識別[M]. 北京:科學出版社,2012.
[5] 張岳,郝麗,柳華,等. 激光顯示的原理與實現(xiàn) [J]. 光學精密工程,2006,14(3);402-405.
[6] 劉慶祥,蔣天發(fā). 彩色與灰度圖像間轉(zhuǎn)換算法的研究[J]. 武漢理工大學學報(交通科學與工程版),2003,27(3):344-346.
[7] 王紅梅,李言俊,張科.基于極值檢測的圖像濾波算法[J]. 激光與紅外,2007,37(10):1117-1119.
[8] 梁華為. 直接從雙峰直方圖確定二值化閾值[J]. 模式識別與人工智能,2002,15(2):253-256.
[9] 王慧峰,戰(zhàn)桂禮,羅曉明. 基于數(shù)學形態(tài)學的邊緣檢測算法研究及應(yīng)用[J]. 計算機工程與應(yīng)用,2009,45(9):223-226.
Abstract: This work combines advanced laser technology and image processing technology, the use of manual key trilateral detection principle is determined to develop a machine vision-based virtual organ keyboard, compared to other models, the keyboard has a high sensitivity, good imaging results. , recognition accuracy and so on. at the same time, the concept of virtual keyboard with a new, low cost, low noise, strict waterproof and suitable for use in high-intensity operations and moisture heavy industrial environments.
Key words: computer vision methods; image recognition; visual processing algorithms; triangulation principle; LLP technology
(責任編輯:徐興華)