• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于頭部姿態(tài)與面部特征混合手勢的設(shè)計與研究

      2018-12-13 09:17:20殷繼彬
      計算機應(yīng)用與軟件 2018年12期
      關(guān)鍵詞:睜開張開右眼

      于 鯤 殷繼彬

      (昆明理工大學信息工程與自動化學院 云南 昆明 650000)

      0 引 言

      人機交互是指計算機通過相關(guān)的設(shè)備實現(xiàn)人與計算機“對話”的技術(shù)[1]。多通道交互是一種混合交互系統(tǒng),它遵守了“以人為中心”的自然交互法則,促進了人機交互的發(fā)展。它允許用戶通過多個不同的人體交互通道方式,并自動提取語義,識別出最終的交互目的。主要包括眼動跟蹤、姿勢識別、三維輸入、語音識別、人臉識別、自然語言理解等,目的在于提高人機交互的自然性和高效性。多通道研究成為人機交互領(lǐng)域的重要方向[2]。目前的人臉識別主要用于身份鑒別,而對于交互方面涉及較少。而面部手勢正好解決了這一缺陷,使得人的面部動作特征得以充分利用。

      目前在手勢研究領(lǐng)域主要集中在筆手勢、手勢,而對于頭部姿態(tài)和面部手勢混合交互的研究較少?;谶@種趨勢,本文提出了“臉表情+頭部姿態(tài)”的混合交互?;旌鲜謩菀揽棵娌刻卣骱皖^部姿態(tài)與計算機進行交互,從而解放雙手負擔。同時對于雙手不便的殘疾人與計算機交互具有重大的意義。隨著人工智能在包括人臉識別、聲紋識別、語音識別、手勢識別、姿態(tài)識別、情感識別等方面的進步,智能算法與人機交互出現(xiàn)了相互融合的趨勢。因為符合人的交互模式,基于人工智能的多通道智能人機交互被認為是未來自然的人機交互的主要方式之一[3]。在人工智能迅速發(fā)展的今天,人工智能與人機交互的結(jié)合已經(jīng)成為必然的趨勢,這將會給未來人機交互帶來巨大的前景。同時將面部手勢和頭部姿態(tài)結(jié)合起來,能更好地探討新的交互通道存在的應(yīng)用價值。實現(xiàn)基于混合交互手勢的人機交互,能夠更好地幫助雙手殘疾的人士與計算機的溝通,減少他們使用計算機的身體負擔,同時可以解放正常人的雙手,對于多通道人機交互技術(shù)的探索與研究具有重大的意義。

      在設(shè)計手勢交互時候,需要著重考慮四大設(shè)計原則。1) 可靠性。由于手勢交互與日?;顒佑邢嗤奶卣骱湍J?,為了避免誤操作應(yīng)該考慮可靠性。2) 容錯性。充分考慮用戶的習慣,允許一定的差異。3) 連貫性。設(shè)計手勢時候,應(yīng)當考慮前后的銜接,前后流暢。4) 繼承性。在對手勢形勢的選擇和引導與反饋機制的設(shè)計上,應(yīng)該考慮與日常交流的繼承性[4],因此我們設(shè)計“臉表情+頭部姿態(tài)”的混合手勢交互應(yīng)該更加尊重這四大原則?;旌辖换ナ謩菔峭ㄟ^攝像頭獲取靜態(tài)面部手勢和頭部姿態(tài)的特征信息后,系統(tǒng)會把數(shù)據(jù)傳給Face++的后臺服務(wù)器,服務(wù)器會返回一些基本的面部信息數(shù)據(jù)和頭部姿態(tài)數(shù)據(jù)。通過編寫代碼對我們所需要的數(shù)據(jù)進行解析,然后按照指定的面部手勢和頭部姿態(tài)的定義標準進行識別,讓計算機執(zhí)行相應(yīng)的交互命令。

      手勢識別包含人工智能、心理學、模式識別、語言學、生理學范疇,從其出現(xiàn)開始一直是研究者關(guān)注的熱點問題。在手勢識別中,無論是數(shù)據(jù)獲取還是模式分類方法都有許多種類[5]。手勢在現(xiàn)實生活中起到了不可或缺的作用,對于推動人與計算機的交互,具有重大的意義。手勢可以分為不同的種類,按照傳感器分類,可以分為基于傳感器和基于非傳感器[6]?;趥鞲衅鞯氖謩輸?shù)據(jù)獲取方式主要通過數(shù)據(jù)手套進行獲取,通過數(shù)據(jù)手套獲取和捕捉手指各個關(guān)節(jié)在操作過程中變化角度、各個手指之間的夾角以及傾斜角等有用信息,并把采集到的信息作為識別過程需要用到的信息[7]?;诜莻鞲衅鞯氖謩葑R別是通過設(shè)備的攝像頭對手勢操作過程的手勢數(shù)據(jù)進行采集和記錄的[8]。對于手勢識別的研究可以分為兩種:動態(tài)手勢識別和靜態(tài)手勢識別。利用攝像頭進行手勢識別的技術(shù)分為兩種:單目的圖像識別和雙目的圖像識別[9]。本文就是基于靜態(tài)圖像的面部手勢和頭部姿態(tài)的手勢識別。

      目前國內(nèi)外對于面部手勢涉及較少,而對于人臉身份鑒別方面涉及較多。比如2017年發(fā)布的Iphone X的Face ID就采用了人臉識別技術(shù)進行解鎖。國外有一項關(guān)于面部手勢的研究就是FaceSwitch[10],它是基于眼動儀的凝視點檢測和beyond reality face的人臉關(guān)鍵點跟蹤技術(shù)實現(xiàn)的,是動態(tài)的人臉跟蹤和眼部跟蹤。而本文是利用Face++平臺基于靜態(tài)圖像的人臉關(guān)鍵點檢測技術(shù)和頭部姿態(tài)檢測技術(shù),自定義出來一套基于“臉表情+頭部姿態(tài)”的混合交互手勢,同時加入了頭部姿態(tài)的跟蹤。FaceSwitch能夠定義的面部手勢只有4種,本文提出的基于“臉表情+頭部姿態(tài)”的混合手勢,可以定義的混合手勢共有28種,大大增加了交互手勢的多樣性,同時對于探索多通道人機交互具有重大的意義。

      1 “臉表情+頭部姿態(tài)”混合手勢

      1.1 面部手勢

      在正常情況下,人的左眼和右眼分別有兩種狀態(tài):睜開和閉上。嘴巴也有兩種狀態(tài):張開嘴巴和閉上嘴巴。按照排列和組合原理,我們能定義的面部手勢共有2×2×2=8種。這8種狀態(tài)分別是:左眼睜開右眼睜開嘴巴張開、左眼睜開右眼睜開嘴巴閉上、左眼睜開右眼閉上嘴巴張開、左眼睜開右眼閉上嘴巴閉上、 左眼閉上右眼睜開嘴巴張開、左眼閉上右眼睜開嘴巴閉上、左眼閉上右眼閉上嘴巴張開、左眼閉上右眼閉上嘴巴閉上。然而在正常情況下,我們的臉部狀態(tài)是左邊的眼睛和右邊的眼睛都睜開,嘴巴處于閉合狀態(tài),同時遵守手勢設(shè)計原則的可靠性,因此我們將這種情況去除掉。因為我們能夠定義并且識別的面部手勢共有7種。

      1.2 頭部手勢

      在現(xiàn)實生活中,人的頭部姿態(tài)可以分為6種狀態(tài):抬頭、低頭、向左歪頭、向右歪頭、向左扭頭、向右扭頭。因為我們的面部手勢是基于攝像頭的面部特征采集,當我們向左扭頭和向右扭頭的時候,會影響我們面部特征的采集,大大降低面部手勢的識別準確率。因此我們能夠和面部手勢結(jié)合起來的頭部姿態(tài)只有四種。

      1.3 “臉+頭部姿態(tài)”的混合手勢

      我們能夠識別使用的面部手勢共有7種,能跟面部手勢結(jié)合起來的頭部姿態(tài)共有4種,根據(jù)排列和組合原理,我們能夠設(shè)計和識別的基于“臉表情+頭部姿態(tài)”的混合手勢共有28種。我們將它們分為四組,它們分別是:

      第一組:左眼睜開右眼睜開嘴巴張開抬頭、左眼睜開右眼閉上嘴巴張開抬頭、左眼睜開右眼閉上嘴巴閉上抬頭、 左眼閉上右眼睜開嘴巴張開抬頭、左眼閉上右眼睜開嘴巴閉上抬頭、左眼閉上右眼閉上嘴巴張開抬頭、左眼閉上右眼閉上嘴巴閉上抬頭。

      第二組:左眼睜開右眼睜開嘴巴張開低頭、左眼睜開右眼閉上嘴巴張開低頭、左眼睜開右眼閉上嘴巴閉上低頭、 左眼閉上右眼睜開嘴巴張開低頭、左眼閉上右眼睜開嘴巴閉上低頭、左眼閉上右眼閉上嘴巴張開低頭、左眼閉上右眼閉上嘴巴閉上低頭。

      第三組:左眼睜開右眼睜開嘴巴張開向左歪頭、左眼睜開右眼閉上嘴巴張開向左歪頭、左眼睜開右眼閉上嘴巴閉上向左歪頭、 左眼閉上右眼睜開嘴巴張開向左歪頭、左眼閉上右眼睜開嘴巴閉上向左歪頭、左眼閉上右眼閉上嘴巴張開向左歪頭、左眼閉上右眼閉上嘴巴閉上向左歪頭。

      第四組:左眼睜開右眼睜開嘴巴張開向右歪頭、左眼睜開右眼閉上嘴巴張開向右歪頭、左眼睜開右眼閉上嘴巴閉上向右歪頭、 左眼閉上右眼睜開嘴巴張開向右歪頭、左眼閉上右眼睜開嘴巴閉上向右歪頭、左眼閉上右眼閉上嘴巴張開向右歪頭、左眼閉上右眼閉上嘴巴閉上向右歪頭。

      1.4 “臉表情+頭部姿態(tài)”混合交互命令

      由于我們定義的“臉+頭部姿態(tài)”的混合手勢共有28種,為了減少任務(wù)復雜度,提高實驗的精確性,因此我們只定義7種命令分別為:選中、右擊、重置、放大、縮小、移動、取消選中。然后我們將這28種混合手勢每7個一組,分為4組分別進行驗證。這7種命令與混合手勢的對應(yīng)關(guān)系如表1-表4所示。

      表1 “臉+頭部姿態(tài)”混合手勢與交互命令(1)

      表2 “臉+頭部姿態(tài)”混合手勢與交互命令(2)

      續(xù)表2

      表3 “臉+頭部姿態(tài)”混合手勢與交互命令(3)

      表4 “臉+頭部姿態(tài)”混合手勢與交互命令(4)

      1.5 面部手勢識別算法

      “臉+頭部姿態(tài)”混合手勢定義完之后需要進行混合手勢識別,此時攝像頭會處于一直工作狀態(tài),并且自動拍成一張靜態(tài)圖片存到本地,然后傳給服務(wù)器進行檢測。服務(wù)器會通過JSon的方式返回給我們?nèi)四樅皖^部姿態(tài)的檢測信息,我們將這些信息融入到自己設(shè)計的混合手勢識別算法,等待系統(tǒng)識別相應(yīng)的面部手勢之后,然后做出相應(yīng)的反饋。本文用到服務(wù)器返回數(shù)據(jù)中的兩個字段,它們分別是eyestatus、mouthstatus和headpose。eyestatus下又包括left_eye_status 和right_eye_status。headpose中包括pitch_angle、roll_angle、yaw_angle。這些屬性并不是直接給出眼睛和嘴巴的張開、閉合狀態(tài)和頭部姿態(tài)的具體信息,而是返回了一些浮點數(shù)。我們根據(jù)這些浮點數(shù),定義了一些閾值,來控制混合手勢識別算法當中眼睛和嘴巴的張開和閉合狀態(tài)以及頭部的狀態(tài),從而根據(jù)這些狀態(tài)設(shè)計出相應(yīng)“臉+頭部姿態(tài)”的混合交互手勢。

      1.6 頭部姿態(tài)檢測原理

      本文是根據(jù)頭部姿態(tài)角來獲取頭部姿態(tài),頭部姿態(tài)角與飛行器姿態(tài)角類。通常所說的飛行器姿態(tài)角是指機體坐標系與地面慣性坐標系之間的夾角,可以用橫滾角—roll、俯仰角-pitch、偏航角-yaw三個角表示。頭部姿態(tài)也是采用這三個參數(shù)來檢測的。

      Pitch-angle對應(yīng)的抬頭和低頭,roll-angle對應(yīng)的是左右歪頭。坐標系采用的是地軸系。地軸系原點選擇為地面上某一點,X0軸與地面平行指向正北方向,Z0軸與重力加速度的方向一致垂直地面向下,Y0軸指向正東并與X0-Z0構(gòu)成右手坐標系[11]。本文中頭部姿態(tài)的檢測也是參照此坐標系進行定義的,如圖1所示。

      圖1 頭部姿態(tài)坐標原理圖

      2 總體框架設(shè)計

      2.1 結(jié)構(gòu)設(shè)計

      本文提出的基于頭部姿態(tài)與面部特征混合手勢應(yīng)用是以C/S(客戶端/服務(wù)器端)體系結(jié)構(gòu)為基礎(chǔ)進行開發(fā)的。整個面部手勢交互系統(tǒng)有人臉信息采集模塊、面部手勢和頭部姿態(tài)分析模塊及交互模塊四部分組成(見圖2)。人臉信息采集使用ANC酷睿攝像頭(1080P高清版);人臉檢測分析在Face++服務(wù)器端進行;服務(wù)器返回的信息根據(jù)我們混合手勢的定義規(guī)則和算法然后做出相應(yīng)的交互和反饋。

      圖2 “臉表情+頭部姿態(tài)”流程圖

      2.2 環(huán)境配置

      為了實現(xiàn)面部手勢的采集,首先要對Java和JMF進行環(huán)境變量配置,使攝像頭能夠和Java環(huán)境正常的通信,我們才能夠采集到混合交互手勢識別所需要的人臉和頭部信息。這是進行混合手勢識別最關(guān)鍵的一步。同時登錄Face++官方網(wǎng)站,注冊一個新的賬號并登錄。點擊“管理應(yīng)用”項目下的API Key,點擊添加,選擇正式使用,輸入應(yīng)用名稱、應(yīng)用分類等信息,然后選擇應(yīng)用平臺Java,點擊創(chuàng)建之后,會自動生成相對應(yīng)的“API Key”和“API Secret”,只有取得這兩個參數(shù),我們的應(yīng)用才可以被調(diào)用。

      2.3 “臉表情+頭部姿態(tài)”核心算法

      環(huán)境全部配置好以后,我們可以編寫面部手勢核心代碼了,根據(jù)前邊提到的面部手勢的定義,我們將眼睛張開的最小值判定設(shè)為30,眼睛閉上的最小值判定為10。嘴巴閉上的狀態(tài)判定值為0,嘴巴張開的判定值大于0。對于頭部姿態(tài)的檢測,我們可以根據(jù)姿態(tài)角原理獲取頭部角度的三個參數(shù),根據(jù)不同參數(shù)的正負和大小,定義出頭部姿態(tài)的判斷算法。根據(jù)“臉+頭部姿態(tài)”的定義規(guī)則和最小值的限制,編寫出混合手勢識別和定義的核心算法,部分代碼如下所示:

      //嘴巴

      float open=mouthstatus.getLong(″open″);

      String value=glass.getString(″value″);

      System.out.println(value);

      //pitch-angle 抬頭低頭

      double UpDownHead=headpose.getDouble(″pitch_angle″);

      System.out.println(UpDownHead);

      //roll_angle 左右歪脖子

      float SwingNeck=headpose.getLong(″roll_angle″);

      //眼睛

      Floatno_glass_eye_open=left_eye_status.getLong(″no_glass_eye_open″);

      float normal_glass_eye_open=left_eye_status.getLong(″normal_glass_eye_open″);

      float right_eye_open=right_eye_status.getLong(″no_glass_eye_open″);

      float right_eye_glass_open=right_eye_status.getLong(″normal_glass_eye_open″);……

      3 實驗環(huán)境搭建和數(shù)據(jù)

      3.1 硬件環(huán)境搭建

      “臉表情+頭部姿態(tài)”的混合面部手勢是基于攝像頭采集獲取面部特征和頭部姿態(tài)的,整體設(shè)備安裝如圖3 所示。其中攝像頭設(shè)備位于顯示器的上方,正對著人臉。

      圖3 設(shè)備安裝示意圖

      3.2 界面展示

      打開混合交互手勢交互識別程序的主界面菜單如圖4所示。演示程序主界面主要有一個攝像頭實時采集窗口和一個測試目標組成。該系統(tǒng)實現(xiàn)了面部手勢識別界面和面部手勢反饋界面的分離,兩者互不干擾。

      圖4 實驗程序主界面

      3.3 放大功能演示

      由于混合手勢種類繁多,這里只演示放大操作,當我們做出即右眼睜開左眼睜開嘴巴張開向左歪頭手勢時,此時混合手勢識別系統(tǒng)識別手勢,并執(zhí)行放大功能,目標成功被放大。結(jié)果如圖5所示。

      圖5 放大命令效果圖

      3.4 實驗數(shù)據(jù)

      本文中的測試工作以功能驗證為主要測試目的,評估“臉+頭部姿態(tài)”的混合手勢系統(tǒng)是否達到預(yù)定的功能目標。根據(jù)操作的特點安排的測試主要有“臉+頭部姿態(tài)”混合手勢識別的成功率。針對不同的手勢種類,進行成功率測試。實驗前允許實驗者進行練習并熟悉實驗環(huán)境,針對不同的混合手勢種類,每個混合手勢設(shè)計測試用例20個,其中平均成功率為90.995%。具體測試結(jié)果如表5-表8所示。

      表5 “臉表情+頭部姿態(tài)”混合手勢成功率測試(1)

      表6 “臉表情+頭部姿態(tài)”混合手勢成功率測試(2)

      表7 “臉表情+頭部姿態(tài)”混合手勢成功率測試(3)

      表8 “臉表情+頭部姿態(tài)”混合手勢成功率測試(4)

      3.5 實驗數(shù)據(jù)分析

      經(jīng)過對系統(tǒng)的功能性測試和面部手勢成功率分析,由數(shù)據(jù)可以看出,面部手勢識別交互系統(tǒng)基本實現(xiàn)了我們所設(shè)計的功能,滿足自然人機交互的需求。“臉+頭部姿態(tài)”混合手勢成功率可以達到90%,但是根據(jù)實驗結(jié)果可以知道,面部手勢識別率與光線、攝像頭的遠近有一定的影響,有待進一步改進。

      4 結(jié) 語

      本文的創(chuàng)新點基于Face++的人臉關(guān)鍵點檢測技術(shù),設(shè)計出了面部手勢識別算法,定義出了28種基本的混合手勢,能夠流暢地進行人機交互。通過理論分析及實驗研究人與設(shè)備之間的交互通道和交互過程,并結(jié)合面部手勢的設(shè)計方法探討新的交互通道,豐富了三維手勢交互方式。同時本文設(shè)計的面部手勢是基于攝像頭的面部特征和頭部姿態(tài)采集,因此光線、攝像頭的方位、距離人臉的位置、頭部位置對于面部手勢識別

      的準確性具有一定的影響,需要我們進一步改進。

      猜你喜歡
      睜開張開右眼
      起 床
      上海故事(2023年8期)2023-11-03 09:23:11
      掩其右眼
      掩其右眼
      視野(2023年18期)2023-10-22 14:30:13
      左眼右眼
      小讀者(2019年24期)2020-01-19 01:51:38
      開花
      詩潮(2019年10期)2019-11-19 13:58:55
      刷新
      三月三(2017年1期)2017-02-25 02:51:14
      刷新
      Dynamical Properties of a Diluted Dipolar-Interaction Heisenberg Spin Glass?
      睜開慧眼看世界
      阜新市| 昆山市| 连平县| 寿阳县| 曲麻莱县| 伊宁县| 马边| 南和县| 大姚县| 林口县| 息烽县| 十堰市| 广元市| 广宗县| 观塘区| 固镇县| 日喀则市| 嫩江县| 恩平市| 怀远县| 湖南省| 黎平县| 罗江县| 祥云县| 美姑县| 赤城县| 博客| 达尔| 信宜市| 招远市| 历史| 贵州省| 仁寿县| 右玉县| 衡东县| 宁乡县| 新乡市| 河间市| 内江市| 昌都县| 娄烦县|