摘? 要: 當前我國人工智能技術水平有了長足的進步,給人民群眾的日常生活帶來了較大的便利,故而在人機交互技術方面的需求也不斷上漲。手勢是人類使用頻率最高的肢體語言之一,運用手勢進行溝通顯得直觀有效、自然簡潔,而在機器學習背景之下,結合人工智能技術完成對人體手勢的識別就成了當前的重要研究問題?;诖耍疚母攀隽藱C器學習的基本內涵及種類,并分析了手勢識別技術中的要點,以求為人工智能的發(fā)展提供理論上的支持。
關鍵詞: 人工智能;機器學習;手勢識別
中圖分類號: TP301? ? 文獻標識碼: A? ? DOI:10.3969/j.issn.1003-6970.2020.10.032
本文著錄格式:徐琛玥. 機器學習背景下手勢識別技術探究[J]. 軟件,2020,41(10):132134
【Abstract】: At present, the level of artificial intelligence technology in China has made great progress, which brings great convenience to people's daily life, so the demand for human-computer interaction technology is also rising. Gesture is one of the most frequently used body language. Using gesture to communicate is intuitive, effective, natural and concise. Under the background of machine learning, the combination of artificial intelligence technology to complete the recognition of human gesture has become an important research issue. Based on this, this paper summarizes the basic connotation and types of mechanical learning, and analyzes the key points of gesture recognition technology, in order to provide theoretical support for the development of artificial intelligence.
【Key words】: Artificial intelligence; Machine learning; Gesture recognition
0? 引言
當前諸如模板匹配、人工神經網絡以及隱馬爾科夫模型這類背景下的手勢識別算法有著較為廣泛的飲用,但其計算顯得較為復雜,相比之下基于機器學習的手勢識別有著較為現(xiàn)主要的優(yōu)勢,能夠提取多層網絡簡化的高價值信息,所取得的識別效果更佳。
1? 機器學習的基本內涵及種類
機器學習涉及到了不同領域的相關知識,且將這類知識進行了有效的整合,主要是研究計算機怎樣對人類的學習行為進行正確的模擬,并根據人類的經驗來掌握相應的技能及知識,再經過不斷學習之后改良與優(yōu)化人類的知識結構。在進行機器學習時,人類所擁有的經驗基本上能夠類比于及計算機中的數據信息、人類所掌握的學習水平則能夠類比于計算機中的學習算法,人類所具備的知識結構則能夠類比于計算機中的模型。那么便能夠得知,機器學習主要是指在計算機中深入分析海量數據信息,根據自身的學習算法來明確數據信息中所蘊含的基本特點及規(guī)律,并在持續(xù)的學習過程之中獲得相應的經驗及知識模型,進而能夠預測未知的數據信息。
根據機器學習的訓練數據信息是否已經完成標準,可以劃分成半監(jiān)督學習、無監(jiān)督學習以及監(jiān)督學習三種類型。其中監(jiān)督學習主要是指所標注的數據信息與訓練數據信息之間能夠達成某種統(tǒng)一,一般劃分成分類及回歸兩種種類。諸如KNN算法、SVM算法、邏輯回歸算法以及決策樹等屬于分類算法的范疇;多項式回歸、線性回歸以及嶺回歸則屬于回歸算法的范疇。而無監(jiān)督學習主要是指并不依賴與標注信息,而是直接分析相應的訓練數據信息,并對其中所體現(xiàn)出來的規(guī)律進行總結,明確其分布情況,進而將這類數據信息劃分成不同的簇。諸如主成分分析法(Principal Component Analysis,PAC)以及K-means算法都是無監(jiān)督學習中的關鍵算法,能夠有效聚類相應的數據信息。半監(jiān)督學習則是將監(jiān)督學習以及無監(jiān)督學習之間的基本特征進行了有機的融合,這主要是因為在實際統(tǒng)計相應數據信息時,無法確保所有數據信息都能夠具備相應的標簽,為了讓所有數據信息的作用能夠得到最大化地發(fā)揮,半監(jiān)督學習算法應運而生。諸如半監(jiān)督支持向量機算法(SVMs)以及graph-basedmethods圖論算法都是半監(jiān)督學習中的常見算法。
2? 基于膚色的多手勢圖像精準分割算法技術要點
膚色作為人類較為鮮明且直觀的特點,與其余手勢特點有所不同,它不會受到來自大小、方向以及形狀這類因素的干擾,在對相關手勢進行旋轉、縮放以及平移時,膚色特點具備了較強的魯棒性,因此采取多手勢圖像能夠對膚色進行精準的分割,實現(xiàn)手勢識別的根本目的。這一算法的技術要點如下:
2.1? 手勢圖像預處理
當獲取了相應的手勢圖像之后,很容易會受到來自噪聲的不利影響,讓分割與識別手勢圖像的精準程度有所降低,故而在分割與識別手勢圖像之前應當進行相應的預處理。應用較為廣泛的預處理方式有去噪方法以及形態(tài)學處理方法。
第一,去噪方法。當試用圖像采集設施來對手勢圖像進行采集時會出現(xiàn)數量眾多的噪聲,這樣一來所獲取圖像的質量無法得到保障,因此對其進行去噪的操作勢在必行。要想實現(xiàn)去噪的目的,可以選擇兩種濾波器來進行去噪處理。首先是高斯濾波器,在對圖像進行采集時,高斯白噪聲是出現(xiàn)頻率最高的噪聲,通過高斯濾波器的應用能夠實現(xiàn)良好的去噪目的。高斯濾波器是一種線性濾波器,根據高斯分布原理能夠明確采集圖像的像素數值,這樣一來就能夠有效避免各類噪聲的產生。高斯濾波器所遵循的二維高斯函數如下:
其中h(x, y)主要是指高斯濾波器在(x, y)這一坐標中的實際數值,σ則表示了標準差。
其次是中值濾波器,它是一種非線性濾波器,能夠統(tǒng)計并排列組合周圍所產生的像素點,并選擇其中值來當做最佳的像素值,進而讓孤立無援的噪聲點得以消除,進而實現(xiàn)去噪的目的。
第二,形態(tài)學處理方法。當完成對手勢圖像的去噪操作之后,所獲取圖像之中會出現(xiàn)一定的殘缺以及空隙,通過形態(tài)學處理方法的應用,就能夠讓圖像之中的毛刺、孤立點、填充小孔得以消除。形態(tài)學處理方法主要有以下幾種操作方式:
一是膨脹。這一操作的目的主要是讓物體能夠與其背景點進行有效的合并,使得目標物體的面積得以增大,從而實現(xiàn)對目標區(qū)域中相應縫隙及空洞得以填充。二是腐蝕。這一操作的目的主要是消除物體周圍的邊界點,使得目標物體的面積得以減少,從而實現(xiàn)對目標區(qū)域中的孤立點得以消除。
2.2? 明確收拾圖像最小面積外接矩形
進行手勢分割操作主要是為了讓手勢不受到背景的干擾,有效提升識別結果的準確程度。一般而言手勢圖像存在著個凸多邊形的凸包,而其外接矩形則主要包含了最小面積外接矩形MABR(Minimum Area Bounding Rectangle)以及最小綁定矩形MBRMBR(Minimum Bounding Rectangle)。針對最小綁定矩形應當充分考慮到其輪廓基本特征來明確矩形頂點,進而建立相應的矩形手勢來完成分割,但通過這一方式所獲得的手勢圖像依然會包含一定的背景,且手勢面積遠遠小于矩形面積。針對最小面積外接矩形應當在沿用上述手段的前提之下,盡可能地增加手勢面積。
2.3? 做好手勢圖像輪廓提取工作
當完成對手勢圖像的預處理之后,工作人員就可以對其中的輪廓數據信息進行提取,輪廓信息有著較為豐富的手勢特點,能夠對手勢的角度進行獲取,對前景以及背景進行有效的區(qū)分。當前應用較為廣泛的手勢圖像輪廓提取方式主要是八鄰域檢測法,其模板如圖1所示。
這一方法的主要步驟如下:
對手勢圖像進行全面的掃描,直至尋找到完美地前景像素點;對搜索方向進行初始化;根據這一方向將前景像素點移動到下一個區(qū)域的像素點之中;如若確定這一像素點屬于輪廓點的范疇,那么就能夠對這一手勢圖像的輪廓進行提取,如若并不屬于,那么就要進行下一步的工作;繼續(xù)對搜索方向進行更新,直至確定像素點屬于輪廓點的范疇;停止工作。最終獲得的手勢圖像輪廓如圖2所示。
3? 結語
綜上所述,人工智能在實際生活中的不同領域都有著較為廣泛的應用,為各行各業(yè)帶來了較大的便利。機器學習便是人工智能中的重要組成部分,在機器學習背景之下,通過手勢識別技術的應用,能夠讓人民群眾在進行人機交互時更為簡便,不再依賴于鍵盤、觸摸屏以及鼠標這類與終端直接接觸的設備,進而有效提升人機交互的效率及質量。要想讓手勢識別結果足夠精準,相關工作人員就必須明確該技術中的相關要點,采取合理的措施來減少手勢識別結果受到各類因素的干擾。這樣一來就會讓手勢識別技術得到良好的發(fā)展,有效推動社會科學技術水平的不斷進步。
參考文獻
[1]江元, 楊波, 趙東來, 等. 基于時間序列分析及機器學習的移動網絡業(yè)務量預測技術[J]. 物聯(lián)網技術, 2020, 10(6): 42-45.
[2]戚天梅, 過弋, 王吉祥, 等. 基于機器學習的外匯新聞情感分析[J]. 計算機工程與設計, 2020, 41(6): 1742-1748.
[3]蒲曉蓉, 陳柯成, 劉軍池, 等. COVID-19中國診療方案的機器學習智能分析方法[J/OL]. 生物醫(yī)學工程學雜志: 1-8[2020-06-19]. http://kns.cnki.net/ kcms/detail/51.1258.R. 20200611.1510.018.html.
[4]趙天偉, 林莉, 張東輝, 等. 機器學習在無損檢測中的應用案例淺析[J]. 無損探傷, 2020, 44(3): 1-4+11.
[5]曾路, 汪浩. 基于機器學習的虛擬儀器軟件缺陷預測模型研究[J]. 自動化與儀器儀表, 2020(5): 59-62.
[6]甘天江, 傅友華, 王海榮. 毫米波大規(guī)模MIMO系統(tǒng)中基于機器學習的自適應連接混合預編碼[J]. 信號處理, 2020, 36(5): 677-685.
[7]余傳明, 李浩男, 安璐. 基于深度學習的領域知識對齊模型研究:知識網絡視角[J]. 情報學報, 2020, 39(5): 521- 533.
[8]歐俊臣, 沙玲, 楊淞文. 基于MCTS和卷積神經網絡的五子棋策略研究[J]. 軟件, 2020, 41(4): 160-164.
[9]石桐歌, 孟祥宇, 王朋嬌. 我國機器人教育現(xiàn)狀分析與發(fā)展趨勢研究[J]. 軟件, 2020, 41(2): 113-118.
[10]王雪, 郭佳偉, 郝天琦, 等. 依托大數據、人工智能技術的醫(yī)工科研平臺創(chuàng)業(yè)項目研究[J]. 軟件, 2019, 40(11): 49-51.