姚玉未
摘 要:在我國科技不斷發(fā)展的背景下,大數(shù)據(jù)技術(shù)、人工智能技術(shù)、機(jī)器技術(shù)等都得到了迅速的發(fā)展,社會隨之進(jìn)入了智能化的時代,人與機(jī)器人之間交互變得越來越頻繁,機(jī)器人逐漸應(yīng)用到人們的生活中。動作交互是機(jī)器人領(lǐng)域最重要也是最直接的交互方式,通過實(shí)現(xiàn)人與機(jī)器人之間的動作交互,人類不僅能夠更好地對機(jī)器人進(jìn)行控制,還能大大提升控制效率,特別是在一些很復(fù)雜的場合,這時智能機(jī)器人的作用就大大的體現(xiàn)出來了。文章基于圖像處理技術(shù),以一款智能機(jī)器人為例,實(shí)現(xiàn)了在復(fù)雜情況下機(jī)器人追蹤并模仿人類的過程。
關(guān)鍵詞:圖像處理;人體動作識別;追蹤機(jī)器人
0 引言
我國科技在不斷進(jìn)步,智能化的設(shè)備已經(jīng)廣泛應(yīng)用到人們生活當(dāng)中,一些較為老舊的科技工具已經(jīng)無法滿足于需求,因此人們更迫切的希望能夠應(yīng)用更加便捷和直觀的交互方式。人與機(jī)器人交互的主要目的在于完善彼此間的交互方式,不僅能夠讓人類更好的使用機(jī)器人,還能夠讓機(jī)器人更好地了解人類的需求,實(shí)現(xiàn)基本的信息輸出工作。隨著我國圖像處理技術(shù)的廣泛應(yīng)用,在很大程度上提升了人們的工作效率。此后,人們又提出了動作交互技術(shù)的概念,隨著此技術(shù)的不斷發(fā)展,圖像處理技術(shù)也開始應(yīng)用于機(jī)器人領(lǐng)域。機(jī)器人自此能夠追蹤并模仿人類的動作,并能夠在一些危險的場合代替人類去完成必要的工作,這樣能夠更好地減小對人類生命安全的威脅。
1 我國動作交互機(jī)器人發(fā)展的現(xiàn)狀
我國交互機(jī)器人雖然發(fā)展的較晚,但是發(fā)展速度卻是相當(dāng)?shù)目?。?980年初開始,我國政府就開始在科技方面規(guī)劃發(fā)展,在此時期交互機(jī)器人才算是真正在我國開始起步發(fā)展。到了2010年,我國交互機(jī)器人產(chǎn)業(yè)發(fā)展逐漸擴(kuò)大,并慢慢涵蓋了生產(chǎn)行業(yè)、銷售行業(yè)等領(lǐng)域。我國國內(nèi)的科技企業(yè)也開始全面重視起對科技的應(yīng)用,開始全面引進(jìn)新的技術(shù)。近年來,我國逐漸擴(kuò)大了對科技的資源供給,通過不斷的生產(chǎn)、研究和應(yīng)用,在交互機(jī)器人產(chǎn)業(yè)發(fā)展領(lǐng)域有了很大的進(jìn)步。到2016年,我國第一臺交互機(jī)器人被研發(fā)誕生,這臺交互機(jī)器人能夠有效識別人類的面部表情,并通過此做出相應(yīng)的微表情,除此之外還能夠做出與人類相似的肢體功能,模仿能力相當(dāng)?shù)膹?qiáng)[1]。雖然說我國動作交互機(jī)器人行業(yè)發(fā)展的較好,但是與國外發(fā)達(dá)國家相比較,在市場份額和技術(shù)領(lǐng)域等方面,我國仍然沒有太大的優(yōu)勢。這是由于機(jī)器人產(chǎn)業(yè)本身就具備一定的復(fù)雜性,且我國在此領(lǐng)域發(fā)展的較晚。如今我國動作交互機(jī)器人主要存在以下問題。
(1)交互簡單。由于交互機(jī)器人的程序已經(jīng)被設(shè)置好,因此機(jī)器人只能夠做出已經(jīng)設(shè)定好程序的幾個動作,超過這幾個動作范圍后,則無法正確進(jìn)行識別。(2)功能局限。因?yàn)榻换C(jī)器人的制作工藝比較特殊,導(dǎo)致其自身結(jié)構(gòu)較為簡單,無法做出和人類相似的復(fù)雜動作,因此導(dǎo)致在多數(shù)情況下無法應(yīng)用。(3)識別率差。在一些特定的環(huán)境下,比如背景復(fù)雜、光線暗淡等,都會影響到交互機(jī)器人采集圖像的清晰度,因此會對識別的結(jié)果造成較大的影響。(4)應(yīng)用范圍不廣。由于大部分交互機(jī)器人是通過數(shù)據(jù)線來傳播數(shù)據(jù)的,在復(fù)雜的環(huán)境下,若是不存在有線的環(huán)境,則會影響到交互機(jī)器人的使用。
2 圖像處理在人體動作識別中的應(yīng)用
2.1 圖像檢測
在搭建好交互機(jī)器人開發(fā)環(huán)境后,下一步則需要對人體的動作進(jìn)行檢測,這樣一來才能實(shí)現(xiàn)機(jī)器人的后續(xù)處理。通過檢測人體的各個關(guān)節(jié)點(diǎn),實(shí)現(xiàn)對人體骨骼的記錄追蹤,并對相應(yīng)的圖像進(jìn)行采集。由于在實(shí)際采集的過程中,圖像的結(jié)果會受到光照強(qiáng)度、彩色圖像、背景顏色等影響,因此可能會對檢測結(jié)果造成一定的影響。為了減小影響,采用圖像處理技術(shù),全面處理采集到的圖像,最終將彩色的圖像轉(zhuǎn)化成為黑白圖像,減小了在采集圖像過程中會受到背景、光照等因素的影響[2]。采用圖像處理技術(shù)對整個圖像檢測有一個具體的流程,即將采集到的彩色圖像進(jìn)行依次的處理,主要包括平滑濾波、灰度化、邊緣檢測、形態(tài)學(xué)變換等,這樣一來不僅避免了噪音對圖像的影響,還減小了背景和光照的影響。因此能夠有效收集到高質(zhì)量的處理圖像,隨后繪制清晰的人體骨骼圖像。
2.2 圖像處理
2.2.1 平滑濾波
在計算機(jī)圖像處理過程中,圖像平滑有著廣泛的應(yīng)用,在形成圖像、接收圖像、傳輸圖像以及處理圖像的過程中不可避免地會受到一定的影響。如,在圖像傳輸過程中,會受到外界因素以及人為因素的影響,從而影響到圖像的質(zhì)量,給交互機(jī)器人分析圖像帶來困難。因此在處理圖像的過程中須除這些因素的影響,才能夠得到高質(zhì)量的圖像。在圖像處理過程中平滑濾波主要有三種濾波方式:(1)均值濾波。均值濾波只能將噪聲減弱,并不能夠徹底消除噪聲,但是操作會比較簡單[3]。(2)中值濾波。中值濾波對于去除噪聲有較好的效果,并且能夠有效保護(hù)圖像信息的完整性。(3)高斯濾波。高斯濾波能夠有效處理正態(tài)分布的噪聲,且能夠保留好圖像分布的特點(diǎn)。
2.2.2 灰度化
灰度化主要是指將圖像進(jìn)行黑白色處理,在進(jìn)行處理之后,圖像顏色將只保留有用的灰色信息。如今交互機(jī)器人所采集到的圖像都是彩色圖像,彩色圖像中有大量的信息,在實(shí)際處理過程中因?yàn)檩^難處理,不僅會影響到圖像處理的質(zhì)量和速度,還會對圖像分析造成影響,因此經(jīng)常會用交互機(jī)器人來灰度化處理圖像。
2.2.3 形態(tài)學(xué)變換
圖像形態(tài)學(xué)處理方法常常用來處理二值化后的圖像,也就是對圖像進(jìn)行進(jìn)一步的改善,通過處理從圖像中提取出來的區(qū)域,能夠更加清晰的觀察到圖像,詳細(xì)的會觀察到圖像的分支、孔洞、崎嶇等。圖像形態(tài)學(xué)處理方法主要包括:閉運(yùn)算法、開運(yùn)算法、腐蝕操作法、膨脹操作法等。
3 追蹤機(jī)器人的結(jié)構(gòu)設(shè)計
3.1 自由度及3D打印材料的選擇
3.1.1 確定自由度
交互機(jī)器人的肩關(guān)節(jié)、胯關(guān)節(jié)是比較重要和特殊的關(guān)節(jié),設(shè)計好之后能夠讓交互機(jī)器人進(jìn)行上下的擺動和左右的擺動,因此在實(shí)際設(shè)計過程中更要為這兩個關(guān)節(jié)設(shè)置好自由度,并且分別安裝上控制其移動的舵機(jī)。交互機(jī)器人的頭部設(shè)計一個自由度,每個上肢設(shè)計四個自由度(一個上下擺動的肩關(guān)節(jié)自由度、一個左右擺動的肩關(guān)節(jié)自由度、一個肘關(guān)節(jié)自由度、一個手臂關(guān)節(jié)自由度),每條腿設(shè)計四個自由度(上下擺動和左右擺動的胯關(guān)節(jié)分別有一個自由度,一個膝關(guān)節(jié)自由度、一個踝關(guān)節(jié)自由度)。
3.1.2 選擇3D打印材料
設(shè)計出的交互機(jī)器人的各種零件均是由3D打印機(jī)打印出來的,考慮到機(jī)器人設(shè)計中所要求的環(huán)保性,可選擇聚乳酸作為交互機(jī)器人的3D打印材料。聚乳酸作為一種新型的環(huán)保材料,主要是由木薯、玉米等淀粉制作而成的。在特定的條件下,可被自然中的微生物給降解掉,環(huán)保性良好,是對環(huán)境較為友好的新型材料。
3.2 零件設(shè)計
3.2.1 設(shè)計舵機(jī)連接件
舵機(jī)連接件是交互機(jī)器人整個結(jié)構(gòu)設(shè)計中會應(yīng)用到最多的零件,其關(guān)系到交互機(jī)器人性能和設(shè)計的協(xié)調(diào)性和穩(wěn)定性。由于舵機(jī)連接件主要與舵機(jī)相連,因此在設(shè)計連接件時,需要充分考慮到交互機(jī)器人舵機(jī)的大小。
3.2.2 設(shè)計手臂和腿部關(guān)節(jié)
在完成舵機(jī)連接件的設(shè)計之后,接下來需要完成交互機(jī)器人手臂零件和腿部零件的設(shè)計。由于關(guān)節(jié)零件的位置主要是由舵機(jī)的位置來確定的,因此在設(shè)計各個零件時,一定要留出一定的空間,這樣一來才能夠促進(jìn)交互機(jī)器人更好的運(yùn)動。
3.2.3 設(shè)計身體和其他零件
在設(shè)計完成交互機(jī)器人的手臂關(guān)節(jié)和腿部關(guān)節(jié)之后,還需要設(shè)計好身體的其他部位零件,要全面考慮到交互機(jī)器人整體的穩(wěn)定性。在設(shè)計過程中,可以適當(dāng)?shù)卦O(shè)計大一點(diǎn)的腳掌,這樣能夠加大機(jī)器人與地面的接觸面積,提高機(jī)器人的穩(wěn)定性[8]。
總的來說,智能機(jī)器人很好地結(jié)合了“交互”“動作識別”“圖像處理”等技術(shù),在技術(shù)操作的實(shí)際過程中方便靈活,不需要提前設(shè)置好復(fù)雜的程序代碼,社會應(yīng)用價值較高,適合多個場合進(jìn)行應(yīng)用。但機(jī)器人在實(shí)際使用中還是存在一些需完善的地方,比如數(shù)據(jù)傳輸、結(jié)構(gòu)穩(wěn)定性等。相信在未來科技不斷發(fā)展下,智能交互機(jī)器人將會更好的投入到社會使用中,對人們產(chǎn)生更深遠(yuǎn)的影響。
[參考文獻(xiàn)]
[1]柴琳.基于立體視覺的人體動作識別方法研究[D].青島:中國海洋大學(xué),2015:67-68.
[2]張穎.基于計算機(jī)視覺的人體動作識別研究[D].北京:華北電力大學(xué),2018.
[3]劉翔宇,楊越佳,胡令昊,等.基于視覺的體感交互人體動作識別系統(tǒng)研究[J].電腦知識與技術(shù),2018(1):193-194,196.
(編輯 姚 鑫)
Research on human action recognition and tracking robot based on image processing
Yao Yuwei
(Guangdong Vocational and Technical University, Zhaoqing 526020, China)
Abstract:Under the background of the continuous development of science and technology in China, Big Data technology, artificial intelligence technology, machine technology and so on have been developed rapidly, and we have entered the era of intelligence, and the interaction between human and robot has become more and more frequent, and robots have been gradually applied to our lives. Action interaction is the most important and direct way of interaction in the field of robot. By realizing the action interaction between human and robot, human beings can better control the robot and greatly improve the efficiency of control. Especially in some very complex situations, the role of intelligent robots is greatly reflected. Based on image processing technology, this paper takes an intelligent robot as an example to realize the process of robot tracking and imitating human beings in complex situations.
Key words:image processing;human action recognition;tracking robot