蔣耀 夏慶鋒 蔣寧元 姜忠堃 靳士博
(南京大學(xué)金陵學(xué)院信息科學(xué)與工程學(xué)院,南京,210089)
一直以來(lái),多自主機(jī)器人協(xié)作都是機(jī)器人學(xué)中的一個(gè)研究熱點(diǎn),多個(gè)無(wú)人自主式的單位協(xié)同工作可以完成單一自主難以完成的任務(wù),更有利于達(dá)到理想的效果?,F(xiàn)如今,多機(jī)器人協(xié)作技術(shù)已經(jīng)越來(lái)越廣泛地用于許多領(lǐng)域,如軍事監(jiān)視、警戒系統(tǒng)等。實(shí)際上,多機(jī)器人系統(tǒng)的研究仍面臨許多難題,例如可以針對(duì)有限數(shù)量的機(jī)器人分析多個(gè)自主機(jī)器人之間的協(xié)作,但想要進(jìn)一步擴(kuò)展更多的解決方案則需要新技術(shù)的突破。
隨著多自主機(jī)器人技術(shù)的發(fā)展,越來(lái)越多的多機(jī)器人比賽開(kāi)始出現(xiàn)在機(jī)器人競(jìng)賽中,中國(guó)智能機(jī)器人格斗大賽武術(shù)擂臺(tái)2v2項(xiàng)目便是其中之一,本文結(jié)合相關(guān)競(jìng)賽研究多機(jī)器人協(xié)作技術(shù)。
中國(guó)智能機(jī)器人格斗大賽于2017年開(kāi)始舉辦,舉辦方為國(guó)際機(jī)器人競(jìng)技與創(chuàng)客教育聯(lián)盟,由國(guó)內(nèi)外知名的智能機(jī)器人領(lǐng)域的專(zhuān)家學(xué)者組成。自2008年以來(lái),該聯(lián)盟核心專(zhuān)家團(tuán)隊(duì)發(fā)起了機(jī)器人武術(shù)擂臺(tái)賽、機(jī)器人格斗比賽、空中機(jī)器人比賽等知名賽事,大賽面向全國(guó)高校,因其競(jìng)技性與趣味性吸引力眾多隊(duì)伍前來(lái)參賽,為人工智能、機(jī)器人技術(shù)在廣大院校的推廣和人才培養(yǎng)起到了積極作用。
中國(guó)智能機(jī)器人格斗大賽場(chǎng)地為邊長(zhǎng)2.4m的正方形擂臺(tái),周?chē)?.7m處有高0.5m的方形黑色圍欄。擂臺(tái)場(chǎng)地顏色為漸變色,場(chǎng)地兩個(gè)對(duì)邊設(shè)有四個(gè)寬度為0.4m上臺(tái)坡道,坡道頂端高度與擂臺(tái)平齊,機(jī)器人從0.3m×0.4m的出發(fā)區(qū)啟動(dòng)后,沿著該坡道走上擂臺(tái)。
比賽雙方各出戰(zhàn)兩個(gè)機(jī)器人,在擂臺(tái)上,機(jī)器人相互推擠,爭(zhēng)取盡可能多的機(jī)會(huì)將對(duì)手推到擂臺(tái)下,評(píng)判方法是:機(jī)器人掉下擂臺(tái)給對(duì)方加一分,10s內(nèi)機(jī)器人未能上臺(tái)再給對(duì)方加一分;如果雙方都只有一臺(tái)機(jī)器人在臺(tái)上時(shí)不得分;同時(shí),規(guī)則引入了KO機(jī)制,若一方機(jī)器人全在擂臺(tái)上,另一方全在擂臺(tái)下,在臺(tái)上的一方直接獲勝。
本文主要任務(wù)為設(shè)計(jì)一個(gè)移動(dòng)機(jī)器人協(xié)作系統(tǒng),由兩個(gè)自主輪式移動(dòng)機(jī)器人組成。每個(gè)機(jī)器人的組裝任務(wù)以下面三點(diǎn)為主要目標(biāo)。一是在紅外光電傳感器的幫助下,實(shí)現(xiàn)防掉臺(tái)的任務(wù)以及達(dá)到檢測(cè)敵人的目的;二是在顏色傳感器的幫助下達(dá)到識(shí)別隊(duì)友的目的;三是機(jī)器人小車(chē)的機(jī)械結(jié)構(gòu)要足夠完成上臺(tái)、巡航等基本任務(wù)。
以上所涉及的步驟主要由三個(gè)模塊組成:感知模塊、控制模塊、執(zhí)行模塊。
圖1 系統(tǒng)結(jié)構(gòu)圖
感知模塊負(fù)責(zé)檢測(cè)并獲取周?chē)畔?,這里采用紅外光電傳感器和320x240的USB彩色攝像頭。本文計(jì)劃在機(jī)器人的前后左右不同高度各放2個(gè)傳感器,下層的傳感器用于登臺(tái)檢測(cè),上層的傳感器用于障礙檢測(cè),并在機(jī)器人小車(chē)的四個(gè)角上各放置一個(gè)傳感器,用于檢測(cè)邊緣。由此,機(jī)器人可以檢測(cè)到不同方向的信息,進(jìn)而做出相應(yīng)的策略。USB彩色攝像頭安裝在上方,以實(shí)現(xiàn)分辨敵友的功能。
控制模塊指導(dǎo)機(jī)器人做出相應(yīng)的合理判斷,硬件上采用搭載Linux的ARM處理的WOODY控制器。
執(zhí)行模塊讓機(jī)器人做出相應(yīng)的動(dòng)作,本文電源采用14.8V鋰電池供電;動(dòng)力方面采用20W進(jìn)口電機(jī)來(lái)提高機(jī)器人的速度及對(duì)抗能力;驅(qū)動(dòng)方面采用BDMC1203驅(qū)動(dòng)器。
硬件設(shè)計(jì)效果如圖2所示。
圖2 硬件設(shè)計(jì)展示
3.1.1 永磁鐵相斥法
在機(jī)器人內(nèi)部?jī)A斜放置一個(gè)U型滑槽,滑槽頂端裝有紅外接近開(kāi)關(guān),在機(jī)器人內(nèi)部偏后位置,滑槽的底端放在機(jī)器人前方,在滑槽底端放置一個(gè)永磁鐵(強(qiáng)磁)。兩個(gè)機(jī)器人內(nèi)部放置的永磁鐵磁極相同。U型滑槽在排裝好永磁鐵和紅外接近開(kāi)關(guān)之后,外部使用光滑的材質(zhì)進(jìn)行封裝,保證內(nèi)部獨(dú)立。兩個(gè)機(jī)器人都裝有這樣的滑槽裝置,內(nèi)部各有一個(gè)永磁鐵。
當(dāng)兩個(gè)機(jī)器人面向靠近時(shí),因?yàn)閺?qiáng)磁鐵的磁極相同,發(fā)生互斥。這時(shí)候底部的永磁鐵因?yàn)榛コ獾牧?,順著滑槽開(kāi)始上升,當(dāng)擋住紅外開(kāi)關(guān)的光信號(hào)一段時(shí)間后觸發(fā)紅外開(kāi)關(guān)(即判定為己方機(jī)器人),兩個(gè)機(jī)器人都執(zhí)行規(guī)避程序。
當(dāng)兩個(gè)機(jī)器人不是面向靠近時(shí),強(qiáng)磁鐵因?yàn)榇艠O相反,發(fā)生吸引,這時(shí)候一個(gè)機(jī)器人的永磁鐵會(huì)上升,觸發(fā)開(kāi)關(guān),執(zhí)行規(guī)避程序。
上述方法為實(shí)驗(yàn)室前幾屆師兄留下,放到本文研究的環(huán)境下,存在一些問(wèn)題。如:該方法只能簡(jiǎn)單實(shí)現(xiàn)敵我的判斷,但因?yàn)闄C(jī)器人在實(shí)際作戰(zhàn)中的移動(dòng)速度很快,磁鐵在較遠(yuǎn)距離下相互作用力不大,無(wú)法達(dá)到識(shí)別的效果,當(dāng)磁鐵開(kāi)始產(chǎn)生作用時(shí),兩個(gè)機(jī)器人已經(jīng)十分靠近。
另外,此方法較為傳統(tǒng),為了解決這一問(wèn)題,提升機(jī)器人在實(shí)戰(zhàn)中的性能,本文結(jié)合最新的視覺(jué)識(shí)別技術(shù),嘗試設(shè)計(jì)出改良的敵我識(shí)別方案——閾值法的顏色識(shí)別。
3.1.2 閾值法的顏色識(shí)別
本文使用320x240的USB彩色攝像頭,通過(guò)RS232串口通信協(xié)議,配合搭載了Linux的ARM處理器的WOODY控制器進(jìn)行對(duì)敵方機(jī)器人和我方機(jī)器人的識(shí)別區(qū)分。
本文研究用顯著顏色對(duì)已方隊(duì)伍的機(jī)器人進(jìn)行標(biāo)注,在賽前通過(guò)軟件對(duì)己方機(jī)器人顏色的HSI值進(jìn)行記錄。比賽中通過(guò)攝像頭接收信號(hào),處理器判斷采集的HSI值是否符合預(yù)先設(shè)定的范圍,如果符合,即為已方機(jī)器人。如此便可以達(dá)到機(jī)器人在格斗過(guò)程中不會(huì)出現(xiàn)撞擊隊(duì)友的現(xiàn)象,從而實(shí)現(xiàn)較好的協(xié)作格斗,保證機(jī)器人的攻擊目標(biāo)始終是準(zhǔn)確的。
圖3 閾值法顏色識(shí)別流程
此方法相較于永磁鐵相拆法,在實(shí)戰(zhàn)速度很快的情況下,極大提升了識(shí)別的速度和距離,使我方機(jī)器人更具競(jìng)爭(zhēng)力。因?yàn)閿z像頭識(shí)別的距離比永磁鐵遠(yuǎn),所以,機(jī)器人可以預(yù)留出足夠的時(shí)間進(jìn)行反應(yīng)。
實(shí)際來(lái)看,此方法也存在一定缺陷,如若與對(duì)方機(jī)器人隊(duì)伍的顏色相同或相近而產(chǎn)生沖突,便不能很好地實(shí)現(xiàn)協(xié)作功能,會(huì)使場(chǎng)面陷入混亂。本文計(jì)劃的解決方法是準(zhǔn)備好一到兩種備選顏色,相應(yīng)的代碼也準(zhǔn)備好,存在控制器中,在比賽前根據(jù)對(duì)手的情況及時(shí)更換。
任務(wù)分配模塊設(shè)計(jì)的理念是充分利用好每個(gè)機(jī)器人個(gè)體的優(yōu)點(diǎn)。
3.2.1 任務(wù)分配概述
在多機(jī)器人協(xié)作的應(yīng)用中,因?yàn)榫唧w情況的不同,一般分為兩類(lèi)任務(wù)進(jìn)行分配,一為靜態(tài)任務(wù),二為動(dòng)態(tài)任務(wù)。若在運(yùn)行過(guò)程中,機(jī)器人所面對(duì)的環(huán)境對(duì)象是已知的且狀態(tài)穩(wěn)定,那么機(jī)器人所執(zhí)行的任務(wù)都可以按照預(yù)先設(shè)定的步驟按部就班進(jìn)行,這就是靜態(tài)任務(wù);動(dòng)態(tài)任務(wù)則是指機(jī)器人所處的環(huán)境在不斷變換,這種變化包括了己方機(jī)器人例如數(shù)量上的各種變化而導(dǎo)致任務(wù)目標(biāo)的改變,以及任務(wù)環(huán)境的調(diào)整,這種情況下機(jī)器人的任務(wù)分配是一個(gè)動(dòng)態(tài)的過(guò)程。目前多數(shù)研究對(duì)動(dòng)態(tài)任務(wù)的探究并不是很完善,尤其在武術(shù)擂臺(tái)2v2競(jìng)賽機(jī)器人上,大多數(shù)設(shè)計(jì)并沒(méi)有從全局最優(yōu)的角度出發(fā)。
多機(jī)器人系統(tǒng)穩(wěn)定又高效的關(guān)鍵在于系統(tǒng)內(nèi)的所有機(jī)器人可以通過(guò)及時(shí)的交流保持行動(dòng)的穩(wěn)定。對(duì)于2v2競(jìng)賽項(xiàng)目來(lái)說(shuō),同一方的兩個(gè)機(jī)器人要保證穩(wěn)定、沒(méi)有沖突地協(xié)作完成得分任務(wù),避免出現(xiàn)機(jī)器人路徑?jīng)_突、亦或是機(jī)器人攻擊的目標(biāo)沖突導(dǎo)致場(chǎng)面混亂的情況,就要求根據(jù)每個(gè)機(jī)器人的差異性,給每個(gè)機(jī)器人計(jì)劃分配不同的任務(wù),從而提升多機(jī)器人系統(tǒng)穩(wěn)定高效性。
3.2.2 基于個(gè)體最優(yōu)化的任務(wù)分配
本文設(shè)計(jì)基于運(yùn)行總邏輯(如圖4所示)提出一種分配任務(wù)的方案,將攻擊和防守兩個(gè)方案分別分配給2個(gè)機(jī)器人,2個(gè)機(jī)器人的結(jié)構(gòu)設(shè)計(jì)也將按照各自方案進(jìn)行,一個(gè)主要負(fù)責(zé)發(fā)現(xiàn)敵人進(jìn)行攻擊,另1個(gè)在場(chǎng)地邊緣進(jìn)行巡航游走,將傳感器的識(shí)別距離調(diào)近,確保在貼身的情況下可以發(fā)起反擊,如果遇到在臺(tái)下試圖上臺(tái)的敵方機(jī)器人,將進(jìn)行防守操作,阻礙敵方機(jī)器人上臺(tái)。
圖4 機(jī)器人運(yùn)行總邏輯
任務(wù)分配所要達(dá)到的目的有兩個(gè),一是要保證系統(tǒng)按照要求穩(wěn)定地完成下發(fā)的任務(wù);二是在確保一的情況下,充分利用好現(xiàn)有的資源,以盡量小的消耗更為高效地完成任務(wù),提升工作效率,例如,因?yàn)橄到y(tǒng)中的每個(gè)個(gè)體不盡相同,可以充分發(fā)揮系統(tǒng)中不同個(gè)體的不同能力,實(shí)現(xiàn)最優(yōu)化。
本文用一個(gè)小實(shí)驗(yàn)來(lái)比較顏色識(shí)別法和永磁鐵法的識(shí)別差異。在實(shí)驗(yàn)室的比賽臺(tái)上,將識(shí)別用機(jī)器人小車(chē)放在一端,將被識(shí)別小車(chē)放在另一端,在3m的距離下,比較兩種方法識(shí)別到友軍的時(shí)間。進(jìn)行5次實(shí)驗(yàn),將實(shí)驗(yàn)數(shù)據(jù)記錄下來(lái)并畫(huà)成圖像,實(shí)驗(yàn)結(jié)果如圖5所示。
圖5 實(shí)驗(yàn)結(jié)果圖像
從實(shí)驗(yàn)結(jié)果可知,永磁鐵法不僅識(shí)別的時(shí)間長(zhǎng),識(shí)別的穩(wěn)定度也差,充分表明顏色識(shí)別法要顯著優(yōu)于永磁鐵法。
下面通過(guò)MATLAB建模仿真來(lái)證實(shí)本設(shè)計(jì)中多機(jī)器人系統(tǒng)的可行性。
首先建立移動(dòng)機(jī)器人的運(yùn)動(dòng)學(xué)方程。移動(dòng)機(jī)器人由4個(gè)電機(jī)驅(qū)動(dòng),但其兩側(cè)的2個(gè)電機(jī)驅(qū)動(dòng)情況相同,建模時(shí)可看成由2個(gè)電機(jī)驅(qū)動(dòng)分別驅(qū)動(dòng)兩邊。如果左右兩邊轉(zhuǎn)速不同,車(chē)輪則會(huì)產(chǎn)生差動(dòng),從而實(shí)現(xiàn)轉(zhuǎn)彎。
機(jī)器人的運(yùn)動(dòng)學(xué)方程為:
為了保證位置跟蹤閉環(huán)系統(tǒng)滿(mǎn)足李普希茲條件,繼而實(shí)現(xiàn)全局穩(wěn)定的雙環(huán)軌跡跟蹤控制,計(jì)劃采用雙曲正切函數(shù)設(shè)計(jì)控制率。并將此雙環(huán)控制運(yùn)用到多機(jī)器人系統(tǒng)中[6]。
取:
最終得到實(shí)際位置控制律為:
仿真結(jié)果如圖6、圖7、圖8所示。
圖6 移動(dòng)機(jī)器人編隊(duì)控制
圖7 移動(dòng)機(jī)器人的速度跟蹤
圖8 移動(dòng)機(jī)器人的角度跟蹤
仿真結(jié)果可知,該多機(jī)器人系統(tǒng)穩(wěn)定可行。
筆者在該項(xiàng)目中探討了多機(jī)器人協(xié)作技術(shù)在2v2擂臺(tái)賽中的應(yīng)用。為了解決永磁鐵相斥法的缺陷,嘗試提出顏色識(shí)別法進(jìn)行敵友區(qū)分設(shè)計(jì),思考了任務(wù)分配對(duì)實(shí)現(xiàn)2v2競(jìng)賽策略最優(yōu)化的意義,并給出一種執(zhí)行方案,最后用實(shí)驗(yàn)驗(yàn)證了顏色識(shí)別法的優(yōu)越性,并且在保證全局穩(wěn)定的基礎(chǔ)上,用數(shù)學(xué)建模對(duì)機(jī)器人系統(tǒng)進(jìn)行雙環(huán)編隊(duì)控制的仿真。
在此基礎(chǔ)上,如何設(shè)計(jì)出更加完善的多機(jī)器人協(xié)作系統(tǒng)、可否嘗試設(shè)計(jì)出獨(dú)特的算法進(jìn)一步優(yōu)化系統(tǒng)等問(wèn)題是下一步研究的方向。