卜文銳
(陜西國防工業(yè)職業(yè)技術(shù)學院 陜西省西安市 710300)
隨著人工智能技術(shù)的發(fā)展,近年來各類機器人的智能程度得到了顯著提升;而隨著該領(lǐng)域各類應用數(shù)據(jù)和實踐經(jīng)驗的積累,人工智能技術(shù)也隨之不斷進步,取得了許多優(yōu)秀的研究成果。AI技術(shù)在各類機器人實用技術(shù)中主要體現(xiàn)在智能感知技術(shù)、智能導航與規(guī)劃技術(shù)、智能控制與操作以及智能交互等方面。
各類實際應用場景的復雜化使得機器人的應用日漸具有挑戰(zhàn)性。機器人的智能感知主要是借助各種不同類型的傳感器來實現(xiàn)。
機器人視覺的實現(xiàn)過程需要經(jīng)過維度轉(zhuǎn)換,也就是從三維實體到二維圖像,再經(jīng)過一定的處理過程得到可用數(shù)據(jù)。這些數(shù)據(jù)通常包括物體的距離、明暗和一定程度的色彩信息,為了獲得較好的數(shù)據(jù),通常會在良好的照明條件下進行圖像采集。機器人視覺方面的應用主要包括視覺反饋(控制機器人動作)、視覺導航(控制機器人移動)和視覺檢驗(質(zhì)量控制、安全檢測)等方面。
觸覺應用的典型目標是替代多種場合下人類雙手的特定功能,往往借助觸覺傳感器來實現(xiàn)。實際場景中涉及的觸覺主要包括接觸覺、壓力覺、滑覺、接近覺和溫度覺等。這一領(lǐng)域的研究難點在于模擬人體運動器官所需要的數(shù)據(jù)在維度和數(shù)量上都非常大,而且單純引入傳感器并不能顯著提高機械手完成復雜任務的能力。目前,觸覺應用領(lǐng)域的進步主要得益于聚類、分類算法的進步,而機器學習中監(jiān)督學習、無監(jiān)督學習和半監(jiān)督學習方法對于機器人觸覺應用的提升起到了明顯的助推作用。
機器人聽覺借助聽覺傳感器實現(xiàn),在使用過程中,傳感器檢測并顯示聲音的波形,將之轉(zhuǎn)化為可被后電路使用的數(shù)據(jù)樣式。機器人聽覺廣泛應用在日常溝通、工業(yè)、醫(yī)療、軍事和航海、航天等領(lǐng)域。
在具體的任務當中,測量聲音的響度和音調(diào)、區(qū)分左右聲源以及判斷聲源方向往往是對機器人的基本要求;進一步的要求通常包括與人進行語音交流以實現(xiàn)人機對話功能。這一體系當中,自然語言處理(NLP)和語音處理(SSP)技術(shù)的發(fā)展為機器人聽覺的進步提供了有力支持。
在機器人的實際應用場景中,需要采集和處理的數(shù)據(jù)往往具有多種模態(tài)(例如視覺、聽覺和觸覺等)且具有顯著的動態(tài)特征。為完成某個特定的任務所采集、處理的大量數(shù)據(jù)通常屬于多模態(tài)數(shù)據(jù),收集這些數(shù)據(jù)的每種方法或視角都稱為一個模態(tài)。機器人分析處理多模態(tài)數(shù)據(jù)的能力是其智能化程度的典型標志之一。
在無人駕駛、智慧物流和智能倉儲等領(lǐng)域,機器人的智能導航與規(guī)劃是研究者長期以來關(guān)注的核心內(nèi)容。如何在保證機器人安全平穩(wěn)運行的前提下最大程度地減少人為干預,并以此為基礎(chǔ)實現(xiàn)自動避障,是當前研究中的熱點問題。
由于機器人在各類工作環(huán)境中移動時場景參數(shù)的多樣性與復雜性,自動避障目標的實現(xiàn)需要機器人搭載的傳感器、處理器和運動控制部分的有機、高效協(xié)同。機器人的實時處理與反應能力決定了事先編制的各類避障規(guī)則能否及時生效。為了提升智能機器人自主行動和避障的能力,當前此類機器人設(shè)計當中很大程度上引入了歸納學習策略等內(nèi)容,機器人在不斷的學習訓練過程中提升自身的信息處理與實時控制能力。自動避障的基本流程如下:
(1)確定機器人的靜態(tài)和動態(tài)參數(shù)。
(2)確定機器人本體與障礙之間的相對位置參數(shù)。
(3)根據(jù)障礙物參數(shù)分析機器人本體的運動態(tài)勢。
今后機器人智能導航與規(guī)劃系統(tǒng)將會更大程度地引入各類性能優(yōu)異地傳感器,并將功能從導航拓展到監(jiān)控、通信等方面,機器人規(guī)劃最佳路徑的能力將隨著自身算力的提高和機器學習算法的優(yōu)化而不斷提升。
機器人的控制與操作涵蓋了運動控制和操作過程中的自主操作及遙控操作。近年來,智能化的機器人操控已成為行業(yè)當中較為主流的技術(shù)。
比例-積分-微分控制(PID)、計算力矩控制(CTM)、魯棒控制(RCM)和自適應控制(ACM)是機器人運動控制比較典型的方法,但由于它們的局限性(例如無法自我學習),傳統(tǒng)的機器人系統(tǒng)在復雜環(huán)境下的穩(wěn)定性、魯棒性和動態(tài)性能都不盡如人意。近二十多年來,以神經(jīng)網(wǎng)絡、模糊邏輯和進化計算為代表的人工智能理論與方法在機器人控制領(lǐng)域取得了較為顯著的成果。
神經(jīng)網(wǎng)絡的學習能力和非線性映射能力對于優(yōu)化傳統(tǒng)的機器人控制模型有著重要的作用,應用較多的神經(jīng)網(wǎng)絡結(jié)構(gòu)有直接控制、自矯正控制和并聯(lián)控制等。
(1)直接控制:利用設(shè)計好的神經(jīng)網(wǎng)絡的自學習能力,經(jīng)過一定次數(shù)的訓練歸納出機器人運動的抽象方程。當機器人運動與理想狀況發(fā)生偏差時,神經(jīng)網(wǎng)絡直接給出優(yōu)化后機器人應當具有的動力輸出,從而控制機器人合理運動。
(2)自矯正控制:使用訓練度高的神經(jīng)網(wǎng)絡矯正系統(tǒng)的參數(shù)。該結(jié)構(gòu)采用在線方式根據(jù)發(fā)生變化的系統(tǒng)模型參數(shù)估計新參數(shù)值,并將該值輸出到控制器以調(diào)整系統(tǒng)的狀態(tài);其優(yōu)點是不必徹底解析系統(tǒng)結(jié)構(gòu)且參數(shù)估計較為準確。
(3)并聯(lián)控制結(jié)構(gòu):通常有前饋型和反饋型兩種類型。其中,前饋型神經(jīng)網(wǎng)絡基于機器人的逆動力特性,將常規(guī)控制器與網(wǎng)絡給出的驅(qū)動力矩并行設(shè)置。當該力矩大小適當時系統(tǒng)誤差較小,此時常規(guī)控制器基本不發(fā)揮控制作用;反之,常規(guī)控制器將起到主導作用。而反饋型神經(jīng)網(wǎng)絡是基于控制器的控制,根據(jù)任務要求和實際場景的實時差異生成矯正力矩,使機器人處于應有的運動狀態(tài)。
當前機械制造與AI技術(shù)不斷融合,促進了泛用性更強、智能交互能力更加顯著的服務型機器人的相關(guān)研究,相對于傳統(tǒng)的工業(yè)機器人而言該領(lǐng)域逐漸具有更高的研究熱度。根據(jù)服務機器人的應用場景,機械手臂在其中扮演著重要的角色。典型任務主要包括實際環(huán)境中的目標識別、目標抓取及后續(xù)的精細操作任務。這類任務需要機器人能夠準確識別目標的形狀、姿態(tài)、抓取特征、抓取方式,并實時規(guī)劃機械手臂完成任務的具體方式。
機械手臂完成抓取任務的解決方式分為“分析法”和“經(jīng)驗法”兩種類型。“分析法”具有較為嚴格和典型的數(shù)學特征,由于其在模型建立、抓取穩(wěn)定性判據(jù)、指關(guān)節(jié)逆運動學等方面搜索的盲目性和求解優(yōu)化的困難,在機器人靈巧操作領(lǐng)域取得的成果有限。然而,“經(jīng)驗法”在近二十年來獲得了較為顯著的突破。該方法基于大量的訓練數(shù)據(jù),借助支持向量機等機器學習方法并注重泛化學習能力的提升,取得了良好的實踐效果。近年來,加之計算機視覺領(lǐng)域中深度學習的突破,卷積神經(jīng)網(wǎng)絡被應用于目標抓取特征的自主學習,使得機械手臂實時抓取操作的要求得到了滿足。
另外,服務機器人操作任務的復雜度使得傳統(tǒng)機械手臂的運動軌跡規(guī)劃方法難以取得顯著的應用成果,相對于五次多項式法和RRT等方法,當前模仿學習和強化學習得到了較多的關(guān)注。模仿學習是在大量人類專家決策數(shù)據(jù)的基礎(chǔ)上,將狀態(tài)和動作作為網(wǎng)絡的輸入和輸出,經(jīng)過一系列的數(shù)據(jù)構(gòu)建和算法處理,以分類或回歸學習為手段得到最優(yōu)的輸出模型。該過程往往是在深度神經(jīng)網(wǎng)絡的協(xié)助下進行的,而強化學習則是在此基礎(chǔ)上引入反饋機制以增強學習效果。得益于AI芯片和算法的發(fā)展,智能服務機器人與人交互和應對復雜環(huán)境的能力有了顯著的提升。
機器人存在的意義在很大程度上可以說是為人類服務,那么與人交互的過程是否順暢自然就稱為評估機器人智能水平的重要標準。當前,人類主要通過語言、表情、動作及與機器人配套的可穿戴設(shè)備實現(xiàn)與機器人的各種交互。當然,人機交互的方式包含著巨大的可能性。機器人技術(shù)的變革不斷影響著人們的生活方式,而在人機交互過程中,AI技術(shù)因其與機器人技術(shù)的深度融合也在不斷進步。
由于各種機器人在識別人類意圖的過程中會遇到各種困難,以各類可穿戴設(shè)備輔助機器人采集和分析人類的意圖來加強人機交互流暢性就成為十分可行的處理方式。這類場合下的可穿戴設(shè)備通常具有集成度高、識別精度高和通信能力強的特點,設(shè)備中部署的計算機系統(tǒng)能夠持續(xù)采集必要的人機交互數(shù)據(jù)。包含了可穿戴設(shè)備的人機交互體系,往往能夠充分感知用戶的狀態(tài)數(shù)據(jù)、意圖及周邊環(huán)境,并結(jié)合使用目的適時增強用戶對外部世界的感知能力。當前,可穿戴設(shè)備支持的人機交互經(jīng)過多年發(fā)展,已逐步拓展到民用娛樂、醫(yī)療和科研等領(lǐng)域。
在許多機器人的應用場景中,自動識別人類意圖并采取相應行動是評估機器人智能程度的重要指標,也是機器人為人類提供更大便利的基本要求,此類系統(tǒng)比單純接受語音指令并采取行動的機器人更為復雜,其智能程度也更高。意圖理解任務通常發(fā)生在動態(tài)的場景中,機器人需要充分感知動態(tài)態(tài)勢,理解并預測當前可能需要完成的任務,實現(xiàn)無人類介入條件下的高度人機協(xié)作。在這個過程當中,人處于核心地位,其表達出的意圖將決定機器人的行動。除了感知語言外,機器人主要通過分析人類行為采取相應的行動。
在識別人類行為的過程中,可選用的參數(shù)較多,常用的一種方法是在分析大量人類動作數(shù)據(jù)的基礎(chǔ)上,預測人體關(guān)節(jié)可能的位置,通過反復識別和預測的訓練過程,得到具有一定實用性的預測模型,為人機交互提供幫助。由于深度學習技術(shù)的蓬勃發(fā)展,當前人類行為識別任務當中研究的行為種類已達上千種。其中,基于LSTM深度神經(jīng)網(wǎng)絡進行分類,并引入視覺深度傳感器來分析人類運動過程中骨架運動數(shù)據(jù)的技術(shù)取得了較好的成效。但是,當前各類相關(guān)應用場景中,行為識別需要分析的數(shù)據(jù)量往往還較大,在實時處理短期數(shù)據(jù)方面還有待提升。另外,由于強化學習在掌握復雜操作技能方面的優(yōu)勢,采用強化學習的反復試錯訓練機器人的方式也被廣泛研究,在交互式機器人智能運動規(guī)劃中有著巨大的發(fā)展?jié)摿Α?/p>
由于集成電路技術(shù)、大數(shù)據(jù)技術(shù)和通信技術(shù)領(lǐng)域的顯著突破,人工智能技術(shù)在近年來呈現(xiàn)出爆發(fā)式發(fā)展的趨勢,無論從算法層面還是硬件設(shè)計層面都取得了豐碩的成果。機器人是人工智能應用的典型領(lǐng)域,也因而發(fā)生了翻天覆地的變化。智能感知技術(shù)、智能導航與規(guī)劃技術(shù)、智能控制與操作以及智能交互等領(lǐng)域取得的進展深刻影響著當今人類的生產(chǎn)生活,在算法研究、神經(jīng)網(wǎng)絡訓練和新應用領(lǐng)域開發(fā)等方面,機器人技術(shù)都有著巨大的研究潛力和良好的發(fā)展前景。