王薪宇
摘要:工業(yè)機(jī)器人發(fā)展的趨勢(shì)是人工智能化,深度學(xué)習(xí)和云機(jī)器人是智能機(jī)器人領(lǐng)域的前沿技術(shù),是近幾年社會(huì)各界的關(guān)注熱點(diǎn)。本文介紹了深度學(xué)習(xí)的主要思想、發(fā)展歷程和主要應(yīng)用;簡(jiǎn)述了云機(jī)器人的概念、關(guān)鍵技術(shù)及其突出的優(yōu)勢(shì);最后分析指出深度學(xué)習(xí)構(gòu)建的神經(jīng)網(wǎng)絡(luò)是驅(qū)動(dòng)工業(yè)機(jī)器人的“引擎”,而云機(jī)器人則為工業(yè)機(jī)器人提供大量的“燃料”,二者的相互結(jié)合與促進(jìn),必將引領(lǐng)一場(chǎng)工業(yè)機(jī)器人走向人工智能化的變革。
關(guān)鍵詞:工業(yè)機(jī)器人;深度學(xué)習(xí);云機(jī)器人;人工智能化
中圖分類號(hào):TP24 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2016)04(a)-0000-00
0 前言
工業(yè)機(jī)器人是集機(jī)械、電子、控制、計(jì)算機(jī)、傳感器、人工智能等多學(xué)科先進(jìn)技術(shù)于一體的現(xiàn)代制造業(yè)重要的自動(dòng)化裝備[1]。自從1959年UNIMATION公司的第一臺(tái)工業(yè)機(jī)器人在美國(guó)誕生后,機(jī)器人技術(shù)及其產(chǎn)品發(fā)展很快,對(duì)世界制造業(yè)的格局產(chǎn)生了重大的影響。如今,工業(yè)機(jī)器人成為智能制造技術(shù)浪潮的關(guān)鍵,是世界制造大國(guó)爭(zhēng)先搶占的第三次工業(yè)革命的制高點(diǎn)。
在工業(yè)機(jī)器人不斷朝著人工智能化發(fā)展的進(jìn)程中,深度學(xué)習(xí)(Deep Learning)和云機(jī)器人(Cloud Robotics)都是近年來機(jī)器人領(lǐng)域最前沿先進(jìn)的技術(shù),它們將會(huì)是工業(yè)機(jī)器人向智能化進(jìn)化的下一個(gè)跨越。隨著世界圍棋冠軍李世石輸給了谷歌旗下人工智能公司DeepMind開發(fā)的“阿爾法圍棋”(AlphaGo),被譽(yù)為人類智慧最后堡壘的圍棋也終于被人工智能所攻克,而使AlphaGo獲勝的“功臣”——深度學(xué)習(xí),也證明了它在機(jī)器人大腦中發(fā)揮的驚人作用。2010年,Google的機(jī)器人科學(xué)家兼卡內(nèi)基梅隆大學(xué)機(jī)器人研究所教授詹姆斯·庫(kù)夫納(James Kuffner)在由電氣和電子工程師協(xié)會(huì)(IEEE)主辦的Humanoids機(jī)器人大會(huì)上提出云機(jī)器人概念[2],國(guó)內(nèi)外反響強(qiáng)烈,不少專家認(rèn)為云機(jī)器人將徹底改變機(jī)器人的發(fā)展進(jìn)程。如果將深度學(xué)習(xí)與云機(jī)器人相結(jié)合,成千上百個(gè)工業(yè)機(jī)器人并行工作然后分享它們學(xué)習(xí)到的信息,相互促進(jìn)學(xué)習(xí),如此必將帶來的極高的學(xué)習(xí)效率和提升極快的加工準(zhǔn)確度,并且還省略了繁瑣的編程。我們不妨假設(shè)一下未來工廠的可能出現(xiàn)一幕:設(shè)計(jì)部的設(shè)計(jì)師下班前把新設(shè)計(jì)好的樣品交給生產(chǎn)線上的工業(yè)機(jī)器人,“聰明”的工業(yè)機(jī)器人將用整個(gè)晚上想出如何完成設(shè)計(jì)師的任務(wù),在學(xué)習(xí)強(qiáng)化的過程中不斷更正自己的錯(cuò)誤,不斷提高加工精度,同時(shí),整個(gè)生產(chǎn)線上的工業(yè)機(jī)器人分享著這些信息,第二天設(shè)計(jì)師上班時(shí)發(fā)現(xiàn)生產(chǎn)線已完成了成品的生產(chǎn)。由此看來,深度學(xué)習(xí)和云機(jī)器人的不斷深入研究,將最有可能重塑機(jī)器人在未來幾年被應(yīng)用的方式,工業(yè)機(jī)器人走向未來的進(jìn)化之光,近在眼前。
1 深度學(xué)習(xí)簡(jiǎn)述
1.1 深度學(xué)習(xí)的主要思想
深度學(xué)習(xí)的主要思想類似于人的神經(jīng)網(wǎng)絡(luò)。人的視覺系統(tǒng)對(duì)信息的處理是分級(jí)的,從低層的神經(jīng)細(xì)胞提取出邊緣特征,然后向高層的神經(jīng)細(xì)胞不斷迭代和抽象,也就是說高層的特征是低層特征的組合。對(duì)于深度學(xué)習(xí),首先是要堆疊多個(gè)層,信息被分配在這些獨(dú)立而又相互聯(lián)系的層中,簡(jiǎn)單的說,上一層的輸出作為下一層的輸入,每個(gè)處于后方的層級(jí)根據(jù)前一層傳來的信息行使更加復(fù)雜的功能。深度學(xué)習(xí)的實(shí)質(zhì),是通過構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性[3]。舉個(gè)例子,看著一幅圖片上的狗,深度學(xué)習(xí)網(wǎng)絡(luò)首先需要把照片里的狗按邊緣分解成深色和淺色兩區(qū)域,然后把這個(gè)信息傳遞到下一個(gè)層級(jí)進(jìn)行處理,下一層級(jí)再將這些信息逐步細(xì)化。當(dāng)?shù)竭_(dá)最后一層時(shí),系統(tǒng)能提供一個(gè)數(shù)學(xué)函數(shù)來回答這個(gè)問題:“這到底是不是一條狗[4]? ”
1.2 機(jī)器人學(xué)習(xí)的兩次浪潮
20世紀(jì)80年代末期,人們利用人工神經(jīng)網(wǎng)絡(luò)的反向傳播算法(BP算法)可以讓一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型從大量訓(xùn)練樣本中學(xué)習(xí)出統(tǒng)計(jì)規(guī)律,從而對(duì)未知事件做預(yù)測(cè),開啟了機(jī)器淺層學(xué)習(xí)的浪潮。2006年,機(jī)器學(xué)習(xí)領(lǐng)域的泰斗Geoffrey Hinton和他的學(xué)生RuslanSalakhutdinov在《科學(xué)》上發(fā)表了一篇文章,提出了深度學(xué)習(xí)的概念,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,掀開了機(jī)器學(xué)習(xí)的第二次浪潮。深度學(xué)習(xí)比淺學(xué)習(xí)具有更強(qiáng)的表示能力,隨著大數(shù)據(jù)的時(shí)代來臨,深度模型更能刻畫大量數(shù)據(jù)里豐富的信息,從而對(duì)未知事件作出更精準(zhǔn)的預(yù)測(cè)。
1.3 深度學(xué)習(xí)的主要應(yīng)用
1.3.1 語音識(shí)別
2011年微軟基于深度神經(jīng)網(wǎng)絡(luò)(deep neural networks)的語音識(shí)別研究取得成果,徹底改變了語音識(shí)別原有的技術(shù)框架[5]。相比于傳統(tǒng)的語音識(shí)別系統(tǒng),采用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行聲音建模的語音識(shí)別系統(tǒng)相對(duì)誤識(shí)別率能降低25%,并且深度神經(jīng)網(wǎng)路的建模技術(shù)可與傳統(tǒng)的語音識(shí)別技術(shù)無縫結(jié)合,不浪費(fèi)任何系統(tǒng)額外耗費(fèi)就可大幅度地提升語音識(shí)別系統(tǒng)的識(shí)別率。
1.3.2 圖像識(shí)別
隨著計(jì)算機(jī)計(jì)算速度和儲(chǔ)存量的大幅度提升,2012年,Hinton和他的兩個(gè)學(xué)生采用卷積神經(jīng)網(wǎng)絡(luò)(convolution neural networks)在圖像識(shí)別領(lǐng)域取得了突破性的進(jìn)展,在2013年,深度學(xué)習(xí)模型被成功應(yīng)用于一般圖片的識(shí)別和理解。深度學(xué)習(xí)大大提升了圖像識(shí)別的準(zhǔn)確性和識(shí)別效率,可以很有把握地說,從現(xiàn)在開始,深度學(xué)習(xí)將取代人工特征+機(jī)器學(xué)習(xí)的方法而逐漸成為主流圖像識(shí)別方法[3]。
2 云機(jī)器人簡(jiǎn)述
2.1 云機(jī)器人的概念及關(guān)鍵技術(shù)
云機(jī)器人,據(jù)它的提出者Kuffner所述,指將信息資料儲(chǔ)存在云端的服務(wù)器上,并讓機(jī)器人在必要時(shí)通過聯(lián)網(wǎng)的方式從云端獲得這些資料。云機(jī)器人把云計(jì)算和機(jī)器人學(xué)相結(jié)合,使得機(jī)器人可以利用云服務(wù)器的計(jì)算資源來提高機(jī)器人的能力,并實(shí)現(xiàn)機(jī)器人之間的知識(shí)信息共享。構(gòu)成云機(jī)器系統(tǒng),需要五個(gè)關(guān)鍵性技術(shù)[6]。一,大數(shù)據(jù)(Big Data):建立一個(gè)提供索引圖片、地圖和對(duì)象數(shù)據(jù)的全球性數(shù)據(jù)庫(kù);二,云計(jì)算( Cloud Computing):針對(duì)統(tǒng)計(jì)學(xué)習(xí)和運(yùn)動(dòng)規(guī)劃需求的網(wǎng)格計(jì)算;三,開源(Open-Source):可共享的機(jī)器人代碼、數(shù)據(jù)、算法和硬件設(shè)計(jì);四,協(xié)作學(xué)習(xí)(Collective Learning):機(jī)器人共享軌跡、控制策略和可供統(tǒng)計(jì) 機(jī)器學(xué)習(xí)方法分析的輸出;五,眾包(Crowdsourcing):用于評(píng)價(jià)、學(xué)習(xí)和錯(cuò)誤恢復(fù)的離線與按需指導(dǎo)。
2.2 云機(jī)器人的優(yōu)勢(shì)和存在問題
云機(jī)器人不僅具備傳統(tǒng)機(jī)器人的功能,而且還有一些巨大的優(yōu)勢(shì):1)結(jié)構(gòu)簡(jiǎn)單,云機(jī)器人可以卸下復(fù)雜的計(jì)算任務(wù)到云端,同時(shí)可以接收海量的數(shù)據(jù),因而有著超強(qiáng)的計(jì)算和儲(chǔ)存的能力;2)機(jī)器人可以實(shí)現(xiàn)信息和資源共享,學(xué)習(xí)能力更強(qiáng),并減少了開發(fā)人員的重復(fù)工作時(shí)間;3) 能夠提供全球范圍的信息和知識(shí)庫(kù),還能共享開源代碼。由于具有這些優(yōu)勢(shì),云機(jī)器人在智能交通、環(huán)境監(jiān)測(cè)、衛(wèi)生保健、智能家居、娛樂、教育和國(guó)防等應(yīng)用領(lǐng)域中具有廣泛的應(yīng)用前景和很高的商業(yè)價(jià)值。 當(dāng)然,云機(jī)器人技術(shù)作為一種全新的技術(shù),還有很多問題需要進(jìn)一步的研究與探索,如資源分配、系統(tǒng)安全、可靠有效的通信協(xié)議等都是下一步研究中需要關(guān)注的問題[7]。
3 深度學(xué)習(xí)與云機(jī)器人的結(jié)合
人工智能,是工業(yè)機(jī)器人發(fā)展的必然趨勢(shì),在社會(huì)數(shù)字化的時(shí)代,是什么給人工智能帶來了前所未有的機(jī)遇?深度學(xué)習(xí),刮起人工智能的一場(chǎng)風(fēng)暴,引領(lǐng)社會(huì)數(shù)字化時(shí)代的變革,它完全改變了機(jī)器人傳統(tǒng)的圖像和語音識(shí)別技術(shù),能夠讓機(jī)器人能夠自己理解描繪圖像或者語音中的信息,成為目前最強(qiáng)力的機(jī)器人視覺聽覺技術(shù)。如果我們把深度學(xué)習(xí)構(gòu)建的日益龐大的神經(jīng)網(wǎng)絡(luò)比作是工業(yè)機(jī)器人騰飛的引擎,那么一個(gè)完整的動(dòng)力系統(tǒng)還需要大量的燃料,這里的大量燃料顯然就是大量的數(shù)據(jù),而向工業(yè)機(jī)器人神經(jīng)網(wǎng)絡(luò)提供大量數(shù)據(jù)的就是云機(jī)器人,云機(jī)器人可以建立全球范圍的信息知識(shí)數(shù)據(jù)庫(kù),提供開源的代碼,算法和硬件設(shè)計(jì)。如果引擎很大,燃料卻很少,是無法驅(qū)動(dòng)的,而引擎很小,燃料很多,顯然也不行,深度學(xué)習(xí)和云機(jī)器人是相輔相成的,只有大量的數(shù)據(jù)才能支撐巨大的神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)和云機(jī)器人的相互結(jié)合和快速發(fā)展,必將實(shí)現(xiàn)人工智能的正循環(huán),創(chuàng)造出無與倫比的動(dòng)力,給工業(yè)機(jī)器人不可預(yù)知的能量。
在2015的國(guó)際機(jī)器人展上,法蘭克(Fanuc)在其展位上演示了散件分揀,事先并沒有向系統(tǒng)輸入工件易吸附部位的信息,只依靠由強(qiáng)化學(xué)習(xí)掌握的與環(huán)境的相互作用(試錯(cuò)法)進(jìn)行分揀。在完成1000份數(shù)據(jù)的學(xué)習(xí)后,機(jī)械手臂有時(shí)還會(huì)試圖吸附工件的側(cè)面等部位,成功率僅為60%,而完成5000份數(shù)據(jù)的學(xué)習(xí),也就是大約8個(gè)小時(shí)后,成功率則提高到了90%,這樣的準(zhǔn)確度已經(jīng)相當(dāng)于一位專家親自為它編寫程序所達(dá)到的效果。很明顯,法蘭克的機(jī)器人使用了深度學(xué)習(xí)技術(shù)來訓(xùn)練自己,它每次分揀散件的過程,法蘭克機(jī)器人配置的3D攝像頭自動(dòng)進(jìn)行抓取,不管它的是成功還是失敗,它都能記住散件的特征,通過每次分揀過程學(xué)到的知識(shí)改進(jìn)控制它行動(dòng)的深度學(xué)習(xí)模型或大型神經(jīng)網(wǎng)絡(luò)。法蘭克機(jī)器人由Preferred Networks(法蘭克的注資企業(yè))編寫程序,Preferred Networks的首席研究官Shohei Hido說:“這種學(xué)習(xí)方式(深度學(xué)習(xí))潛在的一個(gè)巨大好處是,如果幾個(gè)機(jī)器人并行工作然后分享他們學(xué)到的,就可以促進(jìn)學(xué)習(xí)。所以,八個(gè)機(jī)器人一起工作一小時(shí)可以執(zhí)行與一臺(tái)機(jī)器工作八小時(shí)時(shí)相同的學(xué)習(xí)任務(wù),我們的計(jì)劃是面向分散式學(xué)習(xí)(云機(jī)器人)的,你可以想象成百上千個(gè)機(jī)器人分享信息?!?/p>
從上述例子中可以看見,法蘭克公司已經(jīng)將深度學(xué)習(xí)和云機(jī)器人結(jié)合到了一起,并且設(shè)計(jì)出能完成一些學(xué)習(xí)任務(wù)的工業(yè)機(jī)器人,事實(shí)上,Google公司正在將這一步推向更遠(yuǎn),他們?cè)噲D讓機(jī)器人能夠抓取特定形狀的物品,而非特定物品,盡管實(shí)現(xiàn)這些技術(shù)可能還是充滿了挑戰(zhàn),但我們不得不說,隨著深度學(xué)習(xí)和云機(jī)器人的不斷突破,工業(yè)機(jī)器的變革風(fēng)暴正在醞釀。
4 結(jié)論
深度學(xué)習(xí)和云機(jī)器人自問世以來,就成為學(xué)術(shù)界、科技界和產(chǎn)業(yè)界的研究熱點(diǎn),雖然二者都還處于起步階段,但是它們的巨大的潛力給工業(yè)機(jī)器人的發(fā)展帶來了極大的機(jī)遇。深度學(xué)習(xí)使工業(yè)機(jī)器人在語音圖像的智能識(shí)別和理解上取得革命性的進(jìn)展,它所構(gòu)建的神經(jīng)網(wǎng)絡(luò)是驅(qū)動(dòng)工業(yè)機(jī)器人的超強(qiáng)“引擎”,而云機(jī)器人所建立的開源信息知識(shí)數(shù)據(jù)庫(kù)則是推動(dòng)工業(yè)機(jī)器人源源不斷的“燃料”,深度學(xué)習(xí)和云機(jī)器人的相互促進(jìn),會(huì)加速推進(jìn)工業(yè)4.0時(shí)代的來臨,未來工業(yè)機(jī)器人被應(yīng)用的方式將徹底改變,高度智能化的工業(yè)機(jī)器人必然出現(xiàn),智能生產(chǎn)模式下的無人工廠會(huì)成為生產(chǎn)制造業(yè)的主流。深度學(xué)習(xí)+云機(jī)器人,必將實(shí)現(xiàn)工業(yè)機(jī)器人向人工智能化推進(jìn)的一次巨大飛躍。
參考文獻(xiàn):
[1] 徐方. 工業(yè)機(jī)器人產(chǎn)業(yè)現(xiàn)狀與發(fā)展[J]. 機(jī)器人技術(shù)與應(yīng)用, 2007(5):2-4.
[2] KUFFNER J, LAVALLE S. Space-filling trees:a new perspective on incremental search for motion planning[C]//Proceedings of IEEE International Conference on Intelligent Robots and Systems. San Francisco, USA:the IEEE Press, 2011:2199-2206.
[3] 余凱, 賈磊, 陳雨強(qiáng), 等. 深度學(xué)習(xí)的昨天、今天和明天[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(9):1799-1804.
[4] 章琪. 幫機(jī)器人看到重點(diǎn)——“深度學(xué)習(xí)”能夠轉(zhuǎn)化機(jī)器人的視覺[J]. 世界科學(xué), 2015(1):54-56.
[5] Dahl G, Yu Dong, Deng Li, et al. Context-dependent pretrained deep neural networks for large vocabulary speech recognition[J]. IEEE Trans on Audio, Speech, and Language Processing. 2012, 20(1):30-42.
[6] 王鴻鵬. 云機(jī)器人的關(guān)鍵性技術(shù)[J]. 中國(guó)信息界-e制造, 2014(10):32-34.
[7] 張恒, 劉艷麗, 劉大勇. 云機(jī)器人的研究進(jìn)展[J]. 計(jì)算機(jī)應(yīng)用研究, 2014, 31(9):2567-2575.