許樹(shù)杰 詹宇嫻 凌活龍 陳耿 劉常燁 丁凡 陳景華
摘 要:隨著老年人口比重的不斷升高,中國(guó)的人口老年化現(xiàn)象日益突出,如何利用科學(xué)的方法和先進(jìn)的技術(shù)對(duì)這一現(xiàn)象進(jìn)行改善顯得尤其重要。文中提出基于物聯(lián)網(wǎng)、機(jī)器視覺(jué)、機(jī)器學(xué)習(xí)等技術(shù)的智能家庭機(jī)器人設(shè)計(jì)方案,以樹(shù)莓派作為機(jī)器人處理核心、STM32單片機(jī)輔助操控硬件模塊,利用物聯(lián)網(wǎng)技術(shù)、OpenCV機(jī)器視覺(jué)技術(shù)、智能語(yǔ)音交互、機(jī)器學(xué)習(xí)等來(lái)實(shí)現(xiàn)老人身體健康狀況的智能監(jiān)測(cè)和分析、家電的智能控制、室內(nèi)監(jiān)控,家人通信等功能。智能家庭機(jī)器人作為一種服務(wù)型人工智能產(chǎn)品,極大地節(jié)省了年輕人的時(shí)間與精力,高度符合市場(chǎng)的需求和時(shí)代的發(fā)展。
關(guān)鍵詞:物聯(lián)網(wǎng)技術(shù);OpenCV機(jī)器視覺(jué);語(yǔ)音交互;智能監(jiān)測(cè);STM32單片機(jī);導(dǎo)航
中圖分類(lèi)號(hào):TP242文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-1302(2020)10-00-02
0 引 言
根據(jù)國(guó)家統(tǒng)計(jì)局2016年公布的數(shù)據(jù)顯示,我國(guó)60歲以上的老年人超過(guò)2.3億,且老年人口規(guī)模不斷擴(kuò)大。隨著人口年齡結(jié)構(gòu)急劇變化,人們的生活節(jié)奏越來(lái)越快,老年人往往不能得到周到的照料。為了順應(yīng)社會(huì)的轉(zhuǎn)變,充分考慮當(dāng)今的科技進(jìn)步和時(shí)代發(fā)展,本文設(shè)計(jì)一種基于物聯(lián)網(wǎng)的智能家庭機(jī)器人。智能家庭機(jī)器人作為一種服務(wù)型人工智能可以更好地解決養(yǎng)老問(wèn)題,讓老年人享受到更高品質(zhì)的生活的同時(shí),也大大減輕年輕人與社會(huì)的壓力。
1 系統(tǒng)總體結(jié)構(gòu)
本文系統(tǒng)總體結(jié)構(gòu)如圖1所示。
該系統(tǒng)的機(jī)器人集合各種模塊進(jìn)行設(shè)計(jì),以樹(shù)莓派為處理核心,搭載Linux系統(tǒng),以STM32芯片輔助連接各個(gè)模塊。機(jī)器人的底盤(pán)主要由兩個(gè)直流減速電機(jī)、激光雷達(dá)、SLAMWARE模塊、自動(dòng)充電模塊和超聲波模塊組成,中間部分安裝功放模塊、煙霧檢測(cè)模塊和鋰電池組,上部安裝麥克風(fēng)陣列板、語(yǔ)音增強(qiáng)核心板和樹(shù)莓派核心板,頭部搭載舵機(jī)云臺(tái)、攝像頭模塊、遙控模塊和心率檢測(cè)模塊。
2 系統(tǒng)硬件設(shè)計(jì)
2.1 數(shù)據(jù)處理與控制核心
設(shè)計(jì)采用樹(shù)莓派4B作為數(shù)據(jù)的處理核心,并加上STM32芯片及其他硬件模塊MCU的輔助完成各個(gè)硬件模塊的數(shù)據(jù)處理與控制。樹(shù)莓派4B型搭載了基于Cortex-A72架構(gòu)的64位四核處理器BCM2711,主頻可達(dá)1.5 GHz,性能強(qiáng)勁,并集成了雙頻WiFi模塊和Bluetooth 5.0模塊,可以非常便捷地連接互聯(lián)網(wǎng)及家中的智能設(shè)備,同時(shí)外接上EMMC存儲(chǔ)器進(jìn)一步提升其數(shù)據(jù)的讀寫(xiě)性能。在樹(shù)莓派上可以運(yùn)行多種Linux系統(tǒng)或Windows 10 IoT Core系統(tǒng),有圖形界面和眾多SDK的支持,可以更加簡(jiǎn)單快速的進(jìn)行開(kāi)發(fā),同時(shí)能夠簡(jiǎn)單高效的進(jìn)行程序線(xiàn)程的處理,系統(tǒng)的穩(wěn)定性也能得到保障。
2.2 語(yǔ)音交互模組
語(yǔ)音交互模組設(shè)計(jì)如圖2所示。語(yǔ)音交互模組包括:環(huán)形麥克風(fēng)陣列[1]模塊、語(yǔ)音增強(qiáng)[2]核心、功放模塊。
首先得明確該機(jī)器的的語(yǔ)音識(shí)別環(huán)境是在室內(nèi),相比手機(jī)上的近場(chǎng)語(yǔ)音交互,其環(huán)境更加苛刻,人的聲源位置是不斷變化的,還會(huì)有背景噪音、混響、回聲、多人聲混肴等多種干擾因素。面對(duì)這樣的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別[3]環(huán)境,語(yǔ)音前端的設(shè)備和算法的處理十分重要。設(shè)計(jì)采用“環(huán)形6+1”麥克風(fēng)陣列方案,配合語(yǔ)音增強(qiáng)模塊的算法可以有效增強(qiáng)遠(yuǎn)場(chǎng)拾音能力和抑噪能力。主流的麥克風(fēng)陣列拾音流程分為回聲抵消[4]、聲源定位[5]、波束形成[6]、去混響[7]、信號(hào)增益這幾個(gè)步驟,這些需要前端通過(guò)算法完成,而且需要不間斷地實(shí)時(shí)監(jiān)聽(tīng)運(yùn)算,顯然無(wú)法通過(guò)樹(shù)莓派來(lái)完成這些算法,而必須借助專(zhuān)用的語(yǔ)音處理單元。如今,市面上如百度、科大訊飛等公司都推出了功能完善的麥克風(fēng)陣列模塊和語(yǔ)音增強(qiáng)模塊,無(wú)需理解其復(fù)雜的算法便可以完成語(yǔ)音信號(hào)的前端處理。再通過(guò)樹(shù)莓派接入云端語(yǔ)音識(shí)別RestfulAPI和TTS語(yǔ)音引擎,完成語(yǔ)音的識(shí)別、自然語(yǔ)言理解、業(yè)務(wù)邏輯分析、語(yǔ)音合成和語(yǔ)音模型的訓(xùn)練。
2.3 自主定位導(dǎo)航部分
機(jī)器人的自主定位導(dǎo)航[8]包括:自主定位、自動(dòng)地圖建模和自主路徑規(guī)劃,還需要實(shí)時(shí)自動(dòng)避障,并在環(huán)境發(fā)生變化時(shí)重定位。
本設(shè)計(jì)采用SLAMTEC思嵐科技的自主定位導(dǎo)航套裝:RPLIDAR激光雷達(dá)加SLAMWARE自主定位導(dǎo)航核心。SLAMWARE核心集成了9自由度的IMU,內(nèi)置了SLAM算法[9]引擎、改良的D*算法[10],配合激光雷達(dá)可以自動(dòng)快速完成機(jī)器人的定位、建圖和路徑規(guī)劃。并且思嵐科技提供了SLAMWARESDK,可以在電腦上通過(guò)串口連接SLAMWARE核心方便地查看實(shí)時(shí)地圖、修改參數(shù)和命令等。SLAMWARE還提供了算法和API接口配合超聲波傳感器、防跌落傳感器,完成實(shí)時(shí)自動(dòng)避障和激光雷達(dá)測(cè)量受阻時(shí)的重定位。SLAMWARE還提供了“自動(dòng)回巢”的算法,以實(shí)現(xiàn)機(jī)器人的自動(dòng)回充[11]。
2.4 其他模塊
家電遙控模塊:由紅外遙控模塊和WiFi模塊組成。
心率檢測(cè)模塊:使用MAX30102心率血氧檢測(cè)模塊。
攝像頭模塊:考慮到攝像頭需要完成室內(nèi)監(jiān)控、視頻通話(huà)、人臉識(shí)別、物品識(shí)別等功能,攝像頭模塊采用無(wú)畸變、可夜視的高清攝像頭,同時(shí)加裝由兩個(gè)微型舵機(jī)組成的自動(dòng)云臺(tái)來(lái)自動(dòng)調(diào)整攝像的視角。
煙霧檢測(cè)模塊:由MQ-2,MQ-5,ME3-CO和ME3-H2S等多個(gè)不同的煙霧檢測(cè)傳感器組成,主要檢測(cè)室內(nèi)氣體的天然氣、液化氣、甲烷、一氧化碳、硫化氫等氣體的濃度。
3 系統(tǒng)軟件設(shè)計(jì)
機(jī)器人的軟件系統(tǒng)由樹(shù)莓派、語(yǔ)音增強(qiáng)核心、SLAMWARE核心和云端服務(wù)器4部分進(jìn)行分模塊的處理。樹(shù)莓派作為主系統(tǒng)負(fù)責(zé)其他模塊的連接調(diào)用、進(jìn)程的調(diào)配、本地語(yǔ)音識(shí)別、云端的數(shù)據(jù)交互等任務(wù)。語(yǔ)音增強(qiáng)核心負(fù)責(zé)語(yǔ)音識(shí)別的前端聲音處理,SLAMWARE負(fù)責(zé)機(jī)器人的自主定位導(dǎo)航功能,云端服務(wù)器負(fù)責(zé)語(yǔ)音、語(yǔ)義的識(shí)別,做出對(duì)應(yīng)的執(zhí)行邏輯處理,合成應(yīng)答語(yǔ)音,并返回命令和語(yǔ)音數(shù)據(jù)給機(jī)器人終端。其流程圖如圖3所示。
4 結(jié) 語(yǔ)
本文設(shè)計(jì)了一種以語(yǔ)音為核心交互方式,集成多種智能服務(wù)的家庭養(yǎng)老監(jiān)護(hù)機(jī)器人。以機(jī)器人作為智能中樞,借助簡(jiǎn)單的語(yǔ)音交互,使老人能夠簡(jiǎn)便地使用眾多的智能家電,給千萬(wàn)家庭帶來(lái)生活質(zhì)量的提升。
參考文獻(xiàn)
[1]支艷利,張?jiān)苽?基于環(huán)形麥克風(fēng)陣列的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別系統(tǒng)[J].微型電腦應(yīng)用,2017,33(4):62-64.
[2]王義圓,張曦文,周貽能,等.基于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)與干擾抑制算法[J].電聲技術(shù),2018,42(2):1-5.
[3]支艷利,張?jiān)苽?基于環(huán)形麥克風(fēng)陣列的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別系統(tǒng)[J].微型電腦應(yīng)用,2017,33(4):62-64.
[4]黃翔. 基于麥克風(fēng)陣列的回聲抵消系統(tǒng)研究[D].武漢:湖北工業(yè)大學(xué),2018.
[5]汪家冬. 面向智能機(jī)器人應(yīng)用的聲源定位系統(tǒng)研究[D].廣州:廣州大學(xué),2018.
[6]魏序,趙平,譚晶晶.基于波束形成與多參考源噪聲對(duì)消的語(yǔ)音增強(qiáng)算法[J].計(jì)算機(jī)與現(xiàn)代化,2011,26(12):45-47.
[7]孫博. 語(yǔ)音信號(hào)去混響研究[D].沈陽(yáng):沈陽(yáng)理工大學(xué),2018.
[8]王鵬. 導(dǎo)航機(jī)器人的地圖構(gòu)建和定位研究[D].天津:天津工業(yè)大學(xué),2018.
[9]高文研,平雪良,貝旭穎,等.兩種基于激光雷達(dá)的SLAM算法最優(yōu)參數(shù)分析[J].傳感器與微系統(tǒng),2018,37(4):28-30.
[10]張希聞,肖本賢.改進(jìn)D*算法的移動(dòng)機(jī)器人路徑規(guī)劃[J].傳感器與微系統(tǒng),2018,37(12):52-54.
[11]肖奇軍,鄭健聰,陳斯鵬,等.一種基于地圖構(gòu)建與角度傳感器的掃地機(jī)器人自動(dòng)回充方法[J].機(jī)械與電子,2019,37(2):78-80.
物聯(lián)網(wǎng)技術(shù)2020年10期