劉旋+應(yīng)忠翔+喬啟鳴+莫園生+胡洪波
摘 要:語(yǔ)音服務(wù)機(jī)器人由微型控制器和機(jī)器人機(jī)械框架組成,通過QQ物聯(lián)平臺(tái)與QQ進(jìn)行社交關(guān)聯(lián),可與好友進(jìn)行視頻通話、語(yǔ)音聊天等,還可在QQ平臺(tái)上進(jìn)行遠(yuǎn)程控制。使用語(yǔ)音識(shí)別芯片與技術(shù)來(lái)讀取人的語(yǔ)音信息,控制機(jī)器人進(jìn)行相關(guān)動(dòng)作。機(jī)器人具有環(huán)境監(jiān)控功能,通過溫濕度、光照等傳感器來(lái)監(jiān)測(cè)室內(nèi)環(huán)境,如有異常則可語(yǔ)音提示主人。
關(guān)鍵詞:服務(wù)機(jī)器人;語(yǔ)音;QQ物聯(lián);物聯(lián)網(wǎng)
中圖分類號(hào):TP242.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2017)06-0-04
0 引 言
2012年4月,中國(guó)科技部正式印發(fā)了《服務(wù)機(jī)器人科技發(fā)展“十三五”專項(xiàng)規(guī)劃》[1],中國(guó)產(chǎn)業(yè)調(diào)研網(wǎng)發(fā)布的2015-2020年中國(guó)服務(wù)機(jī)器人市場(chǎng)深度調(diào)查分析及發(fā)展趨勢(shì)研究報(bào)告認(rèn)為,縱觀國(guó)內(nèi)外服務(wù)機(jī)器人的發(fā)展,預(yù)測(cè)服務(wù)機(jī)器人在我國(guó)具有廣闊的市場(chǎng)空間。隨著城市化進(jìn)程加速、人口老齡化和人口素質(zhì)的提高,服務(wù)機(jī)器人的商業(yè)應(yīng)用將會(huì)加速發(fā)展。
語(yǔ)言是人們傳遞信息的重要方法,隨著人工智能的發(fā)展,社會(huì)對(duì)智能化的要求越來(lái)越高,智能機(jī)器人的應(yīng)用范圍越來(lái)越廣,通過語(yǔ)音來(lái)控制機(jī)器人可以大幅提高工作效率。2014年10月,“QQ物聯(lián)智能硬件開放平臺(tái)”發(fā)布,開發(fā)者可以充分利用和發(fā)揮騰訊QQ的億萬(wàn)手機(jī)客戶端及云服務(wù)的優(yōu)勢(shì)。結(jié)合目前機(jī)器人發(fā)展的方向,本文提出了基于QQ物聯(lián)的智能語(yǔ)音服務(wù)機(jī)器人系統(tǒng)設(shè)計(jì)方法。
1 系統(tǒng)功能分析與總體設(shè)計(jì)
1.1 系統(tǒng)功能分析
基于QQ物聯(lián)的語(yǔ)音服務(wù)機(jī)器人針對(duì)家庭生活場(chǎng)景主要實(shí)現(xiàn)以下功能:
(1)QQ物聯(lián):將QQ賬號(hào)體系及關(guān)系鏈、QQ消息通道能力等核心能力與機(jī)器人合作,實(shí)現(xiàn)用戶與機(jī)器人之間的互聯(lián)互通互動(dòng),充分利用和發(fā)揮騰訊QQ億萬(wàn)手機(jī)客戶端及云服務(wù)的優(yōu)勢(shì);
(2)無(wú)線充電:機(jī)器人自動(dòng)檢測(cè)自身電量,當(dāng)電量低于預(yù)設(shè)值時(shí),采用無(wú)線充電方式充電;
(3)消息處理:自動(dòng)連接手機(jī)藍(lán)牙,語(yǔ)音處理電話等消息。
(4)環(huán)境監(jiān)控:機(jī)器人自動(dòng)檢測(cè)房間溫度、濕度、光照強(qiáng)度等,當(dāng)環(huán)境參數(shù)不在預(yù)設(shè)值范圍內(nèi)時(shí),進(jìn)行語(yǔ)音提醒[1];
(5)智能安防:當(dāng)檢測(cè)到用戶離開房間后,自動(dòng)切換到安防模式,用戶可通過攝像頭查看室內(nèi)狀況,出現(xiàn)突發(fā)情況時(shí)自動(dòng)聯(lián)系用戶;
(6)語(yǔ)音交互:可與用戶實(shí)現(xiàn)簡(jiǎn)單的人機(jī)交互[2];
(7)娛樂放松:用戶可通過語(yǔ)音交互播放音樂或簡(jiǎn)單笑話等。
1.2 系統(tǒng)總體設(shè)計(jì)框架
根據(jù)系統(tǒng)功能要求,設(shè)計(jì)本系統(tǒng)的總體框圖如圖1所示。系統(tǒng)包括主控制器模塊和外圍功能模塊,外圍部分包括環(huán)境監(jiān)測(cè)模塊,攝像頭模塊,語(yǔ)音識(shí)別模塊,無(wú)線充電模塊,通訊模塊,移動(dòng)設(shè)防系統(tǒng),視頻與音頻處理模塊和小車模塊。環(huán)境監(jiān)測(cè)部分主要通過一些傳感器檢查環(huán)境參數(shù),并不斷返回控制器,控制器可針對(duì)這些數(shù)據(jù)做出綜合調(diào)節(jié)。攝像頭模塊負(fù)責(zé)視頻通話與安防。語(yǔ)音識(shí)別模塊可識(shí)別出人們的一些語(yǔ)言信息,通過識(shí)別這些信息來(lái)判斷人們的指令,從而更好、更人性化的為人們服務(wù)。無(wú)線充電模塊主要維持機(jī)器人和小車的正常用電與供電,保證小車和機(jī)器人正常工作。通訊模塊的主要功能包括語(yǔ)音外放,語(yǔ)音對(duì)講,語(yǔ)音提醒等。無(wú)人在家時(shí),如有特殊情況發(fā)生移動(dòng)設(shè)防系統(tǒng)可自動(dòng)向主人發(fā)送信息。
2 硬件模塊選型與設(shè)計(jì)
2.1 主控制器
本系統(tǒng)的主控制器選用ST公司生產(chǎn)的STM32F103系列芯片。該芯片基于ARM Cortex-M3 32位的RISC內(nèi)核,工作頻率最高可達(dá)72 MHz,且內(nèi)置高速存儲(chǔ)器(64 KB的閃存和20 KB的SRAM),豐富的增強(qiáng)I/O端口和聯(lián)接到兩條APB總線的外設(shè)。STM32系列提供了全新的32位產(chǎn)品選項(xiàng),結(jié)合高性能、實(shí)時(shí)、低功耗、低電壓等特性,保持高集成度和易開發(fā)的優(yōu)勢(shì),將32位MCU的性能和功效引向一個(gè)新的級(jí)別[3]。
2.2 QQ物聯(lián)模塊
QQ物聯(lián)通過QQ賬號(hào)體系及相關(guān)的關(guān)系鏈來(lái)實(shí)現(xiàn)用戶與設(shè)備之間的相互連通,充分發(fā)揮QQ手機(jī)客戶端和云服務(wù)的優(yōu)勢(shì)[4]。本設(shè)計(jì)采用了QQ物聯(lián)攝像頭模塊,可通過QQ與攝像頭進(jìn)行交互。具有如下功能:
(1)遠(yuǎn)程監(jiān)控:直接打開手機(jī)QQ便可隨時(shí)隨地遠(yuǎn)程查看攝像頭內(nèi)的視頻。
(2)支持分享設(shè)備:將自己錄制好的精彩視頻或照片分享至QQ好友,實(shí)現(xiàn)與好友的互動(dòng)。
(3)移動(dòng)偵測(cè)報(bào)警:家中無(wú)人時(shí)啟動(dòng)設(shè)防功能。如果視頻監(jiān)控畫面中出現(xiàn)了移動(dòng)物體或人體時(shí),將會(huì)截圖發(fā)送至手機(jī),同時(shí)也會(huì)將截圖自動(dòng)保存在TF卡上。
(4)語(yǔ)音對(duì)講:利用QQ實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音對(duì)講,使得好友之間的關(guān)系更加親密。
2.3 藍(lán)牙音響模塊
藍(lán)牙技術(shù)是一種短距離通信技術(shù),頻率為全球共有頻段2.4 GHz[5],可使不同的設(shè)備無(wú)縫共享資源。它采用短距離無(wú)線連接,無(wú)需專用電纜,使移動(dòng)用戶不僅擺脫了線纜的束縛,還易于在室內(nèi)或室外流動(dòng)操作。
2.4 語(yǔ)音識(shí)別模塊
本系統(tǒng)采用ICRoute公司生產(chǎn)的LD3320語(yǔ)音控制芯片來(lái)實(shí)現(xiàn)簡(jiǎn)單的語(yǔ)音識(shí)別[6]。LD3320的電路原理圖如圖2所示。
2.5 無(wú)線充電模塊
本系統(tǒng)采用原理為電磁感應(yīng)的無(wú)線充電模塊[7],使機(jī)器人在自身電量不足時(shí)能夠進(jìn)行無(wú)線充電,簡(jiǎn)化充電過程。
2.6 語(yǔ)音輸出模塊
本系統(tǒng)使用LMD102語(yǔ)音模塊。該模塊價(jià)格低廉,穩(wěn)定可靠,支持多路語(yǔ)音,還可通過單片機(jī)串口控制。電路原理圖如圖3所示。
2.7 環(huán)境傳感器模塊
環(huán)境參數(shù)主要為測(cè)量溫度,濕度和光照等信息。本設(shè)計(jì)為了能夠更加準(zhǔn)確地采集光照及溫濕度信息,使用BH1750傳感器來(lái)獲取光照強(qiáng)度[8],利用DHT11采集溫濕度。
3 系統(tǒng)軟件設(shè)計(jì)及實(shí)現(xiàn)
3.1 系統(tǒng)初始化
系統(tǒng)初始化主要完成堆棧、定時(shí)器、串口等的設(shè)置。然后根據(jù)需求調(diào)用相應(yīng)的功能,如獲取環(huán)境參數(shù)等。語(yǔ)音芯片識(shí)別這些語(yǔ)句后,經(jīng)各模塊獲取相應(yīng)內(nèi)容,再通過語(yǔ)音反饋給用戶。本系統(tǒng)還聯(lián)合QQ物聯(lián),通過QQ控制攝像頭,實(shí)現(xiàn)視頻通話與語(yǔ)音對(duì)講。軟件流程如圖4所示。
3.2 LD3320語(yǔ)音程序設(shè)計(jì)
語(yǔ)音識(shí)別軟件流程圖如圖5所示。首先對(duì)該模塊進(jìn)行初始化,對(duì)語(yǔ)音編碼進(jìn)行預(yù)處理,然后提取相應(yīng)的特征,進(jìn)行矢量的量化,最后針對(duì)語(yǔ)音的輸入匹配特征,輸出對(duì)應(yīng)的語(yǔ)音結(jié)果。在程序設(shè)計(jì)中,通過改善算法[9]提高了識(shí)別準(zhǔn)確率。
3.3 環(huán)境監(jiān)測(cè)程序設(shè)計(jì)
首先光照傳感器需要對(duì)解析度和透光率進(jìn)行設(shè)置。解析度一般設(shè)置為2,傳感器返回的值為實(shí)際值乘以透光率。所以在代碼中需要經(jīng)過初始化,經(jīng)光亮度讀取和實(shí)際亮度計(jì)算得出準(zhǔn)確的光照值。光照傳感器程序流程圖如圖6所示。
溫濕度傳感器DHT11包括一個(gè)電阻式感濕元件和一個(gè)NTC測(cè)溫元件,只有4個(gè)引腳,控制其時(shí)鐘序列滿足要求后,即可取出數(shù)據(jù),DHT11對(duì)時(shí)鐘的要求非常嚴(yán)格。數(shù)據(jù)格式為:8 b濕度整數(shù)數(shù)據(jù)+8 b濕度小數(shù)數(shù)據(jù)+8 b溫度整數(shù)數(shù)據(jù)+8 b溫度小數(shù)數(shù)據(jù)+8 b校驗(yàn)和[10]。圖7所示為DHT11的程序流程圖。
3.4 語(yǔ)音播放程序設(shè)計(jì)
語(yǔ)音錄制播放模塊LMD102可以錄制多路聲音。由于此模塊具有USB接口功能,可以直接在特定軟件下合成聲音,無(wú)需人工錄制聲音,可以大大減輕工作量。本系統(tǒng)采用串口發(fā)送的方法將信息發(fā)送給芯片,由于每段語(yǔ)音都有特定的ID號(hào),因此只需發(fā)送對(duì)應(yīng)的ID號(hào)即可播放對(duì)應(yīng)的語(yǔ)音。發(fā)送格式為:引導(dǎo)碼+段號(hào)+結(jié)束碼。LMD102程序流程圖如圖8所示。
3.5 系統(tǒng)測(cè)試
服務(wù)機(jī)器人機(jī)械框架采用3D打印模式,設(shè)計(jì)實(shí)物如圖9所示。
系統(tǒng)采取分模塊測(cè)試方法:
(1)攝像頭及語(yǔ)音功能、移動(dòng)設(shè)防功能測(cè)試。當(dāng)有物體在攝像頭面前移動(dòng)時(shí),會(huì)有QQ提醒消息,移動(dòng)設(shè)防功能正常。
(2)藍(lán)牙音箱功能測(cè)試。打開手機(jī)藍(lán)牙連接至藍(lán)牙音箱,此時(shí)會(huì)有語(yǔ)音提示,藍(lán)牙連接。打開手機(jī)音樂,發(fā)現(xiàn)藍(lán)牙音箱能夠播放手機(jī)音樂,該藍(lán)牙音箱測(cè)試正常。
(3)環(huán)境參數(shù)測(cè)量。為了能夠直觀顯示測(cè)試結(jié)果,將測(cè)試結(jié)果輸出至屏幕。
(4)語(yǔ)音播放模塊測(cè)試。通過外部調(diào)節(jié)使環(huán)境的溫濕度、光照發(fā)生變化,此時(shí)服務(wù)機(jī)器人會(huì)發(fā)出語(yǔ)音環(huán)境異常信息的提示。
對(duì)各模塊進(jìn)行綜合測(cè)試,發(fā)現(xiàn)本系統(tǒng)工作正常。
4 結(jié) 語(yǔ)
本文完成了針對(duì)家庭生活的基于QQ物聯(lián)的服務(wù)機(jī)器人系統(tǒng)設(shè)計(jì)。該系統(tǒng)具有以下優(yōu)點(diǎn):
(1)自動(dòng)無(wú)線充電:解決機(jī)器人手動(dòng)充電的問題,方便機(jī)器人長(zhǎng)時(shí)間工作;
(2)應(yīng)用范圍廣:本項(xiàng)目可適用于老人、孩子和上班族,適用人群廣泛,通過QQ物聯(lián)接入,擴(kuò)大用戶人群;
(3)功能完善、穩(wěn)定:本作品加入了語(yǔ)音、攝像頭圖像處理、分布式信息管理、WiFi等功能模塊,使機(jī)器人擁有較為完備的功能。同時(shí)通過改進(jìn)相關(guān)算法,極大地提高了機(jī)器人針對(duì)不同場(chǎng)景做出的反應(yīng)速度。
本設(shè)計(jì)可廣泛應(yīng)用于家庭和辦公室等一些私人場(chǎng)所。如果將本設(shè)計(jì)繼續(xù)優(yōu)化,功能將更加完善,其適用范圍也將更加廣闊。
參考文獻(xiàn)
[1]服務(wù)機(jī)器人科技發(fā)展“十二五”專項(xiàng)規(guī)劃[J].機(jī)器人技術(shù)與應(yīng)用,2012(3):1-5.
[2]蘇鵬,周風(fēng)余,陳磊.基于STM32的嵌入式語(yǔ)音識(shí)別模塊設(shè)計(jì)[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2011,11(2):42-45.
[3]孫書鷹,陳志佳,寇超.新一代嵌入式微處理器STM32F103開發(fā)與應(yīng)用[J].網(wǎng)絡(luò)新媒體技術(shù),2010,31(12):59-63.
[4]騰訊公司.QQ物聯(lián)全解析[J].物聯(lián)網(wǎng)技術(shù),2015,5(5):5-7.
[5]胡新華,楊繼隆,姜偉,等.藍(lán)牙技術(shù)綜述[J].現(xiàn)代電子技術(shù),2002,25(5):93-96.
[6]陳景帥.智能空間下語(yǔ)音交互系統(tǒng)的研究與實(shí)現(xiàn)[D].濟(jì)南:山東大學(xué),2010.
[7]劉剛,鄭青玉,王德釗.一種基于電磁感應(yīng)的無(wú)線充電方法[J].北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(2):51-54.
[8]王建,毛騰飛,陳英革.基于BH1750芯片的測(cè)光系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].常熟理工學(xué)院學(xué)報(bào),2011,25(2):117-120.
[9]黃翔宇,張明.一種基于幀跳躍的語(yǔ)音識(shí)別改進(jìn)算法[J].微型機(jī)與應(yīng)用,2014(7):38-40.
[10]楊歡歡.基于STM32的溫室遠(yuǎn)程控制系統(tǒng)的設(shè)計(jì)[D].杭州:杭州電子科技大學(xué),2015.