• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于深度學習的自主識別智能語音手杖設(shè)計

      2022-09-14 08:20:06王巖田會峰
      電子設(shè)計工程 2022年17期
      關(guān)鍵詞:攝像頭遠程語音

      王巖,田會峰

      (江蘇科技大學電氣與信息工程學院,江蘇張家港 215600)

      設(shè)計的系統(tǒng)采用Raspberry Pi(樹莓派)作為主控制器,其小巧經(jīng)濟,廣泛應用于嵌入式與物聯(lián)網(wǎng)領(lǐng)域。利用Raspberry Pi 自帶的CSI 接口(相機串行接口)驅(qū)動Pi Camera(樹莓派攝像頭)捕捉實時畫面,通過Frp(快速反向代理)內(nèi)網(wǎng)穿透上傳至華為云服務器ECS,兩個USB 接口攝像頭則分別進行照片的拍攝與物體的檢測識別,照片將自動存儲于云存儲空間。語音交互綜合利用了百度智能云語音技術(shù)以及圖靈機器人。其余各功能模塊,如HC-SR04 模塊、MPU6050 模塊、GPS 模塊,經(jīng)配置分別完成距離測量、狀態(tài)檢測、位置讀取。整個系統(tǒng)使用Button Switch 按鍵模塊作為控制開關(guān)。

      1 硬件系統(tǒng)設(shè)計以及實現(xiàn)

      1.1 系統(tǒng)總體設(shè)計

      系統(tǒng)以Raspberry Pi 作為控制核心,硬件電路由ReSpeaker2-Mics Pi HAT 語音模塊、HC-SR04 模塊、MPU6050 模塊、GPS 定位模塊、Button Switch 按鍵模塊、USB 攝像頭、Pi Camera 以及擴音器組成,智能手杖總體硬件框圖如圖1 所示。

      圖1 總體硬件框圖

      1.2 系統(tǒng)功能分析

      第一,系統(tǒng)能夠自動測量前方障礙物的距離,HC-SR04 模塊工作原理如圖2 所示。距離計算公式為:

      圖2 HC-SR04模塊工作原理

      式中,L為模塊與障礙物的距離,t2為返回信號接收時間,t1為發(fā)出信號時間[1]。一旦距離超過安全閾值,系統(tǒng)及時輸出語音警報,以便使用者迅速作出反應[2];

      第二,系統(tǒng)能夠傳輸攝像頭捕捉到的視頻流,并且將實時畫面共享至云服務器中,通過設(shè)置一定權(quán)限保證指定的第三方用戶能夠訪問此監(jiān)視畫面;

      第三,系統(tǒng)能夠在用戶與前方障礙物保持較大距離時滿足語音交互需求,用戶通過按動按鍵進行錄音后即可享受天氣預報、自由對話等多種服務;

      第四,手杖能夠充當相機,可供使用者隨時隨地進行拍攝,只需按下按鍵,系統(tǒng)便自動將照片上傳至云存儲空間中;

      第五,系統(tǒng)能夠?qū)z像頭捕捉畫面中的各物體進行檢測與識別,并給出各自的識別結(jié)果及準確率;

      第六,系統(tǒng)可對使用者的人體姿態(tài)進行檢測,如若發(fā)現(xiàn)異常,可及時發(fā)出求救信息并保持發(fā)送狀態(tài)直至危險解除;

      第七,系統(tǒng)定時采集GPS 模塊返回的經(jīng)緯度數(shù)據(jù),將其轉(zhuǎn)換為地理位置發(fā)送至指定接收方。

      涂裝是現(xiàn)代產(chǎn)品制造工藝中的重要環(huán)節(jié)之一,它包括涂裝前對被涂物表面的處理、涂布工藝和干燥三個基本工序以及設(shè)計合理的涂層系統(tǒng)。傳統(tǒng)涂裝工藝中,在噴漆、烘干工段會產(chǎn)生大量的有機溶劑氣體,其主要成分是甲苯、二甲苯、苯等,這些有害物質(zhì)外排不僅影響大氣環(huán)境,而且有火災和爆炸的環(huán)境風險。涂裝工藝產(chǎn)生的環(huán)境污染與涂料選擇、作業(yè)環(huán)境條件、質(zhì)量及工藝管理各方面息息相關(guān)[1]。

      1.3 系統(tǒng)硬件的選擇

      由于系統(tǒng)所需實現(xiàn)的功能包括語音交互、按鍵拍照,因而,為滿足控制條件的需求,這里選用了兩個Button Switch 按鍵模塊。在距離測量方面,選用HC-SR04 超聲波測距模塊[3]。而對于狀態(tài)檢測,則選用MPU6050 陀螺儀模塊,通過設(shè)置加速度閾值以保證跌倒即時求救。由于該系統(tǒng)功能模塊較多,為避免I/O 口接線混亂,這里選用TTL 轉(zhuǎn)USB 模塊將GPS 模塊連接到Raspberry Pi 的USB 接口上。

      除上述模塊選擇外,由于Raspberry Pi 沒有自帶的語音輸入通道,因而為滿足智能語音交互功能的需求,選用ReSpeaker2-Mics Pi HAT 語音模塊作為錄音載體。此外,為便于警報語音能夠有效反饋至用戶處[4],這里選用了音量可調(diào)節(jié)的擴音器。系統(tǒng)I/O接線圖如圖3 所示。

      圖3 I/O接線圖

      2 系統(tǒng)軟件設(shè)計

      2.1 控制流程設(shè)計

      系統(tǒng)開啟后,Pi Camera 以及兩個USB 攝像頭獨立工作,分別完成物體檢測與識別及實時遠程監(jiān)控任務,其余各功能模塊相互協(xié)調(diào),在具體的控制策略下共同實現(xiàn)按鍵控制、智能語音交互、拍照存云、摔倒自動求救以及地址定時上報等。系統(tǒng)整體控制流程圖如圖4 所示。

      圖4 系統(tǒng)整體控制流程圖

      2.2 實時遠程監(jiān)控

      實時遠程監(jiān)控涉及到的過程有Mjpg-streamer(視頻流編碼格式傳送程序)與Frp 反向代理軟件的安裝、ini 文件的編輯以及華為云服務器ECS 安全組的配置。安裝編譯Mjpg-streamer 的目的是在局域網(wǎng)內(nèi)傳輸視頻流,實行小范圍內(nèi)的畫面共享。而其余步驟的操作是為了在執(zhí)行Frp 內(nèi)網(wǎng)穿透指令后,Raspberry Pi 的IP 地址能夠順利搭載到公網(wǎng)IP 上,進而,在任一可供上網(wǎng)的設(shè)備中輸入相應網(wǎng)址便可隨時隨地查看遠程畫面。

      2.3 語音交互

      語音交互關(guān)系到語音文件及文本文件的互相轉(zhuǎn)換、機器人回復等過程[5]。前者主要依賴百度智能云語音技術(shù),調(diào)用相應API 即可實現(xiàn),后者則是依賴圖靈機器人對轉(zhuǎn)換后的文本作出答復,將其轉(zhuǎn)為mp3文件后便可通過mplayer 語音輸出至用戶處。

      2.4 拍照存云

      這里的拍照本質(zhì)上是攝像頭畫面的截取,依靠的是Raspberry Pi 小程序fswebcam,以Button Switch模塊作為拍攝鍵。在此基礎(chǔ)上,調(diào)用七牛云存儲空間的API 接口即可實現(xiàn)照片自動存云。

      2.5 地址上傳

      定位功能依賴GPS 模塊以及minicom 串口通信工具,運行AT 指令并進行篩選,可從GPS 返回的大量數(shù)據(jù)中得到經(jīng)緯度信息。調(diào)用百度開放平臺的AK 密鑰將此經(jīng)緯度轉(zhuǎn)換成地理位置,開啟SMTP 協(xié)議后即可定時將其發(fā)送至指定郵箱。

      3 物體檢測與識別實現(xiàn)策略

      3.1 YoloV3算法訓練目標檢測模型

      該系統(tǒng)選用的是COCO 數(shù)據(jù)集,COCO 數(shù)據(jù)集是一個大型的、豐富的物體檢測數(shù)據(jù)集,其擁有80個不同的物體類別,包含超過33萬張圖像。由于COCO 數(shù)據(jù)集是以json 格式存儲的,經(jīng)過必要的轉(zhuǎn)換方可得到訓練模型所需的各種圖片以及txt 文件。利用labelimg軟件對選用的圖片進行標簽標注后可得到xml文件。

      通過YoloV3 算法對上述文件進行訓練,經(jīng)過一段時間可得到損失率最低的h5 權(quán)重模型,將此模型轉(zhuǎn)換成TensorFlow的pb模型即可在OpenCV中調(diào)用。

      3.2 OpenCV圖像處理

      該系統(tǒng)的物體檢測應用OpenCV 對圖像進行采集與預處理。圖像處理包括將RGB 圖像轉(zhuǎn)換為灰度圖像,然后將其二值化。處理步驟涉及將對象與背景和其他對象區(qū)分開,在此步驟中,使用了非常通用的圖像處理方法,即邊界檢測(Canny 算法)、閾值化以與背景隔離、高斯模糊以柔化細節(jié)、從彩色到黑白和二值圖像的轉(zhuǎn)換以及輪廓檢測。

      其中,閾值化采用Otsu算法,使用一個閾值將像素劃分為兩類,其定義為每個群集的方差的加權(quán)和[6-7],如式(2):

      式中,nB與no分別是閾值以下與之上的像素數(shù),而δB與δo分別是它們的方差,T是閾值。這樣,對既有物體又有背景的圖像塊進行閾值化、二值化、填充孔洞等處理便可將每個物體很好地分割出來。

      3.3 CNN(卷積神經(jīng)網(wǎng)絡)基本原理

      物體的識別模型采用的算法是卷積-神經(jīng)網(wǎng)絡[8-9],其依賴的是TensorFlow Lite 學習框架[10-11]。卷積神經(jīng)網(wǎng)絡的神經(jīng)元模型如圖5 所示。

      其數(shù)學表達式為:

      式中,x為輸入;w為權(quán)重;b為偏置值;f為激活函數(shù)。

      卷積神經(jīng)網(wǎng)絡主要包括輸入層、卷積層、池化層、全連接層、輸出層[12]。卷積和池化過程是為了更好地提取圖像特征。輸入層即輸入的原始圖像;卷積層一般使用一個正方形卷積核遍歷圖像上的每一個像素點,圖片與卷積核重合區(qū)域中的每一個像素值乘上卷積核內(nèi)相對應點的權(quán)重,求和后再加上偏置即可得到輸出圖片中的一個像素值,如圖6 所示。

      圖6 卷積過程

      池化層的目的是進一步降低維度,通過聚合卷積層收集的值進行降維。它們遵循與卷積層相同的滑動窗口思想,但不是計算所有值,而是選擇其輸入的最大值或平均值,這分別稱為最大池化和平均池化。池化處理過程如圖7 所示。

      圖7 池化處理過程

      池化層得到的結(jié)果需要進行壓縮后送入全連接網(wǎng)絡,再使用神經(jīng)元模型公式進行計算,即每個輸入值乘以不同的權(quán)重并加入偏置,激活后經(jīng)過多次神經(jīng)網(wǎng)絡連接,在訓練過程中舍棄一定的神經(jīng)元節(jié)點,通過Softmax 函數(shù)回歸,即可得到輸出層。

      4 系統(tǒng)功能測試

      4.1 遠程監(jiān)控測試

      系統(tǒng)啟動后,使能攝像頭,在Linux 命令行中運行相應指令以啟用Mjpg-streamer[13]。確定Mjpgstreamer 有效運行的情況下,分別在ECS 云服務器終端以及系統(tǒng)命令行下輸入Frp 內(nèi)網(wǎng)穿透命令,提示連接成功后實時視頻流即可源源不斷地傳送至公網(wǎng)服務器[14]。遠程監(jiān)控實現(xiàn)流程圖如圖8 所示。

      圖8 遠程監(jiān)控實現(xiàn)流程圖

      順利執(zhí)行以上各流程后,在任一可上網(wǎng)的設(shè)備中輸入網(wǎng)址http://公網(wǎng)IP 地址:端口號port/javascript_simple.html,便可進行實時遠程監(jiān)控[15]。經(jīng)觀察,此頁面中的畫面延遲保持在1 s 以內(nèi),延遲時間隨云服務器ECS 的不同而發(fā)生微小變化。

      4.2 物體檢測與識別測試

      系統(tǒng)開啟后,首先確保tflite1-env 虛擬環(huán)境處于活動狀態(tài),從/home/pi/tflite1 目錄中發(fā)出python3 TFLite_detection_webcam.py--modeldir=Sample_TFL ite_model 命令來指定識別模型并運行物體檢測識別代碼[16]。通過觀察,物體檢測識別畫面的傳輸速率為1 fps 左右,受制于Raspberry Pi 本身的性能約束,此幀數(shù)上下波動但變化幅值不大,一般隨后臺程序數(shù)量的減少而有所提升,總體而言,并不影響觀感。

      4.3 系統(tǒng)總體調(diào)試

      該系統(tǒng)在實際測試運行時,各功能模塊之間相互協(xié)調(diào),在具體的控制策略下保持有效運作。系統(tǒng)能夠及時反饋距離預警,提供自由對話、天氣預報等功能,供使用者便捷管理拍攝的照片,保證跌倒后及時且持續(xù)地發(fā)送求救信息,在正常使用過程中地理位置也可按照設(shè)定定時上報。

      此外,在遠程監(jiān)控的第一次調(diào)試過程中,即使在確保Raspberry Pi 與云服務器ECS 成功連接的情況下,輸入網(wǎng)址后也不能夠訪問實時畫面。經(jīng)查找,出現(xiàn)這個問題的原因是Raspberry Pi和云服務器ECS的設(shè)定時間不一致。該問題的解決方法是通過Python進行網(wǎng)絡爬蟲,請求一臺可以響應的服務器,利用其中的date 屬性獲取實際時間,再調(diào)用os.system()函數(shù)執(zhí)行終端命令,強制設(shè)置Raspberry Pi 時間。為實際操作的方便,這里編寫了一個Shell 腳本,將此Python文件設(shè)為開機自啟,這樣就省去了每次開機后手動校準時間的麻煩。

      5 結(jié)束語

      該手杖的開發(fā)不但結(jié)合了現(xiàn)有智能手杖的優(yōu)點,還充分調(diào)用了各種云服務器進行拓展與創(chuàng)新。受助于這些云計算技術(shù),系統(tǒng)能夠提供拍照存云、實時遠程監(jiān)控、GPS 定位以及語音交互等功能,這些功能能夠有效消除系統(tǒng)受環(huán)境限制的弊端。此外,該系統(tǒng)還提出利用TensorFlow Lite 學習框架以及各類算法進行物體的檢測與識別,進一步提高了系統(tǒng)對圖像的處理能力,有效擴展了應用場景。

      猜你喜歡
      攝像頭遠程語音
      讓人膽寒的“遠程殺手”:彈道導彈
      軍事文摘(2022年20期)2023-01-10 07:18:38
      浙江首試公路非現(xiàn)場執(zhí)法新型攝像頭
      攝像頭連接器可提供360°視角圖像
      遠程工作狂綜合征
      英語文摘(2021年11期)2021-12-31 03:25:18
      魔力語音
      基于MATLAB的語音信號處理
      電子制作(2019年14期)2019-08-20 05:43:38
      基于MQ3與MP3的價廉物美的酒駕語音提醒器
      電子制作(2019年9期)2019-05-30 09:42:10
      對方正在輸入……
      小說界(2018年5期)2018-11-26 12:43:42
      遠程詐騙
      學生天地(2018年19期)2018-09-07 07:06:30
      奔馳360°攝像頭系統(tǒng)介紹
      威信县| 鹰潭市| 罗城| 射洪县| 开化县| 吕梁市| 兴国县| 巢湖市| 怀柔区| 台南市| 浦县| 平顶山市| 临颍县| 白城市| 郴州市| 辰溪县| 康保县| 温泉县| 思南县| 霍林郭勒市| 开江县| 巫溪县| 辽中县| 阳朔县| 黄大仙区| 嘉定区| 额济纳旗| 和田县| 宁德市| 永定县| 金塔县| 南平市| 治多县| 宁都县| 蓬莱市| 临高县| 伊宁市| 天柱县| 城市| 阆中市| 商都县|