• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      多模交互智能終端

      2024-03-08 03:31:20闞保強余容森
      長春師范大學學報 2024年2期
      關鍵詞:頭盔障礙物聊天

      闞保強,余容森

      (福建師范大學協(xié)和學院,福建 福州 350003)

      0 引言

      隨著人工智能的發(fā)展,人機交互不再局限于單一的感知通道的輸入輸出模態(tài),多模態(tài)人機交互旨在利用語音、圖像、文本等多模態(tài)信息進行人與計算機之間的信息交換[1]。單一的人機交互包括基于接觸的交互如智能手機、平板等,基于手勢的交互,基于聲音感知的交互等。但這些都不能給用戶帶來全方位的交互體驗,這時就需要多模態(tài)的人機交互,而頭盔就是一種很好的多模態(tài)人機交互載體?,F(xiàn)今的頭盔大致可劃分為軍用、工作、運動三大類,這三大類頭盔在舒適性及安全性上已經(jīng)有了一定的保證,但在適用范圍上還存在極大的局限性,由于一些工作的特殊性,致使單一功能的頭盔不能滿足情況較為復雜場景[2]。因此,需要一種集成多個模塊、有多種功能、可以應用于多個場景的智能頭盔。多場景智能頭盔監(jiān)測系統(tǒng)的本質(zhì)需求是適應多場景,頭盔能夠適應的場景數(shù)量是不斷變化的,而且頭盔的功能也并非一成不變[3]?,F(xiàn)有的智能頭盔,例如,Helmetphone MT1 Neo智能頭盔,具備拍照、播放音樂、燈光調(diào)節(jié)、語音導航等功能,不過這些功能需要通過手柄控制,是為用戶騎行而打造的;Daqri Smart Helmet智能頭盔,可以完成數(shù)據(jù)監(jiān)測、熱度檢測、人員培訓、人員遠程指導等,但它更注重于AR方向的交互,且價格較貴[4]。本文設計的多模交互智能終端,具有更高的靈活性和可擴展性,不僅擁有人機交互、開放接口以及多個模塊互相交互,還可以根據(jù)用戶的行為搜集所需信息,使用戶能夠感知到環(huán)境信息,從而實現(xiàn)智能化操作。

      本文設計智能頭盔系統(tǒng)的目的是為滿足實時語音和視覺交流,通過本系統(tǒng)可以實現(xiàn)用戶與產(chǎn)品間的無障礙交流,使用戶可以更加便捷地實現(xiàn)自己的需求。比如,在生活方面,基于爬蟲技術和語音合成技術實現(xiàn)智能信息查詢,如用戶通過語音可以直接查詢天氣、音樂、新聞等信息,方便日常生活;在出行方面,伴隨城市的不斷建設發(fā)展,往往有很多地方都會讓人感到陌生,路徑規(guī)劃可以很好地解決這個問題,幫助用戶穿梭在城市的每一個角落;同時,在人機交互方面,語聊模塊可以輕松實現(xiàn)與用戶的日常對話[5]。本系統(tǒng)開發(fā)的就是將樹莓派平臺、GPS模塊、攝像頭、網(wǎng)絡通信技術與頭盔相結(jié)合的智能終端,配備了相應的后臺系統(tǒng),整體集成度較高,能耗小,便于攜帶,可以適應于多種生活場景。并且系統(tǒng)各部分可以相互協(xié)作,將采集到的信息進行傳遞,使后臺可以獲取相關數(shù)據(jù)。同時,這款多模交互智能終端操作比較簡單,功能相對齊全,無論夜間還是白天都可以幫助佩戴者安全地沿著道路前行或轉(zhuǎn)彎。它可以讓用戶與設備交互,不用通過復雜的操作,使用戶有更好的體驗,讓用戶更快地完成任務,提高工作效率。此外,多模交互智能終端還可以實現(xiàn)智能控制,使用戶能夠?qū)崟r追蹤自己的位置,實現(xiàn)實時交互。

      1 系統(tǒng)總體設計

      系統(tǒng)整體包括服務器端和用戶端,其中服務器端提供后端數(shù)據(jù)處理、目標識別任務,用戶端采用樹莓派、攝像頭、L76X GPS定位模塊、語音采集板等,它們之間使用無線方式傳輸數(shù)據(jù)。系統(tǒng)總體設計框圖如圖1所示,系統(tǒng)功能描述如圖2所示。

      圖1 系統(tǒng)總體設計框圖

      系統(tǒng)功能模塊包括管理模塊、系統(tǒng)主體功能模塊和系統(tǒng)表。

      (1)管理模塊。管理員通過管理員賬號登錄管理員系統(tǒng),在系統(tǒng)中管理員通過查看聊天信息來判斷聊天機器人是否正常工作,回答是否準確,也可以通過聊天輸入框?qū)α奶鞕C器人進行測試,并且收集用戶在聊天中出現(xiàn)的問題,用于聊天機器人的訓練,在不斷重復這個過程中,聊天機器人也變得更加智能,為用戶帶來更好的體驗。管理員可以查看障礙物識別的情況,通過查看識別物體的準確率來調(diào)整訓練模型,還可以對用戶信息和終端信息進行增、刪、查、改。

      (2)系統(tǒng)主體功能模塊。主要與用戶交互的模塊,該模塊應用Raspberry Pi 平臺、網(wǎng)絡通信、語義理解、位置服務等技術,結(jié)合了大量的數(shù)據(jù)和處理方法,主要功能有:天氣查詢——在得到用戶指令后,根據(jù)所得城市信息向心知天氣API請求獲取未來三天的天氣情況和出行建議,返回數(shù)據(jù)后經(jīng)系統(tǒng)解析并以語音形式反饋給用戶;障礙物識別——將攝像頭所采集的視頻信息發(fā)送至服務器,經(jīng)過Yolov5模型預測障礙物所屬類別,并將識別結(jié)果返回到客戶端,以語音形式提醒用戶小心前方障礙物和前方障礙物所屬類別;每日新聞——負責將從天行數(shù)據(jù)的新聞API中獲取的新聞數(shù)據(jù)解析后進行語音播報;語聊對話——用戶在與終端對話時,如果未觸發(fā)系統(tǒng)其他功能關鍵字就會進入語聊對話,這個部分負責獲取用戶向終端提出的問題,通過Seq2Seq模型的理解給用戶最佳回復;出行規(guī)劃——將多模交互智能終端所在位置作為起始點,按照用戶給出的目的地,規(guī)劃出一條最短、最優(yōu)的路徑,用詳細的語音播報這段路程所經(jīng)過的一些地點、方向和距離;地圖查看——主要實現(xiàn)當前地圖的實時查看獲取。

      (3)系統(tǒng)表。主要實現(xiàn)用戶管理和終端管理。

      2 系統(tǒng)硬件設計

      根據(jù)總體設計框圖,硬件部分位于頭盔終端,包括樹莓派、語音處理板、定位模塊、供電單元等,硬件實物如圖3所示。語音的采集與處理是基于WM8960芯片的。定位模塊采用L76X GPS定位模塊,這個定位模塊可以接收GPS、BD2和QZSS的信號,具有體積小、功耗低、定位快等優(yōu)點。

      圖3 智能交互終端硬件

      3 系統(tǒng)軟件設計

      用戶在使用本系統(tǒng)時需要先通過喚醒詞喚醒系統(tǒng),然后系統(tǒng)判斷用戶輸入的語句是否有關鍵詞,如果觸發(fā)關鍵詞將進入對應的功能模塊,比如檢測到語句中有“新聞”一詞就會將今天的新聞播報出來,如果沒有觸發(fā)關鍵詞將進入語聊對話,在這個功能里用戶可以與終端聊一些日常生活的話題。主體流程如圖4所示。

      圖4 系統(tǒng)流程圖

      4 多模交互的實現(xiàn)

      4.1 障礙物識別功能

      障礙物的目標檢測,主要通過讀取樹莓派傳輸?shù)囊曨l流,實時獲取周圍障礙物體的信息,識別出常見的交通標志、人車及生活用品。利用圖像處理、深度學習等技術,從圖像或視頻中定位感興趣的對象,通過目標分類判斷輸入圖像中是否包含目標,用目標定位找出目標物體位置并框出目標,其任務是鎖定圖像中的目標,定位目標位置,確定目標類別[6-8]。本系統(tǒng)是基于Yolov5框架訓練的障礙物的目標檢測,整個系統(tǒng)實現(xiàn)流程如圖5所示,識別檢測均基于樹莓派4B實現(xiàn)。

      圖5 障礙物檢測實現(xiàn)過程圖

      在圖片數(shù)據(jù)集上收集常見的障礙物圖片,見圖6(a),本系統(tǒng)使用LabelMe對數(shù)據(jù)集進行標注,見圖6(b),完成后再訓練Yolov5s模型。訓練結(jié)果如圖7所示。

      圖6 數(shù)據(jù)集和標注數(shù)據(jù)集展示圖

      圖7 模型訓練結(jié)果圖

      4.2 語音交互實現(xiàn)

      這個部分是本系統(tǒng)核心之一,由于系統(tǒng)采用模塊的設計手段,所以指令控制和技能選擇都是基于語音識別開發(fā)的,對話功能的實現(xiàn)框圖如圖8所示,支持語音輸入和文本輸入。語音識別算法模型和對話聊天算法模型已經(jīng)通過 TensorFlow 庫實現(xiàn)并做好了封裝,接下來只需使用核心框架下調(diào)用模型的接口,使后臺服務端模型的接口處理好聊天信息,再傳送至客服端前端進行展示,下一步傳遞給語音合成,即輸出完成一輪對話。對于聊天機器人模型的實現(xiàn),首先對原始數(shù)據(jù)進行初始化,這里本系統(tǒng)由于選擇了開源的語聊庫,需要對原始數(shù)據(jù)進行清洗,主要包括對大小寫字符、標點符號、數(shù)字、空白字符以及自然語言處理停用詞的處理;根據(jù)處理后的數(shù)據(jù),通過生成詞匯表、轉(zhuǎn)化詞編碼的方式,將文字與數(shù)值之間建立一個映射字典,并對輸入數(shù)據(jù)進行編碼。接著基于Seq2Seq模型進行訓練和評估。為了將模型回復的文本結(jié)果轉(zhuǎn)化為語音,采用模塊化語音合成,接入不同的語音合成API。

      Seq2Seq是一種編碼器-解碼器結(jié)構(gòu)的模型,該模型需要使用兩個RNN(循環(huán)神經(jīng)網(wǎng)絡),一個用于編碼,另一個用于解碼。Seq2Seq是一種能將很多元素相關聯(lián)形成記憶的模型,就像人的記憶一樣,其輸出是根據(jù)輸入和已有數(shù)據(jù)推斷出來的。St表示t時刻的記憶,公式如下[9]:

      St=f(U×Xt+W×St-1),

      (1)

      其中,Xt表示t時刻的輸入,U和W為模型的線性關系參數(shù)。

      St是一個激活函數(shù),可以用來過濾掉一些不重要的信息,留下的信息即為模型的記憶。那么得到這些記憶后就要進行預測,用softmax函數(shù)可以預測每個詞出現(xiàn)的概率,但需要在預測時帶入一個權重矩陣V,就可以得到t時刻的輸出Ot,公式如下:

      Ot=s(VSt),

      (2)

      其中,s表示softmax函數(shù)。

      利用RNN的這種特性,Seq2Seq就能完成對語義理解。為了得到更好的輸出效果,本系統(tǒng)在訓練模型的過程中增加了Attention機制(將編碼器編碼的向量再根據(jù)解碼器需要進行動態(tài)變化的機制),簡單來說,就是將注意力集中到重要的信息上,可以有效集中資源以提高效率。該模型的提出,使得神經(jīng)機器翻譯的性能在各個方面的指標都打敗了統(tǒng)計機器翻譯。Seq2Seq模型簡圖如圖9所示,經(jīng)過GLU(Gated Linear Units)模塊送入編解碼器。Seq2Seq模型訓練圖如圖10所示。

      圖9 Seq2Seq模型簡圖

      圖10 Seq2Seq模型訓練結(jié)果圖

      5 實驗結(jié)果

      系統(tǒng)管理主界面如圖11所示,提供遠程測試和管理功能接口。

      圖11 系統(tǒng)管理主界面

      語聊對話界面見圖12,主要用于查看用戶聊天信息,可語音聊天,可通過下方的輸入框輸入文字進行聊天,也可以直接通過語音喚醒終端進行語音輸入,語聊內(nèi)容將以語音播報,同時在頁面查看實時語聊信息。

      圖12 語聊對話界面

      障礙物識別界面如圖13所示,通過語音在終端進行播放,同時在遠程可以實時監(jiān)控。

      圖13 障礙物識別界面

      位置交互模式是通過L76X GPS定位模塊和高德地圖API來實現(xiàn),用戶說出“位置”關鍵詞就可以得到現(xiàn)在所在位置,說出“路線”關鍵詞和要去的地方就可以得到最短步行路徑。終端向服務器發(fā)送位置坐標(圖14),同時智能終端會通過語音合成后播報行進路線,步行最短路徑如圖15所示,Web端定位顯示圖如圖16所示。

      圖14 終端向服務器發(fā)送位置坐標

      圖15 步行最短路徑示意圖

      圖16 Web端定位顯示圖

      6 結(jié)語

      目前,人們對智能產(chǎn)品的需求越來越大,本系統(tǒng)設計的出發(fā)點就是為了方便用戶的日常生活,將無線通信、障礙物檢測、語音處理與樹莓派平臺相結(jié)合,形成了一個多模塊的智能終端,通過對用戶需求的分析,確定系統(tǒng)結(jié)構(gòu)和功能模塊,完成硬件和軟件的搭建。不同環(huán)境的實際測試結(jié)果顯示,本系統(tǒng)的設計與實現(xiàn)有助于智能出行。

      猜你喜歡
      頭盔障礙物聊天
      犬用戰(zhàn)術頭盔
      高低翻越
      SelTrac?CBTC系統(tǒng)中非通信障礙物的設計和處理
      小頭盔,大防護
      當頭盔遇上高科技
      我就是不想跟你聊天了
      意林(2017年9期)2017-06-06 10:26:12
      敞開門聊天
      漢字戴頭盔
      土釘墻在近障礙物的地下車行通道工程中的應用
      聊天不倒王
      潞城市| 莱州市| 沂南县| 泾源县| 如东县| 崇阳县| 嘉鱼县| 措勤县| 江孜县| 石河子市| 元谋县| 改则县| 岚皋县| 花垣县| 星座| 晋中市| 连城县| 青铜峡市| 威海市| 青神县| 盐源县| 元谋县| 攀枝花市| 门源| 长宁区| 澳门| 桂林市| 晋中市| 汶上县| 会泽县| 永安市| 镇雄县| 晴隆县| 曲麻莱县| 长寿区| 东平县| 闵行区| 新丰县| 双牌县| 商南县| 新沂市|