基于空間增強現(xiàn)實技術(shù)的軌道車輛檢修訓練關(guān)鍵技術(shù)研究

2021-09-15 10:50:04張倩菡

科技經(jīng)濟導刊 2021年24期

李愷，張倩菡

（廣州鐵路職業(yè)技術(shù)學院，廣東廣州 510430）

軌道交通車輛作為人們出行的選擇之一，已經(jīng)越來越普遍。隨著我國交通強國戰(zhàn)略的實施，全國軌道交通車輛保有量不斷提升。軌道交通車輛數(shù)量的增加給運維企業(yè)帶來了不小挑戰(zhàn)，其中最主要的是車輛檢修。軌道車輛檢修過程繁雜，待檢部件種類多，數(shù)量大，因此需要大量車輛檢修工人。根據(jù)市場調(diào)研，全國軌道交通行業(yè)車輛檢修工人的缺口達到了20 萬人。傳統(tǒng)的檢修工人培養(yǎng)模式效率低下、效果差，難以滿足現(xiàn)行軌道交通行業(yè)的高速發(fā)展。因此，針對軌道車輛多人協(xié)同檢修訓練方法，亟待改善培訓效率，筆者在此基礎(chǔ)上提出基于空間增強現(xiàn)實技術(shù)的軌道車輛多人協(xié)同檢修訓練方法。

1.多人協(xié)同交互平臺的構(gòu)建

空間增強現(xiàn)實技術(shù)是一種借助虛擬現(xiàn)實設(shè)備，將實際的物理空間作為顯示介質(zhì)，再將虛擬影像疊加到實際物體像上，達到虛實融合效果的技術(shù)。SAR 通過將顯示設(shè)備與用戶分離開的方式，降低交互時的設(shè)備負載和認知負荷。融合的影像與用戶個體相互獨立，運行多個用戶從各個角度觀察虛實融合的影像，具有良好的魯棒性，對用戶來說具備良好的協(xié)同感知、環(huán)境感知和空間感知。SAR 的架構(gòu)如圖1 所示。

圖1 空間增強現(xiàn)實技術(shù)架構(gòu)

車輛檢修過程中，往往不是依靠單個檢修工人進行，日常車輛檢修往往是多人同時進行。一方面，同時作業(yè)可大大提升車輛檢修效率，另一方面，因為車輛上的一些測試需要兩人或者多人同時完成，比如車門防夾測試，就需要一人在司機室操作，另外10 人需要在車輛中對應(yīng)的車門位置做防夾測試。為了更好地模擬實際車輛檢修過程，就需要訓練系統(tǒng)具備多人協(xié)同訓練的功能，因此需要搭建多人協(xié)同交互平臺。平臺框架如圖2 所示。

圖2 多人協(xié)同交互平臺框架圖

通過使用Hololens 作為客戶端設(shè)備供學員使用，我們搭建服務(wù)器，利用服務(wù)器與客戶端進行數(shù)據(jù)交互，再將數(shù)據(jù)呈現(xiàn)給學員。這樣一來，各個學員就可以在訓練過程中，實現(xiàn)與他人的交互，從而實現(xiàn)在虛擬場景下的多人協(xié)同作業(yè)訓練。

2.基于空間增強現(xiàn)實技術(shù)的交互方法

人機交互有許多種，傳統(tǒng)的以鼠標鍵盤為設(shè)備輸入端的交互不再適用于實物虛擬檢修訓練?？臻g增強現(xiàn)實技術(shù)中有許多交互方法，如基于觸控的交互、基于手勢或姿勢的交互、基于控制器的交互、手持投影儀交互、實物交互和多模態(tài)交互等等。

2.1 基于手勢的交互方法

在軌道車輛檢修訓練中，我們要求訓練者應(yīng)與實際作業(yè)一致，雙手有實物或者是虛擬的檢修工具。因此，要在此類虛擬訓練中解放雙手，可考慮基于手勢或姿勢的交互作為主要交互手段。圖3 為基于手勢的交互方法。

圖3 基于手勢的交互方法

現(xiàn)代理論研究認為，人類的手勢交互分成多個階段，這些階段可以反映出人類的意圖，在實際交互過程中的特征也是這些情況的共同反映。從相關(guān)研究分析得出，人手的交互狀態(tài)分為以下幾個階段：

準備階段：當用戶明確自己需要達到某種目的之后，在用戶腦海中要將自己的任務(wù)演練一遍，規(guī)劃完成任務(wù)的流程，制定完成步驟，這就是用戶操作中的心理準備過程。當用戶心理準備階段完成以后，就根據(jù)需要完成任務(wù)的困難程度，對任務(wù)進行拆解分類，根據(jù)安裝心理準備的實際情況，做出手勢的初步姿態(tài)。

運動階段：從初步姿態(tài)開始，用戶開始按照腦海中設(shè)計完成的動作，做出預(yù)設(shè)手勢，手勢運動軌跡可循，動作平穩(wěn)，由于已經(jīng)進行心理規(guī)劃，故速度較快。一般性的同一個動作軌跡，是大腦的一次信號傳輸指揮手部按照規(guī)劃進行動作。

過渡階段：從一個動作過渡到另一個動作的過程中，用戶頭腦中會有思考時間，因此在動作銜接中會出現(xiàn)短暫的間隙，即信號的傳輸在大腦中進行調(diào)整，從而在行為上出現(xiàn)停頓，或者動作過程減速等。

基于手勢的交互方法，可用手部姿態(tài)完成人機交互。實現(xiàn)手勢交互分為手部識別和姿態(tài)確認兩個步驟，即先需要確定空間中哪個物體是手，確定手以后就得確定手的姿態(tài)。手部識別現(xiàn)已較為成熟，大都采用圖像識別的方式通過建立手部骨架模型對空間物體對比從而識別手部，手部姿態(tài)也是通過手部骨架姿態(tài)來進行識別手勢。手部骨架如圖4 所示。

通過對手勢進行編碼就可以得到相應(yīng)的人機交互代碼，比如圖4 手勢可以作為數(shù)字“3”進行輸入，也可作為第三模式或者暫停。

圖4 手部骨架模型

2.2 基于語音的交互方法

語音交互作為人機交互中最為直接的方式，在車輛檢修中最為實用。語音交互即機器能夠“聽懂”用戶的語言，然后執(zhí)行相應(yīng)的指令或者進行合理的回復(fù)。語音交互主要經(jīng)過語音識別、自然語言處理、人機對話和語音合成四個步驟。其處理流程如圖5 所示。語音識別技術(shù)是語音交互的第一步，通過傳感器（麥克風）采集聲波信號，將聲波信號轉(zhuǎn)換為電信號并進行解碼的過程，從而將聲波轉(zhuǎn)換為機器能理解的內(nèi)容，即語音識別是從語音信號到文字內(nèi)容的解碼過程。自然語言處理是指設(shè)備（計算機）對自然語言進行處理，提取文本語義的過程。在語音交互技術(shù)中，自然語言處理是其中最為重要的環(huán)節(jié)，因為只有在充分處理好文本內(nèi)容，系統(tǒng)才能根據(jù)文本語義進行下一步的處理或者是操作。

圖5 語音交互處理流程圖

人機對話是指設(shè)備（計算機）與自然人進行語音交互，通過自然友好的方式給用戶提供便捷性，從而高效地完成任務(wù)。人機對話是智能語音交互中重要的支撐技術(shù)，在對人類語音進行識別和內(nèi)容處理后，通過該技術(shù)對語音信息的狀態(tài)，生成自然的、合理的、有效的回復(fù)，以實現(xiàn)時間上連續(xù)的智能語音交互。

語音合成是指將文本內(nèi)容自動地生成聲音信號的過程，是語音識別的逆過程?，F(xiàn)今語音合成已經(jīng)較為成熟，有許多成熟的框架，只需根據(jù)用戶需求進行二次智能優(yōu)化，對必要的信息進行提煉和補充即可。

3.結(jié)語