• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于IDL通用接口的人機(jī)語音交互協(xié)同控制系統(tǒng)設(shè)計(jì)研究

      2021-09-22 01:00:06王開宇張弘瑞王獻(xiàn)昌
      無人系統(tǒng)技術(shù) 2021年4期
      關(guān)鍵詞:跨平臺命令無人

      王開宇,張弘瑞,李 聰,王獻(xiàn)昌

      (1.吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,長春 130012;2.吉林大學(xué)軟件學(xué)院,長春 130012; 3.吉林大學(xué)符號計(jì)算與知識工程教育部重點(diǎn)實(shí)驗(yàn)室,長春 130012;4.成都凱斯人工智能研究院,成都 611730)

      1 引 言

      語音識別技術(shù)在近年來得到了廣泛的應(yīng)用并逐漸趨于成熟。在民用方面,語音識別與控制廣泛應(yīng)用于家用電器中,目前小米已有了一個較為完善的具有語音識別的家用電器生態(tài)。在軍用方面,語音識別技術(shù)也在控制系統(tǒng)中占據(jù)著一席之地。在未來戰(zhàn)場中,無人戰(zhàn)場將會成為未來戰(zhàn)爭的主流形式。無人戰(zhàn)斗機(jī)、無人裝甲車、無人運(yùn)輸車、無人艦隊(duì)等將會成為未來戰(zhàn)場中的主角。由此將會引申出一系列的協(xié)同問題,不同的無人機(jī)、無人車有著不同的指令輸入系統(tǒng),在戰(zhàn)場實(shí)際操作中,將會有多種不同型號的作戰(zhàn)單位協(xié)同作戰(zhàn)。如此繁多的系統(tǒng)控制,對作戰(zhàn)控制人員提出了極高的要求,首先要求控制人員具有對多種不同型號的無人作戰(zhàn)單位收發(fā)、處理命令信息的能力;其次,繁雜的控制系統(tǒng)會導(dǎo)致參與命令下達(dá)的控制人員人數(shù)較多,命令傳遞產(chǎn)生的偏差,以及個體之間對語言理解的不同產(chǎn)生的指令的改變,都嚴(yán)重影響著無人作戰(zhàn)系統(tǒng)的協(xié)同配合;最后,在作戰(zhàn)的極端環(huán)境下,當(dāng)某個單位的指令員因故不能再發(fā)布指令時,其他的人員無法代替其控制的作戰(zhàn)單位導(dǎo)致部分癱瘓。

      本文將研究一種基于接口描述語言(Interface Description Language, IDL)通用接口的跨平臺協(xié)同語音控制作戰(zhàn)系統(tǒng),目的在于將自然語言進(jìn)行分詞、匹配,最終轉(zhuǎn)換為通用的IDL,從而控制各種無人設(shè)備。

      IDL 是對象管理組織(Object Management Group,OMG)提出的CORBA(Common Object Request Broker Architecture)規(guī)范的一部分,是一種與平臺無關(guān)的頂層描述語言,用于描述對象中接口的聲明[1],在跨平臺應(yīng)用開發(fā)領(lǐng)域有著廣泛的應(yīng)用。IDL 描述了接口或結(jié)構(gòu)類型,其語法結(jié)構(gòu)定義用客戶、對象、運(yùn)行時刻三部分[2]。IDL提供了一套通用的規(guī)范數(shù)據(jù)類型,并可用此數(shù)據(jù)類型定義更為復(fù)雜的數(shù)據(jù)類型,從而映射到實(shí)現(xiàn)語言中,實(shí)現(xiàn)跨平臺應(yīng)用的開發(fā)[2]?;贗DL 語言接口描述的通用性,將本系統(tǒng)的落腳點(diǎn)設(shè)計(jì)為IDL 命令控制語言,從而控制異構(gòu)設(shè)備,實(shí)現(xiàn)跨平臺異構(gòu)設(shè)備的協(xié)同控制。

      2003年, 美國國防預(yù)先研究計(jì)劃局(DARPA)和美國空軍組織聯(lián)合開展了軟件使能控制(Software Enabled Control,SEC)研究計(jì)劃,并通過驗(yàn)證。波音首次驗(yàn)證開放式控制平臺OCP轉(zhuǎn)換軟件用于無人機(jī)控制以及F-15E 與無人戰(zhàn)機(jī)協(xié)同飛行。研究完成了有人機(jī)和無人機(jī)的通信接口設(shè)計(jì)并進(jìn)行了試驗(yàn),選用F-15E 有人戰(zhàn)斗機(jī)與無人機(jī)進(jìn)行通信,二者最終通過自然語言(英語)成功傳達(dá)和接收了控制指令,完成了控制任務(wù),最終實(shí)現(xiàn)有人機(jī)/無人機(jī)協(xié)同編隊(duì)飛行[3]。

      目前,江蘇自動化研究所邢向向等在面向作戰(zhàn)指揮的語音智能交互技術(shù)研究中,提出了一種面向作戰(zhàn)指揮的語音智能交互模式,采用基于M-UserCF 的協(xié)同過濾算法計(jì)算作戰(zhàn)場景相似度,利用情景語義建模獲得作戰(zhàn)過程上下文信息,通過基于內(nèi)容的推薦算法,將戰(zhàn)場實(shí)時指揮情況與核心知識庫中已經(jīng)過驗(yàn)證的作戰(zhàn)過程進(jìn)行比較,檢索出相似的最優(yōu)指揮過程集作為推薦集合[4]。但并未實(shí)現(xiàn)異構(gòu)設(shè)備間的控制。在對基于跨平臺異構(gòu)控制的語音指控系統(tǒng)的研究中,尚未有合適的解決方案。

      在過去兩年,我們采用CORBA 規(guī)范下的接口描述語言,規(guī)范、定義了異構(gòu)無人系統(tǒng)在地面編隊(duì)中的通用互操作需求、描述、落地、測試和評估。針對混合超過四類異構(gòu)無人系統(tǒng)(含機(jī)器人、后臺控制)的動態(tài)協(xié)同編隊(duì)案例,展開了基于平臺無關(guān)的通用集群互操作合規(guī)性測試和評估[5]。本項(xiàng)目基于已有的工作,提出了一套基于IDL 通用接口的跨平臺協(xié)同語音控制作戰(zhàn)系統(tǒng),實(shí)現(xiàn)人機(jī)交互的擴(kuò)展。

      2 IDL 的選擇使用

      2.1 軟件復(fù)用

      在NATO 的軟件工程會議上,Mallroy 第一次提出了軟件復(fù)用的概念,1983年,F(xiàn)reeman 對軟件復(fù)用給出了詳細(xì)的定義[2]“在構(gòu)造新的軟件系統(tǒng)的過程中,對已存在的軟件人工制品的使用技術(shù)”[6]。軟件復(fù)用是成熟工程領(lǐng)域的一個基本特征,是實(shí)現(xiàn)系統(tǒng)通用性的基本要求,只有軟件可被復(fù)用才能體現(xiàn)其通用性。本文的語音控制系統(tǒng),是基于IDL 的通用性可復(fù)用系統(tǒng),任何可以解析IDL 命令的系統(tǒng)都可復(fù)用語音控制接口。軟件復(fù)用可以提高系統(tǒng)間的互操作性[6],這個特性完美契合跨異構(gòu)互操作無人系統(tǒng)的需求,因此我們基于IDL 命令來實(shí)現(xiàn)。

      2.2 集群系統(tǒng)協(xié)同

      群體智能是人工智能自主性的高級階段[7],集群系統(tǒng)協(xié)同是一類重要的群體智能,是人工智能未來發(fā)展的必然趨勢,也是新一代人工智能的核心研究領(lǐng)域[8]。任務(wù)的復(fù)雜性與環(huán)境的不確定性決定了集群系統(tǒng)協(xié)同控制勢必朝著智能化和自主化的方向發(fā)展,作為新一代人工智能的核心研究領(lǐng)域,集群協(xié)同控制技術(shù)已成為世界各國經(jīng)濟(jì)和國防發(fā)展的強(qiáng)大驅(qū)動力。美國《2011—2036年無人機(jī)系統(tǒng)綜合路線圖》中明確把有人機(jī)/無人機(jī)編隊(duì)飛行技術(shù)列入未來重點(diǎn)發(fā)展技術(shù),《2017— 2042年無人系統(tǒng)綜合路線圖》對互操作性、人機(jī)協(xié)作等協(xié)同技術(shù)進(jìn)行了深入的探討和規(guī)劃,協(xié)同作戰(zhàn)的能力等級逐漸提升,牽引著技術(shù)更加向前發(fā)展[9]。區(qū)別于當(dāng)前大多數(shù)機(jī)構(gòu)研究對單一物體實(shí)現(xiàn)的語音控制,本文的語音控制系統(tǒng)面向集群系統(tǒng)協(xié)同控制,通過控制臺實(shí)現(xiàn)、調(diào)度協(xié)同作戰(zhàn)?;诒疚乃稣Z音控制系統(tǒng)的通用性,其應(yīng)用范圍可擴(kuò)展到所有基于IDL 命令交互的集群協(xié)同系統(tǒng)中。隨著集群協(xié)同系統(tǒng)的涌現(xiàn),語音控制系統(tǒng)將得到廣泛應(yīng)用。

      2.3 IDL 的選擇

      使用IDL 標(biāo)準(zhǔn)化指令進(jìn)行無人協(xié)同設(shè)備的控制,其特點(diǎn)概括如下:一是IDL 對于設(shè)備控制的通用性;二是IDL 在適應(yīng)不同控制場景下的可擴(kuò)展性。IDL 作為一種標(biāo)準(zhǔn)化的接口描述語言,對跨平臺異構(gòu)的無人設(shè)備有著規(guī)范的接口要求,凡是符合IDL 接口標(biāo)準(zhǔn)的設(shè)備,均可接受IDL 指令。因此通過定義規(guī)范的IDL 接口,實(shí)現(xiàn)跨平臺異構(gòu)設(shè)備的協(xié)同控制。IDL 有著較為完善的指令控制集,基本可以滿足在異構(gòu)設(shè)備的命令控制需求。IDL 的可擴(kuò)展性主要表現(xiàn)在基于一個標(biāo)準(zhǔn)化的指令庫,每一條IDL 的指令都能映射到一條標(biāo)準(zhǔn)化的控制命令,而控制命令可以使用不同種類的語言,按照同一標(biāo)準(zhǔn)規(guī)范化后獲得?;谶@樣的架構(gòu),命令控制語言將可以擴(kuò)展到世界各種語言,而不僅僅囿于單類語言的束縛。

      在本項(xiàng)目中,IDL 的基本邊界是對無人系統(tǒng)的控制需求,而無人系統(tǒng)的指令來源又由IDL 規(guī)范進(jìn)行約束,這就形成了一個閉環(huán)?;贗DL 的規(guī)范,定義了一個面向跨平臺異構(gòu)協(xié)同系統(tǒng)的標(biāo)準(zhǔn)化指令庫,用于與IDL 標(biāo)準(zhǔn)化指令庫進(jìn)行匹配。與標(biāo)準(zhǔn)化指令庫相對應(yīng)的是一個命令庫,命令庫中包含有在IDL 邊界內(nèi)有定義的自然語言詞匯語句,每個標(biāo)準(zhǔn)化指令庫中的指令詞匯都映射一個語言支撐集數(shù)據(jù)庫的同義詞集,在該同義詞集中,將命令分詞后與命令庫進(jìn)行匹配,映射到標(biāo)準(zhǔn)化指令庫后,生成一條標(biāo)準(zhǔn)化詞語的命令,再進(jìn)行相似度匹配,從而匹配到相似度最高的標(biāo)準(zhǔn)指令語句。

      3 語音控制系統(tǒng)的整體架構(gòu)

      構(gòu)建協(xié)同作戰(zhàn)語音控制系統(tǒng),需要實(shí)現(xiàn)自然語言的識別、文本斷句分析、詞庫詞法匹配、IDL匹配、語音合成。語音控制系統(tǒng)的運(yùn)行具體包括以下步驟:指令喚醒,語音輸入命令,語音命令識別,文本命令的斷句與分析,命令規(guī)范化,標(biāo)準(zhǔn)命令匹配,指令員確認(rèn)標(biāo)準(zhǔn)命令,IDL 標(biāo)準(zhǔn)命令匹配與發(fā)布。具體運(yùn)行模式如圖1 所示。

      圖1 語音控制系統(tǒng)運(yùn)行模式Fig.1 Operation mode of voice control system

      根據(jù)屬性與組成系統(tǒng)的作用,語音控制系統(tǒng)主要分為三層結(jié)構(gòu):應(yīng)用層、支撐層和基礎(chǔ)層。

      應(yīng)用層:為用戶提供語音控制服務(wù),主要包括語音采集、語音喚醒、指令接收的人機(jī)交互設(shè)備。

      支撐層:為整個系統(tǒng)提供所需的支撐,包括語音傳遞、文本分詞、詞法分析、指令傳遞,主要承擔(dān)應(yīng)用層與基礎(chǔ)層的信息加工與信息傳遞的工作。

      基礎(chǔ)層:為系統(tǒng)提供網(wǎng)絡(luò)通信,并有規(guī)范化數(shù)據(jù)庫支持,包括命令詞庫、標(biāo)準(zhǔn)化指令詞庫、標(biāo)準(zhǔn)化IDL 庫等。

      語音控制系統(tǒng)組成如圖2 所示。

      圖2 語音控制系統(tǒng)組成Fig.2 Composition of voice control system

      4 自然語言命令識別與處理

      4.1 自然語言命令定義

      漢語語句主要是由詞和短語構(gòu)成,能表達(dá)一個相對完整的意思,完成一次簡單的交際任務(wù),在語音上有語調(diào),表示陳述、疑問、祈使、感嘆的語氣,在書面上用句號、問好、感嘆號表示,句子結(jié)構(gòu)一般為:(定)主+[狀]謂<補(bǔ)>+(定)賓[10-11]。

      在協(xié)同作戰(zhàn)語音控制系統(tǒng)中,通常下達(dá)的命令主要以祈使句為主,句子的結(jié)構(gòu)主要為“代號名詞+行動命令”,“代號名詞+行動命令+代號名詞”或“行動命令+代號名詞”的形式,在詞法分析的過程中,將運(yùn)用ddpaser python 包將名詞與動詞進(jìn)行分詞解析,將解析后的不同類型的詞匯分別與語言支撐集數(shù)據(jù)庫中的詞語進(jìn)行匹配。

      4.2 自然語言-IDL 標(biāo)準(zhǔn)化匹配技術(shù)的實(shí)現(xiàn)

      自然語言-IDL 標(biāo)準(zhǔn)化匹配技術(shù)是實(shí)現(xiàn)自然語言控制無人系統(tǒng)的關(guān)鍵性步驟。本技術(shù)分為三個階段,第一個階段將輸入的文本進(jìn)行預(yù)處理,分詞及詞性標(biāo)注,分析命令的預(yù)參數(shù)以及動作指令。第二個階段將動作指令經(jīng)過處理得到標(biāo)準(zhǔn)化指令,同時檢查上一步得到的預(yù)參數(shù)數(shù)量以及類型是否正確。第三個階段得到標(biāo)準(zhǔn)化指令在IDL中對應(yīng)的函數(shù)調(diào)用以及預(yù)參數(shù)在無人系統(tǒng)內(nèi)部的IDL 語言表達(dá)。最后將得到的IDL 函數(shù)以及參數(shù)返回給控制臺,由控制臺調(diào)用函數(shù)完成對無人系統(tǒng)的控制,實(shí)現(xiàn)協(xié)同作戰(zhàn)。

      4.2.1 指令數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)

      指令數(shù)據(jù)庫系統(tǒng)是本系統(tǒng)設(shè)計(jì)的核心工程,自頂向下地構(gòu)建了三個重要的數(shù)據(jù)庫。頂層為語言支撐集數(shù)據(jù)庫,中層為標(biāo)準(zhǔn)化指令數(shù)據(jù)庫,底層為IDL 標(biāo)準(zhǔn)化接口語言指令數(shù)據(jù)庫。自頂向下的三層指令數(shù)據(jù)庫設(shè)計(jì)如圖3 所示。

      圖3 自頂向下的三層指令數(shù)據(jù)庫設(shè)計(jì)Fig.3 Top-down three-tier instruction database design

      語言支撐集數(shù)據(jù)庫指令集主要針對特定場景,進(jìn)行指令集的構(gòu)建,并隨著適用場景的改變進(jìn)行指令集擴(kuò)充。在協(xié)同作戰(zhàn)系統(tǒng)中,主要由設(shè)備名詞與指令動詞構(gòu)成,每種設(shè)備名詞與指令動詞將會有等價詞匯集與其相對應(yīng)。

      標(biāo)準(zhǔn)化指令數(shù)據(jù)庫是連接語言支撐集數(shù)據(jù)庫與標(biāo)準(zhǔn)化IDL 指令數(shù)據(jù)庫的核心。標(biāo)準(zhǔn)化指令數(shù)據(jù)庫接收由語言支撐集數(shù)據(jù)庫發(fā)送的標(biāo)準(zhǔn)指令流,一條指令流中包含了多個匹配的標(biāo)準(zhǔn)化的名詞與動詞,系統(tǒng)將運(yùn)用此字符流與標(biāo)準(zhǔn)化指令集中的指令進(jìn)行匹配,匹配到相似度最高的標(biāo)準(zhǔn)化指令進(jìn)行輸出。

      標(biāo)準(zhǔn)化IDL 指令數(shù)據(jù)庫(后文簡稱IDL 指令庫),主要存儲的是界定范圍之內(nèi)的標(biāo)準(zhǔn)化IDL指令,用于向無人設(shè)備發(fā)布指令。

      4.2.2 DDParser 依存句法分析技術(shù)介紹

      依存句法分析是自然語言處理的核心技術(shù)之一,旨在通過分析句子中詞語之間的依存關(guān)系來確定句子的句法結(jié)構(gòu)[12],其分析實(shí)例如圖4 所示(分析句子:“設(shè)置A 點(diǎn)為目標(biāo)點(diǎn)”)。對文本進(jìn)行依存句法分析,可以對文本進(jìn)行斷句,并且得到句子成分之間的修飾關(guān)系以及單詞詞性。

      圖4 DDParser 的詞法分析Fig.4 Lexical analysis of DDParser

      4.2.3 命令文本預(yù)處理

      預(yù)處理針對已轉(zhuǎn)換為命令文本所存在的發(fā)音不準(zhǔn)導(dǎo)致識別不準(zhǔn),指令噪聲詞較多等情況,進(jìn)行的命令詞糾錯、剔除噪聲詞。指令噪聲詞指在語音命令中出現(xiàn)的頻率較高但含義或區(qū)分能力較低的詞,如“那么”“吧”“兒”等,過濾掉這些噪聲詞有助于提高解析精度和效率[4]。

      對于預(yù)處理,采用利用正則表達(dá)式進(jìn)行字符串匹配的方法,找到噪聲詞將其過濾,并將因指揮員口音不標(biāo)準(zhǔn)或識別系統(tǒng)不完善導(dǎo)致的多次識別錯誤的詞匯修改為正確的表達(dá)方式。

      4.2.4 分詞及語言支撐集數(shù)據(jù)庫匹配

      將預(yù)處理后的命令文本利用依存句法分析技術(shù)分詞并且進(jìn)行詞性標(biāo)注,如命令文本“讓一車跟著二車”,其分詞結(jié)果是“讓/一/車/跟著/二/車”,詞性標(biāo)注的結(jié)果是[v,m,n,v,m,n],其中v 代表動詞,m 代表數(shù)字,n 代表名詞。將分詞得到的單詞序列分別在語言支撐集數(shù)據(jù)庫中匹配,相應(yīng)的單詞對應(yīng)為語言支撐集數(shù)據(jù)庫中的標(biāo)準(zhǔn)詞。這一過程可以實(shí)現(xiàn)近義詞的標(biāo)準(zhǔn)化,如將一系列近義詞“跟著”“尾隨”“跟從”“追隨”等全部匹配成標(biāo)準(zhǔn)動作指令“跟隨”,以及將表示數(shù)字的漢字標(biāo)準(zhǔn)化為數(shù)字,例如“一”匹配成為“1”。除了上面舉例的標(biāo)準(zhǔn)動作指令,語言支撐集數(shù)據(jù)庫中還擁有名詞庫,亦可將句中的名詞匹配成為標(biāo)準(zhǔn)名詞,作為參數(shù)輸出。對于上文的文本命令例子,其匹配結(jié)果是“設(shè)置1 車跟隨2 車”。由于指令言簡意賅,結(jié)構(gòu)相對簡單,因此匹配到標(biāo)準(zhǔn)動作指令后,取其兩側(cè)的名詞(若存在)以及修飾名詞的數(shù)字(若存在)等,作為預(yù)參數(shù)。隨后對預(yù)參數(shù)進(jìn)行處理,匹配成無人系統(tǒng)內(nèi)部相應(yīng)的參數(shù)標(biāo)識符并與標(biāo)準(zhǔn)動作指令相對應(yīng)的IDL 函數(shù)調(diào)用返回給無人系統(tǒng)。

      4.2.5 模糊匹配及正確性檢測

      在一個系統(tǒng)中,擁有一定的糾錯機(jī)制是必不可少的,以期達(dá)到讓人感到舒適的人機(jī)交互體驗(yàn)。在語音識別、文本解析以及匹配中,難免會出現(xiàn)錯誤,如語音識別出現(xiàn)的文本錯誤、解析出的參數(shù)類型錯誤或者數(shù)量錯誤等,都會造成系統(tǒng)無響應(yīng)的問題。

      將標(biāo)準(zhǔn)動作指令在標(biāo)準(zhǔn)化指令庫中進(jìn)行模糊匹配,匹配到相似度最高的標(biāo)準(zhǔn)化指令進(jìn)行輸出。采用Levenshtein 距離算法計(jì)算兩字符串的相似度,通過計(jì)算從原字符串S轉(zhuǎn)換到目標(biāo)字符串T所需要的最少的插入、刪除和替換的數(shù)目即Levenshtein 距離來計(jì)算相似度[13]。

      文本相似度計(jì)算[14]:L_Distance 為兩字符串之間的Levenshtein 距離,Length1 與Length2 分別表示兩字符串長度,Max 指取較大值,則

      相似度閾值設(shè)置為80%,如果最高相似度低于閾值,則認(rèn)為匹配失敗。如果匹配失敗則表明標(biāo)準(zhǔn)化指令庫中不存在該指令,標(biāo)準(zhǔn)化指令生成錯誤,語音合成模塊提示命令無效,需重新等待命令下達(dá)。標(biāo)準(zhǔn)化指令庫中還為每個標(biāo)準(zhǔn)指令指明了參數(shù)的數(shù)量以及參數(shù)的類型,如果匹配成功則得到一個規(guī)范化的標(biāo)準(zhǔn)指令,判斷一階段得到的預(yù)參數(shù)是否數(shù)量符合、類型符合。若不符合,則語音合成模塊提示命令無效,需重新等待命令下達(dá)。

      如果均沒有出現(xiàn)問題,語音合成模塊發(fā)出語音重復(fù)整條命令,等待指令員確認(rèn)。若確認(rèn)正確,則執(zhí)行下一步;若確認(rèn)錯誤,需等待命令重新下達(dá)。

      4.2.6 標(biāo)準(zhǔn)指令與參數(shù)的IDL 轉(zhuǎn)化

      只有將指令以及參數(shù)轉(zhuǎn)化為無人系統(tǒng)接口所支持的IDL 指令,才能做到直接對無人系統(tǒng)的控制。IDL 指令庫中,標(biāo)準(zhǔn)化自然語言指令與IDL指令是一一映射的關(guān)系。IDL 指令庫需要接收兩個指令才能進(jìn)行指令調(diào)用與指令發(fā)布,一個是中層模塊的標(biāo)準(zhǔn)化指令,另一個是用戶的指令確認(rèn)信息,當(dāng)兩個指令成功輸入時,標(biāo)準(zhǔn)化指令將映射到IDL 指令庫的指令集,得到指令所對應(yīng)的IDL 函數(shù)。同樣地,將參數(shù)轉(zhuǎn)換成為無人系統(tǒng)內(nèi)部的標(biāo)識符,等待返回給系統(tǒng)。

      4.2.7 返回函數(shù)及其參數(shù)

      將IDL 函數(shù)以及參數(shù)的IDL 表示返回給無人系統(tǒng)控制臺,控制臺進(jìn)行函數(shù)調(diào)用以實(shí)現(xiàn)對于無人系統(tǒng)的控制,實(shí)現(xiàn)協(xié)同作戰(zhàn)。

      5 應(yīng)用實(shí)例

      5.1 語音喚醒功能與語音文本轉(zhuǎn)化的實(shí)現(xiàn)

      LD3320 提供的語音識別技術(shù),基于“關(guān)鍵詞語列表”的識別技術(shù),語音識別芯片完成的工作就是[15]:把通過MIC 輸入的聲音進(jìn)行頻譜分析→提取語音特征→和關(guān)鍵詞語列表中的關(guān)鍵詞語進(jìn)行對比匹配→找出得分最高的關(guān)鍵詞語作為識別結(jié)果輸出,系統(tǒng)的主控MCU 反復(fù)啟動識別過程[15]。

      囿于LD3320 模塊有限的存儲能力,該模塊只能存儲50 條預(yù)先設(shè)置好的指令進(jìn)行識別,根據(jù)其簡單準(zhǔn)確快速且能在不同平臺環(huán)境下離線穩(wěn)定識別的特點(diǎn),將這個模塊使用作為整個系統(tǒng)的喚醒裝置。為LD3320 模塊通電后,該模塊將處于待機(jī)狀態(tài),對外界語音進(jìn)行實(shí)時循環(huán)識別,當(dāng)收到約定喚醒指令時,模塊向控制臺主程序以字符串的形式發(fā)送指令識別信號,并進(jìn)入循環(huán)等待結(jié)束信號。當(dāng)指令發(fā)布完畢時,以一個單片機(jī)約定詞如“OVER”結(jié)束,單片機(jī)將會向主程序發(fā)送終止信號,主程序終止錄音功能并開始連接網(wǎng)絡(luò),對錄音頻段進(jìn)行語音識別。

      主程序在錄制音頻結(jié)束后,將會通過科大訊飛提供的API,將錄音文件傳遞到科大訊飛語音識別平臺上,科大訊飛語音識別平臺將把識別后的文檔傳入主程序中。

      5.2 標(biāo)準(zhǔn)化指令應(yīng)用實(shí)例

      基于本項(xiàng)目的應(yīng)用場景,設(shè)定了指令邊界,以下是部分指令邊界定義:

      名詞類:當(dāng)前,位置,目標(biāo),車頭,尾號,速度,米,秒,時間,前,后,左,右

      動詞類:設(shè)置,移動,跟蹤

      指代類:當(dāng)前,上一個,下一個

      環(huán)境類:地面,室內(nèi)地面,操場,野外,點(diǎn),路線

      對象類:車,單元,(具體的車)車號,前車,后車

      角色類:跟隨者,領(lǐng)隊(duì)者

      后臺:控制,自主,編隊(duì)

      命令類:加入,撤出,暫停,恢復(fù),設(shè)置

      序號類:N號(N=1,2,3…)字母集A(A=A,B, C…)

      直接選取識別后的指令進(jìn)行分詞及匹配過程。

      實(shí)例一:

      假定已經(jīng)有命令“設(shè)置目標(biāo)點(diǎn)為A”,

      識別指令“設(shè)置目標(biāo)點(diǎn)為A”

      分詞后指令“[‘設(shè)置’,‘目標(biāo)點(diǎn)’,‘為’,‘A’]”

      匹配語言支撐集數(shù)據(jù)庫“[‘設(shè)置’,‘目標(biāo)點(diǎn)’, ‘A’]”

      匹配標(biāo)準(zhǔn)化指令數(shù)據(jù)庫“設(shè)置A 點(diǎn)為目標(biāo)點(diǎn)”

      匹配 IDL 命令數(shù)據(jù)庫 “consoleObject.set-GoalPoint(consoleObject.getUnitPoint("A"))”

      實(shí)例二:

      識別指令“設(shè)置當(dāng)前編隊(duì)為目標(biāo)跟蹤模式”

      分詞后指令“[‘設(shè)置’,‘當(dāng)前’,‘編隊(duì)’,‘為’,‘目標(biāo)’,‘跟蹤’,‘模式’]”

      匹配語言支撐集數(shù)據(jù)庫“[‘設(shè)置’,‘當(dāng)前’,‘編隊(duì)’, ‘目標(biāo)’,‘跟蹤’]”

      匹配標(biāo)準(zhǔn)化指令數(shù)據(jù)庫“設(shè)置當(dāng)前編隊(duì)跟蹤模式為目標(biāo)跟蹤”

      匹配IDL 命令數(shù)據(jù)庫

      “consoleObject.setTrackMode(SRIO_Console:: TrackMode.ObjectTrack)”

      6 結(jié)束語

      協(xié)同作戰(zhàn)將會成為未來戰(zhàn)場的主要形式,而協(xié)同作戰(zhàn)指令下達(dá)的簡化,將極大地簡化指令員的指令下達(dá)過程,并將指令標(biāo)準(zhǔn)化、精準(zhǔn)化下達(dá)到跨平臺跨系統(tǒng)的無人設(shè)備上。本文提出了一種基于IDL 通用接口,面向協(xié)同作戰(zhàn)系統(tǒng)的中文語言控制平臺的解決方案,讓語言指揮跨平臺設(shè)備協(xié)同作戰(zhàn)成為可能。本文基于自然語言向標(biāo)準(zhǔn)化接口語言轉(zhuǎn)化的思路,也將為自然語言編程提供基礎(chǔ)。

      后續(xù)仍需繼續(xù)完善的工作包括兩個方面:一是語音識別系統(tǒng)的本地化處理,即在極端網(wǎng)絡(luò)條件下,離線語音的識別處理;二是詞庫數(shù)據(jù)庫的完善與擴(kuò)充,在應(yīng)對不同場合下對詞庫邊界的重定義,對上層詞庫語言類型進(jìn)行擴(kuò)展等。

      猜你喜歡
      跨平臺命令無人
      只聽主人的命令
      無人戰(zhàn)士無人車
      反擊無人機(jī)
      跨平臺APEX接口組件的設(shè)計(jì)與實(shí)現(xiàn)
      移防命令下達(dá)后
      詩到無人愛處工
      岷峨詩稿(2017年4期)2017-04-20 06:26:43
      無人超市會流行起來嗎?
      這是人民的命令
      基于QT的跨平臺輸電鐵塔監(jiān)控終端軟件設(shè)計(jì)與實(shí)現(xiàn)
      基于OPC跨平臺通信的電機(jī)監(jiān)測與診斷系統(tǒng)
      弋阳县| 永城市| 山阳县| 石城县| 溧阳市| 亚东县| 天祝| 宝兴县| 秀山| 开封县| 玉环县| 宝兴县| 阿拉善右旗| 宁南县| 乌鲁木齐县| 金山区| 赞皇县| 忻州市| 宝应县| 河间市| 类乌齐县| 珠海市| 凤山市| 浏阳市| 杂多县| 嘉禾县| 屯门区| 平江县| 吉木乃县| 漯河市| 都匀市| 平乡县| 嘉兴市| 万山特区| 江华| 平和县| 宜章县| 韶山市| 兰考县| 阳西县| 吉安县|