摘" 要:隨著無人機技術(shù)的廣泛應(yīng)用,水稻檢測領(lǐng)域的實際需求不斷提高,因此研究引入英文語音識別模塊,來建立先進的無人機控制結(jié)構(gòu)和檢測技術(shù)。首先分析無人機的檢測設(shè)備和航行控制方法,結(jié)合配套設(shè)備對其檢測技術(shù)提供較好的基礎(chǔ)。其次對英文語音識別處理技術(shù)進行分析,以嵌入無人機控制系統(tǒng)從而實現(xiàn)英文語音控制無人機作業(yè)。最后對英文語音識別的無人機進行水稻檢測,得出環(huán)境噪聲為40 dB時,英文指令識別的精度為93.5%,識別效率為38 ms。水稻病害程度和生理參數(shù)的相關(guān)高達0.81,綜合以上結(jié)果表明基于英文語音識別的無人機在水稻檢測的先進性,并為國際田間作業(yè)提供技術(shù)參考。
關(guān)鍵詞:英文語音識別;無人機;航行控制;水稻檢測;病害程度
基金項目:2025年西哲會科學(xué)研究專項般項目(2025YB0269)。
收稿日期:2024-10-23
作者簡介:李夢瑩(1987—),女,碩士,講師,研究方向:英語教育。
中圖分類號:S431.9"""""""""""""""""""""""""""""" 文獻標(biāo)志碼:A文章編號:1673-6737(2025)01-0038-06
Unmanned Aerial Vehicle Detection of Paddy Rice Based
on English Speech Recognition
LI Meng-ying
(Xi‘a(chǎn)n Vocational University of Automobile, Xi‘a(chǎn)n 710600, China)
Abstract: With the widespread application of drone technology, the actual demand in the field of rice detection is constantly increasing. Therefore, research is being conducted to introduce English speech recognition modules to establish advanced drone control structures and detection technologies. Firstly, analyze the detection equipment and navigation control methods of unmanned aerial vehicles, and provide a good foundation for their detection technology in combination with supporting equipment. Next, analyze the English speech recognition processing technology to embed it into the drone control system and achieve English speech control for drone operations. Finally, the unmanned aerial vehicle for English speech recognition was used for rice detection, and it was found that when the environmental noise was 40 dB, the accuracy of English command recognition was 93.5%, and the recognition efficiency was 38 ms. The correlation between rice disease degree and physiological parameters is as high as 0.81. The above results show that the UAV based on English speech recognition is progressiveness in rice detection, and provide technical reference for international field operations.
Key words: English speech recognition; UAV; Navigation control; Rice testing; Disease severity
隨著城市化和經(jīng)濟的快速發(fā)展,人們的生活水平不斷提高,對于稻米的食用和選擇有了更高要求。水稻種植已進入機械化、智能化的發(fā)展階段,水稻種植和品種改良對糧食安全、農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義,農(nóng)業(yè)機械設(shè)備的使用有利于提高農(nóng)田生產(chǎn)力[1]。對于作物的生長狀態(tài)和趨勢,傳統(tǒng)的田間調(diào)查方法對其進行觀察和評估,容易受主觀因素影響,并且耗費大量時間和精力,工作效率低下。遙感技術(shù)和無人機技術(shù)可精確獲取農(nóng)田作物的生長信息,提高了農(nóng)業(yè)管理的工作效率。其中無人機具有靈活性高、操作時空分辨率高、操作簡便等優(yōu)勢,在局部范圍內(nèi)進行農(nóng)田的作物信息監(jiān)測。之后利用大數(shù)據(jù)采集和信息處理技術(shù),對作物生長狀態(tài)進行苗情、病害和產(chǎn)量等的分析,從而調(diào)節(jié)作物生長環(huán)境,實現(xiàn)作物的精準(zhǔn)預(yù)估。無人機通常結(jié)合遙感技術(shù)的光譜數(shù)據(jù),對農(nóng)作物生長的生物量進行動態(tài)監(jiān)測和預(yù)測,對遙感數(shù)據(jù)的處理還需要進行統(tǒng)計模型和算法評估[2]。同時無人機航行控制與遙感技術(shù)的操作不一致,會導(dǎo)致采集數(shù)據(jù)的不確定性,從而增加操作步驟,影響農(nóng)業(yè)管理[3]。語音識別在農(nóng)業(yè)機械控制上有廣闊的應(yīng)用前景,語音識別處理技術(shù)對機械設(shè)備的操作具有便捷性,在無人機的地面遙控或內(nèi)置驅(qū)動程序中實現(xiàn)田間作物播種、施藥和檢測等作業(yè)[4]。
另外英語是世界上應(yīng)用最廣泛的語言,其語法簡單、語感自然,這些特性使得英語在機械設(shè)計和控制方面具有優(yōu)勢。在農(nóng)業(yè)機械的控制過程中引入英語語音,既能利用國外技術(shù)改善農(nóng)業(yè)機械性能,又能增加國內(nèi)成熟機械對國際市場的適應(yīng)能力?;诖?,研究對無人機結(jié)構(gòu)和航行控制進行算法分析,以實現(xiàn)后續(xù)語音識別的嵌入。創(chuàng)新之處在于引入英文語音識別處理技術(shù),并對無人機飛行和檢測作業(yè)進行流程設(shè)計,從而實現(xiàn)無人機檢測水稻的先進技術(shù),為農(nóng)業(yè)作物的生長監(jiān)測和田間管理提供了技術(shù)參考。
1" 無人機檢測水稻的算法流程和語音識別處理技術(shù)
1.1" 無人機結(jié)構(gòu)和航行路徑控制算法
隨著機械化水平的提高,現(xiàn)代農(nóng)業(yè)的生產(chǎn)模式逐漸以機械化為主,其中無人機在農(nóng)業(yè)生產(chǎn)生活中應(yīng)用廣泛。目前常用的X字型機架的四旋翼無人機,以其高性能、快速度、遠距離和自帶電池等優(yōu)勢來執(zhí)行高強度任務(wù),同時在7級大風(fēng)下仍不受影響[5]。研究選大疆M300RTK型號、ZenmuseH20云臺相機配置和DJI Pilot APP對水稻狀態(tài)進行監(jiān)控、拍照和錄像的遠程操作。具體結(jié)構(gòu)如圖1所示。
從圖1中看出大疆飛行器與云臺相機和移動設(shè)備的應(yīng)用軟件相匹配,以執(zhí)行農(nóng)業(yè)生產(chǎn)活動。其中云臺相機的變焦和廣角可實現(xiàn)高倍率與廣角畫面的直接快速切換,對熱成像和可見光的拍攝場景可能實現(xiàn)精確拍攝,同時其激光測距儀在巡檢或搜救作業(yè)中能夠精確定位,提高工作效率。而應(yīng)用軟件在移動設(shè)備上可實時遠程監(jiān)測,控制完成任意角度的拍照和錄像等工作。四個螺旋槳在機體周圍呈對稱分布,在飛行過程中主要通過調(diào)整螺旋槳的轉(zhuǎn)速來實現(xiàn)位置移動,且相鄰的兩個螺旋槳旋轉(zhuǎn)方向相反。
另外飛行器的控制器主要負責(zé)姿態(tài)穩(wěn)定和位置軌跡跟蹤,傳感器獲取飛控系統(tǒng)的實時信息,包括位置、姿態(tài)和監(jiān)測目標(biāo)等。而執(zhí)行機體將控制信號轉(zhuǎn)換為電機的電壓信號,并傳遞給四個螺旋槳以控制其轉(zhuǎn)速[6]。因此在無人機作業(yè)區(qū)域內(nèi),對其中的障礙物和飛行控制進行人工勢場計算,以實現(xiàn)精準(zhǔn)飛行和農(nóng)業(yè)應(yīng)用。人工勢場法的引力計算如式(1)所示。
Uatt(A)=ξ‖Agoal -A‖m"""""" (1)
式(1)中,Uatt(A)表示為位置A的引力勢場,ξ和m均為引力勢場的常數(shù),‖Agoal -A‖為無人機由位置A到Agoal 的距離。根據(jù)人工勢場法的引力場,其負梯度如式(2)所示。
式(2)中,F(xiàn)att(A)為人工勢場法的負梯度,κ為增益,且κgt;0。當(dāng)無人機飛行至目標(biāo)位置的過程中,其距離越小則負梯度的值逐漸縮小到0。但在飛行過程中無人機對障礙物的斥力,會導(dǎo)致其距離目標(biāo)點的總勢能增大,所以改進后的人工勢場法如式(3)所示。
Uatt(A,B)=ξA‖Agoal (t)-A (t)‖m+lB‖Batt(t)-B(t)‖n (3)
式(3)中,B表示避開障礙物的斥力,Batt(t)和B(t)分別為目標(biāo)點和無人機在t時刻的移動速度。ξA和lB為正參數(shù),n為勢場系數(shù)。對應(yīng)的負梯度和無人機飛行合力的計算如式(4)所示。
式(4)中,F(xiàn)att(A,B)為改進的負梯度,F(xiàn)att(A)1和Fatt(B)1分別為無人機避障行為所受勢場合力的兩個分力,PξA和vlB為兩個分力的方向向量。而為無人機指向目標(biāo)點的單位矢量,Nvrt為無人機與目標(biāo)點相對速度的單位矢量。經(jīng)過無人機結(jié)構(gòu)分析和航行路徑的控制,其中無人機在航行路徑規(guī)劃過程中,利用人工勢場對其合力進行計算,并且考慮到避障規(guī)劃的實時性,對無人機飛行的航行角和速度等參數(shù)進行調(diào)整,從而完成規(guī)劃路徑下的穩(wěn)定飛行和水稻作物態(tài)勢的檢測,為農(nóng)業(yè)應(yīng)用提供管理手段。
1.2" 無人機檢測水稻流程和語音識別技術(shù)
根據(jù)無人機飛行結(jié)構(gòu)和航行路徑的規(guī)劃,為語音控制無人機作業(yè)提供較好的技術(shù)基礎(chǔ),在無人機控制系統(tǒng)中嵌入英文語音識別模塊,不僅快速準(zhǔn)確地控制無人機在水稻田間的穩(wěn)定飛行,還能完成飛行過程中水稻拍攝和監(jiān)測任務(wù)。因此在無人機航行路徑的動態(tài)規(guī)劃中,可實現(xiàn)水稻的苗情、產(chǎn)量和成熟度等監(jiān)測內(nèi)容。同時結(jié)合移動設(shè)備對無人機的遠程語音操作,完成水稻圖像或視頻的識別處理流程。具體如圖2所示。
從圖2中看出無人機在檢測水稻前期需要對水稻種植區(qū)域進行地圖模型的建立,以設(shè)置飛行參數(shù)。無人機在飛行時對障礙點和起始點進行航線規(guī)劃,同時調(diào)整飛行的航向角和速度,獲取航線的路徑信息。所以無人機在飛行過程中不僅有效控制飛行速度,還利用配套的云臺相機對水稻進行任意角度的拍攝和錄像,以獲取精確的圖片信息。工作人員在遠程操作航行的同時還能獲取高清的水稻圖片,并對航線和圖片信息進行同步監(jiān)測和處理,其中水稻圖片傳輸至控制系統(tǒng)中,經(jīng)數(shù)據(jù)預(yù)處理和模型訓(xùn)練可完成水稻的監(jiān)測任務(wù)。
農(nóng)業(yè)生產(chǎn)的應(yīng)用語言和無人機控制的發(fā)展,語音識別技術(shù)能夠?qū)⑷祟惖恼Z音信號轉(zhuǎn)變?yōu)闄C器理解的文本或指令,使得機械控制、信息處理和商務(wù)消費等領(lǐng)域得到專業(yè)化發(fā)展[7-8]。目前語音識別技術(shù)以移動設(shè)備為平臺,對應(yīng)用對象進行實時操作,在農(nóng)業(yè)種植的機械控制中,由語音識別與控制系統(tǒng)組成,以便生成對機械設(shè)備的控制指令。所以語音識別技術(shù)在無人機控制系統(tǒng)的應(yīng)用如圖3所示。
從圖3中看出無人機控制系統(tǒng)中對語音識別模塊的運行過程進行說明,由移動設(shè)備的麥克風(fēng)輸入英文語言,再經(jīng)模塊處理輸出指令至無人機及其云臺雙相機中,從而完成水稻檢測。在語音識別模塊中,首先將輸入的英文語音信號轉(zhuǎn)換為數(shù)碼信號,并在解碼芯片中對信號進行噪聲去除,以便特征提取。其次模塊的處理芯片結(jié)合識別算法,對處理的數(shù)字信號進行初步識別,還對識別的英文詞條進行數(shù)據(jù)存儲和顯示屏反映。最后將特征矢量相似度最高的結(jié)果輸出至控制系統(tǒng)中,從而完成英文語音識別的處理。
經(jīng)過航行路徑的控制和英文語音識別的處理,無人機檢測水稻農(nóng)業(yè)生產(chǎn)具有較為系統(tǒng)的操作流程。其中無人機航行路徑的控制在語音指令下,做到及時避障或路徑調(diào)整,另外語音識別芯片中存在大量詞匯和高頻用語,其開放型的源代碼可與其他技術(shù)相兼容,從而豐富了農(nóng)業(yè)無人機的應(yīng)用場景。
2" 基于英文語音識別的無人機檢測水稻結(jié)果
2.1" 英文語音識別技術(shù)對無人機控制指令的測試結(jié)果
根據(jù)英文語音識別處理技術(shù)和無人機控制系統(tǒng)的應(yīng)用,英文語言識別模塊的代碼編程對語音輸入和指令輸出之間的過程,可有效處理語音檢測、背景噪聲和識別錯誤等狀態(tài)。因此無人機控制系統(tǒng)與語音識別模塊的連接,可有效處理輸入音頻,并對其進行序列分析和識別調(diào)試,從而實現(xiàn)無人機控制指令的輸出。為了驗證英文語音識別處理在大疆四旋翼無人機的飛行控制,采用基礎(chǔ)的數(shù)字和單詞來表示無人機運動模式。具體如表1所示。
從表1中得出無人機上下飛行和翻轉(zhuǎn)等基礎(chǔ)操作采用英文數(shù)字,來作為輸入指令,同時對具體的飛行速度和方向等采用精簡詞匯來表明其含義。使得語音識別模塊對語音特征的提取具有快速的處理能力,當(dāng)輸入多種控制指令時,還能保證無人機行為的準(zhǔn)確控制。最后根據(jù)實際應(yīng)用需求對指令進行測試效果的分析,結(jié)果如圖4所示。
從圖4(a)中得出對英文數(shù)字指令進行50次無人機飛行訓(xùn)練,其中Zero-Two的功能定義比較簡單,其成功次數(shù)均在45以上,控制準(zhǔn)確率最高為98%。而Three-Five的指令相對復(fù)雜,對無人機進行翻轉(zhuǎn)和懸停訓(xùn)練,但最低準(zhǔn)確率在58%,因此也說明整體訓(xùn)練具有可行性。在圖4(b)中對實際應(yīng)用的不同環(huán)境噪音進行測試,以建立無人機對語音識別技術(shù)的訓(xùn)練,同時在英文指令輸入時采用50條英文數(shù)字和單詞形式,以符合水稻檢測作業(yè)的需求。其中數(shù)字指令的識別率整體高于單詞識別率,二者均隨著環(huán)境噪音的增加,識別率逐漸下降。當(dāng)環(huán)境噪音為50 dB時,數(shù)字和單詞的識別率分別為92%和91%,同時識別50條指令的時間平均時間為41 ms。綜合以上結(jié)果英文識別技術(shù)在無人機控制飛行和實際操作上,準(zhǔn)確率和識別效率相對較好,證明了其語音識別技術(shù)的實時性和準(zhǔn)確性。
2.2" 無人機檢測水稻病害的結(jié)果分析
根據(jù)英文語音識別技術(shù)對無人機操作的可行性,研究選擇南方某村的水稻實驗田作為檢測對象,其水稻一年兩熟或三熟制,且生育期較短從而提高了當(dāng)?shù)禺a(chǎn)量。由于南方稻區(qū)的熟制和生育期,其病蟲害較多,所以研究選擇夏季常發(fā)生的水稻白葉枯病的生理參數(shù)進行病害評估,其中水稻白葉枯病的病害嚴(yán)重程度經(jīng)標(biāo)準(zhǔn)的田間調(diào)查分析,已量化為0~5這六個等級。再將生理參數(shù)與病害嚴(yán)重程度進行皮爾遜相關(guān)性分析,具體如表2所示。
從表2中可知水稻病害樣本的采集顯示出嚴(yán)重程度和發(fā)展趨勢,其中葉綠素含量和含水率均隨著病害嚴(yán)重程度的加重而逐漸降低。當(dāng)病害嚴(yán)重程度為2級時,水稻樣本的鮮重、干重分別為84 g和15 g,其葉綠素含量和含水率為45 mg/ml和82%,同時葉面積指數(shù)和地上生物量檢測結(jié)果為1.9和2.81 g·m-2。
經(jīng)過相關(guān)系數(shù)的計算和分析,得出葉綠素含量和含水率與病害程度之間具有負相關(guān)關(guān)系,其值分別為0.81和0.74,而其他參數(shù)與病害程度的關(guān)系為正相關(guān)。再利用無人機的云臺相機和檢測程序?qū)λ緢D片進行光譜反射率的分析,生長期和病害程度的分析結(jié)果如圖5所示。
從圖5(a)中得出水稻營養(yǎng)生育期間的光譜曲線變化基本一致,其中波長600~800 nm之間的反射率逐漸上升,最高反射率達到0.35。而之后隨著波長的增長,反射率波動變化較小,且穩(wěn)定在0.3~0.4之間。在圖5(b)中得出水稻白葉枯病的病害嚴(yán)重程度所反映的光譜曲線存在重疊,但整體上不同程度的曲線存在差異,能夠為病害程度提供判斷依據(jù)。波長在700~750 nm之間,水稻光譜反射率在0.35左右,且曲線相互重合,說明水稻圖像特征的提取不明顯。但隨著波長的增加,病害程度的光譜反射率差異較為明顯,其中無病害的水稻光譜反射率高達0.48。
綜上所述,英文語音識別技術(shù)為無人機精確飛行和檢測作業(yè)提供較好的基礎(chǔ),使得無人機在穩(wěn)定飛行中實時提供圖片。在移動設(shè)備的應(yīng)用程序中,對水稻田監(jiān)測對象進行預(yù)處理和特征分析,從而反映出無人機對水稻的準(zhǔn)確檢測。
3" 結(jié)論
針對無人機檢測水稻的技術(shù)問題,研究提出使用英文語音識別模塊。用于無人機遠程控制系統(tǒng)中,從而建立基于英文語音識別的無人機檢測方法。根據(jù)大疆四旋翼無人機的語音控制測試,得出精簡的英文語音輸入指令對無人機控制的平均準(zhǔn)確率達到79%。隨著田間作業(yè)的指令不斷精細,其識別效果有所下降,因此指代的英文數(shù)字相比單詞的識別結(jié)果較高,整體提高了2.5%。最后利用具有英文語音識別模塊的無人機對水稻病害進行生理參數(shù)檢測,得出當(dāng)病害程度較低時,水稻檢測樣本的含水率高達84%,葉綠素含量為57 mg/ml。因此說明水稻檢測的參數(shù)與其病害程度具有較強的相關(guān)性,證明了研究方法在水稻田間檢測的優(yōu)越性。但無人機檢測水稻的應(yīng)用還需要其他方面的驗證,如水稻成熟度管理和產(chǎn)量預(yù)測等,其低空拍攝和懸停技術(shù)缺少因素研究,易影響圖片的誤差,所以后續(xù)研究在語音控制無人機的軟件分析上進行深入探索。英文語音識別技術(shù)的引入不僅簡化了無人機田間作業(yè)的操作,還為未來智慧農(nóng)業(yè)建設(shè)和國際農(nóng)業(yè)市場提供先進技術(shù),從而提高無人機產(chǎn)品及技術(shù)的綜合效益。
參考文獻:
[1] 謝冬梅,汪希成,伍駿騫.農(nóng)業(yè)機械化水平對中國糧食生產(chǎn)技術(shù)效率的空間溢出效應(yīng)研究——基于農(nóng)機跨區(qū)作業(yè)視角[J].中國農(nóng)機化學(xué)報,2023,44(3):223-231.
[2] Anand A, Deb C. The potential of remote sensing and GIS in urban building energy modelling[J]. Energy and Built Environment, 2024,5(6):957-969.
[3] 鄒耀鵬,裴杰,劉一博,等.田塊尺度水稻農(nóng)情遙感監(jiān)測平臺設(shè)計與試驗[J].中國農(nóng)機化學(xué)報,2024,45(10):233-240.
[4] 劉繼展,侯廣宇.語音技術(shù)在農(nóng)業(yè)智能化中的應(yīng)用展望[J].江蘇大學(xué)學(xué)報(自然科學(xué)版),2021,42(5):540-545.
[5] 李鵬,石永康,郭穩(wěn)敏,等.四旋翼植保無人機機臂折疊機構(gòu)輕量化設(shè)計[J].農(nóng)機化研究,2024,46(6):116-121.
[6] 李勝銘,邱世豪,呂宗陽,等.基于擾動觀測器的四旋翼無人機自適應(yīng)姿態(tài)控制方法[J].實驗室研究與探索,2024,43(3):1-5.
[7] 楊潤延,程高峰,劉建.基于端到端語音識別的關(guān)鍵詞檢索技術(shù)研究[J].計算機科學(xué),2022,49(1):53-58.
[8] 王斐斐,賁可榮,張獻.基于領(lǐng)域知識的語音識別魯棒性增強技術(shù)研究[J].計算機工程與科學(xué),2023,45(12):2155-2164.