王永賢 司紀鋒 王耀賓 劉偉濤 慈國慶 王志民 徐小亮
(中國科學(xué)院聲學(xué)研究所北海研究站 青島 266114)
隨著現(xiàn)代化海洋牧場建設(shè)的推進,魚類資源的時間和空間變化動態(tài)監(jiān)測需求日益迫切[1]?;诼晫W(xué)的魚種分類識別技術(shù)因其速度快、探測范圍廣等優(yōu)點,逐漸成為牧場魚類資源監(jiān)測與管理的重要手段。該技術(shù)的核心在于聲散射特征的提取及分析,其特征參數(shù)的選擇直接影響識別的速度與準確性。因此,有必要對魚聲散射信號的特征提取及融合方法進行深入研究。
當(dāng)發(fā)射的聲波傳播至目標處時,目標會將部分入射聲能轉(zhuǎn)化為散射聲能并向四周輻射,散射聲波的特性與目標的物理屬性和結(jié)構(gòu)形狀有關(guān)[2]。魚的聲散射特性是由魚組織器官的聲阻抗與水的聲阻抗存在差異所決定的。對于有鰾魚種,影響聲散射的因素主要是魚本身的種類、魚鰾、體長以及形狀[3]。另外,魚在不同發(fā)射聲波頻率和入射角度設(shè)定下,其散射特性也不同。
魚聲散射信號中含有大量魚種固有屬性信息,一部分研究人員通過分析信號的時頻域統(tǒng)計特征實現(xiàn)魚類識別。例如:許楓團隊[4-5]將聲散射信號的時域質(zhì)心和Walsh 譜作為魚類識別特征量,使用BP 神經(jīng)網(wǎng)絡(luò)分類器實現(xiàn)了3 種魚的分類。杜偉東等[6]將信號的小波包系數(shù)奇異值、時域質(zhì)心和離散余弦變換系數(shù)特征進行融合,支持向量機(Support vector machine,SVM)分類準確率達92%。Brundage 等[7]則通過分析信號的歸一化頻率響應(yīng)譜實現(xiàn)了底層魚類的識別。另一部分研究人員將接收到的多頻聲數(shù)據(jù)進行處理,依據(jù)頻響差異判別魚種類。例如:Sunardi 等[8]通過歸納38 kHz 和120 kHz 聲吶接收信號的目標強度(Target strength,TS),從底層魚類中識別出牛眼凹肩鯵(Selar boops)和鰱(Hypophthalmichthys molitrix)。
海洋中大多數(shù)魚類喜歡群居,魚群主要是由同種類的魚組成。受水深和換能器開角影響,聲吶難以保證同時探測到整個魚群的聲散射信號,所接收到的大多是單條魚和多條魚重疊的聲散射信號。因此,本文將研究重點放在不同種類間個體魚聲散射特征差異上,通過建立魚聲散射特征數(shù)據(jù)庫,達到對目標魚種聲散射信號的分類識別目的。本文以近岸4 種經(jīng)濟魚類為研究對象,通過繩系法實驗研究了魚聲散射信號的特征提取及融合方法,以期為實際漁業(yè)資源分類評估工作提供技術(shù)支撐。
不同魚種的外部形態(tài)各異,即使外部形態(tài)相似,其生理結(jié)構(gòu)也會有所差別。為了解決魚種的分類識別問題,本文嘗試從魚的頻率響應(yīng)特性和魚聲散射信號的時頻域信息中提取能較好表征魚種間差異的聲學(xué)參數(shù)。
TS是反映目標反射聲波強弱的物理量,魚類的TS 是應(yīng)用水聲學(xué)方法對漁業(yè)資源評估的重要參數(shù),影響魚類TS 的主要的因素是魚鰾、體長、換能器頻率和姿態(tài)角。
魚類TS一般定義為[9]
式(1)中,σbs為魚的后向散射截面(即魚體對入射聲波產(chǎn)生散射的等效面積),單位為m2。在遠場條件下,魚的后向散射截面等于魚鰾散射截面和魚體散射截面的疊加。
實驗中魚探儀直接測量的是反射電壓值,經(jīng)標準球校準的魚體TS計算公式為
式(2)中,Vf為魚體的反射電壓值,Vb為標準球的反射電壓值,TSb為標準球的TS,TSb=10 lg(r2/4),r為標準球的半徑,r=11.5×10-3m。
頻率響應(yīng)特性是指系統(tǒng)信號的振幅和相位受頻率變化而變化的特性,同種魚在行為和生理學(xué)特征上具有相似性,頻率響應(yīng)特性能一定程度上反映該種魚的固有屬性,文中用不同頻率下魚的TS 差值ΔTS表征魚的頻率響應(yīng)差異。
式(3)中,TSf1和TSf2分別為f1、f2 頻率下魚的TS。
時域質(zhì)心是一種描述信號在時間上集中程度的指標,可以反映魚聲散射信號在時間軸上的能量分布特性。時域質(zhì)心的計算公式為[4]
式(4)中,T為信號長度,x(t)為信號在t時刻的幅值。
假設(shè)目標回波的時間跨度為[0,T],通過計算整個目標回波的質(zhì)心C11,得到第二層的兩個時間段[0,C11]和[C11,T];分別對第二層兩個時間段計算質(zhì)心C21和C22,得到第三層3 個時間段[0,C21]、[C21,C22]、[C22,T];以此類推,完成對信號能量集中區(qū)的精細劃分。時域質(zhì)心分段示意圖如圖1所示。
圖1 時域質(zhì)心分段示意圖Fig.1 Time domain centroid segment diagram
小波包分解技術(shù)是將信號無冗余、正交的分解到獨立的頻帶內(nèi),子頻帶內(nèi)能量比例的變化可以反映不同目標回聲信號在頻域上的差異。小波包分解同時對原始信號和分解后的子信號的高頻和低頻部分進行分解,假設(shè)原始信號x(t)的數(shù)據(jù)長度為N,則分解頻帶中離散信號xk,m(i)的數(shù)據(jù)長度縮減為2-kN,第m個子頻帶的能量可表示為[10]
式(5)中,k表示分解次數(shù),m=0,1,2,···,2k-1,表示子頻帶的位置序號。
為了方便應(yīng)用,子頻帶能量采用歸一化相對能量,第m個子頻帶的相對能量為
式(6)中,E(x(t))為總頻帶能量。
Hilbert 邊際譜能反映整個時間跨度內(nèi)信號在每個頻率點上的能量積累分布情況,將Hilbert譜在時間軸上進行積分即可得到能量-頻率關(guān)系式[11]:
式(7)中,H(t,f)為Hilbert譜。
1.2 節(jié)表述了多種魚聲散射信號時頻特征提取方法,每種特征中的每個特征量對魚種分類識別的貢獻不同,提取出對分類貢獻大的特征量重新組合成一個新的特征量對提高運算速率和識別準確率具有十分重要的意義。
為了得到對分類貢獻較大的特征量,本文使用Fisher 判別函數(shù)評估兩個類別之間的距離[12-13],F(xiàn)isher判別函數(shù)可表示為
其中,D為判別比,j、k為物種類別,μj、?、μk、分別為第j、k物種的均值和方差。分子項表示該特征在兩物種間的整體差異,分母代表該特征的離散性。將兩兩魚種間時頻特征分別進行Fisher 判別,篩選出貢獻大的特征量組成新的特征向量。
課題組通過設(shè)置繩系法實驗采集近岸4 種經(jīng)濟魚類的聲散射信號,繩系法實驗布置示意圖如圖2所示。影響魚聲散射的主要因素是魚鰾、體長、姿態(tài)角以及換能器頻率,實驗設(shè)定如下。
圖2 繩系法實驗示意圖Fig.2 Schematic diagram of tethered experiment
實驗地點:為了首先實現(xiàn)北方海洋牧場等近岸海域的魚種分類評估,實驗地點選在海州灣海域的日照順風(fēng)陽光國家級海洋牧場示范區(qū)。
實驗用魚:實驗用魚選取4 種近岸常見經(jīng)濟魚類,分別為花鱸(Lateolabrax maculatus)、許氏平鲉(Sebastes schlegelii)、黑鯛(Acanthopagrus schlegelii)、斑石鯛(Oplegnathus punctatus),叉長分別為42 cm、30 cm、22 cm、20 cm;假設(shè)魚鰾等于魚體的1/3[14],花鱸、許氏平鲉、黑鯛、斑石鯛的魚鰾大小分別為14.0 cm、10.0 cm、7.3 cm、6.7 cm。實驗用魚如圖3所示。
圖3 實驗用魚Fig.3 Fish used in experiments
姿態(tài)角:考慮實際應(yīng)用中的垂直魚探儀主要照射魚體背部,實驗中設(shè)置魚體背對換能器(即魚的姿態(tài)角設(shè)定為0°),主要分析背部的回波。將魚線系在魚鰓上,魚線兩端分別固定于網(wǎng)箱兩側(cè)漁網(wǎng)上,調(diào)整魚線,保證個體魚位于換能器開角范圍內(nèi)。由于魚線較細,文中忽略魚線的影響。
換能器頻率:漁業(yè)資源評估中常用的換能器頻率是38 kHz、120 kHz 和200 kHz[9],考慮近岸海域中小型魚類居多,選用較高頻率的換能器能獲得更好的中小型魚檢出率和更多的魚體細節(jié)信息。實驗中選用中心頻率為200 kHz 和450 kHz 換能器,換能器主要參數(shù)見表1。在實驗前,根據(jù)國際通用TS校準法[15],用直徑23 mm 的標準銅球?qū)ψ匝须p頻魚探儀進行現(xiàn)場校正。
表1 自研雙頻魚探儀主要技術(shù)參數(shù)Table 1 The main technical parameters of the self-developed dual-frequency fish detector
根據(jù)單回波檢測準則[16]:單次回波的最小和最大長度一般為發(fā)射脈沖長度的0.6倍和1.8 倍,對應(yīng)的單程最大增益補償為3 dB。設(shè)定最小檢測門限值為-60 dB,自動提取大于門限值的回波。以200 kHz換能器采集數(shù)據(jù)為例,4 種魚回波信號的時域波形差異明顯,中心頻率未發(fā)生明顯偏移,如圖4所示。
圖4 魚聲散射信號Fig.4 Acoustic scattering signal of fish
2.2.1 TS測定
200 kHz 和450 kHz 換能器激勵下花鱸聲圖如圖5(a)所示,魚體回波清晰,上下網(wǎng)箱底面反射信號明顯,背景噪聲較小。上下網(wǎng)底及花鱸TS如圖5(b)所示,TS值通過式(2)置換法計算。
圖5 花鱸聲散射信號示例Fig.5 Examples of acoustic scattering signal of Lateolabrax maculatus
在200 kHz 和450 kHz 換能器激勵下,4 種魚聲散射信號的平均TS 如圖6 所示。200 kHz 換能器激勵時花鱸、許氏平鲉、黑鯛、斑石鯛平均TS 分別為-36.81 dB、-43.86 dB、-45.17 dB、-44.11 dB,450 kHz 換能器激勵時花鱸、許氏平鲉、黑鯛、斑石鯛平均TS 分別為-39.37 dB、-45.41 dB、-46.71 dB、-45.65 dB。
圖6 4 種魚TS 頻數(shù)分布Fig.6 Target strength frequency distribution of four fish species
統(tǒng)計結(jié)果顯示,魚的叉長與TS 值呈正相關(guān),魚在200 kHz 換能器下的TS 大于450 kHz 換能器下的TS。同一實驗條件下魚TS 值的波動主要是由魚呼吸時魚鰾的變化和魚體在水流作用下的微小擺動引起的,斑石鯛的TS 波動范圍大于其他3 種魚,認為與斑石鯛外形的“體側(cè)扁而高”特點有關(guān),體側(cè)較小幅度的傾斜會引起較大的TS 值波動。4 種魚在兩種頻率設(shè)置下TS 分布差異明顯,有利于魚種分類。
2.2.2 時頻特征
對提取的個體魚聲散射信號進行6 層時域質(zhì)心分割,時域質(zhì)心在波包中位置分布如圖7(a)所示。從圖中可以看出,許氏平鲉與花鱸的時域質(zhì)心分布差異最大,斑石鯛和許氏平鲉時域質(zhì)心分布較接近。
圖7 魚聲散射信號時頻域特征分布(200 kHz)Fig.7 Time and frequency domain characteristics distribution of fish acoustic scattering signal (200 kHz)
為了得到更多的頻域細節(jié)信息,對個體魚聲散射信號進行6 層小波包分解,共64 個特征量,信號采樣頻率為10 MHz,每個頻段寬度為78.125 kHz。個體魚聲散射信號各頻段能量占比如圖7(b)所示,從頻段能量分布中可以看出斑石鯛和許氏平鲉一致性較好,黑鯛和花鱸一致性較好。
200 kHz 換能器接收信號能量主要分布在200 kHz 附近,統(tǒng)計Hilbert 邊際譜在180~220 kHz間能量分布(間隔5 kHz),如圖7(c)所示,許氏平鲉回波能量最強,黑鯛回波能量最弱,4 種魚邊際譜特征在視覺上較易區(qū)別。
以上3 種時頻特征共包含78 個特征值,特征值數(shù)量過多會導(dǎo)致深度學(xué)習(xí)算法難以收斂,因此需要對其進行降維處理。兩兩魚類間樣本特征判別比如圖8 所示,從圖中可以看出許氏平鲉和其他3 種魚之間特征判別距離整體上大于其他魚種間判別比,說明許氏平鲉與其他3 種魚間聲散射差異較大。判別閾值設(shè)置為3 時,兩兩魚種間判別比之和大于閾值所對應(yīng)的特征值總數(shù)為6 個(包括1 個時域質(zhì)心特征、4 個小波包頻段能量特征和1 個Hilbert 邊際譜特征),通過Fisher 判別函數(shù)有效降低了特征值數(shù)量。
神經(jīng)網(wǎng)絡(luò)多分類方法采用3 層BP 神經(jīng)網(wǎng)絡(luò)分類器,學(xué)習(xí)過程采用自適應(yīng)學(xué)習(xí)方法[17]。輸入層神經(jīng)元數(shù)為特征個數(shù),隱含層包含25 個神經(jīng)元,輸出層為4個神經(jīng)元,代表4類目標。
SVM 多 分 類 方 法 采 用“one-against-rest”方法[18],通過構(gòu)造4 個兩分類器,第i個SVM 用第i類中的訓(xùn)練樣本做正樣本,其他樣本為負樣本,測試時讓每個訓(xùn)練樣本都經(jīng)過4 個分類器。
將采集的個體魚回聲數(shù)據(jù)分為兩組:第一組為訓(xùn)練樣本,每個類包含400 個樣本,共1600 個樣本;第二組為測試樣本,每個類包含100 個樣本,共400個樣本。
特征向量是由1 個頻差特征值和6 個時頻特征值組成的組合特征向量,分別基于頻差特征、時頻特征、頻差-時頻組合特征選用SVM 分類器對測試集進行識別,識別結(jié)果如表2所示,識別準確率分別為71%、84%、93%,組合特征識別準確率遠高于單一特征。
表2 3 種特征的SVM 分類器識別準確率統(tǒng)計Table 2 Statistical table of recognition accuracy of SVM classifier with three characteristics
分別使用BP 神經(jīng)網(wǎng)絡(luò)和SVM 分類器對訓(xùn)練集進行訓(xùn)練,基于組合特征的測試集數(shù)據(jù)識別結(jié)果如表3 所示,BP 神經(jīng)網(wǎng)絡(luò)分類準確率為90%,其中斑石鯛85%、黑鯛96%、許氏平鲉98%、花鱸82%;SVM 分類準確率為93%,其中斑石鯛94%、黑鯛96%、許氏平鲉98%、花鱸83%。
表3 基于組合特征的魚種類識別準確率統(tǒng)計Table 3 Statistical table of fish species identification accuracy based on combination features
當(dāng)前,魚類聲學(xué)特征量的測量方法主要有兩類:一類是通過搭建聲學(xué)實驗平臺測量行為受控魚類的聲學(xué)特征量,有繩系法、懸垂法和網(wǎng)箱法;另一類是通過建立模型來計算魚類聲學(xué)特征量,有經(jīng)驗統(tǒng)計模型和物理模型[14]。本文選擇繩系法實驗測量魚的聲學(xué)特征量,該方法能夠較好地控制魚的姿態(tài),但由于測量時魚體處于非自然狀態(tài),,無法真實反映聲波散射情況,會使測量結(jié)果產(chǎn)生一定偏差。而且在自然海域中,魚的游向、姿態(tài)以及魚鰾尺寸的改變也會導(dǎo)致接收信號聲學(xué)特征量的變化。因此,在后續(xù)的研究中,實驗可以從以下幾個方面進行改進:(1) 將實驗地點改為消聲水池,以消除水流動、環(huán)境噪聲及海底聲反射對信號采集質(zhì)量的影響。(2) 在現(xiàn)有實驗裝置基礎(chǔ)上增加機械旋轉(zhuǎn)結(jié)構(gòu),獲取魚在不同聲波入射角下的聲數(shù)據(jù),進一步研究魚體姿態(tài)變化對聲散射的影響。(3) 文中只對近岸4 種經(jīng)濟魚類的聲散射特征進行了研究,若要實現(xiàn)更廣泛的魚類目標識別,還需要增加目標樣本數(shù)和特征樣本數(shù)。(4) 通過量化魚在聲軸至聲束上下邊界處的衰減,對聲信號進行補償,同時,整合更多有效特征信息,例如寬帶特性、多頻特性,提升聲信號分析的準確性與魯棒性。
傳統(tǒng)聲散射信號分類方法中特征的提取主要基于信號的時域特性、頻域特性、相位特性及特殊聲音[5]。近年來,魚探儀在多波束、寬帶和多頻方向上發(fā)展迅速,這使得利用多元聲特征信息實現(xiàn)魚種的分類識別成為可能。Rogers 等[19]采用中心頻率為153.6 kHz 的換能器采集3 種魚寬帶聲散射信號,基于信號的寬帶特征對魚種進行分類,但現(xiàn)場識別效果并不理想,分析認為僅提取寬帶回波頻譜特征可能會使神經(jīng)網(wǎng)絡(luò)識別不可靠,寬帶聲信號的識別還需要包括其他特征。本文中同時提取了魚回波信號的時頻特征和頻差特征,將其組合特征作為魚種分類的判別依據(jù),這種特征提取方法不僅可以反映魚在時域和頻域中的信息,還可以體現(xiàn)魚類在不同頻率下的聲散射差異信息,是利用多元聲特征信息實現(xiàn)魚分類的一次成功嘗試。
本文通過繩系法實驗研究了近岸4 種經(jīng)濟魚類聲散射信號的特征提取及融合方法,得出如下結(jié)論:
(1) 姿態(tài)角為0°時,4 種實驗用魚(花鱸、許氏平鲉、黑鯛、斑石鯛)的平均TS 分別為-36.81 dB、-43.86 dB、-45.17 dB、-44.11 dB (200 kHz)/-39.37 dB、-45.41 dB、-46.71 dB、-45.65 dB(450 kHz)。
(2) 基于頻差特征、時頻特征、時頻和頻差組合特征的SVM 魚類識別準確率分別為71%、84%、93%,說明組合特征識別準確率遠高于單一特征,有效地增加判別依據(jù)可以明顯提高不同魚種間區(qū)分度。
(3) 所提方法對文中4 種魚類的識別效果較好,但作為魚類的識別還需要進一步開展工作。