曹曉慧,劉 晃,戚仁宇,張成林,劉世晶
循環(huán)水養(yǎng)殖大口黑鱸攝食顆粒飼料的聲學(xué)特征
曹曉慧1,2,劉 晃2※,戚仁宇1,2,張成林2,劉世晶2
(1. 上海海洋大學(xué)水產(chǎn)與生命學(xué)院,上海 201306;2. 中國水產(chǎn)科學(xué)研究院漁業(yè)機械儀器研究所,上海 200092)
為突破智能投飼系統(tǒng)的技術(shù)瓶頸,近年來采用被動聲學(xué)技術(shù)開展魚蝦攝食行為研究成為熱點之一。該研究主要采用被動聲學(xué)技術(shù)獲取單體大口黑鱸()攝食聲信號,從混合信號中提取完善的攝食信號,篩選可作為衡量大口黑鱸攝食活躍度的聲學(xué)特征參數(shù),以期對攝食活躍度進行量化。根據(jù)大口黑鱸喂食期間的同步音頻與視頻記錄,確定信號類別并進行標記,主要提取每次吞食飼料的時域與頻域特征,對比各參數(shù)與吞食次序之間的相關(guān)度。研究結(jié)果表明,攝食聲信號能量主要集中于4.2~7.4 kHz,且大口黑鱸吞食間隔與吞食次序呈正相關(guān),穩(wěn)定性較強;而時域特征中的波形振幅極差與頻域特征的功率積分值均與吞食次序呈負相關(guān)。吞食間隔、振幅極差及功率積分值均可以作為衡量攝食活躍度的量化指標,而共振峰與平均梅爾倒譜系數(shù)可作為攝食聲識別參數(shù),研究結(jié)果可為今后養(yǎng)殖魚類被動聲學(xué)智能投飼系統(tǒng)研發(fā)提供理論基礎(chǔ)。
水產(chǎn)養(yǎng)殖;攝食行為;聲信號;大口黑鱸
隨著集約化養(yǎng)殖密度的提高,水產(chǎn)養(yǎng)殖越來越依賴于人工配合飼料,根據(jù)2020年淡水鱸產(chǎn)業(yè)報告顯示,飼料占總成本的67.35%[1]。為使養(yǎng)殖飼料成本在可控范圍內(nèi)有所降低,目前最需解決精準控制投喂量的問題,以期在不影響?zhàn)B殖魚類本身正常生長情況下最大限度的提升飼料利用率。為實現(xiàn)精準控制并達到按需投喂,很多學(xué)者從養(yǎng)殖魚類行為入手,主要分析養(yǎng)殖魚類攝食行為,以期能夠得出攝食行為與飼料消耗量間的關(guān)系。目前觀察養(yǎng)殖魚類攝食行為的方式主要有機器視覺與被動聲學(xué)兩種[2]。
計算機視覺技術(shù)為記錄行為參數(shù)提供了一種自動化的、非入侵性的有效方法,對攝食行為的判斷是由攝食魚類運動導(dǎo)致的兩個連續(xù)圖像差異強度總和來確定的[3]。目前對于攝食活躍度的判斷依據(jù)有魚群的聚集程度[4-5]、運動狀態(tài)[6]、水花面積[7]等,其判斷準確性均達到90%以上。但計算機視覺技術(shù)對水質(zhì)和光照的要求較高,在實際養(yǎng)殖中會受水質(zhì)混濁、光線昏暗以及魚群密度的影響,因此難以適用于目前的高密度養(yǎng)殖。但是,采用被動聲學(xué)技術(shù)可以克服這些不足,已成為獲取水生生物信息的重要工具。被動聲學(xué)技術(shù)主要運用水聽器監(jiān)測水生生物發(fā)聲獲得聲信號,不會對監(jiān)測目標產(chǎn)生危害[8],并且聲學(xué)技術(shù)穩(wěn)定,以水為媒介可進行可靠的遠距離信息傳輸,具有很強的抗干擾能力。Silva等[9]分析不同體型的凡納濱對蝦()聲學(xué)特性,認為凡納濱對蝦攝食時所產(chǎn)生的聲信號可以作為衡量飼料消耗量的指標。Peixoto等[10]以不同飼料長度為變量仍然得到凡納濱對蝦的攝食聲信號具有評估飼料消耗的潛能。這些結(jié)論不僅存在于蝦類中,Lagardère等[11]也發(fā)現(xiàn)大菱鲆()的攝食聲信號會隨著攝食強度而變化,之后又發(fā)現(xiàn)利用水聽器測量的攝食聲信號與人工估計的喂食量之間存在線性關(guān)系[12],再次證明了養(yǎng)殖魚類的攝食聲信號可以衡量魚類的攝食活躍度。
對養(yǎng)殖魚類攝食行為的量化分析可以提供更可靠的決策支持,減少對人工養(yǎng)殖經(jīng)驗的依賴,從而提高產(chǎn)量,促進節(jié)能降耗。而目前養(yǎng)殖魚類聲信號分析中,并沒有準確提取的特征參數(shù),或者參數(shù)較為單一。多特征融合的量化特征,能夠建立準確的攝食聲學(xué)模型,從而達到高判別準確度。但目前對于養(yǎng)殖魚類攝食聲信號研究仍處于起始階段,因群體攝食聲信號較為雜亂,不利于聲學(xué)特征的提取,且群體攝食的聲學(xué)特征參數(shù)與攝食活躍度的關(guān)系較為復(fù)雜。因此本文針對攝食聲信號與攝食活躍度研究從單體入手,以大口黑鱸()為試驗對象,利用不同體型大小的大口黑鱸攝食聲信號進行特征篩選與統(tǒng)計分析,確定聲學(xué)特征參數(shù)的提取范圍。以期得到準確的量化參數(shù),擬為下一步群體攝食聲信號研究提供明確的研究方向。
聲信號采集地點為中國水產(chǎn)科學(xué)研究院漁業(yè)機械儀器研究所魚類行為觀察實驗室(上海市楊浦區(qū)赤峰路63號)。試驗所用大口黑鱸魚苗均采購于愛科漫(上海)農(nóng)業(yè)有限公司,將其魚苗暫養(yǎng)于直徑2m的工廠化循環(huán)水系統(tǒng)中,暫養(yǎng)期間的每天投喂量約為體質(zhì)量的3%~4%,飼喂飼料均為硬顆粒浮性飼料。養(yǎng)殖3個月后待狀態(tài)穩(wěn)定進行試驗,試驗中隨機從暫養(yǎng)池中選取單條大口黑鱸進行攝食聲采集。在聲信號采集前,為保持試驗對象對飼料的興趣,投喂間隔不少于1 d。研究共選用6條大口黑鱸進行試驗(體長如表1所示)。
表1 試驗對象統(tǒng)計表
試驗池為1.5 m×1 m×1.5 m的透明玻璃水池,并內(nèi)置小型循環(huán)水系統(tǒng),具體試驗系統(tǒng)如圖1所示。本試驗采用聲像同步方法記錄大口黑鱸每次的攝食過程,其錄音裝置主要是由AquaSound水聽器測量系統(tǒng)(水聽器型號:AQH-020;頻率范圍:20 Hz~20 kHz,前置放大器型號:Aquafeeler Ⅳ;增益控制:20~70 dB,日本京都大學(xué)信息學(xué)研究院);Roland QUAD-CAPTURE外置聲卡(型號:UA-55,臺灣樂蘭企業(yè)股份有限公司),錄像裝置為SPORTS CAMERA4K高清防抖數(shù)碼攝像機(型號:QOER V70,深圳市真視界科技有限公司)。采集的音頻數(shù)據(jù)將以.wav文件存儲于電腦,視頻以.MP4存儲于內(nèi)存卡,用于后期處理。本研究中,錄音采樣頻率設(shè)定為96 kHz,采樣精度為24 bit,采樣通道為單通道,增益為50 dB。
音頻數(shù)據(jù)在采集過程中會存在多種狀態(tài)聲音和無效聲段,因此需要進一步地進行手工切分,并對需要的聲音片段進行標記,以構(gòu)成試驗所需聲信號。利用Adobe Audition 2020音頻處理軟件中的多軌模式對聲像進行同步處理,根據(jù)聲信號的波動與圖像中的行為確定攝食聲信號并對音頻進行標記,之后對標記的音頻進行手動切分。根據(jù)獲得的攝食音頻可發(fā)現(xiàn),大口黑鱸每次吞食聲信號可持續(xù)100~200 ms,可由Adobe Audition頻譜中明確觀察吞食信號的能量變化,確保每次吞食信號的完整性。本研究在每次采集聲信號過程中,為盡可能保持背景噪聲的穩(wěn)定性,會將循環(huán)系統(tǒng)關(guān)閉,并先錄取3 min左右的背景噪聲。其中背景噪聲的聲壓級(SPL)均在65 dB左右,當大口黑鱸出現(xiàn)吞食信號或其他行為聲信號時,SPL均會出現(xiàn)明顯的波動,峰值均在72 dB以上。
攝食聲信號預(yù)處理過程如圖2所示,特征提取之前需要對聲信號進行預(yù)處理,此過程包括數(shù)字轉(zhuǎn)換(A/D轉(zhuǎn)換)、降噪、預(yù)加重、加窗分幀等。
模數(shù)轉(zhuǎn)換(A/D)轉(zhuǎn)化又稱為數(shù)字化,可更方便更準確的對聲信號進行分析處理,本研究采用Roland QUAD-CAPTURE聲卡完成。
降噪可將攝食聲信號較為清晰的從混合信號中提取出來,經(jīng)頻譜圖可得背景噪聲干擾最大的頻率范圍主要集中在1~1 000 Hz,與攝食聲信號頻率范圍存在明顯分段。本研究采用子空間語音增強算法,通過空間分解將整個聲信號分解為噪聲子空間和含有噪聲的聲信號空間,將噪聲子空間去除,并采用最優(yōu)估計器來估計攝食信號特征值,進而實現(xiàn)信號增強。經(jīng)降噪后攝食聲信號信噪比可提高至70 dB以上。
預(yù)加重可避免攝食信號的高頻分量削弱,本研究使用預(yù)加重濾波器來強化高頻部分,預(yù)加重系數(shù)通常取0.9~1.0,本研究依經(jīng)驗值取0.97。
大口黑鱸攝食聲信號與語音信號相似,同樣具有短時平穩(wěn)的特點,并對其進行分幀處理提取短時特性,為減少幀與幀之間的不連續(xù)性,選取窗函數(shù)為漢明窗[13],此外本研究根據(jù)大口黑鱸攝食聲信號特征,選取幀長為100 ms,幀移為50 ms。
所采集到的大口黑鱸攝食聲信號中一般長達10 min左右,期間存在非攝食信號與無聲段,因此為準確確定每次吞食飼料的起始點,改善后期處理效率,本研究通過幀能量與幀過零率對聲信號進行重采樣。
聲信號本身就是時域信號,針對完整的攝食聲信號可提取到吞食間隔、振幅極差、振幅最大值。吞食間隔:為兩次吞食顆粒飼料的時間差,如圖 3中所示;振幅極差:為每個吞食信號振幅最大值與最小值的差,也就是電壓峰-峰值,如圖3中Vpp所示;振幅最大值:為每個吞食信號振幅的最大值,如圖3中所示。
功率譜反應(yīng)聲信號在不同頻率上的能量大小,通常采用快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)將時域信號轉(zhuǎn)化為頻域信號得到頻譜圖,公式如下:
共振峰是聲信號頻譜中在特定頻率區(qū)域聚集大量聲能的表現(xiàn),反映了聲道的物理特性。對聲信號進行倒譜處理,將激勵信號與聲道響應(yīng)分離,去除激勵信號后做傅里葉變換,以得到聲道響應(yīng)包絡(luò),在包絡(luò)上尋找最大值便是共振峰頻率。
梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficients,MFCC)是在Mel標度頻率域提取出的倒譜參數(shù),更著眼分析人耳的聽覺機理[14]。對每幀進行傅里葉變換、三角形梅爾濾波器、離散余弦變換得到梅爾倒譜系數(shù)(C),而平均梅爾頻率倒譜系數(shù)(Average Mel-Frequency Cepstral Coefficients,AMFCC)為所有幀倒譜系數(shù)(C)的平均值(M),即
其中,=1,2,...,12,i()為第1幀的第一個接收系數(shù),為吞食信號幀數(shù)。
本研究中所有聲學(xué)特征參數(shù)均由MATLAB R2019a運算獲得。
為判斷各特征參數(shù)隨著大口黑鱸攝食聲信號的變化規(guī)律,該研究利用Minitab 17進行統(tǒng)計分析,主要利用Pearman相關(guān)來測量特征參數(shù)與吞食次序的相關(guān)性,與LSD方法進行單因素多重比較顯著性分析,比較個體間的差異性。
在時域特征分析中常用的參數(shù)有短時能量、短時過零率、持續(xù)時間等[15],都可在波形圖中通過計算直接得到。本研究通過時域特征分析,對提取的振幅極差、振幅最大值、吞食間隔分別與吞食次序做相關(guān)性分析。從6條試驗個體中隨機選取3次攝食聲信號,每次吞食次數(shù)均在10次以上,并對各相關(guān)系數(shù)做顯著性分析,結(jié)果如表2所示。發(fā)現(xiàn)6條試驗個體的吞食次序與振幅極差、振幅最大值均呈負相關(guān),與吞食間隔呈正相關(guān)。
大口黑鱸吞食飼料顆粒后聲信號會隨之產(chǎn)生波動,振幅是聲信號波動最為直觀的特征,同時也在一定程度上反應(yīng)此次吞食的能量大小。而在實際養(yǎng)殖中魚類攝食活躍度會隨攝食次數(shù)的增加而降低,即吞食顆粒飼料的能量以及攝食積極性隨之降低。因此提取每次吞食信號的振幅極差、振幅最大值與吞食間隔作為衡量攝食活躍度的量化參數(shù)。而攝食次數(shù)則由吞食次序表示,吞食次序是指按照吞食時間依次排序,如第一次吞食飼料產(chǎn)生的聲信號為吞食次序1,第二次為吞食次序2,以此類推為1,2,...,。其中吞食間隔是較為直觀的量化值,因吞食間隔需在第二次吞食后才有數(shù)據(jù)累計,所以與吞食次序的相關(guān)性序列以2開始(如2,3,...,),其余特征參數(shù)與吞食次序的相關(guān)性序列均為1,2,...,。
由表2可知,振幅極差與吞食次序的相關(guān)系數(shù)均在-0.61以下,且6條試驗樣本(以下相同)間無顯著性差異,振幅最大值與吞食次序的相關(guān)系數(shù)在-0.61以下,且個體之間也無顯著性差異。從相關(guān)系數(shù)看,時域特征中吞食間隔與吞食次序的相關(guān)性最好,相關(guān)系數(shù)均大于0.67,呈正相關(guān),雖然表中A1個體的相關(guān)系數(shù)與其他個體之間存在一定的差異性,但相關(guān)系數(shù)卻最大,故此差異可忽略不計。
表2 振幅極差、振幅最大值、吞食間隔相關(guān)系數(shù)顯著性分析
注:表格中同列相同小寫字母表示差異不顯著(>0.05),不同小寫字母表示差異顯著(<0.05)。
Note: In the column, values with same small letter mean no significant differences (>0.05) different small letter mean significant differences (<0.05).
如圖4a所示為某次大口黑鱸吞食飼料的波形圖,圖 4b為其相對應(yīng)的頻域信號即功率圖,圖中每個頻率對應(yīng)的功率之和稱為功率積分值,峰值為功率最大值(如圖中峰值為-71.44 dB)。按照吞食次序依次提取功率積分與最大值,并統(tǒng)計與吞食次序的相關(guān)性系數(shù)以及值大?。ㄒ?0.05為標準),從每條試驗個體中隨機選取3次攝食信號,每完整的攝食信號可獲得一個相關(guān)系數(shù)與值,每個聲學(xué)特征參數(shù)與吞食次序均可獲得18個相關(guān)系數(shù),結(jié)果如圖4c所示。發(fā)現(xiàn)功率最大值與功率積分值均與吞食次序呈負相關(guān)。
經(jīng)對多條大口黑鱸攝食聲信號功率譜分析可得其攝食聲信號頻率范圍為1~10 kHz,功率范圍為-130~-70 dB,但其較大能量普遍集中于4~7 kHz范圍內(nèi),如圖4c中突出曲線部分。而功率最大值與功率積分值與吞食次序的相關(guān)性存在明顯的差異,因功率最大值與吞食次序有3次不存在相關(guān)性,功率積分值有2次,且功率最大值的值波動明顯較大,遠超于=0.05的界限。未被直線連接的散點圖表示每次攝食信號功率最大值和功率積分值與吞食次序的相關(guān)系數(shù),在圖中可明顯看出圓形點比方形點更加接近于-1。從相關(guān)系數(shù)大小與值波動可以確定功率積分值與吞食次序的相關(guān)性更好,可達-0.90以下,因此在頻域特征中單次吞食信號的功率積分值可以作為衡量攝食活躍度的量化參數(shù)。
共振峰一般包括共振峰的頻率位置和頻帶寬度,在不同情感或者不同應(yīng)激條件下聲信號的共振峰位置不同[16]。根據(jù)這一特性,共振峰常常被選為識別物種發(fā)聲的重要特征之一,本研究從6條試驗個體中隨機選取300次吞食信號提取第一、二共振峰,而第一共振峰分布較為密集,如圖5a所示,且第一共振峰位置主要集中于4.2~7.4 kHz左右,如圖5b所示。
在聲信號分析中第一、二、三共振峰均有一定的參考價值,但分析過程中發(fā)現(xiàn)第三共振峰分布較為分散,無規(guī)可尋。而第二共振峰在10~40 kHz均有分布,且在15 與22 kHz左右分布較為密集,中間存在斷層,30 kHz以上分布較少,因此不可做為大口黑鱸的攝食聲學(xué)特征。第一共振峰集中分布在5 kHz左右,且數(shù)據(jù)特點符合正態(tài)分布,根據(jù)95%置信區(qū)間可得第一共振峰密度分布圖如圖5b所示,可確定大口黑鱸攝食的第一共振峰范圍為4.2~7.4 kHz左右,這與功率譜中主要能量頻率范圍一致。但所有共振峰與吞食次序并無明顯的相關(guān)性,該聲學(xué)參數(shù)不能作為衡量攝食活性的量化指標。
AMFCC中Mel標度描述了人耳頻率的非線性特性,大體上對應(yīng)于實際頻率的對數(shù)分布關(guān)系,在語音與動物發(fā)聲識別中運用廣泛[17-18]。本研究選取6條大口黑鱸攝食聲信號,提取吞食信號的AMFCC變化曲線,結(jié)果如圖6所示,吞食信號在系數(shù)3處均有明顯峰值。
圖中每條曲線代表一次吞食信號的AMFCC變化趨勢,其中共包含13個AMFCC,第一個系數(shù)為平均幀能量系數(shù)。大口黑鱸每次攝食均包含若干次吞食信號,因此將每次吞食信號的AMFCC疊加可看出統(tǒng)一變化趨勢,如圖6a代表試驗樣本A1某次完整攝食的AMFCC整體變化趨勢。觀察A1至A6可以看出第3系數(shù)明顯小于其余系數(shù),第1系數(shù)至第3系數(shù)的變化趨勢存在明顯類似,均會在第2系數(shù)處出現(xiàn)拐點。第4系數(shù)至第13系數(shù)雜亂無章,不存在明顯的統(tǒng)一變化趨勢。第3系數(shù)處的峰值最為明顯且統(tǒng)一,可作為大口黑鱸吞食信號的聲學(xué)特征。
由于生活環(huán)境復(fù)雜,水生生物聲學(xué)研究較為困難,魚類不具有發(fā)聲器官-聲帶,發(fā)聲機理與其他陸地動物也存在明顯區(qū)別。目前對于魚類的發(fā)聲方式共有摩擦機制、鼓聲機制、弦式機制、空化機制、水動力機制、充氣機制、呼吸機制和敲擊機制8種[19]。但針對與某種特定魚類的發(fā)聲機制卻很難抉擇。本研究以大口黑鱸為試驗對象,共篩選出振幅極差、振幅最大值、功率積分值、吞食間隔4種可衡量大口黑鱸攝食活躍度的聲學(xué)參數(shù),但振幅極差、振幅最大值與功率積分值三者為非獨立性參數(shù),因此只能選擇其中之一。雖然振幅極差、振幅最大值與吞食次序的相關(guān)程度從相關(guān)系數(shù)看相差并不明顯,但在同一次攝食聲信號中振幅極差與吞食次序的相關(guān)系數(shù)更優(yōu)于振幅最大值的相關(guān)系數(shù),因此振幅極差作為衡量攝食活躍度更為穩(wěn)定。在功率譜分析中,發(fā)現(xiàn)功率積分值與吞食次序呈負相關(guān),即隨著吞食次序的增加攝食功率呈逐漸減小的趨勢,這與Lagardère等[11]以及湯濤林等[20]的研究結(jié)果相同,再次證明了這一結(jié)果的普遍性,與發(fā)展?jié)摿?。而功率積分值與吞食次序的相關(guān)程度較振幅極差更佳。但從實際應(yīng)用角度考慮,在聲信號處理過程中吞食功率積分值的提取在重采樣過程中較為繁瑣,沒有明確的端點閾值而易受人為主觀因素的影響。因此,三者中振幅極差作為衡量大口黑鱸攝食活躍度的聲學(xué)特征參數(shù)更佳。吞食間隔是對完整攝食信號進行分析,是較為直觀的量化指標,不涉及分幀加窗、重采樣繁瑣的處理過程,但人為標記工作量大且速度緩慢,若能將攝食聲信號進行準確識別,便可以解決這一弊端。將對之后攝食聲學(xué)投飼系統(tǒng)模型構(gòu)建提供良好的基底。
大口黑鱸攝食聲信號頻率范圍為1~10 kHz,而大菱鲆、虹鱒(Oncorhynchus mykiss)的最大能量分別集中于7~9 kHz與4~6 kHz[21],產(chǎn)生差異的主要原因是由于攝食方式以及發(fā)聲機制的不同。根據(jù)大口黑鱸吞食信號的聲音與特性,比較符合空化發(fā)聲機制??栈瘷C制是最早確定在魚類喂食過程中產(chǎn)生的,魚類攝食時嘴巴突然張開造成內(nèi)部負壓,食物因壓力作用被吸入嘴巴,隨后由于壓力迅速下降導(dǎo)致出現(xiàn)空化氣泡,伴隨聲音脈沖的產(chǎn)生[22]。除此之外,鼓聲機制也有可能參與攝食發(fā)聲,雖然魚鰾振動產(chǎn)生的聲音頻率較低(1 kHz左右),但會受到發(fā)聲肌以及堅硬構(gòu)造摩擦的影響,從而產(chǎn)生會高頻信號。
共振峰與AMFCC是作為聲學(xué)識別最常見的兩種特征。如宣傳忠等[23]運用功率譜與共振峰兩種特征參數(shù)對母羊的發(fā)聲進行識別,結(jié)果表明共振峰特征參數(shù)的識別率高于功率譜特征參數(shù)。除此之外在識別家禽發(fā)聲特性與行為間的關(guān)系中,共振峰特性也是重要的聲學(xué)特征參數(shù)之一[24]。因此第一共振峰頻率范圍可作為識別大口黑鱸攝食聲學(xué)特征。雖然MFCC比線性預(yù)測倒譜系數(shù)(Linear Prediction Cepstral Coefficients,LPCC)具有更好的棒魯性,但李志忠等[25]在識別蛋雞叫聲中發(fā)現(xiàn)AMFCC方法的識別準確率高于LPCC與MFCC。Lee等[26]人在識別動物發(fā)聲中也認為AMFCC的性能更優(yōu)于平均線性倒譜系數(shù)(Average Linear Prediction Cepstral Coefficients,ALPC)。并且AMFCC表征了魚類的聲紋信號,是基于人類聽覺感知的低頻包絡(luò),不同魚種的AMFCC有不同的變化趨勢。但大口黑鱸與鯉科魚類相似都是僅有一個峰值,而草魚()有3處峰值[27],造成這種結(jié)果的原因可能是由于不同魚種間的體型、鰭的大小以及魚體的長寬比例不同。但同一魚種的AMFCC變化趨勢特點不會隨著魚群數(shù)量的變化而改變,也因此可以作為識別魚類種類的聲學(xué)特征。雖然具有一定的唯一性,但在攝食過程中會出現(xiàn)很多異常信號,例如吞食后嘴巴會冒出類似于吞食聲信號的氣泡以及水面擺尾聲等信號,都屬于大口黑鱸的發(fā)聲,因此仍需提取更多聲學(xué)參數(shù)特征才能達到更高的準確率。在信號分析過程中,不以視頻為參考僅通過人耳也可識別出大口黑鱸的吞食信號,雖然會受某些異常信號的干擾,但仍可大概率做出正確判斷。后期若建立足夠大的信息量,將各種信號分別提取,并識別其特征參數(shù),就可達到準確識別。
1)時域特征中振幅極差與吞食次序相關(guān)性最佳,呈負相關(guān)。吞食間隔作為最直觀的特征參數(shù)與吞食次序呈正相關(guān)。隨著吞食次序的增加,電壓峰峰值逐漸降低,吞食間隔逐漸變大。
2)頻域特征中每次吞食信號的功率積分值與吞食次序相關(guān)性最佳,呈負相關(guān)。隨著吞食次序的增加功率積分值逐漸降低。
3)大口黑鱸吞食信號的第一共振峰分布范圍為4.2~7.4 kHz左右。AMFCC趨勢中,均在第三系數(shù)處有明顯峰值。二者可作為大口黑鱸吞食聲信號自動識別的特征參數(shù)。
[1] 國家特色淡水魚產(chǎn)業(yè)技術(shù)體系. 中國淡水鱸產(chǎn)業(yè)發(fā)展報告[J]. 中國水產(chǎn),2021(3):40-48.
National characteristic freshwater fish industry technology system. China freshwater bass industry development report[J]. China Fisheries, 2021(3): 40-48. (in Chinese with English abstract)
[2] Li D L, Wang Z H, Wu S Y, et al. Automatic recognition methods of fish feeding behavior in aquaculture: A review[J]. Aquaculture, 2020, 528: 735508.
[3] Liu Z Y, Li X, Fan L Z, et al. Measuring feeding activity of fish in RAS using computer vision[J]. Aquacultural Engineering, 2014, 60: 20-27.
[4] Zhou C, Lin K, Xu D, et al. Near infrared computer vision and neuro-fuzzy model-based feeding decision system for fish in aquaculture[J]. Computers and Electronics in Agriculture, 2018, 146: 114-124.
[5] 陳彩文,杜永貴,周超,等. 基于圖像紋理特征的養(yǎng)殖魚群攝食活動強度評估[J]. 農(nóng)業(yè)工程學(xué)報,2017,33(5):232-237.
Chen Caiwen, Du Yonggui, Zhou Chao, et al. Evaluation of feeding activity of shoal based on image texture[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(5): 232-237. (in Chinese with English abstract)
[6] 陳志鵬,陳明. 基于光流法與圖像紋理特征的魚群攝食行為檢測[J]. 南方農(nóng)業(yè)學(xué)報,2019,50(5):1141-1148.
Chen Zhipeng, Chen Ming. Detection of shoal feeding behavior based on optical flow methods and image texture[J]. Journal of Southern Agriculture, 2019, 50(5): 1141-1148. (in Chinese with English abstract)
[7] 胡利永,魏玉艷,鄭堤,等. 基于機器視覺技術(shù)的智能投餌方法研究[J]. 熱帶海洋學(xué)報,2015,34(4):90-95.
Hu Liyong, Wei Yuyan, Zheng Di, et al. Research on intelligent bait casting method based on machine vision technology[J]. Journal of Tropical Oceanography, 2015, 34(4): 90-95. (in Chinese with English abstract)
[8] Chen G, Cai L. Survey of Marine Organisms Based on Passive Acoustic Technology[J]. International Journal of Design & Nature and Ecodynamics, 2020, 15(5): 729-737.
[9] Silva J F, Hamilton S, Rocha J V, et al. Acoustic characterization of feeding activity of Litopenaeus vannamei in captivity[J]. Aquaculture, 2019, 501: 76-81.
[10] Peixoto S, Soares R, Allen D D. An acoustic based approach to evaluate the effect of different diet lengths on feeding behavior of Litopenaeus vannamei[J]. Aquacultural Engineering, 2020, 91: 102114.
[11] Lagardère J P, Mallekh R. Feeding sounds of turbot (Scophthalmus maximus) and their potential use in the control of food supply in aquaculture: I. Spectrum analysis of the feeding sounds[J]. Aquaculture, 2000, 189(3): 251-258.
[12] Mallekh R, Lagardère J P, Eneau J P, et al. An acoustic detector of turbot feeding activity[J]. Aquaculture, 2003, 221(1-4): 481-489.
[13] 李宏松,蘇健民,黃英來,等. 基于聲音信號的特征提取方法的研究[J]. 信息技術(shù),2006(1):91-94.
Li Hongsong, Su Jianmin, Huang Yinglai, et al. The research on characteristics extraction based on voice signal[J]. Information Technology, 2006(1): 91-94. (in Chinese with English abstract)
[14] 梁維謙,許海國,陳一寧等. 應(yīng)用于語音識別片上系統(tǒng)的語音檢測算法[J]. 電路與系統(tǒng)學(xué)報,2003(2):66-70.
Liang Weiqian, Xu Haiguo, Chen Yining, et al. Two Forms of Ohm's Law on Anisotropic Basic Electronic Elements[J]. Journal of Circuits and Systems, 2003(2): 66-70. (in Chinese with English abstract)
[15] 張雪英. 數(shù)字語音處理及MATLAB仿真第2版[M]. 北京:電子工業(yè)出版社,2016:27-48.
[16] 余伶俐,蔡自興,陳明義. 語音信號的情感特征分析與識別研究綜述[J]. 電路與系統(tǒng)學(xué)報,2007(4):76-84.
Yu Lingli, Cai Zixing, Chen Mingyi. Study on emotion feature analysis and recognition in speech signal: An overview[J]. Journal of Circuits and Systems, 2007(4): 76-84. (in Chinese with English abstract)
[17] Sithara A, Thomas A, Mathew D. Study of MFCC and IHC feature extraction methods with probabilistic acoustic models for speaker biometric applications[J]. Procedia Computer Science, 2018, 143: 267-276.
[18] Zgank A. Acoustic monitoring and classification of bee swarm activity using MFCC feature extraction and HMM acoustic modeling: 2018 ELEKTRO,2018[C]. Mikulov: Czech Republic IEEE, 2018.
[19] Kasumyan A. O. Sounds and sound production in fishes[J]. Journal of Ichthyology, 2008, 48(11): 981-1030.
[20] 湯濤林,唐榮,劉世晶,等. 羅非魚聲控投餌方法[J]. 漁業(yè)科學(xué)進展,2014,35(3):40-43.
Tang Taolin, Tang Rong, Liu Shijing, et al. Acoustic control of feeding in Tilapia culture[J]. Progress in Fishery Sciences, 2014, 35(3): 40-43. (in Chinese with English abstract)
[21] Lagardère J. P, Mallekh R, Mariani A. Acoustic characteristics of two feeding modes used by brown trout (Salmo trutta), rainbow trout (Oncorhynchus mykiss) and turbot (Scophthalmus maximus)[J]. Aquaculture, 2004, 240(1-4): 607-616.
[22] Muller M, Osse J W M. Hydrodynamics of suction feeding in fish[J]. The Transactions of the Zoological Society of London, 1984, 37(2): 51-135.
[23] 宣傳忠,武佩,馬彥華,等. 基于功率譜和共振峰的母羊發(fā)聲信號識別[J]. 農(nóng)業(yè)工程學(xué)報,2015,31(24):219-224.
Xuan Chuanzhong, Wu Pei, Ma Yanhua, et al. Vocal signal recognition of ewes based on power spectrum and formant analysis method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(24): 219-224. (in Chinese with English abstract)
[24] 余禮根,滕光輝,李保明,等. 蛋雞發(fā)聲音頻數(shù)據(jù)庫的構(gòu)建與應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報,2012,28(24):150-156.
Yu Ligen, Teng Guanghui, Li Baoming, et al. Development and application of audio database for laying hens[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(24): 150-156. (in Chinese with English abstract)
[25] 李志忠,滕光輝. 基于改進MFCC的家禽發(fā)聲特征提取方法[J]. 農(nóng)業(yè)工程學(xué)報,2008(11):202-205.
Li Zhizhong, Teng Guanghui. Feature extraction for poultry vocalization recognition based on improved MFCC[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2008(11): 202-205. (in Chinese with English abstract)
[26] Lee C H, Chou C H, Han C C, et al. Automatic recognition of animal vocalizations using averaged MFCC and linear discriminant analysis[J]. Pattern Recognition Letters, 2006, 27(2): 93-101.
[27] Tu Q Z, Huang H Y, Li L, et al. Feature extraction and analysis of passive underwater acoustic signals for different species and quantities of freshwater fish[J]. Transactions of the ASABE, 2018, 61(5): 1505-1513.
Acoustic characteristics of the feeding pellets forin circulating aquaculture
Cao Xiaohui1,2, Liu Huang2※, Qi Renyu1,2, Zhang Chenglin2, Liu Shijing2
(1.,,201306,; 2.,,200092,)
A passive acoustic technology has been widely used to monitor the behavior of aquatic organisms for the intelligent feeding system in recent years. Taking six sizesofas research objects, this study aims to acquire the acoustic signals of pelletfeeding in circulating aquaculture using passive acoustic techniques. The signals were first identified to classify for the post-processing using simultaneous audio and video recordings during feeding. The feeding activity was then quantified to extract and screen the characteristic parameters from the acoustic signals. Six kinds of pre-processing were utilized for thefeeding sound signals, including A/D conversion, denoise, pre-emphasis, windowed framing, and endpoint detection. A Fast Fourier transform, real-time, and Mel frequency cepstrum methods were also used to extract the time- and frequency-domain features of each swallowing signal in the complete feeding acoustic signal, in order to obtain the correlation between each acoustic feature parameter and the swallowing order. Specifically, the swallowing interval, the peak-to-peak value of voltage, and the maximum amplitude were extracted from the time-domain features. It was found that the swallowing interval was positively correlated with the order of swallowing (>0.68), whereas, the maximum and range amplitude was negatively correlated with the order of swallowing (<-0.61), but there was no significant difference between the correlation coefficient of three time-domain characteristic parameters. Furthermore, the maximum sum of power intensity and integral value was extracted from the power spectrum of each swallowing signal. Among them, P=0.05 was assumed as the basis to evaluate the integral value of power, where a more stable and reliable measurement was achieved for the characteristic parameters of feeding activity. In addition, the formant frequency and the average Mel cepstrum coefficient (AMFCC) were extracted to find each acoustic signal of feeding mainly in 4.2-7.4 kHz. More importantly, the third coefficient in AMFCC presented an outstanding and stable peak. Particularly, the feeding activity decreased significantly, as the feeding sequence increased. The extraction of power integral parameters depended significantly on subjective factors, although both time domain and frequency domain parameters presented an excellent correlation with the order of swallowing. The feature parameters of the time domain also behaved more reliable stability. Subsequently, the feature parameters for the activity of eating were screened out, according to the correlation between the acoustic feature parameters of ingestion and the order of swallowing. Correspondingly, the feature parameters of multi-feature fusion can be expected to better quantify the feeding activity, indicating the best choice for the swallowing interval and peak-to-peak value of voltage. The finding can also provide theoretical support to identify the sound signal of farmed fish in the intelligent feeding system.
aquaculture; feeding behavior; acoustic signal;
曹曉慧,劉晃,戚仁宇,等. 循環(huán)水養(yǎng)殖大口黑鱸攝食顆粒飼料的聲學(xué)特征[J]. 農(nóng)業(yè)工程學(xué)報,2021,37(20):219-225.doi:10.11975/j.issn.1002-6819.2021.20.025 http://www.tcsae.org
Cao Xiaohui, Liu Huang, Qi Renyu, et al. Acoustic characteristics of the feeding pellets forin circulating aquaculture[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(20): 219-225. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.20.025 http://www.tcsae.org
2021-08-24
2021-10-04
上海市科技興農(nóng)項目(滬農(nóng)科推字(2019)第3-2號);國家重點研發(fā)計劃項目(2021YFE0108700);中國水產(chǎn)科學(xué)研究院漁業(yè)機械儀器研究所基本科研業(yè)務(wù)費資助(2017YJS006)
曹曉慧,研究方向為養(yǎng)殖魚類行為研究。Email:18839772622@163.com
劉晃,研究員,碩士生導(dǎo)師,研究方向為水產(chǎn)養(yǎng)殖工程。Email:liuhuang@fmiri.ac.cn
10.11975/j.issn.1002-6819.2021.20.025
S951.2
A
1002-6819(2021)-20-0219-07