楊勝龍,張勝茂,周為峰,崔雪森,張忭忭,樊 偉
采用AIS計(jì)算中西太平洋延繩釣漁船捕撈努力量
楊勝龍,張勝茂,周為峰,崔雪森,張忭忭,樊 偉※
(1. 中國(guó)水產(chǎn)科學(xué)研究院東海水產(chǎn)研究所,農(nóng)業(yè)農(nóng)村部遠(yuǎn)洋與極地漁業(yè)創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,上海 200090;2. 中國(guó)水產(chǎn)科學(xué)研究院漁業(yè)資源與遙感信息技術(shù)重點(diǎn)開(kāi)放實(shí)驗(yàn)室,上海 200090)
對(duì)漁船捕撈行為和捕撈強(qiáng)度空間高分辨率的估計(jì)可以作為海洋資源管理和生態(tài)脆弱性評(píng)估的重要信息。為識(shí)別遠(yuǎn)洋延繩釣漁船作業(yè)狀態(tài),該文基于2017年10-11月中西太平洋延繩釣漁船衛(wèi)星船舶自動(dòng)識(shí)別系統(tǒng)(automatic identification system,AIS)數(shù)據(jù)和捕撈日志數(shù)據(jù),采用支持向量機(jī)(support vector machine, SVM)學(xué)習(xí)方法,構(gòu)建了中國(guó)中西太平洋延繩釣漁船捕撈作業(yè)狀態(tài)(捕撈/非捕撈)分類(lèi)模型。通過(guò)計(jì)算模型分類(lèi)準(zhǔn)確率、精確率、敏感度和特異度來(lái)評(píng)價(jià)模型對(duì)漁船作業(yè)狀態(tài)分類(lèi)能力。結(jié)果表明,模型訓(xùn)練數(shù)據(jù)的準(zhǔn)確率為95.24% (Kappa系數(shù)為0.9),驗(yàn)證數(shù)據(jù)的準(zhǔn)確率為93.85%(Kappa系數(shù)為0.87)。采用構(gòu)建好的模型識(shí)別2017年10月和11月中西太平洋延繩釣漁船共計(jì)125 624條AIS記錄數(shù)據(jù),模型準(zhǔn)確率在83.3% (Kappa系數(shù)為0.67)。2017年10、11月所有數(shù)據(jù)分類(lèi)精確率為82.33%,靈敏度為88.32%,特異度為77.27%。漁船主要作業(yè)空間在168°E~173°E,12°S~18°S,有3個(gè)明顯的作業(yè)強(qiáng)度較高區(qū)域?;赟VM模型和日志記錄的捕撈強(qiáng)度信息在空間上相關(guān)性很高(>0.98),SVM模型識(shí)別的漁船捕撈努力量空間分布特征和實(shí)際吻合。捕撈努力量與單位捕撈努力量漁獲量(catch per unit of effort,CPUE)、漁獲尾數(shù)、漁獲質(zhì)量和投鉤數(shù)的相關(guān)系數(shù)分別是0.68、0.93、0.93和0.94?;贏IS信息挖掘的漁船空間捕撈努力量可用于漁業(yè)資源分析。
支持向量機(jī);模型;自動(dòng)識(shí)別系統(tǒng)(AIS);延繩釣;捕撈努力量
估計(jì)漁船捕撈行為和捕撈強(qiáng)度的空間分布可以為海洋資源管理和生態(tài)脆弱性評(píng)估提供重要信息[1]。漁業(yè)資源管理中,科學(xué)數(shù)據(jù)主要來(lái)源商業(yè)漁船捕撈日志及國(guó)際漁業(yè)組織公布的漁獲數(shù)據(jù),但存在時(shí)間滯后、時(shí)空分辨率低和準(zhǔn)確性不高等問(wèn)題[2-3]。船舶自動(dòng)識(shí)別系統(tǒng)(automatic identification system,AIS)和船舶監(jiān)控系統(tǒng)(vessel monitoring system,VMS)數(shù)據(jù)提供漁船實(shí)時(shí)位置、航向和速度等信息[4],已被證實(shí)可以用于漁船空間分布和作業(yè)強(qiáng)度分析[5-14]。
基于AIS和VMS信息對(duì)商業(yè)漁船捕撈強(qiáng)度和作業(yè)空間估計(jì)通常遵循4個(gè)步驟,即明確漁船作業(yè)類(lèi)型、判別漁船作業(yè)狀態(tài)、估計(jì)捕撈強(qiáng)度和識(shí)別漁場(chǎng)。AIS和VMS數(shù)據(jù)不包含漁船作業(yè)狀態(tài)信息,因此捕撈空間分析和捕撈強(qiáng)度估計(jì)取決于很好的識(shí)別漁船作業(yè)狀態(tài)。漁船速度通常被用來(lái)識(shí)別漁船作業(yè)狀態(tài),基于統(tǒng)計(jì)和專(zhuān)家知識(shí)設(shè)定速度閾值進(jìn)行過(guò)濾和分類(lèi)[5-6]。由于拖網(wǎng)漁船作業(yè)和非作業(yè)狀態(tài)具有明顯的速度差異,該方法多應(yīng)用于拖網(wǎng)漁船作業(yè)狀態(tài)識(shí)別[7-8]。但僅以速度作為變量進(jìn)行作業(yè)狀態(tài)識(shí)別,結(jié)果會(huì)高估捕撈作業(yè)位置[9]。近年,國(guó)外學(xué)者通過(guò)對(duì)漁船速度時(shí)間系列數(shù)據(jù)分析,采用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)方法提高漁船狀態(tài)識(shí)別,挖掘捕撈努力量空間信息[10-13]。但每條船的情況,如大小、網(wǎng)具和船長(zhǎng)經(jīng)驗(yàn)不一樣,該方法需每條船進(jìn)行建模。表征漁船作業(yè)行為不僅有速度,還有航向、軌跡和離岸距離等,因此多變量模型也被構(gòu)建用于漁船狀態(tài)識(shí)別。Kroodsma等[14]基于AIS數(shù)據(jù)挖掘12種特征參數(shù),對(duì)全球7萬(wàn)多條不同作業(yè)類(lèi)型船舶,220億條信息構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法,識(shí)別準(zhǔn)確率在90%以上。深度學(xué)習(xí)建立在大數(shù)據(jù)基礎(chǔ)上,對(duì)于區(qū)域性某一魚(yú)種捕撈數(shù)據(jù),機(jī)器學(xué)習(xí)也有較好的識(shí)別能力,Bertrand等[9]挖掘5種特征參數(shù)構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)模型識(shí)別秘魯鳀魚(yú)()作業(yè)漁船,證實(shí)漁船作業(yè)空間分布和秘魯鳀魚(yú)資源空間分布相似。BP神經(jīng)網(wǎng)絡(luò)是一種局部搜索的優(yōu)化方法,求解復(fù)雜非線性函數(shù)容易陷入局部極值,因此優(yōu)化算法常被用于提高BP模型性能[15]。相比BP方法,支持向量機(jī)(support vector machine, SVM)[16-18]在解決非線性和高維模式識(shí)別中具有優(yōu)勢(shì)。已有文獻(xiàn)表明SVM優(yōu)于人工神經(jīng)網(wǎng)絡(luò)和其他機(jī)器學(xué)習(xí)方法[19-22]。
國(guó)內(nèi)學(xué)者采用VMS開(kāi)展了近海漁船捕撈行為分析和漁場(chǎng)捕撈努力量特征研究[23],對(duì)遠(yuǎn)洋漁船研究較少[5]。金槍魚(yú)是遠(yuǎn)洋漁業(yè)重要經(jīng)濟(jì)魚(yú)種,全球50%以上的金槍魚(yú)產(chǎn)量來(lái)自于中西太平洋[6]。Cimino等[6]挖掘和分析了帕拉經(jīng)濟(jì)專(zhuān)屬權(quán)內(nèi)延繩釣漁場(chǎng)捕撈努力量空間特征,然而對(duì)遠(yuǎn)洋延繩釣漁船捕撈努力量特征分析未見(jiàn)報(bào)道。因此本文基于AIS數(shù)據(jù),采用SVM方法構(gòu)建中國(guó)中西太平洋遠(yuǎn)洋延繩釣漁船的作業(yè)狀態(tài)識(shí)別模型,挖掘漁場(chǎng)捕撈努力量信息,為漁業(yè)資源管理和可持續(xù)利用提供科學(xué)支撐。
金槍魚(yú)延繩釣日志數(shù)據(jù)來(lái)源于2017年10-11月中國(guó)延繩釣漁船在中西太平洋的記錄。數(shù)據(jù)的時(shí)間分辨率為d,空間分辨率為0.5°×0.5°。數(shù)據(jù)包括作業(yè)日期、下鉤時(shí)刻、經(jīng)緯度、投鉤數(shù)及各金槍魚(yú)漁獲尾數(shù)和產(chǎn)量。采用同期的AIS動(dòng)態(tài)數(shù)據(jù),包括MMSI編號(hào)、船名、發(fā)送時(shí)間、經(jīng)度、緯度、航向、航速等,兩部分?jǐn)?shù)據(jù)可以通過(guò)MMSI編號(hào)或船名進(jìn)行關(guān)聯(lián)。AIS數(shù)據(jù)每間隔5~30 s向衛(wèi)星發(fā)送1次。
延繩釣漁船作業(yè)一般包括投放帶有支線和釣鉤的主線,投放后漁船漂流一段時(shí)間,拉起主線和釣鉤,整個(gè)過(guò)程會(huì)持續(xù)1 d時(shí)間。根據(jù)延繩釣漁船作業(yè)行為特征,將延繩釣漁船狀態(tài)劃分捕撈狀態(tài)和非捕撈狀態(tài),其中捕撈狀態(tài)下有放鉤和起鉤;非捕撈狀態(tài)有漂流和航行。再根據(jù)數(shù)據(jù)整體范圍刪除經(jīng)度,緯度,航向和航速中的異常值,刪除1 d內(nèi)點(diǎn)數(shù)少于10的數(shù)據(jù)。并將數(shù)據(jù)記錄的北京時(shí)間換算為當(dāng)?shù)貢r(shí)間。10月份10條漁船,11月份12艘漁船,共計(jì)125 624條AIS記錄數(shù)據(jù)。根據(jù)日志記錄的放鉤時(shí)間,結(jié)合專(zhuān)家經(jīng)驗(yàn)(主要包括作業(yè)起止時(shí)間、航速分布及變化、航向分布及變化、作業(yè)軌跡)對(duì)125 624萬(wàn)條AIS記錄數(shù)據(jù)的作業(yè)狀態(tài)進(jìn)行人工標(biāo)定,即將漁船信息分為捕撈狀態(tài)(放鉤和起鉤)和非捕撈狀態(tài)(漂流和航行),捕撈狀態(tài)設(shè)置為1,非捕撈狀態(tài)為0。對(duì)標(biāo)定好的數(shù)據(jù),參考文獻(xiàn)[9]提取每條船每個(gè)記錄當(dāng)?shù)匦r(shí)、船速、航向等信息,計(jì)算每個(gè)記錄位置的向前速度差和向后速度差。2個(gè)船位點(diǎn)的航向差和航行時(shí)間(s)也是表征延繩釣漁船作業(yè)特征重要參數(shù)[14],本文同時(shí)計(jì)算每條船前后2個(gè)船位點(diǎn)的航向差和航行時(shí)間。由于數(shù)據(jù)量大,因此本文從所有數(shù)據(jù)中隨機(jī)選擇1/10建立模型。
將捕撈日志數(shù)據(jù)按經(jīng)緯度0.5°×0.5°進(jìn)行漁區(qū)劃分,按月對(duì)其作業(yè)位置、尾數(shù)和放鉤數(shù)進(jìn)行統(tǒng)計(jì),計(jì)算各漁區(qū)內(nèi)單位捕撈努力量漁獲量(catch per unit of effort,CPUE)(尾/千鉤)、投鉤數(shù)、漁獲尾數(shù)和漁獲總質(zhì)量,CPUE公式如下:
假設(shè)最優(yōu)的分類(lèi)超平面為
+=0(2)
式中是權(quán)值向量,是閾值。參數(shù)、通過(guò)下面的規(guī)劃方程求解:
隨機(jī)選擇的1/10數(shù)據(jù)中,2/3的數(shù)據(jù)(8 416條記錄)用于建立模型,1/3的數(shù)據(jù)(4 146條記錄)驗(yàn)證模型。采用LIBSVM工具箱下MATLAB語(yǔ)言函數(shù)實(shí)現(xiàn)模型。
計(jì)算分類(lèi)混淆矩陣,采用準(zhǔn)確率、精確率、靈敏度和特異度來(lái)評(píng)價(jià)模型,公式分別如下[24]:
準(zhǔn)確率:
精確率:
靈敏度:
特異度:
式中TP代表作業(yè)狀態(tài)被正確識(shí)別個(gè)數(shù);FN代表作業(yè)狀態(tài)被錯(cuò)誤識(shí)別個(gè)數(shù);TN代表非作業(yè)狀態(tài)被正確識(shí)別個(gè)數(shù);FP代表非作業(yè)狀態(tài)被錯(cuò)誤識(shí)別個(gè)數(shù)。同時(shí)計(jì)算Kappa系數(shù)評(píng)價(jià)分類(lèi)準(zhǔn)確率,Kappa系數(shù)公式如下:
Kappa=(0?)/(1?)(8)
式中0是準(zhǔn)確率。
式中為總的記錄個(gè)數(shù)。為了和閾值識(shí)別結(jié)果進(jìn)行對(duì)比,按照文獻(xiàn)[5]中,以3~7 kn航速作為閾值對(duì)作業(yè)狀態(tài)進(jìn)行分類(lèi)并計(jì)算各指標(biāo)值。
漁船在作業(yè)狀態(tài)下,航行軌跡中2點(diǎn)之間的捕撈努力量E,m計(jì)算如下:
式中T和T?1是漁船航行軌跡中前后2個(gè)船位的時(shí)間,兩者差為時(shí)間間隔。W是漁船的功率,P,m是漁船在位置的作業(yè)狀態(tài)。E為漁船在航行軌跡中第1到第個(gè)空間位置投入的捕撈努力量,kW·h。
一定時(shí)間內(nèi),漁場(chǎng)區(qū)第個(gè)作業(yè)網(wǎng)格內(nèi)的捕撈努力量FE為所有船位點(diǎn)在該網(wǎng)格內(nèi)的捕撈努力量之和,kW·h,計(jì)算公式如下:
式中為第個(gè)作業(yè)網(wǎng)格內(nèi)漁船總數(shù),為第個(gè)作業(yè)網(wǎng)格內(nèi)第條船作業(yè)狀態(tài)點(diǎn)總數(shù)。繪制SVM模型識(shí)別和日志記錄下的捕撈強(qiáng)度圖,定性分析模型有效性。計(jì)算捕撈努力量與單位捕撈努力量漁獲量(catch per unite of effort,CPUE)、漁獲尾數(shù)、漁獲重量和投鉤數(shù)的Person’s相關(guān)系數(shù),檢驗(yàn)其空間相關(guān)性。
隨機(jī)選擇1/10數(shù)據(jù),選擇其中2/3數(shù)據(jù)訓(xùn)練SVM模型參數(shù)。采用交叉驗(yàn)證方法獲得SVM模型的最優(yōu)參數(shù),在交叉驗(yàn)證平均精度為93.25%時(shí),獲得最優(yōu)的模型參數(shù),和分別取值2.8284和4,耗時(shí)17 182 s。最后采用最優(yōu)模型參數(shù)(和)構(gòu)建最終的SVM分類(lèi)模型。采用最終的SVM模型分別對(duì)訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和以及2017年10、11月共計(jì)125 624條AIS記錄數(shù)據(jù)進(jìn)行識(shí)別。
訓(xùn)練數(shù)據(jù)共8 416條記錄,其中有3 413條作業(yè)狀態(tài)記錄和5 003條非作業(yè)狀態(tài)記錄(表1)。有3 189個(gè)作業(yè)狀態(tài)記錄和4 826個(gè)非作業(yè)狀態(tài)記錄被正確識(shí)別。訓(xùn)練數(shù)據(jù)作業(yè)狀態(tài)精確率是94.74%,靈敏度為93.44%,特異度為96.46%。訓(xùn)練數(shù)據(jù)的分類(lèi)準(zhǔn)確率為95.24%,Kappa系數(shù)為0.9。
驗(yàn)證數(shù)據(jù)共有4 146條,其中有1 630條作業(yè)狀態(tài)記錄和2 516條非作業(yè)狀態(tài)記錄(表2)。有1 478個(gè)作業(yè)狀態(tài)記錄和2 413個(gè)非作業(yè)狀態(tài)記錄被正確識(shí)別。訓(xùn)練數(shù)據(jù)精確率是93.49%,靈敏度為90.67%,特異度為95.91%。驗(yàn)證數(shù)據(jù)漁船狀態(tài)分類(lèi)準(zhǔn)確率為93.85%,Kappa系數(shù)為0.87。
表1 訓(xùn)練數(shù)據(jù)集混淆矩陣
表2 驗(yàn)證數(shù)據(jù)集混淆矩陣
2017年10、11月所有數(shù)據(jù)結(jié)果見(jiàn)表3。2017年10、11月所有數(shù)據(jù)共計(jì)125 624萬(wàn)條記錄,其中作業(yè)狀態(tài)共計(jì)73 482條記錄,非作業(yè)狀態(tài)52 142條記錄。有60 469個(gè)作業(yè)狀態(tài)記錄和44 145個(gè)非作業(yè)狀態(tài)記錄被正確識(shí)別。12 986錯(cuò)誤識(shí)別為非作業(yè)狀態(tài),7 997條記錄錯(cuò)誤識(shí)別為作業(yè)狀態(tài)。2017年10、11月所有數(shù)據(jù)分類(lèi)精確率是82.33%,靈敏度為88.32%,特異度為77.27%。2017年10、11月所有數(shù)據(jù)分類(lèi)準(zhǔn)確率是83.3%,Kappa系數(shù)為0.67。
表3 所有數(shù)據(jù)混淆矩陣
2017年10月作業(yè)分類(lèi)準(zhǔn)確率為82.73%,11月份作業(yè)分類(lèi)準(zhǔn)確率為83.74%,2個(gè)月結(jié)果差別不大。
以3~7 kn航速對(duì)2017年10、11月所有數(shù)據(jù)進(jìn)行閾值分類(lèi),混淆矩陣計(jì)算結(jié)果如表4。有45 159個(gè)作業(yè)狀態(tài)記錄和38 806個(gè)非作業(yè)狀態(tài)記錄被正確識(shí)別。28 323錯(cuò)誤識(shí)別為非作業(yè)狀態(tài),13 336條記錄錯(cuò)誤識(shí)別為作業(yè)狀態(tài)。分類(lèi)精確率是77.2%,靈敏度為61.46%,特異度為74.4%。平均準(zhǔn)確率為66.84%,Kappa系數(shù)為0.34。
表4 閾值識(shí)別混淆矩陣
準(zhǔn)確率和Kappa系數(shù)表明基于SVM方法計(jì)算的各項(xiàng)指標(biāo)值均好于閾值識(shí)別方法?;赟VM模型識(shí)別中國(guó)延繩釣漁船作業(yè)狀態(tài)要優(yōu)于單純的速度閾值識(shí)別。
SVM模型識(shí)別結(jié)果和日志標(biāo)示的捕撈強(qiáng)度空間分布圖見(jiàn)圖1,圖2。日志觀測(cè)的捕撈強(qiáng)度圖表明2017年10和11月,中水集團(tuán)遠(yuǎn)洋延繩釣漁船主要作業(yè)空間在168°~173°E,12°~18°S,有3個(gè)明顯的作業(yè)強(qiáng)度較高區(qū)域。10月和11月捕撈努力量空間分布有明顯差異。10月作業(yè)最密集區(qū)域由3塊區(qū)域組成,在170°~173°E,14°~16°S之間;11月作業(yè)最密集區(qū)域在169°E,14°S,其次是在172°E,16°S。11月漁船作業(yè)空間分布相比10月份更靠近海島。
從捕撈強(qiáng)度上看,11月捕撈強(qiáng)度要明顯高于10月份。10月多在30 000 kW·h以下,11月在169°E,14°S 附近區(qū)域,捕撈強(qiáng)度超過(guò)35 000 kW·h。SVM模型識(shí)別的捕撈努力量空間分布和日志觀測(cè)的捕撈強(qiáng)度圖在空間分布上一致。表3表明作業(yè)狀態(tài)被錯(cuò)誤識(shí)別位置數(shù)要大于非作業(yè)狀態(tài)錯(cuò)誤識(shí)別位置數(shù),所以空間圖顯示SVM模型識(shí)別結(jié)果的捕撈強(qiáng)度均弱于日志標(biāo)示的捕撈強(qiáng)度。
圖1 10月份捕撈努力量空間分布圖
圖2 11月份捕撈努力量空間分布圖
基于SVM模型識(shí)別的漁船作業(yè)狀態(tài)結(jié)果和日志標(biāo)示結(jié)果,分別計(jì)算漁船捕撈努力量,統(tǒng)計(jì)每個(gè)網(wǎng)格的捕撈強(qiáng)度。10、11月以及所有月份,識(shí)別結(jié)果和日志標(biāo)示的捕撈努力量相關(guān)系均大于0.98,所有相關(guān)系數(shù)值小于0.000 001。模型輸出的捕撈努力量空間分布和實(shí)際相似。
SVM模型識(shí)別的捕撈努力量與投鉤數(shù)、漁獲尾數(shù)、漁獲重量和CPUE等在空間上的Person’s相關(guān)系數(shù)見(jiàn)表5。所有相關(guān)系數(shù)都大于0.64,值小于0.000 001。捕撈努力量與延繩釣投鉤數(shù)的相關(guān)系數(shù)最大,均大于0.93;與CPUE相關(guān)系數(shù)最低,均小于0.8。基于AIS模型挖掘的捕撈強(qiáng)度空間信息可以在一定程度上反映漁業(yè)資源量空間分布。
表5 捕撈努力量與投鉤數(shù)、漁獲尾數(shù)、漁獲重量和CPUE空間相關(guān)系數(shù)
捕撈空間分析和捕撈強(qiáng)度估計(jì)取決于很好的識(shí)別漁船作業(yè)狀態(tài)。捕撈作業(yè)行為描述了海上船只的運(yùn)動(dòng)模式、軌跡和漁民捕魚(yú)習(xí)慣[8]。漁船速度常被用于漁船作業(yè)狀態(tài)識(shí)別研究[10],來(lái)定義漁船捕撈行為和努力量[11-13]。僅以速度閾值識(shí)別會(huì)高估漁船作業(yè)狀態(tài),容易把非作業(yè)狀態(tài)誤判為作業(yè)狀態(tài)[15],會(huì)給漁業(yè)管理帶來(lái)偏差。
支持向量機(jī)在回歸和分類(lèi)問(wèn)題上有較好的表現(xiàn)[17-18],在漁業(yè)CPUE標(biāo)準(zhǔn)化中被證明要優(yōu)于其他的統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)算法[20-22]。本文通過(guò)挖掘漁船作業(yè)特征變量,采用SVM構(gòu)建遠(yuǎn)洋延繩釣漁船多元分類(lèi)模型,模型訓(xùn)練和驗(yàn)證數(shù)據(jù)集的所有分類(lèi)指標(biāo)超過(guò)90%,與Kroodsma等[14]卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)果相似。2017年10月和11月所有數(shù)據(jù)作業(yè)分類(lèi)準(zhǔn)確率為83.3%,和Desouza等[10]采用數(shù)據(jù)挖掘方法結(jié)果(83%)相似,證明本文建立的漁船作業(yè)狀態(tài)識(shí)別模型有很好的泛化能力,本文構(gòu)建的模型是可行的。以3~7 kn航速對(duì)2017年10、11月所有數(shù)據(jù)進(jìn)行閾值分類(lèi)。平均準(zhǔn)確率為66.84%,Kappa系數(shù)為0.34。本文建立的模型平均準(zhǔn)確率是83.3%,Kappa系數(shù)為0.67?;赟VM方法計(jì)算的各項(xiàng)指標(biāo)值均好于閾值識(shí)別方法。,采用本文方法繪制的捕撈努力量圖更能反映實(shí)際漁船捕撈努力量空間分布。
本文挖掘漁船作業(yè)特征提取7個(gè)變量進(jìn)行建模,模型可以對(duì)任意漁船軌跡中的任意一個(gè)AIS記錄進(jìn)行識(shí)別,無(wú)需考慮船只本身因素。模型驗(yàn)證精度很高,但對(duì)訓(xùn)練和驗(yàn)證集外的數(shù)據(jù)的識(shí)別率略低,可能與本文采用的輸入變量和數(shù)據(jù)量有關(guān)。Kroodsma等[14]挖掘了12個(gè)輸入特征參數(shù)構(gòu)建了大數(shù)據(jù)深度學(xué)習(xí)模型,未來(lái)可以通過(guò)提取更多有效的特征參數(shù)作為輸入變量,提高模型分類(lèi)識(shí)別能力。本文SVM模型選擇徑向基函數(shù)為核函數(shù),模型分類(lèi)能力依賴(lài)于模型參數(shù),即懲罰因子和徑向基函數(shù)參數(shù)選擇。本文采用交叉驗(yàn)證方法選擇模型參數(shù),相關(guān)文獻(xiàn)采用遺傳算法或者粒子群算法等優(yōu)化算法選擇SVM模型參數(shù)[24-26],提升SVM模型分類(lèi)能力,均取得很好的結(jié)果。未來(lái)可以采用遺傳算法或者粒子群算法等優(yōu)化算法選擇模型參數(shù),進(jìn)一步提高SVM模型在漁船作業(yè)類(lèi)型上的識(shí)別能力。
識(shí)別結(jié)果和漁船日志記錄的捕撈強(qiáng)度在空間上相關(guān)性非常高(>0.98)。捕撈強(qiáng)度空間圖和日志作業(yè)空間圖在空間上分布非常吻合,區(qū)別在于SVM模型識(shí)別結(jié)果的捕撈強(qiáng)度均低于日志標(biāo)示的捕撈強(qiáng)度。因?yàn)橛?2 986錯(cuò)誤識(shí)別為非作業(yè)狀態(tài),有7 997條記錄錯(cuò)誤識(shí)別為作業(yè)狀態(tài)。本文的識(shí)別結(jié)果漁船作業(yè)狀態(tài)SVM模型誤差并沒(méi)有給漁船捕撈強(qiáng)度和漁場(chǎng)作業(yè)空間分布帶來(lái)影響,因此在捕撈日志數(shù)據(jù)有限或沒(méi)有的情況下,基于船位數(shù)據(jù)挖掘的捕撈強(qiáng)度信息也可以刻畫(huà)漁船作業(yè)時(shí)的空間分布特征。捕撈強(qiáng)度和投鉤數(shù)、漁獲尾數(shù)、漁獲重量和CPUE的空間相關(guān)性較好。捕撈強(qiáng)度與延繩釣漁船投鉤數(shù)相關(guān)性最高,因?yàn)楦嗟牟稉茝?qiáng)度意味著更多的延繩釣投鉤作業(yè)。與延繩釣CPUE相關(guān)性最低,但大于0.64,空間相關(guān)性較好,捕撈強(qiáng)度空間分布和CPUE空間分布相似。CPUE與漁業(yè)資源豐度成比例,可作為漁業(yè)資源相對(duì)豐度來(lái)反映漁業(yè)資源豐度。因此在缺乏漁業(yè)捕撈生產(chǎn)數(shù)據(jù)時(shí),基于AIS模型挖掘的捕撈強(qiáng)度空間信息可以在一定程度上反映漁業(yè)資源量空間分布,替代用于漁業(yè)資源評(píng)估和管理。
本文的漁船日志數(shù)據(jù)只記錄了投鉤開(kāi)始時(shí)間,沒(méi)有投鉤結(jié)束、起鉤開(kāi)始和起鉤結(jié)束的時(shí)間。通過(guò)繪制漁船速度曲線,并結(jié)合專(zhuān)家經(jīng)驗(yàn)對(duì)投鉤結(jié)束和起鉤時(shí)間進(jìn)行判斷。Desouza等[10]也采用該方法對(duì)漁船作業(yè)狀態(tài)進(jìn)行標(biāo)簽。該方法工作量非常大,因此本文只采用了2個(gè)月的時(shí)間。未來(lái)希望通過(guò)觀察員計(jì)劃,記錄和獲取更多的漁船作業(yè)狀態(tài)空間信息,采用深度學(xué)習(xí)方法開(kāi)展相關(guān)研究工作。本文采用的是中國(guó)中水集團(tuán)的漁船,為了方法有更好的實(shí)用性,需要考慮更多不同公司的漁船。未來(lái)希望獲取國(guó)外漁船信息開(kāi)展相關(guān)研究,及時(shí)了解和掌握國(guó)外企業(yè)漁船的作業(yè)空間分布,為中國(guó)漁業(yè)公司尋找漁場(chǎng)提供幫助。
本文采用船舶自動(dòng)識(shí)別系統(tǒng)(automatic identification system,AIS)數(shù)據(jù)和漁船捕撈日志數(shù)據(jù),基于SVM模型,構(gòu)建了中國(guó)延繩釣漁船作業(yè)狀態(tài)(作業(yè)/不作業(yè))分類(lèi)判別模型。得到如下結(jié)論:
1)本文構(gòu)建SVM模型對(duì)中國(guó)延繩釣漁船作業(yè)狀態(tài)進(jìn)行分類(lèi),所有數(shù)據(jù)分類(lèi)準(zhǔn)確率是83.3%,Kappa系數(shù)為0.67,可以對(duì)中西太平洋中國(guó)漁船作業(yè)狀態(tài)進(jìn)行識(shí)別。
2)模型輸出的捕撈努力量和日志標(biāo)志的捕撈努力量空間相關(guān)系數(shù)大于0.98,基于AIS數(shù)據(jù)可以估計(jì)中國(guó)中西太平洋延繩釣漁船作業(yè)和捕撈強(qiáng)度空間分布。
3)基于AIS模型挖掘的捕撈強(qiáng)度與漁獲尾數(shù)、漁獲重量和單位捕撈努力量漁獲量(catch per unit of effort,CPUE)等在空間上的相關(guān)系數(shù)都大于0.64,空間信息可以在一定程度上反映漁業(yè)資源量空間分布。
[1]Boulcott P, Millar C P, Fryer RJ. Impact of scallop dredging on benthic epifauna in a mixed-substrate habitat[J]. ICES Journal Marine Science, 2014, 71: 834-844.
[2]鄒莉瑾,戴小杰,許柳雄,等. 金槍魚(yú)延繩釣漁撈日志管理現(xiàn)狀與趨勢(shì)[J]. 漁業(yè)信息與戰(zhàn)略,2015,30(1):35-39.
Zou Jinli, Dai Xiaojie, Xu Liuxiong, et al.On the status of tuna longline fishery logbook[J]. Fishery Information and Strategy, 2015, 30(1): 35-39. (in Chinese with English abstract)
[3]Zeller D, Rossing P, Harper S, et al. The baltic sea:estimates of total fisheries removals 1950-2007[J]. Fisheries Research, 2011, 108, 356-363.
[4]McCauley D J, Woods P, Sullivan B, et al. Worm, Ending hide and seek at sea[J]. Science, 2016, 351(6278): 1148-1150.
[5]原作輝,楊東海,樊偉,等. 基于衛(wèi)星AIS的中西太平洋金槍魚(yú)延繩釣漁場(chǎng)分布研究[J]. 海洋漁業(yè),2018,40(6):649-659.
Yuan Zuohui, Yang Donghai, Fan Wei, et al. On fishing grounds distribution of tuna longline based on satellite automatic identification system in the Western and Central Pacific[J]. Marine Fisheries, 2018, 40(6): 649-659. (in Chinese with English abstract)
[6]Cimino M A, Anderson M, Schramek T, et al. Towards a fishing pressure prediction system for a western pacific EEZ[J]. Science, 2019, 9(461): 1-10.
[7]Wang Y B, Wang Y. Estimating catches with automatic identification system (AIS) data: a case study of single otter trawl in Zhoushan fishing ground, China[J]. Iranian Journal of Fisheries Sciences, 2016, 15(1): 75-90.
[8]Debrah E A, Wiafe G, Agyekum K A, et al. An assessment of the potential for mapping fishing zones off the coast of ghana using ocean forecast data and vessel movement[J]. West African Journal of Applied Ecology, 2018, 26(2): 26-43.
[9]Bertrand S, Burgos J, Gerlotto F, et al. Lévy trajectories of peruvian purse–seiners as an indicator of the spatial distribution of anchovy ()[J]. ICES Journal of Marine Science, 2005,62(3): 447-482.
[10]Desouza E N, Boerder K, Matwin S, et al. Improving fishing pattern detection from satellite AIS using data mining and machine learning[J]. Plos One 11, 2016, e0158248. doi:10.1371/journal.pone.0158248 Medline
[11]Natale F, Gibin M, Alessandrini A, et al. Mapping fishing effort through AIS data[J]. Plos One 10, 2015, e0130746. doi:10.1371/journal.pone.0130746 Medline
[12]Ferra C, Tassetti A N, Grati F, et al. Mapping change in bottom trawling activity in the Mediterranean Sea through AIS data[J]. Marine Policy, 2018, 94: 275-281.
[13]Guyader L D, Ray C, Brosset D. Defining high-resolution dredge fishing grounds with automatic identification system (AIS) data[J]. Aquatic Living Resources, 2017, 30: 39-49.
[14]Kroodsma D A, Mayorga J, Hochberg T, et al. Tracking the global footprint of fisheries[J]. Science, 2018, 359(6378): 904-908.
[15]Bertrand S, Bertrand A, Guevara-Carrasco R, et al. Scale invariant movements of fishermen: the same foraging strategy as natural predators[J]. Ecological Applications, 2007, 17(2): 331-337.
[16]郭霖,白丹,王新端,等. 基于支持向量機(jī)的滴灌灌水器流量預(yù)測(cè)模型建立與驗(yàn)證[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(2):74-82.
Guo Lin, Bai Dan, Wang Xinduan, et al. Establishment and validation of flow rate prediction model for drip irrigation emitter based on support vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(2): 74-82. (in Chinese with English abstract)
[17]胡曉華,劉偉,劉長(zhǎng)虹,等. 基于太赫茲光譜和支持向量機(jī)快速鑒別咖啡豆產(chǎn)地[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(9):302-307.
Hu Xiaohua, Liu Wei, Liu Changhong, et al. Rapid identification of producing area of coffee bean based on terahertz spectroscopy and support vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(9): 302-307. (in Chinese with English abstract)
[18]劉偉,劉長(zhǎng)虹,鄭磊. 基于支持向量機(jī)的多光譜成像稻谷品種鑒別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2014,30(10):145-151.
Liu Wei, Liu Changhong, Zheng Lei. Discrimination in varieties of rice seeds with multispectral imaging using support vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(10): 145-151. (in Chinese with English abstract)
[19]Li A G, Ye Z J, Wan R. Model selection between traditional and popular methods for standardizing catch rates of target species a case study of Japanese Spanish mackerel in the gillnet fishery[J]. Fisheries Research, 2015, 161: 312-319.
[20]Shono H. Application of support vector regression to CPUE analysis for southern bluefin tuna Thunnus maccoyii and its comparison with conventional methods[J]. Fish Science, 2014, 80: 879-886.
[21]楊勝龍,張禹,張衡,等. 不同模型在漁業(yè)CPUE標(biāo)準(zhǔn)化中的比較分析[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(21):259-264.
Yang Shenglong, Zhang Yu, Zhang Heng, et al. Comparison and analysis of different model algorithms for CPUE standardization in fishery[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE) 2015, 31(21): 259-264. (in Chinese with English abstract)
[22]Were A, Buick D T. Comparative assessment of support vector regression, artificialneural networks, and random forests for predicting and mapping soilorganic carbon stocks across an Afromontane landsca[J]. Ecological Indicators, 2015, 52: 394-403.
[23]張勝茂,崔雪森,伍玉梅,等. 基于北斗衛(wèi)星船位數(shù)據(jù)分析象山拖網(wǎng)捕撈時(shí)空特征[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(7):151-156.
Zhang Shengmao, Cui Xueseng, Wu Yumei, et al. Analyzing space-time characteristics of Xiangshan trawling based on Beidou Vessel Monitoring System Data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(7): 151-156. (in Chinese with English abstract)
[24]Zhou T, Lu H L, Wang W W, et al. GA-SVM based feature selection and parameter optimization in hospitalization expense modeling[J]. Applied Soft Computing Journal, 2019, 75: 323-332.
[25]Phan A V, Nguyen M L, Bui LT. Feature weighting and SVM parameters optimization based on genetic algorithms for classification problems[J]. Applied Intelligence, 2017, 46(2): 455-469.
[26]Nieto P J G, Fernández A J R, Suárez V M G, et al. A hybrid PSO optimized SVM-based method for predicting of the cyanotoxin content from experimental cyanobacteria concentrations in the trasona reservoir: A case study in Northern Spain[J]. Applied Mathematics and Computation, 2015, 260: 170-187.
Calculating the fishing effort of longline fishing vessel in the western and central pacific ocean using AIS
Yang Shenglong, Zhang Shengmao, Zhou Weifeng, Cui Xuesen, Zhang Bianbian, Fan Wei※
(1.,,,,, 200090,; 2.,,200090,)
In order to provide relevant information for natural resource management, impact assessment and marine spatial planning, high-resolution estimation of longline fishing gear is needed. Because the use of satellite vessel monitoring system (VMS) data is limited by data access and receiving offshore ship location information. In this paper, based on the data of automatic identification system (AIS) and logbook data of Chinese longline fishing from October to November 2017, a model of fishing detection based on support vector machine (SVM) learning method is established to classify the fishing and non fishing activities in the central and Western Pacific Ocean, to carry out longline fishing and draw fishing effort map in the Western and Central Pacific Ocean. Before constructing a fishing detection model, each AIS point was classified and pre-labeled as potential fishing and non-fishing events by an expert based on information on information on fisheries characteristics as obtained from literature, analysis of the tracks and logbook data. The performance of the fishing detection model was evaluated by the overall accuracy, precision, sensibility and specificity. Fishing intensities were computed from the known fishing positions and the estimated fishing positions were compared with correlation coefficient. The spatial correlation coefficient of fishing intensities and catch data was computed to quantify the extent to which the distribution of longline vessels describes tuna distribution. The results showed that the overall accuracy and the Kappa coefficient of the model training dataset were 95.24% and 0.9, respectively. The precision, sensibility and specificity were 94.74%, 93.44%, 96.56%, respectively. The overall accuracy and the Kappa coefficient of the model testing dataset were 93.85% and 0.87 respectively. The precision, sensibility and specificity were 93.49%, 90.67%, 95.91%, respectively. Then the constructed model was used to identify all the AIS data for 12 longline fishing vessels in the Western and Central Pacific in October and November 2017, with an overall accuracy rate of 83.3% and the Kappa coefficient was 0.67. The precision, sensibility and specificity were 82.33%, 88.32%, and 77.27%, respectively. The longline fishing distinct in October and November 2017 mainly located in 168°E-173°E, 12°S-18°S, and there were three obvious high fishing intensity areas on the map. The spatial distribution of fishing effort was significantly different between October and November. The distribution of fishing intensity in November was closer to the island than in October and the value of fishing intensity in October was lower than November. The fishing intensity information based on the SVM model and logbook data records was highly correlated (>0.98). The spatial distribution characteristics of the fishing effort of the fishing vessel identified by the SVM model were similar to the known fishing positions. But the fishing intensities were calculated from known fishing positions was higher than that of estimated fishing positions. The spatial correlation coefficients of cumulative fishing effort and catch per unit of effort (CPUE), catch tail, catch weight and number of hooks were 0.68, 0.93, 0.93 and 0.94, respectively. The fishing capacity of fishing vessels based on AIS information mining can also be used as an alternative method for fishery resource analysis.
support vector machine; models; automatic identification system; longline; fishing effort
楊勝龍,張勝茂,周為峰,崔雪森,張忭忭,樊 偉. 采用AIS計(jì)算中西太平洋延繩釣漁船捕撈努力量[J]. 農(nóng)業(yè)工程學(xué)報(bào),2020,36(3):198-203.doi:10.11975/j.issn.1002-6819.2020.03.024 http://www.tcsae.org
Yang Shenglong, Zhang Shengmao, Zhou Weifeng, Cui Xuesen, Zhang Bianbian, Fan Wei. Calculating the fishing effort of longline fishing vessel in the western and central pacific ocean using AIS[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(3): 198-203. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.03.024 http://www.tcsae.org
2019-08-13
2020-01-16
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2019YFD0901405),中央級(jí)公益性科研院所基本科研業(yè)務(wù)費(fèi)(2019T09);國(guó)家自然科學(xué)基金項(xiàng)目(41606138);農(nóng)業(yè)部外海漁業(yè)開(kāi)發(fā)重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金資助(LOF2018-01)
楊勝龍,副研究員,主要從事海洋生態(tài)學(xué)研究。Email:ysl6782195@126.com
樊偉,研究員,主要從事漁業(yè)遙感研究。Email:fanwee@126.com
10.11975/j.issn.1002-6819.2020.03.024
S972.9
A
1002-6819(2020)-03-0198-06