張 鑠,陳曉平
(1.福建師范大學 數(shù)學與統(tǒng)計學院,福建 福州 350117;2.福建理工大學 計算機科學與數(shù)學學院,福建 福州 350118)
隨著科學技術(shù)的發(fā)展和各國開放程度的提高,全球貿(mào)易量急速增長,經(jīng)濟全球化逐漸成為當代世界經(jīng)濟的重要特征與世界經(jīng)濟融合發(fā)展的重要趨勢。據(jù)統(tǒng)計,航運貿(mào)易量占全球貿(mào)易總量的90%。隨著全球貿(mào)易量和船舶運力穩(wěn)定增長,船舶的二氧化碳排放量卻在不斷提升。根據(jù)國際海事組織(IMO)相關(guān)數(shù)據(jù),2021年全球航運的二氧化碳排放量達8.33億t,與2020年的7.94億t相比,同比增長4.9%,2021年全球航運占全球碳排放量已達2.4%??梢?船舶的碳排放問題需要引起重視。2020年,中國政府提出“2030年碳達峰”和“2060年碳中和”目標[1],“雙碳”戰(zhàn)略倡導綠色、環(huán)保、低碳的生活方式,加快降低碳排放步伐,有利于引導綠色技術(shù)創(chuàng)新,提高產(chǎn)業(yè)和經(jīng)濟的全球競爭力。國際海事組織(IMO)也提出航運業(yè)碳減排行動計劃,目標于2050年實現(xiàn)碳排放量減少50%。相關(guān)措施表明全球已經(jīng)開始重視碳減排問題,對航運的碳減排也十分重視。船舶的油耗與碳排放量息息相關(guān),因此對于船舶油耗的監(jiān)控與預測也逐漸引起關(guān)注。但是船舶燃料消耗估計存在困難,因為船舶的燃料消耗取決于許多外部因素,如發(fā)動機狀況、運輸距離、海況、天氣狀況等,可靠的油耗預測是航運規(guī)劃、能源監(jiān)管和效率優(yōu)化的重要基礎和重要指標。各國航運公司在降低海洋污染方面面臨著越來越大的壓力,其中航運公司的碳排放量占全球總量的2.5%。但是除了節(jié)能減排,航運公司也需要考慮船舶的有效運營來降低成本,并提高盈利能力。船舶燃料成本約占船舶航行成本的2/3,超過船舶總運行成本的四分之一[2]。因此,航運公司一直專注于實施燃油效率措施。為了監(jiān)測和提高燃料效率,最終提供一種形式化的優(yōu)化方法,在優(yōu)化前我們需要一個合適的建??蚣?推導出能夠準確預測在不同運行概況和環(huán)境條件下的船舶油耗的模型,有助于之后的一系列優(yōu)化操作。然而,在航行過程中,由于安全和運輸進度的復雜要求,提高能源效率的方法非常有限。因此,許多研究工作都致力于在保證船舶安全的前提下,優(yōu)化航行速度,達到節(jié)約油耗的目的。
回顧與燃油效率和油耗預測模型相關(guān)的科學文獻,Bialystossis等[3]對滾裝船的中午報告進行統(tǒng)計分析,以確定船舶油耗的影響因素,對觀測到的海態(tài)曲線進行擬合。Besikci等[4]使用人工神經(jīng)網(wǎng)絡來預測船舶油耗。Meng等[5]提出了一種基于離群值分數(shù)的數(shù)據(jù)預處理方法。利用集裝箱船的中午報告數(shù)據(jù)構(gòu)建了兩個回歸模型,第一個模型將船舶的油耗與速度和位移連接起來。第二種模型建立在第一個模型之上,利用天氣條件和第一個模型提供的信息。Yao等[6]研究了不同尺寸集裝箱船的油耗與船舶速度之間的相關(guān)性。Wang等[7]提出了一個最小絕對收縮和選擇算子LASSO回歸模型。Lepore 等[8]利用巡航船舶運行數(shù)據(jù)應用不同類型的回歸模型,并對每個模型進行二氧化碳估計。LI等[9]融合8艘集裝箱航行報告船數(shù)據(jù)與氣象數(shù)據(jù),并應用于11種廣泛采用的機器學習模型。牟小輝等[10]利用隨機森林構(gòu)造油耗預測模型,并利用偏相關(guān)分析得到單個因素與油耗間的定量關(guān)系。Yang等[11]提出一種基于遺傳算法的預測船舶油耗的灰箱模型。王曉東等[12]提出了一種基于嶺回歸優(yōu)化算法的船舶航速與油耗模型。陳陸等[13]以某一遠洋船舶作為研究對象,對船舶的實際數(shù)據(jù)進行分析,結(jié)合GBDT(梯度提升決策樹)算法構(gòu)建船舶油耗的預測模型。鄭麗暉等[14]采用非參數(shù)核回歸方法,對福州市PM2.5進行實證研究。
從以上文獻回顧可以看出,船舶的油耗預測建模是一個相當活躍的研究領(lǐng)域。由于目前文獻中大多數(shù)使用了不同的數(shù)據(jù)集,具有不同的采集和建模方法,這些不一致導致無法很好地確定船舶油耗預測結(jié)果最佳的建模方法。翻閱文獻,發(fā)現(xiàn)很少學者將非參數(shù)核回歸的方法與船舶油耗估計建模相結(jié)合。考慮到這一點,本研究主要貢獻是:(1)使用非參數(shù)核回歸方法構(gòu)建一個新的模型來預測船舶的油耗;(2)將非參數(shù)核回歸方法構(gòu)建的油耗模型與碳排放相結(jié)合,對船舶碳排放進行分析并提出相應建議。
在本文中,數(shù)據(jù)集由遠航船舶的中午報告信息組成。識別并篩除記錄的異常值,從原始數(shù)據(jù)中提取有用特征,最后將篩選后的數(shù)據(jù)供各個模型使用,執(zhí)行此過程是為了提高油耗模型預測的準確性。在清洗異常記錄值后,最后選取了6個變量,原始數(shù)據(jù)樣本量也由553減少到535。描述性統(tǒng)計如表1所示。數(shù)據(jù)集包含以下變量:Speed(kn)表示航速,Wind speed(m/s)表示風速,Wave height(m)表示浪高,Sea current(m/s)表示水流速度,Distance(km)表示日航行距離,Fuel oil consumption(t/d)表示每日油耗;WINP表示風向,對風向變量進行預處理,處理方法為按常用等級劃分方法進行離散化分箱操作,風向按八方位風向劃分法,如圖1所示。其中C表示靜風,N表示北風,NE表示東北風,E表示東風,SE表示東南風,S表示南風,SW表示西南風,W表示西風,NW表示西北風。
表1 描述性統(tǒng)計
1.2.1 Bagging回歸
Bagging回歸是一種并行式集成學習方法。通過在數(shù)據(jù)集上進行有放回的隨機抽樣,構(gòu)建多個具有一定相關(guān)度的子樣本數(shù)據(jù)集,然后在每個子樣本數(shù)據(jù)集上運用相同的預測模型,最后對回歸預測結(jié)果進行簡單平均。
1.2.2 隨機森林回歸
用隨機森林回歸法創(chuàng)建并組合多個決策樹,在每個節(jié)點的所有競爭的自變量中,隨機選擇幾個來競爭拆分變量,接著通過在樣本數(shù)據(jù)集中抽取樣本來創(chuàng)建新的樹,并從這些樹中提取隨機森林,對回歸預測結(jié)果也是進行簡單平均。
1.2.3 支持向量機回歸
支持向量機回歸的工作原理是推導出最優(yōu)的超平面,在超平面范圍內(nèi)準確預測訓練樣本的目標值[15]。根據(jù)所選內(nèi)核的屬性,支持向量機回歸既可以是參數(shù)模型,也可以是非參數(shù)模型[16]。
1.2.4 廣義可加模型
廣義可加模型對傳統(tǒng)廣義線性模型的非參數(shù)拓展,可有效處理解釋變量與效應變量間復雜的非線性關(guān)系。
1.2.5 梯度提升決策樹模型
梯度提升決策樹模型是一種基于迭代所構(gòu)造的決策樹算法,此算法對決策樹與集成思想進行了有效的結(jié)合[17]。其主要由三個概念組成,回歸樹、梯度提升和縮減?;貧w樹是使用最小化均方差,每個節(jié)點可以得到一個預測值,最后累加所有樹的結(jié)果作為最終結(jié)果。梯度提升是一種理念,沿著梯度方向構(gòu)造一系列弱分類器,并以一定權(quán)重組合起來,形成最終決策的強分類器??s減以殘差作為學習目標,是基于模型過擬合的考慮。
1.2.6 非參數(shù)核回歸
非參數(shù)回歸相比于參數(shù)回歸,它不需要數(shù)據(jù)的先驗信息,模型函數(shù)形式由數(shù)據(jù)本身決定,參數(shù)的特征和數(shù)量是變化的[18]。非參數(shù)回歸的基本模型為
Yi=m(Xi)+εi。
(1)
(2)
(3)
(4)
式(4)中,(h>0)稱為帶寬或調(diào)節(jié)參數(shù),則N-W核估計為
(5)
式n中核函數(shù)K(u)滿足下列條件
(6)
1.3.1 標準化均方誤差(NMSE)
標準化均方誤差(NMSE)對均方差進行了標準化改進,通過計算擬評估模型與以均值為基礎的模型之間準確性的比率:標準化均方誤差取值范圍通常為0~1,比率越小,說明模型效果越好。其公式為
(7)
1.3.2 平均絕對誤差(MAE)
平均絕對誤差(MAE)表示的是觀測值與真實值的誤差絕對值的平均值,其值越小,說明誤差越小。其公式為
(8)
1.3.3 決定系數(shù)(R2)
決定系數(shù)(R2)表示一個隨機變量與多個隨機變量關(guān)系的數(shù)字特征,當R2越接近于1的時候,說明擬合效果越好。其公式為
(9)
1.3.4 均方根誤差(RMSE)
均方根誤差是預測值與真實值偏差的平方與觀測次數(shù)n比值的平方根,在實際測量中,觀測次數(shù)n總是有限的,真值只能用最佳值來代替,即均方根誤差是用來衡量觀測值同真值之間的偏差,當RMSE越小,說明觀測值同真值偏差越小。其公式為
(10)
1.3.5 比較結(jié)果
在討論了建模方法之后,將代入遠航船舶的數(shù)據(jù)集構(gòu)建一系列模型,并計算出各個性能指標,研究的目的是比較各回歸模型在船舶油耗預測的性能,其中數(shù)據(jù)集按傳統(tǒng)的訓練集測試集7∶3劃分。
如圖2所示,分別表示Bagging回歸(bagging)、隨機森林回歸(randomforest)、支持向量機回歸(svm)、廣義可加模型(gam)、梯度提升決策樹模型(gbm)和非參數(shù)核回歸(np)的各個性能指標。從圖2中的MAE圖,可以看出非參數(shù)核回歸的MAE值最小。MAE值越小,說明模型誤差越小。顯然與其他方法相比,非參數(shù)核回歸模型的誤差最小。從圖2的NMSE圖可以看出非參數(shù)核回歸的NMSE值最小,說明與其他方法相比非參數(shù)核回歸模型效果好。從圖2的RMSE圖,可以看出非參數(shù)核回歸的RMSE最小,說明與其他方法相比非參數(shù)核回歸模型的偏差小。最后,通過圖2的R2圖進行比較,可以看出其他方法的R2雖然均大于0.75且接近,但是R2都小于非參數(shù)核回歸的R2,說明非參數(shù)核回歸模型的擬合效果最好。
圖2 各個模型的性能指標比較
通過各個模型的性能指標(表2)的比較,可以得出與Bagging回歸、隨機森林回歸、支持向量機回歸、廣義可加模型、梯度提升決策樹模型相比,非參數(shù)核回歸模型的擬合效果更好,誤差更小,說明非參數(shù)核回歸模型的效果更好,對此遠航船舶的數(shù)據(jù)集的油耗預測是更為精準的。
表2 各個模型的性能指標值
表3 帶寬及變量顯著性檢驗
使用bootstrap方法抽取100次樣本,選定其中一個自變量,其余自變量取中位數(shù),然后建立該自變量與因變量的部分回歸關(guān)系圖,結(jié)果如圖3所示。圖3中,虛線表示因變量的置信區(qū)間。
圖3 非參數(shù)擬合圖
從圖3可以看出,當船舶低速行駛時,航速對船舶油耗的影響很小,當船速增加時,特別是當航速大于10 kn時,航速與船舶油耗呈正相關(guān)關(guān)系,隨著船速的繼續(xù)提高,船舶油耗也會不斷增加。天氣狀況顯然對船舶行駛產(chǎn)生的油耗也會造成影響。從圖3中還可以看出,風速前期影響不大,但當風速高于6 m/s的時候,船舶油耗呈明顯快速上升趨勢。從總趨勢來看,浪高和水流速度與船舶油耗也呈正相關(guān)關(guān)系,船舶油耗會隨著浪高和水流速度的提高而增加。當浪高和水流速度達到一定高值時,船舶的油耗值將趨于平穩(wěn),不再大幅度增加。圖3中的風向圖可以看出不同的風向?qū)Υ坝秃牡挠绊懖町愝^小,說明船舶遇到不同的風向,會及時調(diào)整船頭與航向,減少阻力來減少油耗。最后,船舶的日航行距離增加會始終導致船舶油耗快速增加。非參數(shù)核回歸的結(jié)果說明,船舶油耗與船舶自身行駛狀況、各氣象條件的關(guān)系較為復雜,因此需要根據(jù)精準的油耗預測模型,結(jié)合經(jīng)濟狀況以及船舶原本的航行計劃,設計出最低油耗規(guī)劃。
隨著航運業(yè)的迅猛發(fā)展,船舶數(shù)量大幅增加,碳排放作為溫室氣體的來源之一,對全球環(huán)境影響巨大。如何減少碳排放,提高燃油利用率,正成為航運企業(yè)關(guān)注的焦點。碳排放因子是指單位燃油消耗量產(chǎn)生的二氧化碳排放量,其主要取決于燃料的含碳量和碳氧化率,所以燃料種類不同,碳排放因子也不一樣。對于遠航船舶而言,主機類型一般為低速柴油機,使用重油,對應的碳排放因子為3.114。船舶的碳排放公式為
Q=Fuel oil consumption ×CF。
(11)
Q(t)表示每天船舶的碳排放。式(1)中Fuel oil consumption(t/d)表示的是燃料每日消耗的油耗,CF表示碳排放因子,即單位重量的燃料產(chǎn)生的碳排放量。Q值越小,表示船舶完成一定貨物周轉(zhuǎn)量下碳排放越少,即船舶能效越高。
圖4的各變量重要性圖分析了各變量與船舶油耗的關(guān)系,從中可以看出,船舶油耗與日航行距離和航速的關(guān)系更為密切,因此分析船舶碳排放重點需要分析日航行距離和航速這兩個變量。結(jié)合碳排放進行分析,根據(jù)圖3非參數(shù)擬合圖可知,當航速大于10 kn時,航速與船舶油耗呈正相關(guān)關(guān)系。通過圖5頻率圖可知,該船舶大部分時間的船速位于15~20 kn之間,日航行距離位于400~500 km之間。隨著船速的繼續(xù)提高,船舶油耗也會不斷增加,碳排放也會持續(xù)增加。當日航行距離越長,船舶油耗也會越高,碳排放量也會處在一個高值。因此可知該遠航船舶的碳排放量大部分時間處于比較高的階段,如圖5所示。本文由于缺少相關(guān)的經(jīng)濟數(shù)據(jù)和其他相關(guān)信息,因此無法結(jié)合碳排放對該船舶進行更具體的分析以及更合理的規(guī)劃,希望在經(jīng)濟條件允許的情況下,該船舶適當調(diào)節(jié)優(yōu)化航速與合理分配日航行距離,可以更好地減少船舶產(chǎn)生的碳排放。
圖4 各變量重要性圖
圖5 頻率圖
與眾多的陸上行業(yè)相比,航運業(yè)是最綠色節(jié)能經(jīng)濟的運輸方式,然而從可持續(xù)發(fā)展的角度來看,航運減排是永恒的話題,若不及時采取有效的節(jié)能減排措施,未來航運業(yè)將面臨更加嚴酷的挑戰(zhàn)。除了上述對船舶航速與航線的優(yōu)化,還可以通過一系列技術(shù)手段來降低船舶的碳排放。比如說,可以尋找新能源或其他可替代燃料,逐步淘汰化石燃料;船體優(yōu)化,提高發(fā)動機的效率,裝載更好的氣象導航;定期對船舶進行保養(yǎng)維護等。IMO的研究顯示,船齡、燃油質(zhì)量等也會間接影響到船舶的碳排放情況。當前全球航運業(yè)發(fā)展的總趨勢是向“低碳經(jīng)濟”轉(zhuǎn)型,為了實現(xiàn)航運業(yè)與生態(tài)環(huán)境和諧統(tǒng)一發(fā)展,還需提供法律、金融、稅收等“軟環(huán)境”[20]。希望未來隨著船舶能效提升,替代燃料以及新航運減碳政策的執(zhí)行,航運的碳排放可以在高位震蕩后回落。
在本文研究中,基于遠航船舶的相關(guān)數(shù)據(jù)進行了油耗估算研究。根據(jù)研究方法獲得如下結(jié)果。
(1)本研究創(chuàng)新性地使用含有連續(xù)性變量與類別變量這兩種數(shù)據(jù)類型的混合型數(shù)據(jù),通過非參數(shù)核回歸方法與船舶油耗相結(jié)合,構(gòu)造了預測模型,并通過標準化均方誤差(NMSE)、平均絕對誤差(MAE)、決定系數(shù)(R2)和均方根誤差(RMSE)4個性能指標,與Bagging回歸、隨機森林回歸、支持向量機回歸、廣義可加模型、梯度提升決策樹模型進行了比較,得到船舶油耗預測最優(yōu)模型。接著完成變量間的相關(guān)性與重要性分析,該預測模型方法可以應用于不同的航線,得到的模型可以準確地估計在不同輸入條件下運行的船舶的燃油消耗量。
(2)本研究對非參數(shù)核回歸船舶油耗預測模型進行了實證分析,分析了各變量對油耗的影響??芍剿佟L速、浪高、水流速度和日航線距離與船舶油耗呈正相關(guān)關(guān)系,接著對此船舶進行了碳排放分析,可知該船舶碳排放量大部分時間處于比較高的階段。
(3)此次研究的僅為一艘船舶,在未來的工作中,可以分析更多不同的船舶,收集更多的航行數(shù)據(jù)集,以驗證和進一步改進油耗預測的模型和框架。未來可以探尋更多的新模型進行比較,驗證此模型的有效性與精準性。同時,收集相關(guān)的經(jīng)濟數(shù)據(jù),結(jié)合現(xiàn)有模型與碳排放進行非線性規(guī)劃,優(yōu)化航速,設計更優(yōu)的航線,來減少船舶的碳排放。
在經(jīng)濟全球化的背景下,對如何推進航運的碳減排,本文提出以下建議。
(1)完善相關(guān)管理體系,各國航運部門應出臺更多符合該國國情的法律法規(guī)。將營運船舶劃分標準等級,將那些高耗能高碳排放的船舶逐步淘汰出航運市場,推進綠色航運發(fā)展。加大執(zhí)法力度,保證相關(guān)法律法規(guī)的有效執(zhí)行,建立與維護健康、良性的市場秩序,防止船運公司之間的惡性競爭。
(2)船運企業(yè)要通過一系列技術(shù)手段來降低船舶的碳排放,政府要出臺相關(guān)的扶持政策。船運企業(yè)可以尋找新能源或其他可替代燃料,逐步淘汰化石燃料;船體優(yōu)化,提高發(fā)動機的效率,裝載更好的氣象導航;定期對船舶進行保養(yǎng)維護。這些措施對船運公司的資金財政狀況提出了嚴峻挑戰(zhàn),因此各國可以出臺相應的財政補貼,減免一定稅收,設立專項基金,緩解各船運公司的壓力,提升其國家航運業(yè)的國際競爭力和影響力。
(3)加強國際間的交流與合作,共同推進航運業(yè)的碳減排。經(jīng)濟全球化逐漸成為當代世界經(jīng)濟的重要特征之一,也是世界經(jīng)濟發(fā)展的重要趨勢。在加大科技投入的前提下,各國可以互相合作,分享與借鑒航運減排的有效信息或者措施,提升船舶能效,設計更合理的航線,建立航運碳交易市場,充分發(fā)揮碳交易市場的資源配置功能,達到航運碳減排的目標。