陳延展,陳少偉,胡 浩,任紫暢
(1.湖南大學(xué) 機(jī)械與運(yùn)載工程學(xué)院,湖南 長沙 410082;2. 湖大艾盛汽車技術(shù)開發(fā)有限公司,湖南 長沙 410205 )
無車承運(yùn)人平臺是基于大數(shù)據(jù)、人工智能和互聯(lián)網(wǎng)等技術(shù)構(gòu)建的新型物流平臺,是促進(jìn)物流行業(yè)轉(zhuǎn)型升級的重要利器。無車承運(yùn)人平臺在2016年投入試點(diǎn)后,交通運(yùn)輸部門公布的統(tǒng)計(jì)數(shù)據(jù)顯示,與傳統(tǒng)物流模式相較,無車承運(yùn)試點(diǎn)企業(yè)的車輛里程利用率提高50%,交易成本降低6%~8%,司機(jī)月收入增加30%~40%,等貨時間由2~3 d降低至8~10 h[1]。由此可見,擁有發(fā)達(dá)信息化網(wǎng)絡(luò)的無車承運(yùn)人平臺,能夠?qū)ι鐣系牧闵①Y源進(jìn)行系統(tǒng)地整合并集成,從而提高我國貨運(yùn)市場的整體運(yùn)作效率。無車承運(yùn)人平臺有3個參與角色:平臺、貨主、承運(yùn)人。其利用互聯(lián)網(wǎng)平臺連接貨主和承運(yùn)人;通過有效對接貨主與承運(yùn)商的需求并促使其交易,極大改善了物流業(yè)資源閑置率高的狀況。如果平臺指導(dǎo)價格科學(xué)合理,則能夠促進(jìn)貨運(yùn)任務(wù)快速成交,增加貨運(yùn)任務(wù)交易的成功率,貨主、承運(yùn)人、平臺三方均能獲益,從而提高平臺運(yùn)行的整體效率。因此,如何科學(xué)地對無車承運(yùn)人平臺貨運(yùn)任務(wù)定價,具有很強(qiáng)的研究價值和現(xiàn)實(shí)意義。
定價策略和定價方法是市場營銷組合中一個十分關(guān)鍵的組成部分,在金融、食品、物流等各個領(lǐng)域都具有廣泛的應(yīng)用。劉秋華[2]等基于貝葉斯博弈理論,提出一種不完全信息市場交易下多個售電商博弈的定價模型,將售電商定價下用戶的最優(yōu)購電策略與選擇決策信息反饋給售電商。石永強(qiáng)[3]等基于博弈論的思想,針對現(xiàn)實(shí)中制造商委托零售商回收廢舊產(chǎn)品以再次加工的逆向供應(yīng)鏈定價問題展開研究,構(gòu)建了制造商主導(dǎo)的Stackelberg博弈分散式定價模型與合作博弈的集中定價模型,從理論上證明了合作博弈能夠給供應(yīng)鏈帶來更多利潤,同時也能讓消費(fèi)者獲益。陳斐然[4]等基于多邊市場理論構(gòu)建了消費(fèi)者、自媒體(內(nèi)容提供方)和廣告商三邊用戶的壟斷自媒體平臺廣告定價模型,并考慮投資預(yù)算約束下平臺分別對各邊用戶的最優(yōu)定價策略與服務(wù)投資策略,從而分析平臺決策者在不同情況的最優(yōu)投資對象選擇策略。隨著大數(shù)據(jù)和人工智能技術(shù)的飛速發(fā)展,基于數(shù)據(jù)驅(qū)動的定價方法受到越來越多的關(guān)注。寧克南[5]等基于lightGBM機(jī)器學(xué)習(xí)算法,利用二手商品的歷史成交價格數(shù)據(jù)給出新生個人商家在出售其二手商品時的推薦價格,為二手市場的定價提供指導(dǎo)和借鑒。石言[6]等針對國內(nèi)商業(yè)銀行在系統(tǒng)性風(fēng)險(xiǎn)約束下的風(fēng)險(xiǎn)定價問題,提出了一種使用蒙特卡洛方法的深度強(qiáng)化學(xué)習(xí)框架模型,實(shí)證結(jié)果表明,由深度強(qiáng)化學(xué)習(xí)智能體所運(yùn)營的銀行在面對不同金融事件所帶來的系統(tǒng)性風(fēng)險(xiǎn)與人類專家對手時,能夠做出合理決策,使該模擬銀行能夠在風(fēng)險(xiǎn)中生存并獲得更好的綜合收益。
無車承運(yùn)人平臺在我國尚處于起步探索階段,參考文獻(xiàn)較少,但基于普通公路貨運(yùn)定價已經(jīng)有了一些相關(guān)研究。顧敬巖[7]等研究了我國公路貨運(yùn)價格的演化趨勢,并提出了一些政策建議。王燕凌[8]通過數(shù)據(jù)統(tǒng)計(jì),分析了我國公路貨運(yùn)市場的供求。陳艷靜[9]分析了公路貨運(yùn)價格的影響因素,并給出了一些完善運(yùn)價形成機(jī)制的對策和建議。馮芬玲[10]等分析了公路和鐵路的貨運(yùn)價格和服務(wù)競爭,并建立了鐵路貨運(yùn)和公路貨運(yùn)的Hoteling模型。隨著我國無車承運(yùn)行業(yè)的逐步興起,一些學(xué)者也開始關(guān)注無車承運(yùn)人問題,但大多數(shù)研究都是圍繞無車承運(yùn)模式的現(xiàn)狀分析和業(yè)務(wù)發(fā)展,其中,研究無車承運(yùn)平臺對托運(yùn)人和實(shí)際承運(yùn)人用戶定價的文獻(xiàn)較少。王聰珊[11]等給出了一個多元線性回歸模型,預(yù)測了平臺貨運(yùn)定價。聶福海[12]等基于信息不對稱理論,從博弈角度研究了平臺的定價策略。這些研究均是利用傳統(tǒng)建模方法解決無車承認(rèn)人平臺定價的問題,考慮到影響平臺定價的因素較少,對于定價決策等基本管理環(huán)節(jié)也沒有進(jìn)行深入討論。然而作為貨運(yùn)經(jīng)營者,無車承運(yùn)人平臺需要介入貨運(yùn)交易并賺取貨運(yùn)差價,因此如何科學(xué)指定面向車主的貨物托運(yùn)價格就顯得尤為重要,線路定價策略直接影響著平臺經(jīng)營績效和貨運(yùn)市場運(yùn)行效率。
基于此,本文以某無車承運(yùn)人平臺提供的歷史訂單數(shù)據(jù)展開分析,以無車承運(yùn)人視角對貨運(yùn)線路的定價策略進(jìn)行研究。該無車承運(yùn)人平臺面向承運(yùn)端司機(jī),將需要承運(yùn)的線路任務(wù)以合理的定價發(fā)布到網(wǎng)絡(luò)平臺上供承運(yùn)端司機(jī)瀏覽并決定是否承運(yùn)該運(yùn)輸任務(wù)。本文利用XGBoost模型為無車承運(yùn)人平臺的訂單進(jìn)行定價決策,旨在促進(jìn)無車承運(yùn)人平臺訂單快速成交和降低相應(yīng)的承運(yùn)成本,使得無車承運(yùn)平臺的利潤最大化。
首先對歷史訂單數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,并通過定量分析方法分析主要特征與線路定價的相關(guān)性,初步確定影響無車承運(yùn)人平臺進(jìn)行貨運(yùn)線路定價的主要因素。
本次試驗(yàn)利用某無車承運(yùn)人平臺提供的16 005個歷史成功交易訂單數(shù)據(jù)為數(shù)據(jù)集,其中每個訂單包含16個原始特征,具體的特征變量如下:x1為總里程,x2為車輛噸位,x3為車輛長度,x4為線路價格,x5為計(jì)劃時間,x6為實(shí)際時間,x7為地區(qū)類型,x8為調(diào)價比列,x9為交易時長,x10為目的網(wǎng)點(diǎn),x11為始發(fā)網(wǎng)點(diǎn),x12為線路編碼,x13為分撥時間,x14為調(diào)整時間,x15為是否續(xù)簽約,x16為打包類型。由于數(shù)據(jù)集的樣本數(shù)和特征數(shù)過多,所以只在附錄1展示了前20個訂單的樣本數(shù)據(jù)。通過觀察發(fā)現(xiàn)原始數(shù)據(jù)存在數(shù)據(jù)異常,所以采用的數(shù)據(jù)預(yù)處理操作如下:①若特征的值全相同,無法體現(xiàn)不同訂單的差異性,作刪除處理;②針對某一特征中出現(xiàn)少量缺失值的訂單,則采取均值插值補(bǔ)全的措施;③利用原始數(shù)據(jù)進(jìn)行特征構(gòu)造,包括相對時間和統(tǒng)計(jì)量特征的構(gòu)造;④在異常數(shù)據(jù)剔除后,將所有離散數(shù)據(jù)進(jìn)行one-hot向量編碼處理,所有連續(xù)數(shù)據(jù)作歸一化處理,最終用經(jīng)過數(shù)據(jù)預(yù)處理后的數(shù)據(jù)集作為預(yù)測無車承運(yùn)人平臺定價的XGBoost模型訓(xùn)練集。
為了更準(zhǔn)確地描述無車承運(yùn)人平臺進(jìn)行貨運(yùn)線路定價的主要因素,采用相關(guān)系數(shù)來進(jìn)行相關(guān)性分析。本文采用Spearman秩相關(guān)系數(shù)[13],通過計(jì)算預(yù)處理后得到的16個特征與定價的相關(guān)程度大小來分析影響定價的主要因素。
Spearman秩相關(guān)系數(shù)是衡量2個變量依賴性的非參數(shù)指標(biāo)。它利用單調(diào)方程評價2個統(tǒng)計(jì)變量相關(guān)性。Spearman秩相關(guān)系數(shù)公式如下:
(1)
對2個變量成對的取值分別按照從小到大順序編秩,Ri代表xi的秩,Qi代表yi的秩,Ri-Qi為xi,yi的秩次之差。通過Spearman秩相關(guān)系數(shù)得到16個特征數(shù)與任務(wù)定價的相關(guān)系數(shù),其中每個特征之間的相關(guān)系數(shù)矩陣如圖1所示。
圖1 各特征相關(guān)系數(shù)矩陣圖
通過統(tǒng)計(jì)特征相關(guān)系數(shù)矩陣,做出各個特征與任務(wù)定價相關(guān)性大小的重要度排序表,見表1。根據(jù)表1可以發(fā)現(xiàn)在和任務(wù)定價的相關(guān)系數(shù)中70%以上的因素有總里程、計(jì)劃時間、車輛噸位和車輛長度,由此可知這4個特征與無車承運(yùn)人平臺訂單定價呈現(xiàn)強(qiáng)線性相關(guān)性。由于Spearman秩相關(guān)系數(shù)法只能作為線性相關(guān)度的評價指標(biāo),不能捕捉變量之間的非線性關(guān)系,所以更加準(zhǔn)確的特征重要度排序需要通過XGBoost模型來實(shí)現(xiàn)。
表1 Spearman秩相關(guān)系數(shù)Table 1 Spearman’s rank correlation coefficients特征相關(guān)系數(shù)特征相關(guān)系數(shù)總里程0.991 118 ……計(jì)劃時間0.973 576 線路編碼-0.000 017 車輛噸位0.813 863 調(diào)價比例-0.204 449車輛長度0.765 718 打包類型-0.239 713線路價格0.419 636 始發(fā)網(wǎng)點(diǎn)0.102 90目的網(wǎng)點(diǎn)0.409 852 調(diào)整時間-0.106 65
本節(jié)旨在建立無車承運(yùn)人平臺的線路指導(dǎo)價格與訂單16個特征變量之間的映射函數(shù),而在訓(xùn)練數(shù)據(jù)中所有樣本數(shù)據(jù)的線路指導(dǎo)價格均為已知,所以此問題是一個經(jīng)典的有監(jiān)督學(xué)習(xí)問題。目標(biāo)訂單的線路指導(dǎo)價格為連續(xù)變量,故基于機(jī)器學(xué)習(xí)的回歸模型可以很好地完成這一任務(wù)。目前傳統(tǒng)的機(jī)器學(xué)習(xí)算法例如線性回歸、支持向量機(jī)和K近鄰算法等對特征工程的依賴度極高,而且對于非線性程度高、內(nèi)部規(guī)律較為復(fù)雜的映射關(guān)系的擬合能力有限。XGBoost 是一種集成學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,通過構(gòu)建多棵決策樹來實(shí)現(xiàn)回歸任務(wù),將多個樹模型組合在一起可以更加高效地學(xué)習(xí)到數(shù)據(jù)中的非線性關(guān)系。本節(jié)首先利用XGBoost預(yù)測出線路訂單的線路指導(dǎo)價(即第1次報(bào)價),然后結(jié)合第1次報(bào)價和調(diào)價策略制定出第2次和第3次定價,最終利用數(shù)據(jù)包絡(luò)分析法對3次定價的結(jié)果進(jìn)行評價,以證明預(yù)測模型和調(diào)價策略的合理性。
XGBoost(Extreme Gradient Boosting)是由CHEN[14]等提出的一種支持并行計(jì)算的梯度提升樹模型,近些年它憑借著突出的效率和較高的預(yù)測精度被廣泛應(yīng)用于Kaggle機(jī)器學(xué)習(xí)競賽中。實(shí)際上XGBoost是一種改進(jìn)的GBDT算法[15],兩者本質(zhì)上均由許多用于回歸和分類的決策樹組成,但是XGBoost在以下方面對GBDT算法進(jìn)行了改進(jìn):①對于損失函數(shù),GBDT算法只使用了一階泰勒展開,而XGBoost則增加了二階泰勒展開;②XGBoost在目標(biāo)函數(shù)中構(gòu)造了正則懲罰項(xiàng)[16]以降低模型復(fù)雜度,從而防止模型過擬合。XGBoost模型的結(jié)構(gòu)如圖2所示,模型的細(xì)節(jié)如下所示。
圖2 XGBoost算法示意圖
對于一個給定的有n個樣本的數(shù)據(jù)集D={(xi,yi)},(i=1,2…,n),則基于數(shù)據(jù)集D訓(xùn)練出的具有K個基學(xué)習(xí)器的XGBoost預(yù)測模型為:
(2)
F={f(x)=ωq(x)}
(3)
其中,f(x)表示模型的基學(xué)習(xí)器,F(xiàn)則表示基學(xué)習(xí)器的假設(shè)空間。在式(2)中q(x)表示第x個樣本的葉子節(jié)點(diǎn),ωq(x)則表示樣本x的葉子分?jǐn)?shù),即模型的預(yù)測值。經(jīng)過t次迭代后的預(yù)測結(jié)果如下:
(4)
在對訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)時,每次在保留原有模型不變的基礎(chǔ)上,加入1個新函數(shù)ft,觀察對應(yīng)的目標(biāo)函數(shù),若加入的新函數(shù)能使目標(biāo)函數(shù)盡可能減到最小, 則把該函數(shù)加到模型中。此時目標(biāo)函數(shù)表示為:
(5)
(6)
其中,L代表損失函數(shù);Ω(ft)則表示模型的復(fù)雜度;T和ω分別表示葉節(jié)點(diǎn)數(shù)和得分。之后對目標(biāo)函數(shù)進(jìn)行二階泰勒展開得到如下近似目標(biāo)函數(shù):
(7)
(8)
(9)
綜上所述,最終求得的目標(biāo)函數(shù)形式如下:
(10)
最后對式(9)中的目標(biāo)函數(shù)進(jìn)行優(yōu)化,最優(yōu)解為:
(11)
(12)
本節(jié)以數(shù)據(jù)預(yù)處理后的貨運(yùn)線路已成交歷史數(shù)據(jù)為訓(xùn)練集,分別采用多個機(jī)器學(xué)習(xí)模型對各個任務(wù)訂單的線路總成本、線路指導(dǎo)價格和調(diào)價類型進(jìn)行預(yù)測,并在測試集上利用各種評價指標(biāo)進(jìn)行模型對比。最后基于訂單緊急程度制定了平臺的調(diào)價策略,從而確定平臺針對每個訂單的3次定價。
3.2.1模型評價指標(biāo)
(13)
(14)
(15)
3.2.2試驗(yàn)分析與模型對比
本文基于無車承運(yùn)人平臺歷史訂單數(shù)據(jù)集上分別訓(xùn)練了XGBoost定價預(yù)測模型和其它機(jī)器學(xué)習(xí)模型,如線性回歸模型[17]、K近鄰模型[18]、支持向量機(jī)[19]、決策樹[20]和隨機(jī)森林[21]等,表2提供了模型的簡要說明。
表2 預(yù)測定價的10種機(jī)器學(xué)習(xí)模型Table 2 10 machine learning models for predicting pricing預(yù)測模型說明LR(Linear Regressor)線性回歸模型KNN(K Nearest Neighbor)K近鄰模型Linear-SVM(Linear Support Vector Machine)線性支持向量機(jī)Poly-SVM(Polynomial Support Vector Machine)多項(xiàng)式支持向量機(jī)RBF-SVM(RBF Support Vector Machine)以徑向基為核函數(shù)的支持向量機(jī)DT(Decision Tree Regressor)決策樹模型GB(Gradient Boosting Regressor)梯度提升回歸模型ET(Extra Trees Regressor)極端隨機(jī)樹模型RF(Random Forest Regressor)隨機(jī)森林模型XGBoost(eXtreme Gradient Boosting)極端梯度提升模型
本次試驗(yàn)平臺為AMD Ryzen 7 4800H with Radeon Graphics(2.90 GHz),配置了16.0 GB的RAM內(nèi)存和8 GB的GTX 1070Ti顯卡。其中SVM、DT和RF等模型均在python的第三方庫scikit-learn中實(shí)現(xiàn)。表3給出了上述10個機(jī)器學(xué)習(xí)模型對于無車承運(yùn)人平臺定價的預(yù)測精度、訓(xùn)練時間和測試時間。
表3 不同無車承運(yùn)人平臺定價預(yù)測模型的對比Table 3 Comparison of different pricing prediction models for NVOCC platforms預(yù)測模型R2MAERMSE訓(xùn)練時間/s預(yù)測時間/sLinear-SVM0.949 17.473 820.402 15.901 70.753 9LR0.951 26.920 919.040 70.869 10.012 2DT0.957 45.504 518.510 10.336 20.012KNN0.966 95.072 016.655 50.117 50.125 3Poly-SVM0.973 84.863 416.113 95.860 70.842 5GB0.977 94.222 315.448 81.273 20.101 2ETR0.986 64.188 414.882 40.420 40.020 2RBF-SVM0.989 43.949 614.320 17.356 21.847 5RF0.992 33.642 713.974 22.340 20.051XGBoost0.998 13.581 213.196 71.820 20.015 6
根據(jù)表3繪制出以上機(jī)器學(xué)習(xí)模型對于平臺定價預(yù)測的R2、MAE和RMSE分布曲線,見圖3。通過觀察圖3中的曲線可知,后7個模型的R2值均超過0.95而具有很高的預(yù)測精度,并且其中3個模型(RBF-SVM、RF和XGBoost)的R2值均高達(dá)0.99左右,遠(yuǎn)超其它模型。表現(xiàn)最為突出的XGBoost模型R2值更是高達(dá)0.998 1,并且MAE和RMSE值均處在所有模型的最低值。3種線性模型(LR、Poly-SVM和Linear-SVM)的預(yù)測精度都很差,其R2值均處在0.98以下,證明了平臺定價與16個特征之間存在明顯的非線性關(guān)系。其它3個模型(KNN、GB和ET)的預(yù)測精度則處于中等水平。
圖3 不同無車承運(yùn)人平臺定價預(yù)測模型的評價指標(biāo)對比圖
為了進(jìn)一步說明XGBoost模型的擬合效果,圖4繪制了測試集數(shù)據(jù)中訂單定價的真實(shí)標(biāo)簽值與XGBoost模型預(yù)測值之間的散點(diǎn)分布圖。散點(diǎn)越接近直線則表示模型的預(yù)測能力越強(qiáng)。從圖4可以直觀看出該模型具有良好的定價預(yù)測能力。
圖4 XGBoost模型預(yù)測值與真實(shí)值的散點(diǎn)圖
綜上所述,XGBoost模型的R2值最高,并且訓(xùn)練時間、預(yù)測時間、MAE值和RMSE值均相對較小。所以XGBoost模型在預(yù)測無車承運(yùn)人平臺的問題上比其他模型更加有效,本文最終采用XGBoost模型預(yù)測無車承運(yùn)人平臺定價。為了進(jìn)一步研究每個特征對平臺定價的影響,基于XGBoost模型計(jì)算了16個特征的相對重要度,對影響平臺定價16個特征的重要度進(jìn)行降序排列,見圖5。
上文2.2節(jié)中的Spearman秩相關(guān)系數(shù)只能用來衡量2個連續(xù)變量之間的線性關(guān)系強(qiáng)弱程度,而XGBoost模型的特征重要度大小則是根據(jù)特征在提升決策樹構(gòu)建中的貢獻(xiàn)度來確定的,由特征在每個分裂點(diǎn)的Gini純度計(jì)算得出。因此基于XGBoost的特征重要度排序可以挖掘出定價與特征之間的非線性關(guān)系,其結(jié)果也更加準(zhǔn)確可靠。由圖5可知,總里程、車輛噸位和車輛長度的重要度貢獻(xiàn)率較高,而其它特征(交易時常、調(diào)整時間和分撥時間等)則對平臺定價的影響較小?,F(xiàn)實(shí)生活中線路總里程是任務(wù)價格的直接影響因素,路程越長,成本越高,相應(yīng)定價也會越高。車輛噸位和車輛長度是車輛型號和載重的衡量指標(biāo),噸位和長度越大,貨車的載重越大,相應(yīng)價格也越高。由此可知,總里程、車輛噸位和車輛長度是影響線路定價的最重要的特征變量。
圖5 影響平臺定價的特征重要度排序
為了保證無車承運(yùn)人平臺每個訂單任務(wù)都盡可能被承運(yùn),平臺采取動態(tài)定價的形式保證總收益最大化。若在給定的時間內(nèi),該任務(wù)沒有司機(jī)接單,則該線路 就可以進(jìn)行調(diào)價。假設(shè)每條線路任務(wù)最多允許發(fā)布 3 次價格,即首次發(fā)布線路價格后仍可刷新2次線路價格。由于平臺的目標(biāo)是整體盈利,部分訂單成交價格高于成本價,部分訂單成交價低于成本價,訂單的緊急程度會影響平臺的調(diào)價策略。
首先根據(jù)數(shù)據(jù)集中各訂單的需求緊急程度將訂單分為“常規(guī)訂單”(14 670個)、 “緊急訂單”(330個)和“特急訂單”(1 005個), 根據(jù)式(5)分別計(jì)算3類訂單的平均溢價比,以說明不同緊急程度的訂單調(diào)價的一般水平:
i=1,2,3
(16)
(17)
其中,ai表示第i類訂單的平均溢價比,mi表示第i類訂單下的樣本數(shù),i=1,2,3 分別表示常規(guī)訂單、緊急訂單和特急訂單。最終確定的定價策略如下:根據(jù)XGBoost模型的預(yù)測結(jié)果,確定各個訂單的調(diào)價類型,針對常規(guī)訂單,第1次報(bào)價為訂單的指導(dǎo)價格;針對緊急訂單和特急訂單,平臺急于幫助貨主找到承運(yùn)司機(jī),因此第1次報(bào)價為在訂單指導(dǎo)價格的基礎(chǔ)上,參考成本價、該類訂單的一般調(diào)價水平進(jìn)行調(diào)整。針對所有訂單,第2次和第3次報(bào)價均是綜合考慮指導(dǎo)價格、一般調(diào)價水平、調(diào)價類型(調(diào)高、 調(diào)低、 不調(diào)整)和成本后進(jìn)行調(diào)整。調(diào)整策略見表4。
(18)
為了驗(yàn)證上節(jié)調(diào)價策略的合理性,本節(jié)利用數(shù)據(jù)包絡(luò)法對前1 500個訂單3次定價的綜合效率進(jìn)行評價。數(shù)據(jù)包絡(luò)分析[22](DEA)是根據(jù)多指標(biāo)投入和多指標(biāo)產(chǎn)出對相同類型的單位進(jìn)行相對有效性或效益評價的一種系統(tǒng)分析方法,多用于處理多目標(biāo)決策問題。數(shù)據(jù)包絡(luò)法的具體步驟如下。
a.確定輸出指標(biāo)。
本文站在無車承運(yùn)平臺的角度,平臺在當(dāng)前階段較為關(guān)注的目標(biāo)是快速促進(jìn)成交和較低的承運(yùn)成本,因此其希望通過每單成交的時間更短、每單獲得的利潤更大,因此設(shè)“線路價格”為y1、 “線路指導(dǎo)價”為y2, 對變量x9“交易成功時長”按公式(19)計(jì)算得到y(tǒng)3“時間倒數(shù)”:
n=1,2,…,15 719
(19)
b.確定輸入指標(biāo)。
根據(jù)前文特征重要度分析的結(jié)果,“總里程”、“車輛噸位”、“車輛長度”、“線路價格”、 “計(jì)劃時間”5個變量是各單定價的主要影響因素。因此假設(shè)僅有x1“總里程”、x2“車輛噸位”、x3“車輛長度”、x4“線路價格”、x5“計(jì)劃時間”5 個變量同時會影響初始定價和最終成交價,因此選擇上述5個變量作為輸入變量。
c.建立 CCR 模型。
設(shè)DMUn表示第n個決策單元(n=1, 2, …, 16 005 ),每個決策單元都有5種投入量和3種產(chǎn)出量,設(shè)xi,n(i=1,2,3,4,5;n=1,2,…,16 005)表示第n個決策單位的第i種投入量,yj,n(j=1,2,3;n=1,2,…,15 719)表示第n個決策單位的第j種產(chǎn)出量,vi(i=1,2,3,4,5 )表示第i種投入的權(quán)重,uj(j=1,2,3 )表示第j種產(chǎn)出的權(quán)重。
向量Xn和Yn分別表示第n個決策單元輸入向量和輸出向量,V和U分別表示 輸入指標(biāo)的權(quán)重向量和輸出指標(biāo)的權(quán)重向量,設(shè)Xn=(x1,n,x2,n,x3,n,x4,n,x5,n)T,Yn=(y1,n,y2,n,y3,n)T,V=(v1,v2,v3,v4,v5)T,U=(u1,u2,u3)T。目標(biāo)是少投入、多產(chǎn)出,決策單元n0率的模型為:
(20)
(21)
maxVn0=μTYn0
(22)
(23)
d.DEA評價結(jié)果。
針對選取的1 500個樣本訂單的1次報(bào)價、2次報(bào)價和3次報(bào)價的預(yù)測值,DEA評價結(jié)果如表5所示。針對1次報(bào)價,99.46%的訂單的綜合效率處于 0.8 至 1;針對2次報(bào)價,99.07%的訂單的綜合效率處于0.8至1;針對3次報(bào)價,78.07%的訂單的綜合效率處于0.8至1。綜上所述,利用XGBoost模型的預(yù)測結(jié)果和定價策略相結(jié)合對訂單3次定價進(jìn)行預(yù)測,結(jié)果表明,大部分訂單的定價結(jié)果符合平臺現(xiàn)階段目標(biāo)。
表5 3次報(bào)價的DEA評價Table 5 DEA evaluation of the three quotations綜合效率樣本數(shù)(1次)樣本數(shù)(2次)樣本數(shù)(3次)0~0.20000.2~0.40000.4~0.60030.6~0.88143260.8~1.01 4921 4861 171
本文以無車承運(yùn)人平臺為研究對象,結(jié)合平臺的大量已成交歷史訂單數(shù)據(jù),構(gòu)建了無車承運(yùn)人平臺線路定價的XGBoost預(yù)測模型,并且基于訂單的緊急程度制定了無車承運(yùn)人平臺的調(diào)價策略,隨后利用XGBoost預(yù)測模型和調(diào)價策略相結(jié)合預(yù)測出訂單的3次定價數(shù)值,最后使用數(shù)據(jù)包絡(luò)分析法對訂單預(yù)測出的3次定價進(jìn)行綜合效率評價,主要得出以下結(jié)論:
a.通過對比XGBoost模型與其它9種機(jī)器學(xué)習(xí)模型在人工劃分的測試集上對線路指導(dǎo)價的預(yù)測性能,證明XGBoost模型在無車承運(yùn)人平臺定價問題上的預(yù)測效果最優(yōu),并在XGBoost模型的預(yù)測結(jié)果的基礎(chǔ)上制定了基于訂單緊急程度的調(diào)價策略。
b.基于XGBoost模型計(jì)算了影響平臺定價的16個特征的相對重要度,結(jié)果表明,“總里程”、“車輛長度”、“車輛噸位”、“線路價格”、 “計(jì)劃時間”5個變量是各單定價的主要影響因素。
c.利用數(shù)據(jù)包絡(luò)分析法計(jì)算出1次定價、2次定價和3次定價分別有99.46%、99.07%和78.07%的訂單的綜合效率處于0.8~1的區(qū)間,證明了本文XGBoost模型與調(diào)價策略相結(jié)合的定價預(yù)測方法的合理性。
本文研究為無車承運(yùn)人平臺的定價決策提供了有益借鑒和科學(xué)依據(jù),但本文僅以無車承運(yùn)人平臺和承運(yùn)司機(jī)為研究對象,沒有考慮面向貨主的運(yùn)輸任務(wù)的報(bào)價,未來的研究內(nèi)容可以圍繞上述內(nèi)容展開討論。