董卜源
(上海交通大學(xué)安泰經(jīng)濟(jì)管理學(xué)院,上海 200030)
接單等待時(shí)間 TCR 是指從用戶下單時(shí)刻 TC 到配送員接單時(shí)刻 TR 的這段時(shí)間,是即時(shí)配送系統(tǒng)中一個(gè)非常重要的指標(biāo)。訂單處理時(shí)間 TT 是接單等待時(shí)間 TCR,配送員取單時(shí)間 TRP 以及配送員送單時(shí)間 TPD 之和。
從用戶角度而言,接單等待時(shí)間是影響客戶體驗(yàn)的重要部分,接單等待時(shí)間直接決定了即時(shí)配送訂單所需整體處理時(shí)間。用戶都希望所下訂單能被立即接單,對(duì)此有比較高的預(yù)期,因此其對(duì)接單等待時(shí)間也更為敏感。接單等待時(shí)間的控制對(duì)于平臺(tái)而言十分重要。從平臺(tái)角度而言,接單等待時(shí)間是配送運(yùn)力供需平衡的結(jié)果。當(dāng)客戶訂單較多,運(yùn)力需求量大但是供給相對(duì)不足時(shí),訂單需要等待較長(zhǎng)時(shí)間才會(huì)被接單;相反,運(yùn)力供給充足時(shí),接單等待時(shí)間則會(huì)較短。從配送員的角度來(lái)看,接單等待時(shí)間能在一定程度上反應(yīng)配送員對(duì)此類訂單的偏好程度,包括配送訂單的類型、配送距離、配送收入等。
圖1 即時(shí)配送訂單處理時(shí)間劃分
如上所述,接單等待時(shí)間的影響因素有很多,主要可以歸類為系統(tǒng)運(yùn)力供給需求的平衡以及附近騎手對(duì)這個(gè)訂單的接單意愿兩個(gè)方面,本文將定量的探索各因素對(duì)接單等待時(shí)間的影響。
首先,配送系統(tǒng)中運(yùn)力的供給可以用活躍騎手的數(shù)量R來(lái)表征。針對(duì)每個(gè)訂單i,只有這個(gè)訂單附近活躍的有效騎手?jǐn)?shù)量可以被計(jì)算在運(yùn)力供給中。對(duì)于每一個(gè)訂單i,我們統(tǒng)計(jì)其下單時(shí)刻TCi前一段時(shí)間t內(nèi)臨近區(qū)域出現(xiàn)的活躍騎手的數(shù)量,作為該訂單i附近的有效活躍騎手?jǐn)?shù)量Ri。臨近區(qū)域則是指以訂單i的取單位置LPi為中心,以一定距離r為半徑做圓的區(qū)域。運(yùn)力的需求用有效訂單數(shù)量D來(lái)表征。按與上述方法相同的,我們統(tǒng)計(jì)出訂單i附近區(qū)域內(nèi)的特定時(shí)段(TCi前一段時(shí)間t內(nèi))下單的其他訂單數(shù)量,記做Di。
配送員在決定是否接單時(shí),通常會(huì)權(quán)衡訂單的完成難度和完成訂單能夠獲得的報(bào)酬。在本系統(tǒng)中運(yùn)力來(lái)源形式為眾包,騎手沒(méi)有基本工資,騎手能夠獲得的報(bào)酬就是從每個(gè)訂單中獲取的配送費(fèi)。騎手從訂單i中獲得的配送費(fèi)由基礎(chǔ)配送費(fèi)Feei、顧客小費(fèi)Tipi和平臺(tái)補(bǔ)助Subi三部分組成。配送訂單的類型Type 和訂單的配送距離DDi直接影響到訂單的完成難度。
在研究中我們發(fā)現(xiàn),工作日和周末的接單等待時(shí)間存在明顯差異;另外在一天中也存在高峰與低谷,接單等待時(shí)間也會(huì)有明顯的波動(dòng),因此我們引入訂單發(fā)生在周幾Wi以及訂單生成時(shí)刻(當(dāng)天中的第幾小時(shí))Hi,作為控制變量。需要注意的是,Wi和Hi均是類別變量,在模型中我們將為其設(shè)置虛變量。
配送訂單的類型Type對(duì)接單等待時(shí)間的影響比較復(fù)雜,為了規(guī)避這種影響,我們將研究范圍限定在某特定配送類型中,以消除不同類型對(duì)接單等待時(shí)間的復(fù)雜影響。
基本研究模型如下:
TCRi=β0+β1Feei+β2Tipi+β3Subi+β4DDi+β5Ri+β6Di+β7Wi+β8Hi+Ei
(1)
研究數(shù)據(jù)來(lái)源于某即時(shí)配送平臺(tái)。該平臺(tái)是一個(gè)處在成長(zhǎng)期的即時(shí)配送企業(yè),為客戶提供各種類型的即時(shí)配送服務(wù)以滿足客戶的多樣化的即時(shí)配送需求。配送類型 Type 包括隨意購(gòu)、品牌外賣、同城快送、星巴克代購(gòu)等。品牌外賣是指該平臺(tái)為合作的餐飲商家外賣訂單提供配送服務(wù),從商家取餐后送至顧客要求的訂餐地址。隨意購(gòu)則是顧客只指定購(gòu)買(mǎi)某種商品,不指定特定購(gòu)買(mǎi)地點(diǎn),騎手可以就近選擇采購(gòu)地址,然后送至顧客手中。相比品牌外賣,隨意購(gòu)是一種非標(biāo)準(zhǔn)化的訂單。同城快送則是需要騎手從客戶手中取到包裹,然后送至指定地點(diǎn)。該平臺(tái)運(yùn)力主要來(lái)源于眾包,騎手均非全職。
圖2 訂單量日分布及不同類型訂單占比
我們獲取了該即時(shí)配送平臺(tái)在某城市6個(gè)月的運(yùn)營(yíng)數(shù)據(jù),約有40萬(wàn)條訂單記錄,均為實(shí)際完成訂單。就配送類型來(lái)看,超出60%的訂單為隨意購(gòu)類型,接近30%為品牌外賣,同城快送占比不到10%,星巴克代購(gòu)僅有少量訂單。不同類型的訂單配送難度也不相同。該平臺(tái)在該城市的日均單量在3千左右,日活躍騎手?jǐn)?shù)量在800~1000名之間。人均日單量小于5單,這種情況也與兼職、眾包的運(yùn)力模式相契合。
研究數(shù)據(jù)包涵訂單信息和配送信息兩方面內(nèi)容。訂單信息包括訂單號(hào)、配送員、訂單類型、訂單操作時(shí)刻(下單TCi、接單TRi、取單TPi、送達(dá)TDi)以及配送費(fèi)用,其中包括基本的配送費(fèi)用Feei、用戶給的小費(fèi)Tipi以及平臺(tái)調(diào)度的補(bǔ)貼Subi。配送信息則主要記錄了配送員在完成某訂單i時(shí)接單、取單、送達(dá)的時(shí)刻和位置。其中時(shí)刻精確到秒,位置為經(jīng)緯度坐標(biāo)。
我們先計(jì)算出每個(gè)訂單的接單等待時(shí)間 TCR。超過(guò)半數(shù)的訂單接單等待時(shí)間小于2分鐘,平均接單等待時(shí)間為3.5分鐘。接單等待時(shí)間與每小時(shí)訂單量的波動(dòng)趨勢(shì)高度一致,系統(tǒng)中訂單越多,接單等待時(shí)間也相對(duì)變長(zhǎng)。午高峰時(shí),接單等待時(shí)間達(dá)到峰值,此時(shí)系統(tǒng)運(yùn)力不足比較明顯。工作日與周末也存在明顯的差異,周末晚高峰運(yùn)力不足的現(xiàn)象甚至比午高峰更突出,此時(shí)接單等待時(shí)間明顯比工作日同時(shí)段更長(zhǎng)。
為了排除夜間等時(shí)段少量訂單帶來(lái)的偏差,我們將研究數(shù)據(jù)集中在白天訂單比較密集的時(shí)段。因此選定6、7、8三個(gè)月,下單時(shí)間從上午10時(shí)以后到晚上20時(shí)之前的訂單作為研究對(duì)象。同時(shí)我們舍棄了訂單類型為星巴克代購(gòu)的訂單,該類型訂單占比極少。實(shí)際有效數(shù)據(jù)條數(shù)20余萬(wàn)條。
訂單配送類型的影響較難量化。圖3-b中顯示了不同配送類型訂單一天中每小時(shí)平均接單等待時(shí)間波動(dòng)的差異情況。通過(guò)對(duì)比我們可以發(fā)現(xiàn),品牌外賣的接單等待時(shí)間最短,隨意購(gòu)類型接單等待時(shí)間平均比品牌外賣的多一分鐘左右,但是這兩種類型波動(dòng)趨勢(shì)基本一致。同城快送訂單的接單等待時(shí)間與其他兩者存在較大差異,均值也大于其他兩者。通過(guò)方差分析,我們也可以清楚看到不同配送類型訂單的接單等待時(shí)間存在明顯差異。
圖3 平均接單等待時(shí)間分布
在接下來(lái)的回歸模型中,我們將剔除訂單類型的影響,只關(guān)注訂單配送類型為品牌外賣的訂單,降低問(wèn)題的復(fù)雜程度。此類訂單標(biāo)準(zhǔn)化程度高,在總單量里約占30%,約5.2萬(wàn)條記錄。接單平均等待時(shí)間均值為2.77分鐘,中位數(shù)0.73分鐘。
在計(jì)算附近活躍配送員數(shù)量Ri和訂單運(yùn)力需求Di時(shí),我們?nèi)∮唵蜗聠螘r(shí)刻前一段時(shí)間t=20 min以及附近距離r=3KM。使用如上數(shù)據(jù)回歸結(jié)果如下:
回歸模型的R方為0.093,也就是說(shuō)所選取指標(biāo)部分程度上可以對(duì)訂單接單等待時(shí)間進(jìn)行解釋。除附近活躍配送員數(shù)量R不夠顯著外,其他因素均顯著。
從表中我們可以看出,訂單配送距離DD越短,基礎(chǔ)配送費(fèi)Fee越高,訂單被接單的等待時(shí)間就越短。基礎(chǔ)配送費(fèi)每多1元錢(qián),可以使接單等待時(shí)間減少0.02分鐘。
附近活躍配送員數(shù)量R越多,訂單量D越少,配送訂單就容易被更快接單。附近每多一個(gè)活躍騎手,接單等待時(shí)間會(huì)減少0.004分鐘;相反的,如果周圍每多一個(gè)訂單,接單等待時(shí)間則會(huì)延長(zhǎng)0.025分鐘。需要注意的是,這里R與D表現(xiàn)出比較強(qiáng)的多重共線性。主要原因在于本文所用數(shù)據(jù)為實(shí)際成交訂單,缺失了因?yàn)檫\(yùn)力不足而未滿足的訂單信息;同時(shí)活躍騎手的數(shù)量也是根據(jù)成交訂單推算而來(lái),如果騎手上線但長(zhǎng)時(shí)間空閑,則沒(méi)有納入統(tǒng)計(jì)。因此R與D均是強(qiáng)相關(guān)于實(shí)際成交訂單,所以兩者之間有較強(qiáng)的共線性。
表1 基本模型回歸結(jié)果
顧客小費(fèi)Tip和平臺(tái)補(bǔ)貼Sub的結(jié)果則與我們的預(yù)期恰恰相反。兩者系數(shù)均為正值,也就是意味著,顧客小費(fèi)和平臺(tái)補(bǔ)助越高,則訂單被接單的等待時(shí)間就越長(zhǎng)。顯然這是與我們的認(rèn)知相違背的。我們發(fā)現(xiàn)這里存在雙向因果導(dǎo)致的內(nèi)生性。接單等待時(shí)間過(guò)長(zhǎng),會(huì)刺激顧客增加消費(fèi)以促使更快被接單,同時(shí)平臺(tái)對(duì)長(zhǎng)時(shí)間未接的訂單增加官方補(bǔ)貼使其盡快被接單。也就是說(shuō)接單等待時(shí)間會(huì)對(duì)小費(fèi)和平臺(tái)補(bǔ)貼有同向的影響。回歸所使用的數(shù)據(jù)為訂單被接單時(shí)顧客支付的消費(fèi)和平臺(tái)給予的補(bǔ)貼,缺少變化的過(guò)程。因此得到的結(jié)果并不能夠真實(shí)的反應(yīng)小費(fèi)和補(bǔ)助對(duì)接單等待時(shí)間的影響。
上述結(jié)果中顯示回歸模型存在明顯的內(nèi)生性問(wèn)題。顧客小費(fèi)和平臺(tái)補(bǔ)貼作為影響因變量接單等待時(shí)間的主要因素,反過(guò)來(lái)又會(huì)被接單等待時(shí)間所影響,這種情況屬于內(nèi)生性問(wèn)題中互為因果造成的內(nèi)生性問(wèn)題。內(nèi)生性問(wèn)題是指解釋變量和誤差項(xiàng)存在相關(guān)關(guān)系。內(nèi)生性的來(lái)源有許多種,其中包括遺漏變量偏差、選擇偏差、雙向因果、動(dòng)態(tài)面板和測(cè)量誤差。內(nèi)生性問(wèn)題的常用解決辦法主要有工具變量法和Heckman 兩階段模型。工具變量法的實(shí)質(zhì)是通過(guò)工具變量將存在內(nèi)生性問(wèn)題的解釋變量分成外生部分和內(nèi)生部分兩部分。Heckman 兩階段模型主要是用來(lái)修正由于自選擇偏差和樣本選擇偏差造成的內(nèi)生性問(wèn)題。
首先,本案例中模型的內(nèi)生性問(wèn)題是在接單等待時(shí)間較長(zhǎng)的情況下發(fā)生的。只有當(dāng)接單等待時(shí)間較長(zhǎng)時(shí),會(huì)明顯增加消費(fèi)者增加消費(fèi)、平臺(tái)提高補(bǔ)貼的意愿。當(dāng)接單等待時(shí)間較短的時(shí)候,消費(fèi)者與平臺(tái)增加提高消費(fèi)、補(bǔ)貼的意愿并不強(qiáng)烈。因此我們首先將進(jìn)行分段回歸,首先選取接單等待時(shí)間較小的部分?jǐn)?shù)據(jù)進(jìn)行回歸,在這里我們?nèi)〗訂蔚却龝r(shí)間小于1分鐘的子樣本集進(jìn)行回歸,其他設(shè)定不變?;貧w結(jié)果如下:
表2 接單等待時(shí)間較短的樣本子集回歸結(jié)果
從回歸結(jié)果中可以看出,當(dāng)使用接單等待時(shí)間較小的子樣本進(jìn)行回歸時(shí),在原樣本回歸結(jié)果中發(fā)生的內(nèi)生性問(wèn)題并沒(méi)有出現(xiàn)。此時(shí)顧客小費(fèi)對(duì)接單等待時(shí)間的影響是負(fù)向的,也就是說(shuō)小費(fèi)越高,接單等待時(shí)間越短,與我們的認(rèn)知所一致。平臺(tái)補(bǔ)貼表現(xiàn)為不顯著,因?yàn)榻訂蔚却龝r(shí)間較短時(shí)平臺(tái)很少會(huì)進(jìn)行補(bǔ)貼,因此補(bǔ)貼這一項(xiàng)并不顯著。此外,用子樣本回歸時(shí),除訂單量和配送員數(shù)量表現(xiàn)出強(qiáng)烈共線性之外,基礎(chǔ)配送費(fèi)用和配送距離也存在共線性。
接下來(lái)我們回到原樣本集。本案例中數(shù)據(jù)存在缺失,因此給內(nèi)生新問(wèn)題的處理帶來(lái)極大困難。原始數(shù)據(jù)缺少小費(fèi)及補(bǔ)貼隨等待時(shí)間變化的過(guò)程,只有最終被接單時(shí)刻的數(shù)據(jù)。修正雙向因果造成的內(nèi)生性問(wèn)題,工具變量法是最有效的。通過(guò)工具變量估計(jì)得到 的內(nèi)生解釋變量的擬合值替代內(nèi)生解釋變量,可以使擬合值與復(fù)合誤差項(xiàng)不相關(guān),即解決了雙向因果導(dǎo)致的內(nèi)生解釋變量與誤差項(xiàng)相關(guān)的問(wèn)題。但是在本案例中由于初始小費(fèi)以及小費(fèi)增加次數(shù)數(shù)據(jù)的缺失,并沒(méi)有找到合適的工具變量。同時(shí),Heckman兩階段模型并不適用于處理雙向因果造成的內(nèi)生性問(wèn)題。
滯后變量模型(Lagged Variable)是經(jīng)濟(jì)學(xué)中解決內(nèi)生性問(wèn)題的常用手段。滯后變量是具有滯后作用的變量。例如在消費(fèi)函數(shù)中,本期消費(fèi)不僅被本期收入所影響,還受到前期收入的影響。然而當(dāng)我們引入內(nèi)生變量顧客小費(fèi)Tip和平臺(tái)補(bǔ)貼Sub的前一期作為滯后變量,使用滯后變量模型回歸得到的結(jié)果也并不理想,對(duì)內(nèi)生性問(wèn)題的解決沒(méi)有改善。
由于基礎(chǔ)配送費(fèi)用、顧客消費(fèi)、平臺(tái)補(bǔ)助、配送距離等解釋變量都是與每一條記錄一一對(duì)應(yīng)的,我們主要通過(guò)改變附近活躍配送員數(shù)量Ri和訂單運(yùn)力需求Di的計(jì)算方式,來(lái)進(jìn)行穩(wěn)健性檢驗(yàn)。附近活躍配送員數(shù)量Ri和訂單運(yùn)力需求Di會(huì)隨著訂單下單時(shí)刻前一段時(shí)間t以及附近距離r的取值不同,有不同的計(jì)算結(jié)果。分別取附近距離r=3 KM、2KM以及時(shí)間t=30 min、20min、10min ,計(jì)算出不同條件下附近活躍配送員數(shù)量和訂單運(yùn)力需求。各組回歸結(jié)果如下。
表3 時(shí)間t與距離r取值不同時(shí)的回歸結(jié)果
通過(guò)以上幾組回歸結(jié)果的對(duì)比,我們可以看到不同r與t取值得到的結(jié)論基本與原模型回歸結(jié)果保持一致。從運(yùn)力供需平衡的角度看,附近活躍騎手越多,運(yùn)力供給越充足,接單等待時(shí)間越短;配送需求的增加則會(huì)使得接單等待時(shí)間變長(zhǎng)。從配送訂單配送距離越短以及基礎(chǔ)配送費(fèi)越高的配送訂單,更收到配送員的青睞,接單等待時(shí)間就越短。小費(fèi)與平臺(tái)補(bǔ)貼跟接單等待時(shí)間呈正相關(guān),同樣存在反向因果(互為因果)的內(nèi)生性問(wèn)題。