程子庚 趙珂瑤 李倩 李藝璇
摘要:“拍照賺錢(qián)”是移動(dòng)互聯(lián)網(wǎng)下的一個(gè)自助式服務(wù)模式。APP用戶會(huì)員通過(guò)完成需要拍照的任務(wù),賺取對(duì)任務(wù)所標(biāo)定的酬金。因此,任務(wù)定價(jià)是該平臺(tái)運(yùn)行的核心要素。本文利用數(shù)據(jù)挖掘的手段探索位置、任務(wù)、會(huì)員等相關(guān)因素與任務(wù)定價(jià)乃至任務(wù)認(rèn)領(lǐng)完成情況的量化關(guān)系,實(shí)現(xiàn)統(tǒng)計(jì)建模,并優(yōu)化了任務(wù)定價(jià)分配方案。
關(guān)鍵詞:統(tǒng)計(jì)建模;任務(wù)定價(jià);數(shù)據(jù)挖掘
中圖分類(lèi)號(hào):TP391;F274 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)04-0114-02
1 問(wèn)題分析
1.1 模型背景
“拍照賺錢(qián)”是移動(dòng)互聯(lián)網(wǎng)下的一種自助式服務(wù)模式。用戶下載APP,注冊(cè)成為APP的會(huì)員,然后從APP上領(lǐng)取需要拍照的任務(wù),賺取APP對(duì)任務(wù)所標(biāo)定的酬金。這種基于移動(dòng)互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺(tái),為企業(yè)提供各種商業(yè)檢查和信息搜集,相比傳統(tǒng)的市場(chǎng)調(diào)查方式可以大大節(jié)省調(diào)查成本,而且有效地保證了調(diào)查數(shù)據(jù)真實(shí)性,縮短了調(diào)查的周期。因此APP成為該平臺(tái)運(yùn)行的核心,而APP中的任務(wù)定價(jià)又是其核心要素。如果定價(jià)不合理,有的任務(wù)就會(huì)無(wú)人問(wèn)津,而導(dǎo)致商品檢查的失敗。
1.2 模型假設(shè)
(1)本文所提供的數(shù)據(jù)均真實(shí)可靠;(2)題目中位置均忽略高度屬性,即位置之間的距離均采用二維平面距離進(jìn)行計(jì)算;(3)針對(duì)短時(shí)間同一個(gè)模型,認(rèn)為其社會(huì)環(huán)境系統(tǒng)是不變的;(4)針對(duì)短時(shí)間內(nèi)的會(huì)員信息數(shù)據(jù),認(rèn)為會(huì)員的數(shù)量、地理位置、信譽(yù)值等相關(guān)屬性均保持不變;(5)忽略行業(yè)內(nèi)部不正當(dāng)競(jìng)爭(zhēng)對(duì)模型產(chǎn)生的畸形影響;(6)每一個(gè)位置視為一個(gè)質(zhì)點(diǎn),且不考慮道路阻塞的情況。
1.3 模型分析
此題本質(zhì)上是一個(gè)基于人機(jī)交互系統(tǒng)的計(jì)算任務(wù)定價(jià)的數(shù)據(jù)建模問(wèn)題。用戶首先注冊(cè)成為會(huì)員,并上傳自己的GPS經(jīng)緯度信息,獲取初始信譽(yù)值。會(huì)員根據(jù)個(gè)人情況,從數(shù)據(jù)庫(kù)發(fā)布的任務(wù)信息中預(yù)訂并完成任務(wù)來(lái)賺取酬金。系統(tǒng)則根據(jù)累計(jì)的交易情況、會(huì)員的反饋不斷更新數(shù)據(jù)庫(kù)信息,并以此不斷地調(diào)整任務(wù)價(jià)格以及適當(dāng)?shù)夭扇∪蝿?wù)聯(lián)合打包的方式提高會(huì)員完成任務(wù)率。
2 模型建立與求解
2.1 任務(wù)定價(jià)規(guī)律的研究
2.1.1 模型的建立
本文以經(jīng)度和緯度以及其相應(yīng)的任務(wù)標(biāo)價(jià)的觀測(cè)數(shù)據(jù)為出發(fā)點(diǎn),通過(guò)對(duì)這種數(shù)據(jù)結(jié)構(gòu)的分析研究,尋找變量之間的依賴(lài)關(guān)系。按回歸模型類(lèi)型可以將其劃分為線性回歸分析和非線性回歸分析。為將問(wèn)題簡(jiǎn)化,即認(rèn)為該問(wèn)題是一個(gè)二元線性回歸問(wèn)題,并主要采用二元線性回歸分析的方法來(lái)初步研究項(xiàng)目的任務(wù)定價(jià)規(guī)律。
設(shè)因變量定價(jià)Y與2個(gè)解釋變量經(jīng)緯度x1和x2之間具有線性相關(guān)關(guān)系,則有(2-1):
其中,是殘差。
2.1.2 模型的求解
利用計(jì)算機(jī)求解該模型,得到模型的回歸系數(shù)估計(jì)值及其置信區(qū)間(置信水平)、檢驗(yàn)統(tǒng)計(jì)量R2,F(xiàn),p,s2的結(jié)果如表1。
得到線性回歸關(guān)系的表達(dá)式為(2-2):
(2-2)
2.1.3 結(jié)果分析
表1顯示,R2=0.0148指因變量y的1.48%可由模型確定,F(xiàn)值并沒(méi)有遠(yuǎn)遠(yuǎn)超出臨界值,s2作為方差也相對(duì)較大,所以該線性回歸并不合理。
一般在生產(chǎn)實(shí)踐和科學(xué)研究中,人們得到了參數(shù)x=(x1,…,xn)和因變量y的數(shù)據(jù),需要求出關(guān)系式y(tǒng)=f(x),這時(shí)就可以用到回歸分析的方法。進(jìn)行線性回歸時(shí),有三個(gè)基本假定:(1)待定參數(shù)是線性關(guān)系;(2)殘差是獨(dú)立的;(3)殘差滿足標(biāo)準(zhǔn)正態(tài)分布。
因變量Y的值是隨每組觀察值(x1,x2)而變化的,可以看出,并非所有殘差都在0點(diǎn)附近均勻分布,即存在較多高杠桿點(diǎn),故數(shù)據(jù)中存在強(qiáng)影響點(diǎn)、異常觀測(cè)點(diǎn)。根據(jù)以上分析得出使用線性回歸來(lái)描述標(biāo)價(jià)與任務(wù)位置之間的關(guān)系并不合理,于是采取數(shù)據(jù)建模的方法,直接對(duì)不同價(jià)格的位置進(jìn)行聚類(lèi)來(lái)分析標(biāo)價(jià)與任務(wù)位置的關(guān)系。在具體求解過(guò)程中采用了K-Means方法。通過(guò)對(duì)標(biāo)價(jià)的數(shù)值大小將其聚類(lèi)為4類(lèi)。標(biāo)價(jià)與位置并未呈現(xiàn)一個(gè)均勻的、有規(guī)律性的線性分布。因此,使用簡(jiǎn)單的線性回歸對(duì)任務(wù)標(biāo)價(jià)進(jìn)行研究是不可行的。
2.2 任務(wù)未完成原因的分析
任務(wù)完成情況與任務(wù)位置和任務(wù)標(biāo)價(jià)有著顯著的關(guān)系。結(jié)合實(shí)際情況分析得出如下結(jié)論:
(1)未完成的任務(wù)在地理位置上呈集中分布,所以任務(wù)的完成率跟地理位置有明顯的相關(guān)關(guān)系。未完成的任務(wù)主要分布在中心點(diǎn)分別為(22.60,114.00)、(23.18,113.11)、(23.05,113.10),半徑分別為0.2、0.1、0.05的鄰域中;(2)已完成任務(wù)的定價(jià)分布跨度較大,在45和90之間都有很顯著的分布傾向,期望Ex位于70的右側(cè);未完成的任務(wù)定價(jià),期望Ex位于70的左側(cè)。所以任務(wù)的完成率與任務(wù)的定價(jià)有關(guān);(3)任務(wù)未完成,一部分原因是任務(wù)點(diǎn)在較偏遠(yuǎn)區(qū)域,另一部分原因是雖然任務(wù)點(diǎn)在中心區(qū)域,但任務(wù)量多,標(biāo)價(jià)較低,對(duì)會(huì)員的吸引力不足;(4)任務(wù)未完成還可能與會(huì)員所在地區(qū)有關(guān)。定義一個(gè)比值即任務(wù)數(shù)與會(huì)員數(shù)的比例來(lái)衡量該地區(qū)任務(wù)的擁擠程度:比值越大,任務(wù)越擁擠,完成情況越不理想;反之則完成情況理想。
3 模型優(yōu)化
3.1 打包優(yōu)化指標(biāo)的提出
配額ReLU(修正線性單元)系數(shù):會(huì)員信譽(yù)值與會(huì)員的任務(wù)預(yù)訂限額并非簡(jiǎn)單的線性關(guān)系,由相關(guān)背景知識(shí)可得,新用戶只能預(yù)定一個(gè)任務(wù),預(yù)定的數(shù)量隨信譽(yù)的提高而增長(zhǎng),因此,這里引入配額ReLU系數(shù),由式(3-1)分段表示: (3-1)
鄰域內(nèi)會(huì)員活躍度:第j個(gè)會(huì)員在點(diǎn)a的領(lǐng)域內(nèi)配額數(shù)與該鄰域任務(wù)總數(shù)量的比值。
預(yù)訂限額與會(huì)員的信譽(yù)有關(guān),原則上,會(huì)員的信譽(yù)越高,獲得的參與任務(wù)的機(jī)會(huì)也就越高,信譽(yù)高的會(huì)員可以拿到更多的酬金。即任務(wù)標(biāo)價(jià)、會(huì)員活躍度和任務(wù)完成率是一個(gè)三維閉循環(huán)關(guān)系。
鄰域內(nèi)任務(wù)密度:范圍內(nèi)的任務(wù)總和形成的密度值
3.2 貪心算法分配打包任務(wù)
改進(jìn)后的定價(jià)方案可以提升任務(wù)執(zhí)行的成功率,但是部分任務(wù)分布不均勻,任務(wù)附近會(huì)員人數(shù)、會(huì)員預(yù)定任務(wù)限額和信譽(yù)度都相差較大,導(dǎo)致部分區(qū)域的任務(wù)因分配方式不合理而無(wú)法成功完成,部分任務(wù)被附近較多的會(huì)員爭(zhēng)相選擇。本文考慮將任務(wù)聯(lián)合在一起打包發(fā)布,如圖1紅色表示被納入到已打包集合內(nèi)的任務(wù)點(diǎn),藍(lán)色表示距離該集合最近的任務(wù)點(diǎn)。采用貪心算法,每一步都計(jì)算得到當(dāng)前最優(yōu)解納入集合,從而解決問(wèn)題。
為了降低公司成本,本文設(shè)計(jì)了打包后價(jià)格調(diào)整方案,考慮適當(dāng)降低打包后的任務(wù)標(biāo)價(jià):
其中,fnew為調(diào)整后的任務(wù)標(biāo)價(jià),Cl為會(huì)員預(yù)定的從小到大重新排列后的第l個(gè)任務(wù)的標(biāo)價(jià),Limit為會(huì)員預(yù)定任務(wù)的限額。
3.2.1 目標(biāo)函數(shù)和約束條件的確定
該模型是一個(gè)雙目標(biāo)模型,以距離最近為第一優(yōu)化目標(biāo),將距離最近的5個(gè)任務(wù)打包聯(lián)合發(fā)布,目標(biāo)函數(shù)為(3-6);分析上述指標(biāo)的含義并結(jié)合模型一與問(wèn)題二的結(jié)論,以定價(jià)最低為第二優(yōu)化目標(biāo),目標(biāo)函數(shù)為(3-7)。
根據(jù)以上目標(biāo)建立優(yōu)化模型,在題目給定的可行域中尋求最優(yōu)解。
約束條件(3-8):公司提供酬金的最高預(yù)算為budget;
約束條件(3-9):打包后的會(huì)員活躍度不能低于當(dāng)前活躍度;
約束條件(3-10):打包后的完成率期望不能低于當(dāng)前期望。
3.2.2 打包模型的求解
根據(jù)上述模型,利用計(jì)算機(jī)求解。得到打包之前,任務(wù)未完成區(qū)域大致為3類(lèi),打包之后未完成任務(wù)的數(shù)量明顯減少,減少了39.94%,聚簇程度明顯降低,且僅聚為2類(lèi)。
參考文獻(xiàn)
[1]杜劍平,韓中庚.“互聯(lián)網(wǎng)+”時(shí)代的出租車(chē)資源配置模型[J].數(shù)學(xué)建模及其應(yīng)用,2015,4(4):40-49+85.
[2]張媛.大眾參與眾包的行為影響因素研究[D].東北財(cái)經(jīng)大學(xué),2011.
[3]姜啟源.多屬性決策中幾種主要方法的比較[J].數(shù)學(xué)建模及其應(yīng)用,2012,1(3):16-28.