• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      車貨匹配中考慮注意力機(jī)制的基于SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)模型

      2022-11-02 02:55:22王成浩合肥工業(yè)大學(xué)管理學(xué)院安徽合肥230009
      物流科技 2022年10期
      關(guān)鍵詞:點(diǎn)擊率雙塔貨物

      方 芳,王成浩 (合肥工業(yè)大學(xué) 管理學(xué)院,安徽 合肥 230009)

      0 引 言

      車貨信息不對(duì)稱的問題在車貨匹配平臺(tái)出現(xiàn)后得到了有效的緩解,但是貨源和車源數(shù)量在不斷增加,因此車貨匹配平臺(tái)也承受著越來越大的壓力。然而,隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的發(fā)展,大量的車貨源數(shù)據(jù)也為車貨匹配帶來了新的機(jī)會(huì),通過對(duì)數(shù)據(jù)的分析處理,可以實(shí)現(xiàn)更加精準(zhǔn)的車貨匹配。因此,越來越多的研究人員開始從大規(guī)模數(shù)據(jù)的角度去探索新的車貨匹配方法。

      在大數(shù)據(jù)時(shí)代,伴隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的浪潮,研究人員進(jìn)行了以下探索。黃美華等人通過網(wǎng)頁爬蟲采集到車貨匹配平臺(tái)中真實(shí)的歷史數(shù)據(jù),并利用C4.5決策樹算法建立車貨匹配模型,所建模型能夠達(dá)到較高的匹配精確度;在此基礎(chǔ)上,黃美華等人運(yùn)用最小二乘支持向量機(jī)建立車貨信息匹配模型,在保持匹配精確度的同時(shí),縮短了一半的計(jì)算時(shí)間。Tian等考慮到目前研究理想環(huán)境、小數(shù)據(jù)集、靜態(tài)匹配和匹配效率低等方面的局限,提出了一種基于改進(jìn)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的車貨匹配算法,并利用從物流行業(yè)大數(shù)據(jù)平臺(tái)中獲得的數(shù)據(jù)進(jìn)行驗(yàn)證,證明了該方法能夠提高車貨匹配的效率,同時(shí)為中小型物流企業(yè)的車貨匹配提供理論參考。周夏考慮了“滴滴打車”的模式,在不平衡數(shù)據(jù)的二分類問題的實(shí)驗(yàn)背景下,利用集成學(xué)習(xí)的方法建立車貨匹配預(yù)測(cè)模型,并利用P平臺(tái)的大規(guī)模數(shù)據(jù)進(jìn)行驗(yàn)證,為車貨匹配的預(yù)測(cè)研究提供參考與借鑒價(jià)值。肖斌在虛擬環(huán)境中具體定義了車貨匹配問題的半馬爾科夫過程,并基于深度前饋網(wǎng)絡(luò)設(shè)計(jì)了深度Q網(wǎng)絡(luò)算法,有效地提高了車貨匹配的效率。從這些研究中可以看出,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法逐漸被應(yīng)用于車貨匹配中,并且具有很好的效果。

      推薦系統(tǒng)中常用的模型之一就是雙塔模型,其運(yùn)用了深度學(xué)習(xí)的方法,具有快速篩選海量數(shù)據(jù)和準(zhǔn)確度較高的優(yōu)勢(shì),因此被廣泛地應(yīng)用在搜索、廣告等領(lǐng)域。DSSM(Deep Structured Semantic Model)模型由微軟于2013年提出,這便是最早的雙塔模型,其通過搜索引擎里文檔和查詢的海量點(diǎn)擊曝光日志,用DNN深度網(wǎng)絡(luò)將文檔和查詢表達(dá)為低維語義向量,并通過余弦相似度來計(jì)算兩個(gè)語義向量的距離,最終訓(xùn)練出語義相似度模型。視頻召回雙塔模型是YouTube于2019年提出的,通過計(jì)算用戶和候選視頻的相似度,為用戶推薦其可能感興趣的視頻。莫比烏斯模型是由百度在2019年提出的,通過計(jì)算用戶查詢和廣告之間的相似度,生成推薦序列。統(tǒng)一嵌入模型是Facebook在2020年提出的,通過計(jì)算查詢和文檔之間的相似度,為用戶提供準(zhǔn)確的搜索結(jié)果。雙塔模型之所以受歡迎有以下兩個(gè)原因,一是雙塔分離的結(jié)構(gòu)使其可以快速篩選海量數(shù)據(jù),二是其本身是一個(gè)監(jiān)督學(xué)習(xí)的過程,能夠提供良好的結(jié)果。

      因此,考慮到雙塔模型的優(yōu)勢(shì)和車貨平臺(tái)中大量的車貨數(shù)據(jù),本文將雙塔模型應(yīng)用到車貨匹配中,提出了一種考慮注意力機(jī)制的基于SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)模型——A-SENet雙塔模型。A-SENet雙塔模型主要包括貨物塔、Attention模塊、司機(jī)塔和點(diǎn)擊率輸出模塊。在貨物塔中,對(duì)貨物的多個(gè)特征進(jìn)行嵌入處理,并進(jìn)一步通過SENet和DNN計(jì)算貨物隱向量。在Attention模塊中,將與司機(jī)相關(guān)的所有貨物通過Attention機(jī)制進(jìn)行加權(quán)求和,為得到更加準(zhǔn)確的司機(jī)隱向量做準(zhǔn)備。在司機(jī)塔中,對(duì)司機(jī)的多個(gè)特征進(jìn)行嵌入處理,并通過SENet進(jìn)一步處理,與Attention模塊的輸出拼接,一起輸入DNN中計(jì)算司機(jī)隱向量。最后,通過計(jì)算司機(jī)隱向量和貨物隱向量的點(diǎn)積,預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率?;谀耻囏浧ヅ淦脚_(tái)的數(shù)據(jù)集,最終的實(shí)驗(yàn)結(jié)果證明了A-SENet雙塔模型的有效性和優(yōu)越性。

      1 基于A-SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)

      面對(duì)車貨匹配平臺(tái)中的大規(guī)模車源和貨源數(shù)據(jù),雙塔模型在保持匹配精準(zhǔn)度的同時(shí),也能提高匹配效率,可以快速篩選數(shù)據(jù)。當(dāng)面對(duì)司機(jī)和貨物大量的特征時(shí),不同特征對(duì)點(diǎn)擊率預(yù)測(cè)的重要性不同,而SENet可以動(dòng)態(tài)地增加重要特征的權(quán)重,降低不重要特征的權(quán)重。在表示司機(jī)向量時(shí),除了利用常規(guī)的司機(jī)特征,也可以利用歷史點(diǎn)擊貨物的特征,通過Attention機(jī)制對(duì)點(diǎn)擊過的貨物隱向量進(jìn)行加權(quán)求和,得到更加準(zhǔn)確的司機(jī)隱向量。下面首先對(duì)車貨匹配問題進(jìn)行形式化描述,然后詳細(xì)介紹基于A-SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)。

      1.1 車貨匹配問題描述

      通過司機(jī)塔和貨物塔對(duì)司機(jī)特征和貨物特征加以處理,可以得到司機(jī)隱向量和貨物隱向量,從而計(jì)算出司機(jī)點(diǎn)擊貨物的概率。此時(shí)司機(jī)點(diǎn)擊貨物的標(biāo)簽用y表示,其中,y=1意為司機(jī)點(diǎn)擊了的貨物,y=0表示司機(jī)未點(diǎn)擊的貨物。綜上所述,實(shí)驗(yàn)的最終目標(biāo)便是預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率。

      1.2 基于A-SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)框架

      基于A-SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)框架(如圖1所示),共由四個(gè)模塊組成,分別是貨物塔、Attention模塊、司機(jī)塔和點(diǎn)擊率輸出模塊。首先,貨物塔通過SENet和DNN得到貨物隱向量。然后,將貨物塔中與司機(jī)相關(guān)的貨物隱向量通過Attention機(jī)制進(jìn)行加權(quán)求和。司機(jī)塔中通過SENet對(duì)司機(jī)特征進(jìn)行處理。處理后的特征向量與Attention機(jī)制加權(quán)求和后的向量進(jìn)行拼接,共同輸入DNN中,得到司機(jī)隱向量。最后,司機(jī)隱向量和貨物隱向量通過點(diǎn)乘和Sigmoid激活函數(shù),計(jì)算出司機(jī)點(diǎn)擊貨物的概率。

      圖1 基于A-SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)框架Fig.1 Click-through rate prediction framework of drivers based on A-SENet two-tower model

      1.2.1 貨物塔

      在普通的雙塔模型中,將處理后的貨物特征輸入DNN中,可以得到表示該貨物的貨物隱向量。在選取具體特征時(shí),一般是根據(jù)相關(guān)知識(shí)和經(jīng)驗(yàn)進(jìn)行選取,但無法判斷特征的重要性。因此,為了判斷不同特征的重要性,引入SENet機(jī)制,可以動(dòng)態(tài)地增加重要特征的權(quán)重,降低不重要特征的權(quán)重,從而獲取更加準(zhǔn)確的貨物隱向量。

      不同的貨物特征向量對(duì)于貨物隱向量的表示具有不同的重要性,所以引入SENet機(jī)制動(dòng)態(tài)地增加重要貨物特征向量的權(quán)重,降低不重要貨物特征向量的權(quán)重,對(duì)嵌入后的貨物特征向量做進(jìn)一步的更新。SENet機(jī)制共分為三步:擠壓階段(Squeeze)、激勵(lì)階段(Excitation)、再稱重階段(Re-Weight),接下來描述貨物特征向量通過SENet機(jī)制更新的具體過程。

      1.2.1.1 擠壓階段

      1.2.1.2 激勵(lì)階段

      1.2.1.3 再稱重階段

      通過上述操作,可以得到貨物i的貨物隱向量,同理,可以得到由n個(gè)貨物的貨物隱向量構(gòu)成的貨物塔。

      1.2.2 Attention模塊本研究認(rèn)為司機(jī)歷史點(diǎn)擊過的貨物可以表示司機(jī)的興趣,所以將貨物塔中與司機(jī)相關(guān)的貨物抽取出來。但是,點(diǎn)擊貨物的重要性并不完全相同,為了更好地表示不同貨物的權(quán)重,利用Attention機(jī)制對(duì)相關(guān)貨物的貨物隱向量分配不同的權(quán)重,并進(jìn)行加權(quán)求和,為司機(jī)塔中的拼接操作提前做好準(zhǔn)備。

      α為司機(jī)j第c個(gè)相關(guān)貨物隱向量的權(quán)重,S為司機(jī)j相關(guān)貨物隱向量的綜合表示。

      通過上述操作,可以得到司機(jī)j相關(guān)貨物隱向量的綜合表示,同理,我們可以得到m個(gè)司機(jī)的相關(guān)貨物隱向量的綜合表示。

      1.2.3 司機(jī)塔

      司機(jī)塔的操作與貨物塔的操作基本相同,目的是得到司機(jī)的隱向量表示。上一節(jié)中已經(jīng)提到,為了得到更加準(zhǔn)確的司機(jī)隱向量表示,考慮了司機(jī)的歷史點(diǎn)擊貨物,并通過attention機(jī)制為不同的相關(guān)貨物賦予不同的權(quán)重,得到相關(guān)貨物隱向量的綜合表示。在司機(jī)塔中,將其與SENet操作后的司機(jī)特征向量進(jìn)行拼接共同輸入DNN中,得到司機(jī)隱向量。

      1.2.3.2 激勵(lì)階段

      1.2.3.3再稱重階段

      通過上述操作,可以得到司機(jī)j的司機(jī)隱向量,同理,可以得到由m個(gè)司機(jī)的司機(jī)隱向量構(gòu)成的司機(jī)塔。

      1.2.4 點(diǎn)擊率輸出模塊

      通過上述操作,可以得到司機(jī)j點(diǎn)擊貨物i的概率,同理,可以得到司機(jī)塔中任意一個(gè)司機(jī)點(diǎn)擊貨物塔中的任意一個(gè)貨物的概率。

      因?yàn)樗緳C(jī)是否點(diǎn)擊貨物屬于二分類問題,所以選擇負(fù)對(duì)數(shù)似然函數(shù)作為目標(biāo)函數(shù),具體公式如下:

      其中S表示總訓(xùn)練集,x和y分別是網(wǎng)絡(luò)的輸入和標(biāo)簽,()是網(wǎng)絡(luò)的輸出,表示司機(jī)點(diǎn)擊貨物的概率。

      2 實(shí) 驗(yàn)

      本節(jié)描述了為評(píng)估A-SENet雙塔模型的性能而進(jìn)行的實(shí)驗(yàn)設(shè)計(jì),其中包括實(shí)驗(yàn)使用的數(shù)據(jù)集、評(píng)價(jià)指標(biāo)、對(duì)比方法和實(shí)驗(yàn)流程。

      2.1 數(shù)據(jù)集

      本研究中所使用的數(shù)據(jù)集是某車貨匹配平臺(tái)提供的非公開的司機(jī)行為數(shù)據(jù)集,該數(shù)據(jù)集包括667名司機(jī)和2 208 579個(gè)貨物,在這2 208 579個(gè)貨物中,包括了與667名司機(jī)發(fā)生過交互的1 751 673個(gè)貨物,而司機(jī)的交互行為包括瀏覽貨物、點(diǎn)擊貨物和打電話,由于瀏覽貨物的行為占司機(jī)行為中的絕大多數(shù),所以認(rèn)為瀏覽貨物屬于未點(diǎn)擊行為,即負(fù)樣本;點(diǎn)擊貨物和打電話屬于點(diǎn)擊行為,即正樣本。在貨物塔中所使用的也是這1 751 673個(gè)貨物。為了保證實(shí)驗(yàn)的真實(shí)性,還進(jìn)行了數(shù)據(jù)處理工作。具體來說,就是刪除歷史行為不超過100次和點(diǎn)擊行為次數(shù)不超過10次的司機(jī)。因此,最終的實(shí)驗(yàn)數(shù)據(jù)集包括582名司機(jī)和1 105 719個(gè)貨物。

      2.2 評(píng)價(jià)指標(biāo)

      本研究選擇了兩種評(píng)價(jià)指標(biāo)來評(píng)估我們的方法,如下所示:

      AUC(Area Under Curve)是點(diǎn)擊率預(yù)測(cè)領(lǐng)域常用的評(píng)價(jià)指標(biāo),將樣本根據(jù)預(yù)測(cè)點(diǎn)擊率由大到小排列,然后隨機(jī)抽取一個(gè)正樣本和一個(gè)負(fù)樣本,正樣本排在負(fù)樣本前的概率即為AUC。計(jì)算公式如式(19)所示,表示從正樣本集合中隨機(jī)抽取的樣本,表示從負(fù)樣本集合中隨機(jī)抽取的樣本,和分別表示正負(fù)樣本的數(shù)量, ()表示樣本i的預(yù)測(cè)點(diǎn)擊率的排名。AUC的上限是1,結(jié)果越大表示性能越好。

      LogLoss(Log-likelihood Loss)用交叉熵來度量每個(gè)樣本的預(yù)測(cè)概率和實(shí)際標(biāo)簽之間的距離。計(jì)算公式如式 (18)所示,LogLoss值越低,表明與實(shí)際標(biāo)簽的偏差越小,性能越好。

      2.3 對(duì)比方法

      為了驗(yàn)證所提出的A-SENet雙塔模型的性能,與LR、雙塔模型、DNN、SENet雙塔模型、DeepFM方法進(jìn)行了比較。其中,LR是非DNN方法,其他是基于DNN的方法。具體來講,DNN是單模型,雙塔模型、SENet雙塔模型和DeepFM是雙組合模型。每個(gè)方法的介紹如下:

      LR (Logistic Regression,邏輯回歸)是用于點(diǎn)擊率預(yù)測(cè)的多字段分類數(shù)據(jù)的最廣泛使用的模型,它執(zhí)行基本形式的邏輯函數(shù)來模擬二元因變量。

      雙塔模型是在推薦系統(tǒng)召回和粗排環(huán)節(jié)中廣泛應(yīng)用的模型,雙塔的結(jié)構(gòu)使其能夠快速篩選海量數(shù)據(jù)。

      DNN是一個(gè)標(biāo)準(zhǔn)的深度神經(jīng)網(wǎng)絡(luò),只包括用于預(yù)測(cè)的嵌入層和MLP層。

      SENet雙塔模型在雙塔模型的基礎(chǔ)上,在左右雙塔均添加了SENet模塊,動(dòng)態(tài)地表示不同特征的重要性,在不影響雙塔模型速度的前提下,增加了雙塔模型的準(zhǔn)確度。

      DeepFM由Deep部分和FM部分組成,能夠同時(shí)學(xué)習(xí)低階和高階特征的交互。

      2.4 實(shí)驗(yàn)流程

      使用PyTorch實(shí)現(xiàn)本文提出的方法和所有的對(duì)比方法。采用60%的數(shù)據(jù)集作為訓(xùn)練集來學(xué)習(xí)參數(shù),20%的數(shù)據(jù)集作為驗(yàn)證集來調(diào)整超參數(shù),20%的數(shù)據(jù)集作為測(cè)試集來評(píng)估性能。對(duì)于所有的實(shí)驗(yàn)?zāi)P?,默認(rèn)使用Adam作為優(yōu)化器,學(xué)習(xí)率初始為0.001。神經(jīng)網(wǎng)絡(luò)的隱藏層設(shè)定為與嵌入維度相同,Batch size設(shè)為64。使用Dropout來防止神經(jīng)網(wǎng)絡(luò)中的過擬合。根據(jù)經(jīng)驗(yàn),設(shè)置如下超參數(shù):在{32,64,128,256,512}中測(cè)試嵌入維度,在{0.1,0.3,0.5,0.7,0.9}中測(cè)試Dropout比率。

      3 討 論

      本節(jié)將A-SENet雙塔模型與對(duì)比方法進(jìn)行比較以評(píng)估性能,同時(shí)探討了嵌入維度和Dropout比率對(duì)模型的影響。因?yàn)樵趯?duì)比方法中有雙塔模型和SENet雙塔模型兩種,關(guān)于SENet模塊和Attention模塊的必要性可以根據(jù)實(shí)驗(yàn)結(jié)果證明,所以在本節(jié)中沒有做消融實(shí)驗(yàn)。

      3.1 結(jié) 果

      實(shí)驗(yàn)結(jié)果如表1所示,所有實(shí)驗(yàn)結(jié)果都是通過5次實(shí)驗(yàn)以平均值報(bào)告的。從表1中可以發(fā)現(xiàn),不論是AUC指標(biāo),還是LogLoss指標(biāo),A-SENet雙塔模型是優(yōu)于其他對(duì)比方法的。具體來說:

      表1 AUC和LogLoss下的方法性能比較Table1 Performance comparison of methods by AUC and LogLoss

      LR的結(jié)果最差,說明非DNN的方法相比DNN的方法還是要差一些,即使在準(zhǔn)確度上不占優(yōu)勢(shì)的雙塔模型,其AUC和LogLoss結(jié)果相比LR也分別有1.26%和2.05%的改進(jìn),這也表明深度學(xué)習(xí)模型的非線性泛化能力有助于預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率。

      DNN的AUC和LogLoss結(jié)果要優(yōu)于雙塔模型,雖然雙塔模型包含兩個(gè)DNN模塊,但是每個(gè)DNN模塊只服務(wù)于司機(jī)特征或貨物特征,而DNN輸入的為司機(jī)特征和貨物特征,能夠捕捉到司機(jī)和貨物交互的特征,這表明司機(jī)特征和貨物特征的交互有助于預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率。

      SENet雙塔模型的AUC和LogLoss結(jié)果要優(yōu)于DNN,雖然沒有融合司機(jī)特征和貨物特征,但SENet模塊的添加使司機(jī)特征和貨物特征的權(quán)重進(jìn)行了動(dòng)態(tài)調(diào)整,增加了重要特征的權(quán)重,能夠得到更加準(zhǔn)確的司機(jī)隱向量和貨物隱向量,這表明SENet的使用有助于預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率。

      DeepFM的AUC和LogLoss結(jié)果要優(yōu)于SENet雙塔模型,DeepFM實(shí)現(xiàn)了司機(jī)特征和貨物特征的低階和高階交互,相比之前增加了特征的低階交互,這表明同時(shí)進(jìn)行高階和低階特征的交互有助于預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率。

      A-SENet雙塔模型的AUC和LogLoss結(jié)果要優(yōu)于DeepFM,因?yàn)锳-SENet雙塔模型通過Attention機(jī)制將司機(jī)的相關(guān)貨物加權(quán)求和,加強(qiáng)了司機(jī)隱向量的表示,這表明Attention和SENet的同時(shí)使用有助于預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率。

      僅從雙塔模型的角度考慮,即同時(shí)考慮雙塔模型、SENet雙塔模型和A-SENet雙塔模型這三種方法。首先,從結(jié)構(gòu)方面,雖然對(duì)普通的雙塔模型進(jìn)行了結(jié)構(gòu)的調(diào)整,但整體思路不變,仍是得到司機(jī)隱向量和貨物隱向量,這表明結(jié)構(gòu)復(fù)雜度的增加并沒有影響模型處理數(shù)據(jù)的效率。其次,從結(jié)果來看,相比雙塔模型,SENet雙塔模型在AUC和LogLoss方面分別獲得了8.79%和10.51%的改進(jìn),這表明了SENet模塊的必要性。同理,A-SENet雙塔模型相比SENet雙塔模型也有一定的改進(jìn),這也表明了Attention模塊的必要性。綜上所述,融合了SENet和Attention的雙塔模型不僅保留了處理車貨數(shù)據(jù)的高效率,還提高了預(yù)測(cè)司機(jī)點(diǎn)擊貨物概率的準(zhǔn)確度。

      3.2 嵌入維度的影響

      在這一小節(jié),研究嵌入維度對(duì)模型性能的影響。具體來說,在保持其他參數(shù)固定的情況下,嵌入維度在{32,64,128,256,512}的集合中搜索。圖2顯示了不同嵌入維度下雙塔模型、SENet雙塔模型和A-SENet雙塔模型在AUC和LogLoss方面的比較結(jié)果。從圖2中可以看到,隨著嵌入維度的增加,方法性能呈現(xiàn)先上升后下降的趨勢(shì),嵌入維度為128時(shí)AUC和LogLoss取得最好的結(jié)果。這一結(jié)果表明較大的嵌入維度可以包括更多有用的特征,然而嵌入維度如果設(shè)置得過大,整個(gè)模型會(huì)更加復(fù)雜,容易遭受過擬合問題,從而導(dǎo)致模型性能下降。因此,選取嵌入維度為128。

      圖2 不同嵌入維度下的方法比較結(jié)果Fig.8 The comparison results of methods at different embedding size

      3.3 Dropout比率的影響

      深度學(xué)習(xí)方法總在遭受擬合問題的困擾。Dropout是一種通過在訓(xùn)練過程中隨機(jī)丟棄神經(jīng)元來緩解過擬合問題的有效策略。所以,在這一小節(jié)來研究Dropout比率對(duì)模型性能的影響。具體來說,在保持其他參數(shù)固定的情況下,Dropout比率在{0.1,0.3,0.5,0.7,0.9}的集合中搜索。圖3中展示了不同Dropout比率下雙塔模型、SENet雙塔模型和A-SENet雙塔模型在AUC和LogLoss方面的比較結(jié)果。從圖3中可以看到,方法性能呈現(xiàn)先上升后下降的趨勢(shì),Dropout比率為0.3時(shí)AUC和LogLoss取得最好的結(jié)果。這一結(jié)果表明丟棄較多的神經(jīng)元會(huì)損失過多的信息,導(dǎo)致模型的性能降低,而丟棄較少的神經(jīng)元又無法有效地解決過擬合問題。因此,選取Dropout比率為0.3。

      圖3 不同dropout比率下的方法比較結(jié)果Fig.9 The comparison results of methods at different dropouts

      4 結(jié) 語

      文章以車貨匹配平臺(tái)中的大規(guī)模數(shù)據(jù)為切入點(diǎn),結(jié)合深度學(xué)習(xí),提出了考慮注意力機(jī)制的基于SENet雙塔模型的司機(jī)點(diǎn)擊率預(yù)測(cè)模型——A-SENet雙塔模型。在雙塔模型的大框架下,利用Attention和SENet對(duì)司機(jī)特征和貨物特征進(jìn)行處理,得到司機(jī)隱向量和貨物隱向量,進(jìn)一步計(jì)算司機(jī)點(diǎn)擊貨物的概率。在某車貨匹配平臺(tái)數(shù)據(jù)集的支持下,經(jīng)實(shí)驗(yàn)結(jié)果證明了該方法的有效性和優(yōu)越性,也證明了利用深度學(xué)習(xí)方法進(jìn)行車貨匹配的可行性。

      猜你喜歡
      點(diǎn)擊率雙塔貨物
      雙塔雙循環(huán)濕法脫硫系統(tǒng)SO3脫除率及排放測(cè)試
      雙塔雙循環(huán)脫硫系統(tǒng)超低排放運(yùn)行優(yōu)化研究
      能源工程(2022年1期)2022-03-29 01:06:36
      逛超市
      基于特征工程的視頻點(diǎn)擊率預(yù)測(cè)算法
      雙塔水庫抬高汛期限制水位的可行性探討
      喜報(bào)!萌寶大賽參賽者660名,投票321657人次,點(diǎn)擊率超60萬!
      海峽姐妹(2015年8期)2015-02-27 15:12:30
      雙塔換位
      讀寫算(中)(2014年2期)2014-03-05 07:28:06
      進(jìn)出口侵權(quán)貨物刑事執(zhí)法之法律適用
      徹底消失
      興趣英語(2013年8期)2013-11-13 06:54:02
      宜君县| 喀喇沁旗| 黄浦区| 丰城市| 开鲁县| 黄浦区| 江源县| 施秉县| 辽阳县| 莱州市| 科尔| 长春市| 哈巴河县| 赫章县| 武鸣县| 鄯善县| 读书| 务川| 山东省| 华池县| 防城港市| 遂宁市| 通海县| 通河县| 资兴市| 江口县| 灵寿县| 昭通市| 惠东县| 巨野县| 濮阳市| 福安市| 象山县| 济宁市| 新野县| 同仁县| 广安市| 万盛区| 康保县| 绥阳县| 镇赉县|