• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于面向渠道促銷場景多維分析的方法研究

      2021-12-12 01:12:36曾劍明
      科技信息·學(xué)術(shù)版 2021年32期
      關(guān)鍵詞:直方圖渠道神經(jīng)網(wǎng)絡(luò)

      摘要:現(xiàn)場促銷是促進(jìn)業(yè)務(wù)發(fā)展的重要方式之一。但是基于促銷的圖片進(jìn)行酬金結(jié)算涉及到很多問題,例如促銷經(jīng)緯度、促銷圖片、促銷時長是否符合要求等,基于人工稽核將是非常繁瑣的過程。基于此,提出了基于面向渠道促銷場景多維分析的方法研究,大幅提升稽核效率,促進(jìn)業(yè)務(wù)健康發(fā)展。

      一、引言

      每個流通企業(yè)都有自己渠道促銷的手段,其核心點也大同小異。在產(chǎn)品嚴(yán)重同質(zhì)化、促銷手段也大體類同的情況下,有效的促銷策略顯得非常重要,畢竟,從產(chǎn)品的本質(zhì)和市場上來看,還有季節(jié)性、地域性等等之分。目前家寬發(fā)展已經(jīng)到了同質(zhì)化競爭的階段,用戶對資費(fèi)的敏感度下降了,如何打造優(yōu)質(zhì)的售后服務(wù),才是保持競爭力的有力手段。公司通過下達(dá)任務(wù),讓渠道點完成一定數(shù)量場次的促銷活動,同時也會結(jié)算相應(yīng)的酬金,但是如何避免渠道虛假促銷,這就是本項目研究的重點工作了。

      二、現(xiàn)有稽核技術(shù)的缺點

      目前的圖片稽核技術(shù)方案采用的是直方圖算法。直方圖能夠描述一幅圖像中顏色的全局分布,而且容易理解和實現(xiàn),所以入門級的圖像相似度計算都是使用它的。

      直方圖算法是對源圖像與要篩選的圖像進(jìn)行直方圖數(shù)據(jù)采集,對采集的各自圖像直方圖進(jìn)行歸一化再使用巴氏系數(shù)算法對直方圖數(shù)據(jù)進(jìn)行計算,最終得出圖像相似度值,其值范圍在[0,1]之間0表示極其不同,1表示極其相似(相同)。

      算法步驟大致可以分為兩步,根據(jù)源圖像與候選圖像的像素數(shù)據(jù),生成各自直方圖數(shù)據(jù)。第二步:使用第一步輸出的直方圖結(jié)果,運(yùn)用巴氏系數(shù)(Bhattacharyya coefficient)算法,計算出相似程度值。

      現(xiàn)有的技術(shù)方案是根據(jù)兩個圖像的直方圖數(shù)據(jù)來計算相似度值,直方圖反應(yīng)的是圖像灰度值得概率分布,并沒有圖像的空間位置信息在里面,因此,會出現(xiàn)誤判;比如紋理結(jié)構(gòu)相同,但明暗不同的圖像,應(yīng)該相似度很高,但實際結(jié)果是相似度很低,而紋理結(jié)構(gòu)不同,但明暗相近的圖像,相似度卻很高。

      為了解決這一問題,本技術(shù)方案采用的是孿生神經(jīng)網(wǎng)絡(luò)模型,可以提取圖像的局部特征變量,從全局的角度進(jìn)行綜合比較,Siamese Network有兩個結(jié)構(gòu)相同,且共享權(quán)值的子網(wǎng)絡(luò)。分別接收兩個輸入X1與X2,將其轉(zhuǎn)換為向量Gw(X1)與Gw(X2),再通過某種距離度量的方式計算兩個輸出向量的距離Ew。這種方式可以克服圖像明暗度不同造成的誤判,提高了相似度計算的準(zhǔn)確性。

      同時構(gòu)建全方位、多層次的稽核方式,能夠更好的識別渠道是否虛假促銷。具體如下:

      三、構(gòu)建多層次立體化審核體系

      1、構(gòu)建圖像識別模塊

      孿生神經(jīng)網(wǎng)絡(luò)(Siamese Network)是一種特殊類型的神經(jīng)網(wǎng)絡(luò)架構(gòu),是一種相似性度量的方法。與一個學(xué)習(xí)對其輸入進(jìn)行分類的模型不同,孿生神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)在兩個輸入中進(jìn)行區(qū)分,從數(shù)據(jù)中去學(xué)習(xí)一個相似性的度量。孿生網(wǎng)絡(luò)由兩個完全相同的神經(jīng)網(wǎng)絡(luò)組成,每個都輸入一個圖像,然后依次饋送到卷積層、池化層和全連接層,最后輸出一個特征向量到對比損失函數(shù)中,來計算兩個圖像之間的相似度。孿生神經(jīng)網(wǎng)絡(luò)可廣泛用于簽名驗證、人臉識別等領(lǐng)域。網(wǎng)絡(luò)結(jié)構(gòu)如下:

      caffe的孿生神經(jīng)網(wǎng)絡(luò)采用的損失函數(shù)(Contrastive Loss function)是

      其中:

      ① Ew被定義為姐妹孿生網(wǎng)絡(luò)輸出之間的歐氏距離(euclidean distance),Gw是其中一個姐妹網(wǎng)絡(luò)的輸出,X1和X2是輸入數(shù)據(jù)對。

      ② Y值為1或0:如果模型預(yù)測輸入是相似的,那么Y的值為0,否則Y為1。

      ③ m是閾值。

      我們通過以下方式來理解一下?lián)p失函數(shù):①當(dāng)輸入圖像相似時,歐式距離越大,損失值越大;②當(dāng)輸入圖像不同時,歐式距離越小,損失值越大,而歐式距離大于某個閾值m后將不再產(chǎn)生損失。

      1.1、制作數(shù)據(jù)集

      1.1.1、我們從系統(tǒng)上的促銷工單中批量導(dǎo)出圖像,然后對這些圖片進(jìn)行分類,將相似的圖片分成一組,不相似的歸為另一組,共制作100對樣本。

      1.1.2、讀取數(shù)據(jù),劃分輸入數(shù)據(jù)集(圖片信息列)和輸出數(shù)據(jù)集(label列),同時劃分訓(xùn)練集和測試集

      1.2、搭建孿生神經(jīng)網(wǎng)絡(luò)模型

      1.2.1、對圖像進(jìn)行灰度化處理

      1.2.2、調(diào)整輸入圖像為100*100,同時接受2張圖片作為輸入。

      1.2.3、子網(wǎng)絡(luò)包括3個卷積層和3個全連接層,卷積層的卷積核大小分別為3,3,3,每一個卷積層后均添加一個批量歸一化層。歸一化的引入是為了減少internal covariatie shift現(xiàn)象,其具體表現(xiàn)是在訓(xùn) 練深層網(wǎng)絡(luò)的過程中,前面層參數(shù)的變化會影響后面每層的參數(shù)分布,導(dǎo)致了訓(xùn)練時只能選用較低的學(xué)習(xí)速率以及小心謹(jǐn)慎的參數(shù)初始化。而Batch Normalization層(BN)的引入允許我們使用更高的學(xué)習(xí)率以及不用太擔(dān)心參數(shù)初始化的問題。

      1.3、自定義損失函數(shù)

      在孿生神經(jīng)網(wǎng)絡(luò)(siamese network)中,其采用的損失函數(shù)是contrastive loss,這種損失函數(shù)可以有效的處理孿生神經(jīng)網(wǎng)絡(luò)中的paired data的關(guān)系。

      W代表兩個樣本特征X1和X2的歐氏距離(二范數(shù)),P 表示樣本的特征維數(shù),Y 為兩個樣本是否匹配的標(biāo)簽,Y=0 代表兩個樣本相似或者匹配,Y=1 則代表不匹配,m 為設(shè)定的閾值,N 為樣本個數(shù)。

      1.4、模型訓(xùn)練

      1.4.1、讀取訓(xùn)練集的數(shù)據(jù),定義圖像dataset,生成8維的圖像數(shù)據(jù)。

      1.4.2、實例化模型,設(shè)置學(xué)習(xí)率,定義優(yōu)化器,lr設(shè)置為0.0005,訓(xùn)練100輪。

      1.4.3、保存訓(xùn)練好的模型,下次加載模型即可直接使用,不需要再次訓(xùn)練。

      1.5、圖片預(yù)測

      1.5.1、輸入2張測試集的圖片,進(jìn)行實際的預(yù)測。

      2、構(gòu)建經(jīng)緯度距離審核模塊。

      2.1 在距離計算方面,采取了原始數(shù)據(jù)分離抽取的技術(shù),單獨(dú)將每一個促銷地點的經(jīng)度和緯度分離出來,然后再利用距離計算函數(shù)(利用sin和cos函數(shù)進(jìn)行球面弧長的計算)進(jìn)行經(jīng)緯度的計算,根據(jù)業(yè)務(wù)規(guī)則進(jìn)行下一步的判斷,輸出不符合要求的促銷工單號,進(jìn)行退單處理。

      2.2 提單密集度檢測:

      (1)根據(jù)執(zhí)行人所屬單位名稱、日期輸出分組數(shù)據(jù)

      (2)根據(jù)分組后的結(jié)果,對于統(tǒng)計數(shù)據(jù)大于等于6的進(jìn)行二次分析,先對每一組按照時間進(jìn)行升序排序,然后

      判斷第一個時間與第六個時間是否在10分鐘以內(nèi),如果是的話就判斷第一個與第七個是否在10分鐘以內(nèi),以此類推,

      直到將第一個10分鐘以內(nèi)提交的單搜索出來。然后繼續(xù)下一輪判斷

      (3)遍歷所有的分組后,將不合規(guī)的工單編號輸出,進(jìn)行進(jìn)一步的審核。

      3、構(gòu)建軌跡分析模塊

      根據(jù)渠道進(jìn)行聚類分析,抽取出對應(yīng)的渠道名稱、經(jīng)度、緯度等信息,設(shè)置定位的中心點,然后將該渠道對應(yīng)的所有經(jīng)緯度可視化在地圖上,并繪制軌跡圖。

      通過距離判斷,可以對可疑的渠道進(jìn)行深入分析,探索是否出現(xiàn)不合理的促銷地點,如活動距離遠(yuǎn)遠(yuǎn)超過促銷的平均距離,則可判斷該促銷異常,需做進(jìn)一步的核實處理。

      4、構(gòu)建數(shù)據(jù)可視化模塊。

      根據(jù)統(tǒng)計出來的數(shù)據(jù),經(jīng)過進(jìn)一步的處理,通過可視化技術(shù)顯示在數(shù)據(jù)大屏上,方便進(jìn)一步做分析處理。主要包括以下幾個子模塊。

      4.1 每日執(zhí)行單量統(tǒng)計圖,根據(jù)執(zhí)行日期和發(fā)布日期,統(tǒng)計單日的工單量,通過散點圖的方式繪制圖形,并輔助以氣泡圖的形式形象的表示單量的多少。

      4.2 各縣促銷場次分布圖,從全量列表中分析出各縣的促銷場次,并用地圖的方式來展現(xiàn)數(shù)據(jù),輔助以顏色區(qū)間對數(shù)量做映射。

      4.3 各類網(wǎng)點促銷情況圖,各類網(wǎng)點的等級和規(guī)模大小不一,因此開展的促銷場次也有較大的差異,通過餅圖的方式來展現(xiàn)各類網(wǎng)點的分布情況。

      4.4 網(wǎng)格促銷情況圖,通過直方圖的方式可以很直觀地看到各個網(wǎng)格的促銷情況,以便根據(jù)實際需要做進(jìn)一步調(diào)整。

      4.5 現(xiàn)場促銷反饋詞云圖,每場促銷都會將當(dāng)次的促銷情況用文字的方式進(jìn)行反饋,但是這種方式不太直觀,不能很好的了解整體的促銷情況。根據(jù)文字生成詞云圖,可以大體的了解促銷中反饋的問題情況,反饋問題越多的詞語將會突出顯示,便于管理員抓住重點問題進(jìn)行整改。

      4.6 個人促銷數(shù)量排行榜,以上都是針對一個群體進(jìn)行統(tǒng)計分析的,該模塊是針對個人的一個統(tǒng)計情況,根據(jù)個人促銷場次的統(tǒng)計數(shù)量,并排序輸出,可以明顯的看到促銷較為積極的人員。

      5、視圖探索

      根據(jù)圖片審核結(jié)果,依照文件路徑進(jìn)行可視化展示,將對應(yīng)的兩張圖片顯示在軟件上,避免了手工查找圖片和比對的繁瑣流程。

      操作步驟:5.1、點擊初始化,將所有不符合的組合重新編排,錄入到系統(tǒng)中。

      5.2、通過查看圖片,或者點擊上一組、下一組快速比對圖片。

      5.3、對于人工審核確實不符合條件的工單編號錄入系統(tǒng),導(dǎo)出到本地電腦,便于后續(xù)退單處理。

      6、數(shù)據(jù)和圖像處理模塊。

      6.1通過pandas來進(jìn)行excel數(shù)據(jù)的處理,包括從excel數(shù)據(jù)加載到系統(tǒng)中,并且對日期、經(jīng)緯度等字段進(jìn)行切片處理,提取出有用的信息,同時對缺失值、異常值進(jìn)行檢測和處理,同時根據(jù)渠道點進(jìn)行匯總統(tǒng)計,排序和篩選,進(jìn)一步清洗數(shù)據(jù),保證 系統(tǒng)接收到的是可以正常使用的數(shù)據(jù)。

      6.2、圖像URL下載模塊。

      首先從系統(tǒng)中批量獲取圖片的URL地址,然后放入循環(huán)體中進(jìn)行逐一解析,獲取響應(yīng)數(shù)據(jù)并將數(shù)據(jù)存儲在本地。由于下載的數(shù)據(jù)是一個壓縮包,因此還需要進(jìn)行解壓操作,便于系統(tǒng)讀取數(shù)據(jù),節(jié)約了人工解壓的時間。

      四、總結(jié)

      該項目采用孿生神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模型,孿生神經(jīng)網(wǎng)絡(luò)(Siamese network)就是“連體的神經(jīng)網(wǎng)絡(luò)”,神經(jīng)網(wǎng)絡(luò)的“連體”是通過共享權(quán)值來實現(xiàn)的。所謂權(quán)值共享就是當(dāng)神經(jīng)網(wǎng)絡(luò)有兩個輸入的時候,這兩個輸入使用的神經(jīng)網(wǎng)絡(luò)的權(quán)值是共享的(可以理解為使用了同一個神經(jīng)網(wǎng)絡(luò))。

      創(chuàng)新點總結(jié)如下:

      一、首次將孿生神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像識別,解決了樣本量少的模型訓(xùn)練問題

      二、改進(jìn)排列組合算法,采用渠道點為核心的新算法,減少90%的計算量

      三、開發(fā)了熱力圖和軌跡圖展示模塊,相比傳統(tǒng)的圖表展示方式,更加直觀地查看促銷點的分布和異常促銷情況

      通過對模型的數(shù)據(jù)采集、建模分析等,建立了一整套完整的體系,能夠?qū)η捞摷俅黉N場景進(jìn)行精準(zhǔn)識別,有力規(guī)避了渠道虛假套利現(xiàn)象,為公司的業(yè)務(wù)健康發(fā)展提供了有力保障。

      作者簡介:曾劍明,籍貫:廣東省梅州市,廣東移動梅州分公司,系統(tǒng)維護(hù)管理,高級工程師,大學(xué)本科,人工智能與軟件開發(fā)。

      猜你喜歡
      直方圖渠道神經(jīng)網(wǎng)絡(luò)
      統(tǒng)計頻率分布直方圖的備考全攻略
      聚焦“五個一” 打通為僑服務(wù)渠道
      華人時刊(2022年9期)2022-09-06 01:02:32
      符合差分隱私的流數(shù)據(jù)統(tǒng)計直方圖發(fā)布
      書業(yè)如何擁抱新渠道?
      出版人(2021年11期)2021-11-25 07:34:04
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      用直方圖控制畫面影調(diào)
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于直方圖平移和互補(bǔ)嵌入的可逆水印方案
      基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      兰州市| 绥德县| 龙州县| 抚州市| 浙江省| 正安县| 锦屏县| 长宁区| 敦煌市| 崇左市| 万荣县| 潜山县| 鄂托克旗| 邵阳县| 霍林郭勒市| 金坛市| 旌德县| 万盛区| 山东省| 华亭县| 凤凰县| 巢湖市| 开鲁县| 阿克| 射洪县| 西宁市| 四子王旗| 偃师市| 类乌齐县| 浦县| 邓州市| 余干县| 迁安市| 阳春市| 临洮县| 雷州市| 礼泉县| 万荣县| 井陉县| 宁晋县| 民权县|