李發(fā)文
山東臨沂煙草有限公司 山東臨沂 276003
隨著我國實(shí)體經(jīng)濟(jì)的快速發(fā)展,煙卷消費(fèi)需求不斷擴(kuò)大,給煙草行業(yè)帶來了巨大的發(fā)展情景。和傳統(tǒng)的煙草市場不同,煙草客戶行為特更加多樣化,需求也更加個(gè)性格化,因此需要對煙草用戶的行為進(jìn)行詳細(xì)的分析,明確把握市場的需求方向,深入理解用戶的潛在特質(zhì),從而實(shí)現(xiàn)煙草企業(yè)“個(gè)性化”運(yùn)營。
在構(gòu)建煙草客戶標(biāo)簽庫的時(shí)候要嚴(yán)格按照以下流程:第一步就是要明確業(yè)務(wù)的實(shí)際需求,根據(jù)具體的情況確定相關(guān)數(shù)據(jù),明確用戶群體。對當(dāng)前煙草行業(yè)進(jìn)行深入的分析,明確市場需求和業(yè)務(wù)需求,然后制定相應(yīng)的策略手段,明確所要深入挖掘的主題以及相應(yīng)的研究方法。第二步準(zhǔn)備數(shù)據(jù),包括選取字段、清洗數(shù)據(jù)、分析數(shù)據(jù)等,在準(zhǔn)備數(shù)據(jù)階段涉及到了網(wǎng)絡(luò)爬蟲技術(shù)、信令解析技術(shù)等[1]。第三步就是構(gòu)建用戶行為模型。確定用戶行為模型,然后進(jìn)行構(gòu)建。第四步對數(shù)據(jù)挖掘算法進(jìn)行恰當(dāng)?shù)倪x擇或者是改善,明確進(jìn)行數(shù)據(jù)深入挖掘的目的,準(zhǔn)備好現(xiàn)有的數(shù)據(jù)并對現(xiàn)有數(shù)據(jù)的內(nèi)容和特點(diǎn)進(jìn)行分析,然后選取適當(dāng)?shù)臄?shù)據(jù)挖掘相關(guān)算法。第五步對模型進(jìn)行測驗(yàn),根據(jù)現(xiàn)有的數(shù)據(jù)和已經(jīng)建立的模型對其有效性和可實(shí)施性進(jìn)行檢驗(yàn)。第六步應(yīng)用并對運(yùn)營數(shù)據(jù)進(jìn)行分析,當(dāng)在對模型進(jìn)行檢驗(yàn)之后,可以將模型投放到煙草行業(yè)市場分析中,然后對得出來的結(jié)果進(jìn)行深入的分析。如果和預(yù)期的結(jié)果不符,那么就需要對模型進(jìn)行重新構(gòu)建和設(shè)計(jì)。第七步結(jié)果反饋,通過模型在市場上的應(yīng)用或者是用戶決策層對模型的反饋結(jié)果進(jìn)行分析,從而實(shí)現(xiàn)對模型的優(yōu)化。第八步根據(jù)分析出來的結(jié)果采用文字、PPT等方式將結(jié)果展現(xiàn)出來。
煙草客戶標(biāo)簽庫的實(shí)現(xiàn)系統(tǒng)應(yīng)該具備如下性能:首先,系統(tǒng)要具備良好的可擴(kuò)展性,能夠考慮到的未來行業(yè)的發(fā)展、技術(shù)更新的趨勢以及長久的實(shí)用性。其次,系統(tǒng)要具備良好的運(yùn)行效率,能夠準(zhǔn)確的、有效的實(shí)現(xiàn)用戶信息的標(biāo)簽化,滿足用戶的個(gè)性化需求,能夠支持精細(xì)化運(yùn)行。再次,要具備較高的安全性,充分考慮系統(tǒng)要充分保障系統(tǒng)運(yùn)行的安全性,從而為商戶提供運(yùn)營商提供技術(shù)安全保障,最后,要具備良好的可維護(hù)性、便于操作員進(jìn)行日常的維護(hù),分析運(yùn)行過程中出現(xiàn)的故障并及時(shí)采取措施[2]。
首先,針對標(biāo)簽庫的系統(tǒng)架構(gòu)設(shè)計(jì)。整個(gè)設(shè)計(jì)可以分為四個(gè)層面:數(shù)據(jù)源層、基礎(chǔ)數(shù)據(jù)融合層、用戶數(shù)據(jù)分析層、用戶標(biāo)簽庫和應(yīng)用層。在數(shù)據(jù)源層主要是為了給整個(gè)系統(tǒng)提供一個(gè)較為完備的數(shù)據(jù)支撐,最初的數(shù)據(jù)是來源于信令監(jiān)測系統(tǒng)中收集的數(shù)據(jù)、運(yùn)營商提供的經(jīng)過分析的數(shù)據(jù)以及系統(tǒng)通過網(wǎng)絡(luò)爬蟲獲取的相關(guān)數(shù)據(jù)。其中,信令監(jiān)測系統(tǒng)主要是提供用戶的位置信息、用戶的各種行為等數(shù)據(jù)[3]。網(wǎng)絡(luò)爬蟲系統(tǒng)主要是為了能夠更加準(zhǔn)確的獲取用戶的各種行為?;A(chǔ)數(shù)據(jù)融合層來自各個(gè)接口的數(shù)據(jù)。在這一層面中,網(wǎng)絡(luò)爬蟲進(jìn)行數(shù)據(jù)收集并不斷更新,為后續(xù)的用戶行為的精準(zhǔn)分析提供基礎(chǔ)。在用戶數(shù)據(jù)分析層中,就是利用上述收集到的基礎(chǔ)數(shù)據(jù),對其進(jìn)行分析和數(shù)據(jù)挖掘,從而實(shí)現(xiàn)運(yùn)營業(yè)務(wù)發(fā)展等過程。在用戶標(biāo)簽庫及應(yīng)用層中,包含了個(gè)性化營銷支撐類標(biāo)簽信息、基本信息等,通過要這些信息,可以完成日常業(yè)務(wù)的運(yùn)營,同時(shí)實(shí)現(xiàn)對一些新業(yè)務(wù)層面的擴(kuò)展。
其次,針對用戶標(biāo)簽庫體系的設(shè)計(jì)。根據(jù)上述所說的功能需求分析,在進(jìn)行標(biāo)簽框架設(shè)計(jì)的時(shí)候要包。業(yè)務(wù)支撐類標(biāo)簽、用戶信息標(biāo)簽、業(yè)務(wù)信息標(biāo)簽等。其中,用戶信息標(biāo)簽和業(yè)務(wù)關(guān)系類簽比較容易獲得,可以通過分析數(shù)據(jù)直接得到。個(gè)性化營銷標(biāo)簽可以通過信令解析、和網(wǎng)絡(luò)爬蟲分析來得到。
具體來說,針對基礎(chǔ)數(shù)據(jù)融合層的設(shè)計(jì),要包括協(xié)議解析模塊、聚焦爬蟲模塊。在進(jìn)行協(xié)議解析模塊設(shè)計(jì)的時(shí)候可以分為兩種解碼方式,一個(gè)是簡單解碼,一個(gè)是詳細(xì)解碼。在本研究中,采用的是簡單解碼的方式來提取關(guān)鍵字信息,并將得到的數(shù)據(jù)傳輸?shù)綐I(yè)務(wù)識別模塊兒中。針對聚焦爬蟲模塊的設(shè)計(jì),根據(jù)本研究內(nèi)容設(shè)計(jì)了擴(kuò)展性較好、實(shí)用性較強(qiáng)的網(wǎng)絡(luò)爬蟲系統(tǒng),該系統(tǒng)主要是由控制器、應(yīng)用模塊、數(shù)據(jù)庫等模塊構(gòu)成。通過多元化的設(shè)計(jì)從而實(shí)現(xiàn)對多個(gè)程序的同時(shí)管理。在實(shí)際的應(yīng)用中,只需要修改相應(yīng)的應(yīng)用??季涂梢詫?shí)現(xiàn)對信息的獲取,符合相應(yīng)的設(shè)計(jì)要求。針對用戶數(shù)據(jù)分析層的設(shè)計(jì),為了確保對用客戶行為的分析的準(zhǔn)確性,本設(shè)計(jì)中主要包括了三個(gè)層面的設(shè)計(jì),一個(gè)是數(shù)據(jù)預(yù)處理,一個(gè)是數(shù)據(jù)分析,還有個(gè)數(shù)據(jù)測試。預(yù)處理模塊主要是進(jìn)行數(shù)據(jù)整合,分析模塊是主要是進(jìn)行數(shù)據(jù)分類和分析。測試模塊主要是進(jìn)行相應(yīng)的測試并將測試的結(jié)果進(jìn)行反饋,然后再根據(jù)反饋結(jié)果對進(jìn)行優(yōu)化針對用戶標(biāo)簽及其應(yīng)用層的設(shè)計(jì),包括數(shù)據(jù)準(zhǔn)備標(biāo)簽擇表標(biāo)簽寬表的形成階段等。
通過分析功能和性能方面的需求,對煙草客戶標(biāo)簽數(shù)據(jù)庫整體框架進(jìn)行設(shè)計(jì),然后針對基礎(chǔ)數(shù)據(jù)融合層、聚焦爬蟲模塊等設(shè)計(jì)進(jìn)行了詳細(xì)的分析,為煙草行業(yè)實(shí)現(xiàn)個(gè)性化服務(wù)提供了基礎(chǔ)。