• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù)在煙草行業(yè)的應(yīng)用

      2014-09-17 14:40:02張亮
      電腦知識與技術(shù) 2014年22期
      關(guān)鍵詞:數(shù)據(jù)挖掘煙草大數(shù)據(jù)

      張亮

      摘要:如今一個大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的時代正在開啟,在商業(yè)、物流、金融等諸多領(lǐng)域大量數(shù)據(jù)被巧妙地用來激活新型服務(wù),提升行業(yè)效率。同樣在煙草行業(yè)的諸多環(huán)節(jié),大量數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù)的應(yīng)用前景也十分樂觀,文中簡要探析了數(shù)據(jù)挖掘技術(shù)的幾種方法在煙草商業(yè)企業(yè)的應(yīng)用。

      關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;煙草;分析

      中圖分類號:TP3 文獻標識碼:A 文章編號:1009-3044(2014)22-5375-02

      1 大數(shù)據(jù)和數(shù)據(jù)挖掘

      隨著互聯(lián)網(wǎng)和信息技術(shù)的快速發(fā)展,數(shù)據(jù)量出現(xiàn)爆炸式增長,但要到多大級別才稱得上是大數(shù)據(jù)呢?根據(jù)大數(shù)據(jù)研究的先驅(qū)麥肯錫公司,發(fā)布的一篇名為《大?數(shù)?據(jù)?的?下?一?個?前?沿?:?創(chuàng)?新?、?競?爭?和?生?產(chǎn)?力》的報告中是這么說的:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集。但它還同時說明,并不是說一定要超過特定TB (1TB=1024GB,1PB=1024TB,1EB=1024PB)值的數(shù)據(jù)集才能稱作大數(shù)據(jù)。維基百科中給出的大數(shù)據(jù)的定義是這樣的:“巨量資料(big data),或稱大數(shù)據(jù),指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊”。國際數(shù)據(jù)公司(IDC)則從大數(shù)據(jù)的四個特征來定義,即四個V:Volume(體量大),Velocity(快速化),Variety(類型雜),Value(價值大)。大數(shù)據(jù)的概念是比較寬泛的,見仁見智,智者見智。但前面的三種定義無一例外地都突出了“大”字,但“大”還遠遠不是全部。筆者比較肯定的一個對大數(shù)據(jù)的定義是:大數(shù)據(jù)是“在多樣的或者大量數(shù)據(jù)中,迅速獲取信息的能力”。這個定義里更關(guān)心大數(shù)據(jù)的功用,大數(shù)據(jù)能幫助大家干什么?在這個定義中,重心是“能力”二字,大數(shù)據(jù)的核心能力就是:發(fā)現(xiàn)規(guī)律和預(yù)測未來。

      大數(shù)據(jù)之所以具備這樣的核心能力,關(guān)鍵在于數(shù)據(jù)挖掘。如果把大數(shù)據(jù)比作礦石的話,那么數(shù)據(jù)挖掘就是在礦石中淘金。數(shù)據(jù)挖掘(Data Mining)就是從海量的數(shù)據(jù)中提取、轉(zhuǎn)換、分析,從中獲得潛在的、有價值的信息,這些信息是隱含的、事先未知的,它可以表示為概念、規(guī)則、模式等形式。數(shù)據(jù)挖掘也是一門交叉學科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。從商業(yè)角度來看,數(shù)據(jù)挖掘是一種商業(yè)信息處理技術(shù),即是按照企業(yè)既定的業(yè)務(wù)目標,對大量的業(yè)務(wù)數(shù)據(jù)進行轉(zhuǎn)換、分析,從中提取出有商業(yè)價值的信息,使得企業(yè)可以更合理地進行銷售分析與預(yù)測,幫助企業(yè)做出更有利的決策,提高市場的競爭能力。

      2 數(shù)據(jù)挖掘技術(shù)在煙草商業(yè)企業(yè)的應(yīng)用分析

      目前在很多領(lǐng)域尤其是在商業(yè)領(lǐng)域如銀行、電信、電商等,數(shù)據(jù)挖掘可以解決很多問題,包括市場營銷策略制定、背景分析、企業(yè)管理危機等。煙草商業(yè)企業(yè)信息化經(jīng)過這么多年的發(fā)展,已經(jīng)建立了營銷、專賣、物流、OA等各類經(jīng)營管理的支持系統(tǒng),這些信息系統(tǒng)每天都會產(chǎn)生大量的多種多樣的經(jīng)營管理數(shù)據(jù),為了進一步提高企業(yè)生產(chǎn)經(jīng)營管理水平,提升零售客戶和消費者的滿意度,有必要將先進的信息技術(shù)手段融入到企業(yè)的管理理念當中。通過對這些數(shù)據(jù)進行分析挖掘,提煉出對經(jīng)營管理有效和有用的信息,為制定合理有效的經(jīng)營策略提供數(shù)據(jù)支持。

      數(shù)據(jù)挖掘的分析方法有很多,常用的幾種介紹如下:

      · 關(guān)聯(lián)規(guī)則:用關(guān)聯(lián)規(guī)則挖掘隱藏在數(shù)據(jù)間的相互關(guān)系。對于給定的一組項目集和一個數(shù)據(jù)集,通過分析數(shù)據(jù)找出項目之間的關(guān)聯(lián)規(guī)則,那么其中一個項目就可以通過其他項目進行預(yù)測。

      · 分類和聚類:分類定義了一種從屬性到類別的映射關(guān)系,通過這種映射關(guān)系可以把數(shù)據(jù)庫中的數(shù)據(jù)項映射到特定的類別中。聚類是根據(jù)一定的規(guī)則,按照相似性吧樣本分成若干類別的分析過程,與分類不同的是,它要劃分的類是未知的。

      · 孤立點分析:經(jīng)常存在一些數(shù)據(jù)對象,它們不符合數(shù)據(jù)的一般模型,這樣的數(shù)據(jù)對象就是為孤立點(outlier),它可能是度量或執(zhí)行錯誤所導(dǎo)致的,也可能是固有數(shù)據(jù)變異性的結(jié)果。孤立點分析就是找出數(shù)據(jù)中的這些孤立點。

      · 分類樹:分類樹是決策樹的一種類型,它輸出的是樣本的類標。分類樹的目標是連續(xù)的劃分數(shù)據(jù),使依賴變量的差別最大。分類樹的真正的目的是將數(shù)據(jù)分類到不同組或分支中,在依賴變量的值上建立最強劃分。

      2.1 卷煙營銷領(lǐng)域的應(yīng)用

      1) 用于精準營銷。卷煙精準營銷是現(xiàn)代營銷理論在煙草行業(yè)的創(chuàng)新發(fā)展,是推動卷煙市場營銷上水平的重要途徑。傳統(tǒng)營銷模式下,市場把握更多停留在感性認識,營銷決策主要依靠經(jīng)驗判斷,貨源投放“供非所求、供不應(yīng)求、供過于求”等現(xiàn)象時有發(fā)生,客戶需求無法有效滿足。為此通過數(shù)據(jù)挖掘技術(shù)的探索和研究,運用聚類分析、相關(guān)分析和決策樹等工具,它將有利于解決服務(wù)資源“怎么分”、卷煙品牌“誰來賣”、“賣多少”、“怎樣賣好”等問題。通過數(shù)據(jù)挖掘技術(shù)的深入研究和探索,來進一步提升貨源精準投放和客戶精細服務(wù)水平,為行業(yè)精準營銷提供了一條可深入探索的路徑。

      2) 用于消費者分類。目前商業(yè)企業(yè)所收集的數(shù)據(jù)是以零售客戶為主體,終端消費者的數(shù)據(jù)未被收集。這是一項龐大的工程,未來可以考慮通過銷售終端來實現(xiàn)。收集到數(shù)據(jù)后,我們可以通過生活型態(tài)(時間和金錢的處理態(tài)度)指標對所有消費者進行分類,描述現(xiàn)階段主要消費群體特征,以便在營銷措施上迎合這部分消費者需求,提高營銷效率。我們還可以通過卷煙低焦指標對消費者進行分類,分析支持卷煙低焦的消費群體是主要的還是次要的,以決定是加速卷煙低焦化的步伐還是減緩。

      2.2 專賣稽查領(lǐng)域的應(yīng)用

      真煙非法流動是商業(yè)企業(yè)面臨的難題,給企業(yè)帶來很多不利影響。通過孤立點分析法可用于確定極低或極高以及品牌高集中的客戶的進貨行為。孤立點是數(shù)據(jù)集中與其它數(shù)據(jù)對象顯著不同的數(shù)據(jù),它可能是度量或執(zhí)行錯誤所導(dǎo)致的,也可能是固有數(shù)據(jù)變異性的結(jié)果。孤立點分析法就是找出數(shù)據(jù)中的這些孤立點。這些客戶的實際經(jīng)營能力值得警惕,我們要采取相應(yīng)對策做提前預(yù)防。采用孤立點分析技術(shù)對客戶群進行分析,找出與其他客戶明顯不同的客戶進行重點關(guān)注和防范。例如某卷煙零售客戶在當?shù)責煵輰Yu批發(fā)企業(yè)進貨量比較少,但是經(jīng)營規(guī)模比較大,則有可能從其它渠道購進卷煙或銷售假煙。

      2.3 物流配送領(lǐng)域的應(yīng)用

      目前的物流配送仍是按照行政區(qū)域的方式為主,以后打破行政區(qū)域規(guī)劃后的配送中心選址問題屬于最優(yōu)成本問題,即求解是固定成本、運輸成本和變動成本和等之和為最優(yōu)的問題。

      配送中心的選址需要考慮兩方面因素,一是中心點數(shù)量,二是中心點分布情況。單一中心點的選址問題較為簡單,這里我們主要討論多個中心點選址的問題。多個中心點的選址需要在打破行政區(qū)域的限制,訂單統(tǒng)一采集并集中處理的基礎(chǔ)上才能實施。多中心選址可以在一些已知的備選地點中選出一定數(shù)目的地點來設(shè)置配送中心,從而使形成的物流網(wǎng)絡(luò)的總成本最小,其中包括各種投資費用、不可變費用和可變的費用。而在實際操作中,當這類問題的規(guī)模變得很大或者要考慮一些市場因素(比如顧客需求量)時,數(shù)學規(guī)劃就存在一些困難。不過,這個問題可以通過數(shù)據(jù)挖掘中的分類樹方法來解決。

      分類樹的目標是連續(xù)的劃分數(shù)據(jù),使依賴變量的差別最大。用分類樹的方法解決這種問題時,需要四個方面的數(shù)據(jù):中心點的位置、備選點的位置、中心點的業(yè)務(wù)需求量及中心點和備選點之間的距離。通過這種方法,不僅能確定中心點的位置,同時也能確定每年各個地址物品的運輸量,使銷量得到保證。

      3 前景展望

      數(shù)據(jù)挖掘技術(shù)的方法很多,不同的方法適用的范圍和目的也不一樣,單一的算法往往都有其局限性,因而需要不斷改進或者將多種方法結(jié)合運用,才能很好地發(fā)揮數(shù)據(jù)的作用。我們期待數(shù)據(jù)挖掘技術(shù)可以在可以應(yīng)用、可以拓展的地方應(yīng)用它、拓展它,同時讓不斷發(fā)展的數(shù)據(jù)挖掘技術(shù)在煙草行業(yè)得到廣泛應(yīng)用,它也必將發(fā)揮出巨大能量,為提高我國煙草行業(yè)競爭力提供強有力的保障。

      參考文獻:

      [1] 田臨卿,許自成.數(shù)據(jù)挖掘技術(shù)在煙草行業(yè)中的應(yīng)用[J].中國農(nóng)業(yè)科技導(dǎo)報,2012(6).

      [2] 譚磊.大數(shù)據(jù)挖掘[M].北京:電子工業(yè)出版社,2013.

      猜你喜歡
      數(shù)據(jù)挖掘煙草大數(shù)據(jù)
      煙草具有輻射性?
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      煙草依賴的診斷標準
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      煙草中茄酮的富集和應(yīng)用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      煙草鏡頭與歷史真實
      聲屏世界(2014年6期)2014-02-28 15:18:09
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      定陶县| 耿马| 芷江| 漳平市| 大洼县| 绍兴市| 分宜县| 乌鲁木齐县| 会宁县| 西充县| 常州市| 曲水县| 疏附县| 长海县| 蓬安县| 德格县| 忻城县| 丰顺县| 镇远县| 南江县| 璧山县| 望江县| 潞城市| 台湾省| 尖扎县| 茶陵县| 田林县| 台东县| 高邑县| 增城市| 柯坪县| 泗水县| 大荔县| 固阳县| 通江县| 彭州市| 来凤县| 广宁县| 淮安市| 华安县| 民勤县|