• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術(shù)在藥品零售管理系統(tǒng)中的研究與應(yīng)用

      2018-04-02 09:13馮永祥楊寒
      電腦知識與技術(shù) 2018年5期
      關(guān)鍵詞:聚類算法關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

      馮永祥 楊寒

      摘要:針對各藥店激烈的競爭以及如何實現(xiàn)盈利最大化的問題,將數(shù)據(jù)挖掘技術(shù)有效地運用到藥品零售管理系統(tǒng)中去。通過MATLAB建模,利用關(guān)聯(lián)規(guī)則對某藥店部分零售數(shù)據(jù)進行挖掘以及利用聚類算法對客戶價值進行聚類的研究與分析,發(fā)現(xiàn)顧客購買趨勢、挖掘潛在的客戶、提高藥店的競爭力,為企業(yè)經(jīng)營者提供決策性支持。

      關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;聚類算法;藥品零售;客戶價值

      1引言

      隨著我國國民經(jīng)濟的不斷發(fā)展、人民生活水平不斷提高、人口老齡化的持續(xù)加劇,城鄉(xiāng)居民對藥品的需求量也在逐漸增大,因此,近幾年來我國各零售藥店之間的競爭也越來越激烈,經(jīng)營者更加關(guān)注藥店銷售業(yè)績等有價值的信息。目前,各藥店都用計算機來管理自己的內(nèi)部事務(wù),但現(xiàn)在大多數(shù)藥品零售管理系統(tǒng)中只能提供較為簡單的記錄查詢,沒有從藥店日積月累的銷售數(shù)據(jù)中獲得隱藏的知識,而數(shù)據(jù)挖掘技術(shù)能為企業(yè)帶來更多潛在的商業(yè)機會。

      2相關(guān)理論及技術(shù)

      2.1數(shù)據(jù)挖掘

      數(shù)據(jù)挖掘(Data mining)是指數(shù)據(jù)庫知識發(fā)現(xiàn),一般是從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。目前,數(shù)據(jù)挖掘在各領(lǐng)域的應(yīng)用非常廣泛,尤其是零售業(yè)、金融行業(yè)、通訊以及醫(yī)療服務(wù)業(yè)等。只要該企業(yè)具有分析價值和需求的數(shù)據(jù)庫,就可以利用數(shù)據(jù)挖掘技術(shù)進行有目的的挖掘分析。常用的數(shù)據(jù)挖掘模型包括關(guān)聯(lián)分析、分類和預(yù)測、聚類分析和異常點分析等,本文采用了關(guān)聯(lián)規(guī)則的Apriori算法和聚類分析的K-means算法,挖掘過程如圖1所示。

      1)在藥品零售管理系統(tǒng)中根據(jù)挖掘需求對數(shù)據(jù)進行收集,并整理成原始數(shù)據(jù);

      2)對原始數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理,其中包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換;

      3)運用具體的數(shù)據(jù)挖掘算法進行建模;

      4)結(jié)合日常業(yè)務(wù),對模型結(jié)果進行分析,且將模型結(jié)果應(yīng)用于實際業(yè)務(wù)中,最后輸出應(yīng)用結(jié)果。

      2.2MATLAB簡介

      MATLAB是一款商業(yè)數(shù)學(xué)軟件,用于算法開發(fā)、數(shù)據(jù)可視化以及數(shù)值計算的高級技術(shù)計算語言和交互式環(huán)境,還可以用來創(chuàng)建用戶界面及調(diào)用其它語言編寫的程序。本文用MAT-LAB語言編寫,由若干MATLAB命令組合在一起,實現(xiàn)Apriori算法和K-means算法,完成關(guān)聯(lián)規(guī)則和聚類分析的操作。

      3 Apriori算法在藥品零售管理系統(tǒng)中的應(yīng)用

      基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘可以看作是一種顧客購買行為的分析,購物籃中對應(yīng)的項目表示顧客一次性購買的商品。通過關(guān)聯(lián)規(guī)則發(fā)現(xiàn)顧客購買的不同商品之間的聯(lián)系,發(fā)現(xiàn)顧客購買的行為,用來指導(dǎo)經(jīng)營者科學(xué)地安排進貨、庫存以及貨架設(shè)計等,幫助零售店制定營銷策略

      3.1數(shù)據(jù)獲取

      藥品零售的關(guān)聯(lián)分析數(shù)據(jù)來自于日常業(yè)務(wù)管理中,以某藥店某時間段2375條零售數(shù)據(jù)為例進行關(guān)聯(lián)規(guī)則挖掘。數(shù)據(jù)包括涉藥單位、銷售單號、藥品代碼、藥品名稱、銷售時間、銷售數(shù)量等字段,如圖2所示。

      3.2數(shù)據(jù)預(yù)處理

      1)數(shù)據(jù)清洗

      在日常銷售中,存在退貨的情況,為了便于模型分析,需要對其處理,將無效的數(shù)據(jù)去掉。

      2)數(shù)據(jù)集成

      關(guān)聯(lián)規(guī)則需要以顧客已買到的藥品來預(yù)測顧客可能感興趣的其他項,因此需要對藥品進行分類,在藥品零售數(shù)據(jù)中沒有藥品類型的屬性,本課題根據(jù)藥品的種類將藥品分為心腦血管用藥,腸胃道用藥,五官科用藥,皮膚科用藥,成人用藥,兒科用藥,肝膽科用藥,神經(jīng)科藥,婦科用藥,日常用藥,呼吸道用藥,泌尿科藥,醫(yī)療器械,營養(yǎng)保健,風(fēng)濕關(guān)節(jié)共15種類型。需要通過藥品代碼來對藥品質(zhì)量檔案中藥品類型進行合并,將最終結(jié)果集成到數(shù)據(jù)集中。

      3)屬性規(guī)約

      銷售記錄信息包含很多屬性,為了減少挖掘花費的時間,提高數(shù)據(jù)挖掘算法的效果,需要將與建模相關(guān)程度小的屬性刪除。

      4)數(shù)據(jù)變換

      顧客在購買藥品時,管理系統(tǒng)會自動產(chǎn)生一個銷售單號,而銷售單號是能唯一標(biāo)識顧客的單次購買。在原數(shù)據(jù)集中,顧客買幾種藥品就會顯示幾個事務(wù),這樣挖掘結(jié)果可能不準(zhǔn)確,所以需要將相同的銷售單號購買的藥品合并在一起。

      通過數(shù)據(jù)預(yù)處理,最終數(shù)據(jù)集事務(wù)格式如表1所示:

      3.3模型構(gòu)建

      基于關(guān)聯(lián)規(guī)則的藥品零售數(shù)據(jù)建模流程,如圖3所示。

      該模型主要由輸入、算法處理、輸出部分組成。輸入部分主要包括:事務(wù)數(shù)據(jù)庫D、最大頻繁集項數(shù)maxItem、最小支持度minS、最小置信度minC。

      算法處理部分是Apriori關(guān)聯(lián)規(guī)則算法,具體處理過程如下:

      1)簡單掃描所有的事務(wù),事務(wù)中每一項都是候選1項集的集合C1的成員,計算每一項的支持度并與minS做比較,保留大于或等于該閾值的項,得到1項頻繁集L1。

      2)定義apriori_gen(A,k)函數(shù)產(chǎn)生Ck項集,實現(xiàn)組內(nèi)連接,A表示第k-1次的頻繁項集,k表示第k頻繁項集,然后通過isExit(C,A)來判斷Ck的非空子集是否存在A中,保留存在的項,這個過程稱為剪枝。

      3)對剪枝后Ck中各項集的支持度與預(yù)先設(shè)定的最小支持度閾值做比較,保留大于或等于該閾值的項,得到k項頻繁集。循環(huán)此過程,直到剪枝后的Ck為空集。

      4)利用上述得到的頻繁項集計算置信度,其結(jié)果與minC比較,保留置信度大于或等于該閾值的項,產(chǎn)生關(guān)聯(lián)規(guī)則。

      3.4模型分析

      用上述模型對建模數(shù)據(jù)進行挖掘,點擊數(shù)據(jù)分析界面的“藥品關(guān)聯(lián)”按鈕,設(shè)定最小支持度為1%,置信度為10%,最大頻繁項集為3,顯示個數(shù)是5,如圖4所示。

      點擊“Apriori關(guān)聯(lián)規(guī)則挖掘”按鈕,MATLAB程序輸出的關(guān)聯(lián)規(guī)則如表2。

      由藥品的關(guān)聯(lián)規(guī)則可知,日常用藥(感冒藥類,清熱解毒類)、呼吸道用藥、心腦血管用藥、腸胃用藥、五官科用藥、醫(yī)療器械等類別的藥品經(jīng)常被頻繁地購買,它們之間存在著很強的關(guān)聯(lián)性。

      由關(guān)聯(lián)規(guī)則1,2可知,購買感冒類藥品的顧客同時也會購買消炎類的藥品,這些藥品都是家庭常用藥品,用量非常大。

      由關(guān)聯(lián)規(guī)則3可知,腸胃消化不好的顧客通常體質(zhì)比較弱,在購買腸胃道用藥的同時還會買類似六味地黃丸、維生素類的藥品,增加腸胃道消化。

      由關(guān)聯(lián)規(guī)則4可知,購買神經(jīng)科藥品的顧客會經(jīng)常購買肝膽科類的藥品,暈車的人常常表現(xiàn)為惡心,嘔吐,頭暈?zāi)垦?,從中醫(yī)治療方法來講,需要滋補肝腎,比如吃點杞菊地黃丸等。

      由關(guān)聯(lián)規(guī)則5可知,皮膚受傷或骨頭扭傷的顧客,經(jīng)常購買皮膚用藥或者治療骨傷、風(fēng)濕關(guān)節(jié)藥品的同時,也會買一些類似創(chuàng)可貼、酒精、棉簽等家用醫(yī)療器械,加快傷口愈合。

      藥店在遵循GSP管理規(guī)范的同時參考這些規(guī)則對經(jīng)營管理方式做適當(dāng)?shù)恼{(diào)整。一方面,把關(guān)聯(lián)性比較強的藥品放在相鄰的貨架上,方便顧客挑選,節(jié)約購買時間,增加銷量。另一方面,在進貨計劃上,藥店根據(jù)規(guī)則制定需要購買藥品的數(shù)量,以保證不必要的浪費和貨物的充實。

      猜你喜歡
      聚類算法關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      运城市| 威宁| 沁阳市| 玛沁县| 鞍山市| 精河县| 明水县| 友谊县| 五台县| 肃宁县| 平和县| 乌拉特前旗| 富民县| 海口市| 武胜县| 龙岩市| 九台市| 三明市| 青神县| 开鲁县| 福州市| 花莲市| 鹤山市| 克山县| 云阳县| 郸城县| 朝阳县| 龙胜| 左云县| 阿拉善盟| 安宁市| 姚安县| 普洱| 安吉县| 苏尼特左旗| 兴城市| 伽师县| 云阳县| 花莲县| 临武县| 屏东县|