• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      聚類分析方法在食堂消費(fèi)數(shù)據(jù)中的應(yīng)用研究

      2015-01-14 07:29:56
      科技視界 2015年12期
      關(guān)鍵詞:消費(fèi)額名稱次數(shù)

      張 琳

      (遵義師范學(xué)院計(jì)算機(jī)與信息科學(xué)學(xué)院,貴州 遵義563000)

      1 聚類分析方法

      聚類分析(cluster analysis)是一組將研究對象分為相對同質(zhì)的群組(clusters)的統(tǒng)計(jì)分析技術(shù)[1]。聚類分析方法具有簡單、直觀的特點(diǎn),主要應(yīng)用于探索性的研究,其中變量的選擇有較大的影響。

      2 聚類分析基本思想

      以學(xué)生的消費(fèi)記錄為研究對象,使用聚類分析知識進(jìn)行研究,主要使用K-Means算法[2]:

      輸入:聚類個數(shù)k以及包含n個數(shù)據(jù)對象的數(shù)據(jù)集;輸出:滿足目標(biāo)函數(shù)值最小的k個聚類。

      (1)計(jì)算任意兩個數(shù)據(jù)對象間的距離d(xi,xj);

      (2)計(jì)算每個數(shù)據(jù)對象的密度參數(shù),把處于低密度區(qū)域的點(diǎn)刪除,得到處于高密度區(qū)域的數(shù)據(jù)對象的集合D;

      (3)把處于最高密度區(qū)域的數(shù)據(jù)對象作為第1個中心z1;

      (4)把z1距離最遠(yuǎn)的數(shù)據(jù)對象作為第2個初始中心z2,z2∈D;

      (5)令 z3 為滿足 max(min(d(xi,z1), d(xi,z2)), i=1,2,…,n 的數(shù)據(jù)對象 xi,z3∈D;

      (6)令 z3 為滿足 max(min(d(xi,z1), d(xi,z2)), d(xi,z3)), i=1,2,…,n 的數(shù)據(jù)對象 xi,z4∈D;

      (7)令 zk 為滿足 max(min(d(xi,zj))), i=1,2,…,n, j=1,2,…,k-1 的 xi,zk∈D;

      (8)從這k個聚類中心出發(fā),應(yīng)用k-means聚類算法,得到聚類。

      一般采用均方差作為目標(biāo)測度函數(shù):其中E是數(shù)據(jù)集中所有對象的均方差之和;p是代表對象的空間中的一個點(diǎn)。

      3 聚類分析方法在食堂消費(fèi)數(shù)據(jù)中的應(yīng)用

      本文主要使用SPPS工具來進(jìn)行聚類分析與研究。

      SPSS(Statistical Product and Service Solutions,統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案),是一種實(shí)現(xiàn)數(shù)據(jù)分析的多功能軟件[3]。

      SPSS for Windows是一種運(yùn)行在Windows系統(tǒng)下的社會科學(xué)統(tǒng)計(jì)軟件包,從1968年由美國斯坦福大學(xué)開發(fā)使用至今,在全球已經(jīng)擁有數(shù)以萬計(jì)的用戶,在通信、醫(yī)療、銀行、證券、保險(xiǎn)、制造、商業(yè)、市場研究、科學(xué)教育等眾多的行業(yè)領(lǐng)域都得以有效的應(yīng)用,目前,SPSS已成為世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計(jì)軟件之一。SPSS軟件包采用窗口操作界面,用戶操作使用方便,包括數(shù)據(jù)整理、分析過程、結(jié)果輸出等功能。面對龐大的數(shù)據(jù)量,SPSS軟件的功能不斷完善,其統(tǒng)計(jì)分析方法不斷充實(shí),涵蓋面越來越廣,輸出數(shù)據(jù)表格圖文并貌,大大提高了統(tǒng)計(jì)分析工作的效率。

      SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等,具體內(nèi)容包括描述統(tǒng)計(jì)、列聯(lián)分析,總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數(shù)檢驗(yàn)等多個大類,每個類中還有多個專項(xiàng)統(tǒng)計(jì)方法。SPSS設(shè)有專門的繪圖系統(tǒng),可以根據(jù)使用者的需要將給出的數(shù)據(jù)繪制各種圖形,能夠滿足用戶的不同需求[4]。

      聚類分析工具的應(yīng)用:

      1)打開SPSS軟件,并輸入數(shù)據(jù),設(shè)置變量名稱,在學(xué)生消費(fèi)數(shù)據(jù)中選擇了三十名學(xué)生的月消費(fèi)情況作為分析目標(biāo),如下圖所示為部分消費(fèi)情況,其中男女各15名,將性別男、女處理為二值型數(shù)據(jù)分別標(biāo)記為 1、2。

      2)每個變量設(shè)置的部分格式:

      (1)名稱:學(xué)號,類型:字符串,長度:11,對齊方式:左,測量單位:名稱;

      表1 待處理的數(shù)據(jù)

      (2)名稱:性別,類型:數(shù)值,長度:1,對齊方式:右,測量單位:名稱;

      (3)名稱:月消費(fèi)額,類型:數(shù)值,長度:6,對齊方式:右,測量單位:尺度;

      (4)名稱:交易次數(shù),類型:數(shù)值,長度:5,對齊方式:右,測量單位:尺度。

      3)選擇“分析”—“聚類分析”—“快速聚類K”進(jìn)行分析,則在出現(xiàn)的界面中進(jìn)行如下設(shè)置:

      將”變量”設(shè)置為:性別、月消費(fèi)額、交易次數(shù)。

      將“方法”設(shè)置為:迭代與聚類。

      將“聚類數(shù)目”設(shè)置為:2。

      4)對“方法”、“迭代”選項(xiàng)進(jìn)行設(shè)置,點(diǎn)擊“確定”即出現(xiàn)運(yùn)算過程及相應(yīng)結(jié)果:

      (1)初始聚類中心

      “1”類:性別為“2”(女),月消費(fèi)額為 278.90,交易次數(shù)為 155。

      “2”類:性別為“1”(男),月消費(fèi)額為 520.10,交易次數(shù)為 171。

      (2)迭代過程

      在聚類中心的變化分別為63.006、51.977。

      由于最大絕對坐標(biāo)的變化是.000,當(dāng)前迭代是2,最小距離是241.732,初始中心實(shí)現(xiàn)了最小的變化。

      (3)最終聚類中心

      “1”類:性別為“2”(女),月消費(fèi)額為 341.33,交易次數(shù)為 164。

      “2”類:性別為“1”(男),月消費(fèi)額為 468.13,交易次數(shù)為 170。

      從上述運(yùn)算結(jié)果可看到30個觀測量都有效,并沒有丟失任何一個觀測量。最終,通過以上分析可以看出學(xué)生的消費(fèi)情況可以分為兩類,第一類性別為2,即女生每月消費(fèi)大概為341.33元,平均交易164次,而第二類性別為1,即男生每月消費(fèi)大概為468.13元,平均交易170次。從上我們可以看出男生與女生的每月消費(fèi)情況是不同的,男生消費(fèi)較多,平均交易也自然的較多,針對食堂來說就應(yīng)該針對男女生不同的特點(diǎn),合理安排消費(fèi)類別,促進(jìn)學(xué)生進(jìn)行消費(fèi)。

      總之,使用SPSS軟件中的聚類功能對校園一卡通數(shù)據(jù)進(jìn)行分析,能有效地快速分析出學(xué)生消費(fèi)的一些特征,對這部分知識的研究這里僅進(jìn)行了粗略的分析,在今后的時間里再進(jìn)行深入研究。

      [1]李響.數(shù)據(jù)挖掘技術(shù)淺析[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2012(12):46.

      [2]袁方,周志勇,宋鑫.初始聚類中心優(yōu)化的 k-means算法[J].計(jì)算機(jī)工程,2007,33(3):65-66.

      [3]劉震.SPSS統(tǒng)計(jì)分析與應(yīng)用[M].電子工業(yè)出版社,2011:4.

      [4]陳良英.關(guān)于SPSS軟件在市場調(diào)查統(tǒng)計(jì)應(yīng)用的研究[J].中小企業(yè)管理與科技,2008(11):19.

      猜你喜歡
      消費(fèi)額名稱次數(shù)
      機(jī)場航站樓年雷擊次數(shù)計(jì)算
      2020年,我國汽車召回次數(shù)同比減少10.8%,召回?cái)?shù)量同比增長3.9%
      商用汽車(2021年4期)2021-10-13 07:16:02
      一類無界算子的二次數(shù)值域和譜
      市場總消費(fèi)額增長8%
      投資北京(2018年10期)2018-12-29 09:03:46
      市場總消費(fèi)額增長8%
      投資北京(2018年9期)2018-12-29 09:02:54
      依據(jù)“次數(shù)”求概率
      滬港通一周成交概況
      滬港通一周成交概況
      滬港通一周成交概況
      滬港通一周成交概況
      比如县| 竹溪县| 萝北县| 桓仁| 丰顺县| 泸西县| 德惠市| 新闻| 三明市| 瑞金市| 英吉沙县| 屏东市| 西吉县| 盐城市| 巍山| 台州市| 林州市| 呈贡县| 工布江达县| 库车县| 开江县| 安徽省| 青海省| 中阳县| 舞阳县| 丹巴县| 山丹县| 酒泉市| 南川市| 德保县| 陇川县| 周至县| 新兴县| 民勤县| 永福县| 景洪市| 武夷山市| 铅山县| 庆云县| 义马市| 江北区|