• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      k-means算法在校園一卡通平臺中的應(yīng)用

      2021-04-04 08:10:16張秀玲
      信息記錄材料 2021年4期
      關(guān)鍵詞:刷卡一卡通熱水

      張秀玲

      (長春金融高等??茖W(xué)?,F(xiàn)代教育中心 吉林 長春 130012)

      1 引言

      校園一卡通在校園卡中心儲存了大量的數(shù)據(jù)信息,這些數(shù)據(jù)信息涵蓋了餐飲、上機(jī)、借閱等。由于這些數(shù)據(jù)信息是學(xué)生自己使用產(chǎn)生的,所以對這些信息的研究分析有助于學(xué)校了解學(xué)生的需求,更有助于學(xué)校的建設(shè)和管理。下面對k-means算法在校園一卡通平臺中的運(yùn)用進(jìn)行分析與論述。

      2 k-means算法與校園一卡通概述

      2.1 k-means算法

      k-means算法出現(xiàn)于1960年,其也被人們稱作K均值聚類算法,其是由MacQueen提出來的。伴隨理論分析持續(xù)加深以及計算機(jī)技術(shù)的持續(xù)發(fā)展,這一算法發(fā)展成經(jīng)典數(shù)據(jù)挖掘算法,隨后出現(xiàn)了一部分聚類算法均是根據(jù)這個算法所提出改進(jìn)的。由于此算法于數(shù)據(jù)結(jié)構(gòu)、時間耗費(fèi)、儲存方面有著一定的優(yōu)勢,所以諸多聚類過程均使用此算法。k-means算法原則為:對給定數(shù)據(jù)對象集X,將數(shù)據(jù)對象至聚類中心點(diǎn)之距離和當(dāng)成聚類準(zhǔn)則函數(shù),經(jīng)過求準(zhǔn)則函數(shù)極小值迭代,將數(shù)據(jù)對象劃分至聚類個數(shù)時C的類內(nèi),同時促使各類內(nèi)部數(shù)據(jù)對象相似性較高,而不一樣的類中的數(shù)據(jù)對象不相關(guān)性較大[1]。

      2.2 校園一卡通

      由于受到時代發(fā)展所影響,學(xué)校需要使用適當(dāng)?shù)募夹g(shù)進(jìn)行管理。對計算機(jī)管理系統(tǒng)為基本的卡片的使用十分普及,學(xué)生采用各種卡片于校園日常生活中很普遍。可是以往的校園卡片功能較少,學(xué)生日常生活要攜帶諸多卡片,例如餐飲、圖書證、學(xué)生證等,為學(xué)生生活造成了不便,該校園管理模式具有很多不足:(1)未完成對現(xiàn)代化校園的管理;(2)為學(xué)校管理系統(tǒng)帶來了負(fù)擔(dān);(3)學(xué)校管理成本增加;(4)為學(xué)生帶來了麻煩。對現(xiàn)代化校園管理而言,其需要具有的特征是:信息傳遞效率高、管理相當(dāng)精細(xì),如此對高校教育教學(xué)而言是百利而無一害的。而校園一卡通的出現(xiàn)就有效解決了上述問題,可以促使校園管理水平提升,實(shí)現(xiàn)管理精細(xì)化,提高信息傳輸?shù)乃俣取R豢ㄍㄊ墙?jīng)過把IC卡當(dāng)成重要信息載體,非常適合在校園消費(fèi)和開展管理網(wǎng)絡(luò)系統(tǒng)。IC卡的出現(xiàn)為學(xué)生帶來了方便,可以實(shí)現(xiàn)生活消費(fèi)等多方面的功能,有效代替了以往多張卡的使用方式。與此同時,IC卡和銀行互聯(lián),能夠在學(xué)校中與學(xué)校之外的銀行網(wǎng)點(diǎn)進(jìn)行現(xiàn)金提取和消費(fèi),大大提高了校園信息化管理水平[2]。

      3 k-means算法的不足與優(yōu)化

      3.1 不足

      (1)k-means算法對初始簇個數(shù)K有一定的依賴性。因?yàn)椴灰粯拥腒值對算法效率與聚類結(jié)果有影響,因此K值的確定必須要用戶根據(jù)需要且通過很多實(shí)驗(yàn)才可以確定。

      (2)k-means算法對選取的初始簇中心相當(dāng)敏感。根本原因在于k-means算法為任意抽取初始聚類中心點(diǎn)的,如此一來很大幾率會產(chǎn)生迭代次數(shù)大與迭代收斂最優(yōu)解的現(xiàn)象,倘使真正發(fā)生這種事情,則統(tǒng)統(tǒng)無法獲取到最優(yōu)解聚類成效[3]。

      (3)k-means算法對孤立和噪音對象較為敏感,該情況會將最后的聚類結(jié)果質(zhì)量降低,一般在運(yùn)用過程中,這一算法大部分使用在發(fā)現(xiàn)球狀簇。

      通過以上的分析,我們可以了解到,聚類成效好不好很大概率取決于簇內(nèi)與簇間對象密集度,假使簇內(nèi)對象密集度高,則聚類成效是很不錯的。本次研究采取處理初始聚類中心優(yōu)化方式,可以大大削弱由孤立點(diǎn)與噪音點(diǎn)帶來的影響。與此同時,對點(diǎn)群中心聚類法加以分析,比較選取比較好的點(diǎn)群中心聚類優(yōu)化k-means算法,這樣一來,可以達(dá)到類內(nèi)密集度高和類間密集度低的效果。

      3.2 優(yōu)化

      于初始聚類中心選取問題方面,以往的k-means算法是于樣本數(shù)據(jù)中心隨機(jī)抽取K個對象當(dāng)成初始簇中心,如此會產(chǎn)生初始簇中心太過集中或無法均勻分布于樣本數(shù)據(jù)集中,最終造成數(shù)據(jù)收斂需要的迭代次數(shù)增多,進(jìn)而陷進(jìn)局部最優(yōu)解,對最終的聚類效果帶來不良影響。為防止出現(xiàn)該種情況發(fā)生,此次實(shí)驗(yàn)根據(jù)具體狀況對初始簇中心選擇進(jìn)行了優(yōu)化,讓簇中心可以均勻分布樣本數(shù)據(jù)集中,防止孤立點(diǎn)與噪音點(diǎn)影響,繼而提高算法魯棒性[4]。

      優(yōu)化以后的算法雖于CH指標(biāo)中聚類成效未達(dá)到理想中的效果且低于別的優(yōu)化前試驗(yàn)平均值,可是于Dunn指標(biāo)以及XB指標(biāo)分析過程中,優(yōu)化以后的聚類效果明顯。因而此聚類分析實(shí)驗(yàn)使用優(yōu)化以后的k-means算法展開數(shù)據(jù)挖掘應(yīng)用。

      3.3 點(diǎn)群中心聚類方式

      于聚類分析過程中,選取不一樣的點(diǎn)群中心聚類法,那么聚類效果也是不同的。以往的k-means算法使用了Euclidean Distance度量對象彼此間的聚集程度,這一點(diǎn)群中心聚類法對噪音與孤立點(diǎn)有一定的敏感性,與此同時通常僅能發(fā)掘球狀簇。因而,對不一樣的數(shù)據(jù),要根據(jù)實(shí)際情況使用不一樣的點(diǎn)群中心聚類方式的k-means算法處理問題。此次實(shí)驗(yàn)對幾種點(diǎn)群中心聚類法作了對比,按照原始數(shù)據(jù)的差異性,使用不一樣的點(diǎn)群中心聚類法,如Euclidean Distance、CityBlock Distance、Minkowski Distance。

      此次將在學(xué)生熱水消費(fèi)聚類實(shí)驗(yàn)過程中,合理運(yùn)用基于以上三種點(diǎn)群中心聚類的優(yōu)化k-means算法展開聚類分析。

      4 實(shí)驗(yàn)與結(jié)果

      4.1 數(shù)據(jù)預(yù)處理

      (1)學(xué)生歷年熱水消費(fèi)?,F(xiàn)如今,校園一卡通平臺系統(tǒng)中有很多刷卡記錄,在這里諸多數(shù)據(jù)源自學(xué)生平時的熱水消費(fèi)刷卡記錄,同時每天都在增加。根據(jù)這部分?jǐn)?shù)據(jù)中挖掘隱藏規(guī)律,為優(yōu)化學(xué)校資源配置提供重要依據(jù),是當(dāng)前高校有關(guān)部門的需求。因?yàn)閿?shù)據(jù)庫里面有很多數(shù)據(jù),這些數(shù)據(jù)量大、冗余度較高,因而必須要展開數(shù)據(jù)預(yù)處理,挑選與整理出適于算法的數(shù)據(jù)集合。以某高校為例,對其在2015年—2017年學(xué)生熱水消費(fèi)金及其次數(shù)進(jìn)行了分析。

      (2)熱水消費(fèi)數(shù)據(jù)特點(diǎn)屬性量化。按照需求分析,為有效提升數(shù)據(jù)挖掘質(zhì)量,所見算法分析時間,提高實(shí)驗(yàn)結(jié)果精準(zhǔn)度,因此本次實(shí)驗(yàn)選擇2017年11月學(xué)生熱水消費(fèi)171330條記錄作為樣本數(shù)據(jù),以此實(shí)現(xiàn)綜上目標(biāo)。

      4.2 聚類選擇

      此次實(shí)驗(yàn)主要是針對校園一卡通內(nèi)容之一,即學(xué)生熱水消費(fèi)數(shù)據(jù)情況的分析,經(jīng)過合理采用點(diǎn)群中心聚類優(yōu)化化k-means算法,全面分析高校學(xué)生熱水消費(fèi)實(shí)際情況,繼而經(jīng)過對比Euclidean Distance、CityBlock Distance、Minkowski Distance,我們可以從中發(fā)現(xiàn),這些方法的迭代次數(shù)是一致的,沒有差別,其中ED花時少,MD的P值最小。經(jīng)過整理和歸納,可以得到ED方式在學(xué)生熱水消費(fèi)數(shù)據(jù)聚類成效好得多,故而選取采用ED優(yōu)化K-means算法得到令人滿意的結(jié)果。

      4.3 結(jié)果分析

      經(jīng)過比較幾種點(diǎn)群聚類方法可以了解到,此次實(shí)驗(yàn)將使用基于ED的優(yōu)化k-means算法,分析與探索學(xué)生熱水消費(fèi)情況。根據(jù)業(yè)務(wù)需要,把聚類個數(shù)設(shè)置成五類,經(jīng)過比較分析可以得到:一類熱水刷卡行為80%分布于洗浴中心二、三層,刷卡行為多在當(dāng)月中旬,時間多為中午。二類熱水刷卡行為分布于二、三層,刷卡行為多在二層,行為發(fā)生于當(dāng)月中旬。刷卡行為記錄較多,刷卡行為概率大。三類刷卡行為分布于二層,當(dāng)月刷卡行為在中旬,時間是下午,刷卡金額中等。四類熱水刷卡行為分布于洗浴中心一、二層,當(dāng)月刷卡行為在中旬,刷卡行為在下旬,時間為下午,刷卡金額中等偏上。

      因此,按照以上分析可以知道,根據(jù)POS機(jī)使用狀況,發(fā)現(xiàn)一、二層POS機(jī)使用率高,三層使用率較低,在當(dāng)月中,全部的刷卡行為多出現(xiàn)在中旬,在每日中,全部的刷卡行為出現(xiàn)在中午。

      5 結(jié)語

      校園一卡通平臺是數(shù)字化校園的基礎(chǔ)工程,本文對于某高校學(xué)生熱水消費(fèi)數(shù)據(jù)的聚類分析,僅僅是校園一卡通平臺中的一部分。校園一卡通系統(tǒng)平臺涵蓋了很多有價值的信息,還有待持續(xù)研究與探索。

      猜你喜歡
      刷卡一卡通熱水
      思維與智慧·下半月(2022年5期)2022-05-17 00:54:54
      高層建筑的熱水供暖系統(tǒng)設(shè)計
      多喝熱水
      花火彩版A(2021年2期)2021-09-10 07:22:44
      和讓你“多喝熱水”的男孩結(jié)婚
      海峽姐妹(2020年2期)2020-03-03 13:36:40
      基于“一卡通”開發(fā)的員工信息識別系統(tǒng)
      電子制作(2016年19期)2016-08-24 07:49:44
      向心加速度學(xué)習(xí)一卡通
      刷卡
      向心加速度學(xué)習(xí)一卡通
      成長日記
      一卡通為新農(nóng)合基金加密
      新郑市| 司法| 临西县| 三亚市| 杭锦后旗| 巩义市| 呼伦贝尔市| 蒙山县| 盘山县| 天气| 荣成市| 平武县| 勐海县| 油尖旺区| 开平市| 故城县| 宁都县| 六枝特区| 奉贤区| 嘉祥县| 曲水县| 墨江| 尉犁县| 镇原县| 山东省| 渝北区| 凤凰县| 巢湖市| 象州县| 漳平市| 南汇区| 略阳县| 兴义市| 鹤壁市| 尚义县| 邛崃市| 新安县| 贡觉县| 宣恩县| 平凉市| 虹口区|