• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于K-means算法的人員體能考核標(biāo)準(zhǔn)研究

      2016-11-17 02:21:38武警工程大學(xué)高見文葛衛(wèi)麗
      電子世界 2016年20期
      關(guān)鍵詞:考核成績數(shù)據(jù)挖掘聚類

      武警工程大學(xué) 高見文 葛衛(wèi)麗

      武警杭州士官學(xué)校 郭 程

      基于K-means算法的人員體能考核標(biāo)準(zhǔn)研究

      武警工程大學(xué) 高見文 葛衛(wèi)麗

      武警杭州士官學(xué)校 郭 程

      在人員體能分類訓(xùn)練和考核中,根據(jù)傳統(tǒng)的四級制分類方法對考核人員進(jìn)行分類,但傳統(tǒng)方法往往存在標(biāo)準(zhǔn)固化、缺乏定量考察、人員分類不具體等問題,進(jìn)而導(dǎo)致訓(xùn)練人員訓(xùn)練積極性不高,出現(xiàn)“及格萬歲,多一秒浪費(fèi)”的消極訓(xùn)練傾向。針對這一問題,本文提出將K-means算法應(yīng)用于人員體能考核標(biāo)準(zhǔn)的制中,運(yùn)用K-means算法對人員體能考核成績進(jìn)行分析和處理,根據(jù)人員總體考核成績制定分類標(biāo)準(zhǔn)。

      K-means算法;體能考核標(biāo)準(zhǔn)

      1.引言

      隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,現(xiàn)實生活和網(wǎng)絡(luò)世界中產(chǎn)生越來越多的數(shù)據(jù),如何在這些海量數(shù)據(jù)中挖掘出對人們有用的信息,是一個急需解決的問題。因此數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,數(shù)據(jù)挖掘顧名思義就是在給定的數(shù)據(jù)集中挖掘出有用信息的過程,而聚類分析是最為常用的數(shù)據(jù)挖據(jù)方法之一[1]?!拔镆灶惥邸毙蜗蟮恼f明了聚類的含義,聚類分析就是將相似的失事物聚集起來,使其相似度最大;不相似的事物區(qū)分開來,使其之間的不同盡可能的大[2]。聚類是一種無監(jiān)督的學(xué)習(xí)過程,是在沒有先驗知識的前提下將未標(biāo)注的數(shù)據(jù)集劃分為多個相似子類。聚類分析能夠?qū)?shù)據(jù)進(jìn)行有效分析和管理,是數(shù)據(jù)處理中的一個重要研究方向。

      聚類分析作為一種有效的數(shù)據(jù)處理方法,具有不依靠先驗知識和有效處理多個變量決定的分類等優(yōu)點,成為當(dāng)前數(shù)據(jù)挖掘領(lǐng)域具有代表性的分析和挖掘方法并得到廣泛關(guān)注[3]。隨著信息檢索技術(shù)不斷發(fā)展,聚類被廣泛應(yīng)用于文檔自動摘要、信息檢索等領(lǐng)域,而K-means算法是各種聚類算法中最為常用的一種聚類算法。

      2.K-means算法

      K-means是將未標(biāo)注的數(shù)據(jù)集劃分為k個簇,使得簇內(nèi)數(shù)據(jù)點具有較高相似度,簇間數(shù)據(jù)具有較高非相似度的一種聚類算法[4]。每個簇表示一個聚類,相似度即為簇中全體數(shù)據(jù)點的平均值。

      相似度的計算采用歐氏距離或曼哈頓距離,通常使用誤差平方和(SSM)作為收斂評價標(biāo)準(zhǔn),SSM定義如下:

      式中,dist表示元素與聚類中心的距離,Ci表示第i個簇,x為屬于簇i中元素的集合,ci表示第i個簇的中心。

      具體算法流程如下:(1)隨機(jī)選擇數(shù)據(jù)集中k個元素作為初始簇的中心;(2)根據(jù)簇中元素的均值,將每個元素歸于最近的簇中心,形成k個簇;(3)重新計算每個簇中元素的均值;(4)重復(fù)(2)(3)步,直到簇的中心不再變化為止。

      3.傳統(tǒng)人員體能考核標(biāo)準(zhǔn)和分類存在的不足

      傳統(tǒng)的人員考核標(biāo)準(zhǔn)采用四級制分類,即優(yōu)秀、良好、及格、不及格,在不同成績范圍內(nèi)的人員,被分配到不同的類別中,進(jìn)而獲得相應(yīng)的成績。

      四級制分類方法雖然簡單易操作,但是其缺點也是非常明顯的[5]。四級制分類方法正是因為其操作和處理簡單,使得考核成績中蘊(yùn)含的大量有用信息無法得到利用,信息增益過低。此外,由于考核標(biāo)準(zhǔn)制定過于寬泛,使得在同一層次類別中的人員,在實際考核成績中往往也存在著巨大的差異,例如在5000米考核中22′01″的人員與22′59″的人員是被劃入同意類別中的,但二者之間的差距足足有1分鐘之多,顯然,這是不合理的。再者,由于缺乏定量分析,四級制分類法不利于后續(xù)的人員分類訓(xùn)練,在考核劃分時“一刀切”和“大鍋飯”進(jìn)一步導(dǎo)致在下一步的訓(xùn)練中也出現(xiàn)“一刀切”和“大鍋飯”的問題,非常不利于提高人員訓(xùn)練成績。

      4.K-means算法

      選取100名受訓(xùn)人員體能考核成績,如表1。為了與四級制分類法相對應(yīng)將K-means算法的k值設(shè)為4,每一個數(shù)據(jù)點分別有5000米跑、單杠、100米跑和50米折返跑成績組成,所以每個參與聚類的數(shù)據(jù)點是一個4維數(shù)據(jù)。

      表1 受訓(xùn)人員考核成績

      經(jīng)過K-means算法聚類后,受訓(xùn)人員被分為4個類,每一個的結(jié)果如下表:

      表2 聚類結(jié)果

      為了更清晰的體現(xiàn)于傳統(tǒng)四級制分類法的對比,以5000米為例,兩種方法分類結(jié)果如下:

      表3 對比結(jié)果

      從表3中可以看出利用K-means算法來進(jìn)行人員體能考核標(biāo)準(zhǔn)的制定和分類,比四級制分類具有更小的SSE,分類效果更好,更能貼近受訓(xùn)者的實際情況。

      5.結(jié)論

      針對傳統(tǒng)人員體能考核標(biāo)準(zhǔn)和分類存在的不足,本文利用K-means算法,通過對參訓(xùn)人員考核成績的分析,根據(jù)考核成績所體現(xiàn)出的受訓(xùn)人員訓(xùn)練實際水平,對受訓(xùn)人員進(jìn)行分類,從實驗結(jié)果來看,K-means算法的分類效果更佳,更能反映受訓(xùn)人員的真實訓(xùn)練水平,更加靈活的對人員進(jìn)行分類,并制定相應(yīng)的訓(xùn)練計劃。

      [1]Sean O,Robin A,Ted D,等.Mahout實戰(zhàn)[M].王斌,韓冀中,萬吉,譯.北京:人民郵電出版社,2015.

      [2]Liu Bing.Web數(shù)據(jù)挖掘(第2版)[M].俞勇,薛貴榮,韓定,譯.北京:清華大學(xué)出版社,2015.

      [3]Aliguliyev RM.Clustering of document collection-A weighting approach [J].Expert Systems with Applications,2009,36(4):7904-7916.

      [4]謝娟英,高紅超.基于統(tǒng)計相關(guān)性與K-means的區(qū)分基因子集選擇算法[J].軟件學(xué)報,2014,25(9):2050-2075.

      高見文(1991—),山東臨沂人,碩士研究生,現(xiàn)就讀于武警工程大學(xué)。

      猜你喜歡
      考核成績數(shù)據(jù)挖掘聚類
      骨科臨床教學(xué)中實施PBL教學(xué)法聯(lián)合情景體驗對教學(xué)質(zhì)量、考核成績、教學(xué)滿意度的影響
      “以器官系統(tǒng)為中心”的整合教學(xué)模式在內(nèi)分泌科住院醫(yī)師規(guī)范化培訓(xùn)中對綜合考核成績的價值
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于OSCE的全科專業(yè)住院醫(yī)師規(guī)范化培訓(xùn)實踐技能結(jié)業(yè)考核成績分析
      協(xié)作式見習(xí)帶教模式在護(hù)理本科生中的應(yīng)用效果
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
      顺平县| 竹北市| 兰溪市| 东乌| 长子县| 沅江市| 贵州省| 宝鸡市| 吐鲁番市| 长阳| 大荔县| 浪卡子县| 雅江县| 筠连县| 纳雍县| 会理县| 扶绥县| 敦煌市| 堆龙德庆县| 广汉市| 志丹县| 拉萨市| 万盛区| 临沭县| 汉川市| 云龙县| 壤塘县| 林州市| 舞阳县| 淮阳县| 松滋市| 安福县| 和平区| 苍梧县| 醴陵市| 阜阳市| 香格里拉县| 突泉县| 临邑县| 喀喇沁旗| 慈溪市|