• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于等距聚類方法的改進(jìn)及其應(yīng)用

      2017-05-02 10:37:58丁洪玲葉靜雷天宇金殿川
      關(guān)鍵詞:等距客戶經(jīng)理相似性

      丁洪玲,葉靜,雷天宇,金殿川

      (1.華北理工大學(xué) 理學(xué)院,河北 唐山 063210;2.華北理工大學(xué) 生命科學(xué)學(xué)院,河北 唐山 063210)

      基于等距聚類方法的改進(jìn)及其應(yīng)用

      丁洪玲1,葉靜1,雷天宇2,金殿川1

      (1.華北理工大學(xué) 理學(xué)院,河北 唐山 063210;2.華北理工大學(xué) 生命科學(xué)學(xué)院,河北 唐山 063210)

      聚類分析;相似性;重心;等距聚類

      介紹了聚類分析的發(fā)展歷程及其研究現(xiàn)狀,分析比較了它們之間的差異及局限性。在此基礎(chǔ)上根據(jù)類與類之間的特征,提出了一種新的等距聚類方法,并設(shè)計(jì)出了相應(yīng)的程序算法(應(yīng)用c#語言編寫)。通過實(shí)例證明了該方法的可行性。

      0 引言

      “物以類聚,人以群分”,從古到今,分類就貫穿在實(shí)際生活中。所謂的類就是指相似元素的集合,同類樣本盡可能的相似,不同類別樣本之間有較大的差異性。譬如物種可以分為動(dòng)物、植物;動(dòng)物界又可分為兩大類:脊柱動(dòng)物和無脊椎動(dòng)物;脊柱動(dòng)物包括魚類、爬行類、鳥類、兩棲類、哺乳類等五大類。然而,隨著生產(chǎn)技術(shù)和科學(xué)的發(fā)展,人們對(duì)分類的認(rèn)識(shí)不斷加深,只憑經(jīng)驗(yàn)和專業(yè)技術(shù)的分類已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足人們的需求,人們迫切需要更加準(zhǔn)確、快速和科學(xué)的方法去分類。于是,數(shù)學(xué)工具逐漸被引入分類學(xué)中,后來隨著多元統(tǒng)計(jì)的引入,聚類分析又逐漸從數(shù)值分類學(xué)中分離出來形成一個(gè)相對(duì)獨(dú)立的分支[1]。

      聚類分析又稱群分析,是多元統(tǒng)計(jì)分析中研究樣本或指標(biāo)的一種主要的分類方法,起源于考古分[2],是將一組復(fù)雜的數(shù)據(jù)劃分出一個(gè)相當(dāng)簡單的類的結(jié)構(gòu),因此必然要求進(jìn)行相關(guān)性和相似性度量[3]。在相似性的度量中,常常包含著許多主觀上的考慮,但是最重要的考慮是指標(biāo)性質(zhì)或觀測的尺度一級(jí)相關(guān)的知識(shí)[4]。當(dāng)樣品聚類時(shí),往往用距離來刻畫,就像向平靜的湖面拋一枚石子,以石子落水點(diǎn)為中心周圍產(chǎn)生一波波水紋,在同一水紋或者相近水紋上的點(diǎn)有相差不大的半徑,性質(zhì)相似。又如等高線原理,在不同的高度上溫度不同,高度相差大的兩處溫差大,高度相近的兩處溫差小?;诖耍擁?xiàng)研究提出了一種新的聚類方法-等距聚類法。

      隨著經(jīng)濟(jì)和社會(huì)的發(fā)展,結(jié)合了更為強(qiáng)大的數(shù)學(xué)工具的聚類分析方法已經(jīng)越來越多地應(yīng)用到經(jīng)濟(jì)分析和社會(huì)工作分析中。聚類分析方法一般是先確定統(tǒng)計(jì)量,不論是定性數(shù)據(jù)還是定量數(shù)據(jù)都是如此,其次利用統(tǒng)計(jì)量對(duì)樣品歸類。由于目的、要求不同,因而產(chǎn)生了不同的聚類方法,其中較為常用的有系統(tǒng)聚類法、有序樣品聚類法、K值聚類法、模糊聚類法等[5]。其中,基于系統(tǒng)聚類的5種方法在理論上可行,而在實(shí)際應(yīng)用中卻缺少可操作性;有序樣品聚類法只適應(yīng)于有序樣品的聚類,局限性較大;K值聚類法在樣本空間分類的數(shù)目較大時(shí),可行性較差[6];模糊聚類分析方法主觀性較強(qiáng)。針對(duì)以上各種聚類方法的不足,提出了一種新的聚類方法——等距聚類法。通過具體實(shí)例分析發(fā)現(xiàn)該方法不具有局限性,且消除了主觀性等影響因素,操作性強(qiáng),具有一定的可行性。

      1 等距聚類法

      傳統(tǒng)的聚類方法在特定條件下并不能很好地解決問題,首先來看一個(gè)簡單的例子(如表1所示)。經(jīng)驗(yàn)算,按照傳統(tǒng)的聚類方法得到的結(jié)果是a、c為一類,b、d為一類,而實(shí)際上,簡單地從數(shù)據(jù)上看,a和b(或c和d)僅僅是調(diào)換了數(shù)據(jù)的順序,把a(bǔ)和b分為一類,c, d分為一類更為合理。由此,該項(xiàng)研究提出了一種較為合理的聚類方法-等距聚類法。

      一方面當(dāng)對(duì)樣品進(jìn)行聚類時(shí),往往由距離來刻畫,另一方面當(dāng)對(duì)指標(biāo)聚類時(shí),則根據(jù)相關(guān)系數(shù)或者某種相似性度量來聚類,等距聚類法就是基于這2個(gè)方面的一種方法,其通過計(jì)算得到樣本重心,然后以樣本重心為基準(zhǔn),算出所有樣本到重心的距離,最后,比較樣本到重心的距離并計(jì)算出兩兩之間的距離差,將距離差最小的聚為一類。

      表1 案例具體數(shù)據(jù)

      1.1 相似性度量及理論基礎(chǔ)

      假設(shè)每個(gè)樣品有p個(gè)指標(biāo),故每個(gè)樣品可以看成p維空間中的一個(gè)點(diǎn),n個(gè)樣品就組成p維中的n個(gè)點(diǎn),此時(shí)用距離來度量樣品之間的相似程度,數(shù)據(jù)矩陣如表2所示,相關(guān)計(jì)算公式如下。

      表2 數(shù)據(jù)矩陣

      重心的計(jì)算公式:

      (1)

      距離的計(jì)算公式:

      絕對(duì)距離:

      (2)

      歐式距離:

      (3)

      名考斯基距離:

      (4)

      切比雪夫距離:

      (5)

      類與類之間的距離特征:

      最小距離法:

      (6)

      1.2 等距聚類法的一般步驟

      第5步:按照第4步繼續(xù)聚類,直到得到事先確定的類的個(gè)數(shù)為止。

      1.3 等距聚類法的程序算法設(shè)計(jì)

      依據(jù)等距聚類方法原理,采用C#語言編寫計(jì)算機(jī)程序,幫助讀者方便快速地應(yīng)用該方法對(duì)自己的數(shù)據(jù)進(jìn)行分類。圖1展示了程序計(jì)算分析的流程。讀者可從Github(https://github.com/dinghl/equidistance_cluster)網(wǎng)站上下載該程序的所有源碼文件及下文中的實(shí)例分析數(shù)據(jù)。

      圖1 等距聚類法系統(tǒng)流程圖

      2 實(shí)例分析

      在實(shí)際中常遇到下面的問題:已知某銀行微貸業(yè)務(wù)中心對(duì)2014年招聘的同一批客戶經(jīng)理進(jìn)行放款業(yè)務(wù)考核時(shí)發(fā)現(xiàn),有6位客戶經(jīng)理的年平均業(yè)績相差微小,故想通過其他的聚類方法選出優(yōu)、良、中、差亦是很困難的。這時(shí)從數(shù)據(jù)分析的角度做出更合理的分析為領(lǐng)導(dǎo)提供決策意見尤為重要。此處,該項(xiàng)研究采用了等距聚類法,6位客戶經(jīng)理(蔡、陳、董、范、孔、張),1~12月的業(yè)績匯總?cè)绫?所示,業(yè)績趨勢如圖2所示。

      表3 6位客戶經(jīng)理在1~12月的業(yè)績匯總表

      圖2 客戶經(jīng)理的業(yè)績折線圖

      通過程序運(yùn)行結(jié)果得到:

      優(yōu):張;

      良:董,孔;

      中:陳,范;

      差:蔡。

      結(jié)果分析:對(duì)于微貸業(yè)務(wù)來講,有一定的淡旺季之分。在這種情況下,如果能夠在旺季把業(yè)績相對(duì)提升,并且淡季也不松懈的客戶經(jīng)理才是最優(yōu)秀的客戶經(jīng)理,而通過數(shù)據(jù)分析得到張經(jīng)理完全符合最優(yōu)客戶經(jīng)理;而蔡經(jīng)理雖然年平均業(yè)績不差,但是每月業(yè)績起伏太大,工作狀態(tài)不穩(wěn)定,故為最差;客戶經(jīng)理董經(jīng)理和孔經(jīng)理相對(duì)于張經(jīng)理來說過于穩(wěn)定,沒有更好地抓住工作中的淡旺季,可能心理上存有一定的打算保證每月完成業(yè)績就好,并沒有全力以赴地工作;客戶經(jīng)理陳經(jīng)理和范經(jīng)理穩(wěn)定性不高但是比蔡經(jīng)理稍強(qiáng)。

      3 結(jié)論

      聚類方法作為一種數(shù)據(jù)處理方法,它的理論至今還不完善,聚類方法存在著一定的局限性。該項(xiàng)研究提出的等距聚類法,是一種簡單、計(jì)算量小的新方法。在某些程度上解決了傳統(tǒng)聚類方法存在的局限性。通過對(duì)6位客戶經(jīng)理從1到12月的工作評(píng)價(jià)分析證明了該方法是可行的。

      [1] 張堯庭,方開泰, 多元統(tǒng)計(jì)分析引論[M].北京:科學(xué)出版社,1982.

      [2] 于秀林,任雪松, 多元統(tǒng)計(jì)分析[M].北京: 中國統(tǒng)計(jì)學(xué)出版社,1999.

      [3] 何曉群, 多元統(tǒng)計(jì)分析[M]. 北京: 中國人民大學(xué)出版社, 2008.

      [4] 王學(xué)仁,王松桂, 實(shí)用多元統(tǒng)計(jì)分析[M].上海: 上海科技技術(shù)出版社,1992.

      [5] 王學(xué)明, 應(yīng)用多元統(tǒng)計(jì)分析[M].上海: 上海財(cái)經(jīng)大學(xué)出版社.

      [6] L.S.W. BAI X, ZHAO Y B, Entropy Based Soft K-means Clustering[J]. in: IEEE International Conference on Granular Computing, EI, STP, 2008, pp. 107-110.

      Improvement of An Isometric Clustering Method and Its Application

      DING Hong-ling1, YE Jing1, LEI Tian-yu2, JIN Dian-chuan1

      (1. College of Science, North China University of Science and Technology, Tangshan Hebei 063210, China;2.CollegeofLifeSciences,NorthChinaUniversityofScienceandTechnology,TangshanHebei063210,China)

      clustering analysis;similarity;the center of gravity;isometric clustering

      The development course and the research status of clustering analysis were introduced, the differences and limitations between them were compared. According to the characters between the two classes, a new clustering method was proposed based on the comparison, and the corresponding program was designed. The feasibility of this method has been proved by an example.

      2095-2716(2017)02-0115-05

      2016-10-11

      2017-03-26

      TP311.11

      A

      猜你喜歡
      等距客戶經(jīng)理相似性
      加油創(chuàng)效從客戶經(jīng)理開始
      一類上三角算子矩陣的相似性與酉相似性
      擬凸Hartogs域到復(fù)空間形式的全純等距嵌入映射的存在性
      淺析當(dāng)代中西方繪畫的相似性
      商業(yè)銀行打造優(yōu)秀客戶經(jīng)理隊(duì)伍的途徑分析
      保持算子束部分等距的映射
      低滲透黏土中氯離子彌散作用離心模擬相似性
      等距延拓以及相關(guān)問題
      客戶經(jīng)理能力素質(zhì)模型的構(gòu)建與應(yīng)用
      V4國家經(jīng)濟(jì)的相似性與差異性
      大方县| 莲花县| 宜宾市| 文水县| 缙云县| 郓城县| 井陉县| 丹东市| 溧水县| 靖安县| 平阴县| 潢川县| 开江县| 重庆市| 弥渡县| 谢通门县| 榆社县| 嘉鱼县| 崇礼县| 饶阳县| 合川市| 镇江市| 长宁县| 桦甸市| 定南县| 五家渠市| 中方县| 松阳县| 龙胜| 甘谷县| 行唐县| 荥阳市| 孙吴县| 安义县| 张家川| 博客| 桑日县| 南溪县| 东丽区| 成武县| 阿瓦提县|