譚啟軍
【摘要】在科學技術(shù)、經(jīng)濟管理中常常要按一定的標準進行分類。模糊聚類分析廣泛應(yīng)用在氣象預報、地質(zhì)、農(nóng)業(yè)、林業(yè)等方面。由于科學技術(shù)、經(jīng)濟管理中的分類界限往往不分明,因此采用模糊聚類方法通常比較符合實際。最后本文通過實例說明了模糊聚類分析的有效性。
【關(guān)鍵詞】 數(shù)據(jù)矩陣 閉包 矩陣 聚類分析
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2014)02-0251-02
1.引言
聚類分析是數(shù)理統(tǒng)計中的一種多元分析方法,它是用數(shù)學方法定量地確定樣本的親疏關(guān)系,從而客觀地劃分類型。對帶有模糊特征的事物進行聚類分析,不僅要考慮事物之間有無關(guān)系,更要考慮事物之間關(guān)系的深淺程度,顯然用模糊數(shù)學的方法處理更為自然。
事物之間的界限,有些是確切的,有些則是模糊的。例如,天氣陰、晴之間的界限是模糊的。對所研究的事物按一定標準進行分類的數(shù)學方法稱為聚類分析,它是多元統(tǒng)計“物以類聚”的一種分類方法。通常把被聚類的事物稱為樣本,將被聚類的一組事物稱為樣本集。當聚類涉及事物之間的模糊界限時,需運用模糊聚類分析方法。
2.基礎(chǔ)知識
2.1數(shù)據(jù)矩陣
2.2 數(shù)據(jù)標準化
通常不同的指標具有不同的量綱,為了充分利用原始信息并能客觀真實的反映實際情況,需要對數(shù)據(jù)做適當?shù)淖儞Q以消除量綱的影響。對數(shù)據(jù)作標準化處理,就是根據(jù)模糊矩陣的要求,將數(shù)據(jù)壓縮到區(qū)間[0,1]上。
2.4 基于模糊等價矩陣聚類方法
2.4.1 傳遞閉包法
2.4.2 布爾矩陣法
2.4.3 直接聚類法
2.4.4 最佳閾值λ的確定
在模糊聚類分析中對于各個不同的λ∈[0,1],可得到不同的分類,許多實際問題需要根據(jù)具體情況選擇某個閾值λ,以確定樣本的一個具體分類。一般按實際需要,在動態(tài)聚類圖中,調(diào)整λ的值以得到適當?shù)姆诸悾恍枰孪葴蚀_地估計好樣本應(yīng)分成幾類,從而得出在λ水平上的等價分類。
3.實例分析
3.1問題的提出
某學校一年級有7個班級,學生成績的好與差,沒有明確的評定界限,并且班級間成績好壞的表現(xiàn)具有一定的模糊不確定性。
3.2問題的分析
解決上述問題可運用模糊聚類分析方法?,F(xiàn)以7個班級某次考試的四門課程成績?yōu)橐罁?jù),對各班成績好壞的相關(guān)程度進行分類。
3.3問題的解決
3.3.1數(shù)據(jù)標準化
3.3.2用最大最小法建立相似矩陣
3.3.3改造相似關(guān)系為等價關(guān)系進行聚類分析
按不同的置信水平對7個班級進行模糊聚類,將會得到不同的分類結(jié)果。
參考文獻:
[1]高慧璇編著.應(yīng)用多元統(tǒng)計分析.北京大學出版社,2006
[2]胡則成,羅榮桂,宋德昌,等.隨機存貯理論與應(yīng)用【M】.武漢:華中理工大學出版社,1994