邱保志 賀艷芳 申向東
摘 要:在基于視角加權(quán)的多視角聚類中,每個視角的權(quán)重取值對聚類結(jié)果的精度都有著重要的影響。針對此問題,提出熵加權(quán)多視角核Kmeans(EWKKM) 算法,通過給每個視角分配一個合理的權(quán)值來降低噪聲視角或無關(guān)視角對多視角聚類的影響,進而提高聚類的精度。 EWKKM算法中,首先用核矩陣表示不同的視角,給每個視角分配一個權(quán)重;然后,利用信息熵計算出各個視角的熵權(quán)重;最后,按照定義的目標(biāo)函數(shù)對各個視角的權(quán)重進行優(yōu)化,使用核Kmeans進行多視角聚類。在UCI數(shù)據(jù)集及人工數(shù)據(jù)集進行實驗,實驗結(jié)果表明熵加權(quán)多視角核Kmeans算法能夠為每個視角分配一個最優(yōu)的權(quán)重值,聚類的精確度優(yōu)于已有的聚類算法,具有更穩(wěn)定的聚類結(jié)果。
關(guān)鍵詞:聚類;多視角聚類;核Kmeans; 熵
中圖分類號: TP181 文獻標(biāo)志碼:A英文標(biāo)題