李文娟
摘 要:街道作為最小的行政區(qū)域級別在企業(yè)安全生產(chǎn)監(jiān)督管理中發(fā)揮著重要作用。根據(jù)街道在企業(yè)安全排查和整治中的實際數(shù)據(jù)進(jìn)行因子和聚類分析,將20個街道重新分類,有利于安監(jiān)部門以后企業(yè)安全工作的開展,以及對各街道巡查整治工作的考評具有重要的參考價值和意義。
關(guān)鍵詞:安全生產(chǎn);降維;因子分析; 聚類分析
中圖分類號:F27 文獻(xiàn)標(biāo)識碼:Adoi:10.19311/j.cnki.1672-3198.2018.01.028
本文選取某市20個街道2017年7月對轄區(qū)企業(yè)安全隱患排查整治情況的8個指標(biāo)數(shù)據(jù)為源數(shù)據(jù)。本文中對20個街道采用從1-20的數(shù)字替代。各指標(biāo)說明如下:X1為本季度任務(wù)完成率,X2為人均巡查企業(yè)數(shù),X3為人均整治企業(yè)數(shù),X4人均發(fā)現(xiàn)隱患數(shù),X5為人均整治隱患數(shù),X6為重大隱患累計未核銷率,X7為一般隱患累計未核銷率,X8為本月隱患核銷率。
1 相關(guān)性分析
本文利用主成分分析法提取因子,從相關(guān)系數(shù)矩陣出發(fā)消除原始數(shù)據(jù)量綱上的差異。
由原始變量的相關(guān)系數(shù)矩陣,可以看到任務(wù)完成率X1與人均整治企業(yè)數(shù)X3、人均發(fā)現(xiàn)隱患數(shù)X4、本月隱患核銷率X8相關(guān)系數(shù)較高,符合事實邏輯;與重大隱患累計未核銷率X6、一般隱患累計未核銷率X7存在負(fù)相關(guān)性,符合邏輯。各變量呈較強的相關(guān)關(guān)系,能夠從中提取公因子,適合做因子分析。
2 提取因子
根據(jù)因子分析碎石圖可以看出,第一個因子的特征根值很高,對解釋原有變量的貢獻(xiàn)最大,第3個以后的因子特征根值都較小,對解釋原有變量的貢獻(xiàn)很小,重新指定特征根提取標(biāo)準(zhǔn),指定提取3個因子,各個變量的信息丟失都較少,因此提取3個因子比較理想。
由因子旋轉(zhuǎn)矩陣看出第一個因子主要解釋了X1任務(wù)完成率、X2人均巡查企業(yè)數(shù)、X3人均整治企業(yè)數(shù)、X4人均發(fā)現(xiàn)隱患數(shù)和X5人均整治隱患數(shù)。第二因子主要解釋了X6重大隱患累計未核銷率和X7一般隱患累計未核銷率。第三因子解釋了X5人均整治隱患數(shù)和X8本月隱患核銷率。
4 聚類分析
4.1 系統(tǒng)聚類法
由聚類分析譜系圖看出,1、10、8、5號街道相關(guān)性較高,較早聚成一類,;6、7號街道相關(guān)性較高,較早聚成一類;3、4號街道相關(guān)性較高,較早聚成一類;18、20號街道相關(guān)性較高,較早聚成一類;2、15、13號街道相關(guān)性較高,較早聚成一類。
4.2 K均值聚類法
本部分指定K均值聚類為5類,初始中心點由SPSS自行確定。分類結(jié)果如表4所示。
由表4可以看出提取的3個因子在不同類中的均值比較均通過顯著性檢驗。
通過K均值聚類分為5類,第一類包含7個街道,分別為12、13、14、15、17、18、20;第二類包含1個街道,2號;第三類包含3個街道,3、4、5號街道;第四組包含7個街道,1、6、7、8、10、11、16、17號街道;第五組包含2個街道,9、19號街道。與系統(tǒng)聚類相比:只有5號街道和17號 街道類別有較小變動,其余類中幾乎無變化,說明此次聚類兩種聚類方法并無太大差異。
5 結(jié)論
K均值算法和系統(tǒng)聚類法相比,有很大的不同,那就是它需要數(shù)據(jù)點的坐標(biāo),因為它必須要求取平均,而系統(tǒng)聚類實際上并不需要坐標(biāo)數(shù)據(jù),只需要知道數(shù)據(jù)點之間的距離而已。這也就是說K均值只適用于使用歐氏距離來計算數(shù)據(jù)點相似性的情況,因為如果采用非歐氏距離,那么也不能通過簡單的平均來得到類中心。本次分析的結(jié)果可以作為該市對20個街道的工作完成情況的分類依據(jù),在以后的工作安排中具有一定的參考價值。
參考文獻(xiàn)
[1]朱軒放. 主成分分析和聚類在遼寧省城市職工工資分析中的應(yīng)用[D]. 長春: 吉林大學(xué),2016: 21-46.
[2]張曉冉. 統(tǒng)計分析及其SAS實現(xiàn)[M]. 北京: 清華大學(xué)出版社, 2010: 174-188.
[3]張文彤. SPSS統(tǒng)計分析高級教程[M]. 北京: 高等教育出版社出版, 2004.
[4]張建萍, 劉希玉. 基于聚類分析的K-means算法研究及應(yīng)用[J]. 計算機應(yīng)用研究, 2007, 24(5): 166-168.endprint