任 杰
(福建省電力有限公司,福州 350000)
基于PCA的電力企業(yè)信息質量評價研究
任杰
(福建省電力有限公司,福州 350000)
摘要:本文基于信息質量相關理論方法,結合電力企業(yè)的信息化建設背景,構建了電力企業(yè)信息質量評價指標體系,并采用主成分分析的方法計算出四類信息質量的關鍵影響因素,分別分析信息傳遞、信息效用、信息技術和信息內容。
關鍵詞:電力企業(yè);信息質量;成熟度;評價指標
對于信息質量的研究,國內外都進行了不同程度的努力嘗試,應用領域廣泛,國內的研究相對于外國起步較晚,主要是從信息質量概念、評價的指標體系和信息質量的改進和控制三大方面進行研究的。對于電力行業(yè)來說,處在初步探索階段。
2.1主成分分析理論概述
主成分分析(Principal Component Analysis,PCA)是對數(shù)據(jù)進行降維處理,把眾多變量轉化為少數(shù)幾個綜合指標的統(tǒng)計分析方法,這些綜合指標就成為原有變量的主成分,主成分之間各不相關。
假設有n個評價指標,每個評價指標有p個變量描述,因此我們可以得到一個n×p階的指標變量矩陣:
假設原來的變量指標為x1,x2,L,xp,則有綜合的新的指標變量為F1,F2,L,Fm(m≤p)。則:
其中系數(shù)aij符合以下規(guī)定:Fi和Fj(i≠j)互不相關。
因此,F(xiàn)1,F2,L,Fm就分別為原指標x1,x2,L,xp的第一,第二,…,第m主成分,其中F1在總方差中比例最大,F(xiàn)1,F2,L,Fm的方差依次遞減。
2.2主成分的計算
主成分分析的計算步驟如下所示:
(1)計算協(xié)方差矩陣。計算變量的協(xié)方差矩陣為:
(2)計算∑的特征值λi和正交化的單位向量ei。協(xié)方差矩陣的前m個相對較大的特征值λ1≥λ2≥L≥λm≥0,就是m個主成分對應的方差,λi的正交化的單位向量ei就是原變量在主成分上的荷載系數(shù),因此,原變量第i個主成分Fi為:
主成分的方差貢獻率ai為:
(3)選擇主成分。主成分通過累計的方差貢獻率L(m)來確定:
(4)計算主成分得分。
從綜合指標體系出發(fā),運用調查問卷的方式對我國10家電力企業(yè)的信息質量狀況進行實證分析。所選的10家電力企業(yè)中,有2家是發(fā)電企業(yè),3家電網公司,剩余的5家是供電公司。共計發(fā)放調查問卷200份,回收179份,回收率89.5%。
3.1結果計算
調查問卷針對上述指標體系進行調查分析,作為原始數(shù)據(jù),數(shù)據(jù)SPSS軟件進行主成分分析,可以得到如下表所示的特征向量矩陣。
特征向量矩陣
根據(jù)上表,我們可以得到主成分的表達式為:
3.2結果分析
從上述主成分分析的表達式可以看出,在第一主成分上x5有較高的荷載,說明第一主成分y1是由變量5決定的。以此類推,我們可以發(fā)現(xiàn)對10家電力企業(yè)的信息質量調查分析中,信息傳遞、信息效用、信息技術和信息內容是影響電力企業(yè)信息質量優(yōu)劣的主要原因。也就是說,如果企業(yè)能夠在以上四個方面做到質量良好的質量控制,整合好企業(yè)的信息資源,企業(yè)就能夠顯著提高信息質量水平,實現(xiàn)信息跨越性升級。
參考文獻:
[1]索傳軍,吳啟琳.國內外網絡信息資源評價研究進展[J].現(xiàn)代圖書情報技術,2006(08).
[2]宋立榮,李思經.從數(shù)據(jù)質量到信息質量的發(fā)展[J].情報科學,2010(02).
[3]王炳全.基于神經網絡的網絡信息資源評價模型研究[D].暨南大學,2010.