殷冬琴
摘要:本論述根據(jù)實驗提供的25組有關(guān)二氧化硫濃度與顏色讀數(shù)的數(shù)據(jù),利用EXCEL數(shù)據(jù)分析工具,建立了二氧化硫濃度與顏色讀數(shù)GBRSH之間的五元線性回歸模型,結(jié)果顯示該模型擬合程度較好,但是t統(tǒng)計值和P值顯示顏色分量RSB對二氧化硫濃度的影響不顯著。隨后計算顏色分量之間的相關(guān)系數(shù),結(jié)果顯示顏色分量之間存在多重共線性。為此,對建立的五元線性回歸模型采用逐步回歸法進行優(yōu)化,統(tǒng)計結(jié)果顯示出在給定的5個顏色分量GBRSH中,對二氧化硫濃度的影響由主到次的順序依次為:G>H>B>S>R,可見影響二氧化硫濃度的主要顏色分量為G和H。
關(guān)鍵詞:顏色讀數(shù);二氧化硫;線性回歸;逐步回歸
中圖分類號:G642.0 文獻標志碼:A
1概述
隨著照相技術(shù)和顏色分辨率的提高,人們希望建立物質(zhì)濃度和顏色讀數(shù)之間的數(shù)量關(guān)系?!段镔|(zhì)濃度與顏色讀數(shù)的回歸分析》一文根據(jù)實驗數(shù)據(jù),利用向后變量易0除法,建立了組胺、溴酸鉀、奶中尿素三種物質(zhì)的濃度與顏色讀數(shù)之間的多元線性回歸模型。但根據(jù)實驗數(shù)據(jù),用類似的方法討論二氧化硫濃度與顏色讀數(shù)之間的多元回歸模型時,效果不理想。本論述利用逐步回歸法,建立了二氧化硫濃度與顏色讀數(shù)之間的多元線性回歸模型,并且在顯著性水平a=0.05下,通過相關(guān)系數(shù)R2、F檢驗、t檢驗對該模型進行了評估,得出在顏色分量RGBsH讀數(shù)中對二氧化硫濃度影響由主到次的順序為:G>H>B>s>R,其中紅(R)、綠(G)、藍(B)是顏色的三基色,亮度(B)、飽和度(S)、色調(diào)(H)是顏色的三要素,文中實驗數(shù)據(jù)B是指三基色中的藍色。
2多元線性回歸分析
2.1模型建立
首先整理實驗數(shù)據(jù),見表1所列。利用ExCEL數(shù)據(jù)分析工具對表1數(shù)據(jù)進行回歸分析,得到二氧化硫濃度與各顏色分量的五元線性回歸結(jié)果見表2所列。
從而五元回歸方程為:
y=2846.29122+0.64717R-19.92775G+5.27286B-4.89616S-10.35390H (1)
由表2看出,相關(guān)系數(shù)0.89957,說明方程(1)擬合程度較好,但是t統(tǒng)計值和P值顯示顏色分量R、s、B對二氧化硫濃度的影響不顯著,造成這一現(xiàn)象的原因可能是數(shù)據(jù)量或錯誤,也可能是各顏色分量之間存在多重共線性。下面計算各顏色分量之間的相關(guān)系數(shù),結(jié)果見表3所列。
表3顯示顏色分量R、G之間,R、B之間,R、H之間,G、B之間,G、H之間,B、H之間相關(guān)程度都很高,表明確實各顏色分量存在多重共線性。
2.2模型優(yōu)化
針對上述模型中的多重共線性問題,運用逐步回歸的方法對模型進行優(yōu)化。逐步回歸的基本思想是將變量逐個引入模型,每引入一個解釋變量后都要進行F檢驗,并對已經(jīng)選人的解釋變量逐個進行t檢驗,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除。先利用EXCEL數(shù)據(jù)分析工具,建立二氧化硫濃度分別與各顏色分量RGBSH的一元回歸模型,見表4一表8所列。
對于一元線性回歸,t值、P值與相關(guān)系數(shù)檢驗是等價的,故比較表4-表8的相關(guān)系數(shù),可知二氧化硫濃度與顏色分量G擬合最佳,說明RGB三基色中G對二氧化硫濃度的反應(yīng)最顯著,其回歸方程為:
y=295.6374-2.15228G (2)
下面以二氧化硫濃度y與顏色分量G的一元回歸為基礎(chǔ),依次加入其他顏色分量,進行二元回歸分析,具體結(jié)果見表9-表12所列。
比較表9一表12的相關(guān)系數(shù),F(xiàn)值和t值可知二氧化硫濃度與顏色分量GH的二元回歸效果最佳,說明顏色要素SH中的H對二氧化硫濃度的反應(yīng)最顯著。其二元回歸方程為:
y=1802.638-11.735G-5.04823H(3)
表12顯示相關(guān)系數(shù)為0.88285,說明模型擬合度較好,但是多元回歸還要通過F檢驗和t檢驗。F檢驗:在給定顯著性水平a=0.05下,查表可得自由度為k-l=2和n-k=22的臨界值F0.05(2,22)=3.443,模型求得F=82.90042>F0.05(2,22),說明方程整體顯著,通過F檢驗;t檢驗:在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=22的臨界值為t0.05(22)=1.7171,型求得各顏色分量G、H對應(yīng)的t統(tǒng)計值分別為:6.03992、-4.95371,絕對值均大于t0.05(22)=1.7171,通過t檢驗。
以二氧化硫濃度y與顏色分量GH的二元回歸為基礎(chǔ),依次加入其他顏色分量,進行三元回歸分析,具體結(jié)果見表13-表15所列。
比較表13-表15的相關(guān)系數(shù),F(xiàn)值和t值可知二氧化硫濃度與顏色分量GHB的三元回歸效果最佳,其三元回歸方程為:
y=1867.406-17.2342G+5.155534B-8.91935H(4)
表14顯示相關(guān)系數(shù)為0.89576,說明模型擬合度較好,下面進行F檢驗和t檢驗。F檢驗:在給定顯著性水平a=0.05下,查表可得自由度為k-1=3和n-k=21的臨界值F0.05(3,21)=3.072,模型求得F=60.15237>F0.05(3,21),說明方程整體顯著,通過F檢驗;t檢驗:在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=21的臨界值為t0.05(21)=1.7207,模型求得各顏色分量G、B、H對應(yīng)的t統(tǒng)計值分別為:-4.42757,1.61238,-3.43757,其中G、H的均t計值絕對值均大于to.05(21)=1.7207,通過t檢驗,但B的t系計值小于t0.05(21)=1.7207說明回歸方程(4)中顏色分量B對二氧化硫濃度影響不顯著。
以二氧化硫濃度與顏色分量GHB的三元回歸為基礎(chǔ),依次加入其他顏色分量,進行四元回歸分析,具體結(jié)果見表16-表17。
比較表16-表17的相關(guān)系數(shù),F(xiàn)值和t值可知二氧化硫濃度與顏色分量GBSH的四元回歸效果佳,其四元回歸方程為:
y=2864.877-19.8835G+5.496888B-4.60243S-10.4529H(5)
表17顯示相關(guān)系數(shù)為0.8995,說明模型擬合度較好。F檢驗:在給定顯著性水平a=0.05下,查表可得自由度為k-1=4和n-k=20的臨界值F0.05(4,20)=2.886,模型求得F=44.7526>F0.05(4,20),說明方程整體顯著,通過F檢驗;t檢驗:在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=20的臨界值為t0.05(201=1.7247,模型求得各顏色分量G、B、S、H對應(yīng)的t統(tǒng)計值分別為:-3.99595,1.695899,-0.86311,-3.31012,其中G、H的t統(tǒng)計值絕對值均大于to.05(20)=1.7247,通過t檢驗,但B、s的t統(tǒng)計值小于t0.05(20)=1.7247,說明回歸方程④中顏色分量B、s對二氧化硫濃度影響不顯著。
綜上,得到以下結(jié)論:
第一,二氧化硫濃度y與顏色分量的最優(yōu)回歸模型是回歸方程(3),即
y=1802.638-11.735G-5.04823H
第二,顏色分量RGBSH中對二氧化硫濃度影響由主到次的順序依次為:G>H>B>S>R。
第三,顏色分量三基色RGB中,綠色GXCZ.氧化硫濃度影響最顯著,藍色B次之,紅色R最弱。顏色要素SH中,色調(diào)H對二氧化硫濃度影響最顯著,飽和度S次之。
3模型不足
本論述中得到的最優(yōu)線性回歸模型顯示二氧化硫的濃度僅與兩個顏色分量GH的讀數(shù)關(guān)系顯著,與其他三個顏色分量RBS關(guān)系不顯著,造成這一結(jié)果的原因可能是提供的實驗數(shù)據(jù)量不足或有錯誤數(shù)據(jù),也可能是實驗數(shù)據(jù)更適合非線性回歸的討論,后續(xù)將進一步探討。