李建軍
摘要 本文研究試紙上的顏色讀數(shù)與溶液濃度的關(guān)系,以五種物質(zhì)在不同濃度下的顏色讀數(shù)為基礎(chǔ)進(jìn)行數(shù)據(jù)處理,確定顏色讀數(shù)和物質(zhì)濃度之間的關(guān)系,然后利用SPSS軟件進(jìn)行多元線性擬合,選取剩余標(biāo)準(zhǔn)差S進(jìn)行分析,評(píng)價(jià)建立模型的優(yōu)劣。文中采用主成分分析法來驗(yàn)證三原色維度對(duì)模型的影響,進(jìn)而選取最佳擬合模型。
【關(guān)鍵詞】比色法 主成分分析 多元線性回歸
比色法是目前常用的一種檢測(cè)物質(zhì)濃度的方法,即把待測(cè)物質(zhì)制備成溶液后滴在特定的白色試紙表面,等其充分反應(yīng)后獲得一張有顏色的試紙,再把該顏色試紙與一個(gè)標(biāo)準(zhǔn)比色卡對(duì)比,來確定待測(cè)物質(zhì)的濃度檔位了。不同人對(duì)顏色的觀測(cè)誤差,使得這一方法在精度上受到很大影響,隨著照相技術(shù)和顏色分辨率的提高,更希望建立顏色讀數(shù)和物質(zhì)濃度的準(zhǔn)確關(guān)系,本文以五種物質(zhì)在不同濃度下的顏色讀數(shù)為基礎(chǔ)進(jìn)行數(shù)據(jù)處理,確定顏色讀數(shù)和物質(zhì)濃度之間的關(guān)系,選取最佳模型進(jìn)行準(zhǔn)確應(yīng)用。
1 基本理論介紹
1.1 擬合度分析和多元線性回歸
數(shù)據(jù)擬合是建立模型逼近實(shí)際數(shù)據(jù)序列的過程,模型要盡可能符合實(shí)際體系,這是擬合的原則。一種現(xiàn)象常常是與多個(gè)因素相聯(lián)系的,由多個(gè)自變量的最優(yōu)組合共同來預(yù)測(cè)或估計(jì)因變量,比只用一個(gè)自變量進(jìn)行預(yù)測(cè)更符合實(shí)際,這就是多元回歸,各元素與因變量之間呈線性關(guān)系時(shí)為多元線性回歸。
1.2 主成分分析
主成分分析是利用降維的思想,將多個(gè)變量轉(zhuǎn)化為少數(shù)幾個(gè)主要變量(即主成分),各主成分之間互不相關(guān),P為特征值總個(gè)數(shù),對(duì)于特征值為λi的主成分,λi的貢獻(xiàn)率ηi可用ηi=λi/(λ1+λ2…λp)表示。λi較小的主成分被認(rèn)為包含的是噪聲,在分析時(shí)不將這些變量引入模型,達(dá)到降維的目的。
2 問題分析及模型建立
本文測(cè)得五種溶液(組胺、溴酸鉀、工業(yè)堿、硫酸鋁鉀和奶中尿素)在不同濃度下五種顏色讀數(shù)(紅R、綠G、藍(lán)B、色調(diào)H、飽和度S)與物質(zhì)濃度的數(shù)據(jù),利用Excel做散點(diǎn)圖如圖l。
同樣處理其他四種溶液的數(shù)據(jù)散點(diǎn),觀察得出Y,與x.存在一定的近線性關(guān)系。
2.1 溶液的顏色讀數(shù)與物質(zhì)濃度之間的相關(guān)性分析
相關(guān)性分析是分析兩個(gè)或多個(gè)具備相關(guān)性的變量元素,進(jìn)而衡量?jī)蓚€(gè)變量因素的相關(guān)密切程度。兩個(gè)變量間線性關(guān)系的程度,可用相關(guān)系數(shù)r來描述:
x,y變化的方向一致,如身高與體重的關(guān)系,r>0為正相關(guān);|r|≥0.95顯著相關(guān);|r|≥0.8高度相關(guān);0.5≤|r|<0.8中度相關(guān);0.3 ≤|r|<0.5低度相關(guān); |r|<0.3關(guān)系極弱;反相關(guān),r<0;無線性相關(guān):r=0。
本文采用Pearson相關(guān)系數(shù),運(yùn)用SPSS軟件對(duì)5種物質(zhì)在不同濃度下的顏色讀數(shù)與物質(zhì)濃度的相關(guān)性分析,可得溶液濃度與顏色讀書之間的相關(guān)系數(shù),具有顯著相關(guān)性。
2.2 顏色讀數(shù)與物質(zhì)濃度的函數(shù)模型建立
通過對(duì)這五組數(shù)據(jù)多元線性回歸中方差膨脹因子(ViF)可知此函數(shù)共線性極強(qiáng),各個(gè)自變量出現(xiàn)交互作用,影響擬合準(zhǔn)確度,所以采用主成分分析法排除共線性對(duì)模型進(jìn)行優(yōu)化。
利用SPSS對(duì)五組數(shù)據(jù)進(jìn)行擬合,對(duì)組胺的主成分的提取及擬合(圖2),組胺的濃度與藍(lán)色讀數(shù)的有關(guān)函數(shù):Yi=-2.775x1+191.187;溴酸鉀濃度與藍(lán)、綠色讀數(shù)的擬合方程為y2=-0.818xl-0.539x2+168.215;工業(yè)堿濃度與藍(lán)色讀數(shù)的擬合方程y3=-0.053x1+16.684;硫酸鋁鉀的濃度與藍(lán)色讀數(shù)的擬合方程:y4=0.344xl-50.431;奶中尿素的濃度與藍(lán)色、綠色讀數(shù)的擬合方程:Ys=-132.618xi+16.014x,+13606.314。利用剩余標(biāo)準(zhǔn)差S來對(duì)五個(gè)模型的優(yōu)劣進(jìn)行評(píng)定。五種物質(zhì)的優(yōu)劣順序:工業(yè)堿>硫酸鋁鉀>組胺>溴酸鉀>奶中尿素。
3 模型降維分析
維度,又稱維數(shù),是數(shù)學(xué)中獨(dú)立參數(shù)的數(shù)目。本文把維度理解成可以決定色彩的因素個(gè)數(shù),維度從5組顏色讀數(shù)降到4維再降到3維研究擬合特征。由主成分分析可知,不同物質(zhì)中,三原色R、G、B都起著重要影響,色調(diào)與飽和度相對(duì)較弱。
建立成分矩陣可以得到R紅色顏色值占的主要成分最多且R=0.977,接下來將R紅色顏色值的數(shù)據(jù)去掉,用剩下的四維數(shù)據(jù)再次進(jìn)行主成分分析得到G綠色顏色值所占比重是最大的,且R=0.976;然后同以上步驟將G綠色顏色值去掉,可以看出B藍(lán)色顏色值所在比重是最大的,且R=0.869,采用降維的方法來判斷降維前后的顯著性。降維的順序是:五維、四維(去掉了色調(diào)H)、三維(去掉飽和度S)。
4 分析結(jié)果與模型評(píng)價(jià)
隨著將每組的主要成分分別提出后,所得到的R復(fù)相關(guān)系數(shù)的大小也是隨著提取由大變小的。由此得出R、G、B對(duì)模型都是有一定的影響。從表中的Sig值可看出去掉色調(diào)時(shí)有顯著變化,去掉飽和度時(shí)沒有顯著變化,由此得出色調(diào)是影響模型的主要因素。
三原色與色調(diào)和飽和度具有相關(guān)性,采用主成分分析法利用spss來驗(yàn)證三原色維度對(duì)模型的影響,觀察顏色讀數(shù)維度從5逐步減小后spss做的回歸分析,通過對(duì)R復(fù)相關(guān)系數(shù)的研究看出隨著R、G、B的被提取,復(fù)相關(guān)系數(shù)的值也是越來越小,這說明顏色維度從5到4再到3,擬合模型最佳。
本文所建立模型的主要優(yōu)點(diǎn)是:簡(jiǎn)單快捷、可以直接利用顏色讀數(shù)來測(cè)定物質(zhì)的濃度不足之處是:實(shí)驗(yàn)數(shù)據(jù)較少,模型存在一定的誤差。
參考文獻(xiàn)
[1]駱方,劉紅云,黃昆編著,數(shù)據(jù)統(tǒng)計(jì)與分析[M].高等教育出版社,2015 (07):12-15.
[2]王凱,對(duì)色彩教學(xué)中色彩冷暖和色彩三要素之間關(guān)系的思考[J].文藝生活,2014 (04).
[3]馮國(guó)生,劉榮,呂振通,統(tǒng)計(jì)分析與應(yīng)用(第2版)[M].機(jī)械工業(yè)出版社,2014 (02):26-30.