楊玉鳳
(昆明滇池水務(wù)環(huán)境監(jiān)測(cè)有限公司,云南 昆明 650200)
在環(huán)境監(jiān)測(cè)的儀器分析中,絕大多數(shù)分析方法都是相對(duì)測(cè)量方法,需要進(jìn)行校準(zhǔn),建立分析信號(hào)與分析物量值之間的相關(guān)關(guān)系,即建立校準(zhǔn)曲線。因此,正確建立和應(yīng)用校準(zhǔn)曲線是儀器分析獲得準(zhǔn)確定量分析結(jié)果的前提條件[1]。化驗(yàn)檢測(cè)人員日常工作中使用的校準(zhǔn)曲線是以回歸分析為理論依據(jù),通過(guò)最小二乘法擬合而成,其中最小二乘法分為普通最小二乘法(ordinary least square,OLS)[2]和加權(quán)最小二乘法(weighted least square,WLS)[3]。應(yīng)用普通最小二乘法應(yīng)滿足同方差假設(shè),指的是校準(zhǔn)曲線的隨機(jī)干擾項(xiàng)的方差全部等于一個(gè)有限的常數(shù),而異方差則是校準(zhǔn)曲線中隨機(jī)干擾項(xiàng)的方差不再是某一常數(shù),而是隨著測(cè)定點(diǎn)的變化而變化。當(dāng)校準(zhǔn)曲線存在異方差時(shí),參數(shù)估計(jì)和假設(shè)檢驗(yàn)一般都會(huì)出現(xiàn)偏離,為避免異方差這種不良影響,人們?cè)趯?duì)存在異方差問(wèn)題的模型進(jìn)行參數(shù)估計(jì)時(shí)引入了加權(quán)最小二乘法,這種參數(shù)估計(jì)方法是解決線性回歸模型異方差問(wèn)題的有效途徑[4]。
在涉及分析化學(xué)的食品檢驗(yàn)、環(huán)境檢驗(yàn)、農(nóng)產(chǎn)品檢驗(yàn)等領(lǐng)域,應(yīng)用加權(quán)回歸方法擬合校準(zhǔn)曲線是比較少的[5]。本文應(yīng)用水質(zhì)氨氮、水質(zhì)總磷一年測(cè)定過(guò)程中分別累計(jì)的6條校準(zhǔn)曲線數(shù)據(jù),首先進(jìn)行異方差檢驗(yàn),隨后應(yīng)用加權(quán)最小二乘法進(jìn)行曲線擬合,最后對(duì)加權(quán)最小二乘法擬合曲線與平時(shí)工作過(guò)程中用普通最小二乘法擬合曲線進(jìn)行對(duì)比。
DR2800可見(jiàn)分光光度計(jì)(美國(guó)哈希公司),用于氨氮測(cè)定;
TU1810PC紫外可見(jiàn)分光光度計(jì)(北京普析通用儀器有限公司),用于總磷測(cè)定;
氨氮標(biāo)準(zhǔn)溶液(102227#):證書(shū)號(hào)GSB 05-1145-2000,500 mg/L,相對(duì)擴(kuò)展不確定度 1%,k=2,環(huán)境保護(hù)部標(biāo)準(zhǔn)樣品研究所;
磷酸鹽磷溶液(102817#):證書(shū)號(hào)GSB 07-1270-2000,500 mg/L,相對(duì)擴(kuò)展不確定度 1℅,k=2,環(huán)境保護(hù)部標(biāo)準(zhǔn)樣品研究所。
氨氮的檢測(cè)方法依據(jù)為 HJ 535—2009《水質(zhì) 氨氮的測(cè)定 納氏試劑分光光度法》[6];
總磷的檢測(cè)方法依據(jù)為 GB/T11893-1989《水質(zhì) 總磷的測(cè)定 鉬酸銨分光光度法》[7]。
氨氮、總磷兩項(xiàng)目在一年內(nèi)分別收集的6 條校準(zhǔn)曲線各質(zhì)量濃度點(diǎn)測(cè)得吸光度數(shù)據(jù),結(jié)果見(jiàn)表1,表2。
表1 氨氮各質(zhì)量濃度點(diǎn)測(cè)得吸光度原始數(shù)據(jù)
表2 總磷各質(zhì)量濃度點(diǎn)測(cè)得吸光度原始數(shù)據(jù)
在數(shù)理統(tǒng)計(jì)學(xué)中通常認(rèn)為大樣本容量應(yīng)大于 30[8],當(dāng)樣本容量為30時(shí),樣本均值的抽樣分布形狀基本上沒(méi)有差別,形成正態(tài)分布[9],本文中氨氮校準(zhǔn)曲線的測(cè)定有 8 個(gè)標(biāo)準(zhǔn)質(zhì)量濃度點(diǎn),一年累積6 條校準(zhǔn)曲線的數(shù)據(jù)為48個(gè),總磷校準(zhǔn)曲線的測(cè)定有 7個(gè)標(biāo)準(zhǔn)質(zhì)量濃度點(diǎn),一年累積6 條校準(zhǔn)曲線的數(shù)據(jù)為42個(gè)。為保證各測(cè)定數(shù)據(jù)的獨(dú)立性,選取的數(shù)據(jù)來(lái)自于一年內(nèi)不同人員在不同時(shí)期于同一儀器上所測(cè)得結(jié)果,滿足校準(zhǔn)曲線異方差檢驗(yàn)要求。以各濃度點(diǎn)xi為x軸,各質(zhì)量濃度點(diǎn)處測(cè)得吸光度的標(biāo)準(zhǔn)差si為y軸作圖,見(jiàn)圖1,圖2。
圖1 氨氮校準(zhǔn)曲線各質(zhì)量濃度點(diǎn)與測(cè)得吸光度標(biāo)準(zhǔn)差關(guān)系
圖2 總磷校準(zhǔn)曲線各質(zhì)量濃度點(diǎn)與測(cè)得吸光度標(biāo)準(zhǔn)差關(guān)系
圖1,圖2表明,隨著各質(zhì)量濃度點(diǎn)質(zhì)量濃度的增加,各質(zhì)量濃度點(diǎn)處測(cè)得吸光度的標(biāo)準(zhǔn)差變大,存在異方差現(xiàn)象。
加權(quán)最小二乘法和普通最小二乘法都是通過(guò)對(duì)校準(zhǔn)曲線殘差平方求和后,再求此殘差平方和的最小值,不同之處是在殘差平方求和過(guò)程中,加權(quán)最小二乘法考慮到了異方差的影響,對(duì)殘差平方進(jìn)行加權(quán)求和。因?yàn)榇嬖诋惙讲钋樾螘r(shí),不同質(zhì)量濃度點(diǎn)對(duì)校準(zhǔn)曲線的影響作用是不同的,為消除這種不同,在殘差平方求和過(guò)程中對(duì)不同質(zhì)量濃度點(diǎn)所形成的殘差的平方賦予不同的權(quán)重,權(quán)重通常選擇對(duì)應(yīng)質(zhì)量濃度點(diǎn)所形成的隨機(jī)干擾項(xiàng)方差的倒數(shù)[4]。
依據(jù)文獻(xiàn)[2],加權(quán)最小二乘法回歸方程y=a+bx中截距a、斜率b的計(jì)算公式分別為式(1)~式(4),權(quán)重計(jì)算公式為式(5)。表3、表4為加權(quán)最小二乘法回歸計(jì)算具體過(guò)程數(shù)據(jù)。
表3 氨氮曲線加權(quán)回歸計(jì)算
表4 總磷曲線加權(quán)回歸計(jì)算
(1)
(2)
(3)
(4)
(5)
表5 氨氮項(xiàng)目不同方法擬合曲線|δ|計(jì)算過(guò)程
表6 總磷項(xiàng)目不同方法擬合曲線|δ|計(jì)算過(guò)程
表7 氨氮項(xiàng)目OLS擬合曲線|δ|值及統(tǒng)計(jì)計(jì)算
表8 氨氮項(xiàng)目WLS擬合曲線|δ|值及統(tǒng)計(jì)計(jì)算
表9 總磷項(xiàng)目OLS擬合曲線|δ|值及統(tǒng)計(jì)計(jì)算
表10 總磷項(xiàng)目WLS擬合曲線|δ|值及統(tǒng)計(jì)計(jì)算
圖3 氨氮項(xiàng)目WLS曲線 與OLS曲線走勢(shì)圖
圖4 氨氮項(xiàng)目WLS曲線與OLS曲線|δ|在不同區(qū)間出現(xiàn)頻次
圖5 總磷項(xiàng)目WLS曲線 與OLS曲線走勢(shì)圖
圖6 總磷項(xiàng)目WLS曲線與OLS曲線|δ|在不同區(qū)間出現(xiàn)頻次
1)OLS是以離差平方和最小為原則進(jìn)行曲線擬合,如圖1、圖2存在異方差的情況下,平方和中每一項(xiàng)的地位是不相同的,高質(zhì)量濃度處誤差項(xiàng)方差大,其在平方和中的作用就大,低質(zhì)量濃度處誤差項(xiàng)方差小,其在平方和中的作用就小,因而 OLS 估計(jì)的回歸直線就被拉向方差大的高質(zhì)量濃度項(xiàng),而小方差項(xiàng)的低質(zhì)量濃度項(xiàng)擬合程度就差。WLS 的思路為在平方和中加入一個(gè)適當(dāng)?shù)臋?quán)重項(xiàng)wi,以調(diào)整各項(xiàng)在平方和中的作用,表3、表4中wi項(xiàng)正好體現(xiàn)了這點(diǎn)。
2)根據(jù)表1、表2中的數(shù)據(jù)繪制圖7、圖8。由圖7、圖8可以看出兩項(xiàng)目在低質(zhì)量濃度點(diǎn)的相對(duì)標(biāo)準(zhǔn)偏差(RSD)均大于高質(zhì)量濃度點(diǎn)的RSD。按照WLS擬合思路,如果在方差小的低質(zhì)量濃度點(diǎn)加上較高權(quán)重(表3、表4),有可能同時(shí)將低質(zhì)量濃度處較高的不確定度引入擬合曲線。
圖7 氨氮校準(zhǔn)曲線各質(zhì)量濃度點(diǎn)與測(cè)得吸光度RSD關(guān)系
圖8 總磷校準(zhǔn)曲線各質(zhì)量濃度點(diǎn)與測(cè)得吸光度RSD關(guān)系
3)有學(xué)者從WLS的實(shí)施過(guò)程方面分析,指出WLS改變了原始的樣本數(shù)據(jù)和模型的設(shè)定形式;從WLS估計(jì)量的方差與OLS估計(jì)量的方差不相同方面分析,發(fā)現(xiàn)WLS可能導(dǎo)致模型參數(shù)顯著性檢驗(yàn)結(jié)果的變化;從異方差問(wèn)題是一個(gè)總體問(wèn)題而非樣本問(wèn)題方面分析,指出根據(jù)樣本數(shù)據(jù)發(fā)現(xiàn)的所謂的異方差問(wèn)題來(lái)認(rèn)定總體存在異方差是有風(fēng)險(xiǎn)的[4]。
校準(zhǔn)曲線作為將分析信號(hào)轉(zhuǎn)換為分析物量值的媒介,其擬合的優(yōu)劣直接影響到分析物量值的準(zhǔn)確度,我們之所以要對(duì)存在異方差問(wèn)題的校準(zhǔn)曲線進(jìn)行加權(quán)最小二乘擬合,是為了得到擬合度更優(yōu)的曲線,從而使計(jì)算結(jié)果更接近準(zhǔn)確數(shù)值,從本文以上對(duì)比結(jié)果來(lái)看,針對(duì)本實(shí)驗(yàn)室水質(zhì)氨氮、水質(zhì)總磷兩項(xiàng)目,即使校準(zhǔn)曲線存在異方差,其OLS估計(jì)的參數(shù)(截距、斜率)也可能是最佳線性無(wú)偏參數(shù)。校準(zhǔn)曲線滿足同方差假定,可以保障OLS估計(jì)的參數(shù)是最佳線性無(wú)偏參數(shù);但如果OLS估計(jì)的參數(shù)是最佳線性無(wú)偏參數(shù),校準(zhǔn)曲線未必滿足同方差假定。
本文僅是針對(duì)分光光度法中水質(zhì)氨氮、水質(zhì)總磷兩項(xiàng)目進(jìn)行了WLS曲線和OLS曲線的探討,校準(zhǔn)曲線在化學(xué)分析領(lǐng)域應(yīng)用較廣,有可能在其他項(xiàng)目中WLS曲線和OLS曲線的表現(xiàn)又有不同之處,所以還有很多需要探討和交流的方面。