韓嘉慶,周桂霞*,胡 軍*,程介虹,陳爭(zhēng)光,趙勝雪,劉奕伶
1. 黑龍江八一農(nóng)墾大學(xué)工程學(xué)院,黑龍江 大慶 163319 2. 黑龍江八一農(nóng)墾大學(xué)電氣與信息學(xué)院,黑龍江 大慶 163319
潤(rùn)滑油農(nóng)業(yè)機(jī)械化的必要條件。潤(rùn)滑油作為農(nóng)機(jī)發(fā)動(dòng)機(jī)良好工作的潤(rùn)滑劑,不僅起到潤(rùn)滑和抗磨損的功用,也具備冷卻、 清潔、 防銹、 防腐和抗氧化的功能。農(nóng)機(jī)作業(yè)環(huán)境惡劣且工況多變,長(zhǎng)期高負(fù)荷的作業(yè)導(dǎo)致潤(rùn)滑油變質(zhì)速度加快,使得部分農(nóng)機(jī)潤(rùn)滑油在保質(zhì)期內(nèi)已經(jīng)提前變質(zhì)卻未得到及時(shí)更換;同時(shí)多數(shù)進(jìn)口農(nóng)業(yè)機(jī)械要求使用專用潤(rùn)滑油且需要嚴(yán)格按照規(guī)定時(shí)長(zhǎng)進(jìn)行換油,但有時(shí)農(nóng)機(jī)作業(yè)量少且工作負(fù)荷輕,存在潤(rùn)滑油還未變質(zhì)就被強(qiáng)制換油,造成了能源的浪費(fèi),成本的提高。污染濃度作為評(píng)價(jià)油液質(zhì)量的綜合指標(biāo),不僅可以體現(xiàn)出潤(rùn)滑油中機(jī)械雜質(zhì)的多少,也能體現(xiàn)出油液的使用狀態(tài)。常規(guī)的的實(shí)驗(yàn)室檢測(cè)耗時(shí)長(zhǎng),檢測(cè)成本高,因此,開(kāi)發(fā)出一種高效的潤(rùn)滑油污染濃度檢測(cè)方法具有重要意義。
近紅外光譜技術(shù)具有適應(yīng)性廣、 無(wú)損無(wú)污染、 分析速度快、 精密度高等優(yōu)點(diǎn),是油品質(zhì)量檢測(cè)極其重要的分析手段之一。Balabin等[1]利用近紅外光譜技術(shù)結(jié)合概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network, PNN)、 K最近鄰(K-nearest neighbor method, KNN)等七種方法來(lái)鑒別潤(rùn)滑油種類;Alves等[2]利用近紅外光譜技術(shù)結(jié)合支持向量機(jī)(support vector machine, SVM)對(duì)石蠟潤(rùn)滑油中環(huán)烷烴和植物油的含量進(jìn)行測(cè)定;劉晨陽(yáng)等[3]利用近紅外光譜,提出一種量子遺傳(quantum genetic algorithm, QGA)與BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)結(jié)合的算法對(duì)潤(rùn)滑油粘度進(jìn)行定量分析的方法;陳彬等[4]利用近紅外光譜技術(shù)結(jié)合無(wú)信息變量消除法(uninformative variable elimination, UVE),提出了一種潤(rùn)滑油中含水率的檢測(cè)方法;張瑜等[5]利用近紅外光譜結(jié)合最小二乘支持向量機(jī)(least squares support vector machine, LSSVM)對(duì)潤(rùn)滑油的酸值進(jìn)行檢測(cè)。通過(guò)上述可以發(fā)現(xiàn),較多國(guó)內(nèi)外學(xué)者均應(yīng)用近紅外光譜對(duì)潤(rùn)滑油含水率、 粘度、 酸值以及潤(rùn)滑油品牌的鑒別進(jìn)行了相關(guān)研究,而對(duì)于潤(rùn)滑油污染濃度的研究較少。
在近紅外光譜分析中,特征波長(zhǎng)的提取[6]一直是熱門話題。近紅外光譜特征波長(zhǎng)選擇方法眾多,其中隨機(jī)蛙跳(random frog, RF)[7]是目前較為高效且新式的特征波長(zhǎng)選擇算法之一。其原理是由于各變量被選概率值的大小不同,所以通過(guò)多輪迭代,將被選概率值較高的部分變量作為所選特征波長(zhǎng)。通過(guò)對(duì)RF算法原理的分析,發(fā)現(xiàn)RF算法在數(shù)據(jù)降維方面具有一定優(yōu)勢(shì),但也存在明顯的缺陷。RF算法中初始變量集的選擇是隨機(jī)的,存在較大的不確定性,無(wú)法保證初始信息的合理性與有效性,可能會(huì)選擇到部分無(wú)信息變量或干擾變量,導(dǎo)致所得結(jié)果的再現(xiàn)性較低。因此RF算法中的迭代次數(shù)N需要足夠大,以確保算法在運(yùn)行過(guò)程中可以遍歷所有數(shù)據(jù)集,但這也導(dǎo)致算法需要處理的數(shù)據(jù)量過(guò)大,運(yùn)行效率較低。同時(shí),RF算法中對(duì)被選變量概率值的標(biāo)定無(wú)理論依據(jù),易受客觀因素影響[8],導(dǎo)致所選取特征波長(zhǎng)的數(shù)量存在不確定性。
因此,以農(nóng)機(jī)潤(rùn)滑油為研究對(duì)象,利用所獲取的近紅外光譜數(shù)據(jù),對(duì)RF算法進(jìn)行改進(jìn),提出一種迭代保留信息變量的隨機(jī)蛙跳(iteratively retains informative variables-random frog, IRIV-RF)特征波長(zhǎng)選擇算法。分別利用全譜以及RF算法、 迭代保留信息變量(iteratively retains informative variables, IRIV)[9]算法和改進(jìn)的IRIV-RF算法提取出的特征波長(zhǎng)建立偏最小二乘回歸(partial least squares regression, PLSR)模型[10],比較四種模型的預(yù)測(cè)精度,用來(lái)證明本文提出的IRIV-RF算法的有效性。
試驗(yàn)材料分別選用未開(kāi)封使用的約翰迪爾CK-4/SN機(jī)油和使用遠(yuǎn)超正常工作小時(shí)的同品牌同型號(hào)污染潤(rùn)滑油, 此型號(hào)潤(rùn)滑油適應(yīng)性強(qiáng),屬于冬夏通用型機(jī)油,應(yīng)用于眾多約翰迪爾大馬力拖拉機(jī)中,具有代表性。為得到不同污染濃度的潤(rùn)滑油的近紅外光譜數(shù)據(jù),使用混勻儀,將未開(kāi)封的新油與污染后的舊油按照不同比例進(jìn)行混合,依次配置了污染度濃度為0%,1%,2%,3%,4%,…,100%的共101份潤(rùn)滑油樣本,以此模擬農(nóng)機(jī)發(fā)動(dòng)機(jī)工作過(guò)程中潤(rùn)滑油污染濃度的逐漸變化過(guò)程。本文以農(nóng)機(jī)潤(rùn)滑油污染濃度(0~100)作為因變量進(jìn)行波長(zhǎng)選擇及近紅外光譜數(shù)據(jù)建模預(yù)測(cè)分析。
使用德國(guó)布魯克品牌的TANGO系列近紅外光譜儀采集101份潤(rùn)滑油樣本的近紅外光譜。光譜采集軟件為OPUS6.5,波長(zhǎng)范圍為1 000~2 500 nm,控制室溫在25 ℃左右,開(kāi)機(jī)預(yù)熱30 min后進(jìn)行背景測(cè)量,在后續(xù)光譜采集過(guò)程中,每隔30 min重新測(cè)量背景,避免背景干擾。采集過(guò)程中應(yīng)避免潤(rùn)滑油樣本中有氣泡產(chǎn)生,因?yàn)闈?rùn)滑油樣本中存在氣泡會(huì)使光譜采集過(guò)程中產(chǎn)生光的散射等現(xiàn)象,降低光譜數(shù)據(jù)的準(zhǔn)確性,所以部分產(chǎn)生氣泡的潤(rùn)滑油樣本,均靜置15~20 min,待氣泡自行排出后進(jìn)行光譜采集。為最大限度避免采集過(guò)程中所產(chǎn)生的誤差,每份潤(rùn)滑油樣本均采集三次光譜數(shù)據(jù),將其平均值作為各潤(rùn)滑油樣本的原始光譜。
SPXY(sample set portioning based on joint X-Y distances)算法[11]是由Galvao等提出的樣本選擇方法,原理是分別以光譜變量和理化值為特征參數(shù),計(jì)算各樣本間的距離,最大程度保證樣本分布的代表性,具體實(shí)現(xiàn)過(guò)程參照文獻(xiàn)[12]。該算法可以有效覆蓋多維向量空間,避免樣本間因差異過(guò)小所引起的預(yù)測(cè)模型過(guò)擬合或預(yù)測(cè)效果差的現(xiàn)象,在分析光譜變量特征與理化值之間的關(guān)系的同時(shí)進(jìn)行樣本選擇,改善模型的預(yù)測(cè)能力與穩(wěn)健性。
光譜除含有樣本自身的化學(xué)信息以外,也存有部分無(wú)用信息以及噪聲信息。樣本自身基質(zhì)狀態(tài)的改變、 光的散射以及光譜儀工作狀態(tài)的改變等都會(huì)導(dǎo)致光譜出現(xiàn)基線漂移,多元散射等噪聲信息。因此,需要對(duì)原始光譜進(jìn)行預(yù)處理來(lái)消除噪聲、 校正斜坡背景、 壓縮數(shù)據(jù)以及消除其他無(wú)用因素對(duì)光譜信息的干擾,為所建立模型的魯棒性和待測(cè)樣本預(yù)測(cè)的精度奠定良好的基礎(chǔ)[12]。目前在近紅外光譜技術(shù)中,卷積平滑法(savitzky-golay, SG)、 基線矯正(baseline correction, BC)以及變量標(biāo)準(zhǔn)化(standard normal variate, SNV)等是較為常用的預(yù)處理方法。
1.4.1 初始變量集的選擇
通過(guò)對(duì)RF算法的原理和步驟進(jìn)行深入研究,該算法體具體實(shí)現(xiàn)過(guò)程參照文獻(xiàn)[8]的描述,可以發(fā)現(xiàn)RF算法中初始變量集的選擇是隨機(jī)的,存在較大的不確定性,可能會(huì)選擇到一些無(wú)信息變量或干擾變量,導(dǎo)致算法迭代次數(shù)較大,結(jié)果再現(xiàn)性較低,運(yùn)算時(shí)間過(guò)長(zhǎng)。而IRIV算法是一種將各變量隨機(jī)組合并判斷各變量之間相互作用,基于二進(jìn)制矩陣重排過(guò)濾器提出的特征波長(zhǎng)選擇算法,通過(guò)評(píng)估各變量與模型之間的利害關(guān)系,將全部變量劃分為對(duì)建模有益的強(qiáng)信息變量和弱信息變量以及對(duì)建模無(wú)益甚至產(chǎn)生危害的無(wú)信息變量和干擾信息變量,該算法具體實(shí)現(xiàn)過(guò)程參照文獻(xiàn)[10]的描述。本工作通過(guò)IRIV算法對(duì)RF算法進(jìn)行改進(jìn),利用IRIV算法提取出強(qiáng)信息變量和弱信息變量,將其作為RF算法中的初始變量集,確保初始變量集的合理性與有效性,避免初始變量集的隨機(jī)性,剔除對(duì)建模無(wú)意義的無(wú)信息變量以及對(duì)建模有害的干擾信息變量,減少迭代次數(shù),提高結(jié)果的再現(xiàn)性。
1.4.2 建模波長(zhǎng)的優(yōu)選
RF算法中,通常基于各變量被選概率值的大小進(jìn)行變量選擇,一般選擇由大到小正向排序的前十個(gè)變量作為特征波長(zhǎng),或者根據(jù)客觀標(biāo)定的概率值,一般選擇大于或者等于此客觀標(biāo)定的概率值的變量作為符合要求的特征波長(zhǎng)[13],導(dǎo)致經(jīng)過(guò)RF算法所提取的特征波長(zhǎng)數(shù)量的選擇存在很大的不確定性。
為避免所選建模波長(zhǎng)數(shù)量的不確定性,對(duì)各變量按其被選概率值進(jìn)行由大到小正向排序,通過(guò)向前選擇法對(duì)排序后的變量從首個(gè)波長(zhǎng)開(kāi)始,依次增加一個(gè)波長(zhǎng),建立光譜數(shù)據(jù)與理化值的PLSR模型,計(jì)算各模型的交叉驗(yàn)證均方根誤差(root mean square error of cross validation, RMSECV)值,以出現(xiàn)最小RMSECV值時(shí)對(duì)應(yīng)的變量子集為最終所選的特征波長(zhǎng)。RMSECV使用式(1)計(jì)算
(1)
式(1)中,yi, actual為第i個(gè)農(nóng)機(jī)潤(rùn)滑油樣本污染濃度實(shí)測(cè)值,yi, predicted為經(jīng)過(guò)該模型所計(jì)算出的第i個(gè)農(nóng)機(jī)潤(rùn)滑油樣本污染濃度預(yù)測(cè)值,n為全部樣本中校正集的樣本數(shù)量。
IRIV-RF算法通過(guò)IRIV算法得到強(qiáng)信息變量與弱信息變量,將其作為RF算法中的初始變量集;通過(guò)依次增加一個(gè)變量并建立光譜數(shù)據(jù)與理化值的PLSR模型后找到出現(xiàn)最小RMSECV值時(shí)對(duì)應(yīng)的變量子集。這樣IRIV-RF算法就可以找到最優(yōu)預(yù)測(cè)精度所對(duì)應(yīng)的特征波長(zhǎng),通過(guò)兩次改進(jìn)提高了結(jié)果再現(xiàn)性與預(yù)測(cè)精度。
目前,在近紅外光譜分析中,PLSR[14]是比較高效且常用的建模方法。它將光譜數(shù)據(jù)壓縮成為潛在變量的正交結(jié)構(gòu),描述參考值與光譜信息之間的最大協(xié)方差。PLSR同時(shí)擁有多元線性回歸分析、 主成分分析以及典型相關(guān)分析的分析特性,便于有效消除自變量可能存在多重共線性所導(dǎo)致模型預(yù)測(cè)失真等缺陷,具有較高的預(yù)測(cè)穩(wěn)定性,能更加準(zhǔn)確進(jìn)行信息的識(shí)別。
模型評(píng)價(jià)的目的是為了對(duì)所建立的模型預(yù)測(cè)的精度、 可信度以及建模的效果進(jìn)行驗(yàn)證評(píng)價(jià),主要通過(guò)校正相關(guān)系數(shù)(Rc)、 校正均方根誤差(RMSEC)、 預(yù)測(cè)相關(guān)系數(shù)(Rp)、 預(yù)測(cè)均方根誤差(RMSEP)四個(gè)參數(shù)來(lái)評(píng)價(jià)建模的效果以及模型的預(yù)測(cè)能力。其中,若相關(guān)系數(shù)的數(shù)值越大且越趨近于1,則說(shuō)明對(duì)應(yīng)特征變量與理化值兩者的相關(guān)性越強(qiáng),模型的擬合程度越高;若均方根誤差的數(shù)值越小,則說(shuō)明模型的穩(wěn)定性越高,預(yù)測(cè)能力越好。
利用SPXY算法將101個(gè)潤(rùn)滑油樣本劃分為兩部分,分別為70%的校正集和30%的預(yù)測(cè)集,即校正集由70個(gè)樣本構(gòu)成,預(yù)測(cè)集由31個(gè)樣本構(gòu)成。選用SG、 BC以及SNV三種不同的預(yù)處理方法分別對(duì)原始光譜進(jìn)行處理,其中SG去噪時(shí)選擇移動(dòng)窗口數(shù)為7,用于擬合的多項(xiàng)式次數(shù)為3。同時(shí)對(duì)原始光譜數(shù)據(jù)以及三種不同預(yù)處理后所得的光譜數(shù)據(jù)分別建立PLSR模型,根據(jù)所建立的PLSR模型的建模效果與預(yù)測(cè)精度確定出最佳的預(yù)處理方法。原始光譜的PLSR模型以及三種不同預(yù)處理后所得的光譜數(shù)據(jù)建立的PLSR模型結(jié)果如表1所示。
表1 不同預(yù)處理方法的模型結(jié)果Table 1 Performance results of models withdifferent Pretreatment methods
通過(guò)表1可以看出,經(jīng)過(guò)SNV預(yù)處理后所得的光譜數(shù)據(jù)建立的PLSR模型的均方根誤差和相關(guān)系數(shù)與原始光譜、 SG以及BC預(yù)處理后的光譜數(shù)據(jù)建立的PLSR模型的均方根誤差和相關(guān)系數(shù)比較,可以發(fā)現(xiàn)SNV預(yù)處理建立的PLSR模型的均方根誤差最小且相關(guān)系數(shù)更趨近于1,故選用SNV進(jìn)行光譜預(yù)處理。圖1(a)為原始光譜,圖1(b)為SNV預(yù)處理后得到的光譜,可以發(fā)現(xiàn)通過(guò)SNV預(yù)處理后的光譜曲線的波峰波谷的位置特征越發(fā)分明,解決了原始光譜中存在基線漂移的問(wèn)題,所以后續(xù)的特征波長(zhǎng)選擇和建模均應(yīng)用SNV預(yù)處理后所得到的光譜數(shù)據(jù)。
圖1 原始光譜(a)及SNV預(yù)處理后的光譜(b)Fig.1 Original spectra (a) and SNV preprocessed spectra (b)
2.2.1 RF變量選擇結(jié)果
對(duì)RF進(jìn)行初始化參數(shù)設(shè)置,N設(shè)定為10 000,Q設(shè)定為10,開(kāi)始運(yùn)行。全譜經(jīng)過(guò)RF算法進(jìn)行波長(zhǎng)選擇后,各變量被選擇的概率值如圖2(a)所示,經(jīng)過(guò)多次試驗(yàn),選用不同概率值所對(duì)應(yīng)的變量作為特征波長(zhǎng)分別建模,進(jìn)行對(duì)比分析后,發(fā)現(xiàn)選擇概率值大于等于0.24的變量為特征波長(zhǎng)建模可以獲得最佳的建模效果,此時(shí)的特征波長(zhǎng)共計(jì)24個(gè),如圖2(b)所示,分別為2 435,2 260,2 396,2 290,2 175,2 498,1 953,2 430,2 427,1 400,1 194,1 207,1 770,1 740,1 743,1 409,2 173,1 698,2 487,1 163,1 364,1 049,1 283和1 840 nm。
圖2 RF運(yùn)行結(jié)果Fig.2 The results of random frog selection
2.2.2 IRIV變量選擇結(jié)果
對(duì)IRIV進(jìn)行初始化參數(shù)設(shè)置,設(shè)定最大主成分?jǐn)?shù)為10,交叉驗(yàn)證次數(shù)為5,開(kāi)始運(yùn)行。全譜經(jīng)過(guò)IRIV算法波長(zhǎng)選擇后,選擇出強(qiáng)信息變量和弱信息變量共計(jì)29個(gè),如圖3所示,分別為1 013,1 037,1 066,1 078,1 083,1 084,1 171,1 172,1 212,1 229,1 323,1 363,1 364,1 402,1 408,1 410,1 425,1 474,1 486,1 674,1 675,1 991,2 021,2 028,2 030,2 290,2 352,2 427和2 430 nm。
2.2.3 IRIV-RF變量選擇結(jié)果
在IRIV得到的29個(gè)強(qiáng)信息變量和弱信息變量的基礎(chǔ)上進(jìn)行RF波長(zhǎng)選擇。根據(jù)被選概率值對(duì)各變量進(jìn)行由大到小正向排序,從被選概率值最大的波長(zhǎng)開(kāi)始,按照所排順序依次增加一個(gè)波長(zhǎng)建立光譜數(shù)據(jù)與農(nóng)機(jī)潤(rùn)滑油污染濃度的PLSR模型。IRIV-RF變量選擇的結(jié)果如圖4所示,其中圖4(a)中紅色正方形標(biāo)記處為最小的RMSECV值,為9.134 2,得到滿足條件的特征波長(zhǎng)共計(jì)17個(gè),如圖4(b)所示,分別為:1 408,1 674,2 427,1 083,2 290,1 066,1 212,1 675,2 352,1 991,1 013,1 171,1 363,1 364,2 021,1 172和1 323 nm。
圖3 IRIV所得強(qiáng)、 弱信息變量Fig.3 Strongly and weakly informative variablesobtained by IRIV
圖4 IRIV-RF變量選擇的結(jié)果Fig.4 Variable selection results of IRIV-RF
將全譜、 RF、 IRIV以及IRIV-RF三種算法所選擇出的特征波長(zhǎng),分別建立PLSR模型,計(jì)算得到各模型的校正相關(guān)系數(shù)、 預(yù)測(cè)相關(guān)系數(shù)、 校正均方根誤差以及預(yù)測(cè)均方根誤差的數(shù)值,如表2所示,通過(guò)四個(gè)評(píng)價(jià)參數(shù)來(lái)比較各模型的預(yù)測(cè)能力。
通過(guò)表2可以發(fā)現(xiàn),對(duì)全譜提取特征波長(zhǎng)后所建立模型的各項(xiàng)參數(shù)均優(yōu)于全譜,證明了對(duì)全譜提取特征波長(zhǎng)的必要性。同時(shí),改進(jìn)的IRIV-RF算法模型的各項(xiàng)評(píng)價(jià)參數(shù)均優(yōu)于RF算法以及IRIV算法,其中經(jīng)過(guò)RF算法所選特征波長(zhǎng)建立的PLSR模型的Rp為0.913 3,RMSEP為11.434 6,而經(jīng)過(guò)改進(jìn)后IRIV-RF算法所選特征波長(zhǎng)建立的PLSR模型的Rp為0.965 7,RMSEP為9.058 4,提升了預(yù)測(cè)精度。這是因?yàn)樵赗F算法初始變量集的選擇過(guò)程中可能會(huì)選取到部分干擾信息變量或無(wú)信息變量,導(dǎo)致RF算法的不確定程度極高,結(jié)果再現(xiàn)性較低,算法迭代次數(shù)過(guò)大,運(yùn)行時(shí)間較長(zhǎng)。本文提出的IRIV-RF算法,首先通過(guò)IRIV算法對(duì)全譜進(jìn)行特征波長(zhǎng)初選,提取強(qiáng)信息變量和弱信息變量,避免光譜中無(wú)信息變量和干擾變量對(duì)光譜的影響,將其初選結(jié)果作為RF算法的初始變量集,保證了RF算法初始變量集選擇的有效性,有益于特征波長(zhǎng)的選擇,可以提高模型的預(yù)測(cè)精度,改善RF算法收斂速度慢、 迭代次數(shù)大、 運(yùn)行時(shí)間較長(zhǎng)等問(wèn)題。
表2 不同波長(zhǎng)選擇方法下模型的結(jié)果Table 2 Performance results of models with differentwavelength selection methods
圖5為預(yù)測(cè)集樣本的全譜-PLSR,RF-PLSR,IRIV-PLSR以及IRIV-RF-PLSR模型的農(nóng)機(jī)潤(rùn)滑油污染濃度的預(yù)測(cè)值與化學(xué)值的散點(diǎn)圖。從圖中可以清晰地觀測(cè)出,經(jīng)過(guò)改進(jìn)的IRIV-RF算法所選特征波長(zhǎng)建立的PLSR模型的預(yù)測(cè)效果最優(yōu)。
圖5 PLSR模型下農(nóng)機(jī)潤(rùn)滑油污染濃度的散點(diǎn)圖 (a):全譜-PLSR;(b):RF-PLSR;(c):IRIV-PLSR;(d):IRIV-RF-PLSRFig.5 Scatter plots of PLSR models for contamination concentration of agricultural machinery lubricating oil (a):Full spectrum-PLSR;(b):RF-PLSR;(c):IRIV-PLSR;(d):IRIV-RF-PLSR
配置不同污染濃度的農(nóng)機(jī)潤(rùn)滑油,并采集其近紅外光譜,結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)農(nóng)機(jī)潤(rùn)滑油污染濃度進(jìn)行檢測(cè)研究。提出了一種IRIV-RF特征波長(zhǎng)選擇算法,該算法的初始變量集為利用IRIV算法提取出的強(qiáng)信息變量和弱信息變量,保證了初始變量集中的變量均是對(duì)建模有益的有效信息變量,解決RF算法結(jié)果再現(xiàn)率較低、 算法迭代次數(shù)過(guò)多大以及運(yùn)行時(shí)間較長(zhǎng)等問(wèn)題。將改進(jìn)的IRIV-RF特征波長(zhǎng)選擇算法應(yīng)用于農(nóng)機(jī)潤(rùn)滑油污染濃度的光譜數(shù)據(jù)集中,通過(guò)對(duì)比全譜-PLSR,RF-PLSR,IRIV-PLSR以及IRIV-RF-PLSR四個(gè)模型的預(yù)測(cè)精度可以發(fā)現(xiàn),IRIV-RF-PLSR模型的建模效果最佳,預(yù)測(cè)精度最高,同時(shí)建模的復(fù)雜程度與算法運(yùn)行時(shí)間均有所降低。證明本文提出的IRIV-RF是一種有效的特征波長(zhǎng)選擇算法,近紅外光譜聯(lián)合改進(jìn)的IRIV-RF算法為農(nóng)機(jī)潤(rùn)滑油污染濃度的檢測(cè)提供了一種較為快速準(zhǔn)確且簡(jiǎn)便的方法,為鑒定潤(rùn)滑油品質(zhì)提供了一種新的思路。