張 峰,陳新中
(中國(guó)電子科技集團(tuán)公司第二十八研究所,江蘇 南京 210007)
許多實(shí)際工程優(yōu)化問(wèn)題,通常涉及同時(shí)優(yōu)化多個(gè)相互沖突的目標(biāo),此類(lèi)問(wèn)題可稱(chēng)為多目標(biāo)優(yōu)化問(wèn)題(Multiobjective Optimization Problem,MOP)[1-4]。在多目標(biāo)優(yōu)化問(wèn)題基礎(chǔ)上,存在一類(lèi)特殊的問(wèn)題,其目標(biāo)函數(shù)很難使用公式進(jìn)行簡(jiǎn)單計(jì)算,而是主要依賴(lài)大量耗時(shí)的仿真實(shí)驗(yàn)進(jìn)行計(jì)算,因而導(dǎo)致優(yōu)化的時(shí)間成本過(guò)于昂貴,此類(lèi)問(wèn)題可稱(chēng)為昂貴的多目標(biāo)優(yōu)化問(wèn)題(Expensive Multiobjective Optimization Problem,EMOP)[5]。
盡管在最近20 年間,研究者提出大量多目標(biāo)優(yōu)化算法以高效地求解各類(lèi)MOP,但由于多目標(biāo)優(yōu)化算法需要進(jìn)行大量的目標(biāo)函數(shù)評(píng)估才能達(dá)到理想的求解效果,EMOP每次計(jì)算目標(biāo)函數(shù)卻比較耗時(shí)。另外在求解EMOP 問(wèn)題時(shí),算法往往只能進(jìn)行少量的目標(biāo)函數(shù)評(píng)估,使得多目標(biāo)優(yōu)化算法難以高效地求解EMOP。
為了高效地求解EMOP,許多相關(guān)工作開(kāi)始嘗試在多目標(biāo)優(yōu)化算法框架基礎(chǔ)上,使用機(jī)器學(xué)習(xí)建立代理模型來(lái)輔助算法進(jìn)行評(píng)估。在此基礎(chǔ)上,涌現(xiàn)出不少專(zhuān)門(mén)為高效求解EMOP 而設(shè)計(jì)的代理輔助進(jìn)化算法[6]。
目前很少有相關(guān)工作回顧該領(lǐng)域的最新技術(shù),現(xiàn)有工作大多根據(jù)代理模型對(duì)代理輔助進(jìn)化算法進(jìn)行分類(lèi),通常將相關(guān)算法分為基于高斯過(guò)程的算法和基于非高斯過(guò)程的算法。雖然不同代理模型的特性不一樣,在預(yù)測(cè)不同類(lèi)型問(wèn)題的目標(biāo)值時(shí),預(yù)測(cè)質(zhì)量存在一定差異,但都可以用來(lái)求解相關(guān)類(lèi)型的問(wèn)題。在基于代理模型種類(lèi)的算法分類(lèi)下,通常難以直觀地了解不同類(lèi)型問(wèn)題的研究進(jìn)展。本文按連續(xù)昂貴多目標(biāo)優(yōu)化問(wèn)題的規(guī)模大小對(duì)相關(guān)算法進(jìn)行分類(lèi)梳理,說(shuō)明每類(lèi)問(wèn)題的特點(diǎn),分析每個(gè)算法的優(yōu)缺點(diǎn),以便人們能夠直觀地了解不同規(guī)模的連續(xù)昂貴多目標(biāo)優(yōu)化問(wèn)題研究進(jìn)展,方便后續(xù)開(kāi)展研究工作,或者選擇適合的算法求解相關(guān)問(wèn)題。
EMOP 是在MOP 的基礎(chǔ)上,計(jì)算目標(biāo)函數(shù)比較耗時(shí)的一類(lèi)MOP 問(wèn)題。為了方便理解,本文主要介紹MOP。為了更具有普遍性,給出最小化連續(xù)MOP 的數(shù)學(xué)定義如下:
其中,Ω ∈Rn稱(chēng)為n維決策空間,x=(x1,x2,...,xn)T稱(chēng)為一組決策變量,F(xiàn)(x):Ω →Rm則表示需要優(yōu)化的m個(gè)目標(biāo)函數(shù),Rm為目標(biāo)空間。下面給出一些關(guān)于MOP 的相關(guān)定義:
定 義1假 設(shè)x1,x2∈Ω,當(dāng)且僅當(dāng)?i∈1,...,m和?j∈1,...,m,都有fi(x1) ≤fi(x2)和fj(x1) <fj(x2)成立,則稱(chēng)x1Pareto 支配x2[7]。
定義2假設(shè)存在解集P,非支配解集PN是所有不被P中的解Pareto 支配的解集。
定義3?x*∈Ω,若不存在一個(gè)解能夠使Pareto 支配x*,則稱(chēng)x*是Pareto 的最優(yōu)解。
定義4在一個(gè)MOP 中,所有Pareto 的最優(yōu)解組成Pareto最優(yōu)解集(Pareto set,PS)。
定義5Pareto 最優(yōu)解集對(duì)應(yīng)的目標(biāo)向量稱(chēng)為Pareto 前沿(Pareto Front,PF)。
一般來(lái)說(shuō),許多機(jī)器學(xué)習(xí)方法,例如高斯過(guò)程[8-10]、多任務(wù)高斯過(guò)程[11-12]、神經(jīng)網(wǎng)絡(luò)[13-16]等,都可用來(lái)作為代理模型。算法通常都會(huì)從已評(píng)估過(guò)的解中挑選部分解來(lái)訓(xùn)練代理模型。
在通常情況下,許多代理模型對(duì)候選解的目標(biāo)值進(jìn)行預(yù)測(cè)時(shí),不僅會(huì)給出一個(gè)預(yù)測(cè)目標(biāo)均值,而且會(huì)給出一個(gè)預(yù)測(cè)目標(biāo)的方差。貝葉斯優(yōu)化[17]中的效用準(zhǔn)則不僅考慮到代理模型的預(yù)測(cè)目標(biāo)值,而且考慮到模型預(yù)測(cè)的不確定性,可用來(lái)更好地評(píng)估候選解,這對(duì)于提升算法的優(yōu)化性能有著重要意義。
常用的效用準(zhǔn)則有EI(Expected Improvement)效用準(zhǔn)則、LCB(Lower Confidence Bounder)效用準(zhǔn)則和 UCB(Upper Confidence Bounder)效用準(zhǔn)則。
EMOP 問(wèn)題的評(píng)價(jià)指標(biāo)[18]主要通過(guò)收斂性和多樣性來(lái)體現(xiàn)。算法在優(yōu)化EMOP 后,會(huì)得到一組解集與解集對(duì)應(yīng)的目標(biāo)向量。收斂性是指解集對(duì)應(yīng)的目標(biāo)向量距離Pareto Front 的遠(yuǎn)近程度,多樣性是指解集對(duì)應(yīng)的目標(biāo)向量覆蓋Pareto Front 的完整程度。
不同于多目標(biāo)優(yōu)化算法對(duì)產(chǎn)生的大量解進(jìn)行目標(biāo)函數(shù)評(píng)估,代理輔助進(jìn)化算法在多目標(biāo)優(yōu)化算法框架基礎(chǔ)上,使用機(jī)器學(xué)習(xí)建立代理模型來(lái)輔助算法評(píng)估大量的候選解。候選解可以理解為不經(jīng)過(guò)真實(shí)目標(biāo)函數(shù)評(píng)估的,由代理模型評(píng)估過(guò)的中間解。算法最后挑選出少量最有價(jià)值的候選解(最佳候選解)進(jìn)行目標(biāo)函數(shù)評(píng)估。反復(fù)迭代以上流程,滿(mǎn)足算法終止條件后,針對(duì)所有進(jìn)行目標(biāo)函數(shù)評(píng)估后的解集執(zhí)行非支配操作,將得到的結(jié)果作為EMOP的近似解集。代理輔助進(jìn)化算法工作流程如圖1所示。
首先,算法根據(jù)實(shí)際需要對(duì)相應(yīng)參數(shù)進(jìn)行初始化。接下來(lái)對(duì)算法進(jìn)行采樣,并對(duì)采樣得到的解進(jìn)行目標(biāo)函數(shù)評(píng)估。然后,在訓(xùn)練代理模型過(guò)程中,算法根據(jù)設(shè)計(jì)的策略,從已評(píng)估過(guò)的解中挑選出部分解作為訓(xùn)練樣本,以決策變量作為輸入,根據(jù)算法設(shè)計(jì)的需要選擇合適的目標(biāo)作為輸出,以訓(xùn)練代理模型。之后,算法將會(huì)產(chǎn)生大量候選解,并用代理模型進(jìn)行評(píng)估。算法先產(chǎn)生候選父代,根據(jù)父代產(chǎn)生候選子代,使用代理模型評(píng)估候選子代中的每個(gè)候選解。許多算法通常都會(huì)結(jié)合貝葉斯優(yōu)化中的效用準(zhǔn)則以更好地評(píng)估候選解。上面的過(guò)程通常會(huì)反復(fù)迭代,滿(mǎn)足終止條件后則進(jìn)行下一步驟。最后,挑選最佳候選解主要是從代理模型評(píng)估過(guò)的大量候選解中,根據(jù)算法設(shè)計(jì)的選解策略,挑選出少量最有價(jià)值的候選解進(jìn)行目標(biāo)函數(shù)評(píng)估。反復(fù)以上流程,直到滿(mǎn)足終止條件(通常指當(dāng)前目標(biāo)函數(shù)的評(píng)估次數(shù)達(dá)到最大允許值)則停止。
由于代理輔助進(jìn)化算法的目標(biāo)函數(shù)評(píng)估次數(shù)一般很少,算法通常對(duì)所有評(píng)估過(guò)的解進(jìn)行取非支配操作,得到一組非支配解集,這組解集則作為EMOP 的求解結(jié)果。
本文根據(jù)EMOP 的規(guī)模大小,將相關(guān)算法分成處理小規(guī)模EMOP 的代理輔助進(jìn)化算法和處理中大規(guī)模EMOP 的代理輔助進(jìn)化算法。EMOP 的規(guī)模大小主要由決策變量數(shù)決定,代理模型雖然對(duì)于不同類(lèi)型問(wèn)題的預(yù)測(cè)質(zhì)量存在差異,但這并不意味著代理模型只適合求解某一類(lèi)問(wèn)題。
Fig.1 Workflow of surrogate-assisted evolutionary algorithm圖1 代理輔助進(jìn)化算法工作流程
一般稱(chēng)決策變量數(shù)較少的EMOP 為小規(guī)模EMOP(如決策變量數(shù)小于10),通常求解此類(lèi)問(wèn)題的目標(biāo)函數(shù)評(píng)估次數(shù)也較少(如目標(biāo)函數(shù)評(píng)估總次數(shù)一般在300 次以?xún)?nèi))。在小規(guī)模EMOP 問(wèn)題上,高斯過(guò)程作為代理模型會(huì)擁有比較高的預(yù)測(cè)質(zhì)量,并且高斯過(guò)程不但可以提供預(yù)測(cè)目標(biāo)均值,而且可以提供預(yù)測(cè)目標(biāo)方差,能夠結(jié)合貝葉斯優(yōu)化的效用準(zhǔn)則提升優(yōu)化性能。因此,選擇高斯過(guò)程作為代理模型來(lái)求解此類(lèi)問(wèn)題成為當(dāng)前的一種流行方法。下面介紹一些主要用來(lái)求解小規(guī)模EMOP 的算法。
NSGA-II 雖然屬于多目標(biāo)優(yōu)化算法,但在解決目標(biāo)變量數(shù)較少的EMOP 上有著良好效果,NSGA-II 也經(jīng)常出現(xiàn)在求解EMOP 的對(duì)比算法中[19]。NSGA-II 主要通過(guò)對(duì)當(dāng)前種群進(jìn)行交叉變異產(chǎn)生子代,再通過(guò)非支配排序和計(jì)算擁擠距離來(lái)更新種群,借此不斷逼近EMOP 的Pareto Front。
Knowles[20]提出的ParEGO 主要使用一組均勻的權(quán)重向量將EMOP 劃分成多個(gè)單目標(biāo)子問(wèn)題,通過(guò)優(yōu)化每個(gè)子問(wèn)題的最優(yōu)解來(lái)近似得出一組EMOP 的最優(yōu)解。ParEGO實(shí)現(xiàn)過(guò)程簡(jiǎn)單,并對(duì)許多類(lèi)型的EMOP 都能取得良好效果,但ParEGO 在一次子問(wèn)題優(yōu)化過(guò)程中,更多地考慮優(yōu)化一個(gè)子問(wèn)題聚合函數(shù)本身,而不是優(yōu)化整個(gè)EMOP 問(wèn)題。此外,ParEGO 一次迭代只能產(chǎn)生一個(gè)最佳候選解,從而導(dǎo)致ParEGO 求解EMOP 的時(shí)間過(guò)長(zhǎng)。
Ponweiser 等[21]提出的SMS-EGO 采用協(xié)方差矩陣自適應(yīng)進(jìn)化策略?xún)?yōu)化一種超體積指標(biāo),以決定挑選哪個(gè)候選解進(jìn)行評(píng)估,以此不斷逼近EMOP 的真實(shí)Pareto Front。SMS-EGO 一次迭代同樣只能產(chǎn)生一個(gè)最佳候選解,并且隨著EMOP 優(yōu)化目標(biāo)數(shù)的上升,超體積指標(biāo)的計(jì)算會(huì)變得十分復(fù)雜,從而導(dǎo)致算法求解EMOP 的時(shí)間過(guò)長(zhǎng)。因此,SMS-EGO 在求解優(yōu)化目標(biāo)數(shù)較少的EMOP 時(shí)能取得良好效果,而不適合用來(lái)求解優(yōu)化目標(biāo)數(shù)過(guò)多的EMOP 問(wèn)題。
針對(duì)一次優(yōu)化只能評(píng)估一個(gè)最佳候選解的缺點(diǎn),在MOEA/D-DE[22]基 礎(chǔ)上,Zhang 等[23]提出MOEA/D-EGO。MOEA/D-EGO 通過(guò)一組均勻的權(quán)重向量把EMOP 劃分成多個(gè)子問(wèn)題,MOEA/D-EGO 通過(guò)同時(shí)優(yōu)化全部子問(wèn)題的最佳候選解,并將所有子問(wèn)題聚類(lèi)成多個(gè)簇,挑選出每個(gè)簇的最佳候選解來(lái)逼近EMOP 的Pareto Front。MOEA/DEGO 在一次優(yōu)化中會(huì)得到多個(gè)最佳候選解,支持使用并行技術(shù)同時(shí)評(píng)估多個(gè)最佳候選解,能有效縮短算法求解EMOP 的時(shí)間。在優(yōu)化子問(wèn)題時(shí),子問(wèn)題的鄰居間進(jìn)行相互協(xié)作,有助于提升最佳候選解的質(zhì)量。MOEA/D-EGO在求解大多數(shù)EMOP 時(shí)都能取得比較理想的效果,但在一些特殊問(wèn)題上,算法效果欠佳,比如優(yōu)化目標(biāo)數(shù)超過(guò)3 的EMOP 等。
針對(duì)目標(biāo)數(shù)超過(guò)3 的EMOP 優(yōu)化,在RVEA[24]基礎(chǔ)上,Chugh 等[25]提出了K-RVEA。K-RVEA 采用一組自適應(yīng)權(quán)重向量將一個(gè)EMOP 劃分成多個(gè)子問(wèn)題,K-RVEA 同時(shí)優(yōu)化所有子問(wèn)題的最佳候選解,并根據(jù)代理模型預(yù)測(cè)結(jié)果的不確定性、權(quán)重向量分布情況和候選解分布情況,以權(quán)衡算法的收斂性和多樣性。此外,K-RVEA 還提出一種挑選部分解來(lái)訓(xùn)練代理模型的策略,該策略不僅能保證代理模型的預(yù)測(cè)精度,而且能對(duì)代理模型的訓(xùn)練時(shí)間進(jìn)行限制。實(shí)驗(yàn)結(jié)果表明,K-RVRA 在優(yōu)化目標(biāo)數(shù)超過(guò)3 的EMOP 問(wèn)題上取得了理想效果。
同樣的,針對(duì)目標(biāo)數(shù)大于3 的EMOP 優(yōu)化,Pan 等[26]提出了CSEA。Pan 等認(rèn)為隨著優(yōu)化目標(biāo)數(shù)的增加,代理模型近似目標(biāo)函數(shù)的計(jì)算成本將會(huì)變高,因此使用代理模型預(yù)測(cè)解之間的支配關(guān)系會(huì)比較適合。CSEA 最終采用神經(jīng)網(wǎng)絡(luò)建立代理模型,并使用代理模型預(yù)測(cè)候選解與參考解之間的支配關(guān)系。算法根據(jù)代理模型預(yù)測(cè)的不確定性和支配關(guān)系挑選候選解進(jìn)行評(píng)估,最終不斷逼近EMOP 的Pareto Front。在求解優(yōu)化目標(biāo)數(shù)3 及其以上的EMOP 時(shí),CSEA能夠取得理想效果。
由于一次優(yōu)化產(chǎn)生多個(gè)最佳候選解可以結(jié)合并行技術(shù)同時(shí)進(jìn)行評(píng)估,從而顯著減少求解EMOP 的時(shí)間,對(duì)于求解時(shí)間要求高的應(yīng)用場(chǎng)景具有比較重要的意義。Lin等[27]提出的MOBO/D 首先通過(guò)一組均勻的權(quán)重向量把一個(gè)EMOP 分解成一組子問(wèn)題,隨后采用MOEA/D-DE 優(yōu)化出一個(gè)候選種群,并進(jìn)一步使用IGD 指標(biāo)[28]批量挑選出多個(gè)最佳候選解進(jìn)行評(píng)估。通過(guò)這些方法可保證算法的收斂性和多樣性,因此MOBO/D 在多數(shù)EMOP 問(wèn)題上都能夠取得良好效果。隨后,Zhang 等[29]在網(wǎng)格約束分解基礎(chǔ)上提 出BCDG(A Batched Constrained Decomposition with Grids)。BCDG 采用CDG-MOEA[30]優(yōu)化出一個(gè)候選種群,隨后根據(jù)hypervolume 指標(biāo)[31]批量挑選出一些最佳候選解進(jìn)行評(píng)估,通過(guò)hypervolume 指標(biāo)可有效引導(dǎo)搜索方向。BCDG 在求解一些Pareto Front 形狀比較復(fù)雜的EMOP 時(shí)存在一定優(yōu)勢(shì)。
隨著機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,一部分現(xiàn)有工作開(kāi)始借鑒遷移學(xué)習(xí)的一些方法和思想,并將這些方法或思想應(yīng)用到代理輔助進(jìn)化算法設(shè)計(jì)中,借此提升算法的優(yōu)化性能。
Le 等[32]提出一種交叉代理輔助模因算法CSAMA,CSAMA 首先訓(xùn)練其他目標(biāo)函數(shù)上的代理模型,然后使用訓(xùn)練樣本在其他代理模型上的預(yù)測(cè)結(jié)果構(gòu)建將要進(jìn)行目標(biāo)函數(shù)預(yù)測(cè)的目標(biāo)代理模型,借此提升目標(biāo)代理模型的預(yù)測(cè)質(zhì)量。CSAMA 在求解目標(biāo)函數(shù)相關(guān)的EMOP 時(shí)可取得比較理想的效果,然而許多EMOP 的目標(biāo)函數(shù)間普遍缺乏相關(guān)性,因此CSAMA 不具有普遍性。
針對(duì)EMOP 目標(biāo)函數(shù)缺乏普遍的相關(guān)性的問(wèn)題,Luo等[33]提出的GCS-MOE 同樣使用一組均勻的權(quán)重向量將一個(gè)EMOP 劃分成許多相關(guān)子問(wèn)題,并進(jìn)一步將一些相關(guān)子問(wèn)題劃分成一個(gè)任務(wù)組。由于從同一個(gè)EMOP 分解出的子問(wèn)題具有普遍的相關(guān)性,因此可更好地結(jié)合多任務(wù)學(xué)習(xí)方法優(yōu)化EMOP。針對(duì)多個(gè)相關(guān)任務(wù)組,GCS-MOE 采用多任務(wù)高斯過(guò)程建立代理模型,算法同時(shí)優(yōu)化多個(gè)相關(guān)任務(wù)組的最佳候選解,以不斷逼近整個(gè)EMOP 的Pareto Front。此外,GCS-MOE 還提出一種組合效用準(zhǔn)則,并為每個(gè)任務(wù)組的訓(xùn)練樣本提供一種選擇和維護(hù)策略。在求解目標(biāo)數(shù)小于4 且決策變量數(shù)不多的EMOP 上,算法取得了理想效果。
針對(duì)現(xiàn)有算法將分解后的子問(wèn)題劃分成多個(gè)固定任務(wù),未能充分體現(xiàn)任務(wù)間相關(guān)性的問(wèn)題,蔡昕燁等[34]提出了AMMCS。AMMCS 同樣使用一組均勻的權(quán)重向量,把一個(gè)EMOP 劃分成許多相關(guān)的子問(wèn)題后,通過(guò)一種相關(guān)性度量指標(biāo)將這些子問(wèn)題動(dòng)態(tài)劃分成多個(gè)相關(guān)任務(wù)目標(biāo)。AMMCS 同樣采用多任務(wù)高斯過(guò)程作為代理模型,并使用多種群協(xié)作搜索技術(shù)同時(shí)優(yōu)化出多個(gè)相關(guān)任務(wù)目標(biāo)的最佳候選解,不斷逼近EMOP 的Pareto Front。AMMCS 在簡(jiǎn)單、常規(guī)的EMOP 上能取得理想效果,但由于預(yù)先設(shè)置固定的方向向量和代理模型預(yù)測(cè)質(zhì)量問(wèn)題,AMMCS 在一些Pareto Front 形狀不規(guī)則或者比較復(fù)雜的EMOP 上效果不夠理想。
一般稱(chēng)決策變量數(shù)較多的EMOP 為中大規(guī)模EMOP,此類(lèi)問(wèn)題通常需要較多的目標(biāo)函數(shù)評(píng)估次數(shù)才能進(jìn)行有效求解(如目標(biāo)函數(shù)評(píng)估總次數(shù)通常超過(guò)300)。隨著決策變量數(shù)的增加,高斯過(guò)程的預(yù)測(cè)質(zhì)量會(huì)受到影響,并且由于能夠獲取較多已評(píng)估過(guò)的解,訓(xùn)練樣本相應(yīng)變得更為豐富。在中大規(guī)模EMOP 的目標(biāo)值預(yù)測(cè)上,一些機(jī)器學(xué)習(xí)模型的預(yù)測(cè)質(zhì)量比高斯過(guò)程的預(yù)測(cè)質(zhì)量更有競(jìng)爭(zhēng)力。因此,現(xiàn)有部分算法嘗試使用一些非高斯過(guò)程的機(jī)器學(xué)習(xí)模型作為代理模型,或者尋找別的方法彌補(bǔ)高斯過(guò)程的不足。目前能夠高效求解中大規(guī)模EMOP 的相關(guān)方法較少,主要有以下方法:
針對(duì)決策變量數(shù)較多的中規(guī)模EMOP,Lin 等[35]提出一種可拓展的代理輔助進(jìn)化算法BS-MOBO。BS-MOBO采用貝葉斯神經(jīng)網(wǎng)絡(luò)建立代理模型,并在monte carlo 抽樣和sobolov 訓(xùn)練的支持下,能夠輕松訓(xùn)練貝葉斯神經(jīng)網(wǎng)絡(luò)來(lái)輔助算法評(píng)估。BS-MOBO 使用MOEA/D 優(yōu)化出一個(gè)候選種群,并根據(jù)一種貪婪策略和超體積指標(biāo)批量挑選出多個(gè)最佳候選解進(jìn)行評(píng)估,以此保證算法的收斂性和多樣性[36]。值得一提的是,在求解小規(guī)模EMOP 問(wèn)題上,BSMOBO 也可以選用高斯過(guò)程作為代理模型,可獲得理想的效果。BS-MOBO 的算法性能依賴(lài)于一個(gè)批量評(píng)估最佳候選解的參數(shù),該參數(shù)在不同優(yōu)化問(wèn)題中,或者在一個(gè)完整優(yōu)化過(guò)程的不同優(yōu)化階段很可能是不固定的,固定的參數(shù)設(shè)置很可能會(huì)影響B(tài)S-MOBO 的算法性能。
針對(duì)中規(guī)模的EMOP,Ruan 等[37]在高斯過(guò)程基礎(chǔ)上提出了SAEA/ME。SAEA/ME 挑選相關(guān)的決策變量而非全部決策變量參與構(gòu)建代理模型,并將原來(lái)的EMOP 轉(zhuǎn)換為基于代理模型的新問(wèn)題,同時(shí)開(kāi)發(fā)出一種子集選擇方法挑選出最佳候選解進(jìn)行評(píng)估,并更新訓(xùn)練樣本集。SAEA/ME 在求解決策變量數(shù)較多(如決策變量數(shù)在10~50 之間)的EMOP 時(shí)有著理想效果。由于SAEA/ME 使用NSGA-II 來(lái)優(yōu)化EMOP,在面對(duì)優(yōu)化目標(biāo)數(shù)超過(guò)3 的EMOP 時(shí),SAEA/ME 存在一定的爭(zhēng)議,并且研究其他降維技術(shù)來(lái)減輕代理模型構(gòu)建中的維數(shù)災(zāi)難,對(duì)SAEA/ME 也有著較重要的意義。
代理輔助進(jìn)化算法使用機(jī)器學(xué)習(xí)方法建立代理模型來(lái)輔助算法評(píng)估候選解,成為求解昂貴多目標(biāo)優(yōu)化問(wèn)題的一種流行方法。因此,對(duì)代理輔助進(jìn)化算法的最新研究進(jìn)展進(jìn)行分類(lèi)總結(jié)是一個(gè)很有必要的工作。本文根據(jù)問(wèn)題規(guī)模大小將相關(guān)算法分成兩類(lèi)進(jìn)行闡述,并分析與比較相應(yīng)算法的優(yōu)缺點(diǎn),希望人們能夠從中直觀地了解不同規(guī)模的連續(xù)昂貴多目標(biāo)優(yōu)化問(wèn)題研究現(xiàn)狀,方便后續(xù)研究工作的開(kāi)展。