殷昭寧
連云港潤(rùn)眾制藥有限公司,江蘇連云港 222069
近幾年,結(jié)合決策者的偏好解決多目標(biāo)優(yōu)化問(wèn)題,成為進(jìn)化計(jì)算領(lǐng)域的研究熱點(diǎn)之一。這是因?yàn)?,已有進(jìn)化多目標(biāo)優(yōu)化方法的目的是找到收斂性好且分布均勻的Pareto最優(yōu)解集,而在實(shí)際應(yīng)用中,往往僅需要找到一個(gè)最滿意解或最滿意區(qū)域。因此,和單目標(biāo)優(yōu)化問(wèn)題相比,在多目標(biāo)優(yōu)化中,有兩個(gè)同等重要的任務(wù):搜索Pareto優(yōu)化解和選擇最滿意解[1]。2個(gè)任務(wù)之間的先后關(guān)系決定了3種不同的方法:第一種是先決策后優(yōu)化方法,也稱為先驗(yàn)方法[2];第二種是先優(yōu)化再?zèng)Q策方法,也稱為后驗(yàn)方法[3];第三種是邊優(yōu)化邊決策方法,也稱為交互方法[4]。
與先驗(yàn)法和后驗(yàn)法相比,交互方法有如下3個(gè)優(yōu)點(diǎn)[1]:1)交互方法所需的偏好信息比先驗(yàn)方法簡(jiǎn)單得多;2)交互方法比后驗(yàn)方法需要更少的計(jì)算開銷;3)當(dāng)決策者控制搜索進(jìn)程時(shí),可以通過(guò)介入進(jìn)程了解潛在的候選解,對(duì)最終的選擇更加自信。因此,交互方法是一種解決實(shí)際多目標(biāo)優(yōu)化問(wèn)題非常有前景的方法。下面介紹近兩年有關(guān)交互方法的研究工作。
張華軍等提出一種最大化個(gè)人偏好的多目標(biāo)優(yōu)化進(jìn)化算法,首先采用加權(quán)法將多目標(biāo)優(yōu)化問(wèn)題轉(zhuǎn)化為單目標(biāo)優(yōu)化問(wèn)題,再利用遺傳算法進(jìn)行全局搜索,在滿足個(gè)人偏好約束條件下,每一代進(jìn)化結(jié)束后,通過(guò)求解一個(gè)約束優(yōu)化問(wèn)題,獲得能夠使種群綜合適應(yīng)度具有最大方差的權(quán)重組合,從而最大化個(gè)人偏好[4]。
Chen 等采用基于偏好導(dǎo)向的精英選擇策略選擇父代個(gè)體,從而提供給用戶更多接近其偏好的解[5]。
Chaudhuri和Deb提出一種解決多目標(biāo)優(yōu)化問(wèn)題的交互集成方法,該方法結(jié)合多種多目標(biāo)進(jìn)化算法和一些普遍且有效的多準(zhǔn)則決策方法,用邊優(yōu)化邊決策過(guò)程,開發(fā)了功能強(qiáng)大、使用靈活的交互多目標(biāo)優(yōu)化和決策進(jìn)化算法軟件[6]。
利用決策者關(guān)于目標(biāo)相對(duì)重要性的偏好信息,Rachmawati和 Srinivasan 提出了目標(biāo)相對(duì)重要性的數(shù)學(xué)模型和提取算法,并給出了將提取的偏好信息和NSGA-II結(jié)合的3種方法[7]。
從近2年的相關(guān)工作可以看出,在優(yōu)化過(guò)程中,定期與決策者交互,逐漸獲取其偏好信息,并構(gòu)建偏好函數(shù)的代理模型成為研究熱點(diǎn)。方法可分為3類:基于機(jī)器學(xué)習(xí)的方法、基于擬合的方法和基于偏好凸錐或多面體錐的方法。
結(jié)合基于事例的有監(jiān)督在線學(xué)習(xí)策略和進(jìn)化算法,Krettek等提出一個(gè)新的多目標(biāo)交互進(jìn)化優(yōu)化方法。決策者每隔n代參與決策,將當(dāng)前Pareto最優(yōu)解集聚類后,決策者對(duì)類中心兩兩比較,利用兩兩相似性學(xué)習(xí)決策者的偏好[8]。
Battiti 和 Passerini采用反應(yīng)搜索方法,提出一種多目標(biāo)交互進(jìn)化算法,該算法將在線機(jī)器學(xué)習(xí)作為自適應(yīng)優(yōu)化策略的組成部分,實(shí)現(xiàn)邊優(yōu)化邊學(xué)習(xí)[9]。
上述2種方法在優(yōu)化過(guò)程中逐漸獲取決策者的偏好信息,并用機(jī)器學(xué)習(xí)方法構(gòu)建決策者偏好的代理模型,以學(xué)習(xí)決策者的偏好,指導(dǎo)種群的后續(xù)進(jìn)化。
Deb等提出一種基于偏好的漸進(jìn)多目標(biāo)交互進(jìn)化算法。在進(jìn)化固定代數(shù)后,通過(guò)逐漸獲取決策者的偏好信息,構(gòu)建滿足該信息的嚴(yán)格增加價(jià)值函數(shù),利用基于偏好的占優(yōu)關(guān)系和終止條件,引導(dǎo)算法向最滿意解搜索。該方法可以得到?jīng)Q策者偏好的顯式表示,但需事先給出函數(shù)的類型[10]。
在文獻(xiàn)[10]的基礎(chǔ)上,Sinha等提出一個(gè)擬合用戶偏好價(jià)值函數(shù)的廣義多項(xiàng)式函數(shù),該函數(shù)的乘積項(xiàng)個(gè)數(shù)是任意可變的,這樣可以有效減少價(jià)值函數(shù)不能擬合決策者偏好的情形[11]。
上述2種方法利用決策者定期提供的偏好信息,用一個(gè)優(yōu)化過(guò)程擬合決策者的偏好,該方法可以得到?jīng)Q策者偏好的顯式表示,但需事先給出函數(shù)的類型。
Fowler等針對(duì)多目標(biāo)背包問(wèn)題,提出一種擬凹偏好函數(shù)的多目標(biāo)交互進(jìn)化優(yōu)化方法。該方法定期提交部分非被支配解給決策者,利用獲得的偏好信息生成偏好錐,對(duì)決策者沒(méi)有評(píng)價(jià)的非被支配解隱式排序,引導(dǎo)算法向決策者偏好的區(qū)域搜索,最終得到?jīng)Q策者的最滿意解[12]。
Sinha等利用多面體錐修改占優(yōu)關(guān)系,提出一個(gè)基于偏好的多目標(biāo)進(jìn)化優(yōu)化方法。通過(guò)逐漸獲取決策者的偏好信息不斷修改多面體錐,用該多面體錐縮減搜索空間,在感興趣區(qū)域中找到更好的優(yōu)化解[13]。
上述2種方法的共同特點(diǎn)是:不需要知道決策者偏好的顯式形式,利用決策者從候選解對(duì)應(yīng)的目標(biāo)函數(shù)值中選出的最差值或最好值和其他候選解對(duì)應(yīng)的目標(biāo)函數(shù)值,在目標(biāo)空間中構(gòu)建反映決策者偏好的凸錐或多面體錐,基于該隱式偏好函數(shù)改進(jìn)非被支配解的排序策略,將搜索集中在感興趣的區(qū)域。
在構(gòu)建偏好代理模型的方法中,前2種需要對(duì)所有候選解兩兩比較其優(yōu)劣,相比較而言,基于凸錐或多面體錐的方法,僅需要從候選解對(duì)應(yīng)的目標(biāo)函數(shù)值中選出最好值和最差值,該方法可以大大減輕決策者的比較負(fù)擔(dān),同時(shí)也可以避免因選擇合適顯式偏好函數(shù)而帶來(lái)的難題。因此,構(gòu)建反應(yīng)決策者偏好的多面體是值得進(jìn)一步研究的方向。
此外,雖然上面述及的方法可以有效解決實(shí)際多目標(biāo)優(yōu)化問(wèn)題,得到?jīng)Q策者的最滿意解,數(shù)值實(shí)驗(yàn)也證實(shí)了上述方法對(duì)很多目標(biāo)優(yōu)化問(wèn)題優(yōu)越的求解能力,但只適用于確定參數(shù)多目標(biāo)優(yōu)化問(wèn)題。對(duì)于區(qū)間參數(shù)多目標(biāo)優(yōu)化問(wèn)題,至今還沒(méi)有結(jié)合決策者偏好的求解方法,更不必說(shuō)邊優(yōu)化邊決策的方法。進(jìn)化計(jì)算的權(quán)威期刊《IEEE Transactions on Evolutionary Computation》 2010年10月特刊表明,以后的多目標(biāo)優(yōu)化算法將廣泛地在優(yōu)化過(guò)程中融入決策者的偏好信息[14]。因此,結(jié)合決策者偏好信息解決區(qū)間參數(shù)多目標(biāo)優(yōu)化問(wèn)題,是富有挑戰(zhàn)性和有意義的工作。
[1]Branke J., Deb K., Miettinen K., Slowinski R.. Multi-objective Optimization Interactive and Evolutionary Approaches (LNCS 5252)[M].Heidelberg:Springer, 2008.
[2]Zio E., Baraldi P., Pedroni N..Optimal power system generation scheduling by multi-objective genetic algorithms with preferences[J].Reliability Engineering and System Safety, 2009, 94(2): 432-444.
[3]Lee D.H., Kim K.J., Koksalan M..A posterior preference articulation approach to multiresponse surface optimization[J].European Journal of Operational Research, 2011, 210(2): 301-309.
[4]張華軍,趙金,王瑞.最大化個(gè)人偏好的多目標(biāo)優(yōu)化進(jìn)化算法[J].信息與控制,2010, 39(2): 212-217.
[5]Chen Z.H., Zhuang Z. Q., Huang F.H., Lee J.S..User-preference-oriented multi-objective optimization algorithm[C].In Proceedings of 2010 International Computer Symposium, 2010: 1045-1049.
[6]Chaudhuri S., Deb K..An interactive evolutionary multi-objective optimization and decision making procedure[J].Applied Soft Computing, 2010,10(2): 496-511.
[7]Rachmawati L., Srinivasan D..Incorporating the notion of relative importance of objectives in evolutionary multi-objective optimization[J].IEEE transactions on evolutionary computation, 2010, 14(4):530-546.
[8]Krettek J., Braun J., Hoffmann F., Bertram T., Ewald T., Schubert H.G., Lausch H..Interactive evolutionary multi-objective optimization for hHydraulic valve controller parameters[C].In Proceedings of the IEEE/ASME International Conference on Advanced Intelligent Mechatronics, 2009, 816-821.
[9]Battiti R., Passerini A..Brain computer evolutionary multiobjective optimization: A genetic algorithm adapting to the decision maker[J].IEEE transactions on evolutionary computation, 2010, 14(5):671-687.
[10]Deb K., Sinha A., Korhonen P., Wallenius J..An interactive evolutionary multi-objective optimization method based on progressively approximated value functions[R].Kanpur Genetic Algorithms Laboratory,Department of Mechanical engineering, Indian Institue of Technology, Kanpur, India, KanGAL Report Number 2009005, 2009.
[11]Sinha A., Deb K., Korhonen P., Wallenius J..Progressively interactive evolutionary multiobjective optimization method using generalized polynomial value functions[C].In Proceedings of the IEEE Congress on Evolutionary Computation, 2010: 1-8.
[12]Fowler J.W., Gel E.S., Koksalan M.M.,Korhonen P., Marquis J.L., Wallenius J..Interactive evolutionary multi-objective optimization for quasiconcave preference functions[J]. European Journal of Operational Research, 2010, 206(2): 417-425.
[13]Sinha A., Deb K., Korhonen P., Wallenius J..An interactive evolutionary multi-objective optimization method based on polyhedral cones[C].In Proceedings of Learning and Intelligent Optimization Conference,2010, 6073: 318-332.
[14]Deb K., Koksalan M..Guest Editorial: Special issue on preference-based multi-objective evolutionary algorithms[J].IEEE transactions on evolutionary computation, 2010, 14(5): 669-670.