楊二波 陳 明
大連理工大學船舶CAD工程中心,遼寧大連116024
船舶主尺度方案的博弈優(yōu)選
楊二波 陳 明
大連理工大學船舶CAD工程中心,遼寧大連116024
優(yōu)化選擇的船舶主尺度方案需要具有較好的經(jīng)濟性、技術性能,而博弈論是研究解決、優(yōu)化決策選擇的科學,根據(jù)船舶主尺度方案優(yōu)選問題與經(jīng)濟學中博弈問題之間的相似性,從博弈的觀點確定了船舶設計中的博弈方及其對應的策略空間,即各設計目標視為博弈問題博弈方;設計變量集合視為所有博弈方的戰(zhàn)略集組合,從而提出了船舶主尺度方案優(yōu)選設計問題的博弈方法。通過實例應用表明,合作博弈論方法能更好地綜合反映設計目標的要求,優(yōu)選結(jié)果更加合理。
船舶設計;船舶主尺度;多目標優(yōu)化;博弈論
船舶主尺度方案的確定是進行船舶設計的首要工作,在設計中往往需要兼顧船舶的技術指標和經(jīng)濟指標以求達到最優(yōu)的設計[1]。在進行總體設計時,設計人員根據(jù)設計任務書要求,大致確定出各主尺度要素可取的范圍區(qū)間,通過在該區(qū)間中任意取值可相互組合成一艘船舶的主尺度方案。由于方案較多,因此如何根據(jù)設計要求和限制條件選擇較好的船舶主尺度方案就成了后續(xù)設計的關鍵。博弈論的本質(zhì)是研究解決、優(yōu)化決策選擇的科學[2],根據(jù)博弈論思想,可將船舶設計者設置為局外人,把各個設計目標作為博弈方,目標設計變量看作是博弈論中的策略,而各目標在某一方案下的值即可與博弈論中在一定條件下的博弈方得益作對應。一旦目標條件確定,則策略也隨之確定,同時也產(chǎn)生了相應的得益。通過博弈選擇,可以得到對應船型優(yōu)選目標決策問題的博弈解,而設計者作為局外人根據(jù)實際偏好與效用情況,從博弈解中選取滿意解。由此可以把船舶主尺度方案優(yōu)選問題與博弈論問題本質(zhì)上聯(lián)系在一起。
本文根據(jù)船舶主尺度方案優(yōu)選設計問題與經(jīng)濟學中博弈問題之間的相似性,從博弈的觀點提出船舶多目標優(yōu)化設計問題的博弈方法,并結(jié)合工程實例進行了討論。
根據(jù)各博弈方追求得益的行為方式不同[3],博弈可分為非合作博弈[4]和合作博弈[5]。
非合作博弈是指所有博弈方均以個人理性為原則,以競爭為行為方式,以自身得益的最佳為決策目標,各博弈方通過獨立行動確定所采取的策略使自己的收益達到最大化,其結(jié)果可能對其他博弈方不利。典型模型有Nash均衡模型和Stackelberg寡頭博弈模型,其中Nash均衡模型適用于各目標的地位平等,即決策者無目標偏好,且各目標利益的依存關系為競爭的情況;Stackelberg寡頭模型適用于各目標的地位不平等,決策者存在目標偏好,且各目標利益的依存關系為競爭的問題。
合作博弈是指所有博弈方均以集體理性為原則,以合作為行為方式,各博弈方組成聯(lián)盟,通過協(xié)商,共同確定所要采取的策略,以追求整體得益的最佳為決策目標,其結(jié)果對各博弈方來說不一定是其最優(yōu)結(jié)果,但一定是可以接受的相對較優(yōu)的結(jié)果,即合作博弈結(jié)果是一個Pareto最優(yōu)解,典型模型為合作博弈模型,一般適用于各目標的地位平等,且決策者比較關注整體得益,希望各目標利益的依存關系為合作競爭,通過在競爭中合作的形式實現(xiàn)整體得益問題。
2.1 Nash均衡的定義
在博弈G={S1,S2…,Sm;u1,u2…,um}中,由每個博弈方的各一個策略組成的策略組合 {s1*,s2*,…,sm*},若任一博弈方i的策略si*都是對其余博弈方策略組合{s1*,…,si-1*,si+1*,…,sm*}的最佳對策,即使得益函數(shù)ui(s1*,…,si*,…,sm*)≤ui(s1*,…, sij,…,sm*)對任意sij∈Si都成立,則稱{s1*,s2*,…, sm*}為博弈G的一個“Nash均衡”。
2.2 Nash均衡的求解步驟
1)在各博弈方的策略空間S1,S2…,Sm中隨機生成初始可行策略,形成策略組合s0={s10,s20,…,sm0}。
3)令策略組合s1=s1*∪s2*∪…∪sm*,檢驗s1的可行性。若不滿足,轉(zhuǎn)步驟1);若滿足,計算前后2個策略組合之間的距離(一種范數(shù))是否滿足收斂準則‖s1-s0‖≤ε,若滿足,則博弈結(jié)束,若不滿足,則以s1替換s0,轉(zhuǎn)步驟1)進行循環(huán)。
2.3 Stackelberg策略的定義
設uS,uW分別為強、弱勢方的博弈得益,SS,SW為強、弱勢博弈方的策略空間,sS∈SS,sW∈SW為強、弱勢博弈方采取的策略。若成立,則稱sS*∈SS強勢博弈方的Stackelberg策略,強勢博弈方得益為uS*=其中,R(sS)={sW*∣uW(sS, sW*)≤uW(sS,sW),sW∈SW}稱為弱勢博弈方對強勢博弈方策略的有理反應集。
2.4 Stackelberg策略的求解步驟
1)在強、弱勢博弈方的策略空間中隨機生成初始可行策略組合
由于在Stackelberg模型中分強勢博弈方和弱勢博弈方,所以各自博弈得益的受滿足程度不同,強勢博弈方較弱勢博弈方而言,將在博弈中獲得較高得益和較理想的滿足度。根據(jù)Stackelberg模型的這一特征,可將其用來處理具有目標偏好的船型方案優(yōu)選,將偏好目標作為強勢博弈方,而其他目標作為弱勢博弈方。
2.5 合作博弈模型
在合作博弈中,各博弈方之間以集體理性為基礎,共同遵守某個具有合作性的約束力協(xié)議,即提倡各博弈方在得益函數(shù)構造中考慮其他博弈方的得益,形成共謀機制,將自身目標函數(shù)和其他博弈方目標函數(shù)組合起來作為博弈的得益函數(shù)。為了簡化合作競爭均衡的求解,本文采用模糊綜合評判法[6]分別對各博弈方的設計目標進行模糊賦權使多目標博弈問題轉(zhuǎn)換為單目標博弈問題,即選取表征船型方案質(zhì)量優(yōu)劣的指標作為評判依據(jù)構成單目標評價指標,然后進行進一步的優(yōu)化選擇。共謀合作模型的求解步驟如下:
1)先求出各設計目標
對應的最小值umin,i和最大值umax,i。ui(S)為博弈方i得益的目標函數(shù),gj(S)≤0為不等式約束條件,hk(S)=0為等式約束條件。
2)對不同決策下的得益ui(S)進行模糊評價[7]:
滿意度隨評價指標值單調(diào)增加的情況:
滿意度隨評價指標值單調(diào)減少的情況:
3)根據(jù)實際設計要求或?qū)<医?jīng)驗對各評價指標Ai(S)在整體得益中占的地位評價為bi,并構造博弈方單目標得益函數(shù)U(S),得:
其中,A=(A1(S),A2(S),…,Am(S)),B=(b1,b2,…,bm),b1+b2+…+bm=1。
4)在各博弈方的策略空間S1,S2…,Sm中隨機生成初始可行策略,形成策略組合s0={s10,s20,…,sm0}。
6)令策略組合s1=s1*∪s2*∪…∪sm*,檢驗s1的可行性。若不滿足,轉(zhuǎn)步驟4);若滿足,計算前后2個策略組合之間的距離(一種范數(shù))是否滿足收斂準則‖s1-s0‖≤ε,若滿足,則博弈結(jié)束,若不滿足,則以s1替換s0,轉(zhuǎn)步驟4)進行循環(huán)。
將設計變量集合X分解為各博弈方擁有的策略空間S1,…,Sm是將船舶主尺度方案優(yōu)選問題轉(zhuǎn)化為博弈問題的關鍵技術。本文通過計算設計變量對各博弈方得益的影響因子指標,并對該指標進行模糊聚類[8],得到隸屬于各博弈方的策略空間S1,…,Sm。計算步驟為:
1)分別對m個目標進行單目標優(yōu)化,得到優(yōu)化解u1(X1*),u2(X2*),…,um(Xm*),其中Xi*={x1i*, x2i*,…,xni*},i=1,2,…,m。 記為x1i*,x2i*,…,xni*在策略Xi*中相應的補集。
2)定義第j個設計變量xj對第i個博弈方ui(X)影響因子若無法直接通過求目標函數(shù)偏導得到影響因子的,可采用下面的數(shù)值方式計算:對任意設計變量xj,在其可行空間中按步長δxj等分為T段,則設計變量xj對第i個博弈方ui(X)的影響因子δji為:
3)令分類樣品為δj={δj1,…,δjm}(j=1,…, n),δj的意義是任意第j個設計變量對所有m個目標的影響因子集合。分類樣品全體為δ={δ1,δ2,…,δn},對其進行模糊聚類,將設計變量集合X分類為各博弈方的策略空間S1,S2…,Sm。
在處理多目標問題時,可根據(jù)實際需求將偏好的目標或?qū)?yōu)選結(jié)果有重大影響的代表性指標作為目標函數(shù),其它指標可處理為約束條件或暫不考慮。為了便于進行船型方案優(yōu)選需對設計問題進行分析加工,確定出設計變量,建立目標函數(shù)及約束條件,并把目標函數(shù)及約束條件同設計變量之間的函數(shù)關系明確地表達出來,然后將其轉(zhuǎn)化為博弈問題。
1)設計變量
在船舶優(yōu)化設計中,設計變量主要有船長L,船寬B,吃水T,型深D,方形系數(shù)CB,舯剖面系數(shù)Cm,水線面系數(shù)CW,浮心縱向位置XC,主機功率PB,航速V等指標,則可選其設計變量集合為X= {L,B,T,D,CB}。
2)約束條件
約束條件通常有兩類[9]。
一類是自變量的邊界約束,給出自變量可取值范圍的上下限。主尺度需滿足以下要求:
另一類約束條件是性能約束,給出對技術指標或經(jīng)濟指標的約束:
3)目標函數(shù)
本文確立了該油船的性能的評價指標船速V、投資回收期PBP為主要評價指標。V與PBP可看作是兩個博弈方,而他們的目標函數(shù)即為得益函數(shù)。
(1)船速V
V越高,具有的優(yōu)勢也就更大。目標函數(shù)為
Δ為船舶排水量。
(2)投資回收期PBP
在預定的投資收益率下,PBP最低的方案為最優(yōu),最具有競爭力,承擔的風險也最小。取目標函數(shù)[10]:
A為年收益,i為預期投資收益利率。
4)策略空間確定及博弈結(jié)果
設計變量集為S={L,B,T,D,CB},博弈方集為(船速V,投資回收期PBP)。模糊聚類結(jié)果:
則取船速V策略空間S1={T,CB},投資回收期PBP策略空間S2={L,B,D}。
下表是分別采用合作博弈模型、具有不同策略的Nash博弈模型,V寡頭博弈及PBP寡頭博弈模型和層次分析法計算的結(jié)果,其中Nash博弈模型1的博弈方V的策略空間為{T,D,CB},PBP的策略空間為 {L,B};Nash博弈模型2的博弈方V的策略空間為 {L,B,CB},PBP的策略空間為{T, D};Nash博弈模型3的博弈方V的策略空間為{B,D},PBP的策略空間為{L,T,CB};Nash博弈模型4的博弈方V的策略空間為 {T,CB},PBP的策略空間為{L,B,D}。
從表1中可以看出:
1)與常規(guī)優(yōu)化方法層次分析法及其他博弈模型相比利用合作博弈模型能夠兼顧多個船舶設計指標要求,得到相對較好的總體收益,則最優(yōu)策略為L=260 m,B=42 m,T=15.1 m,D=25 m, CB=0.818。
2)寡頭博弈能夠得到較好的船速V或投資回收期PBP。
3)博弈方策略空間的選擇對Nash博弈結(jié)果影響較大,通過模糊聚類得到的博弈方策略空間使Nash博弈均衡解較好,但不能使單個設計目標或整體性能達到最優(yōu)。
本文以船速、投資回收期等為主要設計目標建立了某油船主尺度方案優(yōu)選模型,并提出了博弈解法。通過實際應用表明:合作博弈論方法能更好地綜合反映各優(yōu)化目標的要求,優(yōu)選結(jié)果更加合理;在設計目標有偏好時,寡頭博弈能夠更好的滿足要求;若要得到較好的Nash博弈均衡解需進行模糊聚類來得到各博弈方的策略空間。從另一方面可知,不同的博弈模型反映了不同的設計人員和部門在對不同的設計目標進行方案選擇的情形,因此為了較好的滿足設計要求,各船舶設計部門必須加強交流和合作。
船舶設計是一個逐步近似,螺旋上升的過程,初步設計只考慮少數(shù)最主要的因素,后一步則計入較多的因素,反復的補充、修正和發(fā)展,直到得到較好符合要求的設計。本文根據(jù)母型船統(tǒng)計資料用統(tǒng)計回歸公式得到的模型及確定的主尺度可行空間,可保證得到的船舶主尺度方案優(yōu)選在一定程度上滿足船舶阻力等指標,和后續(xù)船舶結(jié)構和布置等方面的設計要求,但對其產(chǎn)生怎樣的影響還有待于在未來的工作中進行研究。
[1] 李樹范,紀卓尚,王世連,運輸船舶可行性分析[M].大連:大連理工大學出版社,1990.
[2] 董雨,胡興祥,陳景雄.多目標決策問題的博弈論方法初探[J].運籌與管理,2003,12(6):35-39.
[3] 謝識予.經(jīng)濟博弈論[M].上海:復旦大學出版社,2002.
[4] NASH J.Equilibrium points in n-person Games[J].Proceeding of the National Academy of Seienees of the United States of America,1950,36(1):48-49.
[5] VON NEUMANN J,MORGENSTERN O.Theory of games and economic behavior[M].Princeton University Press, 2004.
[6] 劉亞相,孫洪罡.多目標博弈的模糊求解法[J].西北農(nóng)林科技大學學報,2004,32(10):149-152.
[7] 楊二波,陳明.基于博弈論的船型優(yōu)化[C]//2008中國大連國際海事論壇論文集,2009.
[8] 張弢,紀德云.模糊聚類分析法 [J].沈陽大學學報, 2000,12(2):73-79.
[9] 王世連,劉寅東.船舶設計原理[M].大連:大連理工大學出版社,2000.
Optimization Design of Ship Principal Dimensions Based on the Game Theory
Yang Er-bo Chen Ming
Ship CAD Engineering Center,Dalian University of Technology,Dalian 116024,China
Optimization design models of VLCC principal dimensions should have advantages in the application both technically and economically,The Game Theory is the science of investigation and solution to optimize decision-making.Based on the similarities between optimization of ship principal dimensions and the Game Theory problems in economics,this paper sets the game players and their corresponding strategic options in ship design from the perspective of the Game Theory.The design goals are treated as game players and the design variables as each game player's strategies,thus the gaming method of the multi-objective optimal design is presented.The application of the Game Theory to the practical optimization of ship design demonstrates that the cooperation-competition model is able to comprehensively reflect the requirement of each ship design and make the optimized result more reasonable. Key words:ship design;principal dimensions;multi-objective optimization;game theory
U662.2
A
1673-3185(2010)06-46-05
10.3969/j.issn.1673-3185.2010.06.009
2009-09-15
楊二波(1982-),男,碩士研究生。研究方向:智能船舶CAD與集成信息系統(tǒng)。E-mail:fantasy221@163.com
陳 明(1972-),男,教授,碩士生導師。研究方向:智能船舶CAD與集成信息系統(tǒng)。
E-mail:chenming@dlut.edu.cn