許 潔,張 瑞,藺瑞強
隨著最優(yōu)控制理論的不斷深入研究,微分對策問題也得到了人們的廣泛關(guān)注,穆蕊[1]研究了多人非零和隨機微分博弈理論及其相關(guān)的高維倒向隨機微分方程,證明了相關(guān)的高維倒向隨機微分方程解及納什均衡點的存在性.魏慶萌[2]研究倒向隨機微分方程理論在隨機控制及隨機微分對策理論中的發(fā)展與應(yīng)用,并分別從兩個方面刻畫了最優(yōu)控制.楊依蕓等[3]討論了在部分信息下帶跳線性二次平均場類型的二人零和微分對策問題,得到其相應(yīng)最優(yōu)控制的反饋表示.WANG等[4]利用倒向隨機微分方程討論了一種新的非零和微分對策,建立了開環(huán)納什均衡點的必要條件和充分條件.WANG 等[5]推導(dǎo)了一類新的非零和隨機微分對策的最大原理.WANG等[6]討論了倒向隨機系統(tǒng)的微分對策問題,證明了開環(huán)平衡點的一個Arrow 充分條件.CHEN 等[7]討論了一個帶時滯的非零和隨機微分對策,并建立了時滯對策問題的必要條件和充分條件.YANG 等[8]處理了一類隨機時滯系統(tǒng)的部分可觀測信息下的非零和微分對策問題,推導(dǎo)了該問題的最大值原理和驗證定理.受此類問題的啟發(fā),許潔等[9]在前期探討倒向重隨機系統(tǒng)非零和微分對策問題中納什均衡點存在必要條件的基礎(chǔ)上,進一步探討納什均衡點存在的充分條件及其相關(guān)應(yīng)用.
文中的基本符號:AT表示轉(zhuǎn)置矩陣,Rn×d表示n×d矩陣空間,表示范數(shù),Rn表示n維歐氏空間.文中所給符號和不等式在dt× dp意義下在[0,T] × Ω 中幾乎必然成立.
對任意的t∈[0,T],集合不遞增也不遞減,無法構(gòu)成信息流. 假設(shè)M2(0,T;Rn)={φ(t)|φ(t) 為n維可測隨機過程且設(shè)是一個概率空間,[0,T]是個任意大的時間區(qū)間,{W(t):0 ≤t≤T},{B(t):0 ≤t≤T}是兩個獨立且標準,取值在Rd、Rl的布朗運動過程.定義正向伊藤積分和倒向伊藤積分,其中:?(t),φ(t)屬于M2(0,T;Rn).
系統(tǒng)的狀態(tài)可以由此倒向重隨機微分方程刻畫:
其中:v1(?)和v2(?)分別表示控制雙方的控制過程,設(shè)為控制者1 和控制者2.設(shè)Ui(i= 1,2)為Rk的一個非空凸子集.Ui(i= 1,2)為控制雙方控制過程集合,滿足的條件如下:
①Ui是?t-適應(yīng)的,vi(t) ∈Ui,t∈[0,T].
控制雙方在共同關(guān)心T時刻獲得共同期望結(jié)果ξ時,也關(guān)心各自的利益.控制雙方的目標泛函為:
本文用到的假設(shè)條件:
(A1)存在常數(shù)c> 0 和0 <σ< 1,對于任意的(y1,z1,u1),(y2,z2,u2) ∈Rn×Rn×d×Rk,有
(A2)對于(y,z,v1,v2),f和g是連續(xù)可微的,并且(y,z,v1,v2)關(guān)于f和g的偏導(dǎo)數(shù)是一致有界的.
(A3)Li對于(y,z,v1,v2)是連續(xù)可微的,存在正常數(shù)C使得偏導(dǎo)數(shù)被界住.Φi對于y則是連續(xù)可微的(i= 1,2).
引理1[3]假設(shè)(A1)~(A2)成立,對于給定u(?) ∈U(0,T),方程(1)存在唯一解(y(?),z(?)),且
控制雙方都想選擇最優(yōu)的容許控制vi(?)(i= 1,2) 來優(yōu)化自己的價值泛函,即尋找容許控制(v1(?),v2(?)) ∈U1×U2使其滿足:
滿足式(3)的容許控制(u1(?),u2(?))被稱為納什均衡點.
定義系統(tǒng)對應(yīng)的伴隨方程:
定義哈密頓函數(shù)為Hi:[0,T] ×Rn×Rn×d×
哈密頓形式的伴隨方程如下:
進一步補充文章的假設(shè)條件(A4)~(A7),其中(i= 1,2).
(A5)伴隨方程(7)有解(pi(?),qi(?)).
定理1 假設(shè)(A2)~(A7)成立,(u1(?),u2(?))∈U1×U2是給定的容許控制,是對應(yīng)的軌線,那么(u1(?),u2(?))是一個納什均衡點.
證明對于任意的v1(?) ∈U1,假設(shè),是對應(yīng)于(v1(?),u2(?))的狀態(tài)軌跡,利用哈密頓函數(shù)和價值泛函的定義可得:
即
結(jié)合不等式(13)(14),可得:
結(jié)合不等式(15)(16),有
采取同樣的過程來處理i= 2 的情況,有
將得到的結(jié)果應(yīng)用于一類特殊的線性倒向重隨機微分對策問題,設(shè)
式(19)中t的所有函數(shù)是有界的,其中Mi(t)、Ri(t)和Qi是對稱非負正定的,Ni(t)是對稱均勻正定的.
此時系統(tǒng)的狀態(tài)方程和伴隨方程如下:
定義哈密頓函數(shù)如下:
考慮以下線性控制系統(tǒng):
應(yīng)用定理1,可得
同樣的,對于任意的v2(?) ∈U2,有
故可以得到容許控制滿足式(19),從而得到期望的納什均衡點.
定理2 當且僅當u1(t) 和u2(t) 為如下形式,(u1(t),u2(t)) 是一個滿足上述問題的納什均衡點.
其中(yi(t),p1(t),p2(t),q1(t),q2(t)) 是如下方程的解.
證明 通過納什均衡點的定義和引理1,可以知道以下三個條件是等價的,
(I)(u1(?),u2(?)) 是這個博弈問題的納什均衡點.
(II)ui(?)是以下控制問題的最優(yōu)控制.
價值泛函為:
結(jié)合i= 1,2,可以將式(30)轉(zhuǎn)化為式(27),繼而可得(u1(t),u2(t))是一個滿足上述問題的納什均衡點.
本文研究了由倒向重隨機微分方程刻畫的非零和微分對策問題,得到了納什均衡點存在的充分條件,將所得結(jié)果應(yīng)用于一類特殊的線性倒向重隨機微分對策問題并得到期望的納什均衡點,同時得到了滿足上述問題的納什均衡點的具體形式并以定理的形式給出了證明.