張秘
【摘要】 博弈論(Game theory)是一種依靠嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型,來解決現(xiàn)實(shí)世界中決策主體之間相互利益競爭的工具。博弈的目的,就是為了尋求一個(gè)能實(shí)現(xiàn)整體最優(yōu)的最佳策略組合(即所謂的納什均衡),從而使每個(gè)參與者的策略都是對其他參與者策略的最優(yōu)反應(yīng)。論文分析了一種基于代價(jià)函數(shù)的動(dòng)態(tài)頻譜接入方法,主要考慮了認(rèn)知無線電場景中多個(gè)次用戶欲共享授權(quán)用戶的頻譜時(shí)的問題,該問題可視為壟斷的市場競爭的問題,論文建立了相應(yīng)的博弈模型以尋求次用戶的最優(yōu)頻譜分配結(jié)果,即納什均衡。
【關(guān)鍵詞】 無線電 博弈論 納什均衡
一、博弈論的概述
1.1概念
博弈論(game theory)是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題的理論[20]。也就是說,博弈論研究當(dāng)一個(gè)主體,譬如說一個(gè)人或一個(gè)企業(yè)的選擇受到其他人(其他企業(yè))的選擇的影響,而且反過來影響到其他人(其他企業(yè))選擇時(shí)的決策問題和均衡問題。所以在這個(gè)意義上說,博弈論又稱為“對策論”。博弈論是一種使用嚴(yán)謹(jǐn)數(shù)學(xué)模型來解決現(xiàn)實(shí)中利害沖突的理論,由于沖突、合作、競爭等行為是現(xiàn)實(shí)中常見的現(xiàn)象,因此很多領(lǐng)域都能應(yīng)用博弈論,如軍事領(lǐng)域、經(jīng)濟(jì)領(lǐng)域、政治外交等。
1.2博弈論模型簡介
博弈論自產(chǎn)生到發(fā)展至今已形成了較成熟的理論體系,它并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是一種方法,應(yīng)用范圍不僅包括經(jīng)濟(jì)學(xué),政治學(xué)、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學(xué)等都涉及到博弈論。不過博弈論也具有自身的基本模型,可以對一個(gè)博弈過程用5個(gè)方面來描述,G={P,A,O,I,U}
① P(player):博弈的參與方。
② A(action):博弈方可選擇的全部行為或策略的集合
③ O(orders):博弈的次序。
④ I(information):博弈的信息。
⑤ U(utility):博弈方的收益。
以上五個(gè)方面是定義一個(gè)博弈時(shí)必須首先設(shè)定的,確定了上述五個(gè)方面就是確定了一個(gè)博弈。博弈論就是系統(tǒng)研究用上述方法定義的各種各樣的博弈問題,尋求各博弈方合理選擇策略的情況下博弈的解,也既是均衡。
1.3博弈論的分類
現(xiàn)實(shí)中各種博弈可以按照不同的辦法進(jìn)行分類。根據(jù)參與人的多少,可以將博弈分為兩人博弈和多人博弈;根據(jù)參與人是否合作,可以將博弈分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,又可以將博弈分為零和博弈、常和博弈和變和博弈。
1.4納什均衡
1.4.1納什均衡的定義
納什均衡(Nash Equilibrium)[20]是一種策略組合,它能夠使得每個(gè)參與者的策略都是對其他參與者策略的最優(yōu)反應(yīng)?!白顑?yōu)反應(yīng)”指的是該策略帶給采用它的博弈方的利益或期望利益,大于或至少不小于其它任何策略能帶來的利益。博弈的目的,就是為了尋求這樣的一個(gè)最佳的策略組合。
1.5 一些特殊的博弈模型
1.5.1重復(fù)博弈模型
重復(fù)博弈是目前人們了解的最為透徹的一類動(dòng)態(tài)博弈,參與人每一期都面對同樣的“階段博弈”或“選民博弈”,而且參與人的全部收益是每階段所得收益的加權(quán)平均。參與者基于對博弈過程的認(rèn)知,例如對過去行為的了解,對未來的預(yù)期和對當(dāng)前情況的觀察,在每一個(gè)階段的博弈中選擇自身的策略。這些策略可以是固定的,也可以隨其它參與者行動(dòng)的改變而變化,甚至可以是自適應(yīng)的。
1.5.2潛在博弈模型
潛在博弈是一般形式博弈中的一種特殊類型,存在函數(shù)u:S→R當(dāng)單方面的背離發(fā)生時(shí),u的變化Δu將被反映到單方面背離博弈者的效用上。
二、在無線通信系統(tǒng)資源分配問題中應(yīng)用博弈論的可行性分析
隨著無線通信系統(tǒng)的飛速發(fā)展,許多概念和技術(shù)與現(xiàn)有系統(tǒng)相比都有很大的變化。通信系統(tǒng)將具有智能的資源管理,采用大量動(dòng)態(tài)的、分布式的、自適應(yīng)式的資源管理方式。
三、基于博弈論的動(dòng)態(tài)頻譜接入方法
如何利用博弈論方法對認(rèn)知無線電技術(shù)的研究進(jìn)行分析,其中的關(guān)鍵是如何將博弈論引入到相應(yīng)算法的設(shè)計(jì)和分析中,找到算法的納什均衡點(diǎn)。在開始具體的算法研究之前,需要將所研究的問題抽象成博弈論問題模型。
3.1 分布式自適應(yīng)頻譜接入方法
博弈論模型適用于分析認(rèn)知無線電系統(tǒng)各用戶競爭頻譜的分布式行為,各用戶根據(jù)自己獲得的信息單獨(dú)進(jìn)行決策。
3.2基于代價(jià)函數(shù)的動(dòng)態(tài)頻譜接入方法
由于非合作的關(guān)系導(dǎo)致每個(gè)用戶都致力于通過選擇合適的頻譜傳輸以實(shí)現(xiàn)自身效用函數(shù)的最大化,但是卻忽視了對系統(tǒng)中其它用戶產(chǎn)生的干擾,以及對主用戶的干擾,這種終端用戶的個(gè)人利益最大化的行為將嚴(yán)重影響到系統(tǒng)的整體通信性能,因此需要引入代價(jià)機(jī)制[23]。引入了代價(jià)機(jī)制之后,不僅能給系統(tǒng)增加利潤,同時(shí)也能敦促系統(tǒng)中的用戶合理利用資源。價(jià)格函數(shù)反應(yīng)了用戶使用網(wǎng)絡(luò)資源所要付出的代價(jià)(cost),同時(shí)也是通信服務(wù)供應(yīng)商的實(shí)際需求。