• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      云計(jì)算基于隨機(jī)進(jìn)化博弈動(dòng)態(tài)的資源優(yōu)化配置

      2019-09-13 06:36:30
      關(guān)鍵詞:競價(jià)資源分配效用

      尹 成 國

      (海南熱帶海洋學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 海南 三亞 572022)

      0 引 言

      云計(jì)算通過其數(shù)據(jù)中心可以按需提供計(jì)算、存儲(chǔ)、通信等資源服務(wù)于大規(guī)模分布環(huán)境[1]。云環(huán)境中的資源分配機(jī)制要求向云用戶提供資源用于處理作業(yè)和存儲(chǔ)數(shù)據(jù),常用的資源提供手段包括按需提供和預(yù)留式提供[2]。按需提供時(shí)的定價(jià)是以即付即用為基礎(chǔ)的,按需資源提供可以適應(yīng)于具有波動(dòng)和不可預(yù)測的資源需求狀況。而預(yù)留式提供則可能有效利用空閑資源,且其價(jià)格低于按需提供。

      由于云環(huán)境中參與實(shí)體的異構(gòu)性和動(dòng)態(tài)特性,資源的分配與管理是異常復(fù)雜的。很多研究利用經(jīng)濟(jì)學(xué)的思想完成資源分配優(yōu)化問題,即博弈論的思想,這源于云環(huán)境中的資源管理與社會(huì)經(jīng)濟(jì)學(xué)活動(dòng)擁有極大的相似性[3]。博弈理論可以通過搜索均衡解,利用迭代的方法將云資源分配形式化為效用優(yōu)化問題。當(dāng)前的相關(guān)研究主要包括三種類型的經(jīng)濟(jì)學(xué)博弈模型:(1) 基于合作式博弈的資源分配方法,通過將多個(gè)云用戶組成為聯(lián)盟的形式進(jìn)行資源分配,以增加實(shí)體效用[4-5]。(2) 基于非合作式博弈的資源分配方法,利用云實(shí)體間的相互影響,采用對(duì)實(shí)體的基礎(chǔ)的理性假設(shè),讓博弈者得到最大化的收益,并對(duì)行為策略擁有很好的判斷和預(yù)測[6-7]。(3) 基于進(jìn)化式博弈的資源分配方法,擁有有限理性的云實(shí)體間的博弈求解問題[8-9]。然而,通常情況下,現(xiàn)實(shí)環(huán)境中的云用戶對(duì)于資源使用的行為難免會(huì)發(fā)生錯(cuò)誤,這表明用戶的策略均衡不是僅能通過一次性的動(dòng)態(tài)調(diào)整得到的[10]。同時(shí),以上研究均是在無限制的云種群環(huán)境中進(jìn)行的,這也與實(shí)際情況不符。本文將利用隨機(jī)動(dòng)態(tài)機(jī)制研究有限云種群中的資源分配進(jìn)化博弈問題,并通過用戶策略的固定指數(shù)與入侵指數(shù),求解不同種群大小中策略的進(jìn)化方向。

      1 資源分配模型

      假設(shè)云計(jì)算系統(tǒng)擁有N個(gè)用戶競爭資源,資源通過市場機(jī)制分配和提供,即通過資源價(jià)格的波動(dòng)反映資源供求關(guān)系的變化。換言之,此時(shí)的資源分配取決于所有云用戶對(duì)資源的出價(jià)策略。

      定義1假設(shè)每個(gè)用戶向資源方提交的一個(gè)競價(jià)si,那么,s={s1,s2,…,sN}表示所有競爭用戶的競價(jià)集。如果si∈R,s為N個(gè)元素的向量。如果si為多維數(shù)值,則s為M×N矩陣,M為向量si的維度。

      本文將維度限定為一維空間,那么,資源分享σi∈[0,1]即代表第i個(gè)競價(jià)用戶所分配的資源份額,且定義為:

      (1)

      假設(shè)每個(gè)用戶對(duì)于獲得的資源份額σi擁有一個(gè)評(píng)估函數(shù)vi(σi),該評(píng)估可視為給定資源份額下對(duì)于性能的價(jià)值評(píng)估,如在計(jì)算市場中處理作業(yè)的完成時(shí)間或給定帶寬份額下數(shù)據(jù)的傳輸時(shí)間。每個(gè)性能度量可轉(zhuǎn)換成一個(gè)可與競價(jià)相比較的等價(jià)值。如果用戶的評(píng)估是連續(xù)可微分的,則本文的博弈算法中用戶的效用函數(shù)可定義為評(píng)估與其競價(jià)的差值,即:

      Ui=vi(σi)-si

      (2)

      2 進(jìn)化博弈的效用矩陣

      為了簡化分析,本文的博弈模型中云用戶被抽象為兩種具有有限理性的用戶種群。換言之,博弈即是研究具有兩種策略x和y的進(jìn)化動(dòng)態(tài)過程,這表明每個(gè)用戶在競價(jià)博弈過程中將面臨兩種競價(jià)策略博弈的進(jìn)化動(dòng)態(tài)過程。博弈框架的效用矩陣可表達(dá)為對(duì)稱2×2矩陣,如表1所示。

      表1 兩種策略下的博弈效用矩陣

      效用矩陣的含義可理解為:當(dāng)面對(duì)另一采用策略x的用戶時(shí),用戶采用策略x的效用為a,而面對(duì)另一采用策略y的用戶時(shí),用戶采用策略x的效用為c,其他依此類推。兩種用戶策略x和y定義為競價(jià)ky和競價(jià)y,y為用戶預(yù)算,k為常數(shù),0

      (3)

      (4)

      (5)

      (6)

      令px和py分別表示采用策略x和策略y的用戶比例,則:

      px+py=1

      (7)

      采用x和y的用戶效用為:

      Ux=apx+bpy=apx+b(1-px)

      (8)

      Uy=cpx+dpy=cpx+d(1-px)

      (9)

      云用戶種群的平均效用為:

      (10)

      效用作為云用戶反映其目標(biāo)和偏好的質(zhì)量指標(biāo),在重復(fù)博弈過程中,較優(yōu)的策略將為用戶帶來更高的效用,并感染云種群采用較差的策略。

      復(fù)制方程集合描述了決策選擇過程,每種策略的平均增長率為其適應(yīng)度與整個(gè)種群的平均適應(yīng)度之差得到。

      由于px+py=1,可知:

      (11)

      且:

      Ux-Uy=(a-c)px+(b-d)(1-px)

      (12)

      如圖1所示,均衡點(diǎn)或者在邊界或者在內(nèi)部,有以下五種常見情況:

      1) 當(dāng)a>c且b>d時(shí),種群進(jìn)化最終將由利用策略x的用戶組成。唯一穩(wěn)定均衡點(diǎn)為px=1。策略x為嚴(yán)格Nash均衡,即為進(jìn)化穩(wěn)定策略ESS,策略y不是。形態(tài)表示為x←y。

      2) 當(dāng)a

      5) 當(dāng)a=c且b=d時(shí),整個(gè)種群維持當(dāng)前狀態(tài),策略x和y具有同等偏好。代與代之間的進(jìn)化不作改變。形態(tài)表示為x--y。

      圖1 不同穩(wěn)定點(diǎn)的圖示

      3 基于Moran過程的選擇動(dòng)態(tài)

      對(duì)于有限云種群中的進(jìn)化博弈,N個(gè)個(gè)體的策略的選擇動(dòng)態(tài)可形式化為帶來頻率依賴適應(yīng)度的Moran過程[11]。假設(shè)云種群由N個(gè)云用戶組成,采用策略x的用戶數(shù)量為i,則采用策略x的用戶比例為(N-i)/N,每個(gè)采用策略x的用戶需與其他們用戶博弈。根據(jù)式(8),采用策略x的用戶效用可定義為:

      (13)

      采用策略y的用戶數(shù)量為N-i,則根據(jù)式(9),該類用戶效用為:

      (14)

      令Ti,i+1表示用戶數(shù)增加一個(gè)的概率,Ti,i-1表示用戶減少一個(gè)的概率,Ti,i表示用戶保持不變的概率,則:

      (15)

      (16)

      Ti,i=1-Ti,i+1-Ti,i-1

      (17)

      轉(zhuǎn)移矩陣為:

      (18)

      式(18)表示云種群的狀態(tài)變化轉(zhuǎn)移矩陣僅在三條對(duì)角線上可以進(jìn)行轉(zhuǎn)換,其他概率均為0,這是由于相同類型的用戶不會(huì)增加或減少多于兩個(gè)。

      進(jìn)化博弈擁有兩個(gè)吸收態(tài),即i=0和i=N。i=0表示所有云用戶采用策略x,i=N表示所有云用戶采用策略y。當(dāng)云種群到達(dá)兩個(gè)狀態(tài)之一時(shí),這種狀態(tài)將保持穩(wěn)定。否則,擁有更高效用的策略將入侵擁有低效用的策略。以下將計(jì)算兩個(gè)狀態(tài)間的吸收概率。

      令ri表示采用策略x的用戶數(shù)量從i改變?yōu)镹的概率,即從狀態(tài)變?yōu)闋顟B(tài)i=N的概率。ri可表示為遞歸關(guān)系式:

      ri=Ti,i+1ri+1+Ti,iri+Ti,i-1ri-1

      (19)

      明顯地,ri擁有兩個(gè)吸收點(diǎn)r0=0和rN=1,其中,r0=0表示當(dāng)沒有用戶采用策略x時(shí)用戶數(shù)量從N變?yōu)?的概率,rN=1表示當(dāng)所有用戶采用策略x時(shí)云種群狀態(tài)保持穩(wěn)定的概率。換言之,采用策略y的概率為0。

      將式(15)-式(17)代入式(19),則:

      ri=Ti,i+1ri+1+(1-Ti,i+1-Ti,i-1)ri+Ti,i-1ri-1=

      Ti,i+1(ri+1-ri)-Ti,i-1(ri-ri-1)+ri?

      Ti,i+1(ri+1-ri)-Ti,i-1(ri-ri-1)=0

      (20)

      令wi=ri-ri-1,根據(jù)式(13)、式(14)和式(20),則:

      (21)

      將r0=0代入式(21),則:

      (22)

      將rN=1代入式(22),則:

      (23)

      聯(lián)合式(22)和式(23),有:

      (24)

      根據(jù)式(24),定義兩種概率θx→y=r1和θy→x=1-rN-1。前者表示種群中一個(gè)x用戶變化為y用戶且固定的概率,后者則反之。定義θx→y和θy→x為兩固定指數(shù),當(dāng)θx→y變大時(shí),選擇策略x的用戶將逐步入侵整個(gè)種群,當(dāng)θy→x增加時(shí),選擇策略x的用戶將被其他策略代替,則:

      (25)

      當(dāng)采用策略x和y的用戶擁有相同效用時(shí),稱為中立變種,其固定指數(shù)為1/N。本文利用1/N作為有限云種群中搜索策略選擇動(dòng)態(tài)的基準(zhǔn)。顯然,如果θx→y>1/N,則策略選擇將偏好策略x代替策略y;如果θx→y<1/N,策略選擇將反對(duì)策略x代替策略y。

      4 有限云種群中的選擇動(dòng)態(tài)

      定義另一種度量指數(shù),稱為入侵指數(shù),表示為:

      (26)

      通過式(26),可以比較每個(gè)i下的Uxi和Uyi,評(píng)估在位置i上該選擇是否增加或減少了策略x的用戶數(shù)量。聯(lián)合式(13)和式(14)可知,入侵動(dòng)態(tài)可以φ1和φN-1的形式表示。入侵指數(shù)φ1和φN-1可以評(píng)估是否采用策略x或y的單個(gè)用戶擁有比整個(gè)種群更大的效用。如果φ1>1,則策略選擇偏好策略x入侵策略y;如果φN-1<1,策略選擇偏策略y入侵策略x。

      從式(24)、式(26)、式(13)和式(14)可以發(fā)現(xiàn),固定指數(shù)和入侵指數(shù)在其表達(dá)上擁有不同的復(fù)雜性。入侵指數(shù)表達(dá)更加簡單,為用戶效用矩陣和種群N的函數(shù),函數(shù)φ1和φN-1用于評(píng)估當(dāng)采用策略x的用戶數(shù)量為i時(shí)是否其用戶數(shù)量在下一步將增加或減少。然而,固定指數(shù)的表達(dá)更加復(fù)雜,無法明確通過N顯示。函數(shù)θx→y和θy→x用于度量進(jìn)化博弈中用戶策略保持穩(wěn)定的概率。

      由于固定指數(shù)和入侵指數(shù)均取決于N,即種群大小對(duì)于用戶策略的選擇動(dòng)態(tài)具有重要影響。實(shí)驗(yàn)中將研究固定效用矩陣中N值的改變對(duì)選擇動(dòng)態(tài)的影響。

      5 數(shù)值分析

      本節(jié)利用數(shù)值實(shí)驗(yàn)觀察在具體的效用矩陣中不同種群大小N下用戶策略的進(jìn)化方向變化。定義兩種評(píng)估函數(shù)分別為v1i(σi)=4/σi(實(shí)驗(yàn)1)和v2i(σi)=4ln(1+σi)(實(shí)驗(yàn)2),σi為分配給i的資源分配比例。令k=1/2和y=2,則云用戶的競價(jià)策略包括競價(jià)為1和競價(jià)為2。

      表2 具有兩種策略的博弈效用矩陣

      給出效用矩陣后,固定指數(shù)和入侵指數(shù)僅為種群大小N的函數(shù)。圖2-圖5為MATLAB下的數(shù)值分析結(jié)果,表示在有限云種群中入侵指數(shù)和固定指數(shù)的變化情況。圖2顯示當(dāng)種群大小增加時(shí),用戶效用增加較少,甚至保持不變。圖3顯示當(dāng)種群大小很小時(shí),固定指數(shù)發(fā)生了顯著變化。隨著種群增加,固定指數(shù)趨于平衡。在不同種群規(guī)模下量化的數(shù)值如圖4和圖5,具體地:

      (1) 對(duì)于N≤5,φ1,φN-1>1且θx→y<1/N<θy→x,策略選擇偏好策略x,且該策略將逐步占據(jù)整個(gè)種群。

      (2) 對(duì)于51/N,策略選擇偏好發(fā)生變化,這取決于用戶的策略選擇。

      (3) 對(duì)于81/N,策略選擇維持不變狀態(tài)。

      圖2 效用變化

      圖3 固定指數(shù)

      圖4 表2效用矩陣得到的入侵指數(shù)

      圖5 表2效用矩陣得到的固定指數(shù)

      表3 兩種策略的效用矩陣

      對(duì)于無限的種群大小,策略x的適應(yīng)度大于策略y。因此,可以說策略x占優(yōu)y,這表明策略x為嚴(yán)格Nash均衡或進(jìn)化穩(wěn)定策略ESS,而y不是。對(duì)于有限的種群大小,可以看出根據(jù)N有五種情況。隨著N的增加,策略x逐步獲得對(duì)于y的占優(yōu)。同時(shí),注意到a+d>b+c,策略選擇對(duì)于任意N均不會(huì)偏好作出改變。而a+b>c+d,對(duì)于較大的種群大小,策略選擇不會(huì)偏好y。如圖6和圖7所示,有:

      圖6 表3效用矩陣得到的固定指數(shù)

      圖7 表3效用矩陣得到的入侵指數(shù)

      6 結(jié) 語

      本文提出一種隨機(jī)動(dòng)態(tài)模型,研究了有限云種群環(huán)境中的資源分配的進(jìn)化博弈問題。通過對(duì)稱的用戶2×2效用矩陣,將用戶對(duì)資源的競價(jià)形式形式化為進(jìn)化博弈,利用Moran過程尋找重復(fù)博弈過程中用戶的策略選擇在固定指數(shù)和入侵指數(shù)上的進(jìn)化動(dòng)態(tài),求解了用戶種群在策略選擇上的演化方向。通過兩個(gè)具體的效用矩陣的數(shù)值分析,證明了該博弈算法下用戶為了最大化自身效用,其策略選擇對(duì)于不同的種群大小進(jìn)化方向是不同的。

      猜你喜歡
      競價(jià)資源分配效用
      新研究揭示新冠疫情對(duì)資源分配的影響 精讀
      英語文摘(2020年10期)2020-11-26 08:12:20
      小學(xué)美術(shù)課堂板書的四種效用
      一種基于價(jià)格競爭的D2D通信資源分配算法
      管道天然氣競價(jià)交易引發(fā)的思考
      能源(2017年10期)2017-12-20 05:54:25
      碰撞:惡意競價(jià)與隱孕求職
      納米硫酸鋇及其對(duì)聚合物的改性效用
      中國塑料(2016年9期)2016-06-13 03:18:48
      幾種常見葉面肥在大蒜田效用試驗(yàn)
      玉米田不同控釋肥料效用研討
      OFDMA系統(tǒng)中容量最大化的資源分配算法
      動(dòng)態(tài)規(guī)劃在資源分配中的應(yīng)用
      宝坻区| 虎林市| 黔江区| 沙雅县| 东方市| 客服| 隆回县| 旌德县| 阿拉善右旗| 鲁山县| 镇康县| 龙川县| 穆棱市| 伽师县| 漳平市| 班戈县| 朝阳区| 云林县| 花垣县| 潜山县| 开江县| 同心县| 建宁县| 阿尔山市| 唐河县| 辉县市| 资源县| 临颍县| 攀枝花市| 巴塘县| 安岳县| 府谷县| 巴青县| 循化| 晋中市| 惠来县| 庆安县| 宿州市| 沙洋县| 兰州市| 南昌县|