• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向智慧城市的多精度群智感知定價(jià)機(jī)制研究

      2019-11-11 07:48:36
      數(shù)字通信世界 2019年10期
      關(guān)鍵詞:群智滑動(dòng)定價(jià)

      王 忱

      (南京郵電大學(xué),南京 210003)

      1 研究背景

      利用移動(dòng)設(shè)備進(jìn)行信息感知,即移動(dòng)群智感知,可以融合人的主動(dòng)感知能力和設(shè)備豐富的傳感器資源,因而具有信息種類豐富、感知水平高和部署成本極低的優(yōu)勢(shì),將成為5G的重要業(yè)務(wù)之一。群智感知是智慧城市的一個(gè)重要的解決方案。例如,群智感知會(huì)方便政府部門(mén)監(jiān)測(cè)河流污染狀況。監(jiān)測(cè)任務(wù)會(huì)通過(guò)基站定期向河流覆蓋區(qū)域進(jìn)行發(fā)布,用戶隨后可以上傳反映河水水質(zhì)和周圍工業(yè)情況的照片,服務(wù)器在收集到所有用戶的感知信息后,通過(guò)一定的檢測(cè)算法確定污染情況和污染源。

      由于用戶參與群智感知需要花費(fèi)一定的網(wǎng)絡(luò)流量、設(shè)備電量、交通成本甚至機(jī)會(huì)成本,因此需要設(shè)計(jì)一定的群智感知激勵(lì)機(jī)制,主要包括拍賣、信譽(yù)和定價(jià)三種方式。由于定價(jià)機(jī)制具有客觀性和直接性,近來(lái)越來(lái)越多的學(xué)者聚焦在定價(jià)激勵(lì)機(jī)制的研究上。例如,文獻(xiàn)[1]將定價(jià)機(jī)制用于指紋定位系統(tǒng)。文獻(xiàn)[2]將基于用戶參與感知概率的定價(jià)機(jī)制用于車輛系統(tǒng)中。文獻(xiàn)[3]和[4]在服務(wù)器有限預(yù)算背景下,基于到任務(wù)現(xiàn)場(chǎng)的距離成本,設(shè)計(jì)了激勵(lì)用戶參與感知的定價(jià)。文獻(xiàn)[5]和[6]也假設(shè)服務(wù)器的預(yù)算是有限的,并基于Stackelberg博弈設(shè)計(jì)了Q學(xué)習(xí)定價(jià)機(jī)制,文獻(xiàn)[3]研究了智慧城市背景下的群智感知應(yīng)用,但采用了社會(huì)關(guān)系這樣一種單一的激勵(lì)方式。本文中,我們基于對(duì)智慧城市應(yīng)用的認(rèn)識(shí),假設(shè)服務(wù)器的預(yù)算是一個(gè)固定的預(yù)期值,基于Stackelberg博弈研究了多精度群智感知的最優(yōu)定價(jià)的存在條件,并設(shè)計(jì)了基于Q學(xué)習(xí)的優(yōu)化定價(jià)方法,能有效提升算法的用戶適應(yīng)性、成本節(jié)約性和感知安全性。

      2 基于Stackelberg博弈的定價(jià)收益模型

      下面在Stackelberg博弈模型的基礎(chǔ)上,給出本文的定價(jià)博弈模型。假設(shè)感知精度i分為P級(jí)且表示為i=1,2,...,P,另有i=0表示用戶參與虛假感知,i=-2表示用戶參與未參與感知。首先,服務(wù)器作為帶頭人發(fā)布定價(jià)策略,為保證定價(jià)的公平性,本文假設(shè)在同一時(shí)刻,服務(wù)器付給不同用戶在同一感知精度i上的價(jià)格是相同的,均為y(i)。然后,用戶作為跟隨者選擇一定的感知精度i,并付出感知成本,第j個(gè)用戶的成本記為

      下面分別建立建立用戶端和服務(wù)器端的定價(jià)收益模型。在用戶端,考慮用戶進(jìn)行虛假感知時(shí)可能給自身帶來(lái)收益,則有可能使未參與感知的成本用戶j選擇參與精度為i的感知所期望獲得的收益記為,令和將用戶期望得到的定價(jià)記為ey(i),則有:

      在服務(wù)器端,由于服務(wù)器存在評(píng)估錯(cuò)誤概率e,服務(wù)器只能認(rèn)為評(píng)估后的感知精度才是服務(wù)器的收益,且評(píng)估后的虛假感知會(huì)被服務(wù)器自動(dòng)舍棄,因而帶給服務(wù)器的收益為0。因此,如果用戶j選擇的感知精度為i,服務(wù)器經(jīng)評(píng)估后得到的收益為:

      服務(wù)器在所有M個(gè)用戶可能參與的群智感知任務(wù)中獲得的總收益記為us,可表示如下:

      3 多精度群智感知的最優(yōu)定價(jià)存在條件

      首先討論單個(gè)用戶參與的情況,從用戶收益最大化出發(fā),若要使該用戶選擇感知精度i,則用戶收益應(yīng)大于用戶選擇其他精度、不參與感知和參與虛假感知等情況。據(jù)此可以不加證明地得到如下的引理。

      引理1:對(duì)于參與多精度群智感知的某一個(gè)特定用戶j,激勵(lì)他選擇精度為的感知的充分必要條件是:

      根據(jù)上述引理得到 ey(i)后,可以根據(jù) ey(i)與 y(i)的關(guān)系得到 y(i)。

      對(duì)于某一特定用戶,最優(yōu)定價(jià)應(yīng)是使用戶參與某種非虛假的感知、且服務(wù)器收益最大的定價(jià)。為使最大化,應(yīng)使 ey(i)大于且盡可能地接近,這樣能得到最大值的如下表達(dá)式:

      因此,應(yīng)激勵(lì)用戶選擇的精度i應(yīng)使得最大。結(jié)合引理1,可以不加證明地得到如下的引理:

      引理2:對(duì)于參與多精度群智感知的某一個(gè)特定用戶j,最優(yōu)定價(jià)應(yīng)激勵(lì)用戶選擇使最大的精度i0,且定價(jià)應(yīng)滿足如下的充分必要條件:

      這里假設(shè)定價(jià)是離散的,且最小單位是0.01。

      接下來(lái)討論所有M個(gè)用戶參與多精度群智感知的情況。若要使用戶選擇精度不小于i的感知,且服務(wù)器期望得到的總感知精度為U,從用戶收益最大化出發(fā),若要激勵(lì)不少于個(gè)用戶選擇精度不小于i的感知,則這些用戶的收益應(yīng)大于選擇其他精度、不參與感知和參與虛假感知等情況。據(jù)此可以不加證明地得到如下的定理。

      定理1:對(duì)于參與多精度群智感知的所有M個(gè)用戶,假設(shè)可以將用戶按他們?cè)诟兄萯上的成本從小到大排序?yàn)?,若要激?lì)不少于個(gè)用戶選擇精度不小于i的感知,則定價(jià)應(yīng)滿足如下的充分必要條件:

      若服務(wù)器期望從所有M個(gè)用戶得到的總感知精度為U,最優(yōu)定價(jià)應(yīng)是使用戶參與某種非虛假的感知、且服務(wù)器收益最大的定價(jià)。根據(jù)引理2,最優(yōu)定價(jià)過(guò)程即尋找所有M個(gè)用戶中感知精度與成本差最大的感知精度及其對(duì)應(yīng)用戶,與此同時(shí),應(yīng)使ey(i)大于且盡可能地接近。據(jù)此可以證明得到如下的定理。

      定理2:對(duì)于參與多精度群智感知的所有M個(gè)用戶和P個(gè)感知精度,假設(shè)可以將從大到小排序,并取出最大的n項(xiàng)為,對(duì)應(yīng)的感知精度和i1+i2+...+in等于U,而這n項(xiàng)中最小的一項(xiàng)對(duì)應(yīng)的感知精度和用戶成本分別為ib和Cb。則最優(yōu)定價(jià)可有下面的線性定價(jià)形式:

      當(dāng)ib≠P時(shí)

      當(dāng)ib=P時(shí),

      證明:根據(jù)假設(shè)條件,不論ib是否等于P,上面的期望價(jià)格ey都可以補(bǔ)償選出的n個(gè)凈收益最大項(xiàng)所對(duì)應(yīng)的成本。對(duì)于其他項(xiàng),我們有。然后,當(dāng)ib≠P時(shí),對(duì)于其他ib≠P的項(xiàng)有:

      當(dāng)ib=P時(shí),對(duì)于其他i≠P的項(xiàng)有:

      當(dāng)ib=P時(shí),對(duì)于其他i = P的項(xiàng)有:

      因此,除了選出的n項(xiàng),這些用戶將不會(huì)選擇其他感知精度,而且其他用戶也不會(huì)選擇任何感知精度或參與虛假感知。

      4 不完全信息條件下的動(dòng)態(tài)定價(jià)算法

      在大多數(shù)智慧城市的應(yīng)用場(chǎng)景中,潛在的感知用戶數(shù)量及其感知成本都會(huì)隨時(shí)間變化,可記為M(t)和。因此不能簡(jiǎn)單根據(jù)上面的最優(yōu)定價(jià)方法來(lái)確定群智感知的定價(jià)。此時(shí)定價(jià)過(guò)程應(yīng)該服從如下的動(dòng)態(tài)定價(jià)過(guò)程:(1)在系統(tǒng)測(cè)試階段,發(fā)布一個(gè)隨機(jī)的定價(jià),測(cè)試用戶的選擇;(2)服務(wù)器根據(jù)用戶的選擇,決定定價(jià)的滑動(dòng)方向和滑動(dòng)步長(zhǎng),該步驟會(huì)被迭代重復(fù),直到定價(jià)趨于穩(wěn)定;(3)在系統(tǒng)運(yùn)行階段,根據(jù)現(xiàn)場(chǎng)用戶的響應(yīng)再次動(dòng)態(tài)調(diào)整定價(jià)。

      根據(jù)上述討論,該動(dòng)態(tài)定價(jià)過(guò)程可以用Q學(xué)習(xí)算法來(lái)完成。Q學(xué)習(xí)是強(qiáng)化學(xué)習(xí)的一種,它有狀態(tài)(state)、動(dòng)作(action)、獎(jiǎng)賞(reward)這三個(gè)要素。Q為動(dòng)作效用函數(shù),每個(gè)狀態(tài)所對(duì)應(yīng)的動(dòng)作都有一個(gè)效用值。Q學(xué)習(xí)的訓(xùn)練公式如下:

      其中,學(xué)習(xí)速率α越大,保留之前訓(xùn)練的效果就越小;折扣因子λ越大,記憶中的利益所占比重就越大。在定價(jià)學(xué)習(xí)過(guò)程中,從每個(gè)定價(jià)狀態(tài)出發(fā),只可能有增或減兩種動(dòng)作,分別表示為αr和αι,動(dòng)作的獎(jiǎng)勵(lì)應(yīng)為i(t+1)/(t+1)。我們現(xiàn)在令α=1,提出基于Q學(xué)習(xí)的滑動(dòng)定價(jià)算法SPA,其過(guò)程如下:

      (1)初始化及滑動(dòng)區(qū)間的設(shè)定:固定虛假感知的期望價(jià)格為-1,而完全精度感知的期望價(jià)格ey(p)從最低定價(jià)0開(kāi)始滑動(dòng),滑動(dòng)范圍從最低定價(jià)0到最高定價(jià)p-0.5e,單步滑動(dòng)步長(zhǎng)固定為最小值0.01,當(dāng)ey(p)滑動(dòng)至1-0.5e之后,ey(p-1)從0開(kāi)始與ey(p)同時(shí)滑動(dòng),且總與ey(p-1)保持1-0.5e的差距。以此類推,當(dāng)ey(2)滑動(dòng)至1之后,ey(1)從0開(kāi)始與ey(2)...ey(p)同時(shí)滑動(dòng),且總與ey(2)保持1的差距。

      (2)滑動(dòng)定價(jià)過(guò)程:將當(dāng)前期望價(jià)格向用戶群體中的某隨機(jī)抽取的用戶進(jìn)行發(fā)布,如果該用戶選擇精度為的感知,則當(dāng)前期望價(jià)格向量ey的獎(jiǎng)勵(lì)值增加i。如果當(dāng)前所有價(jià)格的平均獎(jiǎng)勵(lì)值(即獎(jiǎng)勵(lì)值與被測(cè)試次數(shù)的比)大于或等于NU/M(N為當(dāng)前測(cè)試過(guò)的總?cè)藬?shù)),則當(dāng)前所有不為0的價(jià)格向低滑動(dòng)一次,反之則向高滑動(dòng)一次。如果該用戶參與虛假感知,則進(jìn)一步降低虛假感知的定價(jià)。對(duì)該步驟迭代進(jìn)行M次。

      (3)定價(jià)選?。簭漠?dāng)前穩(wěn)定價(jià)格的下方選擇平均激勵(lì)值大于或等于U的最低用戶期望價(jià)格組合。然后可以根據(jù)ey與y的關(guān)系得到y(tǒng)。

      下面對(duì)該算法的性能進(jìn)行仿真。首先驗(yàn)證算法的收斂性。我們假設(shè)用戶的感知成本服從均勻分布,圖1展示了在服務(wù)器評(píng)估錯(cuò)誤概率為0.1、N/M=0.1的條件下,定價(jià)誤差絕對(duì)值和服務(wù)器平均收益隨學(xué)習(xí)次數(shù)增加的性能變化情況:由于平均獎(jiǎng)勵(lì)值利用了歷史標(biāo)簽數(shù)據(jù),之前在當(dāng)前價(jià)格上每次測(cè)試得到的用戶感知精度都會(huì)反饋影響到當(dāng)前價(jià)格的滑動(dòng)方向,該算法收斂速度較快。由圖1可以看到,達(dá)到穩(wěn)定價(jià)格的學(xué)習(xí)次數(shù)與定價(jià)間隔數(shù)接近,而服務(wù)器的平均收益隨著學(xué)習(xí)次數(shù)增加而增加,最終穩(wěn)定在期望平均收益附近。

      圖1 感知成本服從均勻分布時(shí)SPA算法的性能

      此外,我們還試驗(yàn)了用戶的感知成本服從高斯分布的情況,算法的性能與均勻分布的情況十分類似,仿真結(jié)果如下圖所示:

      圖2 感知成本服從高斯分布時(shí)SPA算法的性能

      綜合圖1和圖2可以看出,我們提出的滑動(dòng)定價(jià)算法具有用戶適應(yīng)性、成本節(jié)約性和感知安全性。

      5 結(jié)束語(yǔ)

      本文提出了面向智慧城市應(yīng)用的群智感知模式,即固定價(jià)值的多精度群智感知,并基于Stackelberg模型建立了定價(jià)收益模型。隨后在完全博弈信息條件下,在考慮了服務(wù)器評(píng)估錯(cuò)誤概率的基礎(chǔ)上,得到激勵(lì)用戶選擇某種精度感知的定價(jià)存在區(qū)間,并得到了使虛假感知最少和服務(wù)器收益最大化的最優(yōu)定價(jià)。然后在感知成本位置的不完全信息條件下,基于Q學(xué)習(xí)設(shè)計(jì)了滑動(dòng)定價(jià)算法SPA。隨后通過(guò)仿真驗(yàn)證了算法的用戶適應(yīng)性、成本節(jié)約性和感知安全性。

      猜你喜歡
      群智滑動(dòng)定價(jià)
      軟件眾測(cè)服務(wù)模式探索與實(shí)踐
      本刊2020年36卷第12期版權(quán)頁(yè)定價(jià)勘誤
      物聯(lián)網(wǎng)時(shí)代移動(dòng)群智感知技術(shù)中的安全問(wèn)題淺析
      線上教學(xué)平臺(tái)評(píng)價(jià)主體多元化的發(fā)展趨勢(shì)
      基于開(kāi)源和群智的軟件工程實(shí)踐教學(xué)方法
      一種新型滑動(dòng)叉拉花鍵夾具
      Big Little lies: No One Is Perfect
      基于分層Copula的CDS定價(jià)研究
      幫爸爸定價(jià)
      滑動(dòng)供電系統(tǒng)在城市軌道交通中的應(yīng)用
      哈尔滨市| 社会| 青浦区| 井研县| 攀枝花市| 高雄市| 黄陵县| 吉木萨尔县| 阳城县| 宁阳县| 竹溪县| 台江县| 达州市| 江门市| 昆明市| 邵东县| 大余县| 静宁县| 边坝县| 泰顺县| 临汾市| 军事| 芮城县| 漳平市| 丰城市| 蕲春县| 青河县| 开封县| 寿光市| 新干县| 江孜县| 义乌市| 沈丘县| 和田市| 宁国市| 太仆寺旗| 福清市| 朝阳县| 乐至县| 梓潼县| 南平市|