DRM博弈控制分析

2012-08-07 09:43:18馬國(guó)峻裴慶祺姜曉鴻

通信學(xué)報(bào) 2012年1期

馬國(guó)峻，裴慶祺，姜曉鴻

(1. 西安電子科技大學(xué) 計(jì)算機(jī)學(xué)院，陜西西安 710071；2. 西安電子科技大學(xué) 綜合業(yè)務(wù)網(wǎng)國(guó)家重點(diǎn)實(shí)驗(yàn)室，陜西西安 710071)

1 引言

數(shù)字版權(quán)管理(DRM, digital right management)技術(shù)是數(shù)字內(nèi)容交易過(guò)程中對(duì)知識(shí)產(chǎn)權(quán)進(jìn)行保護(hù)的技術(shù)、工具和處理過(guò)程的總稱，包括對(duì)數(shù)字資產(chǎn)各種形式的使用進(jìn)行描述、識(shí)別、交易、保護(hù)、監(jiān)控和跟蹤等各個(gè)過(guò)程。

DRM價(jià)值鏈由內(nèi)容提供商、用戶等多個(gè)實(shí)體構(gòu)成，實(shí)際中，這些實(shí)體都具有“理性”的特點(diǎn)，是以自我利益最大化為目標(biāo)的。由于利益目標(biāo)不同，這些實(shí)體之間存在利益沖突和策略競(jìng)爭(zhēng)的現(xiàn)象，例如，一方面，用戶總想以最低的代價(jià)來(lái)使用數(shù)字內(nèi)容，于是出現(xiàn)了非法共享等行為。另一方面，為了防止數(shù)字內(nèi)容的非法共享，內(nèi)容提供商采用各種技術(shù)手段來(lái)控制、追查數(shù)字內(nèi)容的使用[1～3]，以維護(hù)自身的利益。然而，技術(shù)保護(hù)的負(fù)面作用又加劇了用戶非法共享數(shù)字內(nèi)容的企圖[4]。DRM價(jià)值鏈的這種矛盾現(xiàn)象，使人們逐漸認(rèn)識(shí)到發(fā)展DRM而應(yīng)該從綜合各方利益的角度出發(fā)，需要尋求利益均衡的解決方案[5,6]。

博弈論也稱作“對(duì)策論”，是研究決策主體的行為發(fā)生相互作用時(shí)的決策以及這種決策的均衡問(wèn)題的理論，是研究競(jìng)爭(zhēng)場(chǎng)景下決策主體行為的重要工具。由于DRM價(jià)值鏈中實(shí)體的決策行為和利益關(guān)系，恰好屬于博弈論的研究范圍。因此，一些學(xué)者開始從博弈論角度來(lái)分析DRM現(xiàn)象、探討DRM價(jià)值鏈中各方利益均衡問(wèn)題[5～8]。和這些工作不同的是，本文并不是單純地用博弈論來(lái)解釋DRM價(jià)值鏈內(nèi)實(shí)體的行為，也不熱衷于納什均衡點(diǎn)的尋求，而是從非合作博弈的特性入手，首次提出了博弈控制理論，并以此為基礎(chǔ)來(lái)探討DRM價(jià)值鏈內(nèi)實(shí)體選取策略的原則，為DRM的合理發(fā)展提供了理論指導(dǎo)。

由于DRM價(jià)值鏈內(nèi)的各個(gè)參與實(shí)體間難以形成一個(gè)穩(wěn)定的協(xié)議，因此，本文認(rèn)為DRM價(jià)值鏈內(nèi)的各個(gè)參與實(shí)體間的利益關(guān)系和決策行為表現(xiàn)為非合作博弈。由于非合作博弈不一定有純策略納什均衡點(diǎn)，并且納什均衡點(diǎn)也不一定是全局最優(yōu)點(diǎn)，即個(gè)人理性和集體理性相矛盾。因此，目前DRM價(jià)值鏈中參與實(shí)體之間難以達(dá)到一個(gè)全局優(yōu)化的均衡點(diǎn)。非合作博弈的這一特點(diǎn)是當(dāng)前DRM現(xiàn)狀的一個(gè)根本解釋。因此，DRM的合理發(fā)展需要克服個(gè)體理性的局限，實(shí)現(xiàn)全局優(yōu)化。為此，本文提出了控制博弈的概念和模型?？刂撇┺脑诨静┺哪Ｐ偷幕A(chǔ)上引入了控制者和控制目標(biāo)，控制者是全局理性的，被控者是個(gè)體理性的。控制者依據(jù)控制目標(biāo)來(lái)選擇自己的策略，“迫使”被控者則依據(jù)自身利益最大化原則選擇控制者期望的策略，從而實(shí)現(xiàn)全局的優(yōu)化控制。然后，本文從DRM價(jià)值鏈的利益關(guān)系入手，選取內(nèi)容提供商和用戶作為博弈的參與者，并對(duì)他們的策略和效用進(jìn)行了分析和建模，建立了DRM控制博弈模型，最后，闡述了內(nèi)容提供商如何作為博弈的控制者來(lái)選擇全局優(yōu)化策略，以實(shí)現(xiàn)和用戶之間的穩(wěn)定的互利共贏。

2 控制博弈

2.1 基本博弈模型

一個(gè)基本的博弈模型可表示為G=(P，S，U，Γ)，其中P表示參與者，S表示策略集，U表示效用函數(shù)。

1) P (參與者)，是參與博弈的直接當(dāng)事人，是博弈的決策主體和策略制定者。參與者具有“理性”的特征，他們行動(dòng)時(shí)都是以自身利益最大化目標(biāo)的。參與者可以是個(gè)人也可以是為了一個(gè)共同目標(biāo)或效用而參加博弈的集體。如果G有n個(gè)參與者，用P={1,,…n}表示參與者集合。

2) S (策略集)，參與者可選擇全部行動(dòng)規(guī)則的集合。如果G有n個(gè)參與者，分別用S1,…,Sn每個(gè)參與者的策略集，用sij∈Si表示參與者i的第j個(gè)策略，同時(shí)用S-i表示除參與者i之外的其他參與者選擇的策略集合。

3) U（效用函數(shù)），用于計(jì)算特定的策略組合下各個(gè)參與者收益的大小，如果G有n個(gè)參與者，用U1,… ,Un分別表示每個(gè)參與者的收益函數(shù)。

4) Γ表示博弈的所有納什均衡點(diǎn)集合，即Γ={τ1,… ,τm}，其中τi表示博弈G的第i個(gè)納什均衡點(diǎn)。τi是一個(gè)策略組合對(duì)于?i∈P，?σi∈Si有

其中，*iσ稱為參與者i在此均衡點(diǎn)的占優(yōu)策略。

非合作博弈中，個(gè)人理性和集體理性往往是相矛盾的，理性的個(gè)體追求自身利益最大化的結(jié)果卻實(shí)現(xiàn)不了集體利益的最大化，從而也不能真正實(shí)現(xiàn)自身利益的最大化。因此，非合作博弈不一定有純策略納什均衡點(diǎn)，同時(shí)納什均衡點(diǎn)往往不是全局最優(yōu)點(diǎn)，如典型的非合作博弈模型—囚徒困境模型。

2.2 博弈控制

2.2.1 模型

為了克服個(gè)體理性的局限，實(shí)現(xiàn)全局的理性，本文提出了控制博弈的概念?？刂撇┺脑诨痉呛献鞑┺哪Ｐ偷幕A(chǔ)上引入了控制者和控制目標(biāo)，控制者也是博弈的參與者，但是控制者是全局理性的，而被控者是個(gè)體理性的，被控制的目標(biāo)總是需求自身利益最大化的?？刂普咭罁?jù)控制目標(biāo)來(lái)選擇自己的策略，“迫使”被控者則依據(jù)自身利益最大化原則選擇控制者期望的策略，從而，實(shí)現(xiàn)全局的優(yōu)化控制。

1) C表示控制者，控制者是博弈的參與者的子集，即C?P，控制者是全局理性的，控制者會(huì)依據(jù)全局效用函數(shù)W來(lái)選擇基于W全局優(yōu)化的戰(zhàn)略。

2) A是控制策略的集合，A是控制者實(shí)施控制的策略集合。

5) W表示全局效用函數(shù)，是控制目標(biāo)的體現(xiàn)。它是控制策略A和的函數(shù)，控制者選擇控制策略的目標(biāo)是使該函數(shù)的值最大，以實(shí)現(xiàn)全局的最優(yōu)化。

2.2.1 必要條件

控制者要實(shí)現(xiàn)全局優(yōu)化控制，需要滿足以下基本條件。

1）信息透明，控制者清楚地知道被控者的策略以及效用函數(shù)，這樣控制者才能正確地選擇全局優(yōu)化的策略。

2）控制先行，控制者先于被控者做出控制策略的行動(dòng)。

3 DRM博弈控制

為了從控制博弈的角度來(lái)研究DRM價(jià)值鏈中實(shí)體的決策行為及相互影響，并尋求全局優(yōu)化的解決方案，在前面建立控制博弈的基礎(chǔ)上建立DRM博弈控制模型，內(nèi)容提供商作為控制者來(lái)實(shí)施全局優(yōu)化的策略。

3.1 參與者

為了便于從博弈角度對(duì)其進(jìn)行研究，本文從DRM價(jià)值鏈的內(nèi)在利益關(guān)系和價(jià)值目標(biāo)不同的角度出發(fā)，將DRM價(jià)值鏈中的眾多實(shí)體抽象為2個(gè)參與者：內(nèi)容提供商和用戶。內(nèi)容提供商的利益目標(biāo)是通過(guò)銷售數(shù)字內(nèi)容來(lái)最大程度地獲利，用戶的利益目標(biāo)則是用最小的代價(jià)來(lái)使用數(shù)字內(nèi)容。因此，在進(jìn)行數(shù)字內(nèi)容的銷售和傳播過(guò)程中，雙方的利益目標(biāo)是不同的。正是由于策略目標(biāo)的不同而導(dǎo)致決策沖突的發(fā)生，成為需要用博弈理論來(lái)分析和優(yōu)化原因。

實(shí)際中，內(nèi)容提供商是通過(guò)DRM系統(tǒng)來(lái)實(shí)施各種保護(hù)措施和營(yíng)銷策略的，而用戶是基于已有的DRM系統(tǒng)來(lái)購(gòu)買數(shù)字內(nèi)容的，因此，DRM系統(tǒng)的策略是先于用戶的購(gòu)買策略的，內(nèi)容提供商很適合作為控制博弈的控制者，而用戶則作為被控者。所以，本文選擇內(nèi)容提供商作為DRM控制博弈的控制者，用戶則為被控者。

3.2 策略

策略是指參與人的行動(dòng)規(guī)則，它表明了參與者在輪到自己行動(dòng)的情形下，可以采取的行動(dòng)。在深入分析內(nèi)容提供商和用戶決策行為的基礎(chǔ)上，本文對(duì)用戶和內(nèi)容提供商的策略進(jìn)行了抽象和總結(jié)。

3.2.1 用戶策略

用戶是數(shù)字內(nèi)容的使用者，決策行為主要體現(xiàn)在是否使用合法數(shù)字內(nèi)容，因此，用戶有如下策略。

1) 合法購(gòu)買數(shù)字內(nèi)容，用Su_id表示。

2) 使用盜版內(nèi)容，用Su_id表示。

3) 不使用數(shù)字內(nèi)容，用Su_nu來(lái)表示，當(dāng)使用合法數(shù)字內(nèi)容或盜版內(nèi)容的代價(jià)太大時(shí)，用戶會(huì)選擇不使用數(shù)字內(nèi)容。

用戶策略集合用Su來(lái)表示，即Su={Su_id,Su_id ,Su_nu }。

3.2.2 內(nèi)容提供商策略

內(nèi)容提供商是數(shù)字內(nèi)容的提供者，主要行為集中在提供數(shù)字內(nèi)容是所采用的安全策略，以及銷售價(jià)格。本文將內(nèi)容提供商的行為抽象為如下策略。

1) 銷售數(shù)字內(nèi)容的價(jià)格，用dcP來(lái)表示。銷售價(jià)格是內(nèi)容提供商進(jìn)行行銷的主要調(diào)控手段，直接關(guān)系了內(nèi)容提供商的收益。

2) 共享策略，用sP來(lái)表示。本文將內(nèi)容提供商的各種技術(shù)保護(hù)策略統(tǒng)一為共享策略，因?yàn)閮?nèi)容提供商使用技術(shù)保護(hù)策略的主要目的就是限制用戶的共享，以維護(hù)自身的利益。因此，數(shù)字內(nèi)容和設(shè)備綁定的策略，可以理解為是一種最低限度的共享策略，該策略下，用戶不能共享數(shù)字內(nèi)容；而無(wú)技術(shù)保護(hù)策略，可以理解為一種最大限度的共享策略，該策略下用戶可以任意共享數(shù)字內(nèi)容，且不承擔(dān)技術(shù)保護(hù)的成本。

3) 隱私保護(hù)級(jí)別，用pL表示。用戶隱私信息有助于內(nèi)容提供商進(jìn)行營(yíng)銷和技術(shù)保護(hù)，同時(shí)也關(guān)系到用戶對(duì)DRM系統(tǒng)的滿意度，因此，用戶隱私信息保護(hù)是內(nèi)容提供商的一個(gè)重要策略。0≤pL≤1指內(nèi)容提供商對(duì)用戶購(gòu)買數(shù)字內(nèi)容的隱私信息的保護(hù)級(jí)別，pL =0時(shí)，內(nèi)容提供商不保護(hù)用戶隱私，pL =1時(shí)，用戶購(gòu)買數(shù)字內(nèi)容時(shí)無(wú)任何隱私信息泄漏。

4) 不銷售數(shù)字內(nèi)容，用nsdS來(lái)表示。當(dāng)內(nèi)容提供商銷售數(shù)字內(nèi)容的效用低于一定限額時(shí)，內(nèi)容提供商將選擇不銷售數(shù)字內(nèi)容。

用戶和內(nèi)容提供商的策略及其符號(hào)如表1所示。

表1 策略符號(hào)

3.3 效用函數(shù)

本節(jié)將討論用戶和內(nèi)容提供商在不同策略下的效用，用Vdc表示一份數(shù)字內(nèi)容的使用價(jià)值，用Pdc表示該數(shù)字內(nèi)容的價(jià)格，用Vs表示無(wú)技術(shù)保護(hù)的情況下，用戶合法共享數(shù)字內(nèi)容的效用，用Vp表示用戶隱私完全保護(hù)給用戶帶來(lái)的效用。

3.3.1 內(nèi)容提供商效用

內(nèi)容提供商效用取決于數(shù)字內(nèi)容的價(jià)格和銷售數(shù)字內(nèi)容的成本。銷售數(shù)字內(nèi)容的成本主要包括以下幾個(gè)方面。

1) 數(shù)字內(nèi)容生產(chǎn)成本，用Ccdc來(lái)表示。

2) 共享策略成本，用Ccp-sp來(lái)表示。

3) 隱私保護(hù)成本，用Ccp-pp來(lái)表示。

4) 數(shù)字內(nèi)容共享的負(fù)面作用，用fcp-sp來(lái)表示。

用σu表示用戶的策略。令內(nèi)容提供商不銷售數(shù)字內(nèi)容時(shí)的效用為0，即

假設(shè)技術(shù)成熟的條件下，隱私保護(hù)成本以及保護(hù)性共享的成本相對(duì)于整個(gè)營(yíng)業(yè)成本來(lái)說(shuō)是可忽略的，即Ccp-s=0以及Ccp-pp=0。則內(nèi)容提供商提供數(shù)字內(nèi)容，且用戶購(gòu)買數(shù)字內(nèi)容時(shí)的效用表示為

3.3.2 用戶效用

用戶效用主要取決于數(shù)字內(nèi)容的使用價(jià)值和使用數(shù)字內(nèi)容的成本。用戶使用數(shù)字內(nèi)容的成本分2種。

1) 用戶使用合法購(gòu)買的數(shù)字內(nèi)容的成本，對(duì)比用戶使用非保護(hù)的數(shù)字內(nèi)容的體驗(yàn)，本文將技術(shù)保護(hù)的負(fù)面作用分為以下3個(gè)方面。

a) 內(nèi)容價(jià)格，數(shù)字內(nèi)容是有銷售價(jià)格dcP的，用戶購(gòu)買合法數(shù)字內(nèi)容是必須承擔(dān)這個(gè)基本費(fèi)用。

b) 共享限制負(fù)作用，用fu-pp表示。包括用戶使用DRM系統(tǒng)的投資，DRM系統(tǒng)對(duì)用戶終端設(shè)備系統(tǒng)性能的影響以及不能共享所帶來(lái)的不便，fu-pp是內(nèi)容提供商共享策略sP的函數(shù)。

c) 隱私泄露負(fù)作用，用fu-pp表示，用戶使用DRM系統(tǒng)購(gòu)買數(shù)字內(nèi)容時(shí)，或多或少地都會(huì)泄漏用戶的隱私信息，fu-pp是內(nèi)容提供商隱私保護(hù)等級(jí)的函數(shù)，fu-pp=(1-pL)pV。

2) 用戶使用非法盜版數(shù)字內(nèi)容的成本，主要包括使用盜版數(shù)字內(nèi)容所承受的法律、道德成本以及數(shù)字內(nèi)容質(zhì)量的損失等。用edV表示這部分成本。

用cpσ表示內(nèi)容提供商的策略，令用戶不使用數(shù)字內(nèi)容的效用為0，即

用lV表示用戶使用正版數(shù)字內(nèi)容帶來(lái)的正面心理效用，則用戶購(gòu)買正版數(shù)字內(nèi)容的效用為

同時(shí)，假設(shè)用戶使用盜版數(shù)字內(nèi)容時(shí)是可以完全共享數(shù)字內(nèi)容的，自身的隱私信息也是完全安全的，則用戶使用盜版數(shù)字內(nèi)容的效用如下：

3.4 控制目標(biāo)

數(shù)字內(nèi)容產(chǎn)業(yè)健康發(fā)展的基本要求是用戶購(gòu)買合法的數(shù)字內(nèi)容，同時(shí)內(nèi)容提供商能通過(guò)出售數(shù)字內(nèi)容而獲利，同時(shí)，要盡可能地提高內(nèi)容提供商和用戶的效用。因此，綜合內(nèi)容提供商和用戶效用，給出全局效用函數(shù)為

其中，cpσ是內(nèi)容提供商的控制策略，uσ表示用戶在內(nèi)容提供商選擇cpσ的情況下，依據(jù)自身利益最大化而選擇的策略。α和β表示用戶和內(nèi)容提供商的全局效用系數(shù)0＜α≤1，0＜β≤1。μ和γ表示用戶和內(nèi)容提供商的策略效用系數(shù)函數(shù)。

內(nèi)容提供商總是努力選擇使W值最大的策略。

3.5 控制策略

現(xiàn)在，討論內(nèi)容提供商如何選擇控制策略。

首先，用戶購(gòu)買數(shù)字內(nèi)容的條件為

由式(3)～式(5)得：

式(12)可化簡(jiǎn)為

為了使目標(biāo)函數(shù)W最大化，內(nèi)容提供商控制策略如下。

首先，選擇適當(dāng)?shù)某鍪蹆r(jià)格dcP、共享策略sP和隱私保護(hù)等級(jí)pL，以確保式(11)、式(13)和式(14)成立，在此基礎(chǔ)上，內(nèi)容提供商盡可能地提高隱私保護(hù)的等級(jí)，這樣可以提高用戶的效用，進(jìn)而提高目標(biāo)函數(shù)W的值，此外，內(nèi)容提供商還通過(guò)選擇適當(dāng)?shù)墓蚕聿呗?，以進(jìn)一步提高用戶或自己的效用，以提高目標(biāo)函數(shù)W的值。

4 結(jié)束語(yǔ)

為了解決DRM價(jià)值鏈中個(gè)體理性與集體理性相矛盾現(xiàn)象的問(wèn)題。本文提出了博弈控制的概念。博弈的控制者依據(jù)控制目標(biāo)來(lái)選擇策略，迫使被控者依據(jù)自身利益最大化原則選擇控制者期望的策略，從而實(shí)現(xiàn)全局的優(yōu)化控制。然后，對(duì)DRM價(jià)值鏈中的實(shí)體進(jìn)行了提取，以內(nèi)容提供商和用戶為研究對(duì)象，建立了DRM博弈控制模型，分析了內(nèi)容提供商如何作為博弈的控制者選擇全局優(yōu)化策略，為DRM的合理應(yīng)用提供了理論指導(dǎo)。

[1] FAZIO N. On Cryptographic Techniques for Digital Rights Management[D]. Ph D Dissertation, New York University, 2006.

[2] CORIA L, NASIOPOULOS P, WARD R. A robust content-dependent algorithm for video watermarking[A]. Proceedings of 2006 ACM Workshop on Digital Rights Management[C]. Alexandria, Virginia,USA, 2006.

[3] MALIK H, KHOKHAR A, ANSARI R. Improved watermark detection for pread-spectrum based watermarking using independent component analysis[A]. Proceedings of 2005 ACM Workshop on Digital Rights Management[C]. Alexandria, Virginia, USA, 2005.

[4] ABIE H. Frontiers of DRM knowledge and technology[J].IJCSNS International Journal of Computer Science and Network Secu 216 Rity,2007, 7(1):216-231.

[5] HEILEMAN G, JAMKHEDKAR P, KHOURY J, etal. The DRM game[A]. Proceedings of 2007 ACM Workshop on Digital Rights Management[C]. Alexandria, Virginia, USA, 2007.

[6] CHANG Y. Who should own access rights? a game-theoretical approach to striking the optimal balance in the debate over digital rights management[J]. Artificial Intelligence and Law, 2007, 15: 323-356.

[7] ZHANG Z Y, PEI Q Q, YANG L, MA J F. Game-theoretic analyses and simulations of adoptions of security policies for DRM in contents sharing scenario [J]. Intelligent Automation and Soft Computing, 2011,17(2): 191-203.

[8] ZHANG Z Y, PEI Q Q, MA J F, etal. Cooperative and non-cooperative game-theoretic analyses of adoptions of security policies for DRM[A]. Proceedings of 5th IEEE International Workshop on Digital Rights Management Impact on Consumer Communications, Satellite Workshop of 6th IEEE Consumer Communica-tions & Networking Conference[C]. Las Vegas, Nevada,USA, 2009.

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看