馬國(guó)峻,裴慶祺,姜曉鴻
(1. 西安電子科技大學(xué) 計(jì)算機(jī)學(xué)院,陜西 西安 710071;2. 西安電子科技大學(xué) 綜合業(yè)務(wù)網(wǎng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710071)
數(shù)字版權(quán)管理(DRM, digital right management)技術(shù)是數(shù)字內(nèi)容交易過(guò)程中對(duì)知識(shí)產(chǎn)權(quán)進(jìn)行保護(hù)的技術(shù)、工具和處理過(guò)程的總稱,包括對(duì)數(shù)字資產(chǎn)各種形式的使用進(jìn)行描述、識(shí)別、交易、保護(hù)、監(jiān)控和跟蹤等各個(gè)過(guò)程。
DRM價(jià)值鏈由內(nèi)容提供商、用戶等多個(gè)實(shí)體構(gòu)成,實(shí)際中,這些實(shí)體都具有“理性”的特點(diǎn),是以自我利益最大化為目標(biāo)的。由于利益目標(biāo)不同,這些實(shí)體之間存在利益沖突和策略競(jìng)爭(zhēng)的現(xiàn)象,例如,一方面,用戶總想以最低的代價(jià)來(lái)使用數(shù)字內(nèi)容,于是出現(xiàn)了非法共享等行為。另一方面,為了防止數(shù)字內(nèi)容的非法共享,內(nèi)容提供商采用各種技術(shù)手段來(lái)控制、追查數(shù)字內(nèi)容的使用[1~3],以維護(hù)自身的利益。然而,技術(shù)保護(hù)的負(fù)面作用又加劇了用戶非法共享數(shù)字內(nèi)容的企圖[4]。DRM價(jià)值鏈的這種矛盾現(xiàn)象,使人們逐漸認(rèn)識(shí)到發(fā)展DRM而應(yīng)該從綜合各方利益的角度出發(fā),需要尋求利益均衡的解決方案[5,6]。
博弈論也稱作“對(duì)策論”,是研究決策主體的行為發(fā)生相互作用時(shí)的決策以及這種決策的均衡問(wèn)題的理論,是研究競(jìng)爭(zhēng)場(chǎng)景下決策主體行為的重要工具。由于DRM價(jià)值鏈中實(shí)體的決策行為和利益關(guān)系,恰好屬于博弈論的研究范圍。因此,一些學(xué)者開始從博弈論角度來(lái)分析DRM現(xiàn)象、探討DRM價(jià)值鏈中各方利益均衡問(wèn)題[5~8]。和這些工作不同的是,本文并不是單純地用博弈論來(lái)解釋DRM價(jià)值鏈內(nèi)實(shí)體的行為,也不熱衷于納什均衡點(diǎn)的尋求,而是從非合作博弈的特性入手,首次提出了博弈控制理論,并以此為基礎(chǔ)來(lái)探討DRM價(jià)值鏈內(nèi)實(shí)體選取策略的原則,為DRM的合理發(fā)展提供了理論指導(dǎo)。
由于DRM價(jià)值鏈內(nèi)的各個(gè)參與實(shí)體間難以形成一個(gè)穩(wěn)定的協(xié)議,因此,本文認(rèn)為DRM價(jià)值鏈內(nèi)的各個(gè)參與實(shí)體間的利益關(guān)系和決策行為表現(xiàn)為非合作博弈。由于非合作博弈不一定有純策略納什均衡點(diǎn),并且納什均衡點(diǎn)也不一定是全局最優(yōu)點(diǎn),即個(gè)人理性和集體理性相矛盾。因此,目前DRM價(jià)值鏈中參與實(shí)體之間難以達(dá)到一個(gè)全局優(yōu)化的均衡點(diǎn)。非合作博弈的這一特點(diǎn)是當(dāng)前DRM現(xiàn)狀的一個(gè)根本解釋。因此,DRM的合理發(fā)展需要克服個(gè)體理性的局限,實(shí)現(xiàn)全局優(yōu)化。為此,本文提出了控制博弈的概念和模型??刂撇┺脑诨静┺哪P偷幕A(chǔ)上引入了控制者和控制目標(biāo),控制者是全局理性的,被控者是個(gè)體理性的。控制者依據(jù)控制目標(biāo)來(lái)選擇自己的策略,“迫使”被控者則依據(jù)自身利益最大化原則選擇控制者期望的策略,從而實(shí)現(xiàn)全局的優(yōu)化控制。然后,本文從DRM價(jià)值鏈的利益關(guān)系入手,選取內(nèi)容提供商和用戶作為博弈的參與者,并對(duì)他們的策略和效用進(jìn)行了分析和建模,建立了DRM控制博弈模型,最后,闡述了內(nèi)容提供商如何作為博弈的控制者來(lái)選擇全局優(yōu)化策略,以實(shí)現(xiàn)和用戶之間的穩(wěn)定的互利共贏。
一個(gè)基本的博弈模型可表示為G=(P,S,U,Γ),其中P表示參與者,S表示策略集,U表示效用函數(shù)。
1) P (參與者),是參與博弈的直接當(dāng)事人,是博弈的決策主體和策略制定者。參與者具有“理性”的特征,他們行動(dòng)時(shí)都是以自身利益最大化目標(biāo)的。參與者可以是個(gè)人也可以是為了一個(gè)共同目標(biāo)或效用而參加博弈的集體。如果G有n個(gè)參與者,用P={1,,…n}表示參與者集合。
2) S (策略集),參與者可選擇全部行動(dòng)規(guī)則的集合。如果G有n個(gè)參與者,分別用S1,…,Sn每個(gè)參與者的策略集,用sij∈Si表示參與者i的第j個(gè)策略,同時(shí)用S-i表示除參與者i之外的其他參與者選擇的策略集合。
3) U(效用函數(shù)),用于計(jì)算特定的策略組合下各個(gè)參與者收益的大小,如果G有n個(gè)參與者,用U1,… ,Un分別表示每個(gè)參與者的收益函數(shù)。
4) Γ表示博弈的所有納什均衡點(diǎn)集合,即Γ={τ1,… ,τm},其中τi表示博弈G的第i個(gè)納什均衡點(diǎn)。τi是一個(gè)策略組合對(duì)于?i∈P,?σi∈Si有
其中,*iσ稱為參與者i在此均衡點(diǎn)的占優(yōu)策略。
非合作博弈中,個(gè)人理性和集體理性往往是相矛盾的,理性的個(gè)體追求自身利益最大化的結(jié)果卻實(shí)現(xiàn)不了集體利益的最大化,從而也不能真正實(shí)現(xiàn)自身利益的最大化。因此,非合作博弈不一定有純策略納什均衡點(diǎn),同時(shí)納什均衡點(diǎn)往往不是全局最優(yōu)點(diǎn),如典型的非合作博弈模型—囚徒困境模型。
2.2.1 模型
為了克服個(gè)體理性的局限,實(shí)現(xiàn)全局的理性,本文提出了控制博弈的概念??刂撇┺脑诨痉呛献鞑┺哪P偷幕A(chǔ)上引入了控制者和控制目標(biāo),控制者也是博弈的參與者,但是控制者是全局理性的,而被控者是個(gè)體理性的,被控制的目標(biāo)總是需求自身利益最大化的??刂普咭罁?jù)控制目標(biāo)來(lái)選擇自己的策略,“迫使”被控者則依據(jù)自身利益最大化原則選擇控制者期望的策略,從而,實(shí)現(xiàn)全局的優(yōu)化控制。
1) C表示控制者,控制者是博弈的參與者的子集,即C?P,控制者是全局理性的,控制者會(huì)依據(jù)全局效用函數(shù)W來(lái)選擇基于W全局優(yōu)化的戰(zhàn)略。
2) A是控制策略的集合,A是控制者實(shí)施控制的策略集合。
5) W表示全局效用函數(shù),是控制目標(biāo)的體現(xiàn)。它是控制策略A和的函數(shù),控制者選擇控制策略的目標(biāo)是使該函數(shù)的值最大,以實(shí)現(xiàn)全局的最優(yōu)化。
2.2.1 必要條件
控制者要實(shí)現(xiàn)全局優(yōu)化控制,需要滿足以下基本條件。
1)信息透明,控制者清楚地知道被控者的策略以及效用函數(shù),這樣控制者才能正確地選擇全局優(yōu)化的策略。
2)控制先行,控制者先于被控者做出控制策略的行動(dòng)。
為了從控制博弈的角度來(lái)研究DRM價(jià)值鏈中實(shí)體的決策行為及相互影響,并尋求全局優(yōu)化的解決方案,在前面建立控制博弈的基礎(chǔ)上建立DRM博弈控制模型,內(nèi)容提供商作為控制者來(lái)實(shí)施全局優(yōu)化的策略。
為了便于從博弈角度對(duì)其進(jìn)行研究,本文從DRM價(jià)值鏈的內(nèi)在利益關(guān)系和價(jià)值目標(biāo)不同的角度出發(fā),將DRM價(jià)值鏈中的眾多實(shí)體抽象為2個(gè)參與者:內(nèi)容提供商和用戶。內(nèi)容提供商的利益目標(biāo)是通過(guò)銷售數(shù)字內(nèi)容來(lái)最大程度地獲利,用戶的利益目標(biāo)則是用最小的代價(jià)來(lái)使用數(shù)字內(nèi)容。因此,在進(jìn)行數(shù)字內(nèi)容的銷售和傳播過(guò)程中,雙方的利益目標(biāo)是不同的。正是由于策略目標(biāo)的不同而導(dǎo)致決策沖突的發(fā)生,成為需要用博弈理論來(lái)分析和優(yōu)化原因。
實(shí)際中,內(nèi)容提供商是通過(guò)DRM系統(tǒng)來(lái)實(shí)施各種保護(hù)措施和營(yíng)銷策略的,而用戶是基于已有的DRM系統(tǒng)來(lái)購(gòu)買數(shù)字內(nèi)容的,因此,DRM系統(tǒng)的策略是先于用戶的購(gòu)買策略的,內(nèi)容提供商很適合作為控制博弈的控制者,而用戶則作為被控者。所以,本文選擇內(nèi)容提供商作為DRM控制博弈的控制者,用戶則為被控者。
策略是指參與人的行動(dòng)規(guī)則,它表明了參與者在輪到自己行動(dòng)的情形下,可以采取的行動(dòng)。在深入分析內(nèi)容提供商和用戶決策行為的基礎(chǔ)上,本文對(duì)用戶和內(nèi)容提供商的策略進(jìn)行了抽象和總結(jié)。
3.2.1 用戶策略
用戶是數(shù)字內(nèi)容的使用者,決策行為主要體現(xiàn)在是否使用合法數(shù)字內(nèi)容,因此,用戶有如下策略。
1) 合法購(gòu)買數(shù)字內(nèi)容,用Su_id表示。
2) 使用盜版內(nèi)容,用Su_id表示。
3) 不使用數(shù)字內(nèi)容,用Su_nu來(lái)表示,當(dāng)使用合法數(shù)字內(nèi)容或盜版內(nèi)容的代價(jià)太大時(shí),用戶會(huì)選擇不使用數(shù)字內(nèi)容。
用戶策略集合用Su來(lái)表示,即Su={Su_id,Su_id ,Su_nu }。
3.2.2 內(nèi)容提供商策略
內(nèi)容提供商是數(shù)字內(nèi)容的提供者,主要行為集中在提供數(shù)字內(nèi)容是所采用的安全策略,以及銷售價(jià)格。本文將內(nèi)容提供商的行為抽象為如下策略。
1) 銷售數(shù)字內(nèi)容的價(jià)格,用dcP來(lái)表示。銷售價(jià)格是內(nèi)容提供商進(jìn)行行銷的主要調(diào)控手段,直接關(guān)系了內(nèi)容提供商的收益。
2) 共享策略,用sP來(lái)表示。本文將內(nèi)容提供商的各種技術(shù)保護(hù)策略統(tǒng)一為共享策略,因?yàn)閮?nèi)容提供商使用技術(shù)保護(hù)策略的主要目的就是限制用戶的共享,以維護(hù)自身的利益。因此,數(shù)字內(nèi)容和設(shè)備綁定的策略,可以理解為是一種最低限度的共享策略,該策略下,用戶不能共享數(shù)字內(nèi)容;而無(wú)技術(shù)保護(hù)策略,可以理解為一種最大限度的共享策略,該策略下用戶可以任意共享數(shù)字內(nèi)容,且不承擔(dān)技術(shù)保護(hù)的成本。
3) 隱私保護(hù)級(jí)別,用pL表示。用戶隱私信息有助于內(nèi)容提供商進(jìn)行營(yíng)銷和技術(shù)保護(hù),同時(shí)也關(guān)系到用戶對(duì)DRM系統(tǒng)的滿意度,因此,用戶隱私信息保護(hù)是內(nèi)容提供商的一個(gè)重要策略。0≤pL≤1指內(nèi)容提供商對(duì)用戶購(gòu)買數(shù)字內(nèi)容的隱私信息的保護(hù)級(jí)別,pL =0時(shí),內(nèi)容提供商不保護(hù)用戶隱私,pL =1時(shí),用戶購(gòu)買數(shù)字內(nèi)容時(shí)無(wú)任何隱私信息泄漏。
4) 不銷售數(shù)字內(nèi)容,用nsdS來(lái)表示。當(dāng)內(nèi)容提供商銷售數(shù)字內(nèi)容的效用低于一定限額時(shí),內(nèi)容提供商將選擇不銷售數(shù)字內(nèi)容。
用戶和內(nèi)容提供商的策略及其符號(hào)如表1所示。
表1 策略符號(hào)
本節(jié)將討論用戶和內(nèi)容提供商在不同策略下的效用,用Vdc表示一份數(shù)字內(nèi)容的使用價(jià)值,用Pdc表示該數(shù)字內(nèi)容的價(jià)格,用Vs表示無(wú)技術(shù)保護(hù)的情況下,用戶合法共享數(shù)字內(nèi)容的效用,用Vp表示用戶隱私完全保護(hù)給用戶帶來(lái)的效用。
3.3.1 內(nèi)容提供商效用
內(nèi)容提供商效用取決于數(shù)字內(nèi)容的價(jià)格和銷售數(shù)字內(nèi)容的成本。銷售數(shù)字內(nèi)容的成本主要包括以下幾個(gè)方面。
1) 數(shù)字內(nèi)容生產(chǎn)成本,用Ccdc來(lái)表示。
2) 共享策略成本,用Ccp-sp來(lái)表示。
3) 隱私保護(hù)成本,用Ccp-pp來(lái)表示。
4) 數(shù)字內(nèi)容共享的負(fù)面作用,用fcp-sp來(lái)表示。
用σu表示用戶的策略。令內(nèi)容提供商不銷售數(shù)字內(nèi)容時(shí)的效用為0,即
假設(shè)技術(shù)成熟的條件下,隱私保護(hù)成本以及保護(hù)性共享的成本相對(duì)于整個(gè)營(yíng)業(yè)成本來(lái)說(shuō)是可忽略的,即Ccp-s=0以及Ccp-pp=0。則內(nèi)容提供商提供數(shù)字內(nèi)容,且用戶購(gòu)買數(shù)字內(nèi)容時(shí)的效用表示為
3.3.2 用戶效用
用戶效用主要取決于數(shù)字內(nèi)容的使用價(jià)值和使用數(shù)字內(nèi)容的成本。用戶使用數(shù)字內(nèi)容的成本分2種。
1) 用戶使用合法購(gòu)買的數(shù)字內(nèi)容的成本,對(duì)比用戶使用非保護(hù)的數(shù)字內(nèi)容的體驗(yàn),本文將技術(shù)保護(hù)的負(fù)面作用分為以下3個(gè)方面。
a) 內(nèi)容價(jià)格,數(shù)字內(nèi)容是有銷售價(jià)格dcP的,用戶購(gòu)買合法數(shù)字內(nèi)容是必須承擔(dān)這個(gè)基本費(fèi)用。
b) 共享限制負(fù)作用,用fu-pp表示。包括用戶使用DRM系統(tǒng)的投資,DRM系統(tǒng)對(duì)用戶終端設(shè)備系統(tǒng)性能的影響以及不能共享所帶來(lái)的不便,fu-pp是內(nèi)容提供商共享策略sP的函數(shù)。
c) 隱私泄露負(fù)作用,用fu-pp表示,用戶使用DRM系統(tǒng)購(gòu)買數(shù)字內(nèi)容時(shí),或多或少地都會(huì)泄漏用戶的隱私信息,fu-pp是內(nèi)容提供商隱私保護(hù)等級(jí)的函數(shù),fu-pp=(1-pL)pV。
2) 用戶使用非法盜版數(shù)字內(nèi)容的成本,主要包括使用盜版數(shù)字內(nèi)容所承受的法律、道德成本以及數(shù)字內(nèi)容質(zhì)量的損失等。用edV表示這部分成本。
用cpσ表示內(nèi)容提供商的策略,令用戶不使用數(shù)字內(nèi)容的效用為0,即
用lV表示用戶使用正版數(shù)字內(nèi)容帶來(lái)的正面心理效用,則用戶購(gòu)買正版數(shù)字內(nèi)容的效用為
同時(shí),假設(shè)用戶使用盜版數(shù)字內(nèi)容時(shí)是可以完全共享數(shù)字內(nèi)容的,自身的隱私信息也是完全安全的,則用戶使用盜版數(shù)字內(nèi)容的效用如下:
數(shù)字內(nèi)容產(chǎn)業(yè)健康發(fā)展的基本要求是用戶購(gòu)買合法的數(shù)字內(nèi)容,同時(shí)內(nèi)容提供商能通過(guò)出售數(shù)字內(nèi)容而獲利,同時(shí),要盡可能地提高內(nèi)容提供商和用戶的效用。因此,綜合內(nèi)容提供商和用戶效用,給出全局效用函數(shù)為
其中,cpσ是內(nèi)容提供商的控制策略,uσ表示用戶在內(nèi)容提供商選擇cpσ的情況下,依據(jù)自身利益最大化而選擇的策略。α和β表示用戶和內(nèi)容提供商的全局效用系數(shù)0<α≤1,0<β≤1。μ和γ表示用戶和內(nèi)容提供商的策略效用系數(shù)函數(shù)。
內(nèi)容提供商總是努力選擇使W值最大的策略。
現(xiàn)在,討論內(nèi)容提供商如何選擇控制策略。
首先,用戶購(gòu)買數(shù)字內(nèi)容的條件為
由式(3)~式(5)得:
式(12)可化簡(jiǎn)為
為了使目標(biāo)函數(shù)W最大化,內(nèi)容提供商控制策略如下。
首先,選擇適當(dāng)?shù)某鍪蹆r(jià)格dcP、共享策略sP和隱私保護(hù)等級(jí)pL,以確保式(11)、式(13)和式(14)成立,在此基礎(chǔ)上,內(nèi)容提供商盡可能地提高隱私保護(hù)的等級(jí),這樣可以提高用戶的效用,進(jìn)而提高目標(biāo)函數(shù)W的值,此外,內(nèi)容提供商還通過(guò)選擇適當(dāng)?shù)墓蚕聿呗?,以進(jìn)一步提高用戶或自己的效用,以提高目標(biāo)函數(shù)W的值。
為了解決DRM價(jià)值鏈中個(gè)體理性與集體理性相矛盾現(xiàn)象的問(wèn)題。本文提出了博弈控制的概念。博弈的控制者依據(jù)控制目標(biāo)來(lái)選擇策略,迫使被控者依據(jù)自身利益最大化原則選擇控制者期望的策略,從而實(shí)現(xiàn)全局的優(yōu)化控制。然后,對(duì)DRM價(jià)值鏈中的實(shí)體進(jìn)行了提取,以內(nèi)容提供商和用戶為研究對(duì)象,建立了DRM博弈控制模型,分析了內(nèi)容提供商如何作為博弈的控制者選擇全局優(yōu)化策略,為DRM的合理應(yīng)用提供了理論指導(dǎo)。
[1] FAZIO N. On Cryptographic Techniques for Digital Rights Management[D]. Ph D Dissertation, New York University, 2006.
[2] CORIA L, NASIOPOULOS P, WARD R. A robust content-dependent algorithm for video watermarking[A]. Proceedings of 2006 ACM Workshop on Digital Rights Management[C]. Alexandria, Virginia,USA, 2006.
[3] MALIK H, KHOKHAR A, ANSARI R. Improved watermark detection for pread-spectrum based watermarking using independent component analysis[A]. Proceedings of 2005 ACM Workshop on Digital Rights Management[C]. Alexandria, Virginia, USA, 2005.
[4] ABIE H. Frontiers of DRM knowledge and technology[J].IJCSNS International Journal of Computer Science and Network Secu 216 Rity,2007, 7(1):216-231.
[5] HEILEMAN G, JAMKHEDKAR P, KHOURY J, etal. The DRM game[A]. Proceedings of 2007 ACM Workshop on Digital Rights Management[C]. Alexandria, Virginia, USA, 2007.
[6] CHANG Y. Who should own access rights? a game-theoretical approach to striking the optimal balance in the debate over digital rights management[J]. Artificial Intelligence and Law, 2007, 15: 323-356.
[7] ZHANG Z Y, PEI Q Q, YANG L, MA J F. Game-theoretic analyses and simulations of adoptions of security policies for DRM in contents sharing scenario [J]. Intelligent Automation and Soft Computing, 2011,17(2): 191-203.
[8] ZHANG Z Y, PEI Q Q, MA J F, etal. Cooperative and non-cooperative game-theoretic analyses of adoptions of security policies for DRM[A]. Proceedings of 5th IEEE International Workshop on Digital Rights Management Impact on Consumer Communications, Satellite Workshop of 6th IEEE Consumer Communica-tions & Networking Conference[C]. Las Vegas, Nevada,USA, 2009.