方燕 隆云滔
〔摘要〕本文闡述和探究了數字時代下的數據變革趨勢及國家支持政策、數據經濟理論和數據治理的基本問題。首先,促進數據要素的運用與發(fā)展已經成為全球共識。其次,基于不同假定和市場情境,學術界對搜集與使用用戶數據問題的理論研究在數據共享的效率影響方面得出了不同結論:當消費者是否理性、是否擁有信息優(yōu)勢的假定不同時,數據優(yōu)勢是否會被濫用、數據共享是否會提升效率的研究結論完全相反;在數據技術、數據交易、數據支付等不同市場情境中,會出現多種福利結果,如效率提升、市場失靈、服務提供者可能濫用數據信息優(yōu)勢等。最后,學術界對于數據治理方面的研究主要圍繞數據產權的界定與分配、數據集中及數據(和算法)倫理責任等三個方面展開。數據產權界定和分配主要依據數據分類分級原則對初始數據進行判定;數據集中主要從可觸達性或可及性而非產權角度、從數據產業(yè)價值鏈條的角度來審視;數據(和算法)倫理責任包括可解釋、可問責、透明、正義與中立等方面的義務。本文的探究和梳理有助于深化對數據的認識和治理。
〔關鍵詞〕數據變革;數據理論;數據治理;數據市場;數據產權;數據集中
中圖分類號:F49??? 文獻標識碼:A??? 文章編號:1008-4096(2021)03-0015-13
一、引? 言
以大數據、云計算和人工智能等為代表的新一輪科技革命和產業(yè)變革,正在深刻影響著人類的經濟社會生活并改變著產業(yè)發(fā)展格局。由于大數據的使用、算力的提高和算法的突破,人工智能得以快速發(fā)展與廣泛應用,呈現出深度學習、跨界融合、人機協(xié)作、群智開放和自主操控等新特征。人工智能越是“智能”“智慧”或“人格化”,越需要獲取、存儲、分析、處理和使用更多的個人信息數據[1-2]。大數據與算法規(guī)則(特別是智能算法)之間存在緊密關系。數據要素是決定數字時代特別是移動互聯(lián)網時代下企業(yè)存亡的關鍵維度。
隨著數字經濟向縱深發(fā)展,確保數字市場充分有效競爭和維持強勁的研發(fā)創(chuàng)新激勵成為互聯(lián)網監(jiān)管和治理的一個重要話題,數據治理是其中的重點和難點。無論是歐盟及其成員國,還是美國國內各司法轄區(qū)都已經或正在推動數字監(jiān)管的立法、司法和執(zhí)法工作。在國內,2020年12月,中央政治局會議和中央經濟工作會議確定了強化反壟斷監(jiān)管和防止資本無序擴張的基調,并提出要完善平臺企業(yè)壟斷認定、數據收集使用管理、消費者權益保護等方面的法律規(guī)范。隨后,中央政法委、最高法院、中國人民銀行、銀保監(jiān)會、國家市場監(jiān)督管理總局及交通運輸部等部門紛紛響應并做出相應部署。近幾年來互聯(lián)網經濟中頻繁涌現屏蔽封殺、大數據殺熟、排他性交易等亂象是反壟斷執(zhí)法的重點。2021年初,國家市場監(jiān)督管理總局先后對阿里投資銀泰、騰訊閱文收購新麗傳媒和順豐收購中郵智遞等三起未依法申報實施經營者集中的違法行為進行了行政處罰,調查了阿里的二選一等行為,處罰了京東、天貓和唯品會的不正當價格競爭等違法行為。盡管國內外數字監(jiān)管動作不斷,但目前對互聯(lián)網特別是數據治理規(guī)則理念的理解和認識仍不夠深入和全面。
盡管幾十年前就有不少針對用戶數據搜集和使用問題的學術研究,但進入移動互聯(lián)網時代后,大數據技術及應用的迅速發(fā)展變化促使學術研究進程加速、研究重點發(fā)生改變。當前圍繞用戶數據搜集和使用問題的理論和政策研究雖有所推進,但仍有許多課題要攻克。數據治理成為全球各國政府和學界討論的重要議題。為了更好地看清數字時代的未來,很有必要深入探究數字時代下數據及其技術帶來的深刻變革,梳理用戶數據搜集和使用問題的理論進展,并提煉出數據治理過程中涉及的經濟學基本理論問題。
二、數據變革趨勢及其發(fā)展政策
(一)大數據變革
在數字時代,越來越多的活動被數字化,虛擬網絡空間產生的顆粒化數據(Granular Data)呈爆炸式膨脹,數字網絡平臺及其相關技術可以便利地獲知特定個人(或群體)的諸如年齡、性別、地理位置、家庭成員組成、飲食習慣、人口和生物統(tǒng)計概況等信息。無論是企業(yè)(如互聯(lián)網科技企業(yè)、電信運營商和智能終端制造商)還是相關組織機構(如政府機關、行業(yè)協(xié)會商會)都能夠相對較為便利地收集到全樣本數據[3]。相比以往,可搜集的用戶數據規(guī)模和范圍不可同日而語[4-5]。同時,企業(yè)也能借助自動處理軟件和算法規(guī)則在短時間里分析、處理和使用這些數據,并在此基礎上形成規(guī)則化的決策流程。除公共數據由政府掌控之外,其他商業(yè)性的社會數據大多由互聯(lián)網通信運營商(如中國移動、中國聯(lián)通和中國電信)、移動智能終端制造商、互聯(lián)網服務提供商(如美國的GAFAM、中國的BAT、字節(jié)跳動、美團和滴滴等),以及專門收集、處理和銷售數據資料的數據運營(經紀)公司所掌控。
大數據對消費者和生產者裨益良多。企業(yè)通過收集、處理有關用戶行為和特征的數據來歸納用戶的基本屬性、預測用戶的行為(如喜好品位、習慣和心理)[6],透析用戶的興趣點和痛點,從而實現精準營銷(Targeted Marketing),如推出新產品和改進既有產品、提供個性化訂制服務、精準化廣告投放和實時供給、精準診斷當前現狀和預測未來趨勢(如疾病、自然災難等)[7]。消費者在享受算法規(guī)則、語音識別、圖像識別、無人駕駛等數據技術帶來便利的同時,消費者提供的數據在這些技術的實現中扮演著驅動算法不斷優(yōu)化迭代的角色。而不斷優(yōu)化的軟件算法規(guī)則與不斷積累的海量數據及其不斷增加的潛在價值之間的循環(huán)驅動,是互聯(lián)網(或人工智能)科技巨頭核心競爭力的真正源頭[8]。
(二)用戶數據要素的爭奪
人類文明的每個重要階段都有其關鍵性資源,如19世紀的煤炭、20世紀的石油和電力。到21世紀,大數據儼然成為新“原油”和新“電力”,是數據驅動式研發(fā)(Data-Driven Innovation)的基礎設施性資源(Infrastructural Resource)[9]。對數據的搜集、分析提煉、合成流轉乃至使用將貫穿整個數字產業(yè)鏈,尤其是數據的收集和分析環(huán)節(jié)。
對用戶數據要素的爭奪已成為現代企業(yè)特別是互聯(lián)網平臺競相角逐的主要內容,也產生了很多糾紛案件。2017年,微軟旗下的職業(yè)社交網站領英因以用戶隱私保護為名阻止雇員評估服務提供商hiQ Labs未經授權抓取領英的公開用戶數據而被hiQ Labs起訴、京東旗下“京東微聯(lián)”智能家居應用軟件因將用戶個人WiFi密碼上傳至京東服務器而被起訴、華為新款手機榮耀Magic因收集用戶的微信聊天記錄被騰訊起訴、Facebook因數據泄露而被美國國會傳喚等,這些都是互聯(lián)網巨頭或相關制造商爭奪(或控制)用戶數據而引發(fā)爭議的典型案例。
2017年,阿里系下子公司菜鳥網絡與國內最大的綜合性民營快遞公司順豐速遞之間,因順豐的豐巢自提柜物件數據信息共享問題而發(fā)生“豐鳥大戰(zhàn)”,其本質是對快遞物流數據信息控制權和話語權的爭奪。2017年,亞馬遜以137億美元的大手筆收購全食超市,被業(yè)界解讀為亞馬遜看中全食超市積累的海量顧客數據,能助力亞馬遜IoT+AI戰(zhàn)略積累實體的實踐場景。IBM、FAMGA和BAT等科技巨頭都在“爭先恐后”布局大數據產品和服務,而GE、西門子、亞馬遜和阿里等諸多工業(yè)制造或電商公司都對外宣稱自己是一家數據公司,從中多少都可以領略數據競爭的重要性,一個爭奪數據要素的競賽正在拉開序幕[10]。
(三)大數據的使用及其發(fā)展政策
互聯(lián)網用戶數據不單單通過提供更深刻、更豐富和更細致的信息(知識)實現企業(yè)的商業(yè)價值,還能通過揭示諸如疾病、外界氣候和官員腐敗等信息來實現政府公共價值。隨著互聯(lián)網和大數據變革向深度和廣度不斷滲透,數據經濟得到了國家越來越多的重視。
2017年12月,中共中央政治局第二次集體學習強調,“審時度勢精心謀劃超前布局力爭主動、實施國家大數據戰(zhàn)略加快建設數字中國”。劉鶴副總理指出,“數據作為生產要素,反映了隨著經濟活動數字化轉型加快,數據對提高生產效率的乘數作用凸現,成為最具時代特征新生產要素的重要變化”。大數據于2014年首次寫入政府工作報告,后來相繼出臺《促進大數據發(fā)展行動綱要》《“十三五”規(guī)劃綱要》,以及各部委跟進出臺諸多促進大數據發(fā)展的政策文件。這一系列行動使得2016年成為我國大數據的政策元年。2017年,《大數據產業(yè)發(fā)展規(guī)劃(2016—2020年)》將大數據列為國家級戰(zhàn)略并形成發(fā)展部署。2020年4月,中共中央國務院發(fā)布《構建更加完善的要素市場化配置體制機制的意見》,首次將數據與土地、勞動、資本、技術等傳統(tǒng)要素并列,提出要加快培育數據要素市場。在2021年3月的兩會中,數據發(fā)展戰(zhàn)略問題也成為討論的一個焦點,并寫入《“十四五”規(guī)劃和2035年遠景目標綱要》。在歐盟,以踐行數字化單一市場戰(zhàn)略為己任的歐盟委員會,于2016年11月發(fā)布《歐洲數據自由流動倡議》以最大化數字經濟增長,并解決數據所有權、互操作性、可用性和訪問等一系列新興問題。
三、數據理論研究進展
(一)研究用戶數據的文獻演進:SPV情景與BE情景
早在20世紀70、80年代就有產業(yè)組織學領域的學者開始研究用戶數據,試圖從經濟學角度解答這樣一個問題:一個互聯(lián)網平臺(如一個社交網絡)是否能在不提高價格、降低數量或減緩研發(fā)創(chuàng)新的前提下,借助消費者數據供應來濫用市場勢力。學界先后基于不同情景衍生出兩個相互承接又對立的理論派別。
1.在消費者理性和處于信息優(yōu)勢的情境下,數據使用會提升效率
這一派學者的理論工具是博弈論和信息經濟學,結論是基于數據的市場勢力是不可能被濫用的。主要研究的問題是,在考慮到用戶數據的不對稱信息效應時,市場一邊相對另一邊享有對個人數據的更佳信息時會帶來什么影響,特別關注研究消費者行為高度理性而服務提供者遭受信息劣勢的情景[11]-[15]。早期研究的綜述請參見Acquisti等[16]、Budzinski和Kuchinke[17]和Budzinski和Stohr[18]。Stigler[13]、Posner[14]、Varian[15]等先驅性文獻考察了消費者極端理性且相對企業(yè)擁有數據信息優(yōu)勢這樣一種不對稱情景,被稱為Stigler-Posner-Varian(SPV)情景。研究發(fā)現,在SPV情景下,對個人數據的使用越頻繁、精細,越能提高經濟效率和社會福利。這是因為消費者比企業(yè)擁有更多有關自身偏好、品位方面的信息,消費者針對服務提供者的策略性行為被極大抑制,同時也讓依托用戶數據的市場勢力濫用行為變得更加困難。這個效率促進型的研究結果使得早期文獻聚焦于如何設計消費者激勵機制,以誘導其披露更多的個性化數據[14],前提是這些被誘導披露的數據信息不被極大浪費[12-19]。
2.在消費者有限理性和處于信息劣勢的情境下,數據使用會抑制效率
隨著移動互聯(lián)網和數字經濟的普及,有關消費者數據搜集和使用問題的經濟學研究呈現全新面貌,出現諸多新洞見,進入了研究的第二個階段。這一階段的文獻不再假定消費者極端理性、企業(yè)面臨信息劣勢,而是假定消費者有限理性、天真幼稚,服務供應商擁有信息優(yōu)勢,研究結論是效率被抑制。這些文獻的研究重點轉變?yōu)橄嚓P企業(yè)何時、如何和為何使用消費者個性化數據,以及這些數據的商業(yè)價值如何等[20]-[32]。
相對于SPV情景,數字經濟的信息不對稱效應往往被扭轉,服務供應商相對消費者更加了解其偏好品味,而且消費者往往過于樂觀地認為自己的行動十分理性。隨著行為和實驗經濟學對產業(yè)組織理論的滲透,越來越多的實證經驗證據也顯示:消費者獲得的信息未被充分利用,并存在框架和錨定效應(Framing and Anchoring Effects)、損失規(guī)避(Loss Aversion)、顯著效應(Salience Effects)和滿意即可的行為(Satisficing Behaviour)等諸多心理影響;同時還發(fā)現,消費者往往是非理性的,無法正確預測自身行為和決策間的經濟關聯(lián),行事時過于信任他人[32]。企業(yè)擁有信息優(yōu)勢而消費者有限理性的情景常被文獻統(tǒng)稱為行為經濟學(Behavioural-Economics,BE)情景。
相對于完全理性消費者擁有信息優(yōu)勢的SPV情景,在消費者有限理性且面臨信息劣勢的BE情景下,以消費者福利受損為代價的濫用數據行為比比皆是,尤其是當企業(yè)擁有數據優(yōu)勢賦予的市場勢力時,更容易出現濫用行為,并確實存在采用濫用策略的激勵動機和外在條件,因而更可能導致社會福利降低,經濟效率受到損失。即便對于消費者群體中同時存在完全理性者和有限理性者的情況,效率抑制的結論同樣成立。
(二)數據市場
現有相關文獻將基于(用戶)數據的市場分為三種基本類型:數據提取和保護技術的數據技術市場(Data Technology Market)、數據作為交易標的數據交易市場(Data Trading Market),以及個性化數據作為支付或貨幣使用的數據支付市場(Paying With Data Market)。每一類市場都存在各自的技術問題和難題。
1.數據技術市場
在數據提取和保護技術的數據技術市場,精細先進的提取和分析軟件(由挑選和使用數據的公司需求所激發(fā))時時刻刻在與同樣先進的數據攔截軟件(由關注個人數據保護的消費者和重視保護本公司收集數據的公司需求所激發(fā))進行競爭。基于數據的市場力量和信息不對稱程度越大,數據技術市場越可能出現。一方面,先進的數據提取技術可以在用戶毫不知情的情況下收集到所需要的數據。如很多互聯(lián)網用戶根本沒有察覺Cookies在定期追蹤自己的在線沖浪行為,自然也就不知道這些Cookies的數量及自己被收集的數據量,更不用說獲知這些數據后續(xù)的流轉和商業(yè)使用情況。德國的Facebook反壟斷案顯示,現有的技術已經能夠做到即便用戶未訪問相關網站或使用相關服務,同樣能收集到用戶的個性化數據[33]。另一方面,攔截技術(如廣告攔截器)能夠助力用戶控制自身的個性化數據。理論上,數據提取技術和攔截技術之間的競賽會促進經濟效率和社會福利的實現[21]。但是,如果數據提取技術在互聯(lián)網巨頭雄厚財力的支持下超過了面對著毫無組織性和有限理性的用戶的數據攔截技術,可以預期這將對消費者福利帶來負面影響。
2.數據交易市場
如果用戶的個性化數據擁有商業(yè)價值,圍繞這些數據的交易市場就能促進數據的有效配置[15]。數據交易市場面臨的首要問題是,一旦消費者數據被初始數據收集者獲得并轉售,消費者往往沒有能力預測到自身數據的后續(xù)使用情況,這便產生了資源配置無效和用戶隱私泄露的潛在風險。而另外一個重要問題則與數據價值相關。
一方面,很大程度上,用戶數據的商業(yè)價值并沒有明確的保證,真正能夠確保用戶數據價值的是整理和分析數據并從中獲取有價值結論的工具和能力,這些數據處理技術才是企業(yè)真正的稀缺資源,并只有當事企業(yè)才能完全擁有和掌握[34]。鑒于此,平臺企業(yè)對用戶數據價值的了解程度通常要高于用戶。另一方面,企業(yè)擁有很強的激勵動機去操縱數據價值的對外透明度,目的是掩蓋數據價值。這一點在2016年德國的Facebook濫用市場支配地位案中得到了很好體現。在該案中,執(zhí)法者指控Facebook濫用其社交網絡市場支配地位的行為主要體現為兩點:一是在一般服務條款中使用消費者在競爭情境下不可能認同的數據使用規(guī)則;二是有意制造數據使用的不透明,特別是在第三方網站中。平臺相對用戶更了解用戶數據價值,且平臺有動力操縱甚至掩蓋數據價值,使得數據價值的實現受到制約,數據交易市場存在失靈的可能。
3.數據支付市場
絕大多數互聯(lián)網用戶都會參與數據支付市場,為了能夠享受到互聯(lián)網產品(如服務和內容),用戶愿意用個人數據來交換,而不是借助支付傳統(tǒng)貨幣(零貨幣價格)或接受隱性的貨幣價格折扣來實現。只有在兩個前提條件下消費者才能從零貨幣價格中獲益:一是用零貨幣價格支付的產品服務給互聯(lián)網用戶帶來的個人價值不低于被換走的個人數據給互聯(lián)網用戶帶來的個人價值,二是互聯(lián)網用戶對個人數據及其使用帶來的市場價值足夠了解,此信息足夠透明。由于互聯(lián)網用戶對數據價值的了解程度系統(tǒng)性地低于對貨幣價值的了解程度,數據支付市場隱含著交易成本問題。同時,現實中的互聯(lián)網用戶并非完全理性,這就意味著主觀上的貨幣價值與其說是理性計算而來,不如說是慣例、經驗或傳統(tǒng)引致的結果。此外,只要在線服務生產商擁有信息優(yōu)勢,無論在服務市場有無市場勢力,都可能存在濫用的動機和能力。
從互聯(lián)網企業(yè)的角度而言,數據支付市場孕育了基于數據的商業(yè)模式——個性化、精準化?;ヂ?lián)網經濟理論的相關文獻探索了私人訂制模式有利可圖的原因及其對消費者福利的影響等問題?;跀祿纳虡I(yè)模式有三種常見表現。
第一種是精準化廣告投放(Targeted Advertising)?;ヂ?lián)網用戶的個性化數據(尤其是行為數據)被用于揭示目標用戶的偏好品位,進而向其進行個性化、精準化的廣告投放。消費者在獲取免費的在線服務和數字內容時需要用其注意力、個人數據等標的物來換取。由于互聯(lián)網企業(yè)的廣告業(yè)務本質上是借助間接(交叉)網絡效應形成多邊平臺市場或新增平臺邊數來開創(chuàng)收入新來源,精準化廣告投放進一步提升了從管控間接(交叉)網絡效應過程中獲得的盈利水平。根據個性化數據向特定的在線用戶推送產品廣告信息能夠大大提高目標用戶的購買概率,廣告對用戶的負間接網絡效應相對降低,由于定向廣告推送更有效率,廣告商自然更愿意為此支付更高的價格,平臺利潤隨之上升。精準化廣告對消費者福利的影響并不明確。盡管相對于普通廣告而言,定向廣告對用戶的干擾度下降[21-35],但定向廣告的數量和滲透率更高,屏蔽隔離廣告所要付出的成本也更大,數據安全和隱私被侵害的擔憂也更急切[24-36]。要結合特定情景進行個案分析,才能對這兩方面的利弊進行權衡。
第二種是個性化訂制服務(Tailormade Services)?;趥€人數據進行訂制服務本身可以是一種產品,也可以是便利其他用戶進行購買的一種營銷方式和手段,如基于個人數據的搜索服務和推薦服務。在線搜索服務商(如谷歌搜索、百度搜索)依據關鍵詞和特定要求提供搜索結果排序以滿足用戶的搜索偏好,而推薦服務商(如亞馬遜、Netflix、Spotify、阿里和京東)基于目標用戶和其他用戶的消費歷史信息進行有針對性的產品推薦。個性化訂制服務更容易誘導發(fā)生額外消費,提高產品的流轉率和銷售利潤。同時,根據消費者偏好塑造數字產品往往也提升了消費者的福利[21]。
第三種是基于數據的價格差別和歧視(Data-Based Price Differentiation and Discrimination)。先進的個性化數據分析技術能夠幫助手握海量數據的企業(yè)更準確地透視用戶對特定產品的個人支付意愿信息,便于進行差別定價。理論上,基于個人數據的個性化價格接近于經典經濟學中的第一價格歧視這種理想化情形。盡管目前暫時未廣泛出現如此精細化的價格歧視系統(tǒng),但已經出現試圖讓價格隨著平臺專用的搜索歷史、位置、購買時序、智能設備類型等通用信息而調整的價格歧視初步版本,甚至還可以兼顧考慮一些動態(tài)定價因素[37]。然而,基于數據的價格歧視至少面臨三個急需克服的問題。首先,要求數據的質量和數量足夠完美,才能確保足夠接近第一價格歧視。其次,數字時代下市場透明化的大趨勢(如在線易得的無偏比價服務),使得基于數據的價格歧視情景增多,適用難度降低。最后,價格歧視行為謀取到的高邊際利潤可能受到有效競爭的蠶食,使得價格歧視的危害性下降甚至反轉為有利因素。
理論上,在SPV情景下,基于數據的價格歧視可能會由于實現了效率所得和銷量增長而起到提高社會福利的效果[13]-[15]。在消費者完全理性且擁有信息優(yōu)勢的同質化市場情境中,基于數據的價格歧視尤其可能提升福利水平。但是,在企業(yè)擁有信息優(yōu)勢的異質性市場情境中,則更可能降低福利水平[12-20-23]。此外,允許企業(yè)依據用戶實際支付意愿索取價格會讓消費者剩余被極大地轉移至企業(yè),出現轉移分配效應。在BE情景下,對消費者福利的負影響可能更普遍,在具有如下特性的情景下更是如此:產品異質性(產品/服務差異性甚至個性化)、鎖定效應和轉移壁壘高企、消費者處于信息劣勢[20-23]、有關用戶數據使用的信息缺失[21]、競爭強度缺乏令用戶選擇余地不足[30]等。此外,當用戶為有限理性時,基于數據的價格歧視不僅可能降低靜態(tài)的消費者福利[29-32],還可能降低動態(tài)的消費者福利,如劣質產品在市場上長期存續(xù)甚至一度猖獗[28]。
現代在線服務市場(如通信市場)往往呈現BE情景特征。SPV情景假定潛在用戶能充分利用可獲得信息,足夠理性地做出是否入網或下載安裝特定應用的行為決策。然而,經驗證據顯示,用戶往往會因信息冗長、語言復雜和自我無助感等忽視相關信息[22-31]。同時,還存在用戶行為數據披露的偏好與其所宣稱的偏好之間不一致的問題,從而出現隱私悖論[25-26]。
在數據收集和分析階段存在程度各異的規(guī)模經濟和范圍經濟,這往往被認為是提升經濟效率和社會福利的一個重要契機。這是因為,規(guī)模經濟和范圍經濟會降低搜索服務和匹配交易的成本,促使一些原本不可能發(fā)生的新式交易批量涌現,還促進了研發(fā)創(chuàng)新活動,保障實現長期效率[38]。數據的規(guī)模經濟和范圍經濟在一定程度上支持了“數據越多、縱向一體化越好”的論斷。當具有不完全重疊數據資源的企業(yè)之間進行并購重組會壯大自有數據庫容量及其信息量,便于改善現有產品質量和研發(fā),從而推出全新服務。收集更多的用戶數據便于企業(yè)更及時準確地預測和滿足用戶的差異化和個性化服務訴求,由此數據交易可能對于相關企業(yè)和消費者而言都是一種福利提升。
四、數據治理基本問題探索
數字時代下網絡數據包括政府系統(tǒng)內部積累的公共數據,以及經濟系統(tǒng)中積累的商業(yè)數據,后者可分為個人數據和非個人數據。本文所指的數據主要是商業(yè)數據。在對個人數據收集、分析和使用等各環(huán)節(jié)中進行治理時至少涉及數據產權的界定與分配、數據集中、數據(和算法)倫理責任等三大類理論議題[38]。
(一)數據產權的界定和分配
數據產權配置是數據治理的一個首要問題。用戶數據究竟應該屬于平臺還是用戶?擁有用戶數據的企業(yè)是否有權借助數據獲利?經濟學界和法學家對數據產權配置的看法和邏輯不盡相同甚至完全相反。
1.經濟學家對數據產權的看法及其邏輯
芝加哥學派的邏輯能較好地解釋初始數據的產權歸屬問題,用戶數據歸屬于數據收集企業(yè)。個人免費享用的更高質量、個性化服務是通過讓渡個人數據有償交換而來?;蛘哒f,為獲取用戶數據,網站或APP通常提供超低價甚至免費服務?;ヂ?lián)網用戶提供個人數據是為了換取服務(如無需支付貨幣就使用搜索引擎、社交網絡、即時消息、在線視頻、地圖或電子郵箱等),或者登錄一個商業(yè)交易過程(如登陸淘寶、滴滴出行和美團點評等)。
Tirole[39]對用戶數據的歸屬問題給出一個初步判斷:如果企業(yè)收集數據需要創(chuàng)新性手段或承擔較高的成本,就應允許企業(yè)持有數據并借數據盈利;如果收集數據很容易且成本低廉,數據應歸用戶個人;如果用戶提供的數據與后續(xù)的數據處理之間存在明確界限,數據屬于客戶且可攜帶,只要客戶愿意則可以將數據轉移給第三方。在美國,從2014年起,患者可以獲得自身的醫(yī)療數據并以標準且安全的方式存儲?;颊咧恍柰ㄟ^應用程序中的藍色按鈕,就能訪問其電子病例檔案和選擇是否愿意將病例數據分享給醫(yī)療服務供應商。理論上,如果處理這些原始數據需要創(chuàng)新性手段或成本較高,原始數據經處理后形成的二手數據產權應歸屬企業(yè)。依照此邏輯,游戲內容是典型的用戶生產型內容(User-Generated Content,UGC),應歸屬游戲平臺;而游戲直播和解說則增加了新視角和新理念,賦予網絡游戲新的價值、功能和性質,改變了其原本的功能或目的,構成對游戲作品的轉換性使用,因而應屬于游戲主播的著作權。
事實上,在實踐中很難確定原始數據和處理數據之間的邊界。首先,數據質量(客觀可靠性)可能取決于企業(yè)的努力程度。網站和APP應用運營商面臨的一個主要挑戰(zhàn)是確保數據的可靠性、防止有人操縱數據,如賣家雇傭水軍發(fā)布好評帖子(或給競爭對手差評)。淘寶和天貓則嚴厲打擊賣家采用好評返現手段操控評分的行為,谷歌則加大投入以確保其網站鏈接排序(部分取決于其受歡迎程度)不會因某個網站人為增加點擊量而被扭曲。如果平臺投入巨資打擊數據操控,以確保數據的可靠性并創(chuàng)造經濟價值,平臺則有理由索要相關數據的產權。其次,數據收集與處理相互關聯(lián)。待收集的數據種類反過來取決于數據信息的使用,這使得更難在屬于用戶的原始數據與屬于企業(yè)的處理數據之間做出明確區(qū)分。
從規(guī)范經濟學角度來看,最佳的數據產權歸屬應按照社會福利最大化目標和成本—收益權衡原則來配置。將數據產權配置給平臺企業(yè)能夠誘導企業(yè)更好地收集和使用數據,產生更大的數據規(guī)模和范圍經濟,創(chuàng)造出更多的經濟價值[40]-[42]。但是,這也可能提升平臺采取反競爭行為(如價格壟斷、合謀等)的能力和動機[43],存在侵犯用戶隱私和數據安全的可能。由于用戶無能力也無意愿開發(fā)數據,將數據產權配置給用戶就不存在這一權衡問題。按照科斯定理,在交易成本足夠低時,初始產權歸屬的劃分不重要,通過交換對數據資源評價最高的一方總能獲得數據產權。思想實驗顯示,即便宣稱對隱私很重視的人也會以很低的價格出讓自己的隱私信息[44]。這個現象印證了數據對于個體用戶的價值低于其對平臺的價值,這則意味著,將數據產權劃歸給平臺可能更有效率,這也說明,個人對數據的評價無法反映數據的社會價值。
2.法學家對數據產權的看法及其監(jiān)管思路
法學界對個人數據產權的歸屬問題也未達共識。一部分法學家吸收了芝加哥學派的觀點,認同將個人數據產權劃歸平臺。但是,更多的法學人士堅持認為網絡世界產生的海量數據應歸屬數據的原始來源——用戶個人。如果說印刷革命帶來了知識產權、工業(yè)革命普及了專利制度,那么互聯(lián)網數字革命必定帶來個人數據所有權。根據法學家的理解,個人數據所有權同樣包括產權制度的經典元素:個人要按自己的想法使用自己的數據、個人若想毀滅自己的數據無須獲得任何“遺忘權”、個人可以隨愿出售自己的數據以獲取一定的利潤回報。為了管理付費數據,可以嘗試為每個互聯(lián)網用戶設立一個智能賬戶來存儲信息并規(guī)定使用條件。讓個人更多地控制其數字生活的“痕跡”帶來的好處,但這一理解超過了純粹經濟意義上的公平范疇。
盡管不少法學家堅持互聯(lián)網數據歸屬互聯(lián)網用戶的觀點,但當今世界還沒有一部法律體系承認個人數據所有權。這或許是因為個人數據產權下的數據交易市場缺乏效率。雖然直覺看來,個人數據所有權似乎會刺激個人數據市場的出現,但實則不然,個人數據市場會面臨Akerlof式逆向淘汰問題,最終導致數據市場徹底萎縮或至少是令此市場不再重要。在將個人數據劃歸用戶個人的法律制度設計下,當個人的在線數據能夠以公平價格售賣,個人就有動力花費時間和精力故意增加在線時間和在線數據量。顯然,這一道德風險行為會導致數據質量普遍下降,不能很好地揭示出偏好和品位等私人信息。理性的數據需求企業(yè)購買此等數據的意愿和出價水平都將下降,數據市場最終會萎縮??傊绻麛祿a權劃歸用戶個人則無法誘導出現數據市場,數據的價值將不能實現。
雖然將數據產權劃歸平臺會帶來潛在的隱私安全(Privacy Safety and Security)和數據壟斷(Data-Opolies)等問題,但也不應因此就徹底否定平臺對數據的產權。如果數據產權界定給平臺,產權保護的方式尤其重要。法律經濟學大師Calabresi[45]指出三種影響深遠的資源產權保護規(guī)則:財產規(guī)則(Property Rule)、責任規(guī)則(Liability Rule)和不可轉讓性規(guī)則(Inalienability Rule)。財產規(guī)則是指除非產權持有者自愿轉讓,否則不得強制轉讓產權,且轉讓價格應由交易雙方協(xié)商確定;責任規(guī)則是指非產權持有者可以不經過產權持有人的同意就提前使用,事后只需支付一個由獨立第三方認可的公平價格;不可轉讓性規(guī)則是指即使擁有產權,也不能對其隨意轉讓。Calabresi進一步指出,對于交易過程中不產生顯著外部性的資源而言,當市場交易成本很低時,財產規(guī)則更有效率,通過自愿談判能讓交易各方滿意;當交易成本較高時,責任規(guī)則可能要比財產規(guī)則更有效。對于會產生明顯外部性的資源,產權應滿足不可轉讓性規(guī)則。這三大規(guī)則后來成為全球各國制定數據政策時倡導遵守的基本準則。對于大部分的互聯(lián)網數據,應當適用責任規(guī)則,可以允許需求者使用并與數據所有者商討報酬償付;對于一些會帶來潛在外部性的重要私密數據,可適用不可轉讓性規(guī)則。當然,在落實數據產權保護的基本原則時,還會面臨監(jiān)控數據復制傳播和使用的難題,需輔以區(qū)塊鏈等新技術來解決。
總之,按效率標準,應將數據產權劃分給平臺,而其帶來的隱私權和壟斷憂慮則可通過產權保護來緩解甚至消除。
(二)數據集中
1.數據集中帶來的復雜影響
用戶的行為和特征數據越來越集中到少數大型企業(yè)中。首先,數據相對集中是隨著業(yè)務的成功自然形成,成功企業(yè)的算法規(guī)則因受到越來越多數據的“喂養(yǎng)”而自然得到優(yōu)化和升級,并無原罪可言。其次,數據集中通??赡墚a生提升經濟效率的結果[46]。如數據驅動型并購交易行為借助數據重組,實現服務提升、價格降低和研發(fā)助推的效率促進式論斷,正是2012年評分評論平臺運營商Bazaarvoice并購其競爭對手Power Reviews時向美國司法部和法院提供的辯護理由,也是2010年Microsoft并購Yahoo搜索業(yè)務時主張的主要理由。最終結果是,前者被禁止而后者被批準,這是因為,前案交易促成一個壟斷者,而后案交易培育和壯大一個能更有效地與行業(yè)領導者Google搜索進行競爭的對手。Telefonica/Vodafone/Everything Everywhere并購案(2012)和Publicis/Omnicom并購案(2014)均涉及數據分析服務提供商之間的競爭,并不直接相關于數據收集問題。最后,現代企業(yè)有時也可能借數據驅動策略獲得、維持或強化不公平不合理的競爭優(yōu)勢,破壞競爭秩序和抑制研發(fā)創(chuàng)新活動[10-47]。正如OECD[48]的報告顯示,大數據經濟學傾向于誘導形成市場集中化和支配化的格局。當集中化是市場成功的結果時,數據驅動型市場能帶來贏者通吃的局面。特別地,大數據在惠及消費者的同時也存在傷害消費者的可能,如私有數據(數據是互聯(lián)網的新貨幣)和廣告(時間是金錢)給消費者帶來的直接成本,數據激發(fā)的市場勢力帶來的高價格、低產出、低質量和研發(fā)缺乏等[7]。避免此等潛在損害的常用手段是實施競爭政策和消費者權益保護。
涉及大數據的反壟斷管制面臨的一個首要理論問題是,相對而言,大數據驅動的經濟行為是否更可能具有反競爭性。相關的政策問題則是大數據是否應納入反壟斷分析框架?如果應納入其中,又如何納入?其他更具體的問題有如,大數據對主導性平臺的市場勢力帶來什么影響?大數據是否天然具有排他性?如何預防平臺濫用數據優(yōu)勢?面對數據濫用時應如何應對和懲處?等等。對于涉及大數據的反壟斷執(zhí)法而言,目前主要關注數據驅動型并購、封鎖數據原料(和拒絕數據開放)、憑借大數據濫用市場支配地位(如大數據殺熟)等。后一類問題牽涉必要設施理論和原則在大數據中的適用性探索。防范數據過于集中、實現數據效率是競爭執(zhí)法的一個重點和難點,算法規(guī)則設計是否應遵守數據保護和反壟斷法也是一個復雜的問題。
2.破解數據集中的潛在思路
針對數據集中的擔憂,從以下兩方面審視有助于消減甚至克服:
第一點從可觸達性而非產權角度審視數據集中問題。將數據比喻為新原油在某些方面似乎有道理:原始數據和原油都需經過提煉才能變得有用。但是,兩者存在重要區(qū)別:原油是競爭性的,某人消費原油,其他人獲取變少;而數據是非競爭性的,某人對數據的使用不會降低或妨礙他人對數據的使用。從這個角度來說,真正要聚焦的不是適用于私人品的數據所有權(Ownership)概念,而應是數據可觸達性或可及性(Data Access)概念。數據很少像私人品那樣銷售,而主要是為特定目的進行的授權。要解答的問題不是誰應擁有自動駕駛等網上沖浪數據,而是誰應該能觸達這些數據和能用這些數據做什么。通常情況下,多個主體能同時設置多個數據收集裝置,可以同時觸達同一批數據。要求毫無理由地獨家掌控數據會無故地限制數據的流通、共享和使用。從原始數據中提煉出來的某些信息可能會受到版權保護,但原始數據在現有知識產權制度下不受保護。數據提供商仍有動力囤積一些數據,有償或無償地提供給他人,并以私人合同的方式限制數據轉售或再授權以控制數據流動范圍。
第二點是從數據價值鏈的角度審視數據集中問題。從可觸達性而非權屬角度來審視數據壟斷(Data Monopolization/Data-Opolies)問題是第一要義。第二要義是從整個數據產業(yè)價值鏈角度來解讀數據集中問題:從數據收集、存儲、分析、處理和使用這一整個鏈條來審視企業(yè)在數據收集階段的優(yōu)勢是否會帶來競爭優(yōu)勢和帶來多大的競爭優(yōu)勢。顯然,如果某個企業(yè)在數據價值鏈多個乃至所有環(huán)節(jié)都處于優(yōu)勢(甚至壟斷)地位,其數據優(yōu)勢能彰顯競爭優(yōu)勢的論斷很可能成立。至少在這種情況下,數據優(yōu)勢直接影響著其他企業(yè)對用戶數據的可觸達性。狹義的數據優(yōu)勢僅僅是指數據收集階段處于優(yōu)勢(甚至壟斷)地位。其實,數據壟斷化是體現數據多用途性的集中多樣性(Concentric Diversification)。換用現代經濟學術語表述,集中多樣性就是數據要素的規(guī)模經濟、范圍經濟和速度經濟。大數據一般是指個人數據,理論上還應包括企業(yè)數據和政府公共數據等。按照數據生產或持有主體可劃分為政府公共數據、企業(yè)數據和個人數據。政府公共數據是指政府及其行政機關在依法履職過程中產生或獲取的以一定形式記錄和保存的各類數據資源。企業(yè)數據是反映企業(yè)基本狀況的數據資源,如企業(yè)財務數據、(研發(fā)、采購、生產和銷售等環(huán)節(jié)的)經營數據、人力資源數據和通過授權直接或間接采集的個人數據。個人數據是以電子或其他方式記錄的能單獨或與其他信息相結合以識別自然人個人身份的信息,包括但不限于自然人的姓名、出生日期、身份證號、個人生物識別信息、住址、病史、電話號碼和習慣癖好等。
(三)數據(和算法)倫理責任
總體而言,隨著數字平臺中存在的幾乎無限的用戶數據收集和處理能力,與有限的用戶認知能力之間鴻溝的不斷擴大,大數據在惠及用戶群體的同時,也面臨人身自由喪失、數據算法規(guī)則不夠透明、算法責任擔當缺乏及數據和算法濫用等擔憂[38]。從這個意義說,大數據社會好比一個黑箱社會(Black Box Society)。需要特別強調的是,數據流通共享過程中的數據泄露和用戶隱私問題。目前與數據競爭緊密相關的隱私保護競賽尚未開始,但數據泄露和隱私侵害卻頻繁發(fā)生。2018年3月,英國Cambridge Analytical咨詢機構濫用Facebook的五千萬用戶數據的丑聞持續(xù)發(fā)酵,促使世界各國加強對數據資產(特別是關乎企業(yè)重大商業(yè)利益的數據資源)所有相關方利益的協(xié)調和規(guī)范。中國銀監(jiān)會于2018年3月發(fā)布《銀行業(yè)金融機構數據治理指引(征求意見稿)》,就相關數據治理問題征求社會意見,至此中國銀行業(yè)金融機構全面的數據治理拉開大幕。隨著數據泄露事件頻繁發(fā)生,以及民眾和政府對隱私保護的日益重視,數據治理和企業(yè)對隱私保護的競賽將成為主流趨勢。
個人數據信息分析與市場勢力的聯(lián)合不僅涉及隱私權,很可能影響消費者選擇權、言論自由權和非歧視權等基本的人類權利。此外,大數據和基礎算法還被賦予了諸多的倫理責任和義務,如算法規(guī)則可解釋(Explainability)、算法后果可擔責(Accountability)、算法透明(Algorithmic? Transparency)、算法設計遵守隱私保護、數據安全和反壟斷要求、數據公正(Data Justice)和算法中立(Algorithmic Neutrality)等。在人工智能應用中兼顧個人、經濟和國家安全保護,確保可用、可靠、可控,是急需關注的技術、經濟、社會、法律乃至倫理道德問題[49]。學界和實業(yè)界就數據或智能算法的責任問題目前仍未達成一致,表現在如下四方面。
1.依靠數據和智能算法做出的決策和行為后果問責
誰應為借助大數據和智能算法做出的決策和行為后果負責,到底是數據和算法創(chuàng)造者(如程序開發(fā)者、獨立第三方)、用戶(企業(yè)管理層、商業(yè)企業(yè))還是獲益者(企業(yè)股東、管理層)?2017年10月,美國參眾兩院相繼批準首部規(guī)范美國自動駕駛汽車產業(yè)發(fā)展的立法《通過革命性技術發(fā)展實現更安全交通的美國愿景(American Vision for Safer Transportation Through? Advancement of Revolutionary Technologies,簡稱AV START Act)》和《自動駕駛法案(Self-Drive? Act)》。美國自動駕駛汽車立法在加速(而非限制)自動駕駛技術和應用創(chuàng)新進程的同時,明確了自動駕駛汽車交通事故的責任主體。在大數據和智能算法的助推下,用戶尤其是未成年用戶對互聯(lián)網產品(從在線游戲拓展至社交產品、社區(qū)產品、短視頻產品等)的“上癮性”不斷增強,對屏幕時間的監(jiān)控和管理責任應該劃歸平臺還是政府?目前來看,騰訊對在線游戲時間進行監(jiān)控、谷歌面向安卓用戶推出數字健康功能,蘋果則規(guī)定了用戶在Ios系統(tǒng)中查看各應用程序使用時長和方式、設置單個應用每日使用時長上限,Instagram和Facebook也在跟進推出用戶使用時長監(jiān)測功能,這些無不彰顯平臺在管理使用時間和培養(yǎng)良好的網絡使用習慣方面的主動作為。針對數字內容的監(jiān)管也是平臺主動或被動選擇承擔的職責。2017年末發(fā)生的虐童風暴尚未平息,2018年初網絡世界對兒童的惡意(主要是邪典視頻)又被掀開。色情和暴力等不良內容污染兒童(也包括所有成年人)的精神世界,平臺應該承擔起凈化本平臺內容的義務。
2.以反對數據歧視和數據透明等為表現形式的數據正義和算法中立
皮尤研究中心2018年發(fā)布的報告《算法面前的公眾態(tài)度》指出,伴隨著算法的普及,公眾開始對算法歧視產生懷疑。報告中針對美國成年人的一項調查顯示,58%的美國人認為算法不同程度地帶有人為偏見,還對隱私造成侵犯,將被評估者置于不公平的境地。與求職歧視、消費歧視和司法歧視等一樣,數據和算法歧視也前所未有地被制度化和系統(tǒng)化。法律僅規(guī)定要更小心和負責任地收集、使用和共享任何敏感數據顯然是不夠的。根據大數據的相關性原理,只是將敏感數據簡單排除(簡單脫媒操作),不能保證真正有效地防止數據泄露。這是因為,基于經此等操作后的數據仍能推測出被排除的信息。要識別和規(guī)避數據(和算法)應用過程中的數據(和算法)歧視和偏見,必須讓數據(和算法)透明,增強個人知情權以對沖相關主體間的信息不對稱性。此類問題面臨諸多需要權衡取舍的兩難抉擇:如何確保既能夠有效使用數據,又能夠保護用戶隱私和數據安全,防止隱私和數據泄露?如何在實現數據效率的同時兼顧數據正義?
3.算法透明
算法規(guī)則是否應該滿足透明性原則?是否應該適當適度地對外公開算法源代碼?國內外最新出臺的相關法律法規(guī)對算法透明都有著不同考量。修訂版《反不正當競爭法》專注于網絡不正當競爭專條,而未考慮算法透明性,《電子商務法》(第34條)首次提出算法透明問題,規(guī)定消費者擁有算法的選擇權,但未規(guī)定算法對外公開。美國計算機協(xié)會USACM就算法透明度和可擔責性發(fā)布六條原則:意識原則,算法規(guī)則的利益相關者應意識到算法在設計、實施和使用中存在的潛在偏見及其帶來的潛在危害;準入和補救原則,監(jiān)管者應鼓勵采用機制對因算法決策而受損的個人或群體提出質疑和糾正;問責原則,算法使用者應對算法決策結果承擔無過錯責任,即便使用者無法詳細解釋算法對結果的影響機理;透明原則,使用算法決策的機構對算法規(guī)則和決策給出解釋,尤其在公共政策或公共服務環(huán)境領域下的數據來源原則,算法構建者應對訓練數量來源進行說明,并對數據收集過程中的潛在偏差進行探索;可審計性原則,應對模型、算法、數據和決策等進行記錄,以便在出現可疑問題時進行審計;驗證與測試原則,算法構建者應嚴格驗證算法模型,記錄、公開驗證方法和結果并定期測試,以評估和確定算法模型是否產生歧視性損害。2017年12月,美國紐約市議會通過算法問責法案,以解決市政機構自動決策算法的公平性、問責性和透明度問題。
雖然算法透明性早已進入國內外立法者的視野,但實質性地推進算法透明的政策原則仍缺乏成熟的時機。原因至少有三:首先,算法規(guī)則通常被認為是商業(yè)機密,立法要求公開全部算法會違背知識產權制度,會因損害相關企業(yè)利益而難以推進。其次,在實際操作上,難以明晰和監(jiān)督算法公開的種類和程度。公開簡單算法還是公開全部算法規(guī)則?主管部門也缺乏技術能力去檢驗或審計算法公開的落實情況。最后,算法過于透明反而會被惡意利用,如有些黑帽SEO公司利用谷歌等公司的收錄規(guī)則制造海量垃圾鏈接以提升目標客戶的谷歌收錄排名,有些刷單公司利用淘寶、天貓等電商平臺的公開算法進行刷單,以讓目標店鋪擠入最大流量頁面等。實現算法透明性的預期效果需要精細化和配套化的輔助設計,這是一個綜合了學理性和操作性的復雜問題。目前,算法透明慢慢被越來越多人關注。甚至有人認為數據日益成為公共資源,算法規(guī)則也應被界定為一種公共服務。美國電子隱私信息中心甚至倡導,在法律和技術的交叉點,算法規(guī)則公開透明是一項基本的人權。
總而言之,實施算法透明性和可擔責性在實踐中面臨困難[50],如對外強制公布算法機密可能會降低相關企業(yè)的投資和研發(fā)激勵。此外,單單披露復雜的程序代碼不足以作為一個完整的透明化舉措。還需花費資源和精力對算法規(guī)則進行調查和監(jiān)控。當算法自動做出決策時,透明性和可擔責性原則會面臨挑戰(zhàn)。
4.智能算法倫理
數字經濟的發(fā)展嚴重依賴于大數據和人工智能算法規(guī)則,在此期間,人工智能作為互聯(lián)網經濟的延伸和拓展也得到長足發(fā)展。為了規(guī)范人工智能的發(fā)展,自2017年起,全球各國紛紛出臺人工智能政策,其中大多涉及或聚焦倫理道德問題。未來生命研究院FLI在召開阿希洛馬會議時倡導達成了23條AI倫理原則;德國發(fā)布《自動和聯(lián)網駕駛》報告提出全球首個自動駕駛汽車的20條倫理原則;電器電子工程師學會IEEE發(fā)布《人工智能設計的倫理準則(第二版)》,全面闡述了人工智能13個方面的倫理事項。人工智能倫理道德的一個重要方面是給予機器人法律地位。韓國國會提出《機器人基本法案》,積極探索機器人法律問題。阿沙尼亞政府公布《人工智能法案》,考慮賦予人工智能代理人法律地位。歐盟議會通過全球首個《機器人民事法律規(guī)則》的決議,要求歐盟委員會提交關于機器人和人工智能民事責任的法律提案:成立統(tǒng)一的機器人和人工智能監(jiān)管機構、采用登記制度和引入電子人格,并就倫理、創(chuàng)新和知識產權保護等提出建議。
五、總結與展望
本文較為系統(tǒng)地闡述和探究了數字時代下數據要素的發(fā)展趨勢及其政策、大數據經濟理論和數據治理的基本問題。當今時代,數字化、網絡化、智能化的發(fā)展趨勢讓數據更加顆?;?,收集、存儲、分析和使用數據的方式發(fā)生顯著變化。其中數據及其算法競爭逐漸取代傳統(tǒng)的價格、產品等方面的競爭而成為核心競爭維度。全球各國競相支持大數據的運用與發(fā)展,試圖為未來博取競爭優(yōu)勢。圍繞搜集和使用用戶數據問題的理論研究聚焦于企業(yè)借助數據供應濫用市場勢力的可能性、可行性及具體數據市場問題的研究。基于消費者理性和擁有信息優(yōu)勢的經典經濟學假定不認為數據優(yōu)勢存在被濫用的可能,普遍得到數據共享促進效率的結論,但后續(xù)研究的假設條件演變?yōu)橄M者有限理性和處于信息劣勢,研究認為,數據優(yōu)勢肯定存在被濫用的可能,數據共享會抑制效率。
在數據技術市場中,數據提取技術和攔截技術之間的競賽會促進效率提升;在數據交易市場中,數據初始提供者不了解數據的使用情況和數據價值,導致市場失靈成為常態(tài);在數據支付市場中,消費者不一定能從零貨幣價格中獲利,在線服務提供者可能濫用數據信息的優(yōu)勢,同時不同的私人訂制模式會對社會福利產生不同影響。
大數據時代數據治理圍繞數據產權界定與分配、數據集中、數據(和算法)倫理責任來展開。數據產權界定和分配問題,首先要依據數據分類分級原則按初始數據和處理數據等類型進行判定。數據集中問題是指數據可觸達性或可及性而非產權上的壟斷,要從整個數據產業(yè)價值鏈條的角度來審視,而不能拘泥于數據收集和使用兩個環(huán)節(jié)。數據(和算法)倫理責任包括可解釋、可問責、透明、正義與中立等方面的義務。
參考文獻:
[1]? 楊明.確保安全、可靠、可控:兼顧人工智能應用和隱私保護[N]. 人民日報,2019-07-12.
[2]? 郭軍.從解放人的體力到溫暖人的心靈:讓人工智能更好造福人類[N]. 人民日報,2019-07-10.
[3]? Einav, L., Levin, J. Economics in the Age of Big Data[J]. Science, 2014, 346 (6210): 715-721.
[4]? Feinstein, D. The Not-So-Big News About Big Data[R]. Federal Trade Commission, 2015.
[5]? Feinstein, D. Big Data in a Competition Environment[J]. CPI Antitrust Chronicles, 2015, 5(3): 24-35.
[6]? Kosinski, M., Stilwell, D., Graepel, T. Private Traits and Attributes are Predictable From Digital Records of Human Behavior[R]. Proceedings of the National Academy of Sciences (PANAS) of the United States of America, 2013.
[7]? OECD of Competition Committee. Big Data: Bringing Competition Policy to the Digital Era[R]. OCED Competition Committee Meetings, 2016.
[8]? Acemoglu, D., Johnson, J. A. The Emergence of Weak, Despotic and Inclusive States[R].? CEPR Working Paper , 2018.
[9]? OECD. Data-Driven Innovation: Big Data for Growth and Well-Being[R]. OECD Publishing, 2015.
[10]? Stucke, M. E., Grunes A. P. Big Data and Competition Policy[M]. Oxford: Oxford University Press, 2016.1-10.
[11]? Hirshleifer, J. The Private and Social Value of Information and the Reward to Inventive Activity[J]. American Economic Review, 1971, 61 (4): 561-574.
[12]? Hirshleifer, J. Privacy: Its Origin, Function and Future[J]. Journal of Legal Studies, 1980, 9 (4): 649-664.
[13]? Stigler, G. J. An Introduction to Privacy in Economics and Politics[J]. Journal of Legal Studies, 1980, 9 (4): 623-644.
[14]? Posner, R. A. The Economics of Privacy[J]. American Economic Review, 1981, 71 (2): 405-409.
[15]? Varian, H. F. Economic Aspects of Personal Privacy[A].Daley, W. M., Iring,L.? Privacy and Self-Regulation in the Information Age[C]. Washington, D. C.: U. S. Department of Commerce, 1997. 50-60.
[16]? Acquisti, A., Taylor, C. R., Wagman, L. The Economics of Privacy[J]. Journal of Economic Literature, 2016, 54 (2): 442-492.
[17]? Budzinski, O.,? Kuchinke, B. Modern Industrial Organization Theory of Media Markets and Competition Policy Implications[R]. Ilmenau Economics Discussion Papers No.115,Ilmenau University of Technology, Institute of Economics, 2018.
[18]? Budzinski, O.,? Stohr, A.? Competition Policy Reform in Europe and Germany-Institutional Change in the Light of Digitization[R]. Ilmenau Economics Discussion Papers No.117,Ilmenau University of Technology, Institute of Economics, 2018.
[19]? Akerlof, G. The Economics of Caste and of the Rat Race and Other Woeful Tales[J]. Quarterly Journal of Economics, 1976, 90 (4): 599-617.
[20]? Taylor, C. R. Consumer Privacy and the Market for Customer Information[J]. Rand Journal of Economics, 2004, 35 (4): 631-651.
[21]? Acquisti, A., Varian, H. R. Conditioning Prices on Purchase History[J]. Marketing Science, 2005, 24 (3): 367-381.
[22]? Gross, R., Acquisti, A. Information Revelation and Privacy in Online Social Networks: The Facebook Case[R]. ACM Workshop on Privacy in the Electronic Society (WPES), 2005.
[23]? Hermalin, B. E., Katz, M. L. Privacy, Property Rights and Efficiency: The Economics of Privacy as Secrecy[J]. Quantitative Marketing and Economics, 2006, 4 (3): 209-239.
[24]? Hui, K. L.,? Png, I. P. L. The Economics of Privacy[A]. Hendershott, T. Economics and Information Systems[C]. Amsterdam:Elsevier,2006. 1-23.
[25]? Grossklags, J., Acquisti, A.? When 25 Cents Is too Much: An Experiment on Willingness-to-Sell and Willingness-to-Protect Personal Information[R]. University of California at Berkeley Working Paper, 2007.
[26]? Beresford, A. R., Kubler, D. , Preibusch, S. Unwillingness to Pay for Privacy: A Field Experiment[J]. Economics Letters, 2012, 117 (1): 25-27.
[27]? Brown, I. The Economics of Privacy, Data Protection and Surveillance[A].Bauer, J.M.,? Latzer , M. Handbook on the Economics of the Internet[C]. Cheltenham, UK:Edward Elgar, 2016. 247-261.
[28]? Heidhues, P., Koszegi ,B. , Murooka, T.Inferior Products and Profitable Deception[J]. Review of Economic Studies, 2016, 84 (1): 323-356.
[29]? Hoffmann, F., Inderst, R., Ottaviani, M. Persuasion Through Selective Disclosure: Implications for Marketing[R]. Campaigning and Privacy Regulation Working Paper, 2016.
[30]? Kerber, W.Digital Markets, Data and Privacy: Competition Law, Consumer Law and Data Protection[J]. Journal of Intellectual Property Law and Practice, 2016, 11 (11): 856-866.
[31]? Obar, J., Oeldorf-Hirsch, A.The Biggest Lie on the Internet: Ignoring the Privacy Policies and Terms of Service Policies of Social Networking Services[J].Information Communication and Society, 2018, 23 (1): 1-20.
[32]? Heidhues, P., Koszegi, B. Discrimination Naivete-Based[J]. Quarterly Journal of Economics, 2017, 132 (2): 1019-1054.
[33]? Budzinski, O.,? Grusevaja, M.? The (Behavioral) Economics of Privacy and Big Data: Fundamental Implications and the German Competition Policy Case against Facebook[R]. Ilmenau Economics Discussion Papers, 2018.
[34]? Schwalbe, U.Algorithms, Learning Machine, and Collusion[J]. Journal of Competition Law and Economics, 2018, 14 (4): 568-607.
[35]? Tucker, C. E. The Economics of Advertising and Pricing[J]. International Journal of Industrial Organization, 2012, 30 (3): 326-329.
[36]? Anderson, S. P.,? de Palma A.Competition for Attention in the Information (Overload) Age[J]. Rand Journal of Economics, 2012, 43 (1): 1-25.
[37]? Budzinski, O., Kohler, K. H. Is Amazon the Next Google? [R].IImenau Economics Discussion Papers , 2015.
[38]? Martens, B. An Economic Policy Perspective on Online Platforms[R]. JRC Technical Reports, Institute for Prospective Technological Studies Digital Economy Working Paper , 2016.
[39]? Tirole, J. Economics for the Common Good[M]. Princeton, NJ: Princeton University Press, 2017. 340-345.
[40]? Varian, H. R. Big Data: New Tricks for Econometrics[J]. Journal of Economic Perspectives, 2014, 28 (2): 3-27.
[41]? Varian, H. R. Beyond Big Data[J]. Business Economics, 2014, 49 (1): 27-31.
[42]? Lewis, R., Rao, J. The Unfavorable Economics of Measuring the Returns to Advertising[J]. Quarterly Journal of Economics, 2015,130 (4): 1941-1973.
[43]? Acquisti, A., Brandimarte, L., Loewenstein, G. Privacy and Human Behavior in the Age of Information[J]. Science, 2015, 347 (6221): 509-514.
[44]? Athey, S., Catalini, C., Tucker, C.? The Digital Privacy Paradox: Small Money, CostsSmall, Small Talk[R]. MIT Sloan Research Paper , 2017.
[45]? Calabresi,G. Property Rules, Rules Liability, and Inalienability: One View of the Cathedral[J]. Harvard Law Review, 1972, 85 (6): 1089-1128.
[46]? Lambrecht., A., Tucker, C. E. Can Big Data Protect a Firm From Competition?[A]? Ortiz,A. Internet: Competition and Regulation of Online Platforms[C]. Cambridge, MA:Competition Policy International,2015.155-166.
[47]? Stucke, M. E., Grunes, A. P. Debunking the Myths Over Big Data and Antitrust[J]. CPI Antitrust Chronical, 2015, 5 (2):10-18.
[48]? OECD. Data-Driven Innovation for Growth and Well-being: Interim Synthesis Report[R]. OECD Publishing, 2014.
[49]? Richards ,N. M., King, J. H. Big Data Ethics[J]. Wake Forest Law Review, 2014, 49(2): 393-432.
[50]? OECD. Algorithms and Collusion: Competition Policy in the Digital Age[R]. OECD Publishing, 2017.
Data Revolution, Data Theory and Data Governance: A Brief Review
FANG Yan1,LONG Yun-tao2
(1.Aliresearch, Beijing 100102, China;2.Chinese Academy of Sciences Institutes of Science and Development, Beijing? 100190, China)
Abstract:This paper describes and explores the trends of data revolution in the digital era and the basic issues of national support policies, data economy theory and data governance.Firstly, supporting the use and development of big data has become a global consensus. Secondly, based on different assumptions and market contexts, academic research on the collection and use of user data has reached different conclusions on the efficiency implications of data sharing. Under the classical assumption of consumer rationality and information advantage, data advantage is not considered to be abused and data sharing promotes efficiency; under the assumption of consumer bounded rationality and behavioral economics of information disadvantage, data advantage may be abused and data sharing inhibits efficiency. In data technology market, competition between data extraction technology and interception technology promotes efficiency; in data trading market, initial data provider does not understand data usage and data value, which often leads to market failure; in data payment market, consumers may not benefit from zero currency price, service providers may abuse advantage of data information, and different private customization modes may bring different welfare impact. Finally, academic research on data governance has focused on the definition and allocation of data property rights, data concentration and ethical responsibility for data (and algorithms).? The definition and allocation of data property rights are based on the principles of data classification and grading to determine the initial data; data concentration is mainly examined from the perspective of accessibility or accessibility rather than property rights, and from the perspective of the value chain of the data industry; ethical responsibility of data (and algorithms) includes the obligations of interpretability, accountability, transparency, justice and neutrality. This paper will help to deepen the understanding and governance of data.
Key words:data revolution; data theory; data governance; data market; data property; data concentration
(責任編輯:鄧菁)
*收稿日期:2021-03-04
*作者簡介:方燕(1981-),男,江西贛州人,博士,博士后,主要從事產業(yè)組織與反壟斷、互聯(lián)網經濟學等方面的研究。E-mail:fy314159@sohu.com隆云滔(通訊作者)(1984-),女,湖南隆回人,助理研究員,博士,主要從事數字經濟、技術創(chuàng)新與管理等方面的研究。E-mail:Yuntaol@casipm.ac.cn