于柳箐 高煜
摘?要:數(shù)字經(jīng)濟(jì)時(shí)代下數(shù)據(jù)要素的出現(xiàn)為實(shí)現(xiàn)服務(wù)業(yè)生產(chǎn)率進(jìn)一步提升提供了新的可能。本文基于2012—2019年中國省際面板數(shù)據(jù),使用雙重機(jī)器學(xué)習(xí)方法探究了數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)、作用機(jī)制與異質(zhì)性表現(xiàn)。研究發(fā)現(xiàn),數(shù)據(jù)要素顯著促進(jìn)中國服務(wù)業(yè)生產(chǎn)率提升;數(shù)據(jù)挖掘能力的提高增強(qiáng)了數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率提升的效應(yīng);數(shù)據(jù)要素更有助于生活性服務(wù)業(yè)以及中國東部和南方地區(qū)服務(wù)業(yè)的生產(chǎn)率提升。
關(guān)鍵詞:數(shù)據(jù)要素;數(shù)據(jù)挖掘;服務(wù)業(yè)生產(chǎn)率;雙重機(jī)器學(xué)習(xí)
中圖分類號(hào):F719??文獻(xiàn)標(biāo)識(shí)碼:A??文章編號(hào):1001-148X(2024)03-0009-11
收稿日期:2023-08-01
作者簡介:于柳箐(1990—),男,陜西西安人,博士研究生,研究方向:機(jī)器學(xué)習(xí)、計(jì)量經(jīng)濟(jì)學(xué)、產(chǎn)業(yè)經(jīng)濟(jì)學(xué);高煜(1973—),男,陜西白水人,教授,博士生導(dǎo)師,研究方向:產(chǎn)業(yè)經(jīng)濟(jì)學(xué)、發(fā)展經(jīng)濟(jì)學(xué)。
基金項(xiàng)目:國家社會(huì)科學(xué)基金后期資助項(xiàng)目“創(chuàng)新驅(qū)動(dòng)價(jià)值鏈升級(jí)的理論與實(shí)證研究”,項(xiàng)目編號(hào):21FJLB028;陜西省社會(huì)科學(xué)基金項(xiàng)目“現(xiàn)代產(chǎn)業(yè)分工推動(dòng)西安都市圈與關(guān)中平原城市群協(xié)調(diào)發(fā)展研究”,項(xiàng)目編號(hào):2021DA016。
①《中華人民共和國2019年國民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)》顯示,服務(wù)業(yè)超過農(nóng)業(yè)和工業(yè)成為第一大產(chǎn)業(yè),其增加值占GDP的比重和對(duì)GDP的貢獻(xiàn)率均達(dá)到50%以上。
一、引?言
黨的二十大報(bào)告指出,要“構(gòu)建優(yōu)質(zhì)高效的服務(wù)業(yè)新體系”,而推進(jìn)服務(wù)業(yè)生產(chǎn)率提升是其首要任務(wù)。當(dāng)前,中國已經(jīng)進(jìn)入了以服務(wù)經(jīng)濟(jì)為主的新時(shí)代①[1],同時(shí)也結(jié)束了持續(xù)近四十年的高速經(jīng)濟(jì)增長。從產(chǎn)業(yè)結(jié)構(gòu)來看,中國經(jīng)濟(jì)增速放緩主要是由于以服務(wù)業(yè)為主導(dǎo)產(chǎn)業(yè)結(jié)構(gòu)的經(jīng)濟(jì)體系出現(xiàn)經(jīng)濟(jì)增速下行的趨勢(shì),而之所以發(fā)生這種“結(jié)構(gòu)性減速”,主要原因在于服務(wù)業(yè)本身具有低效率特征,進(jìn)而產(chǎn)生了所謂的“成本病”問題。Baumol(1967)研究發(fā)現(xiàn),隨著技術(shù)進(jìn)步,制造業(yè)對(duì)勞動(dòng)力的需求不斷減少,在勞動(dòng)力要素轉(zhuǎn)移至服務(wù)業(yè)后,不僅沒有推動(dòng)服務(wù)業(yè)生產(chǎn)率提升,反而由于產(chǎn)業(yè)間效率的不平衡增長導(dǎo)致整體經(jīng)濟(jì)增速下滑[2]。因此,為改變中國經(jīng)濟(jì)增速下行趨勢(shì),必須進(jìn)一步提升服務(wù)業(yè)生產(chǎn)率。然而,勞動(dòng)力、資本等生產(chǎn)要素普遍存在邊際報(bào)酬遞減特性,同時(shí)在人口老齡化、工資上漲、資本效率下降等情況下,傳統(tǒng)要素提升服務(wù)業(yè)生產(chǎn)率的動(dòng)能不足[3-4]。
幸運(yùn)的是,中國經(jīng)濟(jì)在進(jìn)入以服務(wù)業(yè)為主的發(fā)展階段時(shí),恰好與數(shù)字技術(shù)的興起相重合,因此有可能打破“服務(wù)業(yè)時(shí)代是低增長時(shí)代”這個(gè)過往的規(guī)律[1]。數(shù)字技術(shù)的應(yīng)用不僅能從根本上改變傳統(tǒng)服務(wù)業(yè)低效率的特征,還可以創(chuàng)造新的服務(wù)和商業(yè)模式,使得服務(wù)業(yè)生產(chǎn)率得以提升[5-8]。更為重要的是,隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等數(shù)字技術(shù)的進(jìn)步,中國步入了數(shù)字經(jīng)濟(jì)時(shí)代,其中最為鮮明的變化是,數(shù)據(jù)成為繼勞動(dòng)力、資本等傳統(tǒng)要素后形成的又一基礎(chǔ)性生產(chǎn)要素。2020年3月30日,印發(fā)的《中共中央?國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》,第一次從國家層面確立了數(shù)據(jù)基礎(chǔ)性生產(chǎn)要素的地位。2022年12月2日,又印發(fā)了《中共中央?國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,進(jìn)一步強(qiáng)調(diào)“為加快構(gòu)建數(shù)據(jù)基礎(chǔ)制度……激活數(shù)據(jù)要素潛能”。
數(shù)據(jù)要素與傳統(tǒng)要素最根本的區(qū)別在于具有易復(fù)制性,使得其額外使用的成本幾乎為零,由此又衍生出數(shù)據(jù)要素的非競爭性,即任何主體都可以使用同一套數(shù)據(jù)而不會(huì)損害其他主體對(duì)數(shù)據(jù)的使用,尤其是與傳統(tǒng)要素邊際產(chǎn)出不斷下降不同,數(shù)據(jù)要素的回報(bào)率較高[9],因此體現(xiàn)出巨大的經(jīng)濟(jì)價(jià)值[10]。Müller等(2018)與張葉青等(2021)分別針對(duì)美國和中國企業(yè)的實(shí)證研究發(fā)現(xiàn),大數(shù)據(jù)的應(yīng)用顯著提高了企業(yè)生產(chǎn)效率,這無疑提供了數(shù)據(jù)要素可以提升服務(wù)業(yè)生產(chǎn)率的部分證據(jù)[11-12]。然而,現(xiàn)有研究主要關(guān)注網(wǎng)絡(luò)技術(shù)[6-7]、數(shù)字經(jīng)濟(jì)發(fā)展[13]等對(duì)服務(wù)業(yè)低效率特征的改善,以及數(shù)字技術(shù)[14]、數(shù)字基礎(chǔ)設(shè)施[15]等對(duì)服務(wù)業(yè)生產(chǎn)率提升的作用,并未涉及數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率的影響。有鑒于此,本文在厘清數(shù)據(jù)要素提升服務(wù)業(yè)生產(chǎn)率內(nèi)在機(jī)理的基礎(chǔ)上,以2012—2019年中國省際面板數(shù)據(jù)為樣本,使用雙重機(jī)器學(xué)習(xí)方法就數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)、作用機(jī)制與異質(zhì)性表現(xiàn)進(jìn)行檢驗(yàn)。本文的研究不僅有助于進(jìn)一步理解數(shù)據(jù)要素的價(jià)值以及如何發(fā)揮其作用,并且對(duì)擁有海量數(shù)據(jù)規(guī)模和豐富應(yīng)用場景優(yōu)勢(shì)的中國而言,證實(shí)數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率具有提升作用,對(duì)于激活數(shù)據(jù)要素潛能,治愈服務(wù)業(yè)“成本病”,打破經(jīng)濟(jì)“結(jié)構(gòu)性減速”規(guī)律具有重要的現(xiàn)實(shí)意義。
與現(xiàn)有研究相比,本文的創(chuàng)新之處主要體現(xiàn)在以下兩個(gè)方面:(1)就研究內(nèi)容而言,明確從數(shù)據(jù)要素角度對(duì)服務(wù)業(yè)生產(chǎn)率提升問題展開理論分析與實(shí)證檢驗(yàn),為相關(guān)研究提供了一定補(bǔ)充。首先,理論分析了數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率提升的影響,豐富了數(shù)據(jù)要素、服務(wù)業(yè)生產(chǎn)率等領(lǐng)域的研究;其次,考察了數(shù)據(jù)挖掘?qū)?shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升的調(diào)節(jié)作用,不僅加深了對(duì)數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率內(nèi)在機(jī)制的理解和認(rèn)識(shí),也為更好發(fā)揮數(shù)據(jù)要素生產(chǎn)率提升效應(yīng)提供政策參考。(2)就研究方法而言,使用雙重機(jī)器學(xué)習(xí)這一較為前沿的因果推斷方法,不但滿足了本文的研究需求,還得到了更為有效的數(shù)據(jù)要素提升中國服務(wù)業(yè)生產(chǎn)率效應(yīng)估計(jì),提高了結(jié)論的可信性。由于影響服務(wù)業(yè)生產(chǎn)率提升的要素較多,為得到數(shù)據(jù)要素的一致估計(jì),其他潛在混淆因素均需考慮控制。然而在一定樣本容量下,經(jīng)典因果推斷模型僅能控制少量因素,容易發(fā)生由遺漏變量引起的內(nèi)生性問題,但是增加控制變量后,又會(huì)產(chǎn)生自由度下降、多重共線性和“維度災(zāi)難”等問題,造成估計(jì)失效。同時(shí),其他潛在混淆因素對(duì)服務(wù)業(yè)生產(chǎn)率的影響還可能是非線性的,而經(jīng)典因果推斷模型的線性假設(shè)將造成估計(jì)有偏。在對(duì)數(shù)據(jù)要素提升中國服務(wù)業(yè)生產(chǎn)率效應(yīng)的估計(jì)中,基于機(jī)器學(xué)習(xí)算法在高維數(shù)據(jù)處理和非參數(shù)擬合上的優(yōu)勢(shì),采用雙重機(jī)器學(xué)習(xí)方法不僅可以控制更多的協(xié)變量,還可以不受函數(shù)形式的限制,從而在一定程度上緩解了使用經(jīng)典因果推斷模型時(shí)所遇到的變量遺漏和函數(shù)誤設(shè)問題。
二、理論機(jī)制與研究假說
作為生產(chǎn)要素的數(shù)據(jù)其實(shí)質(zhì)是存在于網(wǎng)絡(luò)和計(jì)算機(jī)內(nèi)的0—1字符,因而相較于勞動(dòng)力、資本等傳統(tǒng)要素更為原始、分散、細(xì)碎,需要進(jìn)行采集、整理(存儲(chǔ))、清洗后才能成為企業(yè)生產(chǎn)的投入[16]。尤其是與傳統(tǒng)要素依賴直接消耗和形變產(chǎn)生價(jià)值不同,數(shù)據(jù)中蘊(yùn)藏著規(guī)律,僅具有價(jià)值潛能,只有通過分析提煉出有用的知識(shí)才能將其價(jià)值釋放[17]。數(shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升的機(jī)制如圖1所示。
圖1?數(shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升的機(jī)制
(一)數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率提升的影響
1?數(shù)據(jù)要素驅(qū)動(dòng)企業(yè)形成數(shù)據(jù)決策范式,實(shí)現(xiàn)服務(wù)業(yè)生產(chǎn)率提升
數(shù)據(jù)作為重要的生產(chǎn)要素之一,改變了服務(wù)業(yè)企業(yè)傳統(tǒng)的經(jīng)營管理決策模式,驅(qū)動(dòng)企業(yè)形成數(shù)據(jù)決策范式。對(duì)日常生產(chǎn)、經(jīng)營、管理中產(chǎn)生的數(shù)據(jù)進(jìn)行挖掘,企業(yè)可以得到優(yōu)化自身經(jīng)營管理決策的有用知識(shí),而對(duì)這些知識(shí)的應(yīng)用將賦能決策實(shí)踐,提高經(jīng)營管理決策效率。一方面,數(shù)據(jù)決策范式提升了企業(yè)內(nèi)部信息的透明度,形成對(duì)生產(chǎn)經(jīng)營活動(dòng)的細(xì)致觀察,使得決策時(shí)可用信息更加豐富,比如在財(cái)務(wù)決策中,除了使用傳統(tǒng)的資產(chǎn)負(fù)債表、現(xiàn)金流表、利潤表外,還可以引入對(duì)口碑、品牌價(jià)值等數(shù)據(jù)資產(chǎn)的測(cè)量信息[18]。另一方面,數(shù)據(jù)決策范式激發(fā)了企業(yè)在商業(yè)洞察、風(fēng)險(xiǎn)預(yù)判和業(yè)務(wù)模式等方面的創(chuàng)新[19],進(jìn)而增強(qiáng)了對(duì)市場環(huán)境變化的反應(yīng),不僅對(duì)未來發(fā)展方向的分析更為準(zhǔn)確,還可以及時(shí)作出相關(guān)決策,在瞬息萬變的市場變化中降低了經(jīng)營管理風(fēng)險(xiǎn),提高了生產(chǎn)效率[20]。
2?數(shù)據(jù)要素驅(qū)動(dòng)形成數(shù)據(jù)密集型服務(wù)企業(yè),實(shí)現(xiàn)服務(wù)業(yè)生產(chǎn)率提升
隨著數(shù)據(jù)要素規(guī)模的擴(kuò)大,以及機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、人工智能等算法的優(yōu)化,更多知識(shí)、信息、洞見等得以挖掘提煉,為新產(chǎn)品和新服務(wù)的開發(fā)提供了有力支持[21]。在服務(wù)業(yè)層面,以云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、5G等為技術(shù)支撐,數(shù)據(jù)要素驅(qū)動(dòng)的新業(yè)態(tài)、新服務(wù)、新模式不斷涌現(xiàn),并逐漸形成一批數(shù)據(jù)密集型服務(wù)企業(yè),使得住宿餐飲、交通運(yùn)輸、批發(fā)零售等服務(wù)領(lǐng)域不僅實(shí)現(xiàn)了更為有效精準(zhǔn)的供需匹配[22],更是突破了服務(wù)的時(shí)空限制,改變了服務(wù)業(yè)不可儲(chǔ)存、不可貿(mào)易的特性,從根本上解決了傳統(tǒng)服務(wù)業(yè)低效率的問題[7]。據(jù)此,本文提出以下假說:
H1:數(shù)據(jù)要素可以促進(jìn)中國服務(wù)業(yè)生產(chǎn)率提升。
(二)數(shù)據(jù)挖掘?qū)?shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升的影響
前文分析表明,數(shù)據(jù)在經(jīng)過采集、存儲(chǔ)、清洗和分析等步驟后,將提煉出有關(guān)如何改進(jìn)企業(yè)經(jīng)營管理決策、供需匹配等知識(shí),進(jìn)而驅(qū)動(dòng)企業(yè)數(shù)據(jù)決策范式和數(shù)據(jù)密集型服務(wù)企業(yè)的形成,實(shí)現(xiàn)服務(wù)業(yè)生產(chǎn)率提升。以上數(shù)據(jù)處理步驟即為數(shù)據(jù)挖掘過程,在數(shù)據(jù)價(jià)值釋放、知識(shí)生產(chǎn)中發(fā)揮著關(guān)鍵作用。數(shù)據(jù)要素的出現(xiàn)以及相關(guān)數(shù)據(jù)挖掘技術(shù)的進(jìn)步改變了知識(shí)發(fā)現(xiàn)模式,尤其是數(shù)據(jù)要素所具有的非競爭性和低復(fù)制成本特征,使其可以被不同主體重復(fù)、同時(shí)挖掘,進(jìn)而促使更多、更有價(jià)值的知識(shí)被發(fā)現(xiàn),呈現(xiàn)知識(shí)倍增態(tài)勢(shì),提高企業(yè)新知識(shí)獲取的效率。因此,企業(yè)數(shù)據(jù)挖掘能力越強(qiáng),知識(shí)生產(chǎn)效率就越高,即從單位數(shù)據(jù)中能夠產(chǎn)生更多的知識(shí),從而數(shù)據(jù)要素對(duì)企業(yè)生產(chǎn)率的提升就越明顯。據(jù)此,本文提出以下假說:
H2:數(shù)據(jù)挖掘?qū)?shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升具有正向調(diào)節(jié)作用,即數(shù)據(jù)挖掘能力的提高將增強(qiáng)數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)。
三、研究設(shè)計(jì)
(一)模型構(gòu)建
為避免使用經(jīng)典線性因果推斷方法可能遭遇的變量遺漏和函數(shù)誤設(shè)問題,得到更為有效的數(shù)據(jù)要素影響中國服務(wù)業(yè)生產(chǎn)率效應(yīng)估計(jì),本文建立如下部分線性回歸雙重機(jī)器學(xué)習(xí)模型(Partially?Linear?Regression-Double?Machine?Learning,?PLR-DML):
proi,t=θ0datScai,t+g0Xi,t+Ui,t,EUi,tdatScai,t,Xi,t=0(1)
datScai,t=m0Xi,t+Vi,t,EVi,tXi,t=0(2)
其中,下標(biāo)i代表省份、t代表年份。proi,t為結(jié)果變量,表示服務(wù)業(yè)生產(chǎn)率;datScai,t為處理變量,表示數(shù)據(jù)要素投入規(guī)模;θ0是需要重點(diǎn)關(guān)注的數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率的條件平均處理效應(yīng);Xi,t是涉及其他影響服務(wù)業(yè)生產(chǎn)率因素的高維控制變量(協(xié)變量),g0Xi,t與m0Xi,t則分別為關(guān)于Xi,t影響結(jié)果變量proi,t和處理變量datScai,t的未知函數(shù),即厭惡函數(shù);Ui,t和Vi,t是條件均值為零的隨機(jī)誤差項(xiàng)。
傳統(tǒng)的參數(shù)回歸首先設(shè)定g0Xi,t為完全線性或交互項(xiàng)、平方項(xiàng)等形式,隨后執(zhí)行OLS估計(jì),然而由于處理變量datScai,t還受協(xié)變量Xi,t的影響,如此可能導(dǎo)致函數(shù)誤設(shè),造成估計(jì)有偏。為了避免函數(shù)設(shè)定偏差,可以使用核回歸等非參數(shù)方法估計(jì)0Xi,t,但是當(dāng)協(xié)變量Xi,t維度很高時(shí),這又會(huì)產(chǎn)生“維度災(zāi)難”問題,造成估計(jì)失效。使用適用于高維數(shù)據(jù)回歸的機(jī)器學(xué)習(xí)方法(如SVM、Lasso、XGBoost)估計(jì)0Xi,t即可解決這一問題,此時(shí)處理變量系數(shù)θ0的估計(jì)量為:
0=1n∑i∈I,t∈TdatSca2i,t-11n∑i∈I,t∈TdatScai,t(proi,t-0(Xi,t))(3)
其中,n表示樣本容量。然而,直接使用機(jī)器學(xué)習(xí)估計(jì)0Xi,t時(shí)將引入正則化偏差,造成估計(jì)量0有偏。為此,需要從處理變量datScai,t分離出協(xié)變量Xi,t的影響,從而得到具有正交性的處理變量,即使用機(jī)器學(xué)習(xí)估計(jì)0Xi,t,然后計(jì)算殘差V[DD(-*2/3][HT6”]^[][HT][DD)]i,t=datScai,t-0Xi,t,此時(shí)V[DD(-*2/3][HT6”]^[][HT][DD)]i,t作為處理變量datScai,t的工具變量滿足相關(guān)性與外生性要求,因此可以使用IV矩估計(jì)得到θ[DD(-*2/3][HT6”]^[][HT][DD)]0:
θ[DD(-*2/3][HT6”]^[][HT][DD)]0=1n∑i∈I,t∈TV[DD(-*2/3][HT6”]^[][HT][DD)]i,tdatScai,t-11n∑i∈I,t∈TV[DD(-*2/3][HT6”]^[][HT][DD)]i,t(proi,t-0(Xi,t))(4)
遺憾的是,估計(jì)量θ[DD(-*2/3][HT6”]^[][HT][DD)]0依然可能存在偏差,因?yàn)槭褂幂^為復(fù)雜的機(jī)器學(xué)習(xí)算法還引入了過擬合偏差,這可以通過交叉擬合解決,即將樣本隨機(jī)劃分為等量的兩部分,一部分用于機(jī)器學(xué)習(xí)估計(jì)0Xi,t和0Xi,t,另一部分用于θ[DD(-*2/3][HT6”]^[][HT][DD)]0的估計(jì),隨后交換兩部分樣本重新進(jìn)行以上估計(jì),最后取兩次θ[DD(-*2/3][HT6”]^[][HT][DD)]0估計(jì)值的平均數(shù)此時(shí)這一估計(jì)方法稱為2折交叉擬合,為了提高處理效應(yīng)估計(jì)量的精確性,一般在實(shí)踐中還采用5折交叉擬合進(jìn)行估計(jì),即將樣本隨機(jī)劃分為5個(gè)部分,進(jìn)行5次交叉估計(jì)。。Chernozhukov等(2018)證明,在消除正則化偏差和過擬合偏差后,PLR-DML處理效應(yīng)估計(jì)量是一致的[23]。
(二)變量設(shè)定
1?結(jié)果變量
本文的結(jié)果變量為服務(wù)業(yè)生產(chǎn)率,以勞動(dòng)生產(chǎn)率(serLab)和全要素生產(chǎn)率進(jìn)行衡量,其中,勞動(dòng)生產(chǎn)率采用人均增加值的自然對(duì)數(shù)表示,全要素生產(chǎn)率則使用Malmquist指數(shù)方法進(jìn)行測(cè)算(以符號(hào)Malmquist_TFP表示)產(chǎn)出變量為服務(wù)業(yè)增加值(經(jīng)過平減處理),投入變量分別為服務(wù)業(yè)就業(yè)人數(shù)和資本存量(基于服務(wù)業(yè)實(shí)際固定資產(chǎn)投資數(shù)據(jù)使用永續(xù)盤存法計(jì)算)。需要說明的是,由于Malmquist計(jì)算的是以基年(2012)的值為1時(shí)后續(xù)年份TFP相較于上一年的變化,因此本文通過累乘上一年指數(shù)的方式將Malmquist_TFP指標(biāo)轉(zhuǎn)換為水平值。。
2?處理變量
本文旨在研究數(shù)據(jù)要素能否提升中國服務(wù)業(yè)生產(chǎn)率的問題,因此處理變量是數(shù)據(jù)要素投入規(guī)模,使用徐翔等(2021)基于成本法估算的歷年中國各省份數(shù)據(jù)要素規(guī)模存量(datSca)的自然對(duì)數(shù)進(jìn)行衡量[24]。具體方法如下:數(shù)據(jù)生產(chǎn)過程中的成本分為人工成本與數(shù)據(jù)庫這里的數(shù)據(jù)庫是指廣義上的進(jìn)行數(shù)據(jù)采集、存儲(chǔ)、清洗和分析等相關(guān)軟件和ICT設(shè)備。成本,前者由相關(guān)勞動(dòng)力的工資支出進(jìn)行衡量,后者則使用相關(guān)ICT資產(chǎn)的投資支出進(jìn)行衡量。t年份i省份j行業(yè)包括《國民經(jīng)濟(jì)行業(yè)分類》標(biāo)準(zhǔn)中的所有二位數(shù)(大類)行業(yè)。的數(shù)據(jù)生產(chǎn)人工成本為αjWagei,j,t,其中αj表示行業(yè)j中數(shù)據(jù)生產(chǎn)勞動(dòng)力成本占總勞動(dòng)力成本的比重,Wage表示就業(yè)人員工資總額??梢钥吹?,數(shù)據(jù)生產(chǎn)人工成本測(cè)算的關(guān)鍵在于對(duì)αj的估計(jì)。實(shí)際上,任何一類勞動(dòng)力都不會(huì)將全部工作時(shí)長均用于數(shù)據(jù)生產(chǎn),由于數(shù)據(jù)生產(chǎn)過程主要依賴相應(yīng)的ICT設(shè)備,因此行業(yè)ICT中間投入占總中間投入的比重反映了行業(yè)勞動(dòng)力數(shù)據(jù)生產(chǎn)時(shí)長占總勞動(dòng)時(shí)長的比重,進(jìn)而反映了行業(yè)數(shù)據(jù)生產(chǎn)勞動(dòng)力成本占總勞動(dòng)力成本的比重:
ICT中間投入總中間投入≈勞動(dòng)力數(shù)據(jù)生產(chǎn)時(shí)長總勞動(dòng)時(shí)長≈?jǐn)?shù)據(jù)生產(chǎn)勞動(dòng)力成本總勞動(dòng)力成本=αj(5)
加總所有行業(yè)的數(shù)據(jù)生產(chǎn)人工成本即為t年份i省份的數(shù)據(jù)生產(chǎn)人工成本(∑jαjWagei,j,t),進(jìn)一步與t年份i省份的數(shù)據(jù)庫成本(datBasei,t)使用軟件和信息技術(shù)服務(wù)業(yè)的固定資產(chǎn)投資數(shù)據(jù)衡量。相加即可得到i省份當(dāng)年新增的數(shù)據(jù)要素規(guī)模(流量)此時(shí)為名義值,采用固定資產(chǎn)投資價(jià)格指數(shù)進(jìn)行平減。。最后使用永續(xù)盤存法即可計(jì)算得到i省份在t年份的數(shù)據(jù)要素存量:
datScai,t=1-δDdatScai,t-1+(∑jαjWagei,j,t+datBasei,t)(6)
其中,δD為數(shù)據(jù)要素的折舊率,徐翔和趙墨非(2020)認(rèn)為,短期內(nèi)數(shù)據(jù)要素的折舊率接近于0[9];基期的數(shù)據(jù)要素存量為當(dāng)年新增數(shù)據(jù)要素規(guī)模除以后5年數(shù)據(jù)要素流量的平均增長率。
3?控制變量
考慮到雙重機(jī)器學(xué)習(xí)具有控制高維協(xié)變量的優(yōu)勢(shì),為避免遺漏變量偏差,本文參考相關(guān)研究[8,25],建立了包括7個(gè)要素類別,涵蓋30種要素的影響服務(wù)業(yè)生產(chǎn)率提升的投入要素指標(biāo)體系,如表1所示。不同于現(xiàn)有研究,本文在人力資本要素中包含了數(shù)據(jù)勞動(dòng)指數(shù)據(jù)生產(chǎn)過程中所涉及的有關(guān)勞動(dòng)力。,在物質(zhì)資本要素中包含了數(shù)據(jù)資本指數(shù)據(jù)生產(chǎn)過程中所涉及的有關(guān)軟件和ICT設(shè)備。、網(wǎng)絡(luò)基礎(chǔ)設(shè)施以域名數(shù)(domNa)和互聯(lián)網(wǎng)寬帶接入端口數(shù)(port)作為對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)情況的衡量。,以反映數(shù)字經(jīng)濟(jì)時(shí)代下人力資本與物質(zhì)資本的新內(nèi)涵。其中,對(duì)于數(shù)據(jù)勞動(dòng)人數(shù)(datLab)的測(cè)算,使用與數(shù)據(jù)生產(chǎn)緊密相關(guān)的7個(gè)國民經(jīng)濟(jì)大類行業(yè)計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè);儀器儀表制造業(yè);通用設(shè)備制造業(yè);專用設(shè)備制造業(yè);軟件和信息技術(shù)服務(wù)業(yè);互聯(lián)網(wǎng)和相關(guān)服務(wù);電信、廣播電視和衛(wèi)星傳輸服務(wù)。在各省的就業(yè)人數(shù),分別乘以徐翔等(2021)估算的對(duì)應(yīng)行業(yè)數(shù)據(jù)生產(chǎn)勞動(dòng)力成本占總勞動(dòng)力成本的比重[24],隨后在省份層面對(duì)以上計(jì)算結(jié)果進(jìn)行加總;數(shù)據(jù)資本投資(datInv)使用軟件和信息技術(shù)服務(wù)業(yè)的固定資產(chǎn)投資數(shù)據(jù)進(jìn)行衡量該行業(yè)的固定資產(chǎn)包括進(jìn)行數(shù)據(jù)生產(chǎn)所需的各種軟件、數(shù)據(jù)庫、計(jì)算機(jī)等。,并基于永續(xù)盤存法計(jì)算數(shù)據(jù)資本存量(datK)其中,基期數(shù)據(jù)資本存量為當(dāng)年數(shù)據(jù)資本投資/10%,同時(shí)考慮到數(shù)據(jù)資本的更新?lián)Q代較快,因此設(shè)定折舊率為20%。。
(三)數(shù)據(jù)說明與變量描述性統(tǒng)計(jì)
本文所用面板數(shù)據(jù)的時(shí)間區(qū)間為2012—2019年,共涉及31個(gè)省區(qū)市考慮數(shù)據(jù)可得性,不包括中國臺(tái)灣、中國香港和中國澳門。。計(jì)算服務(wù)業(yè)勞動(dòng)生產(chǎn)率和全要素生產(chǎn)率的相關(guān)數(shù)據(jù)來自《中國第三產(chǎn)業(yè)統(tǒng)計(jì)年鑒》《中國勞動(dòng)統(tǒng)計(jì)年鑒》《中國固定資產(chǎn)投資年鑒》和《中國投資領(lǐng)域統(tǒng)計(jì)年鑒》等。其他控制變量數(shù)據(jù)的來源除以上統(tǒng)計(jì)年鑒外,還包括《中國統(tǒng)計(jì)年鑒》《中國科技統(tǒng)計(jì)年鑒》《中國人口和就業(yè)統(tǒng)計(jì)年鑒》《中國教育統(tǒng)計(jì)年鑒》以及中國研究數(shù)據(jù)服務(wù)平臺(tái)(CNRDS)。缺失的數(shù)據(jù)由線性插值法填補(bǔ),有關(guān)增加值、固定資產(chǎn)投資、收入等涉及價(jià)格的變量均進(jìn)行了平減處理(2012=1)。另外,由于本文樣本中變量較多且單位存在較大差異,為消除不同量綱對(duì)雙重機(jī)器學(xué)習(xí)估計(jì)的不利影響,對(duì)數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化處理。主要變量的描述性統(tǒng)計(jì)結(jié)果如表2所示。
四、實(shí)證結(jié)果分析
(一)數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率的效應(yīng)
表3報(bào)告了使用PLR-DML模型得到的數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率效應(yīng)估計(jì)結(jié)果采用R語言DoubleML包中的DoubleMLPLR函數(shù)進(jìn)行估計(jì),超參數(shù)選擇與模型構(gòu)建對(duì)應(yīng),一方面對(duì)處理變量進(jìn)行正交化處理(orthogonalization)以消除正則化偏差,即score=“IV-type”;另一方面使用交叉擬合估計(jì)處理變量系數(shù),即dml_procedure=?“dml1”。。其中,模型(1)和(2)使用5折交叉擬合,模型(3)和(4)則使用2折交叉擬合。對(duì)PLR-DML模型中厭惡函數(shù)的估計(jì)可以使用任意機(jī)器學(xué)習(xí)方法,本文選擇默認(rèn)超參數(shù)的XGBoost如無特別說明,后文實(shí)證中均使用默認(rèn)超參數(shù)的XGBoost估計(jì)厭惡函數(shù),同時(shí)DML超參數(shù)也與基準(zhǔn)估計(jì)一致。,因?yàn)樵摲椒ɑ跇O端梯度提升算法改進(jìn)了經(jīng)典提升森林模型,泛化(樣本外預(yù)測(cè))性能在眾多機(jī)器學(xué)習(xí)模型中具有優(yōu)勢(shì),進(jìn)而能更好地反映高維協(xié)變量與數(shù)據(jù)要素投入、服務(wù)業(yè)生產(chǎn)率提升之間真實(shí)的數(shù)據(jù)生成過程,使得對(duì)數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率效應(yīng)的估計(jì)更為有效。與此同時(shí),為進(jìn)一步避免不同地區(qū)不隨時(shí)間變化的,以及省際層面隨時(shí)間變化的不可觀測(cè)因素對(duì)估計(jì)的影響,借鑒張濤和李均超(2023)的做法,將省份和年份變量轉(zhuǎn)換為虛擬變量納入?yún)f(xié)變量中,以對(duì)地區(qū)固定效應(yīng)和時(shí)間固定效應(yīng)加以控制[26]??梢钥吹?,服務(wù)業(yè)生產(chǎn)率無論以勞動(dòng)生產(chǎn)率還是全要素生產(chǎn)率進(jìn)行衡量,在5折和2折交叉擬合下,datSca的系數(shù)均在1%的水平上顯著為正,說明數(shù)據(jù)要素顯著促進(jìn)中國服務(wù)業(yè)生產(chǎn)率提升,假說H1成立。
(二)內(nèi)生性問題處理
在基準(zhǔn)估計(jì)中,雖然已經(jīng)引入了盡可能多的協(xié)變量,并控制了地區(qū)和時(shí)間固定效應(yīng),但由于樣本限制,依然可能遺漏變量,同時(shí)還可能存在處理變量測(cè)量誤差和雙向因果,從而引發(fā)內(nèi)生性問題,造成PLR-DML估計(jì)不一致。為此,本文使用雙重機(jī)器學(xué)習(xí)的工具變量法予以克服。依據(jù)Chernozhukov等(2018),構(gòu)建部分線性工具變量回歸模型(Partially?Linear?Instrumental?Variable?Regression?Model,?PLIV)[23]:
proi,t=θ0datScai,t+g0Xi,t+Ui,t(7)
IVi,t=m0Xi,t+Vi,t(8)
其中,IV表示datSca的工具變量。參考施炳展和李建桐(2020)的研究,本文選擇建國初期(1953—1957年)各省份人均函件數(shù)量(letter)作為datSca的工具變量[27]。其合理性在于:一方面letter符合相關(guān)性要求,函件數(shù)量反映了各省份居民對(duì)于通信方式的接受程度或者偏好,而這種偏好在省份內(nèi)相對(duì)穩(wěn)定,進(jìn)而影響了此后居民對(duì)互聯(lián)網(wǎng)這一現(xiàn)代通訊方式的接受程度,由于互聯(lián)網(wǎng)是數(shù)據(jù)要素主要的生成與流通媒介,從而與datSca存在相關(guān)性;另一方面letter符合外生性要求,因?yàn)楹H能滿足居民的日常通信需求,并不會(huì)對(duì)服務(wù)業(yè)生產(chǎn)率產(chǎn)生直接影響,同時(shí)建國初期人均函件數(shù)量也不可能影響到近期的服務(wù)業(yè)生產(chǎn)率,因此,letter只能通過地區(qū)數(shù)據(jù)規(guī)模這一途徑間接影響服務(wù)業(yè)生產(chǎn)率。另外,參考鈔小靜和王宸威(2022)的研究,本文還選擇1988年各省份每百萬人微型電子計(jì)算機(jī)產(chǎn)量(computer)作為datSca的工具變量[28]。其合理性在于:一方面computer符合相關(guān)性要求,由于計(jì)算機(jī)是數(shù)據(jù)要素形成、展示、存儲(chǔ)以及分析等的重要載體,因此早期計(jì)算機(jī)產(chǎn)量越高的地區(qū),后期數(shù)據(jù)要素規(guī)模就可能越大,從而computer與datSca存在相關(guān)性;另一方面computer符合外生性要求,因?yàn)檩^早時(shí)期各省份的計(jì)算機(jī)產(chǎn)量對(duì)近期服務(wù)業(yè)生產(chǎn)率的直接影響微乎其微。因此,computer只能通過地區(qū)數(shù)據(jù)規(guī)模這一途徑間接影響服務(wù)業(yè)生產(chǎn)率。進(jìn)一步,根據(jù)Nunn?and?Qian(2014)的做法,本文為上述截面工具變量引入時(shí)間趨勢(shì),具體是將letter和computer分別乘以上一年全國軟件和信息技術(shù)服務(wù)業(yè)固定資產(chǎn)投資(不含農(nóng)戶)數(shù)據(jù),構(gòu)造交互項(xiàng)并取自然對(duì)數(shù),從而將其擴(kuò)展為面板工具變量[29]。
表4報(bào)告了工具變量估計(jì)結(jié)果采用R語言DoubleML包中的DoubleMLPLIV函數(shù)進(jìn)行估計(jì),超參數(shù)使用默認(rèn)值,即score=“partialling?out”,dml_procedure=“dml2”。,可以看到,在以勞動(dòng)生產(chǎn)率和全要素生產(chǎn)率衡量服務(wù)業(yè)生產(chǎn)率時(shí),無論是以computer還是letter作為datSca的工具變量,其系數(shù)均在1%的水平上顯著為正,這與基準(zhǔn)估計(jì)一致,說明充分考慮內(nèi)生性問題后,數(shù)據(jù)要素促進(jìn)中國服務(wù)業(yè)生產(chǎn)率提升的結(jié)論依然成立,本文的研究假說H1得到了進(jìn)一步證實(shí)。
(三)穩(wěn)健性檢驗(yàn)
1?更換處理變量
為進(jìn)一步緩解由處理變量測(cè)量誤差引發(fā)的內(nèi)生性問題,借鑒楊艷等(2023)在驗(yàn)證其估算的數(shù)據(jù)要素價(jià)值是否合理時(shí)的做法,使用移動(dòng)互聯(lián)網(wǎng)接入流量(intFlo)作為數(shù)據(jù)要素投入規(guī)模的代理變量[30]。估計(jì)結(jié)果如表5列(1)所示。
2?更換結(jié)果變量
Malmquist指數(shù)法屬于非參數(shù)方法,在測(cè)算TFP時(shí)不僅無法檢驗(yàn)前沿面的適用性,也未能考慮隨機(jī)因素的影響,為此本文使用基于超越對(duì)數(shù)生產(chǎn)函數(shù)的隨機(jī)前沿分析法(SFA)重新測(cè)算服務(wù)業(yè)全要素生產(chǎn)率(以符號(hào)SFA_TFP表示)。同時(shí),進(jìn)一步考慮到參數(shù)法測(cè)算TFP時(shí)難以避免內(nèi)生性問題,本文還使用半?yún)?shù)的OP法測(cè)算了服務(wù)業(yè)全要素生產(chǎn)率(以符號(hào)OP_TFP表示)。估計(jì)結(jié)果如表5列(2)和列(3)所示。
3?解釋變量滯后
服務(wù)業(yè)生產(chǎn)率的提升可能會(huì)進(jìn)一步加快形成新業(yè)態(tài)、新服務(wù)、新模式,在深化服務(wù)業(yè)數(shù)字化程度的同時(shí)導(dǎo)致數(shù)據(jù)要素規(guī)模的持續(xù)擴(kuò)大,從而出現(xiàn)雙向因果。為進(jìn)一步緩解由雙向因果導(dǎo)致的內(nèi)生性問題,本文將處理變量和控制變量均滯后一期。估計(jì)結(jié)果如表5列(4)所示。
4?更換機(jī)器學(xué)習(xí)
相比于其他機(jī)器學(xué)習(xí)算法,XGBoost對(duì)數(shù)據(jù)的擬合能力較強(qiáng),有可能錯(cuò)誤學(xué)習(xí)樣本內(nèi)的隨機(jī)誤差,進(jìn)而降低泛化性能(即發(fā)生過擬合現(xiàn)象),影響雙重機(jī)器學(xué)習(xí)估計(jì)量的有效性和一致性。為避免XGBoost過擬合對(duì)PLR-DML的估計(jì)結(jié)果產(chǎn)生影響,分別使用支持向量機(jī)(SVM)和套索回歸(Lasso)對(duì)厭惡函數(shù)進(jìn)行估計(jì)。結(jié)果如表5列(5)和列(6)所示。
可以看到,在更換處理變量、結(jié)果變量、機(jī)器學(xué)習(xí)以及滯后解釋變量一期后,數(shù)據(jù)要素影響中國服務(wù)業(yè)生產(chǎn)率的效應(yīng)均在1%的水平上顯著為正,這充分說明本文的基本結(jié)論穩(wěn)健。
(四)調(diào)節(jié)機(jī)制檢驗(yàn)
本文在基準(zhǔn)估計(jì)模型(1)、模型(2)的基礎(chǔ)上引入數(shù)據(jù)規(guī)模(datSca)與數(shù)據(jù)挖掘能力變量的交互項(xiàng),以檢驗(yàn)數(shù)據(jù)挖掘?qū)?shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升效應(yīng)的調(diào)節(jié)作用,具體模型構(gòu)建如下:
proi,t=θ0datScai,t×datMini,t+g0Xi,t+Ui,t,EUi,tdatScai,t×datMini,t,Xi,t=0(9)
datScai,t×datMini,t=m0Xi,t+Vi,t,EVi,tXi,t=0(10)
其中,datMini,t表示i省份在t年的數(shù)據(jù)挖掘能力;θ0是本文關(guān)心的交互項(xiàng)系數(shù),若顯著為正則表明數(shù)據(jù)挖掘能力的提高增強(qiáng)了數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率提升的促進(jìn)作用。另外,為保證估計(jì)的一致性,將datScai,t和datMini,t同時(shí)歸入?yún)f(xié)變量Xi,t中。
本文使用多指標(biāo)綜合評(píng)價(jià)方法構(gòu)建數(shù)據(jù)挖掘能力指數(shù),以反映不同省份歷年的數(shù)據(jù)挖掘能力。數(shù)據(jù)挖掘過程由相關(guān)勞動(dòng)力使用相應(yīng)軟件、數(shù)據(jù)庫、計(jì)算機(jī)等實(shí)現(xiàn),因此當(dāng)數(shù)據(jù)勞動(dòng)供給和數(shù)據(jù)資本投資充足時(shí),地區(qū)將擁有較強(qiáng)的數(shù)據(jù)挖掘能力,換言之,數(shù)據(jù)勞動(dòng)人數(shù)和數(shù)據(jù)資本水平體現(xiàn)了地區(qū)的數(shù)據(jù)挖掘能力。鑒于此,本文分別基于主成分分析(PCA)、面板熵值法(EEM)以及算術(shù)平均法(Mean)將數(shù)據(jù)勞動(dòng)人數(shù)、數(shù)據(jù)資本投資和數(shù)據(jù)資本存量三個(gè)指標(biāo)綜合為數(shù)據(jù)挖掘能力指數(shù)(datMin)。
表6報(bào)告了調(diào)節(jié)機(jī)制檢驗(yàn)結(jié)果,可以看到,在以勞動(dòng)生產(chǎn)率和全要素生產(chǎn)率衡量服務(wù)業(yè)生產(chǎn)率時(shí),無論以何種方法計(jì)算數(shù)據(jù)挖掘能力指數(shù),交互項(xiàng)datSca×datMin系數(shù)均在1%的水平上顯著為正,說明數(shù)據(jù)挖掘?qū)?shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升具有正向調(diào)節(jié)作用,即數(shù)據(jù)挖掘能力的提高顯著增強(qiáng)了數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率提升的效應(yīng),假說H2得到證實(shí)。
五、異質(zhì)性分析
(一)服務(wù)業(yè)類型差異
服務(wù)業(yè)可以分為生產(chǎn)性服務(wù)業(yè)和生活性服務(wù)業(yè)兩種類型,前者是與工業(yè)、制造業(yè)發(fā)展直接配套的一類服務(wù)業(yè)依據(jù)國家統(tǒng)計(jì)局發(fā)布的《生產(chǎn)性服務(wù)業(yè)統(tǒng)計(jì)分類(2019)》標(biāo)準(zhǔn),生產(chǎn)性服務(wù)業(yè)包括以下行業(yè):批發(fā)和零售業(yè),交通運(yùn)輸、倉儲(chǔ)及郵政業(yè),信息傳輸、軟件和信息技術(shù)服務(wù)業(yè),金融業(yè),租賃和商務(wù)服務(wù)業(yè),科學(xué)研究和技術(shù)服務(wù)業(yè)。,后者是為滿足居民日常生活需求的一類服務(wù)業(yè)依據(jù)國家統(tǒng)計(jì)局發(fā)布的《生活性服務(wù)業(yè)統(tǒng)計(jì)分類(2019)》標(biāo)準(zhǔn),生活性服務(wù)業(yè)包括以下行業(yè):住宿和餐飲業(yè),房地產(chǎn)業(yè),水利、環(huán)境和公共設(shè)施管理業(yè),居民服務(wù)、修理和其他服務(wù)業(yè),教育,衛(wèi)生和社會(huì)工作,文化、體育和娛樂業(yè)。。由于這兩類服務(wù)業(yè)在國民經(jīng)濟(jì)發(fā)展中的用途各異,使得它們?cè)跀?shù)字化進(jìn)程以及數(shù)據(jù)要素需求上可能有所不同,進(jìn)而導(dǎo)致數(shù)據(jù)要素對(duì)這兩類服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)存在差異。為此,本文使用PLR-DML模型分別估計(jì)數(shù)據(jù)要素對(duì)生產(chǎn)性和生活性服務(wù)業(yè)生產(chǎn)率采用勞動(dòng)生產(chǎn)率(即增加值/就業(yè)人數(shù))的自然對(duì)數(shù)進(jìn)行衡量。其中兩類服務(wù)業(yè)的增加值和就業(yè)人數(shù)數(shù)據(jù)由各自所包括行業(yè)的數(shù)據(jù)加總而來。需要說明的是,國家統(tǒng)計(jì)局一直公布個(gè)別服務(wù)業(yè)行業(yè)的增加值數(shù)據(jù),比如批發(fā)和零售業(yè),交通運(yùn)輸、倉儲(chǔ)和郵政業(yè),住宿和餐飲業(yè),金融業(yè),房地產(chǎn)業(yè),而其他服務(wù)業(yè)行業(yè)的增加值數(shù)據(jù)則全部合并至“其他行業(yè)增加值”指標(biāo)內(nèi),因此本文參考夏杰長等(2019)的方法,首先分別計(jì)算未公布增加值行業(yè)的工資總額在“其他行業(yè)”工資總額中所占的比例,隨后用這一比例分別乘以“其他行業(yè)增加值”,以推算出未公布增加值行業(yè)的增加值數(shù)據(jù)[25]。的影響效應(yīng),以探究數(shù)據(jù)要素對(duì)不同類型服務(wù)業(yè)生產(chǎn)率的影響是否具有異質(zhì)性。估計(jì)結(jié)果如表7所示。
從表7可以看到,無論使用5折還是2折交叉擬合進(jìn)行估計(jì),數(shù)據(jù)要素影響生產(chǎn)性和生活性服務(wù)業(yè)生產(chǎn)率的效應(yīng)均在1%的水平上顯著為正,說明數(shù)據(jù)要素對(duì)這兩類服務(wù)業(yè)的生產(chǎn)率均能發(fā)揮提升作用。進(jìn)一步,從datSca系數(shù)值來看,生產(chǎn)性服務(wù)業(yè)中平均為06531,生活性服務(wù)業(yè)中平均為08234,表明數(shù)據(jù)要素對(duì)這兩類服務(wù)業(yè)生產(chǎn)率提升的作用程度存在明顯差異,相比于生產(chǎn)性服務(wù)業(yè),數(shù)據(jù)要素更有助于生活性服務(wù)業(yè)生產(chǎn)率的提升。本文的解釋是,隨著相關(guān)數(shù)字技術(shù)的發(fā)展,在出行、住宿、餐飲等生活服務(wù)領(lǐng)域快速形成了各種數(shù)字平臺(tái)比如滴滴出行、貝殼找房、攜程、去哪兒、美團(tuán)外賣等。,有關(guān)企業(yè)使用數(shù)據(jù)要素實(shí)現(xiàn)供需匹配的動(dòng)力較強(qiáng),在面對(duì)諸如消費(fèi)者畫像、服務(wù)品推薦等復(fù)雜的數(shù)據(jù)要素應(yīng)用場景時(shí),培養(yǎng)和引進(jìn)了更多數(shù)據(jù)人才,投資了更多數(shù)據(jù)資本,導(dǎo)致生活性服務(wù)業(yè)內(nèi)的企業(yè)在數(shù)據(jù)挖掘能力上具有較大優(yōu)勢(shì),從而能更有效釋放數(shù)據(jù)要素的潛在價(jià)值。
(二)東西、南北區(qū)域差異
在中國區(qū)域經(jīng)濟(jì)東西差距依然存在的情況下,南北差距也愈發(fā)明顯,與此同時(shí),各區(qū)域在服務(wù)業(yè)生產(chǎn)率水平、數(shù)字化程度、數(shù)據(jù)要素稟賦等方面也有所不同,可能導(dǎo)致數(shù)據(jù)要素對(duì)不同區(qū)域服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)存在差異。鑒于此,本文在基準(zhǔn)估計(jì)模型(1)和模型(2)的基礎(chǔ)上引入數(shù)據(jù)規(guī)模(datSca)與區(qū)域虛擬變量的交互項(xiàng),以考察數(shù)據(jù)要素提升服務(wù)業(yè)生產(chǎn)率的區(qū)域異質(zhì)性,模型設(shè)定如下:
serLabi,t=θ0datScai,t×region+g0Xi,t+Ui,t,EUi,tdatScai,t×region,Xi,t=0(11)
datScai,t×region=m0Xi,t+Vi,t,EVi,tXi,t=0(12)
其中,serLabi,t表示i省份在t年的服務(wù)業(yè)勞動(dòng)生產(chǎn)率;region表示區(qū)域虛擬變量,包括東西(EW)、南北(NS)兩個(gè)變量,屬于東部和南方地區(qū)的省份定義為1,屬于西部和北方地區(qū)的省份定義為0東部省份包括:安徽省、北京市、福建省、廣東省、海南省、河北省、黑龍江省、吉林省、江蘇省、江西省、遼寧省、山東省、上海市、天津市、浙江省,其余省份屬于西部地區(qū);以中國北緯35°線為界,南方省份包括:上海市、江蘇省、浙江省、安徽省、福建省、江西省、湖北省、湖南省、廣東省、廣西省、海南省、重慶市、四川省、貴州省、云南省、西藏自治區(qū),其余省份屬于北方地區(qū)。。同時(shí),為保證估計(jì)的一致性,將datScai,t和region歸入?yún)f(xié)變量Xi,t中。估計(jì)結(jié)果如表8所示。
從表8可知,無論以5折還是2折交叉擬合進(jìn)行估計(jì),datSca×EW和datSca×NS的系數(shù)均在1%的水平上顯著為正,說明相較于西部與北方地區(qū),數(shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)在中國東部和南方地區(qū)更為明顯。對(duì)此可能的解釋是,東部與南方地區(qū)數(shù)據(jù)要素供給更充裕、流通更通暢、價(jià)值釋放更充分,即數(shù)據(jù)要素市場化程度更高這一判斷來自國家工業(yè)信息安全發(fā)展研究中心、北京大學(xué)光華管理學(xué)院等共同編寫的《中國數(shù)據(jù)要素市場發(fā)展報(bào)告(2021—2022)》,該報(bào)告基于對(duì)數(shù)據(jù)要素市場化過程的分析,建立了“中國數(shù)據(jù)要素市場化指數(shù)”。各區(qū)域數(shù)據(jù)要素市場化指數(shù)分別為:南方地區(qū),5816;北方地區(qū),5140;東部地區(qū),7000;西部地區(qū),4545。,進(jìn)而在數(shù)據(jù)要素的生成環(huán)境、采集渠道、質(zhì)量水平、價(jià)值密度以及知識(shí)提煉等方面具有優(yōu)勢(shì),不僅有助于服務(wù)業(yè)企業(yè)加快形成數(shù)據(jù)決策范式,也有助于數(shù)據(jù)密集型服務(wù)企業(yè)更好、更快發(fā)展,這無疑更有利于數(shù)據(jù)要素服務(wù)業(yè)生產(chǎn)率提升效應(yīng)的發(fā)揮。
六、結(jié)論與政策建議
本文試圖從理論和實(shí)證兩個(gè)層面探究數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率的影響,通過理論分析厘清數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率提升的內(nèi)在機(jī)理,并基于2012—2019年中國省際面板數(shù)據(jù),使用雙重機(jī)器學(xué)習(xí)方法檢驗(yàn)數(shù)據(jù)要素影響服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)、作用機(jī)制與異質(zhì)性表現(xiàn)。實(shí)證結(jié)果表明:(1)數(shù)據(jù)要素顯著促進(jìn)中國服務(wù)業(yè)生產(chǎn)率提升,在使用雙重機(jī)器學(xué)習(xí)的工具變量法以及經(jīng)過一系列穩(wěn)健性檢驗(yàn)后這一結(jié)論仍然成立;(2)就作用機(jī)制而言,數(shù)據(jù)挖掘能力的提高顯著增強(qiáng)了數(shù)據(jù)要素對(duì)服務(wù)業(yè)生產(chǎn)率提升的效應(yīng);(3)異質(zhì)性分析還發(fā)現(xiàn),數(shù)據(jù)要素對(duì)不同類型和區(qū)域服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)存在差異,相比于生產(chǎn)性服務(wù)業(yè),數(shù)據(jù)要素更有助于生活性服務(wù)業(yè)生產(chǎn)率的提升;相較于西部與北方地區(qū),數(shù)據(jù)要素促進(jìn)服務(wù)業(yè)生產(chǎn)率提升的效應(yīng)在中國東部和南方地區(qū)更為明顯?;谏鲜鲅芯拷Y(jié)論,本文的政策建議如下:
第一,擴(kuò)大數(shù)據(jù)要素規(guī)模,增加數(shù)據(jù)要素投入。在政策層面,首先,政府應(yīng)著力提高數(shù)據(jù)要素市場化配置水平,加快健全數(shù)據(jù)產(chǎn)權(quán)、數(shù)據(jù)開放、數(shù)據(jù)安全等法律法規(guī)建設(shè),重視數(shù)據(jù)要素交易和流通的體制機(jī)制建立,努力營造良好的、有助于數(shù)據(jù)要素良性發(fā)展的制度和市場環(huán)境。其次,政府應(yīng)積極推進(jìn)互聯(lián)網(wǎng)+、物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等新一代信息技術(shù)的發(fā)展,以加速數(shù)據(jù)要素生成、加快數(shù)據(jù)要素采集。增加數(shù)據(jù)交易中心、區(qū)塊鏈、云服務(wù)平臺(tái)等數(shù)字基礎(chǔ)設(shè)施投入,以加快破除阻礙數(shù)據(jù)要素流動(dòng)的技術(shù)壁壘。鼓勵(lì)創(chuàng)新服務(wù)業(yè)新業(yè)態(tài)、新服務(wù)、新模式,加強(qiáng)金融配套、完善監(jiān)管制度,以加快構(gòu)建豐富的數(shù)據(jù)要素應(yīng)用場景。在企業(yè)層面,服務(wù)業(yè)企業(yè)應(yīng)加大數(shù)據(jù)要素投入占比,轉(zhuǎn)換生產(chǎn)率提升動(dòng)能,進(jìn)而加快形成數(shù)據(jù)決策范式,以提高經(jīng)營管理決策效率,明晰未來發(fā)展方向,減少經(jīng)營風(fēng)險(xiǎn)。另外,對(duì)于生產(chǎn)性服務(wù)業(yè),政府應(yīng)積極引導(dǎo)數(shù)據(jù)資源,數(shù)據(jù)挖掘人才、設(shè)備等集聚,加速數(shù)字化轉(zhuǎn)型,同時(shí)積極鼓勵(lì)交通運(yùn)輸(物流)、批發(fā)零售、金融等領(lǐng)域深化數(shù)字服務(wù)、平臺(tái)等創(chuàng)新。
第二,加快提高數(shù)據(jù)挖掘能力,充分釋放數(shù)據(jù)要素價(jià)值。首先,服務(wù)業(yè)企業(yè)需要加大對(duì)數(shù)據(jù)傳感器、數(shù)據(jù)存儲(chǔ)服務(wù)器、云計(jì)算設(shè)備、高速計(jì)算機(jī)等的投資,為數(shù)據(jù)要素的采集、存儲(chǔ)、清洗和分析等提供硬件保障。其次,政府需要加快數(shù)據(jù)清洗、分析等人才的培養(yǎng)。由于短期內(nèi)現(xiàn)行的教育體制無法完全滿足企業(yè)對(duì)數(shù)據(jù)挖掘人才的旺盛需求,因此政府應(yīng)牽頭開展產(chǎn)學(xué)研合作,聯(lián)合高校、企業(yè)和一切社會(huì)力量為相關(guān)人才的培養(yǎng)與引進(jìn)提供平臺(tái)。
第三,探索促進(jìn)數(shù)據(jù)要素發(fā)展、提高數(shù)據(jù)挖掘能力的差異化政策。對(duì)于西部和北方省份,首先,各級(jí)政府應(yīng)加強(qiáng)數(shù)據(jù)要素市場化建設(shè),加快相關(guān)配套制度建立,以擺脫數(shù)據(jù)要素供給不足、流通不暢、價(jià)值釋放不夠的困境,并充分利用數(shù)據(jù)要素服務(wù)業(yè)生產(chǎn)率提升紅利,縮小服務(wù)業(yè)發(fā)展的區(qū)域差距,進(jìn)一步改善中國區(qū)域經(jīng)濟(jì)發(fā)展失衡現(xiàn)狀;其次,國家在數(shù)據(jù)要素市場化配置上應(yīng)給予西部和北方省份一定的政策傾斜,比如批準(zhǔn)建立更多的數(shù)據(jù)存儲(chǔ)或交易中心,使各級(jí)政府可以在數(shù)據(jù)要素市場的供給側(cè)方面做好文章;最后,地方政府應(yīng)盡力完善數(shù)據(jù)人才的引進(jìn)與激勵(lì)機(jī)制,努力做到人才在生活、醫(yī)療、子女教育等方面沒有后顧之憂,以加快實(shí)現(xiàn)數(shù)據(jù)人才集聚。
參考文獻(xiàn):
[1]?譚洪波.新發(fā)展階段服務(wù)業(yè)“走出去”:路徑、挑戰(zhàn)與對(duì)策[J].經(jīng)濟(jì)縱橫,2023(3):60-68.
[2]?Baumol?W?J.?Macroeconomicsof?Unbalanced?Growth:?The?Anatomy?of?Urban?Crisis[J].American?Economic?Review,?1967,57(3):?415-426.
[3]?鄭江淮,宋建,張玉昌,等.?中國經(jīng)濟(jì)增長新舊動(dòng)能轉(zhuǎn)換的進(jìn)展評(píng)估[J].中國工業(yè)經(jīng)濟(jì),?2018(6):?24-42.
[4]?楊晨,原小能.?中國生產(chǎn)性服務(wù)業(yè)增長的動(dòng)力源泉——基于動(dòng)能解構(gòu)視角的研究[J].財(cái)貿(mào)經(jīng)濟(jì),?2019(5):?127-142.
[5]?Peters?B,?Riley?R,?Siedschlag?I,et?al.?Internationalisation,?Innovation?and?Productivity?in?Services:?Evidence?from?Germany,?Ireland?and?the?United?Kingdom[J].Review?of?World?Economics,?2018,154(3):?585-615.
[6]?江小涓.?網(wǎng)絡(luò)空間服務(wù)業(yè):效率、約束及發(fā)展前景——以體育和文化產(chǎn)業(yè)為例[J].經(jīng)濟(jì)研究,?2018(4):?4-17.
[7]?江小涓,羅立彬.?網(wǎng)絡(luò)時(shí)代的服務(wù)全球化——新引擎、加速度和大國競爭力[J].中國社會(huì)科學(xué),2019(2):68-91+205-206.
[8]?胡宗彪,周佳.?服務(wù)業(yè)全要素生產(chǎn)率再測(cè)度及其國際比較[J].?dāng)?shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2020(8):103-122.
[9]?徐翔,趙墨非.?數(shù)據(jù)資本與經(jīng)濟(jì)增長路徑[J].經(jīng)濟(jì)研究,2020(10):?38-54.
[10]Jones?C?I,Tonetti?C.?Nonrivalry?and?the?Economics?of?Data[J].American?Economic?Review,2020,110(9):?2819-58.
[11]Müller?O,F(xiàn)ay?M,Brocke?V?J.?TheEffect?of?Big?Data?and?Analytics?on?Firm?Performance:?An?Econometric?Analysis?Considering?Industry?Characteristics[J].Journal?of?Management?Information?Systems,2018,35(2):?488-509.
[12]張葉青,陸瑤,李樂蕓.?大數(shù)據(jù)應(yīng)用對(duì)中國企業(yè)市場價(jià)值的影響——來自中國上市公司年報(bào)文本分析的證據(jù)[J].經(jīng)濟(jì)研究,2021(12):?42-59.
[13]矯萍,田仁秀.數(shù)字技術(shù)創(chuàng)新賦能現(xiàn)代服務(wù)業(yè)與先進(jìn)制造業(yè)深度融合的機(jī)制研[J].廣東財(cái)經(jīng)大學(xué)學(xué)報(bào),2023,38(1):?31-44.
[14]李帥娜.?數(shù)字技術(shù)賦能服務(wù)業(yè)生產(chǎn)率:理論機(jī)制與經(jīng)驗(yàn)證據(jù)[J].經(jīng)濟(jì)與管理研究,2021(10):?51-67.
[15]尚文思.?新基建對(duì)勞動(dòng)生產(chǎn)率的影響研究——基于生產(chǎn)性服務(wù)業(yè)的視角[J].南開經(jīng)濟(jì)研究,2020(6):?181-200.
[16]Abis?S,Veldkamp?L.?The?Changing?Economics?of?Knowledge?Production[R].SSRN?Working?Paper,2021,No.3570130.
[17]王超賢,張偉東,顏蒙.?數(shù)據(jù)越多越好嗎——對(duì)數(shù)據(jù)要素報(bào)酬性質(zhì)的跨學(xué)科分析[J].中國工業(yè)經(jīng)濟(jì),2022(7):?44-64.
[18]陳國青,任明,衛(wèi)強(qiáng),等.?數(shù)智賦能:信息系統(tǒng)研究的新躍遷[J].管理世界,2022(1):?180-196.
[19]陳國青,曾大軍,衛(wèi)強(qiáng),等.?大數(shù)據(jù)環(huán)境下的決策范式轉(zhuǎn)變與使能創(chuàng)新[J].管理世界,2020(2):?95-105.
[20]Tanaka?M,Bloom?N,David?J?M,et?al.?Firm?Performance?and?Macro?Forecast?Accuracy[J].Journal?of?Monetary?Economics,2020,114:?26-41.
[21]蔡躍洲,馬文君.?數(shù)據(jù)要素對(duì)高質(zhì)量發(fā)展影響與數(shù)據(jù)流動(dòng)制約[J].?dāng)?shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2021(3):?64-83.
[22]Carrière-Swallow?Y,Haksar?V.?The?Economics?and?Implications?of?Data:?An?Integrated?Perspective[R].IMF?Departmental?Papers/Policy?Papers,2019,18(12).
[23]Chernozhukov?V,Chetverikov?D,Demirer?M,et?al.?Double/debiased?Machine?Learning?for?Treatment?and?Structural?Parameters[J].Econometrics?Journal,2018,21(1):?C1-C68.
[24]徐翔,田曉軒,厲克奧博.?中國省際數(shù)據(jù)要素規(guī)模——基于就業(yè)人員工資與投資數(shù)據(jù)的測(cè)度與分析[R].?數(shù)據(jù)要素市場化配置與分配制度改革論壇,2021.
[25]夏杰長,肖宇,李詩林.?中國服務(wù)業(yè)全要素生產(chǎn)率的再測(cè)算與影響因素分析[J].學(xué)術(shù)月刊,2019(2):?34-43+56.
[26]張濤,李均超.?網(wǎng)絡(luò)基礎(chǔ)設(shè)施、包容性綠色增長與地區(qū)差距——基于雙重機(jī)器學(xué)習(xí)的因果推斷[J].?dāng)?shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2023(4):?113-135.
[27]施炳展,李建桐.?互聯(lián)網(wǎng)是否促進(jìn)了分工:來自中國制造業(yè)企業(yè)的證據(jù)[J].管理世界,2020(4):?130-149.
[28]鈔小靜,王宸威.?數(shù)據(jù)要素對(duì)制造業(yè)高質(zhì)量發(fā)展的影響——來自制造業(yè)上市公司微觀視角的經(jīng)驗(yàn)證據(jù)[J].浙江工商大學(xué)學(xué)報(bào),2022(4):?109-122.
[29]Nunn?N,Qian?N.?US?Food?Aid?and?Civil?Conflict[J].American?Economic?Review,2014,104(6):?1630-1666.
[30]楊艷,王理,李雨佳,等.?中國經(jīng)濟(jì)增長:數(shù)據(jù)要素的“雙維驅(qū)動(dòng)”[J].統(tǒng)計(jì)研究,2023(4):?3-18.
Data?Factors,Data?Mining,and?Productivity?Improvement?of?Chinese?Service?Industry
——Causal?Inference?from?Double?Machine?Learning
YU?Liuqinga,GAO?Yua,b
(Northwest?University,a.School?of?Economics?&?Management;b.China?Western?Economic
Development?Study?Center,Xi′an?710127,China)
Abstract:?Chinas?economy?has?entered?a?development?stage?dominated?by?the?service?industry,but?the?momentum?of?traditional?factors?to?improve?the?productivity?of?the?service?industry?is?insufficient.?In?the?era?of?digital?economy,the?emergence?of?data?factors?provides?new?possibilities?for?further?improving?service?industry?productivity.?Based?on?Chinas?inter?provincial?panel?data?from?2012?to?2019,this?paper?uses?the?double?machine?learning?method?to?explore?the?effects,internal?mechanisms?and?heterogeneous?effects?of?data?factors?on?the?improvement?of?service?industry?productivity.?The?results?show?that?data?factors?significantly?promote?the?productivity?improvement?of?Chinas?service?industry;?The?improvement?of?data?mining?ability?significantly?enhances?the?effects?of?data?factors?on?the?productivity?improvement?of?the?service?industry;?Data?factors?are?more?conducive?to?the?improvement?of?productivity?in?the?life?service?industry,and?their?impact?on?the?improvement?of?productivity?in?the?service?industry?in?eastern?and?southern?regions?of?China?is?more?significant.
Key?words:data?factors;?data?mining;service?industry?productivity;double?machine?learning
(責(zé)任編輯:周正)