劉 波 胡宗義 龔志民
健康是個人全面發(fā)展的前提,是經(jīng)濟社會發(fā)展的基礎(chǔ)。2016年10月,《“健康中國2030”規(guī)劃綱要》頒布,提出以農(nóng)村和基層為重點,推動健康領(lǐng)域基本公共服務(wù)均等化,維護基本醫(yī)療衛(wèi)生服務(wù)的公益性,逐步縮小城鄉(xiāng)、地區(qū)、人群間基本健康服務(wù)和健康水平的差異,實現(xiàn)全民健康覆蓋,促進社會公平。2018年9月,《鄉(xiāng)村振興戰(zhàn)略規(guī)劃(2018-2022年)》進一步明確了“健康鄉(xiāng)村建設(shè)”,關(guān)注農(nóng)村居民健康、縮小健康差距成為醫(yī)療衛(wèi)生改革與“鄉(xiāng)村振興”的核心要務(wù)。2019年7月,《國務(wù)院關(guān)于實施健康中國行動的意見》提出了“到2030年健康公平基本實現(xiàn)”的愿景。從現(xiàn)實來看,無論是社會經(jīng)濟發(fā)展水平,還是醫(yī)療衛(wèi)生資源的數(shù)量與質(zhì)量,農(nóng)村均落后于城鎮(zhèn)。居民健康水平不僅在城鄉(xiāng)之間存在巨大的鴻溝,在農(nóng)村內(nèi)部,居民之間的健康差距更為突出a按照《大逃亡:健康、財富以及不平等的起源》(Deaton,2013)的觀點,死亡率是衡量居民健康水平的重要指標。根據(jù)“第六次人口普查”的數(shù)據(jù),城鎮(zhèn)居民死亡率為3.75‰,鄉(xiāng)村居民死亡率為7.03‰;將31個省、市、自治區(qū)的分組數(shù)據(jù)按城、鄉(xiāng)匯總,城鎮(zhèn)組的死亡率取值范圍與標準差為[0.0026, 0.0054]、0.67‰,鄉(xiāng)村組的死亡率取值范圍與標準差為[0.0053, 0.0096]、1.01‰。。因此,農(nóng)村是推進健康中國建設(shè)的重點領(lǐng)域之一,提升農(nóng)村居民健康水平、縮小農(nóng)村居民之間的健康差距對于推進“健康鄉(xiāng)村建設(shè)”,進而實現(xiàn)“健康公平”目標具有重要現(xiàn)實意義。
個人兼具生物屬性與社會屬性,健康原本是生物學事件,由于諸多社會因素摻雜到“生老病死”的過程中,從而把純粹的生物學事件轉(zhuǎn)變?yōu)閺?fù)雜的社會事件(李紅文、毛新志,2015[1])。社會因素會直接影響個體是否暴露于營養(yǎng)不良、壓力過大、醫(yī)療匱乏、被感染等健康風險中,從而影響其是否免受疾病侵害(Solar和Irwin,2010[2];Phelan 等,2010[3];焦開山,2018[4])。因此,促進健康公平不能完全依靠對直接導(dǎo)致疾病的生物因素進行干預(yù)(CSDH,2009[5];WHO,2019[6])。居民之間的健康水平差異既受自然法則的影響,也受社會因素的左右,既有合乎正義法則的一面,也有悖于公平的一面。按照機會不平等的研究范式(Roemer,1993、1998、2016[7][8][9]),如果居民之間健康差距是由個人選擇或偏好所致,則被認為是合理的差距;但如果健康差距是由個人無法事先選擇的外生環(huán)境因素所致,則被認為是不合理的差距——健康機會不平等(Fleurbaey和Schokkaert,2009[10];Donni等,2014[11];Fajardo-Gonzalez,2016[12]),而縮小健康差距的首要任務(wù)則是縮小不合理的健康機會不平等。因此,如何緩解外部環(huán)境對農(nóng)村居民健康的不利影響、縮小健康機會不平等,是逾越城鄉(xiāng)之間的健康鴻溝、縮小農(nóng)村居民健康差距的著力點。本文的目標在于將農(nóng)村居民健康差距中的機會不平等分解出來,識別出引致健康機會不平等的主要因素,為“推進健康鄉(xiāng)村建設(shè)”建言獻策。
從已有文獻的研究進展來看,在居民健康指標的選擇上并未達成一致,在測度模型與分解方法上還存在改進的空間。在筆者的前期研究中,從總體上測度了中國居民健康差距中的機會不平等,本文是筆者前期研究的進一步拓展,邊際貢獻主要體現(xiàn)在三個方面:一是在健康指標的選擇上,綜合對比了自評健康、生物標記物、身體功能障礙測試與抑郁得分,從身、心健康兩個維度驗證了將自評健康作為健康指標的合理性;二是在測度方法上,在參數(shù)法的框架下,詳細討論了如何處理環(huán)境因素、身份變量與努力程度的相關(guān)性問題;三是在分解算法上,針對夏普利值分解算法中的維度災(zāi)難問題,本文給出了一種優(yōu)化思路,顯著縮短了夏普利值分解的耗時。
本文其余內(nèi)容包括5個部分:首先,對健康機會不平等問題的研究進展進行回顧;其次,論證自評健康作為健康指標的合理性,改進測度模型,給出優(yōu)化夏普利值分解算法的思路;第三,以CHARLS(2015)為樣本,測度中國農(nóng)村居民健康差距中的機會不平等,識別出導(dǎo)致健康機會不平等的主要因素;第四,調(diào)整健康決定方程的估計方法,進行穩(wěn)健性檢驗;最后,總結(jié)研究結(jié)論,結(jié)合現(xiàn)實提出政策建議。
健康機會不平等是本文的核心問題,主要涉及什么是健康機會不平等、如何測度健康機會不平等,以下綜述將從此兩方面展開。
Rawls認為健康是自然的產(chǎn)物,雖然受社會因素的影響,但并不受其控制,因而未將健康作為評價社會公正的核心變量和機會不平等的研究對象(Rawls,1971[13])。雖然健康作為機會平等的研究對象并不恰當,但與健康緊密相關(guān)的醫(yī)療保健卻是恰當?shù)难芯繉ο螅―aniels,1985[14];Ruger,2004[15])。隨著研究的深入,健康機會不平等的內(nèi)涵逐漸明確,“健康(及其關(guān)鍵的社會決定因素)不存在與社會優(yōu)勢/劣勢(財富、權(quán)力或聲望)有系統(tǒng)聯(lián)系的差異,健康不平等系統(tǒng)地使已經(jīng)處于社會不利地位的人口(如貧困人口、女性、種族、少數(shù)族裔、宗教群體)在健康方面處于更不利的地位”(Braveman和Gruskin,2003[16]),據(jù)此觀點,財富、權(quán)力、身份導(dǎo)致的健康差距是不合理的差距。在健康機會不平等的量化研究中,已有文獻仍然延續(xù)Roemer的“環(huán)境-努力”分析框架,其前提假設(shè)是居民健康由環(huán)境因素和努力因素決定。環(huán)境因素泛指無法首先選擇的外生因素,努力因素為生活習慣、健康素養(yǎng)等因素(Roemer,1993、1998、2016[7][8][9]),并將環(huán)境因素差異導(dǎo)致的健康差距界定為健康機會不平等,將努力因素差異導(dǎo)致的健康差距界定為合理的差距(Rosa Dias,2009[10];Fleurbaey 和 Schokkaert,2009[11];Jusot等,2013[12];Donni等,2014[17];Fajardo-Gonzalez,2016[18])。
測度機會不平等的方法主要有參數(shù)法、非參數(shù)法兩種,而測度健康機會不平等主要采用參數(shù)法(Ferreira 和 Gignoux,2011[19];Bj?rklund 等,2012[20];Carrieri和Jones,2018[21])。在參數(shù)法的具體應(yīng)用中有兩個核心問題:一是如何構(gòu)建健康決定方程;二是如何將每個因素對健康差距的貢獻度分解出來,從而獲取健康機會不平等對健康差距的相對貢獻度。
在構(gòu)建健康決定方程時,首先需要確定健康指標。在已有文獻中,通常將自評健康(Self-Report Health)作為量化居民健康狀況的健康指標。隨著研究的深入,有文獻開始質(zhì)疑自評健康是否能夠客觀準確地衡量居民的健康狀況。如果個人對自身的健康水平預(yù)期較高,那么對自身健康水平的評價也將不同(孫祺等,2003[22];Bagod’Uva等,2008[23]),并且自評健康在個人之間與國家之間不具備橫向可比性(Carrieri和 Jones,2017[21];Johnston et al.,2009[24])。因此,有越來越多的學者開始將更為客觀的生物標記物指標應(yīng)用到實證研究中。例如,在研究收入與健康的關(guān)聯(lián)性時,諸多學者將自評健康替換成生物標記物指標(Carrieri和Jones,2017[21];Banks 等,2006[25];Davillas 等,2017a[26];Davillas 等,2017b[27]),而血檢指標是最為常用的生物標記物指標。由于生物標記物指標包括多個檢測指標,因而需要對其進行降維(Cohen等,2014、2015[28][29]),將多維度指標轉(zhuǎn)化為單一維度的健康代理變量(Li等, 2015[30];Brasher等,2017[31])。健康不僅包括身體健康,還包括心理健康,除了利用生物標記物指標反映身體健康之外,還需要通過抑郁指標反映心理健康(焦開山,2014[32])。除此之外,身體健康與否還可以通過預(yù)期壽命來測量(Chetty等,2016[4];焦開山,2018[33])。
其次,需要確定健康的影響因素。在選擇健康的決定因素時,社會環(huán)境與政策調(diào)整是重點關(guān)注領(lǐng)域,兩者首先會因人而異地影響健康風險(Diderichsen等,2012[34]),相比于社會地位低的群體,處于較高社會地位高的群體,其健康風險水平相對較低,其患病風險也相對較低。CSDH對健康的社會決定因素進行了全面討論(CSDH,2009[5]),社會決定因素對健康的影響路徑具體如圖1所示(Solar和Irwin,2010[2])。健康不平等的社會決定因素包括結(jié)構(gòu)性決定因素和中介因素兩個層次,結(jié)構(gòu)性決定因素對健康的影響會因社會經(jīng)濟地位、社會階層、性別和種族的異質(zhì)性而有所不同,具體的傳導(dǎo)中介包括三個方面:物質(zhì)環(huán)境(Material circumstances)、社會心理環(huán)境(Psychosocial circumstances)、行為和生物因素(Behavioral and Biological Factors)。在物質(zhì)環(huán)境方面,良好的工作環(huán)境和生活環(huán)境使其遭受健康傷害的可能性較低(Evans和Kantrowitz,2002[35])。在社會心理環(huán)境方面,不同社會經(jīng)濟地位群體面臨的心理、社會壓力不同,較低社會經(jīng)濟地位群體面臨著更大的心理壓力、更強的社會剝奪感以及缺少控制感,而這些因素與諸多健康問題密切相關(guān)(Wilkinson,2005[36])。在行為和生物因素方面,社會經(jīng)濟地位通過多種風險行為(包括吸煙、酗酒、久坐、疾病預(yù)防)影響患病風險(Phelan等,2010[3];王甫勤,2017[37]),長壽也與某類基因相關(guān)(Zeng 等,2010[38])。
圖1 健康的社會決定因素
第三,確定健康決定方程的類型。已有文獻多以自評健康作為測度對象(Fajardo-Gonzalez,2016[12];Donni等,2014[11];Rosa Dias,2009[17];O’Donnell等,2015[39];Gallardo等,2017[40]),而自評健康是有序(Ordered)變量,對于有序變量通常采用Ordered Probit/Logit模型。基于有序變量模型僅能得到自評健康水平等于某個層級的概率預(yù)測值,而不能得到自評健康的預(yù)測值,故不能沿用原有的參數(shù)法,繼而又發(fā)展出三種不同的處理方法。第一種方法為“OLS+基于回歸方程的不平等指標分解”(Jones和 Nicolás,2006[41];Carrieri和 Jones,2018[42]),由于變量系數(shù)估計值的正負取值和顯著性在Ordered Probit/Logit模型的極大似然估計和OLS估計中存在一致性(Ferrer-i-Carbonell & Frijters,2004[43]),因而有文獻采用OLS方法估計Ordered Probit/Logit模型(Knight等,2009[44])。在此測度方法中,直接采用OLS方法估計健康決定方程,然后采用基于回歸方程的分解方法(如夏普利值分解、Fields分解)測度健康機會不平等。第二種方法為“極大似然估計+基于潛變量的Fields分解”(Jusot等,2013[18]),首先采用極大似然方法估計健康決定方程,然后估計被解釋變量(自評健康變量)的潛變量,再結(jié)合Fields分解方法分解出健康機會不平等對健康差距的貢獻值。第三種方法為“Probit/Logit模型 + 夏普利值分解”(Fajardo-Gonzalez,2016[12];Juárez和 Soloaga,2014[45]),首先將有序變量轉(zhuǎn)化為0-1變量,采用極大似然方法估計Probit/Logit模型,再以概率值估計值為基礎(chǔ),通過夏普利值分解測度健康機會不平等。
最后,在健康決定方程的估計中,需要處理環(huán)境因素與努力因素的相關(guān)性,以及確定隨機擾動項的歸屬。按照Barry的觀點,忽略父母給予的原生環(huán)境對子代努力程度的影響,直接將環(huán)境與努力變量納入方程(Barry,2005[46])。而Roemer認為,努力中包含了環(huán)境的影響,因而需要將努力中的環(huán)境因素剔除(Roemer,1995、1998、2016[7][8][9])。按照 Swift的觀點,努力會左右環(huán)境,因而需要將環(huán)境中的努力因素剔除(Swift,2005[47])。在實證研究中,通過輔助方程將努力中的環(huán)境因素剔除是較為常用的處理方式(Fajardo-Gonzalez,2016[12];劉波等,2020[48])。隨機擾動項的歸屬會直接影響測度結(jié)果,文獻中甚至存在刻意回避常數(shù)項和殘差項的現(xiàn)象(Wan,2004[49])。在已有文獻中,在如何確定隨機擾動項的歸屬上并未達成一致,以Roemer為代表的研究者將殘差項歸類為努力程度,也有學者將其歸類為環(huán)境因素(Devooght,2008[50]),或者認為殘差項的含義無法明確界定,可將之忽略(Lefranc等,2009[51])。
目前,直接以農(nóng)村居民的健康機會不平等為主題的文獻相對較少,散見于各類主題的研究中。健康在城鄉(xiāng)之間的差距是實證研究關(guān)注的重點(趙廣川,2017;魯萬波等,2018)[52][53],我國中老年人整體健康水平存在顯著的城鄉(xiāng)差異,健身場所、服務(wù)類組織、工業(yè)污染源距離和廁所類型是形成健康機會不平等的主要因素,除此之外,收入水平、居住方式與生活能源也是文獻關(guān)注的影響因素(陳東、張郁楊,2015[54];陳光燕、司偉,2019[55];方黎明、劉賀邦,2019[56])。醫(yī)療保障水平在城鄉(xiāng)之間存在顯著差距,醫(yī)療保險對農(nóng)村居民健康的影響一直是文獻關(guān)注的重點,“新農(nóng)合”是近期文獻關(guān)注的重點(程令國、張曄,2012[57])。新農(nóng)合有利于減輕醫(yī)療負擔,有助于改善農(nóng)村居民身體健康與心理健康(黃曉寧、李勇,2016[58];鄭適等,2017[59];趙為民,2020[60]),但卻難以發(fā)揮全面增進農(nóng)村居民健康的作用(章丹等,2019[61])。
綜上,本文認為關(guān)于健康機會不平等的研究還可以從以下方面進行拓展。首先,在健康指標的選擇上,已有實證研究多以自評健康作為健康指標,有諸多學者對自評健康能否作為量化居民健康水平的指標提出質(zhì)疑(Bagod’Uva等,2008[23];Johnston等,2009[24];Carrieri和Jones,2017[42])。本文認為,健康并非單一維度的身體健康,還包括心理健康,因而本文將對自評健康能否真實地反映居民的身心健康進行討論。其次,在方法層面,夏普利值分解是不平等指標分解中最為常用的方法,但在具體運用中存在維度災(zāi)難問題,維度災(zāi)難限制了高維度解釋變量在實證研究中的使用,因此本文給出了一種優(yōu)化算法的思路。第三,在研究對象方面,以中國居民健康機會不平等為研究對象的文獻有待進一步豐富,鮮有文獻討論中國農(nóng)村居民的健康機會不平等問題,本文的量化研究能夠估計出健康機會不平等對健康差距貢獻度,能夠為實施“健康中國戰(zhàn)略”、“推進健康鄉(xiāng)村建設(shè)”提供理論參考。
在實證研究中,自評健康是最為常用的健康指標,自評健康能夠較好地反映受訪人的健康水平(Hayes等,1995[62]),通常來自于SF-36量表(Short Form 36 health Survey Questionnaire)。然而,有文獻質(zhì)疑自評健康的主觀性,在量化收入與健康相關(guān)性的研究中,采用更具客觀性的生物標記物指標。生物標記物指標包括多個檢測指標,因而需要對其進行降維,基于馬氏距離(Mahalanobis Distance,DM(x))的降維方法是較為常用的方法(Cohen 等,2014、2015[28][29];Li等,2015[30];Brasher等,2017[31]),具體如式(1)所示。
其中,x為生物標記物指標向量,μ(x)為其均值向量,S為生物標記物指標的協(xié)方差矩陣。在本文的實證研究中,以CHARLS(2015)農(nóng)村居民(農(nóng)村戶口)的血檢數(shù)據(jù)、血壓與體重指數(shù)為樣本,指標及其描述性統(tǒng)計結(jié)果如表1所示。
表1 血檢數(shù)據(jù)指標、血壓與體重指數(shù)
通常而言,判斷某項血檢指標是否正常需要依據(jù)閾值,本文除了通過馬氏距離將血檢數(shù)據(jù)綜合為單一維度的連續(xù)指標之外,還將依據(jù)各項血檢指標的閾值將其轉(zhuǎn)化為0-1變量,再將轉(zhuǎn)化后的指標求和,從而得到受訪人的健康風險水平。如果受訪人的各項血檢指標不在正常范圍內(nèi)的數(shù)量越多,則意味著受訪人的健康狀況越差,各項指標的取值方式以及描述性統(tǒng)計結(jié)果如表2所示,分類統(tǒng)計結(jié)果如圖2所示。由圖2可知,自評健康與馬氏距離(DM)、健康風險指標亦呈正相關(guān)關(guān)系。由此可見,雖然自評健康的主觀性較強,但與基于客觀的血檢指標得到的健康風險具有一致性。
表2 血檢指標的閾值及描述性統(tǒng)計結(jié)果
圖2 DM、健康風險與自評健康
除了血檢指標之外,身體功能障礙測試也可以較為客觀地反映受訪者的健康狀況,身體功能障礙測試包含19個問題,每個問題的選項均為:“1.沒有困難;2.有困難但仍可以完成;3.有困難,需要幫助;4.無法完成”,按自評健康等級分類求均值,如表3所示。從總體來看,除個別項目外,其他項目的自評健康為“好”、“很好”的平均值低于“不好”、“很不好”的平均值。可見,自評健康也能夠反映出身體功能障礙測試的結(jié)果。
更為重要的是,健康不只包括身體健康,還應(yīng)包含心理健康,基于血檢數(shù)據(jù)得到的DM與健康風險指標,并不能反映受訪人的心理健康程度。在CHARLS(2015)中關(guān)于心理健康的調(diào)查共有10問題,每個問題的賦值方式為“1.很少或者根本沒有(<1天),2.不太多(1-2天),3.有時或者說有一半的時間(3-4天),4.大多數(shù)的時間(5-7天)”。按心理學問卷的處理方式,可將10個問題的分值加總得到抑郁得分,表4中給出了心理調(diào)查數(shù)據(jù)按自評健康的分類統(tǒng)計結(jié)果。從總體來看,自評健康為“好”、“很好”的抑郁得分平均值低于“不好”、“很不好”的平均值,具體的10項調(diào)查數(shù)據(jù)分布亦是如此。由此可見,自評健康也能夠反映出受訪人的心理健康水平。綜上所述,自評健康不僅能夠反映受訪人身體上的健康狀況,還能夠反映出受訪人的心理健康水平。因此,將自評健康水平作為量化健康的指標具有較強的合理性。
表4 抑郁得分與自評健康
本文認為,機會不平等的測度需實現(xiàn)兩個目標:一是測度機會不平等對總的不平等(差距)的相對貢獻度;二是對機會不平等進行分解,識別出導(dǎo)致機會不平等的主要因素。以此為導(dǎo)向,在現(xiàn)有兩種測度方案的基礎(chǔ)上,構(gòu)建測度模型。
(1)測度模型的構(gòu)建
在近期的文獻中,“極大似然估計+基于潛變量的Fields分解”、“Probit/Logit模型 + 夏普利值分解”(Fajardo-Gonzalez,2016[12];Jusot等,2013[18];Juárez和Soloaga,2014[45])是最具有代表性的兩種測度方案。第一種方案給出了三種處理環(huán)境與努力相關(guān)性的方法,雖然采用Ordered Probit/Logit模型構(gòu)建健康決定方程,卻以潛變量的估計值為基礎(chǔ),采用Fields分解方法估計健康機會不平等對健康差距的相對貢獻度。且沒有進一步分解出每個解釋變量對健康機會不平等的相對貢獻值,即沒有實現(xiàn)第二個研究目標。第二種方案比較契合測度機會不平等的兩個目標,但該方案在變量選擇上存在較為突出的局限性。沒有將努力因素、家庭的經(jīng)濟社會地位或者生活水平、年齡作為健康決定方程的解釋變量,努力因素是構(gòu)建健康決定方程不可或缺的因素,居民健康與其社會地位或者生活水平存在的高度相關(guān)性,年齡是影響健康的關(guān)鍵變量。如果遺漏了三者,必然會影響估計結(jié)果的一致性,從而會影響測度結(jié)果的準確性。更為重要的是,健康公平不僅包括橫向公平,還有縱向公平,而年齡增加導(dǎo)致的健康水平下滑是反映縱向公平最為直觀的范例。
本文仍然采用參數(shù)法測度健康機會不平等,將第一種方案的變量選擇方式與第二種方案的分解方法相結(jié)合,并在以下三個方面進行改進:
首先,對環(huán)境因素和努力因素的范疇進行延伸。遵循“環(huán)境-努力”二元框架的假設(shè),假定居民健康是由個人所處的環(huán)境與所付出的努力決定,在健康經(jīng)濟學語境下,環(huán)境不局限于個人所處的原生家庭環(huán)境、當前所處的生活環(huán)境與社區(qū)環(huán)境,而是指代影響個人健康的所有外生因素。外生因素不僅包括環(huán)境變量,還包括身份變量等外生指標。努力因素包含兩個維度:生活習慣與健康素養(yǎng),已有文獻中通常將抽煙、酗酒等生活習慣作為努力程度的代理變量,諸多文獻表明,健康素養(yǎng)與個人健康密切相關(guān)(DeWalt等,2004[63];Berkman等,2011[64];Al Sayah等,2013[65]),因而本文認為有必要將健康素養(yǎng)作為努力因素的一個維度。
其次,不局限于使用一種方式構(gòu)建輔助方程。從現(xiàn)實來看,環(huán)境因素與努力因素并不是相互獨立的(Roemer,1995、1998、2016[7][8][9];Jusot等,2013[18];Barry,2005[46])。首先,環(huán)境因素是決定努力程度的重要因素。吸煙、酗酒的行為會在代際之間傳遞(Orford和 Velleman,1991[66];Melchior等,2010[67];Schmidt和 Tauchmann,2011[68];Eriksson 等,2014[69]),如果父母抽煙、酗酒,子女吸煙、酗酒的可能性也會增加,原生家庭環(huán)境是塑成個人生活習慣的重要因素。自然環(huán)境與飲食習慣密切相關(guān),“南人喜米、北人好面”、“靠山吃山、靠水吃水”,自然環(huán)境是決定飲食習慣的主要因素。其次,努力程度是影響個人在中、老年時期所處社區(qū)環(huán)境、生活條件的重要因素。個人所處的環(huán)境并不是一成不變的,原生家庭環(huán)境會左右個人的努力程度,努力程度會使個人不同程度地脫離原生環(huán)境。例如,健康與收入的相關(guān)性是健康不平等研究關(guān)注的重點,家庭的生活水平或者社會地位是影響個人健康的重要因素,文獻中將之總結(jié)為“地位綜合癥”。然而,家庭的生活水平或者社會地位不僅受外生因素的影響,還受個人努力程度的影響。顯然,如果環(huán)境變量不完全外生,且努力程度并不完全由個人主觀決定,則不能只遵循某一種方式處理環(huán)境與努力之間的相關(guān)性。
第三,剝離環(huán)境、努力與隨機擾動項的相關(guān)性。在Ordered Probit/Logit模型中不能得到與線性回歸方程相同的隨機擾動項,隨機擾動項也不能參與到夏普利值分解中,故在分解過程中將其忽略(Lefranc等,2009[51])。如果隨機擾動項嚴格滿足隨機性,不將其納入分解過程中是合理的,但如果隨機擾動項與環(huán)境、努力存在相關(guān)性,將其忽略顯然是不合理的。圖3中直觀地給出了環(huán)境、努力、殘差項三者的關(guān)聯(lián)關(guān)系,假設(shè)環(huán)境、努力與殘差項不相關(guān)是比較嚴苛的。在構(gòu)建健康決定方程時,無法窮盡所有影響個人健康的變量,而且并不是所有的變量都是可觀測、可量化的。與此同時,微觀調(diào)查數(shù)據(jù)提供的變量也是有限的,因而所構(gòu)建的健康決定方程會遺漏某些變量,從而導(dǎo)致模型可能存在異方差問題,而異方差通常表現(xiàn)為解釋變量與殘差項存在相關(guān)性。不同個體對自身的健康預(yù)期是不同,那么對自身健康水平的評價也有所不同(Bagod’Uva等,2008[23]),原生家庭環(huán)境、生活水平、受教育水平、生活習慣、年齡與性別都可能會影響對自身健康水平的評價,觀測誤差可能隨著環(huán)境因素、努力因素的變化而不同。如果模型存在異方差問題,參數(shù)估計量不再具備漸進有效性,最終影響測度結(jié)果的準確性。由于自評健康是有序變量,在考慮異方差的條件下,需要采用異方差選擇模型(Heterogeneous Choice Models)估計健康決定方程(Williams,2016[70]),可將原生家庭環(huán)境、生活條件、受教育水平、生活習慣、年齡與性別作為估計方差的變量。
圖3 健康機會不平等測度模型中環(huán)境、努力與殘差項的關(guān)系
按照參數(shù)法的流程,首先是構(gòu)建健康決定方程,在“環(huán)境-努力”的框架下,健康(Hi)是由環(huán)境變量(Ci')、努力程度(Ei)與不可觀測的隨機因素(ξi)決定,如式(2)所示。
自評健康(Hi)為有序變量,如在CHARLS數(shù)據(jù)庫中,自評健康的取值方式為“5極好、4很好、3好、2一般、1不好”。在中文的語境下,將環(huán)境變量稱為條件變量更為恰當,條件變量不僅包括完全外生的原生家庭環(huán)境(C1i)、生活條件(C2i)、社區(qū)環(huán)境(C3i),還包括外生的身份變量(Di),即,即。雖然身份變量是外生的,但并非所有身份變量導(dǎo)致的健康差距都是不合理的,比如年齡。因此,本文將年齡(Ai)中身份變量中單列出來,將剩余的身份變量命名為。由此可將式(2)改寫為:
由于環(huán)境變量與努力變量存在相關(guān)性,進一步通過輔助方程對變量進行調(diào)整。為了獲取環(huán)境因素對健康差距影響的上限值,故按照Roemer的方式構(gòu)建努力方程,如式(4)-(5)所示。
其中,ei與?k,i為殘差項,Ck,i為生活條件與社區(qū)環(huán)境變量中受原生家庭環(huán)境、身份變量影響的變量,如家庭的生活水平。由于環(huán)境變量與努力變量通常為有序變量或者0-1變量,不能獲取一般意義上的殘差項,但可以獲取輔助方程的廣義殘差項êi、??k,i(Gourieroux 等,1987[71])。通過輔助方程將Ei、Ck,i中的外生因素剝離之后,剩下的殘差項可以視作純粹的努力程度變量,將兩者帶入式(3)中可得:
由式(7)-(9)可得P(Hi>h)、P(Hi≤h)(h=1,2,3,4)的概率值:
在Ordered Probit模型中,假定隨機擾動項(ξi)服從標準正態(tài)分布,而在Ordered Logit模型中,假設(shè)隨機擾動項(ξi)服從Logistic分布,相應(yīng)的概率值如式(12)-(13)所示:
(2)夏普利值分解的算法優(yōu)化
在現(xiàn)有方法中,夏普利值(Shapley Value)分解方法的應(yīng)用最為廣泛(Shorrocks,2013[72])。按照夏普利值分解的流程,首先需給出健康決定方程與解釋變量。按照本文的設(shè)定,夏普利值分解的對象為為不平等指標。為了便于表達,假定,變量集共包含個變量,按照夏普利值分解的原理,本文提出一種更為簡化的分解算法,主要包括三個步驟:
首先,在變量集Xi中選定一個變量,以第一個變量為例,以剩下的N-1個變量組成變量集X',再以X'為基礎(chǔ),生成子變量集Zi(i=1,,K),K的取值如式(15)所示。
其次,將Zi中所有的變量以其均值替代得到,從而可得第一個變量差異引致的健康差距:
其中,CX'Zi為子集Zi在全集X'中的余集。依次類推,最終可得N個變量對健康差距的絕對值(S1,…,SN)。最后,以絕對貢獻值為基礎(chǔ),可得每個變量對健康差距的相對貢獻值:
按照本文提出的簡化算法,可以有效降低夏普利值的分解時間,運算效率顯著提升。
在實證研究中,本文的樣本數(shù)據(jù)為CHARLS(2015),由于本文的測度對象為農(nóng)村居民,因而選取戶口為農(nóng)業(yè)戶口的受訪人為研究對象。變量的定義與賦值方式如表5所示,變量分為原生家庭背景、生活條件、社區(qū)環(huán)境、努力程度、身份變量5類,共計21個變量。其中,家庭背景變量包括父母受教育程度、17歲之前的家庭經(jīng)濟狀況、童年時期父親與母親是否抽煙、童年時期父親是否酗酒;生活條件包括家里是否有廁所、是否有自來水、做飯用的主要燃料、當前的家庭生活水平;社區(qū)環(huán)境包括居住地所在經(jīng)濟區(qū)域、城市類型、是否有公交車、居住地是否有工業(yè)污染、是否有下水道系統(tǒng)、垃圾處理方式;努力變量包括剝離環(huán)境因素后的生活水平、受教育程度、是否抽煙、是否喝酒;身份變量包括年齡、性別、民族。
表5 變量的選擇與賦值
續(xù)表
經(jīng)過數(shù)據(jù)清洗,有效樣本共有5418個,變量的描述性統(tǒng)計詳見表6,自評健康的均值為2.5026,眾數(shù)和中位數(shù)均為2,可見自評健康的分布為有偏分布,較多受訪人的自評健康在均值以下。具體來看,在樣本受訪人中,自評健康為“不好”、“一般”、“好”、“很好”、“極好”分別為918人、1985人、1694人、516人、305人,占比依次為16.94%、36.64%、31.27%、9.52%、5.63%;再將“極好”、“很好”、“好”匯總,三者共計2515人,占比46.62%。
表6 變量的描述性統(tǒng)計
續(xù)表
健康決定方程的估計包含兩個步驟,首先估計輔助方程,輔助方程的因變量依次為受教育水平(edu)、是否抽煙(smoking)、是否喝酒(alcohol)、家庭生活水平(situation),以估計結(jié)果為基礎(chǔ)可以得到廣義殘差項的估計值edu_res_hat、smoking_res_hat、alcohol_res_hat、situation_res_hat。其次,在考慮異方差的條件下,將四者與其他變量一起作為解釋變量估計健康決定方程。由于自評健康為有序變量,因而可以采用Ordered Probit/Logit模型進行估計,輔助方程與健康決定方程的系數(shù)估計值如表7所示。基于Ordered Probit模型的估計結(jié)果可以得到變量的邊際效應(yīng),而基于Ordered Logit模型可以得到變量的幾率比,幾率比能夠給予估計系數(shù)估計值更為直觀的現(xiàn)實含義,幾率比的估計結(jié)果亦如表7所示。從系數(shù)估計值與顯著性程度來看,兩類模型的估計結(jié)果并無較大差異。由于廣義隨機擾動項的估計需以O(shè)rdered Probit模型為基礎(chǔ),故在健康機會不平等的測度中,以O(shè)rdered Probit模型的估計結(jié)果為基礎(chǔ)。值得關(guān)注的是,在1%和5%的置信水平上,受教育程度、吸煙與否對方差存在顯著影響。
表7 健康決定方程的估計結(jié)果
續(xù)表
由Ordered Probit模型的估計結(jié)果可知,在1%的置信水平上,原生家庭的經(jīng)濟狀況、東部地區(qū)、剝離外生因素后的家庭生活水平、年齡和性別對自評健康存在顯著影響;在5%的置信水平上,家中是否有沖水廁所、剝離外生因素后的是否抽煙亦是顯著的;在10%的置信水平上,家用主要燃料類型、中部地區(qū)、是否有下水道也顯著。由幾率比的估計結(jié)果可知,在給定自評健康的條件下,原生家庭的經(jīng)濟狀況增加一個單位,I{Hi>h}的幾率比將增加12.73%;家中有沖水廁所,幾率比將增加11.44%;主要燃料不是秸稈或者柴火,幾率比將增加8.64%;如果受訪人位于東部地區(qū),幾率比將增加32.15%;居住地有下水道系統(tǒng),幾率比將增加11.14%。對于剝離外生因素后的努力變量,調(diào)整后的家庭生活水平增加一個單位,幾率比將增加20.07%;調(diào)整后的是否吸煙增加一個單位,幾率比將增加5.47%。在身份變量中,年齡每增加1歲,幾率比將降低0.93%;如果受訪人是男性,幾率比將增加11.98%。綜上,眾多外生環(huán)境因素變量對自評健康均存在顯著影響,由此可見,對于農(nóng)村居民而言,存在突出的健康機會不平等。
以O(shè)rdered Probit模型的估計結(jié)果為基礎(chǔ)可得I{Hi>h}的預(yù)測值,相應(yīng)的基尼系數(shù)分別為0.0413、0.1113、0.1997、0.2618。由于在健康決定方程中共有21個解釋變量,故在夏普利值分解中需進行209.72萬次運算。進一步,采用本文給出的優(yōu)化算法,對基尼系數(shù)進行夏普利值分解,分解結(jié)果如表8所示。
表8 夏普利值分解結(jié)果
續(xù)表
其次,將變量的相對貢獻度按類別匯總,努力因素的相對貢獻度位列第一,為31.360%;社區(qū)環(huán)境次之,為28.297%;原生家庭環(huán)境位居第三,為19.401%;生活條件為第四,為10.930%;最后是身份變量,為10.012%。年齡差異導(dǎo)致的健康差距是合理的健康差距,將年齡與努力程度的相對貢獻度加總,可知合理的健康差距在總的健康差距中占比為39.224%。除年齡之外的身份變量與環(huán)境變量導(dǎo)致的健康差距是不合理的健康差距——健康機會不平等,將年齡之外的身份變量與環(huán)境變量的貢獻度加總,可得健康機會不平等對健康差距的相對貢獻度為60.776%。
表9 Ordered Probit模型與Ordered Logit模型的估計結(jié)果
續(xù)表
以O(shè)rdered Probit模型的估計結(jié)果為基礎(chǔ),首先估計n,i的基尼系數(shù),分別為0.0384、0.1102、0.2006、0.2605。進一步檢驗該結(jié)果與基于異方差選擇模型得到的基尼系數(shù)(0.0413、0.1113、0.1997、0.2618)是否存在顯著性差異,檢驗結(jié)果表明,在5%的置信水平上,1,i、2,i的基尼系數(shù)在兩類模型之間存在顯著差異,而3,i、4,i的基尼系數(shù)在兩組之間并不存在顯著差異a。由此可見,環(huán)境變量、身份變量與努力程度變量是否存在相關(guān)性會顯著影響n,i的基尼系數(shù),間接凸顯了在實證研究中采用異方差選擇模型估計健康決定方程的必要性。調(diào)整估計方法后,n,i的基尼系數(shù)估計值在統(tǒng)計上并未完全改變,且兩組基尼系數(shù)的數(shù)值差異甚小,可見n,i的估計值具有較好的穩(wěn)健性。
進一步對基尼系數(shù)進行夏普利值分解,分解結(jié)果如表10所示。同樣以的分解結(jié)果為例,剝離外生因素影響后的家庭生活水平、東部地區(qū)、17歲以前的家庭經(jīng)濟狀況、年齡仍然是影響健康差距的主要因素。具體來看,在原生家庭環(huán)境變量中,父母受教育程度對健康差距的相對貢獻度為1.315%,早期家庭經(jīng)濟狀況為17.135%,父親與母親是否抽煙為0.011%,父親是否酗酒為0.717%;在生活環(huán)境變量中,是否有沖水廁所對健康差距的相對貢獻度為3.279%,是否有自來水為2.491%,主要燃料為4.518%;在社區(qū)環(huán)境變量中,經(jīng)濟區(qū)域(東部、西部)對健康差距的相對貢獻度為21.118%,所在城市類型為0.972%,是否有公交車為0.169%,是否有工業(yè)污染為0.822%,是否有下水道系統(tǒng)為4.598%,垃圾處理方式為1.795%;在努力變量中,剝離外生因素影響后的家庭生活水平、受教育程度、是否抽煙與喝酒對健康差距的相對貢獻度依次為29.522%、0.164%、1.775%、0.122%;在身份變量中,年齡差異對健康差距的相對貢獻度為7.163%,性別為2.165%,民族為0.002%。
表10 基于穩(wěn)健性檢驗的夏普利值分解結(jié)果
續(xù)表
以此為基礎(chǔ),按變量類別匯總相對貢獻度,努力因素、社區(qū)環(huán)境、原生家庭環(huán)境、生活條件、身份變量的相對貢獻度依次為31.582%、29.620%、19.179%、10.289%、9.330%。年齡差異與努力程度差異導(dǎo)致的健康差距是合理的健康差距,合理的健康差距在總的健康差距中占比為38.746%。年齡之外的身份變量與環(huán)境變量導(dǎo)致的健康差距是不合理的,兩者的貢獻度之和為61.254%,即按照Fajardo-Gonzalez的處理方式[12],在穩(wěn)健性檢驗中,健康機會不平等對健康差距的相對貢獻度為61.254%。
“生老病死”并非單純的生物學事件,其中摻雜了諸多社會因素,遺傳因素、膳食結(jié)構(gòu)、作息習慣、醫(yī)療保健都會影響居民健康。居民健康既有遵從自然法則、合乎正義的一面,也有人為干預(yù)、有違機會公平的一面。本文的研究目標是在機會不平等的理論框架下,測度農(nóng)村居民健康差距中的機會不平等,從農(nóng)村居民健康差距中分解出不合理的健康機會不平等。在健康機會不平等中,已有文獻并未在健康指標的選擇上達成一致,本文認為健康不只包括客觀上的身體健康,還應(yīng)包括主觀上的心理健康。本文對比了血檢數(shù)據(jù)、抑郁得分與自評健康三項健康指標,對比發(fā)現(xiàn)自評健康不僅能夠反映基于血檢數(shù)據(jù)得到的健康風險程度,還能反映出基于抑郁得分得到的心理健康,自評健康能夠綜合反映出受訪者的健康狀況。因此,在本文的健康機會不平等的測度中,以自評健康為健康指標。
在考慮環(huán)境因素、身份變量、努力因素與隨機擾動項存在相關(guān)性的條件下,以O(shè)rdered Probit/Logit模型與夏普利值分解為基礎(chǔ)構(gòu)建測度模型,并以CHARLS(2015)中的農(nóng)村居民為樣本數(shù)據(jù)進行實證研究。實證研究結(jié)果表明:①在本文選擇的21個變量中,剝離外生因素影響后的家庭生活水平、東部地區(qū)、17歲以前的家庭經(jīng)濟狀況、年齡是影響健康差距的主要因素,對健康差距的相對貢獻度依次介于28.934%~30.275%、22.618%~23.263%、16.469%~17.635%、6.914%~7.389%;②將變量對健康差距的相對貢獻度按變量所屬類別匯總之后,原生家庭環(huán)境的相對貢獻度介于18.398%~19.775%,生活條件的相對貢獻度介于9.988%~10.507%,社區(qū)環(huán)境的相對貢獻度介于29.185%~30.140%,努力因素的相對貢獻度介于30.990%~32.358%,身份變量的相對貢獻度介于9.116%~9.542%;③努力程度與年齡導(dǎo)致的健康差距是合理的差距,而除年齡之外的身份變量與環(huán)境變量導(dǎo)致的差距則是不合理的差距——健康機會不平等,將努力程度與年齡的相對貢獻度加總,可得合理的健康差距在總的健康差距中占比為38.379%~39.273%,而將年齡之外的身份變量與環(huán)境變量的貢獻度加總,健康機會不平等的相對貢獻度介于60.727%~61.621%。由實證研究結(jié)果可知,努力程度差異是影響健康機會不平等首要因素,個人所在的社區(qū)環(huán)境次之,原生家庭環(huán)境位列第三。因此,保持健康的生活習慣、提升健康素養(yǎng)、加強社區(qū)基礎(chǔ)設(shè)施建設(shè)、阻斷健康不平等的代際傳遞是抑制健康機會不平等的主要著力點。鑒于此,本文認為可從以下三個方面入手緩解健康機會不平等問題:
首先,將健康知識教育納入國民教育體系,提升國民健康素養(yǎng)。掌握必要的健康知識有益于居民養(yǎng)成健康的飲食習慣與作息習慣,對于疾病預(yù)防具有關(guān)鍵作用。從現(xiàn)實來看,中國農(nóng)村居民的健康知識普遍比較缺乏,農(nóng)村居民生活中的許多影響健康的成規(guī)陋習與缺乏健康知識緊密相關(guān),因而有必要提升健康知識水平。一方面,可以將健康知識教育納入教育體系,提升年輕一代的健康知識水平。另一方面,定期開展鄉(xiāng)村健康知識普及活動,消除“成規(guī)陋習”,提升中老年人的健康知識水平。
其次,消除醫(yī)療空白點,增加醫(yī)療基礎(chǔ)設(shè)施建設(shè)投入,合理布局基層醫(yī)療機構(gòu),充分發(fā)揮基層醫(yī)療機構(gòu)功能。對于醫(yī)療空白點的鄉(xiāng)村,加之交通與地理位置的制約,看病諸多不便。在合理布局基層醫(yī)療機構(gòu)的前提下,盡可能地消除醫(yī)療空白點,有利于降低農(nóng)村居民看病的時間成本與交通成本,化解看病難的問題?;鶎俞t(yī)療機構(gòu)應(yīng)充分發(fā)揮預(yù)防、治療和宣傳功能,開展定期體檢,監(jiān)控居民健康狀況,普及健康知識,消除生活陋習。
第三,通過政策干預(yù)阻斷健康差距的代際傳遞,從嬰兒、幼兒、兒童健康切入,提升國民健康水平。首先,大幅提升健康民生項目的覆蓋面,加大遺傳疾病、先天疾病的篩查力度,促進優(yōu)生優(yōu)育。其次,進一步增加免費疫苗種類,著力提升疫苗接種率,防范于未然。第三,定期開展營養(yǎng)、體能和心理檢查,追蹤成長狀況。