邱 東
(北京師范大學 國民核算研究院,北京 100875)
對福利的測度,是經(jīng)濟學及其經(jīng)濟統(tǒng)計學的一個悠久傳統(tǒng)。英國哲學家邊沁(Jeremy Bentham)早在17世紀就創(chuàng)造性地編制“快樂指數(shù)”,德國“國勢學派”及社會統(tǒng)計學派也特別關(guān)注社會福利。在“國民生產(chǎn)總值還是國民收入(GNP or NI)”論戰(zhàn)中,美國經(jīng)濟學家、諾貝爾經(jīng)濟學獎得主庫茲涅茨(Simon Kuznets)強調(diào)經(jīng)濟測度的重心在于社會福利。SNA核算范式確立之后,斯通(Stone)又設(shè)計了“社會與人口核算體系(SSDS)”。20世紀60年代自美國“社會指標運動”開始,福利測度更成為社會關(guān)注熱點,各種測度指標涌現(xiàn),各種測度方法爭相流行。這個傳統(tǒng)如此強大,以至于人們往往將福利測度視為天經(jīng)地義。
2010年,Stiglitz、Sen和Fitoussi為首的“經(jīng)濟表現(xiàn)和社會進步測度委員會”發(fā)表報告(以下簡稱“SSF報告”,國外有的文獻稱之為“斯蒂格里茨報告”),較為系統(tǒng)地梳理和總結(jié)了經(jīng)濟測度方法,福利測度(與GDP統(tǒng)計、可持續(xù)發(fā)展測度)成為其中三大內(nèi)容之一[1]12-190。
然而,福利真的具備“可測度性”嗎?種種流行的測度福利方法確實可行嗎?其所依托的測度邏輯確實鏈接好了嗎?甚至,為什么福利測度是必要的?至少,什么樣的經(jīng)濟福利測度內(nèi)容是必要的?它在什么成本約束下是必要的?無論是SSF報告,還是相關(guān)文獻,對這些基本問題的系統(tǒng)討論甚少。
本文基于SSF報告內(nèi)容對福利測度提出質(zhì)疑和批判,討論經(jīng)濟福利的多元性及其對測度的可能障礙,作為測度方法展開的對象。剖析測度經(jīng)濟福利的三種理念:主觀福利觀、能力觀和公平分配觀,側(cè)重于這些理念的方法論啟示。揭示福利測度主要方法的可行性,包括問卷法、支付意愿法、樣本代表性問題和合成指標法。
福利的外延不易把握,SSF報告采用“經(jīng)濟福利”這個限制,并將其與“生活質(zhì)量”等同使用。至于福利與經(jīng)濟福利究竟有什么區(qū)別,SSF報告語焉不詳。SSF報告也沒有使用“幸福測度”這種流行說法,這些審慎做法對我們的警示是,一旦涉及實地測度,就需要注意對經(jīng)濟福利內(nèi)涵與外延的適度把握。
經(jīng)濟福利測度與“GDP統(tǒng)計”不同,不再將測度重心放在生產(chǎn)發(fā)展水平或經(jīng)濟表現(xiàn),是經(jīng)濟測度從生產(chǎn)過程轉(zhuǎn)向其目的之升華。福利測度與GDP統(tǒng)計既有區(qū)別,又有聯(lián)系。
需要注意的是,SSF報告特別強調(diào)當下福利與未來福利的區(qū)別,即應該將生活質(zhì)量測度與可持續(xù)發(fā)展測度加以區(qū)分[2]32-50。筆者認為,從測度可行性與數(shù)據(jù)質(zhì)量角度看,這種區(qū)分是相當必要的。經(jīng)濟測度總會面臨各種約束,將比較有把握的測度與把握不大的測度分開,是對數(shù)據(jù)用戶負責任的體現(xiàn),也是對經(jīng)濟測度的一種敬畏。筆者提出一個區(qū)分:SSF報告的三大內(nèi)容構(gòu)成了經(jīng)濟測度的三個層級,對經(jīng)濟福利測度的認識,應該放在整個經(jīng)濟測度的大格局中來認識。
生產(chǎn)測度和福利測度存在區(qū)別,生產(chǎn)為了福利,但只是福利的來源之一。從測度角度分解,福利來源可以細分為四種:第一,本期本單位生產(chǎn)。第二,生產(chǎn)成果在不同時間段之間的轉(zhuǎn)移,如公共服務的正外部性在各期發(fā)揮滯后影響,其中甚至應該包括各期成果的漏測部分。第三,生產(chǎn)成果的空間轉(zhuǎn)移,一國至另一國的空間正外部性,當然也存在福利的空間負外部性轉(zhuǎn)移。第四,自然資源、氣候等自然稟賦對經(jīng)濟福利的作用。前三種經(jīng)濟福利均來自于生產(chǎn),但其時間和空間范圍不一致,導致測度特定時空的福利與生產(chǎn)測度之間的差異。第四種福利并非來自人類的生產(chǎn)活動,比如一個城市冬暖夏涼,可以節(jié)省空調(diào)設(shè)備及其運轉(zhuǎn)的資源,轉(zhuǎn)而可能用于滿足其他福利需求。
福利的需求影響因素可以細分:第一,需求方的消費心理。個人消費習慣不同,存在悲觀和樂觀兩種基本消費習慣,一種是追求最佳“現(xiàn)貨”,每次都享受最好的;另一種是追求最佳預期,每次都有更好的在等待。第二,需求方原有的福利基礎(chǔ),客觀的福利需求量在不同時期分布可以產(chǎn)生某種抵消效應,如果基礎(chǔ)較好,短期福利差一些亦可忍受,此時供給如果減少不大會影響其福利水平。但若原來福利基礎(chǔ)不好,經(jīng)濟狀況再變得更差,或者福利水平長期無法改善,就難以忍受。第三,需求方不同空間比較所產(chǎn)生的滿足感和不滿足感。第四,文化、宗教、歷史等影響。比如清教徒講求節(jié)儉,某些極端節(jié)儉的教派甚至不用現(xiàn)代電器,過原始生活才真正幸福。
福利供給和需求的因素都可以且應該細分,兩方面的不同因素再組合,又產(chǎn)生多輪次的交叉作用。這些都使福利測度和生產(chǎn)測度產(chǎn)生較大區(qū)別。
福利多元,但測度資源有限,只能選取部分內(nèi)容加以反映,無論選取哪部分都將是一種偏執(zhí)。偏執(zhí)的福利測度會成為一種信息誘惑,讓人們產(chǎn)生“媚上心理”和從眾心理。誘惑在客觀上會干預民眾的幸福取向,破壞福利的多元格局,這其實是文化專制的一種。歐美有人推崇不丹的“國民幸??傊怠保坏さ男腋J俏镔|(zhì)困苦型的,以追求來世的宗教為依托,這樣的福利測度究竟有何正面意義?時至今日,還有不丹人自己也不愿意完全用國民幸??傊?GNH)取代GDP。
經(jīng)濟福利的跨文化比較未必完全可行。不同文化,對安靜和熱鬧的喜好不同。發(fā)達國家講究寂靜,用公德(日本人在公交車上不宜使用手機通話)、法律、技術(shù)等方式創(chuàng)造低噪聲環(huán)境。不同文化有著不同的飲食偏好和禁忌,中醫(yī)在東方文化造福于人,西方很多人卻認為拔罐子、刮痧、放血等是巫術(shù)。父母與子女的關(guān)系各國也有相當大差異,表現(xiàn)在可否打罵、供養(yǎng)到多大、結(jié)婚費用等方面。歐美把無法出門度假稱為“糟糕的休閑”,但窮國的多數(shù)人沒有這種奢望,放假往往是做“非日常家務”的時間,如果能夠不干活,讓身體真正休息,就非常滿意了??梢?,不同國家不同經(jīng)濟發(fā)展水平,對生活質(zhì)量的要求和看法都不同,東方的福利增項可能成為西方的福利減項,無法用統(tǒng)一的標準去測度。
就福利測度的國際比較而言,不同經(jīng)濟發(fā)展階段的國家對此類公共品的需求程度是否相同?一國經(jīng)濟測度究竟應該與該國經(jīng)濟水平相匹配,還是向國際標準看齊?這是一個現(xiàn)實問題,對歐美人來講,二者近乎等價,但這能反映窮國的需求和能力嗎?是否應該提出標準的經(jīng)濟福利測度要求?在什么樣的發(fā)展水平上才可提出深化福利測度的要求?但如果對福利信息的要求不同,比如福利信息分類粗細不同,又如何構(gòu)建可深入進行國際比較的綜合指標?
休閑是關(guān)乎生活質(zhì)量如何的一個重要組成部分,OECD《理解國民賬戶》給出一個休閑的定義,即花費在與生產(chǎn)和個人照顧無關(guān)活動上的時間。其實這個說法不妥,細究起來,休閑與生產(chǎn)和個人照顧難以截然分開,就是與無酬家務也糾纏不清,即使沒有直接關(guān)系,也可以有間接關(guān)系。正是休閑的這個特性造成了測度困局,無論是休閑的數(shù)量還是質(zhì)量都難以給出確切的測度結(jié)果。要測度,就要有相應標準,而休閑卻因人、因事、因時、因空而異,人們往往無法制定統(tǒng)一的測度標準。
休閑與人的能力有關(guān)。能力強的人,工作時可有部分時間處于休閑狀態(tài)。能力弱的人,下班后工作外的時間還需要加班。休閑、能力與工作管理方式可以相互作用,工作分為計件和計時兩種。如果采用計時管理,能力強的人如果要保持工作節(jié)奏均衡,就得自覺降低勞動強度,勞動強度低到什么程度可以視為休閑呢?
休閑與人的精神狀態(tài)相關(guān)。人與人不同,有的人不工作呆著難受。有的人很怕事,非工作時間心里還在擔心工作的事,不能處于休閑應有的狀態(tài)。
休閑與人的生活態(tài)度相關(guān),如果能把工作和個人愛好合二為一,是工作又是休閑,無法判定究竟。好多市場工作都可以與閑暇相重合,比如畫家、詩人、研究者等。靈感往往來自于閑暇過程,來自于自然現(xiàn)象的啟發(fā),來自于吃飯、喝茶等社會交往過程。智力工作者或許不加班,但是他們精神上從來不下班。人體基因“雙螺旋模型”就是誕生在英國劍橋的“鷹酒吧(Eagle Bar)”,經(jīng)濟學的“拉弗曲線”也是在餐巾紙上畫出來的。好多人羨慕大學老師職業(yè),一年兩個假期,然而很少人看到半夜仍亮著燈的書房,其實教師崗位的特點在于工作時間彈性大,休閑與工作難以區(qū)分。由于休閑容易與其他活動混淆,不能只看表面現(xiàn)象,還需深入考察區(qū)分。
休閑還可能是生產(chǎn)過程中必須的中間消耗。比如美國硅谷的高科技公司,大樓里專門設(shè)有休閑區(qū),強制性地要求員工上班時間去休閑,可以用各種形式放松,否則腦力疲勞后工作效率更低。越是高科技工作,越是腦力勞動強度大的工作,越需要調(diào)節(jié)。高度緊張的腦力勞動要求員工每年定期休假,平日下班后需要從事文藝體育項目以放松神經(jīng)。這樣,休閑活動完全可以定性為生產(chǎn)過程付出的中間消耗,是個人為企業(yè)生產(chǎn)的付出。
休閑很可能跟“無酬家務”相混淆。某些活動究竟是休閑還是無酬家務,取決于個人的好惡。有的人以做飯為樂,有的人愿意逛商店,購物時就滿足了此愿望。有的人愿意打電話,談完正事兒就聊天。有的以上網(wǎng)為樂,有的以開車為樂。對這種家庭生活熱情飽滿的人而言,無酬家務就是休閑,福利測度的困難在于:究竟如何將時間分配給二者?
休閑還可能與“個人照顧(主要是吃喝睡)”相混淆。如果一個飯局兩小時,其中多長時間算個人照顧?多長時間又算休閑?上床(go to bed)和入睡(go to sleep)通常是兩回事兒,這段時間在床上躺著,是個人照顧?還是休閑?或者是工作?還是學習?取決于此時大腦在做什么。這段時間不僅狀態(tài)難以歸類,而且狀態(tài)常常轉(zhuǎn)來轉(zhuǎn)去,無法固化界定。筆者將對測度休閑的質(zhì)疑歸結(jié)為以下三點:第一,休閑與人類其他活動有著太多的“亦此亦彼性”,無法滿足統(tǒng)計分組“既不重復又不遺漏”的原則,無法判明個人每天究竟有多長時間用于休閑,其確切數(shù)量無法測度清楚。第二,休閑的質(zhì)量也難以測度,不同的人,休閑無法統(tǒng)一估價,其“等值收入”也難以按一個標準計算。第三,可以為休閑計算出某些數(shù)據(jù)來,但是這種計算包含了太多的假設(shè),隨意性較大,結(jié)果似是而非,并不具有本應具備的社會經(jīng)濟內(nèi)涵,不能真正減少社會認知中的不確定性,甚至可能誤導民眾的社會認知。
總之,休閑難以測度,而作為人類生活不可或缺的組成部分,休閑的不可測度性又將嚴重影響對生活質(zhì)量的確切測度。
不平等的存在使社會總體生活質(zhì)量的下降。不平等在經(jīng)濟福利中更為多元,不同類型的不平等各有其意義,不能用一種方法的測度。而且,各種不平等之間還可能相互強化,產(chǎn)生疊加效應,這就要求研究政策措施對其作用影響。
SSF報告強調(diào)了“多重劣勢的累積效應”,比如,貧病交加所致的生活質(zhì)量損失遠遠大于這兩者分別造成的損失之和。與此相對應的,還應該注意到“多重優(yōu)勢的累積效應”,比如,既有顏值又有本事,比起只有顏值或本事,當然更容易在職場打開局面。兩種情形合在一起就是眾所周知的“馬太效應”。所以研究不平等的時候,應該同時把握劣勢和優(yōu)勢累積兩方面。
需要特別注意的是,自然界存在著“紅移現(xiàn)象”,各星球間的距離在擴大。筆者認為,在經(jīng)濟界也存在類似的現(xiàn)象,在經(jīng)濟規(guī)模及其相關(guān)指標上,也存在著極大值提升的趨勢。極值單邊擴大,導致被評價對象間的距離擴大,被評價事物的格局擴大。由于經(jīng)濟數(shù)量級的擴大,客觀上不平等的程度一定會加大。因此,在不平等時序分析時,不同數(shù)量級的不平等水平存在不可比因素。同一不平等指標數(shù)值升高,不一定是不平等加劇,其中會有極大值提升的影響,計算相對數(shù)時,1% 差異所代表的絕對值不同,需要考慮其中的實際經(jīng)濟含義。不平等分析需剔除數(shù)量級變異的影響。由于極大值提升所帶來的不平等程度擴大,將這種影響扣除之后,才是時空可比的不平等水平,即真正由于結(jié)構(gòu)變化帶來的不平等變化[3-4][5]337。SSF報告重視不平等問題,但沒有認識到這一點。筆者認為,不平等分析時一定要充分考慮極大值擴大這個因素。
經(jīng)濟福利測度應該從哲學理念出發(fā),哲學思考具有悠久的傳統(tǒng),關(guān)注什么賦予生活以質(zhì)量。所以,應該采用哪種尺度來評估生活質(zhì)量,取決于人們采用的哲學視角。SSF報告總結(jié)了經(jīng)濟福利測度的三種主要理念:主觀福利觀(the notion of subjective well-being,SWB)、能力觀(the notion of capabilities)和公平分配觀(the fair allocation approach)。
在GDP統(tǒng)計中,價值指標方法主要是通過人們的交易行為來做評估,假定不同的交易選擇顯示出經(jīng)濟主體的偏好。部分經(jīng)濟學家以為只要觀察人們的選擇,就足以獲得福利的信息,以為這些選擇會符合一種標準的假設(shè)。SSF報告指出:這些年由心理學家和經(jīng)濟學家進行了相關(guān)專題研究,基于人們自述或福利體驗的主觀數(shù)據(jù),側(cè)重于人們的價值判斷及其實際生活中的行為方式,凸顯出經(jīng)濟學理論的標準假設(shè)與實際生活現(xiàn)象之間的巨大差異。
主觀福利測度,一個重要功能是彌補“顯示性偏好”信息的不足。將生活質(zhì)量分為認知評價、正面感受、負面感受,采用問卷法,通過被調(diào)查者對相關(guān)問題的回答,觀察其偏好和自我認定。
生活質(zhì)量主觀測度的一個特性是,人們對其自身狀況的回答并沒有明顯的“客觀對應項”。主觀回答僅是被詢問者所提供的心理狀況和價值判斷,這個特點使得測度的“可靠性”和“可理解性”打了折扣。相比而言,“感受到的通貨膨脹率”和“實際的通貨膨脹率”可以相互對應,個人感受到的與計算出來的指標數(shù)值可以互相印證。
快樂內(nèi)省是指某人對自身幸福感和效用的主觀度量。有研究證明,這種方法具有較為穩(wěn)定的正確性和可靠性。信賴個體自身評判是一種傳統(tǒng)哲學觀點,所謂“鞋是不是舒服只有腳知道”,就強調(diào)了這個意思,但是主觀福利測度也還存在許多問題,并不能完全取代其他方法。威爾金森教授指出:快樂體驗與再意識(meta-awareness,或再察覺meta-conciousness)不同,按照貝姆的“自身感受理論”,人們傾向于從行為中推斷出內(nèi)心狀態(tài)、態(tài)度和偏好,這種心理過程會帶來很大的偏差,主要表現(xiàn)為錯誤歸因[5]。SSF報告中也指出:個人回憶和判斷失誤,可能導致行為選擇的系統(tǒng)誤差。這種可能性反證了該哲學觀點指導福利測度可能失靈,至少是部分失靈。故而可以質(zhì)疑,主觀福利觀的機制基礎(chǔ)并不十分牢固。
行為經(jīng)濟學中提出了“自我助益偏差”概念,其常見的例子是所謂的“好于平均”效應,人們往往認定自己是好于平均值的,至少應該如此[5]337。這樣對自己的主觀感受往往優(yōu)于實際狀況,而當受到現(xiàn)實的負面撞擊后,遠離預期所造成負面情緒也會更加嚴重。這兩種可能都會造成主觀福利測度與實際狀況的偏離。還需要注意的是,主觀福利測度強調(diào)正面感受和負面感受的區(qū)分,然而行為經(jīng)濟學將消極情緒看做一種保證機制,是一把雙刃劍。這對主觀福利測度帶來的影響是,感受的正面負面的“一階區(qū)分”意義不大,或者正負感受相互作用的每一輪(層次)都需要再區(qū)分。
主觀選擇基于記憶和價值判斷。但有可能導致壞的選擇,有的選擇是無意識做出的,并未權(quán)衡各種替代的利和弊。這里需要注意“決策的時限問題”,選擇和決策都受到時間約束,不管決策者是否準備好,有的決策必須在給定時間窗口之內(nèi)做出。看似非理性的決策,如果加入時限因素后,很可能是理性的。
主觀測度是一個傳統(tǒng)工具,經(jīng)濟和社會中的許多特征是由人們對一組標準問題的回答來測度的。比如邊沁計算“快樂指數(shù)”就需要了解人們的主觀感覺。再看現(xiàn)代失業(yè)統(tǒng)計,問卷法發(fā)揮了重大作用。主要涉及“三個是否”:(1)在某個特定時期是否工作,(2)他們是否在積極尋找工作,(3)他們在近期是否處于可以開始工作的狀態(tài)。還有“擴展問題”,比如說,在一個月內(nèi)外出工作的時間是多少?只有一定時期內(nèi)累計工作時間少于規(guī)定的小時數(shù),才算失業(yè)。問題在于:當我們越來越倚重于主觀測度時,對其中隱含的障礙就得更加小心了。
行為經(jīng)濟學、認知科學及其社會認知學近年來取得了較大進展,理論爭議也不小,主觀福利測度應該借鑒這些基礎(chǔ)學科的經(jīng)驗和成果,作為經(jīng)濟測度方法論研究的一個重要方向。既然基礎(chǔ)學科還在發(fā)展中,其所支撐的測度方法也就時時需要接受新的挑戰(zhàn)。
能力觀與公平分配觀,這兩種測度觀都特別重視人們生活的客觀條件和擁有的機會,以之作為計算福利指標的基礎(chǔ)。能力觀方法和公平分配觀方法都屬于多指標綜合評價,即將所選定的福利影響因素凝煉出一系列“構(gòu)成指標”,再加以合成得到一個整體評判。那么,哪些因素應該被列入客觀特征的單子?影響因素的選取既取決于評估目的,還取決于不同經(jīng)濟主體的價值判斷。
既然選定福利影響因素也需要主觀價值判斷,那所選因素集合能不能反映客觀現(xiàn)實?SSF報告認為,在實際操作中,不同國家和地區(qū)所考慮的大部分內(nèi)容都相同,各種致力于測度福利所選擇的特征也有很大程度的一致性。比如,強調(diào)社會組織方式對人們生活的影響。然而筆者以為,需深入思考這種“一致性”之源,一個不可忽視的基本事實是:福利測度規(guī)則的制定者、測度因素的選取者大多來自發(fā)達國家,測度方案是否包含他們的主觀成分?只有各國測度者充分討論,互相交叉多輪反饋,集中對各種福利影響因素的主觀印象,才能真正收斂于客觀性所在。SSF報告列示了8個影響生活質(zhì)量的客觀特征:健康、教育、個人活動、政治發(fā)言權(quán)和治理、社會關(guān)系、環(huán)境條件、人身不安全、經(jīng)濟不安全,并逐一闡釋了其測度要義。
本研究認為,對這些因素的測度尚存在許多需要進一步思考的問題。比如:人類健康包含了多個不同的維度,已經(jīng)有了數(shù)個測度健康的綜合指數(shù),但沒有一種得到普遍認同,它們不可避免地取決于引發(fā)爭議的倫理判斷和不同病癥被賦予的權(quán)重。無論中醫(yī)還是西醫(yī),這種判斷差異難以取得一致。問題在于,綜合評價究竟能否在這一層級實現(xiàn)?如果答案是否定的,對更高層級的合成又意味著什么?
對健康測度也可以從不同角度進行拓展思考,比如設(shè)定場景A,若底層人口的健康質(zhì)量提升 3%,而頂層人口的健康質(zhì)量下降 1%,總?cè)丝诘慕】蒂|(zhì)量上升 1%,社會是否又能接受這一結(jié)果?而福利測度的現(xiàn)實是,質(zhì)量評價往往由頂層人口的狀況所主導。再設(shè)定場景分析B,生命長度和生命質(zhì)量何者為先?生活質(zhì)量測度若對此問題做綜合考慮,標準應該如何確立?對安樂死到底如何判斷?與現(xiàn)有測度指標如何協(xié)調(diào)?
歐美人通??粗孛裰髡?,其實“政治發(fā)言權(quán)和治理”只是適度指標,其中隱含著一個悖境:若代理人可靠,民眾不必過多參與,反之若政治本質(zhì)上有問題時,人們?nèi)菀走x擇遠離政治。歐美國家自認為民主化水平最高,但民眾有時并不樂意行使其擁有的選舉權(quán),可見該指標數(shù)值未必越大越好。此外,是否應該注重比較相近經(jīng)濟水平的政治發(fā)展狀況?
富國精英認為“社會關(guān)系”涵蓋的內(nèi)容很多,所以需要設(shè)計各種指標加以測度。但同時需要思考,不同文化、不同階層的人,對“獨處”和社會關(guān)系的需求及其評價大有不同[6]136。因而,這些社會關(guān)系指標未必越大越好,設(shè)計、計算和解讀構(gòu)成指標時都需要注意不同文化人群類別的差異。
測度“工作不安全”需要評估個人手中工作的安全程度。需要特別思考的是:如何區(qū)分“向上的不穩(wěn)定”和“向下的不穩(wěn)定”?因為職場的提升也表現(xiàn)為不穩(wěn)定,但并非工作不安全,不穩(wěn)定不等價于不安全。
不同國家、不同發(fā)展階段人們的福利偏好不同,對不同特征的重視程度也不同。還要思考:8個方面特征是否全面?此外還有哪些領(lǐng)域需要關(guān)注?每方面特征在福利測度時需要注意哪些問題,應該發(fā)動各國測度者討論,而不只是由歐美專家開藥方,其他國家僅僅遵守執(zhí)行,不應該忽視設(shè)計優(yōu)化中的反饋機制。
基于不同的福利測度觀念,可以相應地發(fā)展各種不同的福利測度方法,國外國內(nèi)用于測度福利主要有兩種基本方法(此處方法是從測度一般的意義上指稱的,而主觀福利觀方法中的方法是從測度特殊的意義上指稱的,含義、層次有別),一是問卷法,主要測度主觀福利。二是合成指標法,能力觀和公平分配觀都是采用此方法合成諸福利因素的影響。應該充分注意到,這兩種基本測度方法,包括GDP校正法和生物技術(shù)法等,在測度邏輯上都存在種種缺陷,需要進一步修正,也需要數(shù)據(jù)使用者警覺。
問卷法主要用于主觀福利的測度,也可為“能力觀方法”和“公平分配觀方法”提供補充信息。有一些信息是收入等指標無法傳遞的。比如在發(fā)達國家,幼兒和老人對生活的評價高于正當壯年的人,這與相應年齡段人的收入水平形成鮮明對照。然而并不是收入越高的人越幸福對生活的評價越好。此外,不同的人對上班、通勤、社交和婚姻等社會事務的看法不同,傳遞的信息也不同。
然而,問卷法用于經(jīng)濟福利測度也存在限制和風險,主要表現(xiàn)在以下三個方面:
1.問卷法對回復者認知能力的要求
并非所有人都具有認知生活質(zhì)量的能力,問卷只能發(fā)給具有正常自覺意識的成年人,而非精神病人,但如何區(qū)分精神病人和神經(jīng)不太正常的人?現(xiàn)代社會壓力這么大,抑郁癥人群比重很大。不管窮國富國,精神上存在障礙的人不少那么,障礙到什么程度應該取消回答問卷的資格?如何在正常人和精神病人之間完成“被調(diào)查資格”的確認和轉(zhuǎn)換?最典型的是所謂“自閉癥患者”,只因為他們不與外界交流,社會就視其為不正常。然而誰敢斷言他們不幸福?從其中的繪畫、音樂天才可知,他們的精神生活可能非常豐富,或許是幸福地孤獨,沒人能進入他們的世界,怎么能妄下結(jié)論?
還有未成年人和老年人,占比相當大的人口群體,需要多大年紀才具備(取消)他們回答問卷的資格?也需要關(guān)注。
進一步看,在具備了“自我陳述”資格的人士中,又有多少人能對自己的福利做出恰當?shù)呐袛啵?015年經(jīng)濟學諾獎得主安格斯·迪頓(A Deaton)指出,在關(guān)于生活總體評價的調(diào)查中,人們經(jīng)常不能確定問卷中的問題是什么意思,也不知道自己需要做出怎樣的回答[7]335。迪頓教授本人在世界銀行工作過,他促成了生活標準測度調(diào)查。就這類調(diào)查而言,迪頓教授無論在理論還是實踐上都是專家,所以他的評價或告誡語重心長?,F(xiàn)在很多的評估和測度,遠談不上完美。國與國的比較結(jié)果也會因為各國受訪者回答風格的差異而受到影響。在使用此類調(diào)查數(shù)據(jù)時,應當注意這些問題。
人的感覺(敏感度)區(qū)分能力存在差異,如何確定選項的數(shù)量級別?是好中差三級,還是五級乃至七級?對敏感者而言,級別少不能達到確切程度,對鈍感者而言,級別多難以定位。如果用一個分級標準套裁不同敏感度的人,則會影響測度的可靠性。所以,問卷法還需要假定:回復者的認知能力相同或其能力呈正態(tài)分布,差異可抵消。
2.問卷法面臨的道德風險
采信問卷法的數(shù)據(jù)結(jié)果,需要假定:回復者都會按其識別能力發(fā)揮,如實回答。然而即便本人能對自身的福利狀況做出準確的判斷,為什么一定要如實報告?現(xiàn)實場景是,正因為回復者具有自覺意識,才能利用回復問卷為自己謀利,這里不可忽視索羅斯所強調(diào)的社會現(xiàn)象中的“自反性(reflexivity)”。如果自我陳述滲入功利因素,平民想從政府和社會得到更多從而假裝不幸福,或者害怕陳述后受壓制而假裝幸福,問卷結(jié)果就可能將我們引入歧途。如何剔除這種“偽陳述”或陳述中的種種干擾因素?這是問卷法面臨的重大博弈之一,調(diào)查者需要把握:回復者是不是如實回答?如實回答的比重多大?能不能支撐研究結(jié)論?迪頓教授指出很多經(jīng)濟學家和哲學家對自我陳述型評估的可靠性和有效性保留態(tài)度,因為我們并不總能了解人們在回答問題時到底在想些什么[7]22。
3.問卷法對測度者的素質(zhì)要求非常高
不僅問卷設(shè)計質(zhì)量對調(diào)查結(jié)果影響非常大,而且不同地區(qū)的問卷設(shè)計質(zhì)量還應該大致相當,否則其測度結(jié)果的可比性就無法保證,可能誤導結(jié)果的分析結(jié)論。威爾金森教授在《行為經(jīng)濟學》中指出,快樂內(nèi)省可能由情境因素引導,研究顯示,人們事先被詢問的問題會強烈影響他們對快樂體驗的評價,這種效應被稱為錨定效應。如何避免這種錨定效應,是問卷設(shè)計區(qū)別于客觀指標記錄的困難之處,需要特別注意。
支付意愿法是主觀福利調(diào)查中的常用方法,“你愿意為某項選擇付多少錢”將人們的主觀福利偏好用支付意愿表現(xiàn)出來,用價值量計值并加總。然而筆者認為,支付意愿法存在三大局限:
第一是“現(xiàn)場效應”限制。人們通常是在構(gòu)想的情形下給出自己的支付意愿,并沒有身臨其境,受到現(xiàn)場與非現(xiàn)場之間心理差異的影響,而且無法得知其影響究竟多大。
第二是“量級效應”限制,支付意愿問卷中設(shè)計的選擇問題規(guī)模往往不大,由于心理調(diào)查對象的原因,相當部分是在大學生經(jīng)濟條件下就可以做出的決策。一般而言,決策問題的量級(規(guī)模)越大,具備該量級層次理性決策能力的人就越少,即可以做出理性選擇的人就越少,答復的可靠性就越差。現(xiàn)實社會問題規(guī)模不一,支付意愿問卷難以準確涵蓋人們的真實心理愿望。
第三是人群收入結(jié)構(gòu)限制,對高收入者而言,“支付”的邊際效用低,而達成某種“意愿”的邊際效用高。反之,對低收入者而言,“支付”的邊際效用高,而達成某種“意愿”的邊際效用尚沒有那么高。由此在加總處理后,問卷結(jié)果往往更多地反映高收入者的支付意愿,這是“數(shù)值平均方法”(如算術(shù)平均數(shù)、幾何平均數(shù)和調(diào)和平均數(shù))不可避免的結(jié)果?!拔恢闷骄椒ā?如中位數(shù)和眾數(shù))可以避免這種偏差,但不易進行數(shù)學處理,分析時又面臨“計算便利性”的限制。
如何減少這三大局限對問卷結(jié)果的不良影響,是采用支付意愿法應該充分注意到的關(guān)鍵。在解讀支付意愿法所得數(shù)據(jù)的內(nèi)涵時,需要注意這三個限制的影響。
抽樣調(diào)查是經(jīng)濟統(tǒng)計的主要方法,在經(jīng)濟福利測度中,如何使用這種方法?原來對實物生產(chǎn)有效的抽樣法,是否可以照搬挪用到福利測度?方法“能否”使用非常重要的一點即樣本的代表性問題,筆者將其分解為兩個方面:
第一,就報告者個體而言,報告時間的福利狀況和情緒對其福利狀況和情緒的代表性。個人不同時間的情緒不同,主觀感受不同,喜怒哀樂無常,波動可能極大。SSF報告提出,個人感受最好是及時得到報告,從而在一定程度上可以減少因為記憶和社會壓力而導致的偏差。然而回復者不可能時時刻刻都用來記錄和報告,那么,問卷調(diào)查的頻率究竟需要多高?樣本時間的情緒能代表報告者的所有狀態(tài)嗎?
第二,報告者對全體對象的代表性。需要調(diào)查多少人才能得到整體的主觀福利測度?整個人口包括不同的類型:成年人、未成年人和老年人,或者“宜回答問卷人口”和“不宜回答問卷人口”,被調(diào)查人口的主觀福利陳述可以代表其他類型人口進而整個人口的主觀福利嗎?有一點是肯定的:我們無法代表所謂“自閉癥患者”的主觀福利自我評價。代表性偏差肯定存在,問題在于其大小,而且微觀測度加總過程會將代表性偏差傳導到宏觀指標上,如何限制其可靠性損失?
由于測度資源與調(diào)查頻率、樣本量的反方向作用,使用“方便樣本”在博弈中往往難以避免[8]64-120。如,“在 2010 年一項開創(chuàng)性研究中,約瑟夫·亨利希(Joseph Henrich)、史蒂夫·海涅(Steven J.Heine)和阿蘭·洛蘭蕯楊(Ara Norenzayan)三人針對心理學六大領(lǐng)域的頂尖科學期刊,系統(tǒng)性調(diào)查了所有發(fā)表的論文。研究結(jié)果發(fā)現(xiàn),雖然論文常常聲稱人類的心智如何,但大多數(shù)的研究卻只是以 WEIRD 群體的樣本為基礎(chǔ)?!盬EIRD 群體就是西方的(Western)、受過教育的(Educated)、經(jīng)過工業(yè)化洗禮的(Industrialized)、富裕的(Rich)、民主的(Democratic)這群人。他們研究的本應是人類的心智,實際上調(diào)查對象卻局限于這個群體。六大領(lǐng)域當中的《人格與社會心理學期刊》,本是社會心理學這個心理學次領(lǐng)域最重要的期刊,其論文數(shù)據(jù)基礎(chǔ)是這樣的:96% 的抽樣屬于WEIRD群體,并且68% 都是美國人。此外,有67% 的美國參與者、80% 的非美國參與者是心理系的學生。心理系學生之所以參與這么多實驗,是因為教授的要求[9]322。這些教授顯然知道主觀調(diào)查的方法論標準和要求,卻采用方便樣本進行數(shù)據(jù)分析,這典型地反證了主觀調(diào)查的現(xiàn)實困難。
心理調(diào)查還存在著另一重大局限:無法剔除“自反性”影響。就算我們真的跑遍全球,研究每一個社群,仍然只能研究到智人心理頻譜極有限的一段。現(xiàn)今所有人都受到現(xiàn)代性的影響,也都是地球村的成員[9]322。有個笑話說,在卡拉哈里沙漠,典型的狩獵采集隊伍是20個獵人、20個采集者,再加上50個人類學家[9]322。心理學家講究“體驗式調(diào)查”,調(diào)查者跟被調(diào)查對象同吃同住同勞動,近距離觀察社會現(xiàn)實。可被觀察對象一共40個人,觀察者卻50個人,調(diào)查者的存在太強大了,被調(diào)查對象的行為完全可能已經(jīng)有所改變。
可見,預先建立好經(jīng)濟測度的格局非常重要。所以,到底是實證還是虛證?如何保持經(jīng)濟測度者的職業(yè)操守?一則笑話諷刺中國記者在火車上做調(diào)查,詢問乘客是否買到了春運車票,結(jié)果當然皆大歡喜,然而這種“調(diào)查”連起碼的思維邏輯都成問題。涉及到主觀調(diào)查的局限,那些美國社會心理學教授的錯誤在本質(zhì)上竟然與中國記者相當。
能力觀和公平分配觀都需要以影響福利的各種客觀因素作為構(gòu)成指標,然后再計算合成指標,得出對總體經(jīng)濟福利的評價,像人類發(fā)展指數(shù)(HDI)和各種所謂幸福指數(shù)都屬于此類。邱東指出了合成指標方法的兩個主要缺陷[4]。
第一,諸構(gòu)成指標間的相關(guān)性可能導致所使用信息的重疊,從而造成合成信息扭曲。構(gòu)成指標需要與被評價事物相關(guān),但各構(gòu)成指標之間的相關(guān)性卻應該盡可能小,這要求在經(jīng)濟現(xiàn)實中難以充分滿足。另一方面,又存在基礎(chǔ)信息不足的擔憂。HDI在GNI之外,只選取了教育和健康兩個代表性指標,前述影響生活質(zhì)量客觀因素中還有六方面特征沒有考慮,而且沒有考慮資源和環(huán)境因素,不是綠色的(曾有人提議構(gòu)建“綠色HDI”),三因素的綜合究竟能否代表人類發(fā)展?構(gòu)成指標的選取與基礎(chǔ)信息采集究竟如何協(xié)調(diào)?“度”到底在哪里?
第二,合成指標存在“當量轉(zhuǎn)換”問題。確定了合成公式,就確定了構(gòu)成指標間一個固定的當量轉(zhuǎn)換關(guān)系,以人類發(fā)展指數(shù)為例,說明數(shù)學可加性并不等于經(jīng)濟社會意義的可加性。SSF報告給出了合成處理的含義解釋:把人均GDP的對數(shù)與預期壽命水平相加,等于是隱含地認為,美國人預期壽命增加一年的價值等于印度人相同增量的20倍。至于為何是這種數(shù)量等價關(guān)系,沒有人從社會經(jīng)濟意義上給出說明。SSF報告還指出了合成指標方法的另外一個缺陷,即平均數(shù)對結(jié)構(gòu)變化的掩蓋。合成處理忽視了各福利影響因素之間的相關(guān)性,沒有反映經(jīng)濟體內(nèi)部的狀態(tài)分布。即使實際結(jié)構(gòu)變動,只要構(gòu)成指標的平均數(shù)不變,合成結(jié)論也就不變。
筆者對這些缺陷的解讀是:合成結(jié)果并不具備“遍歷性”,即無法代表被評價事物變化所經(jīng)歷的各種時空狀態(tài),只是其多種可能結(jié)果當中的一種。合成是將被評價對象的部分狀態(tài)認作被評價對象的全部狀態(tài)?;蛘哒f,多種構(gòu)成指標的分布結(jié)構(gòu)即便相異,只要其平均數(shù)相同,都可以達成同一的綜合評價結(jié)論。這樣綜合評價就沒有減少所試圖減少的不確定性,或者說綜合評價數(shù)據(jù)結(jié)果并沒有其應該具備的特定社會經(jīng)濟含義,在綜合評價信息上仍然是不確定的。鑒此“非遍歷性”,人們更不應該對綜合評價結(jié)果做絕對的解讀。
福利測度有四個大的缺失:第一,沒有測度觀念及其測度方法間關(guān)聯(lián)的邏輯概括。每一種哲學理念之下有不同的測度方法,不同方法的測度機制不同。SSF報告這部分內(nèi)容的論述過于寬泛。如,從能力觀到HDI編制、從抽象到具象的過程測度邏輯如何貫穿?依據(jù)于此測度理念的計算方法是否唯一?其他方法是否也存在此種邏輯關(guān)系?其存在原因?諸方法之間的區(qū)別何在?在哪個環(huán)節(jié)相區(qū)別?本部分缺少“測度機制”的系統(tǒng)論述,而切實關(guān)注經(jīng)濟測度邏輯正是提升經(jīng)濟統(tǒng)計方法論的關(guān)鍵所在。
第二,SSF報告對福利測度方法的概括不夠。SSF沒有各種不同經(jīng)濟福利測度方法的列示和比較,這一點不如可持續(xù)發(fā)展測度的論述。
第三,SSF報告沒有對改進建議的可行性分析和預算壓力測試。SSF報告指出:福利測度并沒有替代常規(guī)經(jīng)濟指標,卻提供了豐富政策討論、增進人們認知的機會。原來的福利測度不夠,還需要追加五個方面:(1)將主觀福利納入統(tǒng)計調(diào)查;(2)測度各福利影響因素;(3)全面評估不平等;(4)評估各領(lǐng)域間聯(lián)系;(5)為用戶構(gòu)建合成指數(shù)提供指標的數(shù)據(jù)平臺。這些構(gòu)成了專家委員會的改進建議。概括而言,SSF報告的問題解決之道就是“做加法”,這其中至少有以下問題需要注意:
首先,“做加法”的追加成本。以不同福利因素之間相互影響為例,比如健康、教育對就業(yè)、經(jīng)濟安全的影響,追加之難在于:常規(guī)調(diào)查中加入一個標準提問,它帶來的成本增加在不同國家分別是多少?分類加細一層,調(diào)查費用增加多少?需要測度成本試算,比較測度的成本效益,做可行性分析。在經(jīng)濟福利測度的這五個方面中,人文關(guān)懷需要落地,社會能夠用于測度的公共資源畢竟有限,不可能什么指標都加進來。
其次,未決問題的梳理。測度方法中還存在許多懸而未決的問題,筆者主張把這些問題盡可能列出來,理清解決不同問題的大致思路,學理上還值得探討,這樣才可能知道“加法”是否能做的。
再次,常規(guī)統(tǒng)計與專項調(diào)查的區(qū)別。作為經(jīng)濟統(tǒng)計的一個基本信條,小規(guī)模專項調(diào)查與官方統(tǒng)計常規(guī)調(diào)查在可行性上大有區(qū)別,起碼二者的預算就相差非常大。在前者可行的,后者未必可行。
又次,不同經(jīng)濟發(fā)展水平對追加統(tǒng)計的承受力。發(fā)達國家能做的測度,發(fā)展中國家未必能做。將福利測度納入常規(guī)統(tǒng)計需要什么條件?具備條件的國家有多少又有哪些?當下許多發(fā)展中國家連GDP統(tǒng)計都難以常規(guī)化,如何進一步開展經(jīng)濟福利測度?SSF報告認為,不僅在發(fā)展中國家有必要超越經(jīng)濟資源測度,而超越恰恰對于富有的工業(yè)化國家意義更為顯著。福利測度的重心到底應該在哪里?SSF報告沒有展開分析,需要跟蹤關(guān)注。
SSF報告認為,最近的研究進展使得福利測度“創(chuàng)新而且可信”,其中有些測度結(jié)果能以可信的方式進行跨國比較,這個還有待于進一步論證。SSF報告宣稱福利測度具備了從研究走向標準統(tǒng)計實踐的潛質(zhì),但對這個重大結(jié)論并沒有給出證明,就連較詳細的說明也沒有,實在令人擔憂。
第四,價值指標方法在經(jīng)濟福利測度中的地位未能界定。物質(zhì)生活水平主要通過收入來衡量,但金錢無法涵蓋福利的其他方面。收入是人們評價生活狀況時非常重要的標準,但并不唯一。不能說金錢就是幸福,也不能說金錢與幸福無關(guān)。對經(jīng)濟福利的非現(xiàn)金項目,可以采用“等值收入法”進行估算。由于經(jīng)濟福利本身的多元性,由于能力觀不承認經(jīng)濟學理性及其模型,價值指標方法在經(jīng)濟福利測度中被弱化了,至少在SSF報告的生活質(zhì)量測度中沒有加以重點闡述。由此帶來的潛在矛盾是,如果在對“當下福利(生活質(zhì)量)”的測度中,價值指標方法都難以得到信任,處于三種主要福利測度觀之外,那么在對“未來福利(可持續(xù)發(fā)展)”的測度中,校正GDP方法又如何立足呢?又讓人如何接受呢?顯然,SSF報告的這兩個部分在此基本立場上尚待協(xié)調(diào)。
問卷法測度主觀福利存在一定問題,有人主張采用生物技術(shù)法。人腦可以植入專用芯片,記錄負責快樂神經(jīng)的波動頻率,可以用來測度個人的幸福程度。將來生物技術(shù)發(fā)達了,完全可以實現(xiàn)這一構(gòu)想。著名華裔經(jīng)濟學家黃有光先生特別認可這種方法,認為比GDP統(tǒng)計更為可靠。
眾所周知,有攝像頭監(jiān)視,人的行為就會不同。頭腦植入芯片后,知道“老大哥在看著你”,一舉一動都受約束,自由程度降低,幸福會有一個減量。這正應了管理的最基本特征——“管理是反人性的”。因此,用生物技術(shù)測得的幸福值,實際上是原始幸福感降低后的值。真正的幸福值應該再加上一項,即因為植入芯片帶來的幸福減量。然而麻煩的是,個體的敏感程度不同,其幸福減量也不同。每個人的幸福究竟該加多少?又帶出一個新的測度問題。
此外,生物技術(shù)法是進行全面測度還是抽樣進行?孩子一出生就給他植入測度芯片,如果孩子長大了要求摘出來,是否允許?抗議的人多了,社會如何應對?如果尊重本人意愿,召集自愿者植入測度芯片,能否達到宏觀福利測度的樣本量要求?
迪頓教授認為,“即便是每個人的身上都有一個腕表一樣的測量儀,把人的每一次快樂心情都記錄下來,我們也無法用這些數(shù)據(jù)來評估我們的生活過得是否幸福。人類的幸福有多個維度,他們彼此關(guān)聯(lián)又絕不相同?!盵7]28
經(jīng)濟福利測度屬于公共產(chǎn)品的一種,因而天然就存在邊界問題,也即其必要性(“當否”)問題:政府或NGO等經(jīng)濟主體究竟應該在多大程度上介入?作為“廣義政府(general government)”產(chǎn)出的組成部分,經(jīng)濟測度究竟應該做到哪兒為止?已相當繁雜的GDP統(tǒng)計還不夠嗎?
測度經(jīng)濟福利,自然是為了提升民生水平。然而出于公心未必就天然具備了行為的法理性。如果測度生活質(zhì)量本身就造成民眾生活質(zhì)量的沉重負擔,如果公共品生產(chǎn)擠壓了私人生存空間,事物性質(zhì)就將逆轉(zhuǎn),就需要進行成本效益分析,就可能產(chǎn)生“福利測度的必要性究竟如何”這一問題。
世上有兩種民權(quán)思想,一種如英國諺語所代表,“風能進雨能進,國王不能進”。老百姓的屋子再破,只要門框在那兒立著,國王進去之前就得征求主人允許。雖然貴為國王,也應該尊重私人權(quán)利。另外一種則以中國古語所代表:“普天之下莫非王土”,既然是王土,國王行無其限。如果按照前者行事,經(jīng)濟福利測度也需充分考慮對民權(quán)的尊重?!皽y度一切”與“計劃一切”、“管理一切”有著天然的聯(lián)系,因此經(jīng)濟測度需要注意適度性問題,經(jīng)濟福利測度更是如此。
一般來說,收入、財富是個人與社會的“交”——福利平臺,由此個人和家庭自由生活,可進可退。社會應該做的,只是創(chuàng)造個人取得幸福的機會和環(huán)境,將福利平臺搭好足矣。至于每個個人偏好幸福的哪個方面,社會不能去過度干涉。筆者認為,在某種意義上,這也應該是經(jīng)濟測度的重要邊界。
經(jīng)濟福利測度究竟應該深入多遠?所謂“老大哥在看著你”,《1984》的警告需要認真考慮。作為納稅人,百姓將公權(quán)授予政府,但對其提供什么樣的公共產(chǎn)品卻很難給出限定,從而政府官員仍具有相當大的自由裁量權(quán)。按SSF報告的提議,做經(jīng)濟福利測度要具體到每個人。應該質(zhì)疑的是:民眾個人生活質(zhì)量的高低,一定要告之外人嗎?即便是為了公眾福利提升,也必須以暴露個人福利狀況為代價嗎?納了稅難道是要政府來測度我的私人生活嗎?究竟誰應該是經(jīng)濟福利測度“當否”的決定者?
這涉及到經(jīng)濟測度的操作性邊界,筆者曾專門做過論述,是第三種測度邊界[3]7。事關(guān)測度相關(guān)性與測度資源可用性之間的平衡,不能誤以為經(jīng)濟測度可以無所限制。經(jīng)濟福利測度發(fā)自于人文關(guān)懷,固然不錯,但現(xiàn)代文明的一個標志,就是保持適當?shù)木嚯x感。過度的人文關(guān)懷,就侵犯個人私密空間。如果執(zhí)意深度地測度經(jīng)濟福利,人文關(guān)懷和堅守私密空間之間恐怕矛盾不小。而且著眼于測度實效,相當部分人恐怕會對經(jīng)濟福利測度做出負面反應,反而會造成數(shù)據(jù)結(jié)果的失真,這又涉及到“經(jīng)濟測度的中性悖律”。
到底為什么要測度經(jīng)濟福利?如果不知道其社會總量(假設(shè)其可測),就不知道如何去構(gòu)建幸福社會么?社會各界就不知道如何追求幸福么?認知社會福利水平對追求幸福究竟有多大意義?其實更重要的是實地提升福利的能力和機會。不丹的“國民幸福總量(GNH)”曾經(jīng)名揚全世界,受到熱捧,盡管經(jīng)濟水平與福利并非絕對正相關(guān),可那么低下的經(jīng)濟社會發(fā)展水平,怎么能產(chǎn)生地球人公認的幸福?有一點倒是明確的,絕大多數(shù)人不可能長期生活在那種幸福狀態(tài)下。
測度意味著標準,難道一定要被統(tǒng)一指導才幸福?幸福與一律相悖,生物要多樣性,人更需要多樣性。為人有沒有“偷著樂”和躲開憐憫的權(quán)力?獨處的權(quán)利,某種意義上也就是避開社會監(jiān)管的權(quán)利,不在攝像頭下生活,減少“隨時被揪出來”的恐慌。需要填福利問卷,還要“每日情景重現(xiàn)”(DRM),不是占用了人們本該休閑的寶貴時間么?倘若有這個時間,真正用來提升實際福利如何?本來痛苦經(jīng)歷令人難耐,為了公共測度,還要努力去回憶本該忘掉的事情,這樣的問卷本身就降低了人的幸福水準。大量的研究表明,快樂內(nèi)省會降低人們對幸福感的體驗,而那些快樂的人不太進行內(nèi)省。若此,主觀福利問卷豈不是恰恰反福利之道而逆行?
經(jīng)濟福利問卷要求實時得到報告,以保障數(shù)據(jù)結(jié)果的真實性。SSF報告強調(diào)了在個人層面提供了可長期監(jiān)測的生活質(zhì)量測度,以筆者的理解,這就是要為福利測度建立一套系統(tǒng)化的微觀經(jīng)濟統(tǒng)計。
問題在于,人們不可能花費一生時間來自覺地問自己有多快樂。為了測度總福利,要求測度單個人的福利,并且為之付出部分公共資源,其正當性究竟如何?這里存在兩種正當性,測度本身的正當性和為測度支出耗用公共資源的正當性。
就付出公共資源進行福利測度和交出個人信息而言,在不同國家可能存在不同的意愿組合,又如何決策?發(fā)達國家,經(jīng)濟實力強,公共資源可付出,但個人隱私不愿意被監(jiān)測。發(fā)展中國家雖然個人隱私保護不強,但用公共資源去進行福利測度,還不如直接用于提升生活。如果落實SSF報告的福利測度改進建議,社會,特別是欠發(fā)達國家,將不堪重負。
稅收完全可以非金錢的方式征收,日常生活中人們往往忽略的是:我們一直在繳納“信息稅”和“信息支付附加”,而且越是大數(shù)據(jù)時代,信息稅費越重。
從廣義上看統(tǒng)計,筆者斷言任何人都與統(tǒng)計有關(guān),不是“做統(tǒng)計的”(制造者),就是“用統(tǒng)計的”(用戶),至少是“被統(tǒng)計的”(對象),大家都是統(tǒng)計的“局中人”。
細致且高頻的問卷調(diào)查就是社會的一種重稅。有人不接受統(tǒng)計調(diào)查,但實際上躲不起,一開智能手機就已經(jīng)身在“被統(tǒng)計”之中,支付寶、滴滴打車等等,個人數(shù)據(jù)不由自主全上去了。人總是貪婪的,生活方便的代價就是被統(tǒng)計。實際生活中為方便付出的并不少,不只是金錢,還有個人信息,甚至隱私。只不過,多數(shù)人對這種隱私信息的付出并沒有自覺意識。如果充分意識到種種顯在和潛在的信息代價,福利測度還是十分必要的嗎?
GDP用于福利測度究竟如何?美國著名經(jīng)濟學家曼昆認為:“就大多數(shù)情況而言,GDP是衡量經(jīng)濟福利的一個好指標?!盵11]19,如果曼昆的這個結(jié)論成立,還需要再另起爐灶去發(fā)展經(jīng)濟福利測度嗎?
《理解國民賬戶》提出一個思路,“通過國民賬戶更好地測算福利”。因為GDP僅僅是一套成熟賬戶體系中的一個指標,比GDP更好的經(jīng)濟福利指標確實存在,也就是那些針對居民戶(household)的測度,個人和居民戶是估價福利的天然基礎(chǔ)[12]456。
在SNA中,從生產(chǎn)到最終使用的指標邏輯關(guān)系是:GDP調(diào)整國內(nèi)外要素凈收入得到國民總收入(GNI),減去固定資本消耗得到國民凈收入(NNI),再減去繳稅得到可支配凈收入(NDI),加上實物轉(zhuǎn)移得到“經(jīng)過調(diào)整的可支配凈收入(ANDI)”。可支配凈收入減去儲蓄是居民戶的最終消費支出(final consumption expenditure),而“經(jīng)過調(diào)整的可支配凈收入”減去儲蓄為居民戶的實際最終消費(real final consumption)。最終消費支出,特別是實際最終消費,便可作為測度經(jīng)濟福利的平臺。當然,還需要進一步調(diào)整:(1)剔除人口規(guī)模的影響。(2)考慮收入分配和不平等因素,涉及不同類型住戶的微觀資料。(3)納入存量因素,因為儲蓄(負儲蓄)與本期經(jīng)濟福利密切相關(guān)。
接續(xù)OECD專家勒蓋耶和布萊茲的思路,可否考慮采用“常規(guī)統(tǒng)計 + 專項調(diào)查”的經(jīng)濟福利測度模式?調(diào)整SNA現(xiàn)有居民戶收入和消費指標作為常規(guī)統(tǒng)計內(nèi)容,而其他相關(guān)性強的福利信息則采用專項調(diào)查采集。
經(jīng)濟福利測度必要性的討論,當然不是要全盤否定之,但至少應該有助于將其限制在一定的范圍內(nèi)?!白黾臃ā辈⒉皇俏ㄒ坏某雎罚瑒虞m另起爐灶也未必是優(yōu)選。