杭州蕭然會計師事務所
近年來,我國公共財政收支基數(shù)和范圍逐年增加,筆者統(tǒng)計了2017—2019年的1~6月份同期數(shù)據(jù),全國一般公共預算收入和相應支出均呈增長趨勢,但2020年1~6月的數(shù)據(jù)首次呈現(xiàn)下降。財政部網(wǎng)站披露數(shù)據(jù)顯示,2020年1~6月全國一般公共預算收入96176億元,比去年同期下降10.82%;同期全國一般公共預算支出123538億元,較去年同期下降5.77%,其中:中央支出同比下降3.23%,地方支出同比下降6.17%。公共預算收支均呈下降趨勢,且地方支出的降幅高于中央支出;但公共預算支出依然大于公共預算收入,若不考慮其他收入路徑,則將入不敷出。可見,財政支出績效管理任重而道遠。
財政支出績效評價形式多樣,定義未嚴格統(tǒng)一。大體來講,指評價機構通過搜集資料、訪談、走訪現(xiàn)場等形式充分了解評價項目內(nèi)容的手段來針對性地設置評價指標和評判標準,再綜合運用各種評價方法對財政資金使用和實施后績效進行現(xiàn)場和非現(xiàn)場評價,并對照已設置的評價體系進行全過程綜合評分。通常而言,評價機構可以是財政評價組、部門(單位)評價組和第三方中介機構等;從類型上看,有項目支出績效評價、部門整體績效評價等。文中提到的績效評價報告,指注冊會計師為主體的第三方專業(yè)機構對財政支出進行績效評價并形成的相應報告。
1.內(nèi)因:第三方機構特有的獨立性和相對專業(yè)性
項目績效等級和績效得分存在較大的彈性尺度,而項目績效往往和項目負責人、分管領導的年度考核相掛鉤,體制內(nèi)部的人員進行評議很難做到公允;而第三方評價機構可保持應有的職業(yè)審慎,具有相對較強的獨立性。
此外,會計師事務所為主的第三方機構擁有各類專業(yè)人士,可以勝任評價方法系統(tǒng)性高、專業(yè)性強且評價對象多樣化的績效評價。
2.外因:行業(yè)全方位拓展新路徑和社會需求度
中注協(xié)網(wǎng)站公開數(shù)據(jù)顯示,截至2018年12月31日,注冊會計師行業(yè)擁有會計師事務所9005家,執(zhí)業(yè)注冊會計師106798人,全行業(yè)從業(yè)人員基數(shù)龐大,而上述行業(yè)的傳統(tǒng)業(yè)務呈減少趨勢,國辦56號文件和行業(yè)協(xié)會的新業(yè)務拓展戰(zhàn)略給出了開展非審計業(yè)務的新路徑,而財政支出績效評價正是新路徑之一。
同時,“全面實施績效管理”的提出,績效評價覆蓋面擴大,社會需要更多專業(yè)力量參與評價,尤其是社會關注度高和民生類項目,社會大眾更愿意信賴獨立性和專業(yè)性較強的第三方機構。
近十余年中,全國各地先后有多家第三方中介機構參與了財政支出績效評價的嘗試和探索。筆者所在的浙江省早在2005年12月就制定了第三方中介機構參與評價的暫行辦法,于2006年建立“浙江省參與績效評價中介機構庫”,截至2012年4月已有346家專業(yè)機構入庫,2013年取消了第三方機構入庫才能從事評價的準入限制,高校等其他社會力量可通過招投標入圍方式參與績效評價。
財政部于2011年制訂《財政支出績效評價管理暫行辦法》并提出可委托專家、中介機構等第三方實施績效評價,于2018年7月對引入第三方機構開展績效評價提出指導意見,于2020年2月修訂《項目支出績效評價管理辦法》并對部門委托第三方開展績效評價提出相關要求。由此,全國范圍內(nèi)第三方參與績效評價工作的路徑向更廣、更深層次推進。
第三方專業(yè)機構出具的績效評價報告整體篇幅大,大致有30~100頁,若不考慮附表,僅報告正文部分也有15~40頁左右,報告使用者往往無從下手。盡管評價報告中有績效等級和得分,但績效等級基本為“良好”,績效得分因評價指標體系的賦值無統(tǒng)一標準,得分可操作空間較大,難以實現(xiàn)有效橫向比較。同時,第三方機構保持應有的職業(yè)審慎,試圖將發(fā)現(xiàn)的問題盡數(shù)進行披露,但又需顧及報告意見征求階段的順利通過,導致報告中“存在問題”篇幅和結構異常復雜。往往是大問題中套小問題,多個小問題再歸納總結,力求問題數(shù)量保持“三大條”。
上述現(xiàn)象導致原有績效等級和得分難以為報告使用者提供橫向比較,大問題套小問題的“大三條”使得經(jīng)驗豐富的注冊會計師和相關評價工作的實施者難以在短時間內(nèi)作出判斷和風險評估。顯然,報告中披露的存在問題內(nèi)容本身比項目績效等級和得分更值得信賴。本人設想對已有財政支出項目績效評價報告進行實證研究,對報告中反映的存在問題進行匯總和歸納,并以問題類型為導向設置定性和定量指標,構建出一個簡單易操作、合理較科學的評分系統(tǒng),試圖解決上述相關人士的困惑,為報告使用者和評價實施者提供有用信息。
通過對2008—2020年期間主持并撰寫的79個績效評價報告所涉存在問題進行梳理,運用德爾菲法,對梳理出的實施績效、預算管理等14項問題類型進行賦值(以下稱該14項為“經(jīng)驗問題”),并通過具體項目和專家經(jīng)驗對相關因素進行反復修正,形成相應評分系統(tǒng)。大致框架如下:評分系統(tǒng)由基本指標、修正指標和附加指標組成,滿分100分,項目總得分=100-∑基本指標-∑修正指標-∑附加指標。除附加指標存在增減值,其余指標均為扣分值。
1.基本指標(定性指標)
基本指標用于對績效評價項目的經(jīng)驗問題進行定性打分,計算公式為:∑基本指標=∑(標準值×重要性系數(shù))。對經(jīng)驗問題群中各項根據(jù)問題嚴重程度設置相應的重要性系數(shù),單一基本指標=標準值×重要性系數(shù),單項經(jīng)驗問題標準值為1分,即每發(fā)現(xiàn)一項經(jīng)驗問題扣除一個基本指標值。
該指標計算關鍵為重要性系數(shù)的確定。筆者向參與或研究財政支出績效評價的專家團隊65人征求意見,上述專家分別對已梳理的14項經(jīng)驗問題進行重要性排序。第14位取基礎值1,排位每上升1位,階梯值增加0.1,則第13位的分值為1+0.1=1.1。以此類推,第1位的分值為1+0.1×13=2.3。上述14項分值合計為23.1。根據(jù)上述賦值規(guī)則,分別對每位專家的經(jīng)驗問題排序形成重要性鏈條評分表(見表1)。
每位專家的問題類型排序生成1條重要性鏈條,65名專家的意見就有65條重要性鏈條,由此形成重要性鏈條組;再對重要性鏈條組中涉及的某單項經(jīng)驗問題分值取平均值,完成經(jīng)驗問題的重要性鏈條取值。以序號1“實施績效”舉例,該經(jīng)驗問題的取值為重要性鏈條組中該單項經(jīng)驗問題分值累加取平均值,經(jīng)計算,該項取值為2.04。以此類推,其余經(jīng)驗問題賦值詳見表2“取值”行次(見表2)。
表1 舉例說明某位專家“經(jīng)驗問題”重要性鏈條評分表
表2 所有專家“經(jīng)驗問題”重要性鏈條的取值和重要性系數(shù)的確定
與專家討論決定,單項經(jīng)驗問題的基準值為1,經(jīng)驗問題群的基準值合計為14,對單項經(jīng)驗問題取值進行折算得出重要性系數(shù)(即表2中簡稱“系數(shù)”)。如序號1“實施績效”,取值為2.04,重要性系數(shù)=2.04÷23.1×14=1.24;再如序號14“財務管理”的重要性系數(shù)=1.44÷23.1×14=0.88。同理,可得到經(jīng)驗問題群1~14項數(shù)據(jù)。最后進行尾數(shù)驗算,經(jīng)計算,“系數(shù)”欄行次1~14項合計為13.99,與14項既定基準值14相差0.01,故進行尾數(shù)修正,即序號第14項系數(shù)調(diào)增0.01,調(diào)整后1~14項系數(shù)相加為14。
2.修正指標(定量指標)
修正指標分兩部分內(nèi)容,對基本指標中未涉及的“滿意度”和“經(jīng)驗問題”的嚴重程度進行定量打分。計算公式為:∑修正指標=∑(基準值-定量分)+∑扣分值。其中,∑(基準值-定量分)是針對各類滿意率,如工人路北伸項目,總體滿意度項,收回326份問卷,滿意72份,比較滿意149份,基本滿意88份,根據(jù)“滿意10分,比較滿意8分,基本滿意6分”的標準計算,得分=(72×10+149×8+88×6)/326=7.48分,則此項修正指標=基準值-定量分=10-7.48=2.52分。如果項目涉及多個滿意度,則按各單項修正指標值累加。∑扣分值是針對同類經(jīng)驗問題多次出現(xiàn)的情形,對“經(jīng)驗問題”嚴重程度進行定量打分,即同類經(jīng)驗問題在基本指標中已計算一次,“經(jīng)驗問題”嚴重程度量化部分通過修正指標扣分。距離來看,如某年度農(nóng)村橋梁改造項目計劃對27座橋梁進行改造,如全部完成計劃則不扣分,實際有2座橋梁改造未實施,計劃完成率為25/27=92.59%,按照完成率每下降5%扣0.1分計算,則對序號8“目標完成”經(jīng)驗問題進行修正,該項扣分值=0.1×2=0.2分。該類指標可以將不同項目單位存在問題類型的嚴重程度進行區(qū)分,可以實現(xiàn)不同項目單位的橫向比較。此處的定量修正需注意剔除與基本指標值重復的因素。
3.附加指標(定性與定量指標結合)
附加指標,指加減分項。主要評價機制創(chuàng)新、違規(guī)違紀以及未在“經(jīng)驗問題”中體現(xiàn)的問題類型(以下簡稱“非經(jīng)驗問題”)等。機制創(chuàng)新視具體情況加1~3分,以鼓勵機制創(chuàng)新;違規(guī)違紀,即所謂的一票否決,可視具體情況扣5~20分,理論上說,如果存在違規(guī)違紀,總體分值不會很高。非經(jīng)驗問題為減分項,每出現(xiàn)一項非經(jīng)驗問題,視具體情況扣0.5~2分。需要注意的是,本評分系統(tǒng)是倒扣分制,故此處的加分項為負值,減分項為正值。
“非經(jīng)驗問題”扣分區(qū)間(0.5~2)的確定思路:將“經(jīng)驗問題”與“非經(jīng)驗問題”的嚴重程度進行比較,設“經(jīng)驗問題”的基準值為1。如果“非經(jīng)驗問題”嚴重程度較低,按0.5取值;如果“非經(jīng)驗問題”是我們在進行實證研究時未遇到或者未曾考慮到的經(jīng)典問題,嚴重程度等同于“經(jīng)驗問題”,按1取值;如果該項“非經(jīng)驗問題”系同一類型并多次出現(xiàn),考慮到附加指標中未設置類似修正指標中的數(shù)量因素,按基準值1+調(diào)整值封頂1進行賦分,則此種情況按2取值。
修正指標受報告披露和輔助數(shù)據(jù)獲得的詳細程度影響,如果能獲取的數(shù)據(jù)越詳細,則修正越有效,評分精度越高,反之,則評分系統(tǒng)越粗糙。
重要性系數(shù)的主觀性不可避免,本文僅提供一種思路,隨著專家的層次提高和評價報告基礎數(shù)據(jù)范圍增大,可以降低主觀程度帶來的影響。
績效評價本身和第三方機構開展績效評價存在固有局限,評分系統(tǒng)也因指標量化、賦值主觀性而存在不足,但隨著第三方機構受重視程度和規(guī)范化、評價收費有效市場化等,其開展評價工作的相關限制狀況會有較大改觀;一些有意識、隱蔽性較強的不合規(guī)事項、舞弊行為隨著績效評價理論方法的深入研究和評價實踐的持續(xù)開展而更容易被察覺;評分系統(tǒng)中重要性系數(shù)和基準值賦值的主觀程度可通過德爾菲法來降低。
盡管本評分系統(tǒng)構建是基于項目支出績效評價報告的數(shù)據(jù)為基礎,但這個思路同樣適用于部門支出績效管理。目前部門績效評價的實踐并不多,基礎數(shù)據(jù)比較缺乏,隨著全面實施績效評價深入推進,以問題為導向的評分系統(tǒng)對部門績效報告照樣適用。此外,部分評價報告的指標體系是根據(jù)經(jīng)濟性(相關性)、效率性、效益性(有效性)、可持續(xù)性等評價維度構建,由于報告中同樣包含存在問題段,故指標體系的區(qū)別不影響基于報告內(nèi)容的評分系統(tǒng)運用,采用3E或4E指標體系的評價項目不影響本報告評分系統(tǒng)的運用。
以第三方財政支出績效評價報告中問題類型為導向構建的評分系統(tǒng)比項目的績效等級和得分更值得信賴。我們有理由相信,基于經(jīng)驗問題群框架搭建的評分系統(tǒng)通過后續(xù)的完善和細化,可以為今后的績效管理和評價實施提供服務。期望通過上述研究,為今后的財政支出績效評價工作提供思路和借鑒。