張倩云,李瑾*,張瑤,趙東,劉琛
1.上海環(huán)境能源交易所股份有限公司,上海 200083
碳市場建設是我國構建綠色金融體系的關鍵內(nèi)容,根據(jù)各試點每日交易價格判斷碳市場的有效性是衡量碳市場發(fā)展成熟度的關鍵依據(jù)[1]。關于國外的碳市場價格研究,Daskalakis 和Markellos利用歐洲碳交易數(shù)據(jù),實證檢驗碳市場的有效性[2];Seifer等通過隨機均衡模型得出了歐洲碳市場信息充分有效的結論[3];Alberto Montagnoli等采用方差比率法對歐盟碳市場的有效性進行檢驗[4];Amelie Charles等亦證實歐盟碳市場有效[5];國內(nèi)研究部分,王倩、王碩選取2013年下半年至2014年上半年范圍內(nèi)上海、北京、深圳和天津4個試點的碳交易數(shù)據(jù)進行有效性研究[6];趙長紅等采用面板回歸模型分析能源價格、宏觀經(jīng)濟等因素對碳交易價格的影響[7];王揚雷選取2013年11月至2015年6月期間北京碳排放權交易價格作為研究對象,進行市場分析[8]??梢钥闯觯际袌龅慕灰仔畔槭袌鲇行缘难芯刻峁┗A的數(shù)據(jù)支撐。
相對目前國內(nèi)已有的研究來看,本數(shù)據(jù)集覆蓋的試點范圍和時間范圍更廣,包括2013年12月31日至2017年12月31日北京、上海、廣東、深圳、湖北、天津、重慶7個省市試點碳市場的配額日成交量和日成交額數(shù)據(jù)。根據(jù)這些數(shù)據(jù)可以整理出碳交易市場配額日成交均價以及碳價日變化率序列,為進一步分析碳市場價格變化趨勢及市場有效性提供必要的數(shù)據(jù)支持。
本數(shù)據(jù)主要來源于市場公開數(shù)據(jù),覆蓋各個試點碳市場官方網(wǎng)站的交易信息。其中,上海碳市場的交易數(shù)據(jù)由上海環(huán)境能源交易所根據(jù)交易系統(tǒng)內(nèi)部成交信息進行統(tǒng)計匯總形成。對于北京、廣東、深圳、湖北、天津和重慶碳市場,分別進入各自的碳排放權交易所官網(wǎng),將2013年12月31日至2017年12月31日時間范圍內(nèi)的交易信息完整下載,得到原始數(shù)據(jù)。
數(shù)據(jù)收集過程中通常會受到噪聲數(shù)據(jù)、缺失數(shù)據(jù)、沖突數(shù)據(jù)等影響,導致采集到的原始數(shù)據(jù)比較“臟”。因此,首先需要對原始數(shù)據(jù)進行預處理,以保證數(shù)據(jù)的質(zhì)量和應用價值。本文的預處理環(huán)節(jié)主要包括數(shù)據(jù)集成、數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換等方面。
(1)數(shù)據(jù)集成
由于交易信息不是來源于同一網(wǎng)站,需要將數(shù)據(jù)進行整合,形成一個綜合數(shù)據(jù)集。將不同數(shù)據(jù)源的數(shù)據(jù)進行形式統(tǒng)一,有利于提高數(shù)據(jù)的集中性和一致性。
在這個過程中,主要是對不同來源的數(shù)據(jù)名稱、長度、格式和單位等進行統(tǒng)一,并進行字段檢查。對不同的字段進行刪除或合并,避免出現(xiàn)冗余。
(2)數(shù)據(jù)清洗
對數(shù)據(jù)的不一致檢驗、噪聲數(shù)據(jù)的識別、數(shù)據(jù)過濾與修正,有利于提高數(shù)據(jù)的真實性和可用性。本文清洗過程包括以下幾個方面:
①數(shù)據(jù)不一致。由于數(shù)據(jù)的來源不同,名稱和單位可能有所差異。在使用前,對數(shù)據(jù)進行檢查和統(tǒng)一,避免由于內(nèi)容不一致帶來的誤差。
②空缺值。原始數(shù)據(jù)中存在少量空缺值,這是由于當天沒有成交記錄造成的,對數(shù)據(jù)的分析與研究并沒有實際意義,故直接將空缺值做刪除處理。
③異常值識別。通過單變量的描述統(tǒng)計及圖形法,識別有無異常值或明顯錯誤值。本文分別將七個試點的成交量和成交額進行描述性統(tǒng)計分析得出每月碳配額價格的加權平均值,然后利用散點圖將碳配額日均價可視化處理。對于明顯偏離加權平均值的數(shù)據(jù)可視為異常情況,可能原因是原始數(shù)據(jù)的記錄錯誤或者數(shù)據(jù)收集過程中的操作錯誤。對于有異常值出現(xiàn)的情況,經(jīng)人工查證后利用上一交易日的有效成交數(shù)據(jù)進行替換處理。
(3)數(shù)據(jù)轉(zhuǎn)換
利用對數(shù)收益率計算方式將配額日成交均價轉(zhuǎn)化成碳價日變化率,可以為市場有效性研究提供基礎數(shù)據(jù)支持,計算公式為[9]:Xt=ln(Pt/Pt-1),其中,Xt為第t日的碳價日變化率;Pt為第t日的碳市場價格;Pt-1為第t-1日的碳市場價格。
數(shù)據(jù)預處理階段的整體流程如圖1所示。
圖1 數(shù)據(jù)處理流程圖
經(jīng)過數(shù)據(jù)處理,得出七個試點2014-2017年的交易數(shù)據(jù),詳情如表1所示。
表1 七個試點交易數(shù)據(jù)詳情
本數(shù)據(jù)集由七個試點碳市場2014-2017年的交易情況組成,每個試點的數(shù)據(jù)內(nèi)容包括配額日成交量、配額日成交額、配額日成交均價以及碳價日變化率。根據(jù)這些數(shù)據(jù)可以單獨研究各試點的市場交易情況,也可以將七個試點作對比分析。以上海碳市場為例,數(shù)據(jù)具體信息如圖2所示。
圖2 上海碳市場部分交易數(shù)據(jù)信息
由于原始數(shù)據(jù)屬于外部二手數(shù)據(jù),所以在使用前對數(shù)據(jù)的準確性、適用性和一致性進行審核。
本數(shù)據(jù)來源于各試點官網(wǎng)信息,是所有交易情況的匯總統(tǒng)計,保證了數(shù)據(jù)的真實性和準確性。
本文收集的原始數(shù)據(jù)中包含市場成交量和成交價等重要信息,是碳市場量價關系分析以及有效性研究等工作必不可少的目標數(shù)據(jù)。
不同試點官方網(wǎng)站包含的數(shù)據(jù)字段有所差別,但是均包含完整的交易信息,根據(jù)數(shù)據(jù)集需求進行統(tǒng)一篩選。
本數(shù)據(jù)集來源可靠,包含了七個試點2014-2017年較完整的交易數(shù)據(jù)。各數(shù)據(jù)可以直接參考使用,為中國碳市場歷年進展情況或七個試點交易情況對比等相關研究提供可靠的數(shù)據(jù)支持。
致 謝
衷心感謝中國科學院上海高等研究院“碳排放特色數(shù)據(jù)產(chǎn)品及系統(tǒng)開發(fā)”項目的大力支持。