【摘要】隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大, 數(shù)據(jù)質(zhì)量問(wèn)題不斷涌現(xiàn)。數(shù)據(jù)質(zhì)量究竟如何評(píng)估才能合理體現(xiàn)數(shù)據(jù)實(shí)際適用情況, 適應(yīng)數(shù)據(jù)要素市場(chǎng)化需要, 為數(shù)據(jù)資產(chǎn)定價(jià)、 估值提供合適的評(píng)估方法。本文從應(yīng)用場(chǎng)景出發(fā), 構(gòu)建數(shù)據(jù)質(zhì)量指標(biāo)體系, 根據(jù)指標(biāo)累計(jì)權(quán)重剔除低影響的指標(biāo)。在簡(jiǎn)單比率法的基礎(chǔ)上, 構(gòu)建異質(zhì)偏好效用函數(shù)對(duì)不同維度的數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估, 并采用組合賦權(quán)法確定權(quán)重, 計(jì)算綜合評(píng)估得分。最后以我國(guó)碳試點(diǎn)市場(chǎng)公布的交易數(shù)據(jù)為例進(jìn)行實(shí)證分析, 結(jié)合CNN-LSTM模型估計(jì)數(shù)據(jù)效用, 降低評(píng)估過(guò)程中的主觀性。研究結(jié)果表明, 在數(shù)據(jù)應(yīng)用過(guò)程中, 數(shù)據(jù)使用者對(duì)不同維度的數(shù)據(jù)質(zhì)量問(wèn)題具有不同的容忍度, 即存在異質(zhì)風(fēng)險(xiǎn)偏好。該方法能夠有效反饋數(shù)據(jù)真實(shí)適用程度, 為數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估提供依據(jù)。本文立足于數(shù)據(jù)可用性, 結(jié)合效用提出非線性的數(shù)據(jù)質(zhì)量評(píng)估方法, 以期為數(shù)據(jù)質(zhì)量評(píng)估提供新思路。
【關(guān)鍵詞】數(shù)據(jù)質(zhì)量;綜合評(píng)估;效用函數(shù);組合賦權(quán);CNN-LSTM
【中圖分類號(hào)】 F810.6" " "【文獻(xiàn)標(biāo)識(shí)碼】A" " " 【文章編號(hào)】1004-0994(2024)16-0110-7
一、 引言
2020年3月《中共中央 國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》出臺(tái), 首次把數(shù)據(jù)要素單列出來(lái), 并將數(shù)據(jù)作為與土地、 勞動(dòng)力、 資本、 技術(shù)并列的生產(chǎn)要素, 要求加快培育數(shù)據(jù)要素市場(chǎng), 促進(jìn)重點(diǎn)領(lǐng)域政府開(kāi)放和數(shù)據(jù)資源有效流動(dòng)。但隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大, 數(shù)據(jù)質(zhì)量問(wèn)題不斷涌現(xiàn), 嚴(yán)重阻礙了數(shù)據(jù)要素市場(chǎng)化進(jìn)程。一方面, 數(shù)據(jù)質(zhì)量評(píng)估過(guò)程中, 以人工評(píng)估為主, 評(píng)估成本高、 效率低, 存在較大的主觀隨意性, 導(dǎo)致數(shù)據(jù)交易所在數(shù)據(jù)質(zhì)量評(píng)估把控尺度上松緊不一, 影響數(shù)據(jù)要素自由流動(dòng)(王琪,2023;姜琪等,2024)。另一方面, 數(shù)據(jù)質(zhì)量評(píng)估方法多聚焦于數(shù)據(jù)綜合治理角度, 忽略了數(shù)據(jù)應(yīng)用場(chǎng)景, 在數(shù)據(jù)價(jià)值評(píng)估中存在“水土不服”的現(xiàn)象, 這給數(shù)據(jù)要素的交易價(jià)格確定帶來(lái)了難題, 導(dǎo)致數(shù)據(jù)交易中買方支付的意愿通常較低(Spiekermann,2019)。
2022年6月中國(guó)資產(chǎn)評(píng)估協(xié)會(huì)下發(fā)的《數(shù)據(jù)資產(chǎn)評(píng)估指導(dǎo)意見(jiàn)(征求意見(jiàn)稿)》指出, 數(shù)據(jù)質(zhì)量評(píng)估是數(shù)據(jù)資產(chǎn)評(píng)估的基礎(chǔ)。2023年12月財(cái)政部印發(fā)的《關(guān)于加強(qiáng)數(shù)據(jù)資產(chǎn)管理的指導(dǎo)意見(jiàn)》提出, 數(shù)據(jù)質(zhì)量是數(shù)據(jù)資產(chǎn)價(jià)值的屬性之一, 并進(jìn)一步明確了數(shù)據(jù)質(zhì)量在數(shù)據(jù)價(jià)值評(píng)估中的應(yīng)用方法。這是因?yàn)閿?shù)據(jù)質(zhì)量反映了數(shù)據(jù)的適用水平, 直接影響數(shù)據(jù)價(jià)值轉(zhuǎn)化的順利與否。故本文依托于數(shù)據(jù)應(yīng)用場(chǎng)景, 落腳于數(shù)據(jù)資產(chǎn)估值與定價(jià), 構(gòu)建基于效用的數(shù)據(jù)質(zhì)量評(píng)估模型。本文的主要貢獻(xiàn)體現(xiàn)在以下三個(gè)方面: 第一, 本文從效用角度入手, 構(gòu)建異質(zhì)偏好效用函數(shù)來(lái)厘清不同維度數(shù)據(jù)質(zhì)量問(wèn)題的容忍程度, 通過(guò)風(fēng)險(xiǎn)偏好因子來(lái)體現(xiàn)不同應(yīng)用場(chǎng)景下使用者對(duì)數(shù)據(jù)質(zhì)量要求的變化, 使得評(píng)估結(jié)果隨應(yīng)用場(chǎng)景而變化, 能夠滿足實(shí)際需要, 即同一份數(shù)據(jù)在不同的應(yīng)用場(chǎng)景下有著不一樣的評(píng)估結(jié)果。第二, 利用機(jī)器學(xué)習(xí)、 主客觀組合賦權(quán)方法對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行實(shí)證分析, 降低數(shù)據(jù)評(píng)估過(guò)程中的人工參與度, 保證評(píng)估結(jié)果的客觀性, 提高評(píng)估效率。同時(shí), 改進(jìn)數(shù)據(jù)質(zhì)量指標(biāo)選取的方式, 通過(guò)事先確權(quán)來(lái)剔除低影響指標(biāo)、 保留高價(jià)值指標(biāo), 提高評(píng)估效率, 突出數(shù)據(jù)評(píng)估重點(diǎn)。第三, 適應(yīng)數(shù)據(jù)要素市場(chǎng)化需要, 為數(shù)據(jù)資產(chǎn)定價(jià)、 估值提供合適的數(shù)據(jù)質(zhì)量評(píng)估方法, 進(jìn)一步提高買賣雙方溝通效率從而促進(jìn)數(shù)據(jù)資產(chǎn)自由流通。
二、 相關(guān)研究現(xiàn)狀述評(píng)
1. 國(guó)外研究??v觀國(guó)內(nèi)外研究現(xiàn)狀, 國(guó)外相關(guān)學(xué)者對(duì)數(shù)據(jù)質(zhì)量的研究較早, 數(shù)據(jù)質(zhì)量評(píng)估涉及三個(gè)主體角色, 即數(shù)據(jù)生產(chǎn)者、 數(shù)據(jù)管理者和數(shù)據(jù)消費(fèi)者(Strong等,1997)。起初對(duì)于數(shù)據(jù)質(zhì)量評(píng)估多是基于數(shù)據(jù)生產(chǎn)者或管理者的主體角度 (Wang等,2003;Arazy和Kopak,2011), 但隨著數(shù)據(jù)技術(shù)的發(fā)展, 基于該視角進(jìn)行評(píng)估已經(jīng)無(wú)法滿足實(shí)際需求。因?yàn)閿?shù)據(jù)質(zhì)量是一個(gè)多維和主觀的問(wèn)題, 其定義和評(píng)估嚴(yán)格取決于所涉及的內(nèi)容和用戶。因此, 在考慮數(shù)據(jù)質(zhì)量時(shí), 應(yīng)始終將用戶的感受視為基礎(chǔ)(Batini等,2009)。即同一份數(shù)據(jù)有多種用途和用戶, 這會(huì)導(dǎo)致有一些人認(rèn)為數(shù)據(jù)質(zhì)量高, 另一些人認(rèn)為數(shù)據(jù)質(zhì)量低(Sundararaman,2011)。而關(guān)于數(shù)據(jù)質(zhì)量的評(píng)估量化, 有學(xué)者對(duì)數(shù)據(jù)的商用價(jià)值建立了效用驅(qū)動(dòng)的數(shù)據(jù)質(zhì)量評(píng)估模型, 并利用數(shù)據(jù)實(shí)際效用與潛在最大效用之比來(lái)衡量數(shù)據(jù)質(zhì)量(Even和Shankaranarayanan,2007)。但效用值需要人工評(píng)估, 效率較低且評(píng)估結(jié)果主觀性強(qiáng)。也有學(xué)者借助“預(yù)測(cè)市場(chǎng)”來(lái)建立類似股票期權(quán)的數(shù)據(jù)質(zhì)量衍生品, 根據(jù)用戶交易結(jié)束后最終形成衍生品市場(chǎng)的交易價(jià)格評(píng)估數(shù)據(jù)質(zhì)量(Pierce和Thomas,2007)。該方法需要將數(shù)據(jù)公布給大眾, 本質(zhì)上也是用戶反饋調(diào)查的一種。受限于人工評(píng)估的不便, 開(kāi)始有學(xué)者從數(shù)據(jù)應(yīng)用角度對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估, 以客觀量化評(píng)估為主。如從信息價(jià)值的角度出發(fā), 將擾動(dòng)圖像傳送到模型以計(jì)算預(yù)測(cè)概率的熵, 稱為擾動(dòng)熵。擾動(dòng)熵可以從信息價(jià)值的角度區(qū)分好數(shù)據(jù)和壞數(shù)據(jù), 將其視為圖像數(shù)據(jù)質(zhì)量得分(Li等,2022)。也有學(xué)者從數(shù)據(jù)信息量角度進(jìn)行評(píng)估, 采取距離熵方法來(lái)選取高質(zhì)量的數(shù)據(jù)樣本, 即距各個(gè)中心點(diǎn)距離較遠(yuǎn)的樣本具有較大的信息量(Yang等,2022)。而這些方法對(duì)數(shù)據(jù)質(zhì)量的解釋性仍存在一定的問(wèn)題, 僅僅從單個(gè)角度對(duì)數(shù)據(jù)質(zhì)量展開(kāi)量化評(píng)估。
2. 國(guó)內(nèi)研究。國(guó)內(nèi)學(xué)者多以綜合評(píng)估為主。綜合評(píng)估是對(duì)評(píng)估對(duì)象做出價(jià)值判斷的一種方法, 它既能發(fā)揮主觀能動(dòng)性, 又能相對(duì)客觀地給出評(píng)價(jià)(蔡莉等,2021)。常見(jiàn)的綜合評(píng)估方法包括模糊綜合評(píng)價(jià)法模糊層次 (孔敏等,2023)、 層次分析法(莊計(jì)龍和陳敏剛,2019)、 德?tīng)柗品?(孫嘉睿和安小米,2022)和扎根理論(撒旭等,2020)。通用的數(shù)據(jù)質(zhì)量評(píng)估方法雖然適用性強(qiáng), 但具體的應(yīng)用效果依舊不盡如人意(劉桂鋒等,2021)。就此情況, 有學(xué)者根據(jù)數(shù)據(jù)應(yīng)用場(chǎng)景開(kāi)發(fā)有特色的數(shù)據(jù)質(zhì)量評(píng)估方法, 從而提高評(píng)估結(jié)果的針對(duì)性。如為加強(qiáng)數(shù)據(jù)質(zhì)量管理, 在對(duì)電力數(shù)據(jù)進(jìn)行評(píng)估時(shí), 根據(jù)線損數(shù)據(jù)質(zhì)量差異問(wèn)題, 建立基于懲罰變權(quán)的“秩和”數(shù)據(jù)質(zhì)量評(píng)估模型, 能有效提高整體數(shù)據(jù)管理水平(王方雨等,2020)。而對(duì)于政府開(kāi)放數(shù)據(jù), 有學(xué)者針對(duì)當(dāng)前政府開(kāi)放數(shù)據(jù)質(zhì)量不高、 用戶需求得不到滿足的問(wèn)題, 從數(shù)據(jù)內(nèi)容、 數(shù)據(jù)表達(dá)、 數(shù)據(jù)獲取、 數(shù)據(jù)效用四個(gè)維度構(gòu)建了政府開(kāi)放數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)體系(宋暮凡,2022)。此外, 為提高評(píng)估的效率, 針對(duì)數(shù)據(jù)主要應(yīng)用場(chǎng)景, 從欠費(fèi)挖掘的角度對(duì)電信數(shù)據(jù)展開(kāi)評(píng)估, 根據(jù)缺失、 離群數(shù)據(jù)對(duì)挖掘結(jié)果的影響實(shí)現(xiàn)對(duì)數(shù)據(jù)質(zhì)量的量化(王曉華,2010)。 總體來(lái)說(shuō), 針對(duì)具體需求所提出的數(shù)據(jù)質(zhì)量評(píng)估的應(yīng)用效果有所提升, 但當(dāng)下數(shù)據(jù)爆炸性增長(zhǎng), 針對(duì)性的數(shù)據(jù)質(zhì)量評(píng)估方法存在捉襟見(jiàn)肘的困境。故亟需提出一種既能夠滿足應(yīng)用場(chǎng)景又適用廣的數(shù)據(jù)質(zhì)量評(píng)估方法, 從而滿足數(shù)據(jù)增長(zhǎng)的新需要。
三、 相關(guān)理論分析
1. 數(shù)據(jù)質(zhì)量。關(guān)于數(shù)據(jù)質(zhì)量的定義大都集中在數(shù)據(jù)的適用性上(Tayi和Ballou,1998;Huang等,1999)。從用戶角度來(lái)看, 數(shù)據(jù)質(zhì)量的高低取決于用戶是否可以高效地使用數(shù)據(jù)(Ismael等,2016;宋立榮,2016)。隨著研究的不斷深入, 有學(xué)者將數(shù)據(jù)質(zhì)量與數(shù)據(jù)質(zhì)量維度結(jié)合起來(lái), 進(jìn)一步將數(shù)據(jù)質(zhì)量的定義具象化, 主要包括時(shí)效性、 完整性、 及時(shí)性、 準(zhǔn)確性、 一致性、 可訪問(wèn)性等維度(Strong等,1997;李永紅和張淑雯,2018;王博和溫繼文,2021)。在數(shù)據(jù)應(yīng)用過(guò)程中, 低質(zhì)量的數(shù)據(jù)不但無(wú)法產(chǎn)生經(jīng)濟(jì)價(jià)值, 甚至?xí)斐刹豢珊鲆暤膿p失。比如重復(fù)數(shù)據(jù)不但會(huì)導(dǎo)致機(jī)器學(xué)習(xí)模型的性能下降, 還會(huì)導(dǎo)致模型過(guò)度擬合訓(xùn)練數(shù)據(jù)。又如就準(zhǔn)確性而言, 數(shù)據(jù)準(zhǔn)確性問(wèn)題導(dǎo)致企業(yè)普遍提高了數(shù)據(jù)庫(kù)數(shù)據(jù)獲取、 數(shù)據(jù)預(yù)處理、 用戶分析等各個(gè)環(huán)節(jié)的工作量和難度(王禹,2023)。再如, 如果數(shù)據(jù)標(biāo)準(zhǔn)不一致、 數(shù)據(jù)質(zhì)量不高, 智能財(cái)務(wù)系統(tǒng)就很難對(duì)數(shù)據(jù)進(jìn)行分析和預(yù)測(cè), 從而使得企業(yè)財(cái)務(wù)大數(shù)據(jù)在智能財(cái)務(wù)中無(wú)法發(fā)揮作用(陸興鳳和曹翠珍,2022)。
2. 數(shù)據(jù)的效用。數(shù)據(jù)本身沒(méi)有價(jià)值, 需要通過(guò)數(shù)據(jù)挖掘技術(shù)獲取有用的信息, 并將信息應(yīng)用于具體任務(wù)時(shí)才會(huì)產(chǎn)生價(jià)值。機(jī)器學(xué)習(xí)是目前應(yīng)用較廣的數(shù)據(jù)挖掘模型, 能夠從大量的數(shù)據(jù)之間尋找到某種規(guī)律, 從而輔助人們?cè)谀稠?xiàng)工作或生活需求中做出決策。數(shù)據(jù)預(yù)測(cè)結(jié)果常常依賴于數(shù)據(jù)本身, 提高數(shù)據(jù)質(zhì)量能夠有效地降低預(yù)測(cè)誤差(Nespoli等,2020)。在數(shù)據(jù)的建模、 訓(xùn)練過(guò)程中, 數(shù)據(jù)質(zhì)量越高, 所訓(xùn)練出來(lái)的模型質(zhì)量越好, 模型準(zhǔn)確度就越高。模型準(zhǔn)確度體現(xiàn)的是數(shù)據(jù)的貢獻(xiàn), 可以將其定義為數(shù)據(jù)的效用(Niyato等,2016)。數(shù)據(jù)的效用與各影響因素之間并非線性關(guān)系(嚴(yán)鵬等,2023)。例如在圖片識(shí)別的深度學(xué)習(xí)模型中, 由于數(shù)據(jù)集存在冗余度問(wèn)題, 此時(shí)較低的數(shù)據(jù)量就可以達(dá)到與完整數(shù)據(jù)集相似的測(cè)試精度(Yang等,2022), 故增加數(shù)據(jù)的完整性帶來(lái)的對(duì)預(yù)測(cè)精度的提升效果會(huì)大大減少, 即完整性存在邊際效用遞減的情況。再比如天氣預(yù)測(cè)領(lǐng)域中, 短期預(yù)測(cè)的效果往往會(huì)大大優(yōu)于長(zhǎng)期預(yù)測(cè)的效果, 從而對(duì)數(shù)據(jù)及時(shí)性要求較高, 僅當(dāng)數(shù)據(jù)及時(shí)性達(dá)到一定水平后, 預(yù)測(cè)結(jié)果才能夠有一個(gè)較好的表現(xiàn), 即及時(shí)性存在邊際效用遞增的情況。
四、 基于效用的數(shù)據(jù)綜合評(píng)估模型構(gòu)建
效用刻畫(huà)的是消費(fèi)者擁有消費(fèi)商品或服務(wù)對(duì)欲望的滿足程度, 數(shù)據(jù)資產(chǎn)本身也是一種商品或某種服務(wù), 用效用評(píng)估數(shù)據(jù)質(zhì)量, 既能保證可量化性, 又能契合數(shù)據(jù)質(zhì)量的含義。故本文結(jié)合數(shù)據(jù)應(yīng)用場(chǎng)景, 從數(shù)據(jù)效用角度出發(fā), 對(duì)數(shù)據(jù)質(zhì)量進(jìn)行綜合評(píng)估, 具體流程如圖1所示。
1. 數(shù)據(jù)質(zhì)量評(píng)估指標(biāo)的選取。本文綜合《信息技術(shù) 數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)》(GB/T 36344-2018)標(biāo)準(zhǔn)及《系統(tǒng)與軟件工程系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)CSQuaRE第24部分:數(shù)據(jù)質(zhì)量測(cè)量》(ISO/IEC 25024-2015)標(biāo)準(zhǔn), 共選取10個(gè)一級(jí)指標(biāo), 每個(gè)一級(jí)指標(biāo)下的二級(jí)指標(biāo)作為評(píng)估規(guī)則建立的依據(jù), 由于相關(guān)標(biāo)準(zhǔn)中已經(jīng)對(duì)指標(biāo)定義進(jìn)行了詳盡闡釋, 本文不再贅述。具體指標(biāo)體系如圖2所示。
數(shù)據(jù)指標(biāo)是對(duì)數(shù)據(jù)質(zhì)量的具體化, 但指標(biāo)選取過(guò)少易導(dǎo)致數(shù)據(jù)評(píng)估結(jié)果不夠全面。而指標(biāo)選取過(guò)多又容易攤平指標(biāo)權(quán)重, 同時(shí)也會(huì)導(dǎo)致客觀賦權(quán)法應(yīng)用效果不佳, 不能實(shí)際突出反映數(shù)據(jù)問(wèn)題的存在, 增加評(píng)估成本。故本文通過(guò)事先確權(quán)的方法來(lái)改進(jìn)指標(biāo)選取, 即在評(píng)估前通過(guò)層次分析法主觀賦權(quán), 計(jì)算累計(jì)權(quán)重, 剔除權(quán)重小的指標(biāo)。如此在保留高價(jià)值指標(biāo)的同時(shí)降低評(píng)估成本, 突出該類數(shù)據(jù)的質(zhì)量問(wèn)題。具體步驟如下:
第一步, 根據(jù)所選的一級(jí)指標(biāo)構(gòu)建層次結(jié)構(gòu)模型, 對(duì)層次結(jié)構(gòu)模型中指標(biāo)之間的相對(duì)重要性進(jìn)行判斷和比較, 按照1 ~ 9標(biāo)度方法形成判斷矩陣B。
[B=bijn×n=b11" b12" …" b1nb21" b22" …" b2n…" " …" "…" …bn1" bn2" …" bnn]
其中, bij×bji=1。
第二步, 利用方根法計(jì)算出各個(gè)指標(biāo)的權(quán)重W(w1,w2,…,wn)T, 并進(jìn)行一致性檢驗(yàn), 如果未通過(guò)就重新構(gòu)建判斷矩陣。
第三步, 將權(quán)重從大到小排序, 生成新的指標(biāo)權(quán)重向量W(w1,w2,…,wn)T。
第四步, 計(jì)算累計(jì)權(quán)重。
(1)
記最小的i使得Ei≥α, α即累計(jì)權(quán)重閾值, 其值越大保留的指標(biāo)越多, 一般根據(jù)指標(biāo)情況, 取值范圍為α∈[0.8,1]。
根據(jù)i值更新權(quán)重向量。
(2)
得到新的權(quán)重向量" " " " " " " " " " " " " " " " " " "。其中賦值為0的指標(biāo)便是被剔除掉的指標(biāo)。
2. 數(shù)據(jù)效用評(píng)估函數(shù)構(gòu)造。在不同應(yīng)用場(chǎng)景下, 隨著不同維度數(shù)據(jù)質(zhì)量水平的提高, 對(duì)數(shù)據(jù)使用者效用的邊際增長(zhǎng)也會(huì)變化。針對(duì)這一特性, 本文從風(fēng)險(xiǎn)偏好角度構(gòu)建效用函數(shù)評(píng)估不同維度數(shù)據(jù)質(zhì)量。效用函數(shù)內(nèi)含了個(gè)體的主觀感應(yīng)(價(jià)值判斷), 不同個(gè)體(不同應(yīng)用場(chǎng)景)對(duì)某測(cè)評(píng)的需求欲望存在差異性, 分別是風(fēng)險(xiǎn)中性型、 風(fēng)險(xiǎn)偏好型和風(fēng)險(xiǎn)規(guī)避型(尹薇,2021)。即對(duì)不同維度數(shù)據(jù)質(zhì)量水平, 使用者對(duì)其抱有的態(tài)度是不同的, 從而構(gòu)造異質(zhì)偏好效用函數(shù)來(lái)對(duì)數(shù)據(jù)各個(gè)指標(biāo)進(jìn)行評(píng)估。
效用函數(shù)的擬合常見(jiàn)的形式有線性函數(shù)型、 冪函數(shù)型、 對(duì)數(shù)函數(shù)型和指數(shù)函數(shù)型等??紤]到指數(shù)函數(shù)能夠更好地?cái)M合各個(gè)形狀從而刻畫(huà)偏好要求, 故選取指數(shù)函數(shù)型效用函數(shù)作為數(shù)據(jù)質(zhì)量評(píng)估函數(shù)。具體如下所示:
(3)
其中: ui(sij)指的是第i個(gè)維度下第j個(gè)二級(jí)指標(biāo)對(duì)應(yīng)的質(zhì)量評(píng)估分?jǐn)?shù), 其值越大代表數(shù)據(jù)質(zhì)量越高。λi反映數(shù)據(jù)使用者對(duì)該數(shù)據(jù)維度的風(fēng)險(xiǎn)偏好: λi小于0時(shí)為風(fēng)險(xiǎn)規(guī)避型; λi大于0時(shí)為風(fēng)險(xiǎn)偏好型; λi趨近于無(wú)窮大時(shí)為風(fēng)險(xiǎn)中性型, 此時(shí)等價(jià)于ui(sij)=sij。sij是二級(jí)指標(biāo)的量化值, 本文采用簡(jiǎn)單比率法(Pipino等,2002)進(jìn)行度量。該方法計(jì)算簡(jiǎn)單、 具有較高的穩(wěn)健性。具體公式如下所示:
(4)
其中, Nij表示數(shù)據(jù)集中符合數(shù)據(jù)質(zhì)量規(guī)則要求的數(shù)據(jù)量, Mij為所檢測(cè)的數(shù)據(jù)量或用戶期望的值。sij越大說(shuō)明數(shù)據(jù)質(zhì)量問(wèn)題越少, 反之越多。
3. 綜合評(píng)估模型與權(quán)重的確定。數(shù)據(jù)質(zhì)量的各個(gè)指標(biāo)體現(xiàn)的是數(shù)據(jù)使用者對(duì)數(shù)據(jù)各個(gè)方面的要求, 這些指標(biāo)共同作用從而實(shí)現(xiàn)數(shù)據(jù)的價(jià)值。故指標(biāo)之間不存在完全替代性, 即數(shù)據(jù)某個(gè)維度質(zhì)量問(wèn)題較為嚴(yán)重時(shí), 哪怕其他維度質(zhì)量較高, 其實(shí)際適用程度也將會(huì)是較低的?;诖诉x取乘法合成作為綜合評(píng)估模型能更好地刻畫(huà)數(shù)據(jù)質(zhì)量不同指標(biāo)之間的關(guān)聯(lián)關(guān)系。其具體公式如下:
(5)
其中: G稱為效用評(píng)估得分, 在數(shù)據(jù)質(zhì)量的綜合評(píng)估中, 權(quán)重反映的是指標(biāo)之間的相對(duì)重要性, 會(huì)直接影響綜合評(píng)價(jià)的結(jié)果。指標(biāo)選取中的層次分析法屬于主觀賦權(quán)法, 受評(píng)估專家偏好影響。為降低評(píng)估結(jié)果的主觀性, 本文根據(jù)評(píng)估數(shù)據(jù)集分別選取合適的主觀賦權(quán)法及客觀賦權(quán)法確定主觀權(quán)重w1和客觀權(quán)重w2, 引入博弈理論對(duì)二者進(jìn)行組合優(yōu)化, 確定主客觀權(quán)重在綜合權(quán)重中所占比例, 求解最優(yōu)線性組合系數(shù), 達(dá)到穩(wěn)定均衡效果, 得出更為科學(xué)合理的組合權(quán)重(黃耀倞等,2021)。
(1)根據(jù)評(píng)估數(shù)據(jù)集分別選取合適的主觀賦權(quán)法及客觀賦權(quán)法確定主觀權(quán)重w1和客觀權(quán)重w2, 進(jìn)行線性組合求取組合權(quán)重w, 表達(dá)式如下:
(6)
其中, β1、 β2分別表示主觀權(quán)重和客觀權(quán)重的線性系數(shù)。
(2)利用博弈論思想求取權(quán)重納什均衡點(diǎn), 即:
(7)
(3)對(duì)式(7)求導(dǎo), 其最優(yōu)解滿足下式:
(8)
(4)根據(jù)上式求得權(quán)重系數(shù)β1和β2, 并按下式進(jìn)行歸一化處理:
(9)
從而得到組合權(quán)重:
(10)
五、 實(shí)證分析
2014年前后, 北京、 天津、 上海、 重慶、 湖北、 廣東、 深圳七省市試點(diǎn)碳排放權(quán)交易市場(chǎng)陸續(xù)建成運(yùn)行, 隨后2021年全國(guó)碳排放權(quán)交易市場(chǎng)正式上線。在缺乏透明和廣泛可獲得的市場(chǎng)信息的情況下, 碳市場(chǎng)價(jià)格發(fā)現(xiàn)可能會(huì)失敗, 市場(chǎng)參與者無(wú)法做出正確的交易決策(霍學(xué)靜,2020)。獲取充分和相關(guān)的信息可確保企業(yè)有效參與碳市場(chǎng)交易。其中部分碳試點(diǎn)交易數(shù)據(jù)存在登記錯(cuò)誤、 空缺不完整、 更新不及時(shí)等數(shù)據(jù)質(zhì)量問(wèn)題, 使得市場(chǎng)信息無(wú)法有效地在投資者與企業(yè)間傳達(dá)。因此, 本文選取我國(guó)碳試點(diǎn)市場(chǎng)所公布的交易數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量評(píng)估, 研究我國(guó)碳市場(chǎng)信息披露情況。
1. 數(shù)據(jù)來(lái)源。根據(jù)各碳交易市場(chǎng)交易官方網(wǎng)站, 通過(guò)python爬蟲(chóng)技術(shù)逐一采集該市場(chǎng)碳排放權(quán)配額的歷史交易數(shù)據(jù), 若有多個(gè)碳排放權(quán)配額進(jìn)行交易, 則僅采集交易時(shí)間最長(zhǎng)的碳排放權(quán)配額, 采集時(shí)間截止至2023年1月10日。由于重慶碳市場(chǎng)的官網(wǎng)中間出現(xiàn)過(guò)較大的調(diào)整, 故不納入數(shù)據(jù)質(zhì)量評(píng)估中。共選取廣東、 湖北、 上海、 天津、 四川、 北京、 深圳七個(gè)碳排放權(quán)交易試點(diǎn)地區(qū)的交易數(shù)據(jù)。
2. 數(shù)據(jù)質(zhì)量指標(biāo)選取。根據(jù)數(shù)據(jù)實(shí)際應(yīng)用問(wèn)題, 選取相關(guān)專家, 使用層次分析法確定權(quán)重, 剔除部分指標(biāo), 步驟如下:
第一步, 根據(jù)專家意見(jiàn), 構(gòu)建如下指標(biāo)判斷矩陣:
[B=12…5121…5…………1515…1]
第二步, 通過(guò)方根法計(jì)算得到權(quán)重向量為:
W=(0.218,0.130,0.080,0.234,0.072,0.100,0.033,0.049,0.045,0.038)
其CR=0.0766lt;0.1, 故通過(guò)一致性檢驗(yàn)。
第三步, 將指標(biāo)權(quán)重向量W重新排序得到新的權(quán)重向量W':
W'=(0.234,0.218,0.130,0.100,0.080,0.072,0.049,0.045,0.038,0.033)
第四步, 計(jì)算累計(jì)權(quán)重, 設(shè)定權(quán)重閾值α=0.85, 根據(jù)式(1), 記最小的i使得Ei≥α, 求得i=7。
第五步, 根據(jù)式(2)更新權(quán)重, 并且恢復(fù)順序:
W''=(0.247,0.147,0.091,0.265,0.082,0.113,0.000,0.055,0.000,0.000)
即剔除可恢復(fù)性、 可信性、 效率性三個(gè)一級(jí)指標(biāo)。
3. 數(shù)據(jù)指標(biāo)量化。上文通過(guò)累計(jì)權(quán)重剔除了3個(gè)一級(jí)指標(biāo), 故選取剩下的6個(gè)一級(jí)指標(biāo)、 12個(gè)二級(jí)指標(biāo)構(gòu)建碳市場(chǎng)交易數(shù)據(jù)評(píng)估指標(biāo)體系, 如圖3所示。
本文根據(jù)各碳排放權(quán)交易市場(chǎng)的交易規(guī)則, 定義各個(gè)二級(jí)指標(biāo)中具體評(píng)估規(guī)則描述如表1所示。
參考?xì)W洲碳市場(chǎng)、 全國(guó)碳市場(chǎng)公布的數(shù)據(jù)格式及數(shù)據(jù)挖掘?qū)?shù)據(jù)量的要求, 本文設(shè)定屬性期望個(gè)數(shù)為6個(gè), 而考慮到最早的碳試點(diǎn)市場(chǎng)距今已經(jīng)運(yùn)行9年之久, 故數(shù)據(jù)期望記錄為2000個(gè)。期望交易數(shù)據(jù)更新時(shí)間為12小時(shí), 期望更新頻率為一周5次, 數(shù)據(jù)值精確到百分位。根據(jù)各個(gè)二級(jí)指標(biāo)的規(guī)則進(jìn)行量化, 得到量化值sij, 結(jié)果如表2所示。各市場(chǎng)的交易數(shù)據(jù)準(zhǔn)確性、 一致性等指標(biāo)的問(wèn)題較少。而數(shù)據(jù)完整性、 更新及時(shí)性量化評(píng)估結(jié)果差異較大, 其中: 四川交易所屬性完整性最差, 該市場(chǎng)只公布累計(jì)交易量數(shù)據(jù); 從數(shù)據(jù)值完整性來(lái)看, 該市場(chǎng)開(kāi)市較晚從而記錄交易數(shù)據(jù)長(zhǎng)度較短。此外深圳、 天津市場(chǎng)由于有多個(gè)碳排放額交易標(biāo)的, 較早發(fā)現(xiàn)的交易標(biāo)的隨時(shí)間逐漸退出交易舞臺(tái), 從而導(dǎo)致采集的數(shù)據(jù)記錄較短。在更新及時(shí)性上, 北京碳市場(chǎng)問(wèn)題較嚴(yán)重, 在更新延遲久、 停止交易較久后才公布當(dāng)天交易數(shù)據(jù), 且常常因?yàn)闊o(wú)交易而停止更新數(shù)據(jù)。
4. 數(shù)據(jù)效用質(zhì)量評(píng)估??紤]到碳交易數(shù)據(jù)的主要用途, 本文選取CNN-LSTM預(yù)測(cè)每日碳交易收市價(jià), 以其預(yù)測(cè)準(zhǔn)確性作為數(shù)據(jù)的效用。CNN具有很強(qiáng)的數(shù)據(jù)特征提取能力, 其預(yù)測(cè)效果與數(shù)據(jù)質(zhì)量相關(guān)性較強(qiáng)。而LSTM能夠提取長(zhǎng)、 短時(shí)間序列的復(fù)雜特征關(guān)系, 在處理時(shí)間序列方面具有良好的性能, 本文選取的數(shù)據(jù)為時(shí)間序列數(shù)據(jù), 適合用LSTM進(jìn)行預(yù)測(cè)。因此, CNN-LSTM兼具對(duì)數(shù)據(jù)特征的強(qiáng)提取能力和對(duì)時(shí)間序列良好處理的能力, 更適用于解釋數(shù)據(jù)質(zhì)量與數(shù)據(jù)預(yù)測(cè)結(jié)果之間的關(guān)系。具體結(jié)果如圖4所示。
考慮到廣東碳市場(chǎng)開(kāi)市較久, 交易活躍, 數(shù)據(jù)較為完整, 將其作為原始數(shù)據(jù)。截止到2023年1月10日, 數(shù)據(jù)集總共有1927個(gè)。通過(guò)控制唯一變量的方法, 對(duì)原始數(shù)據(jù)添加噪聲、 刪除數(shù)據(jù)后生成四個(gè)系列共40個(gè)數(shù)據(jù)集" " " 。
數(shù)據(jù)集表示僅出現(xiàn)第i個(gè)維度的數(shù)據(jù)質(zhì)量問(wèn)題, 其第j個(gè)一級(jí)指標(biāo)量化評(píng)分為" ", 而" " " " " " " " " " " 。如" " " 指數(shù)據(jù)集在準(zhǔn)確性方面的評(píng)分為" ", 而其他一級(jí)指標(biāo)對(duì)應(yīng)評(píng)分為1。記數(shù)據(jù)" " "所訓(xùn)練出的模型平均絕對(duì)百分比誤差為
。為與數(shù)據(jù)質(zhì)量一致, 需將其采用最大最小值法歸一化, 即:
[yki=MAPEkimax-MAPEkiMAPEkimax-MAPEkimin]
其中: ui(0)=0,ui(1)=1。
故式(3)中a=0, b=1。以" " 為自變量、" " "為因變量, 使用非線性最小二乘法對(duì)式(3)估計(jì)參數(shù)λi, 具體估計(jì)結(jié)果如表3所示。
由表3可知, 指數(shù)效用函數(shù)能夠較好地?cái)M合數(shù)據(jù)的效用。其中及時(shí)性、 準(zhǔn)確性、 規(guī)范性、 精確性表現(xiàn)為風(fēng)險(xiǎn)偏好型, 即該維度質(zhì)量增加, 模型預(yù)測(cè)準(zhǔn)確性的增長(zhǎng)是遞增的。而完整性、 一致性、 可訪問(wèn)性呈現(xiàn)的是風(fēng)險(xiǎn)厭惡型。
將表3數(shù)值代入所估計(jì)出的效用函數(shù)(3)中, 得到各個(gè)市場(chǎng)數(shù)據(jù)效用評(píng)估得分如表4所示。相對(duì)來(lái)說(shuō), 風(fēng)險(xiǎn)偏好型的效用函數(shù)評(píng)估值的差異會(huì)大于量化值, 體現(xiàn)數(shù)據(jù)應(yīng)用場(chǎng)景對(duì)該維度的高要求, 而風(fēng)險(xiǎn)保守型的效用函數(shù)的評(píng)分差異會(huì)小于量化值, 這意味著在數(shù)據(jù)應(yīng)用場(chǎng)景下, 對(duì)這些維度具有較高的容忍度, 即一定程度的損失對(duì)數(shù)據(jù)應(yīng)用影響不大。
5. 數(shù)據(jù)質(zhì)量綜合評(píng)估。根據(jù)所選取的數(shù)據(jù)集應(yīng)用場(chǎng)景, 采用層次分析法確定主觀權(quán)重w1, 由專家采用1 ~ 9標(biāo)度法分別對(duì)二級(jí)指標(biāo)的重要性進(jìn)行比較, 并結(jié)合一級(jí)指標(biāo)權(quán)重計(jì)算得到二級(jí)指標(biāo)權(quán)重:
w1=(0.15,0.10,0.10,0.04,0.05,0.05,0.13,0.13,0.04,0.04,0.11,0.06)
再選取熵權(quán)法確定客觀權(quán)重w2, 根據(jù)實(shí)測(cè)數(shù)據(jù)處理得到客觀權(quán)重如下:
w2=(0.08,0.05,0.14,0.16,0.01,0.15,0.10,0.07,0.02,0.02,0.02,0.13)
將w1、 w2代入式(6) ~ (9)中, 得到權(quán)重系數(shù)為:" " "=0.59;" " "=0.41。
代入式(10)中得到組合權(quán)重:
w=(0.12,0.08,0.12,0.09,0.04,0.09,0.12,0.11,0.04,0.04,0.08,0.09)
根據(jù)式(5), 計(jì)算各個(gè)碳市場(chǎng)碳交易數(shù)據(jù)質(zhì)量綜合評(píng)估得分如表5所示。其中, 廣東碳試點(diǎn)交易市場(chǎng)數(shù)據(jù)質(zhì)量最高, 其數(shù)據(jù)披露完整, 更新及時(shí), 格式一致。而四川碳試點(diǎn)交易市場(chǎng)數(shù)據(jù)質(zhì)量最低, 主要是由于其數(shù)據(jù)完整性低, 僅公布每日交易額, 缺乏關(guān)鍵數(shù)據(jù), 這也導(dǎo)致在我國(guó)碳試點(diǎn)市場(chǎng)研究中該市場(chǎng)常常被忽略掉, 說(shuō)明該市場(chǎng)的數(shù)據(jù)無(wú)法滿足研究、 分析需要。
信息披露制度不完善是影響碳市場(chǎng)有效性的直接因素, 碳市場(chǎng)透明度的提高有助于緩解信息不對(duì)稱問(wèn)題, 增加碳交易價(jià)格對(duì)信息的反應(yīng)程度, 從而提高碳市場(chǎng)有效性(馬躍和馮連勇,2022)。交易數(shù)據(jù)屬于信息披露的一部分, 提高披露數(shù)據(jù)質(zhì)量能夠提高市場(chǎng)有效性。相關(guān)研究表明, 試點(diǎn)碳市場(chǎng)大致可分為三個(gè)等級(jí): 第一等級(jí)為湖北、 廣東、 深圳; 第二等級(jí)為北京、 上海; 第三等級(jí)為天津。這與數(shù)據(jù)質(zhì)量評(píng)估結(jié)果一致(吳偉光等,2021)。
6. 評(píng)估結(jié)果分析。若不考慮數(shù)據(jù)的效用, 忽略數(shù)據(jù)各個(gè)維度對(duì)數(shù)據(jù)應(yīng)用的非線性影響, 兩者的評(píng)估結(jié)果是不相同的。這主要是受數(shù)據(jù)的應(yīng)用場(chǎng)景影響, 不同的應(yīng)用場(chǎng)景對(duì)數(shù)據(jù)各個(gè)維度的需求是不同的, 如量化投資場(chǎng)景下數(shù)據(jù)主要用于收益率預(yù)測(cè), 那么對(duì)于及時(shí)性的需求自然是極高的, 若數(shù)據(jù)的及時(shí)性不能達(dá)到一定的程度就會(huì)導(dǎo)致其在量化投資時(shí)失去優(yōu)勢(shì), 則無(wú)法發(fā)揮應(yīng)用價(jià)值。再如數(shù)據(jù)的完整性, 機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)量具有一定的需求, 當(dāng)數(shù)據(jù)的完整性低于某個(gè)量時(shí), 機(jī)器學(xué)習(xí)模型便無(wú)法得到有效的訓(xùn)練, 其模型性能自然是較差的。
將無(wú)應(yīng)用場(chǎng)景與投資預(yù)測(cè)應(yīng)用場(chǎng)景下的情況進(jìn)行評(píng)估對(duì)比, 前者由于不考慮應(yīng)用場(chǎng)景, 各個(gè)維度的數(shù)據(jù)質(zhì)量評(píng)估采用簡(jiǎn)單比率法, 即默認(rèn)風(fēng)險(xiǎn)中性。而投資預(yù)測(cè)場(chǎng)景下的數(shù)據(jù)集以預(yù)測(cè)準(zhǔn)確率作為效用, 進(jìn)行綜合評(píng)估。其對(duì)比結(jié)果如圖5所示。在考慮應(yīng)用場(chǎng)景下北京碳市場(chǎng)的數(shù)據(jù)質(zhì)量評(píng)分為0.7258, 排序第5, 而無(wú)應(yīng)用場(chǎng)景下其質(zhì)量評(píng)分為0.8310, 排序第4。這是由于北京碳市場(chǎng)的數(shù)據(jù)及時(shí)性較差, 在投資預(yù)測(cè)時(shí)北京碳市場(chǎng)的數(shù)據(jù)適用性不強(qiáng)。因?yàn)楦哐舆t的數(shù)據(jù)容易在市場(chǎng)錯(cuò)失先機(jī), 所以在評(píng)估時(shí)數(shù)據(jù)的及時(shí)性是風(fēng)險(xiǎn)偏好型的, 對(duì)及時(shí)性問(wèn)題給予了更高的懲罰, 從而其綜合質(zhì)量評(píng)估得分較低。再如在考慮應(yīng)用場(chǎng)景下上海碳市場(chǎng)的數(shù)據(jù)質(zhì)量評(píng)分為0.8294, 而無(wú)應(yīng)用場(chǎng)景下其質(zhì)量評(píng)分為0.8206, 排序不變??紤]應(yīng)用場(chǎng)景時(shí)上海碳市場(chǎng)的數(shù)據(jù)質(zhì)量有了一定的提升, 這是由于上海碳市場(chǎng)的數(shù)據(jù)完整性較差, 但仍包含每日開(kāi)盤價(jià)、 收盤價(jià)、 交易量等關(guān)鍵數(shù)據(jù)信息, 從而在應(yīng)用時(shí)數(shù)據(jù)仍能夠提供有效的信息, 滿足使用者的需要。在評(píng)估時(shí), 考慮應(yīng)用場(chǎng)景下完整性為風(fēng)險(xiǎn)厭惡性, 對(duì)完整性給予了更高的容忍度, 從而較無(wú)應(yīng)用場(chǎng)景下評(píng)分更高。
基于效用的數(shù)據(jù)質(zhì)量綜合評(píng)估方法更契合數(shù)據(jù)應(yīng)用場(chǎng)景下適用性描述, 具有較強(qiáng)的針對(duì)性。該方法能夠根據(jù)不同的應(yīng)用場(chǎng)景給出不同的評(píng)估結(jié)果, 從而適應(yīng)不同用戶的評(píng)估需要, 即同一個(gè)數(shù)據(jù)集在有些用戶心目中已經(jīng)是高質(zhì)量的數(shù)據(jù), 而對(duì)于另一部分用戶來(lái)說(shuō)可能還遠(yuǎn)不能滿足使用需要。
六、 結(jié)語(yǔ)
在數(shù)據(jù)要素流通過(guò)程中, 價(jià)值評(píng)估是必不可少的一環(huán), 數(shù)據(jù)質(zhì)量可作為數(shù)據(jù)資產(chǎn)價(jià)值的源泉(李雪梅和趙小磊,2024)。這是由于高質(zhì)量的數(shù)據(jù)才能產(chǎn)生價(jià)值, 而低質(zhì)量的數(shù)據(jù)不但無(wú)法發(fā)揮價(jià)值, 反而會(huì)使得決策失誤, 導(dǎo)致難以估計(jì)的損失。事實(shí)證明, 數(shù)據(jù)價(jià)值評(píng)估離不開(kāi)數(shù)據(jù)質(zhì)量評(píng)估。但以往的數(shù)據(jù)質(zhì)量評(píng)估多落腳于數(shù)據(jù)質(zhì)量管理角度, 從數(shù)據(jù)的破壞性、 成本等方面進(jìn)行評(píng)估。這與數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估中對(duì)數(shù)據(jù)質(zhì)量的需要有所不同。前者更注重?cái)?shù)據(jù)維護(hù), 后者則更注重?cái)?shù)據(jù)的適用程度, 即數(shù)據(jù)是否能夠達(dá)到使用者的需求。而這種需求在不同的應(yīng)用場(chǎng)景下是變化的, 如果不能體現(xiàn)出這種變化, 必然導(dǎo)致價(jià)值評(píng)估失效。
故本文從效用角度入手, 借助機(jī)器學(xué)習(xí)模型客觀評(píng)估數(shù)據(jù)效用, 減少評(píng)估過(guò)程中對(duì)人工的依賴性。構(gòu)建異質(zhì)偏好效用函數(shù)來(lái)厘清不同維度的數(shù)據(jù)質(zhì)量問(wèn)題的容忍程度, 通過(guò)風(fēng)險(xiǎn)偏好因子來(lái)體現(xiàn)不同應(yīng)用場(chǎng)景下使用者對(duì)數(shù)據(jù)質(zhì)量要求的變化, 使得評(píng)估結(jié)果較為真實(shí)地反饋數(shù)據(jù)的可用性、 適用性。該模型評(píng)估結(jié)果更適用于數(shù)據(jù)資產(chǎn)的估值或定價(jià), 為推動(dòng)我國(guó)數(shù)據(jù)要素市場(chǎng)化作出了一定的貢獻(xiàn)。
【 主 要 參 考 文 獻(xiàn) 】
蔡莉,李永軒,王淑婷等.基于層次分析法的眾源地理數(shù)據(jù)質(zhì)量評(píng)估研究[ J].測(cè)繪地理信息,2021(3):98 ~ 102.
黃耀倞,許拴梅,姜苗苗等.基于博弈論組合賦權(quán)的航道水域通航安全評(píng)價(jià)[ J].安全與環(huán)境學(xué)報(bào),2021(6):2430 ~ 2437.
姜琪,孫超臣,倪碩.?dāng)?shù)據(jù)要素市場(chǎng)化進(jìn)程中的數(shù)據(jù)流通與價(jià)值創(chuàng)造——基于上海數(shù)據(jù)交易所的案例研究[ J].金融教育研究,2024(3):3 ~ 10.
孔敏,王風(fēng)帆,耿姍姍等.模糊層次分析法在淺剖數(shù)據(jù)質(zhì)量評(píng)價(jià)中的應(yīng)用[ J].海洋科學(xué),2023(10):65 ~ 75.
李雪梅,趙小磊. 基于經(jīng)濟(jì)學(xué)視角的數(shù)據(jù)要素定價(jià)研究[ J].河南社會(huì)科學(xué),2024(1):33 ~ 42.
李永紅,張淑雯.?dāng)?shù)據(jù)資產(chǎn)價(jià)值評(píng)估模型構(gòu)建[ J].財(cái)會(huì)月刊,2018(9):30 ~ 35.
劉桂鋒,聶云貝,劉瓊.?dāng)?shù)據(jù)質(zhì)量評(píng)價(jià)對(duì)象、體系、方法與技術(shù)研究進(jìn)展[ J].情報(bào)科學(xué),2021(11):13 ~ 20.
陸興鳳,曹翠珍.利益相關(guān)者視角下的企業(yè)財(cái)務(wù)大數(shù)據(jù)治理[ J].財(cái)會(huì)月刊,2022(1):39 ~ 47.
馬躍,馮連勇.中國(guó)試點(diǎn)碳排放權(quán)交易市場(chǎng)有效性分析[ J].運(yùn)籌與管理,2022(8):195 ~ 202.
撒旭,王健,范智萱等.?dāng)?shù)據(jù)期刊同行評(píng)議視角下科學(xué)數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)識(shí)別[ J].圖書(shū)情報(bào)工作,2020(17):123 ~ 130.
宋立榮.基層科技報(bào)告資源建設(shè)中元數(shù)據(jù)質(zhì)量評(píng)估研究——以中國(guó)科學(xué)技術(shù)信息研究所為例[ J].中國(guó)科技資源導(dǎo)刊,2016(1):57 ~ 66.
宋暮凡.?dāng)?shù)據(jù)開(kāi)放視角下的政府開(kāi)放數(shù)據(jù)質(zhì)量評(píng)價(jià)研究[ J].圖書(shū)情報(bào)導(dǎo)刊,2022(8):63 ~ 70.
孫嘉睿,安小米.開(kāi)放政府?dāng)?shù)據(jù)質(zhì)量評(píng)估指標(biāo)體系研究[ J].情報(bào)理論與實(shí)踐,2022(6):94 ~ 100+78.
王博,溫繼文.基于元數(shù)據(jù)的林業(yè)開(kāi)放政府?dāng)?shù)據(jù)質(zhì)量評(píng)估[ J].情報(bào)學(xué)報(bào),2021(2):173 ~ 183.
王方雨,劉文穎,陳鑫鑫等.基于懲罰變權(quán)的RDA同期線損數(shù)據(jù)質(zhì)量評(píng)估模型[ J].中國(guó)電力,2020(12):223 ~ 231.
王琪.打通數(shù)據(jù)交易所壁壘,構(gòu)建統(tǒng)一數(shù)據(jù)交易市場(chǎng)——基于對(duì)數(shù)據(jù)交易所的比較分析[ J].中國(guó)電信業(yè),2023(1):30 ~ 33.
王禹.?dāng)?shù)據(jù)資產(chǎn)的商業(yè)價(jià)值研究[ J].全國(guó)流通經(jīng)濟(jì),2023(19):189 ~ 192.
吳偉光,祝雅璐,顧光同.中國(guó)試點(diǎn)碳市場(chǎng)有效性的決定因素[ J].資源科學(xué),2021(10):2119 ~ 2129.
莊計(jì)龍,陳敏剛.?dāng)?shù)據(jù)質(zhì)量量化評(píng)價(jià)研究與實(shí)現(xiàn)[ J]. 智能計(jì)算機(jī)與應(yīng)用,2019(4):71 ~ 74+78.
Arazy O., Kopak R.. On the measurability of information quality[ J]. Journal of the American Society for Information Science amp; Technology,2011(1):89 ~ 99.
Batini C., Cappiello C., Francalanci C., et al.. Methodologies for data quality assessment and improvement[ J]. Acm Computing Surveys,2009(3):1 ~ 52.
Even A., Shankaranarayanan G.. Utility-driven assessment of data quality[ J].ACM SIGMIS Database,2007(2):75 ~ 93.
Li Y., Chao X., Ercisli S.. Disturbed-entropy: A simple data quality assessment approach[ J]. ICF Express,2022(3):309 ~ 312.
Nespoli A., Ogliari E., Pretto S., et al.. Data quality analysis in day-ahead load forecast by means of LSTM[C]. 2020 IEEE International Conference on Environment and Electrical Engineering and 2020 IEEE Industrial and Commercial Power Systems Europe (EEEIC/Iamp;CPS Europe),2020.
Niyato D., Alsheikh M. A., Wang P., et al.. Market model and optimal pricing scheme of big data and internet of things (IoT)[C]. IEEE Internatio-nal Conference on Communications (ICC),2016.
Pierce E., Thomas L.. Assessing information quality using prediction markets[C]. 12th International Conference on Information Quality(ICIQ-2007),2007.
Spiekermann M.. Data marketplaces: Trends and monetisation of data goods[ J]. Intereconomics,2019(4):208 ~ 216.
Strong D. M., Lee Y. W., Wang R. Y.. Data quality in context[ J]. Communications of the ACM,1997(5):103 ~ 110.
Sundararaman A.. A framework for linking data quality to business objectives in decision support systems[C]. International Conference on Trendz in Information Sciences amp; Computing,2011.
Tayi G. K., Ballou D. P.. Examining data quality[ J]. Communications of the ACM,1998(2):54 ~ 57.
Yang J., Lan G,. Li Y., et al.. Data quality assessment and analysis for pest identification in smart agriculture[ J]. Computers and Electrical Engineering,2022(103):108322.