馬文勝 侯錫林
關(guān)鍵詞:大數(shù)據(jù)價值;粒度樹;使用關(guān)系;價值模型
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-8228(2023)11-146-05
0 引言
20 世紀(jì)80 年代,美國未來學(xué)家阿爾文·托夫勒(Alvin Toffler)在《第三次浪潮》中第一次使用了“大數(shù)據(jù)”一詞[1]。從此大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型。大數(shù)據(jù)是改變市場、組織機(jī)構(gòu)以及政府與公民關(guān)系的方法,大數(shù)據(jù)還是人們獲得新的認(rèn)知、創(chuàng)造新的價值的源泉[2]。
大量的數(shù)據(jù)在開放多源的渠道中產(chǎn)生,并持續(xù)記錄物質(zhì)世界和精神世界運(yùn)動狀態(tài)和狀態(tài)變化的數(shù)據(jù)空間[3]。在這個大數(shù)據(jù)空間中,蘊(yùn)藏著巨大的科學(xué)研究價值、公共管理與服務(wù)價值、商業(yè)價值以及科學(xué)決策價值[4-5]。這些蘊(yùn)藏在大數(shù)據(jù)中的各種“價值”逐漸被人們所認(rèn)知[6]。
于是大數(shù)據(jù)的價值是多少?怎么計(jì)算大數(shù)據(jù)的價值的數(shù)值?就成了研究的重要課題。目前人們已給出了很多不同的研究方法和方向。
⑴ 按照一種定價模型方法對大數(shù)據(jù)價值進(jìn)行研究[7-8];
⑵ 按照一種數(shù)據(jù)資產(chǎn)對大數(shù)據(jù)價值進(jìn)行研究[2];
⑶ 按一種價值評估方法對大數(shù)據(jù)價值進(jìn)行研究[9-10]。
以上這些對大數(shù)據(jù)價值的研究都是以分析、探究、論述、描述、敘述、解釋等為主,而都不是以計(jì)算出一個具體的“價值數(shù)值”為主。然而計(jì)算出“價值數(shù)值”是非常有意義的,理由如下:
(a) 作為大數(shù)據(jù)交易價格數(shù)值的參考;
(b) 作為大數(shù)據(jù)失竊“索賠”的參考;
(c) 作為大數(shù)據(jù)更新“刪除”的參考;
(d) 作為大數(shù)據(jù)行業(yè)“標(biāo)準(zhǔn)”、“規(guī)范”制定的參考。
還有很多領(lǐng)域需要大數(shù)據(jù)的“價值數(shù)值”,因此侯錫林教授認(rèn)為,對大數(shù)據(jù)的價值進(jìn)行科學(xué)的評估和計(jì)算,創(chuàng)建大數(shù)據(jù)的價值模型,給出大數(shù)據(jù)的“價值數(shù)值”,無論在理論上還是在實(shí)踐中,都是亟待解決的最重要問題[6]。
如何給出大數(shù)據(jù)的“價值數(shù)值”呢?
人們發(fā)現(xiàn)只有使用大數(shù)據(jù),大數(shù)據(jù)才能體現(xiàn)出價值。大數(shù)據(jù)的價值的多少應(yīng)體現(xiàn)在大數(shù)據(jù)使用的多少上。
人們還發(fā)現(xiàn),體現(xiàn)大數(shù)據(jù)“使用”情況的價值才是最核心最基本的價值。各個領(lǐng)域的各種價值都是這個核心基本價值的外在表現(xiàn)。
本文將探討基于“使用”的大數(shù)據(jù)最核心最基本的“價值數(shù)值”計(jì)算。
本文首先將大數(shù)據(jù)“粒化”,在大數(shù)據(jù)中建立“粒度樹”。然后考慮每個粒及每個粒集合的使用情況。并將使用情況分為3 種:“正則使用”、“必然使用”、“相關(guān)使用”。取它們對粒及使用項(xiàng)目的平均值作為大數(shù)據(jù)的“正則價值”、“必然價值”、“相關(guān)價值”的數(shù)值。并給出應(yīng)用實(shí)例。
1 粒計(jì)算與粒度樹
大數(shù)據(jù)是巨量數(shù)據(jù)、海量數(shù)據(jù),是無法在一定時間范圍內(nèi)通過人工或計(jì)算機(jī)進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合[11]。所以大數(shù)據(jù)的“價值”計(jì)算也必須使用非傳統(tǒng)的方法。在這些非傳統(tǒng)的方法中Chen 等將“粒計(jì)算”列為駕馭大數(shù)據(jù)的第一方法[12]。
粒計(jì)算的基本思想是把初始形式的數(shù)據(jù)分為不同的粒度進(jìn)行處理。用粒度合適的“粒”作為處理對象,從而在保證求得滿意解的前提下,提高解決問題的效率[13]。
目前大數(shù)據(jù)?;姆椒ㄓ写植诩姆椒╗14]、聚類的方法[15]、商空間的方法[16]、模糊信息的方法[17]和云模型的方法[18-19]等等。