■楊 靜
統(tǒng)計(jì)到底是怎樣一門學(xué)問(wèn)呢?先看看我們的周圍,其實(shí)有無(wú)限多的數(shù)據(jù),所謂數(shù)據(jù)就是一系列數(shù)字的集合或者符號(hào)的集合體。我們看一些數(shù)據(jù)的個(gè)數(shù)、平均、傾向、分類等數(shù)字特征才能了解數(shù)據(jù)的性質(zhì)。那么看數(shù)字特征,基本上會(huì)有一定的不確定性,比如某企業(yè)大多數(shù)都是一線員工,年收入在2萬(wàn)元左右,另有一些管理層次的人,年收入幾十萬(wàn)元,此時(shí)年收入的平均數(shù)就失去了參考價(jià)值。統(tǒng)計(jì)學(xué)就是一個(gè)被體系化的方法論,它用來(lái)查看零散的有不確定性數(shù)據(jù)的性質(zhì),從大的數(shù)據(jù)(總體)抽取出一部分(樣本),查看它的性質(zhì),推測(cè)原來(lái)的大的(總體)數(shù)據(jù)的性質(zhì)(用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征)等。
在國(guó)外,統(tǒng)計(jì)工作開(kāi)始于公元前3050年。埃及建造金字塔,為征收建筑費(fèi)用,對(duì)全國(guó)人口進(jìn)行普查和統(tǒng)計(jì),到了亞里士多德時(shí)代,統(tǒng)計(jì)工作開(kāi)始往理性演變。這時(shí),統(tǒng)計(jì)在衛(wèi)生、保險(xiǎn)、國(guó)內(nèi)外貿(mào)易、軍事和行政管理方面的應(yīng)用,都有詳細(xì)的記載。
數(shù)理統(tǒng)計(jì)起源于人口統(tǒng)計(jì)、社會(huì)調(diào)查等各種描述性統(tǒng)計(jì)活動(dòng)。公元前2070年前大禹治水時(shí),根據(jù)山川土質(zhì),人力和物力的多寡,分全國(guó)為九州;殷周時(shí)代實(shí)行井田制,按人口分地,進(jìn)行了土地與戶口的統(tǒng)計(jì);春秋時(shí)代常以兵車多寡論諸侯實(shí)力,可見(jiàn)已進(jìn)行了軍事調(diào)查和比較;漢代全國(guó)戶口與年齡的統(tǒng)計(jì)數(shù)字有據(jù)可查;明初編制了黃冊(cè)與魚(yú)鱗冊(cè),黃冊(cè)乃全國(guó)戶口名冊(cè),魚(yú)鱗冊(cè)系全國(guó)土地圖籍,繪有地形,完全具有現(xiàn)代統(tǒng)計(jì)圖表的性質(zhì)。可見(jiàn),我國(guó)歷代對(duì)統(tǒng)計(jì)工作非常重視,只是缺少系統(tǒng)研究,未形成專門的著作。
數(shù)理統(tǒng)計(jì)在自然科學(xué)、工程技術(shù)、管理科學(xué)及人文社會(huì)科學(xué)中得到越來(lái)越廣泛和深刻的應(yīng)用,其研究的內(nèi)容也隨著科學(xué)技術(shù)和政治、經(jīng)濟(jì)與社會(huì)的不斷發(fā)展而逐步擴(kuò)大,但概括地說(shuō)可以分為兩大類:(1)試驗(yàn)的設(shè)計(jì)和研究,即研究如何更合理更有效地獲得觀察資料的方法;(2)統(tǒng)計(jì)推斷,即研究如何利用一定的資料對(duì)所關(guān)心的問(wèn)題作出盡可能精確可靠的結(jié)論。當(dāng)然這兩部分內(nèi)容有著密切的聯(lián)系,在實(shí)際應(yīng)用中更應(yīng)前后兼顧。
由于大數(shù)據(jù)的出現(xiàn),統(tǒng)計(jì)更加引人注目。理由很簡(jiǎn)單,就是利用統(tǒng)計(jì)學(xué)方法分析大數(shù)據(jù),在計(jì)劃經(jīng)營(yíng)戰(zhàn)略,市場(chǎng)戰(zhàn)略,開(kāi)發(fā)新產(chǎn)品,新業(yè)務(wù)的時(shí)候取得了有效成果。經(jīng)營(yíng)不只是靠感覺(jué),靠經(jīng)驗(yàn),靠勇氣的東西了,而是根據(jù)以數(shù)據(jù)為基礎(chǔ)的科學(xué)分析方法來(lái)進(jìn)行決策。
最早應(yīng)用大數(shù)據(jù)并對(duì)大數(shù)據(jù)進(jìn)行收集和分析的設(shè)想來(lái)自于世界著名的管理咨詢公司麥肯錫公司(M c K i n s e y)。麥肯錫公司看到了各種網(wǎng)絡(luò)平臺(tái)記錄的個(gè)人海量信息具備潛在的商業(yè)價(jià)值,于是投入大量人力物力進(jìn)行調(diào)研,在2011年6月發(fā)布了關(guān)于大數(shù)據(jù)的報(bào)告,該報(bào)告對(duì)大數(shù)據(jù)的影響、關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域等都進(jìn)行了詳盡的分析。麥肯錫的報(bào)告得到了金融界的高度重視,而后逐漸受到了各行各業(yè)關(guān)注。
維克托·邁爾-舍恩伯格和肯尼斯·克耶在其編寫的《大數(shù)據(jù)時(shí)代》中提出大數(shù)據(jù)的4 V特點(diǎn),即 V o l u m e(數(shù)據(jù)量大),V e l o c i t y(輸入和處理速度快),V a r i e t y(數(shù)據(jù)多樣性),V a l u e(價(jià)值密度低)。
當(dāng)我們進(jìn)入大數(shù)據(jù)時(shí)代之后,統(tǒng)計(jì)有了什么樣的變化呢?如果我們能夠分析總體的話就沒(méi)有必要分析一部分的樣本了。在大數(shù)據(jù)時(shí)代,最重要的是從這些龐雜的數(shù)據(jù)中,要得到那些有價(jià)值的信息。我們相信,隨著科技的發(fā)展,統(tǒng)計(jì)和大數(shù)據(jù)將會(huì)更加深遠(yuǎn)地影響著我們的生活。