曹朋 成都七中嘉祥外國語學(xué)校
引言:統(tǒng)計學(xué)在社會生產(chǎn)生活當中應(yīng)用非常廣泛,通過分析統(tǒng)計數(shù)據(jù),我們可以得到很多有用的有利于工作的指導(dǎo)性結(jié)論,例如金融分析師可以通過統(tǒng)計數(shù)據(jù)對行業(yè)未來發(fā)展方向進行預(yù)測等。近年來,大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展,通過對海量數(shù)據(jù)所包含的內(nèi)容提取和利用,可以社會各行各業(yè)的高效快速運行。所以,我們有必要對大數(shù)據(jù)時代統(tǒng)計學(xué)受到的影響進行分析。
顧名思義,大數(shù)據(jù)就是包含了數(shù)量極大的信息和數(shù)據(jù),通常不能由單個計算機或者數(shù)據(jù)庫來管理、處理,必須借助分布式的數(shù)據(jù)庫存儲系統(tǒng)和云計算等新型技術(shù)對其加以利用,它具有大量、高速、多樣和真實等特點。
統(tǒng)計學(xué)是一門通過處理數(shù)據(jù)來提高我們對客觀事物群體認識甚至預(yù)測未來發(fā)展方向的一門學(xué)科,廣泛應(yīng)用于社會科學(xué)和自然科學(xué)各個領(lǐng)域。如果沒有統(tǒng)計學(xué),數(shù)據(jù)將會失去意義,只有通過統(tǒng)計學(xué)的方法論,將數(shù)據(jù)解釋出來,才能顯示出數(shù)據(jù)巨大價值。
統(tǒng)計學(xué)的發(fā)展具有很長的歷史,大數(shù)據(jù)是現(xiàn)代信息社會的產(chǎn)物,但是兩者仍然有很多的聯(lián)系。統(tǒng)計學(xué)的研究過程為:統(tǒng)計方案設(shè)計、數(shù)據(jù)搜集、數(shù)據(jù)整理、數(shù)據(jù)分析、得出相關(guān)規(guī)律和結(jié)論,而大數(shù)據(jù)的利用過程為:采集數(shù)據(jù)、統(tǒng)計分析、挖掘信息、利用信息,兩者在過程上有較大的相似之處。統(tǒng)計學(xué)的相關(guān)理論方法和思想被運用到大數(shù)據(jù)分析中,同時,大數(shù)據(jù)相關(guān)軟件也在一定程度上豐富了統(tǒng)計學(xué)的研究工具,為統(tǒng)計學(xué)搜集數(shù)據(jù)帶來一定便利。另外,大數(shù)據(jù)和統(tǒng)計學(xué)都集合了社會、數(shù)據(jù)、哲學(xué)、數(shù)學(xué)和方法等概念,將定性分析和定量分析相結(jié)合,用于解決社會問題。某種程度上,兩者也是相互依存的,沒有了統(tǒng)計學(xué),大數(shù)據(jù)無法運作,離開了大數(shù)據(jù),統(tǒng)計學(xué)對將不能滿足現(xiàn)代社會的發(fā)展需要。
但是,大數(shù)據(jù)和傳統(tǒng)統(tǒng)計學(xué)還存在很大的區(qū)別,在信息規(guī)模和組織結(jié)構(gòu)、處理方法、動靜標準、搜集形式、思維方式、研究目的等方面存在差異。傳統(tǒng)統(tǒng)計學(xué)通過抽樣調(diào)查得到有限數(shù)據(jù),然后用樣本單位來估計整體特征,取得的也是相對容易整理的結(jié)構(gòu)化數(shù)據(jù),可利用概率論、相關(guān)回歸等理論進行分析,而大數(shù)據(jù)的樣本則是幾乎等于總體,里面包含了大量各種各樣的信息和特征,并且是非結(jié)構(gòu)化和半結(jié)構(gòu)化的,只能通過現(xiàn)代計算機和網(wǎng)絡(luò)技術(shù)進行分析。通過抽樣調(diào)查得到的統(tǒng)計學(xué)數(shù)據(jù)都是靜態(tài),且非即時的,而大數(shù)據(jù)是實時動態(tài)變化,其對現(xiàn)實的反映程度更高。搜集形式上,抽樣調(diào)查大多通過線下線上等多種方式進行,而大數(shù)據(jù)一般只能通過互聯(lián)網(wǎng)獲取。思維方式上,傳統(tǒng)統(tǒng)計學(xué)更追求的是事物之間的因果關(guān)系,而大數(shù)據(jù)在此基礎(chǔ)上,還能分析事物之間的相關(guān)關(guān)系。在研究目的上,大數(shù)據(jù)更多的以實現(xiàn)價值追求為目的,而統(tǒng)計學(xué)更多的以研究社會現(xiàn)象為目的。
大數(shù)據(jù)的出現(xiàn),對傳統(tǒng)統(tǒng)計學(xué)的應(yīng)用領(lǐng)域構(gòu)成了一定的挑戰(zhàn)。傳統(tǒng)的統(tǒng)計學(xué)需要抽樣調(diào)查,在搜集數(shù)據(jù)上存在一定的困難并需要花費大量時間,在大數(shù)據(jù)時代,人們?yōu)榱撕啽?,很多時候就直接從互聯(lián)網(wǎng)流量數(shù)據(jù)上去搜集信息,以達到快速高效的目的,比如用于某些選舉的人氣支持率調(diào)查、商品的受歡迎程度調(diào)查等,并且隨著大數(shù)據(jù)的發(fā)展和計算機軟硬件的功能越來越強大,其作用會更加凸顯出來。但是,這樣存在一定的弊端,在某些領(lǐng)域,數(shù)據(jù)分布可能是相對均勻的,然而,在另外一些領(lǐng)域,樣本則存在一定的選擇性,因為互聯(lián)網(wǎng)的使用群體更傾向于年輕人,使用地域更傾向于網(wǎng)絡(luò)通信發(fā)達和開放程度更高的國家和地區(qū),因此得到的結(jié)論可能具有一定的片面性。
傳統(tǒng)的統(tǒng)計人才培養(yǎng)方式已經(jīng)不再適應(yīng)大數(shù)據(jù)社會的發(fā)展,主要體現(xiàn)在教師知識結(jié)構(gòu)、教學(xué)內(nèi)容和教育模式上?,F(xiàn)在大部分教師只擅長理論公式推導(dǎo)、模型構(gòu)建以及統(tǒng)計應(yīng)用等,不太了解計算機和互聯(lián)網(wǎng)的新興技術(shù),因此在教學(xué)中,很難將這些技術(shù)灌輸給學(xué)生,而這些技術(shù)正好是大數(shù)據(jù)時代所需要的。大部分學(xué)校的統(tǒng)計專業(yè)培養(yǎng)計劃也更偏重于理論知識,涉及到大數(shù)據(jù)處理、計算機分析和應(yīng)用的課程比較少。另外,當前學(xué)校的培養(yǎng)模式也存在一定的問題,以老師講課為主,看重理論知識,對于學(xué)生的實踐能力、社會視野、和商業(yè)意識的培養(yǎng)還很不到位,而這些能力對于現(xiàn)代統(tǒng)計分析人員是非常重要的。所以,在人才培養(yǎng)上,學(xué)校應(yīng)該結(jié)合大數(shù)據(jù)時代的特征,在教師知識體系、教學(xué)內(nèi)容和培養(yǎng)模式方面進行一定的改進。
總結(jié):大數(shù)據(jù)時代的來臨,單純的傳統(tǒng)統(tǒng)計學(xué)已滿足不了現(xiàn)代社會的需要,但是我們在認識他們之間區(qū)別的同時,要將這兩者聯(lián)系起來,結(jié)合運用,在不同的領(lǐng)域發(fā)揮出各自的優(yōu)點。我們還要認識到大數(shù)據(jù)時代帶給統(tǒng)計學(xué)應(yīng)用和人才培養(yǎng)方面的挑戰(zhàn),通過相關(guān)改進培養(yǎng)出有統(tǒng)計學(xué)基礎(chǔ)的大數(shù)據(jù)人才,創(chuàng)造出迎合大數(shù)據(jù)的新統(tǒng)計學(xué)方法,促進統(tǒng)計學(xué)的發(fā)展。