李偉
摘要:隨著多媒體技術(shù)的發(fā)展,網(wǎng)絡(luò)信息也漸漸豐富起來,大數(shù)據(jù)因其數(shù)據(jù)信息規(guī)模較大、結(jié)構(gòu)復(fù)雜,受到各個國家廣泛的關(guān)注。并且大數(shù)據(jù)與統(tǒng)計工作之間存在多方面的聯(lián)系大數(shù)據(jù)時代的出現(xiàn)給統(tǒng)計新思維也提出很多要求。本文就大數(shù)據(jù)與統(tǒng)計新思維方式的進(jìn)行分析,深入探討統(tǒng)計思維的變化及創(chuàng)新大數(shù)據(jù)的收集方式,以期提升大數(shù)據(jù)分析數(shù)據(jù)的效率。
關(guān)鍵詞:大數(shù)據(jù) 統(tǒng)計新數(shù)據(jù) 分析
隨著信息時代的發(fā)展,大數(shù)據(jù)發(fā)展的速度變得越來越快,漸漸改變著公眾通過統(tǒng)計知識去探索世界的方法。在以往的統(tǒng)計學(xué)分析中,所使用的數(shù)據(jù)一般都是樣本數(shù)據(jù),即現(xiàn)在的大數(shù)據(jù)。大數(shù)據(jù)的數(shù)據(jù)規(guī)模非常廣泛,數(shù)據(jù)的類型非常多,并且更新的速度較快。大數(shù)據(jù)與樣本數(shù)據(jù)相比,其數(shù)據(jù)量較廣,因此,有利于研究人員從多方面統(tǒng)計及分析數(shù)據(jù)。在統(tǒng)計學(xué)分析中,研究者所研究的對象沒有更改,但數(shù)據(jù)的來源卻有了相應(yīng)的變化,比以往的更加完善,相關(guān)的統(tǒng)計思維方式也有很大的變化。
一、統(tǒng)計思維的變化
(一)認(rèn)識數(shù)據(jù)思維
首先,從數(shù)據(jù)來源方面看,以往的樣本數(shù)據(jù)是根據(jù)某種方式來進(jìn)行收集,但大數(shù)據(jù)主要是來源于網(wǎng)絡(luò),數(shù)據(jù)庫內(nèi)的信息可被記錄下來,不帶有目的性。因此,對于大數(shù)據(jù)的來源難以追溯。其次,大部分的樣本數(shù)據(jù)的類型都屬于結(jié)構(gòu)型,而大數(shù)據(jù)的類型屬于半結(jié)構(gòu)、非結(jié)構(gòu)及異構(gòu)型。最后,以往的樣本數(shù)據(jù)可依靠相關(guān)的理論基礎(chǔ),對一些結(jié)構(gòu)型的數(shù)據(jù)實施量化處理,但大數(shù)據(jù)的數(shù)據(jù)類型較為復(fù)雜,量化的方式也需要有所更改。
(二)收集數(shù)據(jù)的思維要變化
收集與統(tǒng)計數(shù)據(jù)的思維是確定數(shù)據(jù)統(tǒng)計分析的目的,之后再根據(jù)所需的數(shù)據(jù)進(jìn)行收集,因此,要仔細(xì)分析相應(yīng)的調(diào)查方案,嚴(yán)格按照規(guī)定來執(zhí)行各個流程。
(三)分析數(shù)據(jù)的思維
第一,以往的統(tǒng)計思維分析,主要是根據(jù)“定性--定量--再定性”的過程進(jìn)行,定性的目的是為了確定進(jìn)行定量分析的方向,根據(jù)相關(guān)經(jīng)驗來判斷,這在數(shù)據(jù)缺失及運(yùn)算受限的情況之下顯得非常重要。目前主要是依靠數(shù)據(jù)的分析來做判斷,因此,主要要找到定量回應(yīng),這對于儲存能力、分析技術(shù)的速度不斷提升的今天,探測定量回應(yīng)的工作,主要是在定量回應(yīng)當(dāng)中來尋找真實及重要的數(shù)量管理,進(jìn)而得出可作為數(shù)據(jù)判斷或者是決策的結(jié)論。
第二,以往的統(tǒng)計思維實證分析,要先按照數(shù)據(jù)研究的目的,做出相應(yīng)的假設(shè),然后再通過收集和分析數(shù)據(jù),驗證該項假設(shè)是否成立,分析的思路主要是按照“假設(shè)--驗證”的過程來進(jìn)行,但是這種形式的驗證經(jīng)常會受到假設(shè)條件的限制,造成很多指標(biāo)選擇不當(dāng)或者是缺失數(shù)據(jù),最后沒能得出結(jié)論。第三,以往的統(tǒng)計思維推斷分析,根據(jù)分布理論,以一定概率作為保障,按照樣本數(shù)據(jù)的特征來推斷出總體的特征,邏輯關(guān)系為“分布理論--概率保證--總體推斷”,而推斷評判的標(biāo)準(zhǔn)和樣本沒有關(guān)系,但是推斷結(jié)果正確與否直接取決定于基本樣本的好壞。
二、積極應(yīng)對大數(shù)據(jù)
(一)改變對不確定性的認(rèn)識
統(tǒng)計學(xué)出現(xiàn)的目的主要是研究與認(rèn)識事物發(fā)生的不確定性,因為不管是自然還是社會的經(jīng)濟(jì)現(xiàn)象,隨時都會由于個體間的差異而造成不確定性,想要研究與分析不確定性,就要先收集大量的數(shù)據(jù)信息,在只可以實行抽樣檢測的情況之下,不確定性主要表現(xiàn)在獲取樣本、推斷總體以及建設(shè)模型等方面。對大數(shù)據(jù)依然存在相應(yīng)的個體差異,而區(qū)別就只在于其包含了所有的個體,并不是隨機(jī)獲取的樣本。
(二)融合統(tǒng)計技術(shù)與云計算技術(shù)
盡管當(dāng)前收集與分析數(shù)據(jù)信息的統(tǒng)計技術(shù)已逐漸成熟,但在面對規(guī)模較大的大數(shù)據(jù),也存在一定的困難,這對數(shù)據(jù)信息的計算能力來說是一個挑戰(zhàn)。因此,需要充分使用現(xiàn)代化的信息技術(shù),并借助相應(yīng)的云計算技術(shù),把其與統(tǒng)計技術(shù)相互融合,來處理相關(guān)的數(shù)據(jù)。并且大數(shù)據(jù)的數(shù)據(jù)量較大,形式復(fù)雜多樣,必須要現(xiàn)從數(shù)據(jù)本身切入,并結(jié)合大數(shù)據(jù)的相關(guān)特點,仔細(xì)查看數(shù)據(jù)的變化情況,不斷創(chuàng)新大數(shù)據(jù)的梳理及分類的方法,只有不斷創(chuàng)新技術(shù)才可以適應(yīng)當(dāng)前大數(shù)據(jù)對技術(shù)的需求。
(三)創(chuàng)新樣本采樣的方式
對于小數(shù)據(jù)時代而言,主要是按照研究的目的進(jìn)行數(shù)據(jù)采樣,屬于收集數(shù)據(jù)的一種方式。雖然數(shù)據(jù)樣本在總體樣本中只占據(jù)較小的部分,但按照采樣的科學(xué)理論,科學(xué)的進(jìn)行采樣可保證數(shù)據(jù)信息的可靠性。系統(tǒng)采樣的信息量有一定的限制,難以滿足信息化社會發(fā)展的需求,但從目前的成本與效率方面來考慮,以往的數(shù)據(jù)采樣調(diào)查方式依然被廣泛應(yīng)用。
(四)因果關(guān)系和相關(guān)關(guān)系
因果關(guān)系通常都來源于經(jīng)驗,但隨著大數(shù)據(jù)時代的到來,就直接推翻了這一論斷。在大數(shù)據(jù)時代環(huán)境之下,并不需要了解其發(fā)展的原因,它的主要核心是建立在相關(guān)關(guān)系之上,進(jìn)而可以科學(xué)地預(yù)測未來事物的發(fā)展方向。但分析事物發(fā)生的因果關(guān)系,一直都是人們探索未知世界的一個使命。即在大數(shù)據(jù)時代下,人們只是了解事物發(fā)展的因果關(guān)系遠(yuǎn)遠(yuǎn)不夠,還應(yīng)充分了解事物間存在的相關(guān)關(guān)系,只有知道因果關(guān)系,才可以有效地使用相關(guān)關(guān)系,進(jìn)而協(xié)助研究人員作出科學(xué)的決策。
三、結(jié)束語
總而言之,隨著大數(shù)據(jù)時代的發(fā)展,對各個領(lǐng)域的發(fā)展都帶來了很大的影響在大數(shù)據(jù)特征的影響之下,統(tǒng)計學(xué)分析也漸漸轉(zhuǎn)變了單一的思維,而是以一種全新的態(tài)度來分析大數(shù)據(jù)所帶來的便利,使用新思維來認(rèn)識、分析及處理大數(shù)據(jù)中出現(xiàn)的問題,并不斷轉(zhuǎn)變大數(shù)據(jù)統(tǒng)計學(xué)的分析方式,充分利用大數(shù)據(jù)的優(yōu)勢,進(jìn)而為決策人員提供一些有效及可靠的決策選擇。
參考文獻(xiàn):
[1]柴世琿.試論大數(shù)據(jù)統(tǒng)計的新思維[J].中國高新技術(shù)企業(yè),2015,15
[2]喬紅.現(xiàn)代統(tǒng)計中新思維、新方法的應(yīng)用[J].現(xiàn)代商業(yè),2015,36
[3]劉軍華.大數(shù)據(jù)視野下統(tǒng)計數(shù)據(jù)質(zhì)量演變的信息回歸、分布與趨勢[J].統(tǒng)計與信息論壇,2015,149