孫雪琴
摘要:從學(xué)科層面來(lái)看,大數(shù)據(jù)作為一種新的數(shù)據(jù)分析方案,其基于數(shù)據(jù)關(guān)系的內(nèi)在本質(zhì)直接決定了大數(shù)據(jù)與統(tǒng)計(jì)學(xué)之間所存在必然聯(lián)系,對(duì)統(tǒng)計(jì)學(xué)來(lái)說(shuō),大數(shù)據(jù)不僅是一種挑戰(zhàn),同時(shí)也是良好的機(jī)遇,深入探討大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)的發(fā)展趨勢(shì)就成為社會(huì)各界共同關(guān)注的焦點(diǎn)。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);發(fā)展
大數(shù)據(jù)背景下,信息化技術(shù)、定位系統(tǒng)以及傳感器等各類技術(shù)不斷發(fā)展,使得許多曾經(jīng)難以收集的數(shù)據(jù)能夠進(jìn)行大規(guī)模收集,云計(jì)算則使得大規(guī)模數(shù)據(jù)處理得以實(shí)現(xiàn)。基于大規(guī)模數(shù)據(jù)分析能夠讓我們獲取傳統(tǒng)只使用樣本時(shí)不能達(dá)成的全新視野,其為統(tǒng)計(jì)學(xué)未來(lái)發(fā)展提供了良好的機(jī)遇。與此同時(shí),基于樣本的傳統(tǒng)統(tǒng)計(jì)理論及方法顯然已經(jīng)無(wú)法適應(yīng)大數(shù)據(jù)背景下相關(guān)需求,這就需要我們充分結(jié)合大數(shù)據(jù)需求與特征針對(duì)統(tǒng)計(jì)學(xué)進(jìn)行改進(jìn),從大數(shù)據(jù)當(dāng)中挖掘更多信息,促進(jìn)統(tǒng)計(jì)學(xué)更好的發(fā)展。
1健全總體、個(gè)體以及樣本的定義
傳統(tǒng)統(tǒng)計(jì)分析需要從總體當(dāng)中進(jìn)行抽樣,再針對(duì)抽樣樣本性質(zhì)來(lái)決定總體特點(diǎn)。由于其需要從總體當(dāng)中獲取數(shù)據(jù),即應(yīng)當(dāng)明確整體范圍來(lái)當(dāng)作研究目標(biāo),然后利用抽樣樣本分析來(lái)針對(duì)總體進(jìn)行分析。大數(shù)據(jù)環(huán)境則是完全相反,其需要先有數(shù)據(jù),然后后總體,并不需要定義目標(biāo),只包含某一段時(shí)間點(diǎn)的所有數(shù)據(jù)對(duì)應(yīng)的整體概念。由于個(gè)體所具有的不確定性,數(shù)據(jù)本身是一個(gè)動(dòng)態(tài)的進(jìn)程,不能事前依靠數(shù)據(jù)庫(kù)當(dāng)中的單位實(shí)施編制,這個(gè)時(shí)間段與下一個(gè)時(shí)間段的數(shù)據(jù)是存在差異性的,所以也難以在事后進(jìn)行個(gè)體識(shí)別?;ヂ?lián)網(wǎng)中,相同個(gè)體可以存在多個(gè)符號(hào)與稱謂,相同符號(hào)或者稱謂則能夠代表多個(gè)個(gè)體,并且個(gè)體以為的現(xiàn)象也非常多,所以大數(shù)據(jù)通常能夠看到整體數(shù)據(jù)的外形,難以針對(duì)個(gè)體進(jìn)行考究。然而對(duì)于大數(shù)據(jù)分析而言,針對(duì)個(gè)體實(shí)施身份識(shí)別仍舊是至關(guān)重要的,這就需要我們針對(duì)傳統(tǒng)意義層面中個(gè)體與總體的定義方式進(jìn)行改革,而傳統(tǒng)意義層面上的樣本定義方式無(wú)法從大數(shù)據(jù)當(dāng)中提取樣本數(shù)據(jù)。當(dāng)然,因?yàn)榇髷?shù)據(jù)動(dòng)態(tài)性,在任意時(shí)間段的整體,其都能夠作為界面樣本。
2積極拓展統(tǒng)計(jì)學(xué)體系
大數(shù)據(jù)背景下需要我們采用辯證、發(fā)展眼光來(lái)對(duì)待統(tǒng)計(jì)學(xué)的發(fā)展,統(tǒng)計(jì)學(xué)要想有效適應(yīng)大數(shù)據(jù)的相關(guān)需求,應(yīng)當(dāng)積極構(gòu)建基于大數(shù)據(jù)框架的學(xué)科體系。統(tǒng)計(jì)學(xué)必須要把大數(shù)據(jù)整體統(tǒng)計(jì)的方法與思想歸納到學(xué)科體系當(dāng)中,統(tǒng)計(jì)學(xué)相關(guān)的內(nèi)容則應(yīng)當(dāng)從傳統(tǒng)樣本統(tǒng)計(jì)逐步過(guò)渡到樣本統(tǒng)計(jì)與總體統(tǒng)計(jì)的整合。樣本統(tǒng)計(jì)主要是利用帶有隨即性質(zhì)的觀測(cè)數(shù)據(jù)來(lái)針對(duì)整體進(jìn)行推斷,樣本的生成存在隨機(jī)性,采用樣本去進(jìn)行整體推斷會(huì)出現(xiàn)代表性誤差,而基于大數(shù)據(jù)的整體統(tǒng)計(jì)則能夠有效彌補(bǔ)上述不足。通過(guò)大數(shù)據(jù)的引入,統(tǒng)計(jì)學(xué)科能夠劃分為總體統(tǒng)計(jì)與樣本統(tǒng)計(jì),樣本統(tǒng)計(jì)的作用在于“以小見(jiàn)大”,而總體統(tǒng)計(jì)則在于“由繁入簡(jiǎn)”,兩者的有效整合能夠更好的適應(yīng)大數(shù)據(jù)的相關(guān)需求。
3研發(fā)新的分類與梳理方法
傳統(tǒng)統(tǒng)計(jì)學(xué)主要是根據(jù)預(yù)先設(shè)置的方案實(shí)施數(shù)據(jù)分類與梳理,所參考的指標(biāo)與最終獲得的分類都屬于結(jié)構(gòu)化的,針對(duì)數(shù)據(jù)實(shí)施分類與梳理屬于數(shù)據(jù)預(yù)處理的必要步驟,屬于統(tǒng)計(jì)分析的重要部分。但針對(duì)大數(shù)據(jù)來(lái)說(shuō),因?yàn)閿?shù)據(jù)的來(lái)源、形式以及表現(xiàn)方式等都是多元化的,如果還根據(jù)傳統(tǒng)統(tǒng)計(jì)學(xué)方式在研究以前針對(duì)信息的類型、分類依據(jù)標(biāo)識(shí)、標(biāo)示之間的關(guān)系以及類與類之間區(qū)別度等實(shí)施更為嚴(yán)格的設(shè)定,顯然是不現(xiàn)實(shí)的,只可以在針對(duì)數(shù)據(jù)實(shí)施預(yù)處理以后,依照數(shù)據(jù)自身的特征來(lái)實(shí)施完善與補(bǔ)充。顯然,傳統(tǒng)的數(shù)據(jù)分類與梳理已經(jīng)不適用于大數(shù)據(jù)要求,應(yīng)當(dāng)積極研發(fā)適用于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)分類與梳理方法,并在此基礎(chǔ)上研發(fā)新的數(shù)據(jù)分析方法。
4整合多種統(tǒng)計(jì)學(xué)方法
傳統(tǒng)統(tǒng)計(jì)分析中,歸納推斷法屬于最為主要的研究方法,通過(guò)分析樣本數(shù)據(jù)的主要特征,然后在這個(gè)基礎(chǔ)上進(jìn)行總體特征的推斷。針對(duì)大數(shù)據(jù),歸納法依據(jù)能夠作為大數(shù)據(jù)分析的主要方法,依據(jù)需要利用具體個(gè)體的特征來(lái)進(jìn)行總體特征的推斷,依然需要從個(gè)體信息當(dāng)中去不斷發(fā)現(xiàn)新的知識(shí)。然而針對(duì)大數(shù)據(jù)而言,如果僅僅只是注重一般或者總體特征的歸納,則會(huì)造成嚴(yán)重的浪費(fèi)。部分類別甚至是個(gè)體,或者某些異常值,都能夠據(jù)此推斷出全新的預(yù)測(cè)或者結(jié)論。所以,還必須要針對(duì)個(gè)體的信息實(shí)施更為深入的挖掘,同時(shí)需要根據(jù)現(xiàn)有的相關(guān)經(jīng)驗(yàn)知識(shí)與分布特征去針對(duì)其他更為具體的規(guī)律實(shí)施推理分析,能夠更為深入的挖掘事物之間存在的聯(lián)系,并據(jù)此來(lái)針對(duì)新事物實(shí)施判斷,即演繹推理法。演繹法能夠幫助我們基于現(xiàn)有知識(shí)經(jīng)驗(yàn)基礎(chǔ),實(shí)施進(jìn)一步的研究挖掘,避免研究進(jìn)程中忽略一些細(xì)小、關(guān)鍵的特點(diǎn)。通過(guò)歸納法與演繹法的有效整合,能夠從大數(shù)據(jù)當(dāng)中的偶然性中發(fā)現(xiàn)必然性,并通過(guò)全面數(shù)據(jù)當(dāng)中的必然性去觀察偶然性、認(rèn)知偶然性、利用偶然性,以此來(lái)全面提升偶然性的駕馭水平。
綜上所述,大數(shù)據(jù)在為傳統(tǒng)統(tǒng)計(jì)學(xué)帶來(lái)嚴(yán)峻挑戰(zhàn)的同時(shí),也能夠?yàn)閭鹘y(tǒng)統(tǒng)計(jì)學(xué)創(chuàng)造發(fā)展提供良好的機(jī)遇。處在大數(shù)據(jù)快速發(fā)展的時(shí)代中,我們必須要意識(shí)到大數(shù)據(jù)對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)來(lái)說(shuō)是一種補(bǔ)充而并非替代,傳統(tǒng)統(tǒng)計(jì)學(xué)仍舊會(huì)在經(jīng)濟(jì)分析、社會(huì)統(tǒng)計(jì)領(lǐng)域發(fā)揮至關(guān)重要的作用。