孫越
科學(xué)技術(shù)在現(xiàn)階段的發(fā)展過(guò)程中取得了長(zhǎng)久化的進(jìn)步,在信息技術(shù)的革新過(guò)程中,逐漸涌現(xiàn)出了以云技術(shù)與物聯(lián)網(wǎng)為主的尖端科技,為大眾的生活帶來(lái)便利的同時(shí),促使社會(huì)生產(chǎn)形式出現(xiàn)了較大的變動(dòng)。在大數(shù)據(jù)時(shí)代的影響下,統(tǒng)計(jì)學(xué)逐漸加強(qiáng)了與數(shù)據(jù)信息之間的聯(lián)系,并在大數(shù)據(jù)時(shí)代的建設(shè)過(guò)程中發(fā)揮出了自身的實(shí)用價(jià)值。然而,時(shí)代的變革趨勢(shì)也為統(tǒng)計(jì)學(xué)模式的轉(zhuǎn)型帶來(lái)了新機(jī)遇與新挑戰(zhàn),為了能夠保障統(tǒng)計(jì)學(xué)能夠順利的應(yīng)對(duì)轉(zhuǎn)型過(guò)程中的難題,應(yīng)加強(qiáng)對(duì)變革目的的分析,探討有效的時(shí)代數(shù)據(jù)信息,進(jìn)而找出合理的問(wèn)題解決辦法。
一、大數(shù)據(jù)的處理、抽樣以及分析
(一)網(wǎng)絡(luò)圖的模型
借助網(wǎng)絡(luò)圖所建立的模型,可以細(xì)致化的描述高維度的變量關(guān)系,這是由于網(wǎng)絡(luò)圖模型屬于高維數(shù)據(jù)分析處理工具,同時(shí)還形成了多樣化的圖像模型系統(tǒng)軟件,為變量關(guān)系的處理提供了便利。在節(jié)點(diǎn)網(wǎng)絡(luò)當(dāng)中,若變量較多時(shí),為了能夠有效獲取相關(guān)的變量信息,則可以直接利用網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)信息的傳播與交流,并通過(guò)高維聯(lián)合形式的計(jì)算,進(jìn)而構(gòu)建以數(shù)據(jù)處理為主的網(wǎng)絡(luò)平臺(tái)。
(二)數(shù)據(jù)的預(yù)處理
數(shù)據(jù)的梳理、糾偏、矯正以及不完全數(shù)據(jù)的填補(bǔ)等內(nèi)容,都屬于數(shù)據(jù)預(yù)處理工作當(dāng)中的重要組成部分,可以采用隨機(jī)抽樣的方法,對(duì)相關(guān)數(shù)據(jù)進(jìn)行處理并整合,進(jìn)而針對(duì)數(shù)據(jù)當(dāng)中的問(wèn)題進(jìn)行糾偏。傳統(tǒng)的統(tǒng)計(jì)機(jī)構(gòu)數(shù)據(jù)具有代表性的特點(diǎn),并且系統(tǒng)的誤差幾率較小,但在實(shí)際的數(shù)據(jù)更新以及獲取過(guò)程中所耗費(fèi)的時(shí)間較多,同時(shí)對(duì)于數(shù)據(jù)的涵蓋面積較小。利用互聯(lián)網(wǎng)獲得數(shù)據(jù)具有數(shù)量大、效率高等方面的特點(diǎn),但仍然會(huì)存在數(shù)據(jù)的偏倚現(xiàn)象,此時(shí)可以利用多元化數(shù)據(jù)重疊處理的方法,實(shí)現(xiàn)對(duì)數(shù)據(jù)資源的有效整合,解決單一化數(shù)據(jù)難以完成的業(yè)務(wù)。
(三)大數(shù)據(jù)的分析與整合
傳統(tǒng)的數(shù)據(jù)庫(kù)連接方法已經(jīng)難以滿(mǎn)足大數(shù)據(jù)時(shí)代對(duì)于數(shù)據(jù)信息收集工作的整體要求,此時(shí)應(yīng)根據(jù)數(shù)據(jù)庫(kù)的重疊項(xiàng)目進(jìn)行深入研究,發(fā)揮有關(guān)條件的獨(dú)立性?xún)?yōu)勢(shì),對(duì)多個(gè)不同的變量進(jìn)行整合,進(jìn)而完善以大數(shù)據(jù)變量為主的收集方法,保障方法與數(shù)據(jù)收集的完整性。在多種數(shù)據(jù)來(lái)源以及專(zhuān)題數(shù)據(jù)庫(kù)的影響下,還可以通過(guò)對(duì)數(shù)據(jù)收集過(guò)程進(jìn)行總結(jié),獲取有效的統(tǒng)計(jì)理論,進(jìn)而再對(duì)經(jīng)驗(yàn)和理論進(jìn)行整合。
(四)大數(shù)據(jù)環(huán)境的抽樣
現(xiàn)階段對(duì)于大數(shù)據(jù)環(huán)境抽樣的方法仍然處于研究的狀態(tài),根據(jù)不同數(shù)據(jù)流之間的關(guān)系,可以直接獲取相關(guān)數(shù)據(jù),同時(shí)此類(lèi)數(shù)據(jù)還具有精確性的保障。此外,針對(duì)數(shù)據(jù)信息的適應(yīng)性、動(dòng)態(tài)性以及連貫性等方面的特點(diǎn)進(jìn)行深入研究,再結(jié)合數(shù)據(jù)樣本進(jìn)行全面化的調(diào)查,及時(shí)的針對(duì)調(diào)查的對(duì)象以及項(xiàng)目進(jìn)行調(diào)整,確保所提供的數(shù)據(jù)能夠吸引大眾的興趣。在大數(shù)據(jù)背景的影響下,可以采用大數(shù)據(jù)案例解析的方法,并以非隨機(jī)抽樣為主,擴(kuò)大數(shù)據(jù)的樣本數(shù)量。
二、大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)所面臨的挑戰(zhàn)
(一)缺少合理的統(tǒng)計(jì)軟件和方法
1.缺乏對(duì)技術(shù)以及資源的投入
大數(shù)據(jù)時(shí)代的不斷深入發(fā)展,為加快不同媒介當(dāng)中的信息傳播速度提供了保障,相關(guān)領(lǐng)域所使用的軟件也逐漸適應(yīng)了時(shí)代形式的變化。此外,計(jì)算機(jī)技術(shù)的逐漸進(jìn)步,在促進(jìn)軟件發(fā)展的同時(shí),對(duì)其提出了更高的要求,使其能夠在更新的過(guò)程中,逐漸順應(yīng)統(tǒng)計(jì)學(xué)學(xué)科領(lǐng)域相關(guān)內(nèi)容的變化趨勢(shì),確保軟件與學(xué)科知識(shí)相互匹配。然而,現(xiàn)階段由于企業(yè)缺少對(duì)于配套資源的投入力度,導(dǎo)致相關(guān)行業(yè)領(lǐng)域的企業(yè)缺乏對(duì)技術(shù)的開(kāi)發(fā)能力和計(jì)劃指導(dǎo)。
2.統(tǒng)計(jì)軟件功能不足
在大數(shù)據(jù)時(shí)代的信息處理過(guò)程中,主要的信息載體屬于信息技術(shù)和計(jì)算機(jī)技術(shù),在使用計(jì)算機(jī)設(shè)備進(jìn)行運(yùn)算的過(guò)程中,還會(huì)運(yùn)用到與統(tǒng)計(jì)學(xué)學(xué)科基礎(chǔ)專(zhuān)業(yè)知識(shí)相關(guān)的內(nèi)容,進(jìn)而發(fā)揮出統(tǒng)計(jì)學(xué)軟件的實(shí)際作用。利用統(tǒng)計(jì)學(xué)軟件不僅能夠提升統(tǒng)計(jì)學(xué)對(duì)于數(shù)據(jù)的分析能力,還可以有效降低統(tǒng)計(jì)學(xué)的難度 ,進(jìn)而再利用統(tǒng)計(jì)學(xué)進(jìn)行操作,擴(kuò)大了統(tǒng)計(jì)學(xué)的使用范圍。在大數(shù)據(jù)時(shí)代的轉(zhuǎn)型過(guò)程中,已經(jīng)逐漸涌現(xiàn)了一批統(tǒng)計(jì)學(xué)軟件,且相關(guān)軟件還具有成熟性以及完善性的特點(diǎn),但此類(lèi)軟件當(dāng)中仍然存在部分問(wèn)題 ,導(dǎo)致統(tǒng)計(jì)軟件無(wú)法發(fā)揮出自身的功能價(jià)值。
(二)數(shù)據(jù)收集方式所產(chǎn)生的變化
數(shù)據(jù)的來(lái)源具有豐富性以及多樣化的特點(diǎn),互聯(lián)網(wǎng)時(shí)代下的信息交流形式,不僅能夠打破時(shí)間與空間的局限性,還可以保障信息聯(lián)系的密切性。數(shù)據(jù)的來(lái)源屬于個(gè)體、社會(huì)、經(jīng)濟(jì)以及生活等各個(gè)方面,隨著專(zhuān)業(yè)統(tǒng)計(jì)數(shù)據(jù)庫(kù)在建設(shè)過(guò)程中的規(guī)模化發(fā)展,同時(shí)也豐富了間接性的數(shù)據(jù)來(lái)源,使數(shù)據(jù)的收集與獲取手段不僅呈現(xiàn)出了多樣化的特點(diǎn),同時(shí)也實(shí)現(xiàn)了信息傳輸?shù)母咝Щ?/p>
(三)數(shù)據(jù)的類(lèi)型發(fā)生變化
1.頻數(shù)的轉(zhuǎn)變
傳統(tǒng)以低頻、低維為主的數(shù)據(jù)逐漸轉(zhuǎn)變成為以高頻、高維為主的數(shù)據(jù)形式,大量的高頻、高維類(lèi)型的數(shù)據(jù),以半結(jié)構(gòu)化的形式呈現(xiàn)出了交錯(cuò)復(fù)雜的情況,其中雖然隱含了豐富的價(jià)值信息,但相關(guān)數(shù)據(jù)信息背后的邏輯特征卻無(wú)法擺脫模糊性的影響,導(dǎo)致在關(guān)鍵信息要素提取的過(guò)程中,對(duì)數(shù)據(jù)邏輯機(jī)理的挖掘工作帶來(lái)了一定的難度,難以保障此項(xiàng)工作的順利開(kāi)展。
2.結(jié)構(gòu)的變化
數(shù)據(jù)的類(lèi)型本身具有結(jié)構(gòu)化的特點(diǎn),而隨著大數(shù)據(jù)時(shí)代的深入發(fā)展,逐漸有結(jié)構(gòu)化的數(shù)據(jù)朝著半結(jié)構(gòu)與非結(jié)構(gòu)型的數(shù)據(jù)類(lèi)型進(jìn)行轉(zhuǎn)型,同時(shí)非結(jié)構(gòu)化的數(shù)據(jù)類(lèi)型在整體數(shù)據(jù)類(lèi)當(dāng)中占據(jù)了較大的比例。
(四)樣本選取與標(biāo)準(zhǔn)確定的難度較大
1.對(duì)非結(jié)構(gòu)數(shù)據(jù)的關(guān)注程度較低
樣本的數(shù)量逐漸呈現(xiàn)出了成倍增長(zhǎng)的趨勢(shì),同時(shí)還會(huì)在數(shù)據(jù)處理的過(guò)程中,受到“零散化”發(fā)展形式的阻礙。在長(zhǎng)期的統(tǒng)計(jì)學(xué)學(xué)科知識(shí)結(jié)構(gòu)的革新過(guò)程中,由于數(shù)據(jù)屬于結(jié)構(gòu)化的形式,而傳統(tǒng)學(xué)科的概念設(shè)置則是面對(duì)非結(jié)構(gòu)數(shù)據(jù),導(dǎo)致數(shù)據(jù)處理工作難以被有效落實(shí),同時(shí)也無(wú)法在大數(shù)據(jù)時(shí)代背景的影響下提取有效的數(shù)據(jù)信息。造成此類(lèi)現(xiàn)象的原因,主要是由于現(xiàn)階段對(duì)于非結(jié)構(gòu)數(shù)據(jù)的關(guān)注程度較低導(dǎo)致的。
2.樣本之間缺乏關(guān)聯(lián)性
樣本在統(tǒng)計(jì)學(xué)當(dāng)中具有重要作用,而樣本的統(tǒng)計(jì)主要與主體對(duì)象的特點(diǎn)和關(guān)系有關(guān),但在大數(shù)據(jù)時(shí)代的影響下,各個(gè)樣本之間的聯(lián)系逐漸被弱化,且關(guān)聯(lián)性不強(qiáng)。在一般情況下,統(tǒng)計(jì)學(xué)屬于樣本集合的概念,但在大數(shù)據(jù)時(shí)代的影響下,使數(shù)據(jù)的來(lái)源呈現(xiàn)出了多樣化的特點(diǎn),并通過(guò)對(duì)多種角度的論證,保障了統(tǒng)計(jì)數(shù)據(jù)的合理性,進(jìn)而對(duì)統(tǒng)計(jì)學(xué)相關(guān)內(nèi)容的研究工作提出了更高的要求。