蘇杭
摘要 在大數(shù)據(jù)時(shí)代下,海量數(shù)據(jù)處理對(duì)數(shù)據(jù)相關(guān)性分析有較高要求,需要應(yīng)用統(tǒng)計(jì)學(xué)的相關(guān)系數(shù)進(jìn)行量化描述。本文首先對(duì)相關(guān)系數(shù)的定義和性質(zhì)進(jìn)行介紹,在此基礎(chǔ)上,探討相關(guān)系數(shù)在大數(shù)據(jù)背景下的應(yīng)用,給出兩個(gè)常用公式,結(jié)合具體案例研究相關(guān)系數(shù)計(jì)算方法。
【關(guān)鍵詞】大數(shù)據(jù)背景 相關(guān)系數(shù) 常用公式計(jì)算方法
相關(guān)關(guān)系是指客觀事物之間存在的數(shù)量關(guān)系,在自然界中,各種事物和現(xiàn)象之間總是存在一定的聯(lián)系性,大數(shù)據(jù)時(shí)代的一個(gè)顯著特征是采用相關(guān)關(guān)系描述代替了以往數(shù)據(jù)關(guān)系分析中的因果關(guān)系描述。統(tǒng)計(jì)學(xué)中的相關(guān)系數(shù)就是對(duì)兩變量關(guān)聯(lián)性的量化描述,使其精煉為一個(gè)描述性數(shù)據(jù)。在大數(shù)據(jù)時(shí)代下,相關(guān)系數(shù)在數(shù)據(jù)分析過(guò)程中有重要應(yīng)用,應(yīng)積極研究其定義和計(jì)算方法,為實(shí)際應(yīng)用提供參考。
1 概率相關(guān)系數(shù)的定義和性質(zhì)
2.2 相關(guān)系數(shù)統(tǒng)計(jì)計(jì)算
在傳統(tǒng)統(tǒng)計(jì)計(jì)算方法中,搜集全部數(shù)據(jù)可行性較低,一般采取抽樣分析方法,按照一定策略在總體中進(jìn)行抽樣,計(jì)算其相關(guān)系數(shù),反映總體特征。比如以某城市的青少年身體成長(zhǎng)為研究對(duì)象,探討其體重與身高的相互關(guān)系,可以直接采用
(1)確定樣本規(guī)模,獲取樣本中每一位青少年的體重測(cè)量值和身高測(cè)量值;
(2)分別計(jì)算體重和身高的平均值、標(biāo)準(zhǔn)差:
(3)將樣本體重和身高測(cè)量值轉(zhuǎn)化為標(biāo)準(zhǔn)值;
(4)將體重標(biāo)準(zhǔn)值與身高標(biāo)準(zhǔn)值相乘,將每個(gè)樣本數(shù)據(jù)的乘積相加,最后除以樣本總?cè)藬?shù),得到相關(guān)系數(shù)。
2.3 相關(guān)系數(shù)大數(shù)據(jù)計(jì)算
在大數(shù)據(jù)技術(shù)的支持下,我們可以較為輕松的獲取研究對(duì)象的全部數(shù)據(jù),且實(shí)現(xiàn)對(duì)動(dòng)態(tài)數(shù)據(jù)的采集和分析,根據(jù)兩個(gè)變量之間的相互關(guān)系,分析事物在未來(lái)一段時(shí)間內(nèi)的變化趨勢(shì)。因此,傳統(tǒng)相關(guān)性計(jì)算只是對(duì)以往數(shù)據(jù)的相互關(guān)系進(jìn)行檢驗(yàn),而大數(shù)據(jù)技術(shù)下的相關(guān)性計(jì)算則能夠反映出數(shù)據(jù)的未來(lái)變化趨勢(shì)。比如以企業(yè)單位成本和產(chǎn)量為研究對(duì)象,利用大數(shù)據(jù)技術(shù)搜集企業(yè)的全部單位成本和產(chǎn)量數(shù)據(jù),相關(guān)系數(shù)計(jì)算步驟為:
(1)分別計(jì)算單位成本與產(chǎn)量的平方,并計(jì)算單位成本與產(chǎn)量的乘積;
(2)分別求出單位成本之和、產(chǎn)量之和、兩者各自平方的和以及單位成本與產(chǎn)量乘積之和:
3 結(jié)束語(yǔ)
綜上所述,在大數(shù)據(jù)時(shí)代下,捕獲研究對(duì)象的全部數(shù)據(jù)成為一種可能,在此情況下利用統(tǒng)計(jì)學(xué)中的相關(guān)系數(shù)計(jì)算公式計(jì)算數(shù)據(jù)變量之間的相關(guān)系數(shù),可以科學(xué)評(píng)判數(shù)據(jù)變量之間的相關(guān)性,全面反映數(shù)據(jù)隱藏特征,并預(yù)測(cè)數(shù)據(jù)的未來(lái)發(fā)展趨勢(shì),為管理決策提供科學(xué)依據(jù)。
參考文獻(xiàn)
[1]姜詠梅,倪中華,基于大數(shù)據(jù)背景的相關(guān)系數(shù)研究[J].商丘職業(yè)技術(shù)學(xué)院學(xué)報(bào),2017,16 (05):68-71.
[2]魏新來(lái).大數(shù)據(jù)背景下居住用地價(jià)格驅(qū)動(dòng)力分析
以蘇州工業(yè)園區(qū)為例[A].中國(guó)科學(xué)技術(shù)協(xié)會(huì)、廣東省人民政府,2015:7.