• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      中國(guó)大數(shù)據(jù)與統(tǒng)計(jì)學(xué)發(fā)展的需求預(yù)測(cè)模型

      2017-03-30 00:07:24林揚(yáng)嘯
      現(xiàn)代經(jīng)濟(jì)信息 2017年1期
      關(guān)鍵詞:大數(shù)據(jù)統(tǒng)計(jì)學(xué)

      林揚(yáng)嘯

      摘要:大數(shù)據(jù)是21世紀(jì)的熱點(diǎn)話(huà)題之一,統(tǒng)計(jì)學(xué)是傳統(tǒng)的數(shù)據(jù)分析學(xué)科。利用百度指數(shù)提供的“用戶(hù)關(guān)注度”功能,本文選取2012年-2016年5年260周的百度周平均搜索指數(shù)為研究對(duì)象,以百度搜索指數(shù)來(lái)反映社會(huì)關(guān)注熱度,研究大數(shù)據(jù)與統(tǒng)計(jì)學(xué)關(guān)注熱度之間有無(wú)相關(guān)性,以及大數(shù)據(jù)搜索指數(shù)發(fā)展的趨勢(shì)變化。根據(jù)圖形分析與相關(guān)系數(shù)的計(jì)算,可知大數(shù)據(jù)與統(tǒng)計(jì)學(xué)搜索熱度呈現(xiàn)正相關(guān)關(guān)系,該關(guān)系線(xiàn)性程度不大,多為非線(xiàn)性關(guān)系。根據(jù)大數(shù)據(jù)的季平均搜索指數(shù)、每四周平均搜索指數(shù)的變化趨勢(shì)研究表明,大數(shù)據(jù)搜索指數(shù)不存在明顯季節(jié)性,存在明顯的正趨勢(shì)性;其搜索熱度自2012年初至2015年2季度以來(lái)呈明顯上升趨勢(shì),其后增長(zhǎng)速率放緩,呈現(xiàn)更為顯著的波動(dòng)性,由此可知2015年2季度為其明顯的一個(gè)轉(zhuǎn)折點(diǎn),符合其發(fā)展趨勢(shì)的模型有修正指數(shù)模型,以及龔珀茲曲線(xiàn)模型和皮爾曲線(xiàn)模型這兩個(gè)生長(zhǎng)曲線(xiàn)模型,結(jié)果顯示三個(gè)模型的擬合度均較理想,其中龔珀茲曲線(xiàn)的擬合度最高。根據(jù)擬合結(jié)果,從大數(shù)據(jù)搜索指數(shù)反映的社會(huì)關(guān)注熱度來(lái)看,大數(shù)據(jù)搜索指數(shù)的發(fā)展已趨于飽和趨勢(shì),其飽和值為4300左右。

      關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);百度指數(shù);趨勢(shì)外推

      中圖分類(lèi)號(hào):F27 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2017)001-0000-02

      引言

      現(xiàn)代社會(huì),數(shù)據(jù)量呈爆炸式增長(zhǎng)趨勢(shì),數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。2012年以來(lái),大數(shù)據(jù)一詞越來(lái)越多地被提及,人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。而統(tǒng)計(jì)學(xué)作為傳統(tǒng)的數(shù)據(jù)分析方法,在擁有海量數(shù)據(jù)的現(xiàn)代社會(huì)既有著巨大的機(jī)遇,但由于大數(shù)據(jù)突破了傳統(tǒng)統(tǒng)計(jì)學(xué)關(guān)于樣本和總體界定等等限制,也對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)的分析方法提出了前所未有的沖擊和挑戰(zhàn)。在現(xiàn)實(shí)生活中,并沒(méi)有一門(mén)基于大數(shù)據(jù)的專(zhuān)業(yè)產(chǎn)生,各大企業(yè)往往通過(guò)招收統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、數(shù)學(xué)等相關(guān)專(zhuān)業(yè)的人才來(lái)滿(mǎn)足其大數(shù)據(jù)分析工作的要求,盡管如此,關(guān)于大數(shù)據(jù)的熱門(mén)是否捧熱了統(tǒng)計(jì)學(xué)之類(lèi)的相關(guān)學(xué)科的說(shuō)法一直眾說(shuō)紛紜;此外經(jīng)過(guò)了幾年的對(duì)大數(shù)據(jù)關(guān)注的大熱,市場(chǎng)逐漸對(duì)其回歸理性,甚至出現(xiàn)了“大數(shù)據(jù)泡沫”這樣的質(zhì)疑聲音。本文借助百度搜索指數(shù),對(duì)2012年-2015年每一周大數(shù)據(jù)、統(tǒng)計(jì)學(xué)兩詞條的反映其關(guān)注熱度的搜索指數(shù)進(jìn)行定性、定量分析,實(shí)現(xiàn)以下目的:

      觀察從百度搜索指數(shù)中反映出的人們對(duì)于大數(shù)據(jù)、統(tǒng)計(jì)學(xué)度的變化趨勢(shì),了解在人們關(guān)注度方面二者有無(wú)相關(guān)性、有怎樣的相關(guān)性,即大數(shù)據(jù)的大熱有沒(méi)有帶來(lái)統(tǒng)計(jì)學(xué)關(guān)注度的變化。

      通過(guò)建立統(tǒng)計(jì)模型,觀察大數(shù)據(jù)關(guān)注熱度5年來(lái)的變化,了解現(xiàn)實(shí)中其在關(guān)注度發(fā)展過(guò)程中所處的階段,即現(xiàn)實(shí)中對(duì)大數(shù)據(jù)的關(guān)注依然處于上升階段還是已經(jīng)趨于飽和。采用定量、定性結(jié)合的分析方法,將統(tǒng)計(jì)學(xué)和大數(shù)據(jù)的搜索指數(shù)時(shí)間序列作線(xiàn)圖,并計(jì)算線(xiàn)性相關(guān)系數(shù),觀察兩者的變化規(guī)律,并計(jì)算兩者有無(wú)線(xiàn)性相關(guān)關(guān)系。為滿(mǎn)足消除隨機(jī)性波動(dòng)和保留足夠數(shù)據(jù)量的需要,分別計(jì)算大數(shù)據(jù)搜索指數(shù)的每四周、每季度加權(quán)平均值。觀察圖形有無(wú)季節(jié)性、周期性波動(dòng);觀察圖形是否存在轉(zhuǎn)折點(diǎn),以此為基礎(chǔ)選擇統(tǒng)計(jì)模型。根據(jù)圖形識(shí)別的結(jié)果,建立可能的統(tǒng)計(jì)模型,并通過(guò)比較R方值的方法來(lái)選擇適當(dāng)?shù)哪P汀?/p>

      一、中國(guó)統(tǒng)計(jì)學(xué)發(fā)展與大數(shù)據(jù)發(fā)展的相關(guān)性分析

      用橫坐標(biāo)表示周次,縱坐標(biāo)表示搜索指數(shù),將大數(shù)據(jù)和統(tǒng)計(jì)學(xué)的搜索指數(shù)時(shí)間序列在一個(gè)圖中分別做折線(xiàn)圖,從圖像中可以看出,57周以前,統(tǒng)計(jì)學(xué)的搜索熱度大于大數(shù)據(jù)的搜索熱度,57周以后,大數(shù)據(jù)搜索熱度逐漸超過(guò)統(tǒng)計(jì)學(xué)搜索熱度。90周之后,大數(shù)據(jù)和統(tǒng)計(jì)學(xué)的變動(dòng)趨勢(shì)呈現(xiàn)一定的相似性,例如都在214周時(shí)達(dá)到谷值,而后回升。在178周大數(shù)據(jù)搜索達(dá)到峰值,182周統(tǒng)計(jì)學(xué)搜索量達(dá)到峰值,在此期間統(tǒng)計(jì)學(xué)的增長(zhǎng)略落后于大數(shù)據(jù)的增長(zhǎng),但是分布的形狀大體一致。

      2.季平均值線(xiàn)性相關(guān)系數(shù)=0.292112357

      結(jié)果分析:兩組數(shù)據(jù)的線(xiàn)性相關(guān)程度都不高,其中季平均線(xiàn)性相關(guān)系數(shù)略高于周平均線(xiàn)性相關(guān)系數(shù)。說(shuō)明大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的搜索指數(shù)之間并不存在明顯的線(xiàn)性相關(guān)關(guān)系,但是從圖中看出二者變化趨勢(shì)具有相似性,因此猜測(cè)二者可能具有某種非線(xiàn)性相關(guān)關(guān)系。

      因?yàn)橄嚓P(guān)關(guān)系并不等于因果關(guān)系,因此對(duì)于如上結(jié)果我們做出兩種假設(shè):

      在90周以后,統(tǒng)計(jì)學(xué)的分布類(lèi)似并且略落后于大數(shù)據(jù)的增長(zhǎng),這可能是由于人們對(duì)于大數(shù)據(jù)的關(guān)注,引發(fā)了人們對(duì)于統(tǒng)計(jì)學(xué)這個(gè)相關(guān)學(xué)科的關(guān)注。

      兩者類(lèi)似的分布形態(tài),可能是由于全國(guó)所有用戶(hù)搜索頻次的周期性、隨機(jī)性變動(dòng)所引致的,大數(shù)據(jù)、統(tǒng)計(jì)學(xué)搜索指數(shù)變動(dòng)之間并沒(méi)有直接的因果關(guān)系。

      二、中國(guó)大數(shù)據(jù)需求量預(yù)測(cè)模型

      由于原始數(shù)據(jù)有260周,波動(dòng)性過(guò)大,為了得到更為準(zhǔn)確的結(jié)論,我們僅對(duì)其按每季度、每四周兩種方式計(jì)算加權(quán)平均值得到的時(shí)間序列作討論,其目的是(1)平滑隨機(jī)波動(dòng);(2)判定按每季度和每四周平均哪個(gè)有季節(jié)性;(3)每季度平均更能反映長(zhǎng)期趨勢(shì),但數(shù)據(jù)較少,只能以季為單位預(yù)測(cè)未來(lái)值;每四周平均的數(shù)據(jù)較多,且可以進(jìn)行更短期的預(yù)測(cè)。

      1.季節(jié)性、趨勢(shì)性的判定

      (a)圖形判別法

      建立按季平均和按每四周平均的橫坐標(biāo)為季度或周次,縱坐標(biāo)為搜索指數(shù)的折線(xiàn)圖,按季節(jié)平均、按每四周平均,大數(shù)據(jù)搜索指數(shù)都不存在明顯的季節(jié)性;另外由于后一年的值往往大于前一年的值,因此可以判定其存在趨勢(shì)性。

      (b)建立一元線(xiàn)性回歸方程并檢驗(yàn)顯著性

      季平均值:;

      每四周平均值:;

      由于兩個(gè)時(shí)間序列一元線(xiàn)性回歸的R2均顯著,所以大數(shù)據(jù)搜索指數(shù)顯然存在線(xiàn)性趨勢(shì)。

      結(jié)論:上述過(guò)程從圖形和計(jì)算兩個(gè)角度得出了以下結(jié)論:大數(shù)據(jù)搜索指數(shù)并不存在明顯的季節(jié)性,不適合使用時(shí)間序列分解法;大數(shù)據(jù)搜索指數(shù)存在明顯的趨勢(shì),一元回歸有較好的擬合優(yōu)度,但是一元回歸使用的前提是時(shí)間序列不存在明顯的轉(zhuǎn)折點(diǎn),為了進(jìn)一步確定更好的擬合模型,我們繼續(xù)如下討論。

      2.轉(zhuǎn)折點(diǎn)的判定

      作橫坐標(biāo)為季度,縱坐標(biāo)為搜索指數(shù)的折線(xiàn)圖,可以看出,2015年2季度為一個(gè)明顯的轉(zhuǎn)折點(diǎn),在這之前,類(lèi)似于線(xiàn)性一元增長(zhǎng);在之后,2015年3季度僅為3989,2015年4季度僅為4015,并無(wú)太大增長(zhǎng),此后呈現(xiàn)下降上升交替出現(xiàn)的形式。

      3.模型選擇結(jié)論

      因?yàn)椴淮嬖谠诿黠@的季節(jié)性,所以不選擇時(shí)間序列分解模型;又因?yàn)橛忻黠@的轉(zhuǎn)折點(diǎn),所以不應(yīng)對(duì)所有數(shù)據(jù)采取一元回歸的方式;搜索指數(shù)的變化類(lèi)似于先增長(zhǎng)后穩(wěn)定,符合上述條件的模型有:

      (1)修正指數(shù)模型;(2)龔珀茲曲線(xiàn)模型;(3)皮爾曲線(xiàn)模型。

      4.模型的建立

      基于matlab軟件,模型擬合結(jié)果如下:

      (1)修正指數(shù)模型:

      特點(diǎn):該模型00時(shí),以增長(zhǎng)速度遞減的方式遞減。t趨于無(wú)窮大時(shí)a為其極限。

      (a)每季平均值:。保留兩位小數(shù)后得到如下預(yù)測(cè)函數(shù):

      當(dāng)t趨于無(wú)窮大時(shí),搜索指數(shù)趨近于6389.78。

      (b)每四周平均值:。保留兩位小數(shù)后得到如下預(yù)測(cè)函數(shù):

      當(dāng)t趨于無(wú)窮大時(shí),搜索指數(shù)趨近于6650.56。

      每期預(yù)測(cè)值原始數(shù)據(jù)見(jiàn)附表4。

      (2)龔珀茲曲線(xiàn)模型:

      特點(diǎn):屬于生長(zhǎng)曲線(xiàn)模型,形狀類(lèi)似于S形,可以描述并判斷事物經(jīng)歷的發(fā)生、發(fā)展到成熟的過(guò)程。

      (a)每季平均值

      5.模型比較

      每季平均R2值,修正指數(shù)曲線(xiàn)模型為0.9516,龔珀茲曲線(xiàn)模型為0.9582,皮爾曲線(xiàn)模型為0.9539;每四周平均R2值,三者分別為0.902、0.9075、0.9033。

      三個(gè)模型的R2均達(dá)到了顯著性水平,可知模型擬合度很高,其中按每季平均計(jì)算的擬合優(yōu)度,由于平滑了更多的隨機(jī)性因素,擬合度都大于按每四周平均計(jì)算的擬合優(yōu)度。龔珀茲曲線(xiàn)模型的R2值最高,其次是皮爾曲線(xiàn)模型,再次是修正指數(shù)曲線(xiàn)模型。

      結(jié)果分析:大數(shù)據(jù)搜索指數(shù)不存在季節(jié)性,但存在明顯的周期性。從2012年以來(lái),其搜索指數(shù)呈快速遞增趨勢(shì),2015年2季度左右以后,其增速放緩,逐漸呈現(xiàn)飽和趨勢(shì)。在飽和度的預(yù)測(cè)方面,修正指數(shù)t無(wú)窮大的條件難以實(shí)現(xiàn),我們主要根據(jù)后兩個(gè)模型進(jìn)行判定,得到了大數(shù)據(jù)搜索指數(shù)已經(jīng)趨于飽和,并且飽和值位于4200-4600左右的結(jié)論,即市場(chǎng)對(duì)于大數(shù)據(jù)搜索的熱度,已經(jīng)從狂熱趨于理性。

      參考文獻(xiàn):

      [1]耿直.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014,31(1):5-9.

      [2]云舟工作室.MATLAB6數(shù)學(xué)建?;A(chǔ)教程[M].北京:人民郵電出版社,2001.

      [3]曹挺.統(tǒng)計(jì)學(xué)是新世紀(jì)具有輝煌前景的學(xué)科[N].中國(guó)信息報(bào),2002.

      猜你喜歡
      大數(shù)據(jù)統(tǒng)計(jì)學(xué)
      關(guān)于投稿的統(tǒng)計(jì)學(xué)要求
      統(tǒng)計(jì)學(xué)符號(hào)使用的說(shuō)明
      統(tǒng)計(jì)學(xué)符號(hào)使用的說(shuō)明
      統(tǒng)計(jì)學(xué)符號(hào)使用的說(shuō)明
      本刊對(duì)來(lái)稿中統(tǒng)計(jì)學(xué)處理的有關(guān)要求
      本刊對(duì)來(lái)稿中統(tǒng)計(jì)學(xué)處理的有關(guān)要求
      大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶(hù)端的傳統(tǒng)媒體轉(zhuǎn)型思路
      新聞世界(2016年10期)2016-10-11 20:13:53
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      城固县| 延川县| 禹州市| 六枝特区| 新沂市| 潞西市| 同江市| 望都县| 宜黄县| 西乡县| 沧州市| 同德县| 祁阳县| 定远县| 兴城市| 新宾| 涪陵区| 枣庄市| 商洛市| 东乡| 黎平县| 枞阳县| 章丘市| 梅州市| 龙门县| 潢川县| 莱阳市| 博野县| 满城县| 公主岭市| 仪征市| 海淀区| 永康市| 红河县| 双辽市| 万盛区| 信丰县| 揭东县| 平武县| 萝北县| 大庆市|