• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于互聯(lián)網(wǎng)搜索指數(shù)的大宗商品農(nóng)產(chǎn)品價格指數(shù)預測

      2017-09-13 11:52:48周湘蕾
      時代金融 2017年23期
      關鍵詞:因子分析

      【摘要】本文利用因子模型思想構建互聯(lián)網(wǎng)搜索指數(shù),從與大宗農(nóng)產(chǎn)品價格相關的11類基準關鍵詞中篩選出共計17個關鍵詞構建搜索指數(shù),并分析其與大宗農(nóng)產(chǎn)品價格之間的關聯(lián)。實證結果表明:本文提出的互聯(lián)網(wǎng)搜索指數(shù)與實際大宗商品農(nóng)產(chǎn)品價格指數(shù)的相關性較高,其長期趨勢體現(xiàn)出較高的一致性,在短期也能擬合絕大部分拐點,能夠反映互聯(lián)網(wǎng)用戶主要是投資者對大宗農(nóng)產(chǎn)品市場動態(tài)變化的關注程度。

      【關鍵詞】互聯(lián)網(wǎng)搜索指數(shù) 大宗商品農(nóng)產(chǎn)品價格 因子分析

      一、引言

      隨著大數(shù)據(jù)時代的降臨,高效的信息檢索功能是搜索引擎成為網(wǎng)民獲取互聯(lián)網(wǎng)信息的重要入口。用戶信息搜索行為的群體表現(xiàn)在一定程度上體現(xiàn)了用戶心理形態(tài)和外部環(huán)境的變化,與實際經(jīng)濟行為具有較強的相關性,為經(jīng)濟預測提供了新的信息資源。故而相對于傳統(tǒng)的數(shù)據(jù)來源,諸如機構發(fā)布的統(tǒng)計數(shù)據(jù)及調察問卷數(shù)據(jù)等,從互聯(lián)網(wǎng)中甄選更具全面和代表性的能夠反應用戶關注的熱度、趨勢且具有較好預測能力的數(shù)據(jù),是對傳統(tǒng)數(shù)據(jù)來源數(shù)據(jù)的有效擴充,如何有效應用互聯(lián)網(wǎng)數(shù)據(jù)也是目前學術界和業(yè)界急需解決的問題。

      搜索引擎的廣泛使用,在滿足用戶信息需求的同時也記錄了用戶的搜索行為,從而使得基于互聯(lián)網(wǎng)的搜索數(shù)據(jù)中蘊含了用戶的關注及意圖,能夠映射用戶在現(xiàn)實生活中的行為趨勢和規(guī)律(Lynn Wu 2009)。基于網(wǎng)絡搜索數(shù)據(jù)的社會經(jīng)濟行為研究大多出現(xiàn)于2008年之后,研究的領域始于流行病監(jiān)測,發(fā)展至今日已逐漸成為一個新的學術熱點,并在宏觀經(jīng)濟指標、投資市場以及房地產(chǎn)價格等經(jīng)濟領域的研究中取得了一定成果。

      在經(jīng)濟領域中,搜索指數(shù)可用于消費行為、失業(yè)率、通貨膨脹等指標的預測。McLaren N證明了互聯(lián)網(wǎng)搜索指數(shù)可以用作的經(jīng)濟指標的編制,Guzman G 將搜索指數(shù)用于通貨膨脹的預測。Li X,Shang W,Wang應用MIDAS模型結合谷歌搜索數(shù)據(jù)編制了中國通貨膨脹的預測指數(shù)。

      在投資市場中,搜索指數(shù)可用于天然氣、原油價格以及房地產(chǎn)價格Li X,Ma J,Zhang X利用谷歌搜索數(shù)據(jù)研究了公眾注意力如何影響天然氣價格。李新和張珣運用廣義動態(tài)因子模型構建了可預測原油價格的搜索指數(shù),并使用生物信息學中因果分析方法對指數(shù)進行評價,證實了所構造的搜索指數(shù)與期貨價格和現(xiàn)貨價格均存在顯著的因果關系,并能準確探測原油價格的拐點。

      目前基于互聯(lián)網(wǎng)搜索的預測研究在實證領域取得了不小的成果,但仍需要不斷改進與完善,本文粗略提出三點:首先,在理論基礎方面,基于網(wǎng)絡搜索指數(shù)的研究存在一個基本的理論前提,即信息構造引起行為變化,行為變化導致現(xiàn)象產(chǎn)生。這種理論前提在不同領域的內在機理的作用過程及其普遍適用性有待討論;其次,在預測方法上,相關學者對于如何進行關鍵詞的選取、數(shù)據(jù)模型處理上都尚未達成共識,其中關于關鍵詞的選擇方法,主要分為兩類,其一以研究問題作為關鍵詞,以該研究方向的理論體系為基礎,選取關鍵變量進行分類和拓展,這種方法的優(yōu)越性在于所構建的指數(shù)能夠反映最相關信息,但由于主觀性較強且依賴于理論基礎的完備程度,故而存在著代表不完全且難以主動識別新變量的問題;其二,有部分學者提出將數(shù)據(jù)挖掘算法應用到關鍵詞選擇中,運用決策樹、文本挖掘、向量機等多種數(shù)據(jù)挖掘算法進行特征搜索的選擇,在實證中也取得了較好的效果,這類方法更具有客觀性和嚴謹性,但所選取的指標是否具有經(jīng)濟含義還需要大量的人工判斷,這也使這種方法變得十分繁瑣。最后,關于互聯(lián)網(wǎng)搜索指數(shù)的研究大多是針對國外市場進行的,該方法是否對中國情境下的研究問題有效尚無確定的結論。

      本文正是基于上述文獻的研究結果,從投資者行為視角建立了互聯(lián)網(wǎng)搜索行為與大宗農(nóng)產(chǎn)品價格之間的映射關系,如圖1所示,構建過程分為3步:

      第一,市場的重要信息的發(fā)布會影響投資者的心理預期,相反投資者也會通過主動搜索捕捉重要信息以輔助其進行投資決斷。

      第二,在新經(jīng)濟的背景下,互聯(lián)網(wǎng)成為投資者獲取大宗商品市場變動信息的最佳途徑,投資者可以通過互聯(lián)網(wǎng)的搜索、瀏覽及論壇等應用獲取新信息,其中搜索引擎作為互聯(lián)網(wǎng)的入口,蘊含了無數(shù)投資者對影響農(nóng)產(chǎn)品價格的關注。投資者對農(nóng)產(chǎn)品價格信息的采集可能主要集中于宏觀形勢、金融市場、行業(yè)特征以及突發(fā)事件等方面。

      第三,在有效資本市場理論中,新信息是影響股票市場變動的唯一因素,期貨市場作為衍生品市場,其變動在市場充分有效的情形下也可以看作是新信息所引致的,因此及時準確的捕捉最有效信息對期貨市場、現(xiàn)貨市場的投資者而言至關重要。

      二、實證分析

      本文利用搜索關鍵詞數(shù)據(jù)對大宗商品農(nóng)產(chǎn)品進行預測。農(nóng)產(chǎn)品價格選取由中國流通產(chǎn)業(yè)網(wǎng)發(fā)布的大宗商品價格指數(shù)(CCPI)中的農(nóng)產(chǎn)品價格指數(shù)來衡量,時間跨度為2011年1月至2016年5月。由于所預測的是國內大宗商品價格的變動,故而搜索行為的觀察數(shù)據(jù)來源于國內所有使用度最高的百度搜索引擎所提供的數(shù)據(jù),百度指數(shù)與前述眾多文獻中使用的谷歌指數(shù)類似,所提供的搜索量數(shù)據(jù)是一個相對數(shù)據(jù),而非絕對搜索量,代表的是在某段時期內,某個特定關鍵詞的被關注程度和熱門程度。本文采集數(shù)據(jù)所使用的軟件可以抓取百度指數(shù)上每個關鍵詞從2011年1月1日至今的用戶關注度的天數(shù)據(jù)。用戶關注度是以數(shù)千萬網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎,以關鍵詞為統(tǒng)計對象,科學分析并計算出各個關鍵詞在百度網(wǎng)頁搜索中搜索頻次的加權和,并以曲線圖的形式展現(xiàn)可以反映與該關鍵詞相對應的某類事物的熱門程度和被關注程度該數(shù)據(jù)是絕對值的形式,故已有的數(shù)據(jù)不會隨著時間的推移而變化。

      (一)初始搜索關鍵詞集合

      為了獲取盡可能相關、完整的關鍵詞,根據(jù)上文中的理論框架,將關鍵詞分為宏觀形勢、金融市場、行業(yè)特征以及突發(fā)事件四類,據(jù)此獲取基準搜索關鍵詞集合。其中,宏觀形勢因素的基準關鍵詞為匯率、利率、通貨膨脹、貨幣供應、原油價格;金融市場因素的基準關鍵詞為農(nóng)產(chǎn)品期貨、農(nóng)產(chǎn)品現(xiàn)貨;行業(yè)特征因素的基準關鍵詞為農(nóng)業(yè)產(chǎn)業(yè)化、農(nóng)業(yè)機械、農(nóng)業(yè)技術;突發(fā)事件因素的基準關鍵詞為自然災害。endprint

      然后利用搜索引擎的關鍵詞推薦功能,產(chǎn)生這11個基準關鍵詞的所有相關搜索詞,每個類別50個,進而得到550個百度所能提供的搜索詞。通過對每一類別的關鍵詞進行初步文本分析,篩選出57個有效關鍵詞。

      (二)數(shù)據(jù)收集及預處理

      對這57個搜索數(shù)據(jù)進行Pearson相關性檢驗,選取了通過雙邊0.01顯著性檢驗的關鍵詞序列,以保證進入模型的每個關鍵詞與大宗商品農(nóng)產(chǎn)品指數(shù)之間的相關性。對剩余數(shù)據(jù)進行平穩(wěn)性分析,選取通過平穩(wěn)性檢驗的序列用以形成最終關鍵詞集合,相關檢驗結果如表1所示。

      表1 最終關鍵詞集合及檢驗結果

      (三)搜索指數(shù)的合成

      因為本文旨在研究基于因子分析模型構建的搜索指數(shù)與大宗商品農(nóng)產(chǎn)品價格之間的關聯(lián),所以首先我們根據(jù)關鍵詞數(shù)據(jù)和因子分析原理構建搜索指數(shù),然后分析搜索指數(shù)與農(nóng)產(chǎn)品價格之間的匹配關系。在對數(shù)據(jù)進行標準化處理后,對變量之間的相關性進行KMO檢驗,得KMO值為0.732,此外Bartlett球形檢驗值為0.000,表示數(shù)據(jù)之間具有一定的相關性,適合做主成分—因子分析。本文采用因子貢獻率標準選取公共因子,一般來講,因子對總體的解釋程度達到80%左右為宜,因此,本文選取特征大于1的5個公共因子和特征值為0.874的1個公共因子,累計對總體的解釋程度達到79.389%。本文采用常用的最大方差法旋轉因子載荷矩陣,旋轉后的因子載荷矩陣可得每個因子的因素表達式:

      C1=-0.832X1-0.625X2+0.684X3+0.500X4-0.127X5

      -0.891X6+0.169X7+0.872X8-0.401X9+0.026X10

      +0.094X11+0.242X12-0.026X13-0.205X14+0.083X15

      -0.030X16+0.908X17

      同理可得C2~C6因子的表達式。

      根據(jù)主成分對總體的解釋程度可得總體的各因子表達式:

      Y=0.28017C1+0.20585C2+0.11227C3+0.08352C4+0.06067C6

      將C1~C6的表達式代入上式即可得個影響因素的權重,對各權重進行歸一化處理,得到各指標對總體的綜合評價權重,再將初始數(shù)據(jù)帶入可得綜合指標的序列,這樣的方法提取出了總體輸入數(shù)據(jù)的共同成分,驅使各個不同關鍵詞序列去世的共同成分即他們的共性——大宗商品農(nóng)產(chǎn)品的價格,由此我們使用綜合評價Y序列作為搜索指數(shù),圖1為合成的搜索指數(shù)與大宗商品農(nóng)產(chǎn)品價格指數(shù)(ccpi)的兩個序列趨勢信息。

      如圖1(橫軸為自2011年1月1日起累計周數(shù),縱軸為價格指數(shù),系列1為大宗商品農(nóng)產(chǎn)品價格趨勢,系列2為搜索指數(shù)變動趨勢)所示,兩個變量間的走勢表現(xiàn)出較強的一致性。在圖1中45周~62周的上行區(qū)間、117周~187周的平穩(wěn)震蕩區(qū)間以及23周~262周的下行區(qū)間內,本文構建的搜索指數(shù)與實際農(nóng)產(chǎn)品價格指數(shù)走勢均呈現(xiàn)出較強的一致性。

      為了突出短期的變化相關性,圖2截取了2016年1月1日至2016年5月27日的價格指數(shù)和搜索指數(shù)對比圖,在2016年前5周,兩個指數(shù)都呈現(xiàn)出變動較為平緩的態(tài)勢,在第8周和第17周,兩個指數(shù)同時達到一個小峰值從圖中可以看出搜索指數(shù)能夠預測出大部分大宗商品價格走勢的拐點,說明了搜索指數(shù)內包含了能夠極大程度的反映搜索關鍵詞之間的共性信息,同時表明了關鍵詞關注度指數(shù)可以幫助提高大宗商品農(nóng)產(chǎn)品的預測水平。

      三、小結

      大宗商品農(nóng)產(chǎn)品價格一直都是投資者關注的重點之一,但由于影響因素龐雜,經(jīng)濟影響因素的滯后性等原因,使農(nóng)產(chǎn)品的價格預測結果總是不盡人意,國內外研究者一直都在積極尋求更加準確地預測方法。近年來,隨著互聯(lián)網(wǎng)技術及大規(guī)模數(shù)據(jù)分析方法的發(fā)展,海量搜索數(shù)據(jù)及社交媒體數(shù)據(jù)等逐漸在社會、經(jīng)濟、金融和能源預測中得到廣泛應用,這也為大宗商品農(nóng)產(chǎn)品價格的預測提供了新的思路。本文也在此種背景下針對網(wǎng)絡搜索數(shù)據(jù)是否能提高農(nóng)產(chǎn)品價格預測的準確性和時效性進行了討論。由于目前對于搜索指數(shù)的合成方法還沒有一個公認的方法,本文在經(jīng)過大量模型的嘗試之后選擇使用因子分析方法的思想構建互聯(lián)網(wǎng)搜索指數(shù),為了解決了大量搜索數(shù)據(jù)之間的多重共線性問題,我們從與大宗農(nóng)產(chǎn)品價格相關的11類基準關鍵詞中篩選出共計17個關鍵詞,合成旨在預測農(nóng)產(chǎn)品價格的互聯(lián)網(wǎng)搜索指數(shù),并分別在長期和短期驗證該合成指數(shù)的預測效果。檢驗結果顯示,本文提出的互聯(lián)網(wǎng)搜索指數(shù),與實際大宗商品農(nóng)產(chǎn)品價格指數(shù)的相關性較高,其長期趨勢體現(xiàn)出較高的一致性,在短期也能擬合絕大部分拐點,能夠反映互聯(lián)網(wǎng)用戶主要是投資者對大宗農(nóng)產(chǎn)品市場動態(tài)變化的關注程度,提高農(nóng)產(chǎn)品價格的預測精確度。

      需要指出的是,由于互聯(lián)網(wǎng)大數(shù)據(jù)的應用在經(jīng)濟學領域的研究還處于一個初步的探索階段,故還有許多問題需要進一步研究, 如關鍵詞的關注度與投資者的投資決策之間的關系,關鍵詞關注度對農(nóng)產(chǎn)品價格的影響方向以及關鍵詞的選擇等將是下一步研究的重點。

      參考文獻

      [1]Ginsberg J,Mohebbi M H,Patel R S,et al.Detecting influenza eqidemics using search engine query data[J].Nature,2009,457(7232):1012-1014.

      [2]李秀婷,劉凡,董紀昌,等.基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的中國流感檢測[J].系統(tǒng)工程理論與實踐,2013,33(12):3028-3034.

      [3]Guzman G.Internet and Social behavior as an economic forecasting tool:The case of inflation expectations[J].Journal of Economic and Social Measurement,2011,36(3):119-167.

      [4]Goel S,Hofman J M,Lahaie S,et al.Predicting consumer behavior with Web search[C].Proceedings of the National Academy of Sciences,2010,107(41):17486-17490.

      [5]Li X,Shang W,Wang S,et al.A MIDAS modeling framework for Chinese inflation index forecast incorporating Google search data[J].Electronic Commerce Research and Applications,2015,14(2):112-125.

      [6]Li Z,Xu W,Zhang L,et al.An ontology-based Web mining method for unemployment rate prediction[J].Decision Support Systems 2014,66(10):114-122.

      [7]Askitas N,Zimmermann K F.Google econometrics and unemployment forecasting[J].Applied Economics Quarterly,2009,55(2):107-120.

      [8]孫毅,呂本富.網(wǎng)絡搜索與經(jīng)濟行為相關性研究綜述[J].管理評論,2011,23(7):72-77.

      [9]楊欣,呂本富,彭賡,劉穎.基于網(wǎng)絡搜索數(shù)據(jù)的突發(fā)事件對股票市場影響分析[J].數(shù)學的實踐與認識,2013,43(23):17-28.

      [10]蘇應蓉.全球農(nóng)產(chǎn)品價格波動中金融化因素探析[J].農(nóng)業(yè)經(jīng)濟問題,2011,6.

      作者簡介:周湘蕾(1994-),女,漢族,廣西大學商學院在讀研究生,研究方向:數(shù)量經(jīng)濟學理論與方法。endprint

      猜你喜歡
      因子分析
      基于GPS數(shù)據(jù)的旅游時空行為評價研究
      旅游學刊(2016年9期)2016-12-06 19:38:33
      中國創(chuàng)業(yè)板生物制藥類上市公司成長性評價體系實證研究
      中國各地區(qū)主要空氣污染物結構的因子分析
      我國31省城鎮(zhèn)居民消費水平(2007)
      基于因子分析法的二胎概念股投資價值分析
      中國市場(2016年38期)2016-11-15 23:35:01
      基于主導產(chǎn)業(yè)視角的戰(zhàn)略性新興產(chǎn)業(yè)識別以及實證研究
      基于省會城市經(jīng)濟發(fā)展程度的實證分析
      中國市場(2016年33期)2016-10-18 12:16:58
      山東省縣域經(jīng)濟發(fā)展評價研究
      商(2016年27期)2016-10-17 07:17:42
      實證分析會計信息對股價的影響
      商(2016年27期)2016-10-17 05:39:59
      京津冀一體化下物流網(wǎng)絡節(jié)點城市選址規(guī)劃
      化州市| 宁安市| 磴口县| 怀集县| 安康市| 松阳县| 驻马店市| 老河口市| 亳州市| 读书| 嘉义市| 松阳县| 聊城市| 邳州市| 余庆县| 永修县| 贵阳市| 肥乡县| 神池县| 大安市| 磐安县| 敦煌市| 绿春县| 偃师市| 英吉沙县| 隆德县| 舒城县| 平远县| 锦州市| 永康市| 綦江县| 寿宁县| 竹山县| 当雄县| 社会| 海口市| 罗定市| 太白县| 涞水县| 九江县| 疏附县|