邵小彧,李冬梅,劉云強(qiáng)
(四川農(nóng)業(yè)大學(xué)管理學(xué)院,成都 611130)
新型冠狀病毒感染的肺炎疫情自爆發(fā)以來,對人民群眾的生命安全造成了重大威脅,對國民經(jīng)濟(jì)特別是消費(fèi)領(lǐng)域、服務(wù)業(yè)領(lǐng)域造成了巨大沖擊[1]。值得關(guān)注的是,與人民生活息息相關(guān)的農(nóng)產(chǎn)品價(jià)格波動明顯。2020年3月16日國務(wù)院新聞辦公室舉行的1—2月國民經(jīng)濟(jì)運(yùn)行情況發(fā)布會中指出,受新冠肺炎疫情影響,糧食價(jià)格上漲0.6%,鮮菜上漲13.8%,豬肉上漲125.6%,鮮果下降5.3%。疫情期間,全國主要農(nóng)產(chǎn)品供給充足,但由于各地實(shí)行進(jìn)出管控,恐慌情緒導(dǎo)致居民開始瘋狂搶購,需求激增使得農(nóng)產(chǎn)品供需失衡,價(jià)格產(chǎn)生波動[2]。因此,研究新冠肺炎疫情對農(nóng)產(chǎn)品價(jià)格波動的影響,對于把握當(dāng)前農(nóng)產(chǎn)品價(jià)格局勢,預(yù)測未來變化具有重大意義。
現(xiàn)有研究主要從供求視角、產(chǎn)業(yè)鏈視角[3-4]研究農(nóng)產(chǎn)品價(jià)格的波動情況。國際原油價(jià)格[5-7],國際農(nóng)產(chǎn)品價(jià)格[8],農(nóng)業(yè)生產(chǎn)成本[9],期貨市場[10],貨幣政策調(diào)整帶來的貨幣供應(yīng)量變動、通貨膨脹[11-12]等因素均會對農(nóng)產(chǎn)品價(jià)格的波動產(chǎn)生影響。也有少量研究關(guān)注突發(fā)事件帶來的信息沖擊對農(nóng)產(chǎn)品價(jià)格波動產(chǎn)生的作用[13-14]。新冠肺炎疫情期間,具有易用性、及時(shí)性和公開性的新浪微博成為公眾獲取信息和發(fā)表觀點(diǎn)的重要平臺[15-16]。因此本研究旨在運(yùn)用文本挖掘技術(shù),發(fā)掘微博平臺上公眾討論的主題及其情感傾向,進(jìn)一步研究其對農(nóng)產(chǎn)品價(jià)格的影響。
社交媒體文本挖掘已經(jīng)在突發(fā)公共衛(wèi)生事件研究領(lǐng)域有所應(yīng)用[17]。A.J.Lazard等對埃博拉期間相關(guān)推特進(jìn)行收集、分類和分析,發(fā)現(xiàn)公眾關(guān)心的內(nèi)容包括病毒的癥狀和壽命、疾病的傳染和發(fā)生、出行安全以及個(gè)人防護(hù)[18];E.M.Glowacki等對萊卡病毒傳播期間公眾的推特以及疾病控制和預(yù)防中心(CDC)的回應(yīng)進(jìn)行分析,結(jié)果表明公眾和疾控中心都十分關(guān)注寨卡病毒的傳播,但公眾更關(guān)注的是它對孕婦和新生兒的影響,而疾控中心更關(guān)注的是病毒的癥狀和防控知識普及[19]。此外,社交媒體的文本挖掘還在企業(yè)管理中起到重要作用,具體說來,其被應(yīng)用于品牌管理[20]、網(wǎng)絡(luò)營銷[21]等方面。在政治方面,社交媒體的文本挖掘常常用來分析、預(yù)測選舉結(jié)果[22-25]。以上社交媒體的文本挖掘主要集中在提煉用戶討論主題,研究情感方向。在社交媒體文本挖掘的應(yīng)用中,還有一類不容忽視,那就是進(jìn)行股市預(yù)測[26-28]。這些研究采用VAR模型、Granger因果關(guān)系檢驗(yàn)等方法研究情緒與股票指數(shù)收益率等指標(biāo)的關(guān)系,預(yù)測股票市場價(jià)格變化[29-35]。
綜上所述,社交媒體的文本挖掘在突發(fā)公共衛(wèi)生事件領(lǐng)域的主要應(yīng)用是發(fā)掘用戶的討論主題,了解民眾訴求,從而及時(shí)采取有效的相應(yīng)措施。然而,這些研究主要是從定性的角度進(jìn)行分析,缺少定量研究。除此之外,文本挖掘還包括意見挖掘,即情感分析。通過情感分析可以對文本進(jìn)行情感打分,從而把非結(jié)構(gòu)化的文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。受投資者情緒對股票市場的預(yù)測分析的啟發(fā),本研究聚焦于疫情期間公眾情緒對農(nóng)產(chǎn)品價(jià)格的影響,研究思路如下:在生命周期理論的基礎(chǔ)上將新冠肺炎疫情發(fā)展劃分為4個(gè)階段,運(yùn)用文本挖掘技術(shù)獲取微博數(shù)據(jù),提煉出各個(gè)階段的討論主題,進(jìn)一步運(yùn)用情感分析方法對每條微博進(jìn)行情感打分,按天歸類展示公眾的情感變化。在此基礎(chǔ)上,運(yùn)用VAR模型和格蘭杰因果關(guān)系檢驗(yàn)驗(yàn)證新冠肺炎期間情感傾向與不同競爭屬性農(nóng)產(chǎn)品(包括畜產(chǎn)品、水產(chǎn)品、蔬菜、水果)價(jià)格波動之間的關(guān)系,為制定疫情期間農(nóng)產(chǎn)品價(jià)格調(diào)控政策,保障人民生活和農(nóng)產(chǎn)品市場有序運(yùn)作提供可供參考的理論解釋。
為研究新冠肺炎期間公眾情感與農(nóng)產(chǎn)品價(jià)格波動的關(guān)系,首先,通過網(wǎng)絡(luò)爬蟲獲取微博數(shù)據(jù),并對獲得的文本數(shù)據(jù)進(jìn)行預(yù)處理。隨后一方面將處理后的數(shù)據(jù)按照疫情發(fā)展劃分為4個(gè)階段,通過LDA模型分析各個(gè)階段公眾討論的主題[36];另一方面對每條數(shù)據(jù)進(jìn)行情感分析[37],并按天歸類計(jì)算均值與各類情感傾向微博數(shù)量,形成公眾情感時(shí)間序列。農(nóng)產(chǎn)品批發(fā)市場積聚大量交易信息,是農(nóng)產(chǎn)品價(jià)格形成的主要平臺,能夠相對真實(shí)地反映農(nóng)產(chǎn)品的商品價(jià)值和市場供需規(guī)律[14]。因此,本文整理農(nóng)產(chǎn)品批發(fā)市場價(jià)格形成農(nóng)產(chǎn)品價(jià)格時(shí)間序列,將情感時(shí)間序列和農(nóng)產(chǎn)品價(jià)格時(shí)間序列都構(gòu)建VAR模型,進(jìn)行格蘭杰因果關(guān)系檢驗(yàn)得出結(jié)論[38]。研究框架如圖1所示。
圖1 新冠肺炎疫情與農(nóng)產(chǎn)品價(jià)格波動研究框架Figure 1 Framework for research on COVID-19 and agricultural price volatility
1.2.1 公眾情緒變化與農(nóng)產(chǎn)品價(jià)格波動的關(guān)系
根據(jù)均衡價(jià)格理論,在未受到外部沖擊的情況下,農(nóng)產(chǎn)品的市場價(jià)格會在供給和需求的相互作用下趨于均衡[39]。而已有研究表明突發(fā)事件等特殊情況帶來的信息沖擊會導(dǎo)致農(nóng)產(chǎn)品價(jià)格變化[13-14]。情感具有動態(tài)性,網(wǎng)民的情感波動往往和突發(fā)事件的走向緊密相關(guān)[40]。疫情期間公眾受到有關(guān)地區(qū)封城、交通管制等消息的影響,情緒隨疫情形勢波動劇烈,在恐慌心理下出現(xiàn)非理性囤積生活物資的行為。而農(nóng)業(yè)農(nóng)村部市場與信息化司司長唐珂2020年3月10日表示,疫情期間全國主要農(nóng)產(chǎn)品供給穩(wěn)定充足。在供給不變,需求急劇增加的情況下,供需失衡導(dǎo)致農(nóng)產(chǎn)品價(jià)格波動。此外,已有研究表明,媒體負(fù)面報(bào)道會影響消費(fèi)決策,導(dǎo)致相應(yīng)農(nóng)產(chǎn)品的需求降低,而媒體中性或正面的報(bào)道往往不會對需求產(chǎn)生明顯的影響[39]。且負(fù)向情緒在突發(fā)公共衛(wèi)生事件的爆發(fā)期最為強(qiáng)烈,蔓延期開始減弱,隨著輿情發(fā)展到衰退期,中性和正向情緒甚至比負(fù)向情緒更強(qiáng)烈[41]。因此負(fù)向情緒更能反映疫情的發(fā)展?fàn)顩r,致使農(nóng)產(chǎn)品的需求發(fā)生變化,價(jià)格產(chǎn)生波動。因此,做出如下假設(shè):
H1a:公眾情緒變化是引起各類農(nóng)產(chǎn)品價(jià)格波動的格蘭杰原因。
H1b:公眾負(fù)向情緒對各類農(nóng)產(chǎn)品價(jià)格波動的影響相較于整體公眾情緒更加明顯。
1.2.2 公眾負(fù)面情緒變化與不同競爭屬性農(nóng)產(chǎn)品價(jià)格波動的關(guān)系
考慮畜產(chǎn)品、水產(chǎn)品和蔬菜以及水果4類農(nóng)產(chǎn)品。在公眾的畜產(chǎn)品消費(fèi)結(jié)構(gòu)中,豬肉占我國肉類總消費(fèi)的62%以上[42],其需求彈性較小,而牛肉、羊肉由于價(jià)格較高,可替代性較強(qiáng),需求彈性也較強(qiáng)。面對嚴(yán)峻的疫情形勢,公眾由于過于緊張,大量囤積超過短期需求的生活物資,豬肉作為公眾日常生活的必需品被大量搶購,而牛肉、羊肉的消費(fèi)決策卻不會發(fā)生大幅度改變。因此公眾情緒的變化可能會引起豬肉價(jià)格波動,而不會引起牛肉、羊肉的價(jià)格波動。其次,已有研究表明,當(dāng)某產(chǎn)品受突發(fā)事件沖擊時(shí),其替代品的價(jià)格或許會受到更深、更大的沖擊[43]。水產(chǎn)品作為畜產(chǎn)品的替代品,在疫情期間,公眾因?yàn)榭只徘榫w,為了減少出門次數(shù),將其作為補(bǔ)充物資大量采購。價(jià)格較為低廉的淡水魚,例如白鰱魚、鯉魚和鯽魚因?yàn)樾枨蠹眲≡黾樱瑑r(jià)格發(fā)生波動;而價(jià)格較高的海水魚例如大帶魚,與牛肉、羊肉相似,預(yù)期價(jià)格不會產(chǎn)生太大波動。蔬菜由于含有多種維生素且價(jià)格較低,在人們的生活中不可或缺。從需求上看,1月處于疫情爆發(fā)時(shí)期,公眾對疫情認(rèn)知不足,恐慌情緒強(qiáng)烈,因此多地出現(xiàn)超市蔬菜一搶而空的現(xiàn)象。從供給上看,由于全國大部地區(qū)氣溫適宜,利于蔬菜生長發(fā)育,且“穩(wěn)產(chǎn)保供”措施有力有序推進(jìn),蔬菜供給總體有保障。因此,蔬菜價(jià)格可能產(chǎn)生波動。水果作為提高生活品質(zhì)的附加品,具有時(shí)效性,易腐壞。面對嚴(yán)峻的疫情形勢,公眾恐慌情緒下較多囤積生活必需的食品,而水果類產(chǎn)品不會被首要考慮,滯銷使得總體價(jià)格發(fā)生波動。根據(jù)以上分析做出如下假設(shè):
H2a:公眾負(fù)面情緒變化是引起豬肉價(jià)格變化的格蘭杰原因,而不是引起牛肉、羊肉價(jià)格變化的格蘭杰原因。
H2b:公眾負(fù)面情緒變化是引起白鰱魚、鯉魚和鯽魚價(jià)格變化的格蘭杰原因,而不是引起大帶魚價(jià)格變化的格蘭杰原因。
H2c:公眾負(fù)面情緒變化是引起蔬菜價(jià)格變化的格蘭杰原因。
H2d:公眾負(fù)面情緒變化是引起水果價(jià)格變化的格蘭杰原因。
1.2.3 公眾負(fù)面情緒變化與農(nóng)產(chǎn)品價(jià)格波動關(guān)系的地區(qū)差異
已有研究表明,在突發(fā)事件的發(fā)生地公眾對事件的關(guān)注度更高,討論更為火熱[44]。由于新冠肺炎疫情在各個(gè)省市嚴(yán)重程度不同,疫情嚴(yán)重地區(qū)公眾情緒起伏程度較大,恐慌情緒更為嚴(yán)重,非理性囤貨苗頭更為突顯,農(nóng)產(chǎn)品價(jià)格也因此在短期內(nèi)產(chǎn)生較大波動,因此做出如下假設(shè):
H3:疫情嚴(yán)重地區(qū)公眾負(fù)面情緒變化對農(nóng)產(chǎn)品價(jià)格波動的沖擊更大。
通過Python模擬微博的高級搜索功能,以“新型冠狀病毒”為關(guān)鍵詞,抓取2020年1月9日—2020年3月4日的原創(chuàng)微博,得到微博文本、發(fā)出時(shí)間、轉(zhuǎn)發(fā)量、評論量、點(diǎn)贊量、用戶ID、所在地區(qū)和性別等數(shù)據(jù),進(jìn)一步對獲得的原始數(shù)據(jù)做預(yù)處理以便進(jìn)行分析,包括數(shù)據(jù)清理、分詞以及去停用詞。去停用詞對照哈爾濱工業(yè)大學(xué)停用詞表,包括1 893個(gè)停用詞。調(diào)用Jieba分詞系統(tǒng)對清理后的數(shù)據(jù)進(jìn)行分詞,為避免專業(yè)詞語被錯(cuò)誤分割,將搜狗詞庫的疾病預(yù)防工作專業(yè)詞庫和歸納的新型冠狀病毒相關(guān)術(shù)語載入用戶自定義詞典[40],以提高分詞效果。
突發(fā)事件的演化過程往往具有一定的生命周期,因此,研究突發(fā)事件常常根據(jù)生命周期理論,將突發(fā)事件劃分為幾個(gè)階段。依據(jù)關(guān)注度這個(gè)定性特征來劃分演化階段是常用的方法,研究多以百度指數(shù)來反應(yīng)關(guān)注度。為提高階段劃分的準(zhǔn)確度,本研究綜合百度指數(shù)和微博數(shù)量2個(gè)指標(biāo),將新冠肺炎疫情發(fā)展劃分為4個(gè)階段,如圖2所示。2020年1月9日,武漢不明原因肺炎病原體被判定為新型冠狀病毒,但此時(shí)疫情還未被大部分人知曉,該階段被定義為潛伏期;自1月19日始,有關(guān)新冠肺炎的信息和新聞迅速傳播,在微博上爆發(fā)了大規(guī)模的討論,因此該階段被劃分為爆發(fā)期;截至1月30日,新冠病毒的基本情況已被大多數(shù)人了解,進(jìn)入線下防控,線上持續(xù)穩(wěn)定討論的階段,定義為蔓延期;2020年2月15日后,有關(guān)新冠肺炎的信息多為每日疫情播報(bào),討論進(jìn)入衰退階段。
圖2 新冠肺炎疫情發(fā)展階段劃分Figure 2 The stages of COVID-19 development
公眾的討論內(nèi)容是輿情研究的重點(diǎn),為此利用LDA模型對各階段微博主題進(jìn)行聚類,研究新冠肺炎疫情期間公眾關(guān)注的主題。通過主題分布可視化結(jié)果確定4個(gè)階段的主題數(shù)分別為6、7、7和4[45]。得到不同階段的主題特征詞,并結(jié)合主題特征詞對應(yīng)的微博內(nèi)容對主題進(jìn)行歸納概括,如表1所示。潛伏期的主題主要集中于對新冠肺炎的初步認(rèn)識;爆發(fā)期主題多樣,包括對新冠病毒的進(jìn)一步認(rèn)識、普及預(yù)防措施和公眾對疫情的情緒表達(dá)等;蔓延期出現(xiàn)了有關(guān)新冠病毒傳播的深入研究結(jié)果,同時(shí)也出現(xiàn)了諸如“雙黃連口服液可抑制新冠病毒”“寵物傳染新冠病毒”等謠言;衰退期主題集中在復(fù)工復(fù)產(chǎn)以及有效治療方案上。特別的是,在爆發(fā)期出現(xiàn)了“肉蛋”這樣的關(guān)鍵詞,說明有關(guān)農(nóng)產(chǎn)品的內(nèi)容在公眾的討論主題中也占有一席之地,需要對新冠肺炎疫情期間的農(nóng)產(chǎn)品價(jià)格進(jìn)行研究。
表1 分階段主題概括Table 1 Recognizing the topics of each stage
情感分析將文本數(shù)據(jù)轉(zhuǎn)化為數(shù)值型數(shù)據(jù),為建立公眾情緒與農(nóng)產(chǎn)品價(jià)格的數(shù)學(xué)模型提供了可能性。使用中文自然語言處理庫Snow NLP進(jìn)行情感分析,取值范圍在0~1之間,接近0說明該條微博表現(xiàn)的情感越負(fù)面,反之越正面。將情感分析后的微博文本按天歸類,計(jì)算每天的情感平均值,得到的情感值時(shí)間序列如圖3所示,記為Sentiment。參照陽玉 堃 的做法[46],將情感值大于0.6的微博文本判定為積極,小于0.4的微博文本判定為消極,處于0.4~0.6之間的微博文本判定為中性,將微博劃分為3類。由圖可知,在潛伏期由于公眾對新冠肺炎病毒信息掌握得很少且片面,情感傾向隨著信息的極性變化產(chǎn)生較大波動;爆發(fā)期剛開始,由于公眾對疫情風(fēng)險(xiǎn)有了一定程度的認(rèn)知,焦慮、恐慌情緒爆發(fā),整體表現(xiàn)為負(fù)向情緒,但隨著疫情相關(guān)知識的普及,防控措施的積極部署,情感值顯著上升;蔓延期和衰退期,公眾情緒幾乎始終保持在中性范圍內(nèi)。公眾情感變化與分階段的討論主題是互相映照的。計(jì)算每1 d積極、中性和消極微博的數(shù)量,形成微博條數(shù)時(shí)間序列,分別記為 Positive、Negative、Neutral,結(jié)果如圖3所示。根據(jù)圖3可以明顯觀察到消極微博條數(shù)與圖2中疫情關(guān)注度曲線走勢十分相似,而積極和中性微博條數(shù)在中后期較高。以上研究表明,公眾情緒隨著疫情發(fā)展產(chǎn)生動態(tài)變化,且消極微博條數(shù)更能反映疫情的發(fā)展?fàn)顩r,印證了假設(shè)H1a、H1b提出的合理性。
圖3 新冠肺炎疫情公眾情感變化趨勢Figure 3 Trends in public sentiment in the COVID-19 epidemic
參照農(nóng)業(yè)農(nóng)村部市場與信息化司每日發(fā)布的農(nóng)產(chǎn)品批發(fā)價(jià)格200指數(shù)中提及的農(nóng)產(chǎn)品,選取豬肉、牛肉和羊肉作為畜禽產(chǎn)品研究對象;選取鯽魚、鯉魚、白鰱魚和大帶魚做水產(chǎn)品研究對象;將國家重點(diǎn)監(jiān)測的28種蔬菜按照價(jià)格高低分為3類,結(jié)合《中國農(nóng)產(chǎn)品價(jià)格調(diào)查年鑒》中統(tǒng)計(jì)的農(nóng)產(chǎn)品種類,最終選取大白菜、黃瓜和豆角做研究對象;考慮季節(jié)性問題,從國家重點(diǎn)監(jiān)測的6種水果中選取富士蘋果、菠蘿和鴨梨作為研究對象。通過農(nóng)業(yè)農(nóng)村部信息中心搜集每種農(nóng)產(chǎn)品每日的全國平均批發(fā)價(jià)格并進(jìn)行整理,得到農(nóng)產(chǎn)品價(jià)格時(shí)間序列,描述性統(tǒng)計(jì)如表2所示。從平均值可以看出,畜禽產(chǎn)品中豬肉與牛肉、羊肉價(jià)格相去甚遠(yuǎn),大帶魚價(jià)格是其他3種水產(chǎn)品的2~4倍。蔬菜、水果均價(jià)相近,3種蔬菜存在3檔價(jià)格,而3種水果價(jià)格都比較低。綜上可知,即使是同類農(nóng)產(chǎn)品,具體品種不同,結(jié)果也會產(chǎn)生差異,驗(yàn)證了假設(shè)H2a、H2b提出的合理性。此外,從標(biāo)準(zhǔn)差上看,豬肉和大帶魚價(jià)格波動較大。
表2 農(nóng)產(chǎn)品價(jià)格描述性統(tǒng)計(jì)Table 2 Descriptive statistics of agricultural product prices 元/kg
考慮到公眾情感數(shù)據(jù)和各個(gè)農(nóng)產(chǎn)品價(jià)格數(shù)據(jù)之間量綱不同,不具可比性,因此對兩類數(shù)據(jù)進(jìn)行Z-Score標(biāo)準(zhǔn)化處理。此外,為了保證實(shí)證結(jié)果的有效性,避免虛假回歸問題,對公眾情感時(shí)間序列和農(nóng)產(chǎn)品價(jià)格時(shí)間序列分別進(jìn)行ADF單位根檢驗(yàn),結(jié)果表明時(shí)間序列平穩(wěn),可以進(jìn)行格蘭杰因果檢驗(yàn)。
由于格蘭杰因果關(guān)系檢驗(yàn)對滯后階數(shù)的選擇十分敏感,首先構(gòu)建VAR模型來確定最優(yōu)滯后階數(shù)。考慮到趕集一般每周一次,因此若公眾情感與農(nóng)產(chǎn)品價(jià)格變化存在格蘭杰因果關(guān)系,在滯后7 d內(nèi)應(yīng)當(dāng)能夠顯現(xiàn)出來。將最大滯后階數(shù)設(shè)定為7,根據(jù)LR、FPE、AIC、SC和HQ五大信息準(zhǔn)則確定最優(yōu)滯后階數(shù)。分別構(gòu)建公眾情緒平均值與各農(nóng)產(chǎn)品價(jià)格以及消極公眾情緒數(shù)量與各農(nóng)產(chǎn)品價(jià)格的VAR模型,進(jìn)1步進(jìn)行格蘭杰因果關(guān)系檢驗(yàn),結(jié)果如表3所示。表3中每個(gè)單元格前面的數(shù)字代表根據(jù)以上方法確定的最優(yōu)滯后階數(shù),后面的數(shù)字是P值,若P值小于0.1則說明公眾情緒值/負(fù)向情緒數(shù)量變化是該農(nóng)產(chǎn)品價(jià)格變化的格蘭杰原因。
表3 公眾情緒與各農(nóng)產(chǎn)品價(jià)格格蘭杰因果關(guān)系檢驗(yàn)結(jié)果Table 3 Granger causality test results of public sentiment and agricultural product price
從農(nóng)產(chǎn)品種類上看,對于畜禽產(chǎn)品,公眾情緒值變化是豬肉價(jià)格波動的格蘭杰原因,而不是牛羊肉變動價(jià)格變化的格蘭杰原因。負(fù)向情緒數(shù)量變化是豬肉價(jià)格變化的格蘭杰原因在10%水平下顯著,說明公眾情緒變化會引起豬肉價(jià)格的變動,驗(yàn)證了假設(shè)H2a的前半部分;而負(fù)向情緒數(shù)量變化不是牛肉價(jià)格變化的格蘭杰原因在10%的顯著性水平下被拒絕,負(fù)向情緒數(shù)量變化不是羊肉價(jià)格變化的格蘭杰原因P值也接近0.1,說明負(fù)向情緒變動會引起牛肉、羊肉價(jià)格的波動,假設(shè)H2a后半部分被拒絕。我國人民生活水平的提高以及疫情帶來的群體性恐慌情緒使得牛肉、羊肉也作為補(bǔ)充食品被大量搶購。對于水產(chǎn)品,公眾情緒值變化不是鯽魚、白鰱魚、大帶魚價(jià)格變化的格蘭杰原因,卻在10%的顯著性水平下影響鯉魚價(jià)格的變化。負(fù)向情緒數(shù)量變化是鯽魚、鯉魚、白鰱魚價(jià)格變化的格蘭杰原因分別在1%、1%和5%的顯著性水平下被接受,不是大帶魚價(jià)格變化的格蘭杰原因也被接受,假設(shè)H2b被證實(shí)。對于蔬菜類農(nóng)產(chǎn)品,首先公眾情緒值變化不是黃瓜、大白菜價(jià)格變化的格蘭杰原因,卻在1%水平下顯著影響豆角價(jià)格的波動。負(fù)向情緒數(shù)量變化是28種蔬菜平均價(jià)格變化的格蘭杰原因在10%的顯著性水平下被接受;負(fù)向情緒數(shù)量變化是豆角、黃瓜、大白菜價(jià)格變化的格蘭杰原因均在1%的顯著性水平下被接受,說明公眾負(fù)向情緒變化會引起蔬菜價(jià)格的變化,假設(shè)H2c被證實(shí)。對于水果類農(nóng)產(chǎn)品,首先公眾情緒值變化不是各類水果價(jià)格變化的格蘭杰原因。負(fù)向情緒數(shù)量變化是6種水果平均價(jià)格變化的格蘭杰原因在10%的顯著性水平下被接受;負(fù)向情緒數(shù)量變化是蘋果價(jià)格變化的格蘭杰原因在1%的顯著性水平下被接受,蘋果作為產(chǎn)量最大的水果之一,受到的影響更為嚴(yán)重。其他假設(shè)均被拒絕,假設(shè)H2d沒有得到證實(shí)。
從滯后階數(shù)上看,肉類整體滯后階數(shù)較小,而蔬菜整體滯后階數(shù)較大。說明肉類價(jià)格的變動對于公眾情緒變化的反應(yīng)較為靈敏,而蔬菜價(jià)格的變動往往要在接近1周才能反映出來。各類農(nóng)產(chǎn)品的研究結(jié)果表明,公眾情緒值變化并不全是各類農(nóng)產(chǎn)品價(jià)格變化的格蘭杰原因,假設(shè)H1a沒有得到證實(shí);負(fù)向情緒數(shù)量驗(yàn)證情緒變化與農(nóng)產(chǎn)品價(jià)格的關(guān)系效果比用公眾情緒值驗(yàn)證更顯著,假設(shè)H1b被證實(shí)。
以上研究是基于全國范圍進(jìn)行的,但由于疫情對各地區(qū)影響程度差異較大,疫情嚴(yán)重地區(qū)公眾情感與農(nóng)產(chǎn)品價(jià)格變化之間的關(guān)系還需進(jìn)一步驗(yàn)證。根據(jù)百度提供的新冠肺炎疫情大數(shù)據(jù),湖北、廣東、河南、浙江和湖南是受新冠肺炎疫情影響最嚴(yán)重的5個(gè)省份。因此,將挖掘到的微博信息和情感分析結(jié)果與微博發(fā)出者所在地區(qū)逐一對應(yīng)并按天歸類,分別計(jì)算出5個(gè)省份每天的負(fù)向公眾情感數(shù)量,得到公眾情感時(shí)間序列。從全國農(nóng)產(chǎn)品商務(wù)信息公共服務(wù)平臺收集并整理各省的農(nóng)產(chǎn)品價(jià)格數(shù)據(jù),得到各省各種農(nóng)產(chǎn)品的價(jià)格時(shí)間序列。實(shí)證分析過程與前面的研究相似,結(jié)果如表4所示,空白處對應(yīng)的農(nóng)產(chǎn)品價(jià)格數(shù)據(jù)缺失。
由表4可知,對于畜產(chǎn)品,不同于對全國范圍內(nèi)的研究,負(fù)向情緒數(shù)量變化不是豬肉、牛肉價(jià)格變化的格蘭杰原因,而豬肉、牛肉價(jià)格變化是負(fù)向情緒數(shù)量變化的格蘭杰原因分別在10%、1%的顯著性水平下被接受,即豬肉、牛肉的價(jià)格變化領(lǐng)先于公眾情感的變化。出現(xiàn)這一結(jié)果的原因分析如下:由于全國范圍內(nèi)的農(nóng)產(chǎn)品批發(fā)市場價(jià)格會平滑掉變動較大的省份,分省來看,豬肉、牛肉市場價(jià)格的變化比社交媒體上公眾情緒的波動更為敏感,因此通過豬肉、牛肉價(jià)格的變化可以迅速感知疫情的發(fā)展?fàn)顩r。對于蔬菜和水果類農(nóng)產(chǎn)品,分省份的格蘭杰因果關(guān)系檢驗(yàn)結(jié)果與全國范圍內(nèi)的檢驗(yàn)結(jié)果相似,假設(shè)H3沒有得到證實(shí)。
表4 5省負(fù)向情緒數(shù)量與各農(nóng)產(chǎn)品價(jià)格格蘭杰因果關(guān)系檢驗(yàn)結(jié)果Table 4 Granger causality test results of negative emotion amount and agricultural product price of five provinces
為排除春節(jié)因素對農(nóng)產(chǎn)品價(jià)格變動的影響,對應(yīng)本文的研究時(shí)段,搜集2019年1月20日—3月19日的各農(nóng)產(chǎn)品價(jià)格數(shù)據(jù),形成時(shí)間序列,經(jīng)過標(biāo)準(zhǔn)化處理、平穩(wěn)性檢驗(yàn)后與前文的公眾情感時(shí)間序列構(gòu)建VAR模型,進(jìn)行格蘭杰因果關(guān)系檢驗(yàn)。檢驗(yàn)結(jié)果表明,負(fù)向情緒數(shù)量變化與2019年各農(nóng)產(chǎn)品價(jià)格變化互不影響,因此用負(fù)向情緒數(shù)量衡量公眾情感則可以排除春節(jié)因素對農(nóng)產(chǎn)品價(jià)格波動產(chǎn)生的影響,假設(shè)H1b再次被證實(shí)。
本研究通過對微博“新型冠狀病毒”相關(guān)內(nèi)容進(jìn)行文本挖掘,一方面研究疫情發(fā)展各個(gè)階段的網(wǎng)絡(luò)輿情內(nèi)容,另一方面構(gòu)建VAR格蘭杰因果關(guān)系檢驗(yàn)?zāi)P脱芯抗娗楦信c農(nóng)產(chǎn)品價(jià)格之間的關(guān)系。研究產(chǎn)生以下結(jié)論:
新冠肺炎疫情發(fā)展被分為潛伏期、爆發(fā)期、蔓延期和衰退期4個(gè)階段。潛伏期的主題主要集中于對新冠肺炎的初步認(rèn)識;爆發(fā)期主題多樣,包括對新冠病毒的進(jìn)一步認(rèn)識、普及預(yù)防措施、公眾對疫情的情緒表達(dá)等;蔓延期出現(xiàn)了有關(guān)新冠病毒傳播的深入研究結(jié)果,疫情有關(guān)謠言也不斷出現(xiàn);衰退期主題集中在復(fù)工復(fù)產(chǎn)以及有效治療方案上。對于疫情發(fā)展各階段公眾關(guān)注主題的研究有助于監(jiān)測網(wǎng)絡(luò)輿論,一方面了解民眾訴求,準(zhǔn)確采取措施進(jìn)行部署;另一方面監(jiān)控網(wǎng)絡(luò)謠言,及時(shí)辟謠避免其廣泛傳播。研究結(jié)果表明,潛伏期和爆發(fā)期對新冠病毒有關(guān)知識和防控措施的普及較為到位,但在蔓延期仍有謠言不斷出現(xiàn)造成公眾恐慌,干擾公眾判斷。
在公眾情緒與農(nóng)產(chǎn)品價(jià)格關(guān)系的研究上得出以下結(jié)論。首先,公眾情緒變化不僅是引起豬肉、蔬菜價(jià)格變化的格蘭杰原因,也是引起牛肉、羊肉和水果價(jià)格變化的格蘭杰原因。當(dāng)面臨嚴(yán)峻的疫情形勢,公眾出現(xiàn)恐慌情緒,豬肉、蔬菜是人民生活的基本需求,因此出現(xiàn)非理性囤貨現(xiàn)象,價(jià)格產(chǎn)生波動。緊張情緒加上人民生活水平的提高,公眾對牛肉、羊肉也不會產(chǎn)生消費(fèi)抑制,反而會將其作為補(bǔ)充物資大量囤積。而水果因?yàn)橐子诟瘔那也⒉皇潜匦杵罚娍只判睦硐虏⒉粫紫瓤紤],需求減少導(dǎo)致價(jià)格波動。其次,相對于整體情感值,負(fù)向情緒數(shù)量的解釋效果更好。由于有關(guān)部門對網(wǎng)絡(luò)輿情的引導(dǎo)作用,除疫情剛開始爆發(fā)產(chǎn)生的消極恐慌情緒以外,在實(shí)施應(yīng)急管理措施以及普及防控知識后,公眾整體情緒傾向好的方向發(fā)展;而負(fù)向情緒由于限定在消極情緒的范圍內(nèi),更能反映公眾對疫情發(fā)展的實(shí)際感知狀況,公眾也正是根據(jù)這個(gè)感知來做出對各種農(nóng)產(chǎn)品的消費(fèi)決策。此外,對于疫情嚴(yán)重地區(qū),豬肉、牛肉價(jià)格變動領(lǐng)先于公眾情緒變化,因此可根據(jù)豬肉、牛肉的價(jià)格變動來預(yù)測疫情的發(fā)展?fàn)顩r。