蘇永華 王哲平
(1.杭州科技職業(yè)技術(shù)學(xué)院旅游管理學(xué)院,浙江 杭州 311402;2.浙江工業(yè)大學(xué)管理學(xué)院,浙江 杭州 310023;3.浙江工業(yè)大學(xué)人文學(xué)院,浙江 杭州 310023)
自19世紀(jì)末誕生以來(lái),電影在人們追求美好生活的道路上扮演著重要角色:其不僅是個(gè)人娛樂(lè)和放松的重要消遣品,同時(shí)也是跨地區(qū)跨民族進(jìn)行文化交流的重要媒介。作為商業(yè)行為的電影制作和發(fā)行,票房一直以來(lái)都是投資人主要的收入來(lái)源,對(duì)電影院線公司、電影院和發(fā)行公司而言,更是如此。即便是電影行業(yè)盈利模式不斷朝多元化努力,但各方在衍生品、廣告和其他周邊上的收入仍無(wú)法撼動(dòng)票房在產(chǎn)業(yè)鏈盈利中的核心地位。包括《長(zhǎng)城》《阿凡達(dá)》這樣的中外高投入電影在內(nèi),投資人對(duì)票房的期許莫不翹首企足,票房不僅是影片成功與否的事后表征,基于預(yù)測(cè)的票房來(lái)評(píng)估風(fēng)險(xiǎn)和收益,進(jìn)行拍攝、制作、宣傳和上映的策略調(diào)整,更是投資人追求收益最大化之所急需。
對(duì)特定電影的票房進(jìn)行一個(gè)準(zhǔn)確預(yù)測(cè)并不是件容易的事情。電影的出品方、制片方、發(fā)行方、影片質(zhì)量、導(dǎo)演、主演、影片類(lèi)型、影片時(shí)長(zhǎng)、上映日期、市場(chǎng)區(qū)域、宣傳力度還有同檔期中的競(jìng)品情況,甚至是電影放映期間的社會(huì)環(huán)境和天氣狀況,都會(huì)影響著最終的票房表現(xiàn)。不僅如此,包括影片投資額在內(nèi)的許多數(shù)據(jù)實(shí)際上也是很難獲得的(抑或是難以準(zhǔn)確測(cè)量),而電影投資預(yù)算對(duì)票房和盈利的影響卻早已得到證實(shí)——預(yù)算超過(guò)6000萬(wàn)美元的電影相較于低成本制作的電影更能盈利,這就意味著如果采用傳統(tǒng)線性方法來(lái)預(yù)測(cè)票房不得不面臨對(duì)明明已知影響變量卻無(wú)法控制的尷尬境地。
為了提升對(duì)電影票房預(yù)測(cè)的準(zhǔn)確性,已有相關(guān)研究試圖從兩個(gè)方向進(jìn)行突破。在預(yù)測(cè)方法改進(jìn)上,包括支持向量機(jī)、多項(xiàng)式logit回歸、高斯樸素貝葉斯、多層感知器神經(jīng)網(wǎng)絡(luò)、自適應(yīng)增強(qiáng)、隨機(jī)森林、隨機(jī)梯度下降、決策樹(shù)和BP神經(jīng)網(wǎng)絡(luò)等一批機(jī)器學(xué)習(xí)的方法應(yīng)用其中,實(shí)證研究結(jié)果表明多層感知器神經(jīng)網(wǎng)絡(luò)在票房預(yù)測(cè)中獲得了更佳的效果,而電影上映前使用10折交叉驗(yàn)證的神經(jīng)網(wǎng)絡(luò)模型則票房預(yù)測(cè)的準(zhǔn)確性可高出90%以上。在預(yù)測(cè)指標(biāo)挖掘上,包括微博、推特、優(yōu)兔和IMDb電影數(shù)據(jù)庫(kù)等社交媒體和網(wǎng)絡(luò)資源上的人氣、評(píng)分、評(píng)論數(shù)量以及文本情緒等數(shù)據(jù)被充分采用,但這些特征在最終算法模型中是否得到支持,答案仍不統(tǒng)一。
對(duì)于電影這樣一類(lèi)體驗(yàn)性商品而言,口碑毫無(wú)疑問(wèn)是影響人們觀影決策的最重要的信息傳播渠道之一,在網(wǎng)絡(luò)社會(huì)中這一媒介效應(yīng)更是獲得極大的增強(qiáng),網(wǎng)絡(luò)口碑越來(lái)越成為影響電影票房的重要變量。電影《厄夜叢林》以6萬(wàn)美元投資創(chuàng)造了2.48億美元票房的奇跡成為電影在線口碑營(yíng)銷(xiāo)的典范,相關(guān)研究報(bào)告更是披露了大約50%的年輕網(wǎng)民正在依靠口碑推薦來(lái)購(gòu)買(mǎi)CD、電影、視頻或DVD。本文基于線性回歸和機(jī)器學(xué)習(xí)的方法,從電影票房預(yù)測(cè)角度探求網(wǎng)絡(luò)口碑的影響機(jī)制與效應(yīng),揭示網(wǎng)絡(luò)口碑效價(jià)和網(wǎng)絡(luò)口碑量值在電影票房預(yù)測(cè)中的異質(zhì)性表現(xiàn),并以此為基礎(chǔ)對(duì)電影口碑營(yíng)銷(xiāo)提升提出了富有針對(duì)性的建議。
美國(guó)電影協(xié)會(huì)前首席執(zhí)行官杰克·瓦倫蒂(Jack Valenti)曾于1979年宣稱(chēng),沒(méi)有人能夠告訴你電影在市場(chǎng)上的表現(xiàn),但這并不能阻擋人們探究的腳步。自20世紀(jì)80年代初以來(lái),對(duì)電影票房進(jìn)行預(yù)測(cè)的研究一直都未停止嘗試。從預(yù)測(cè)的時(shí)間節(jié)點(diǎn)來(lái)看,這些研究主要分為兩種:一種是在電影上映前對(duì)票房進(jìn)行預(yù)測(cè),而另一種則是在電影上映一定時(shí)間后(通常是一周以?xún)?nèi))進(jìn)行的預(yù)測(cè)。就投資策略調(diào)整的角度而言,前一種預(yù)測(cè)似乎更具商業(yè)價(jià)值,但復(fù)雜多樣的影響因素加之上映后所面臨的動(dòng)態(tài)變化往往令這些模型預(yù)測(cè)捉襟見(jiàn)肘。值得注意的是,網(wǎng)絡(luò)口碑(或稱(chēng)之為在線口碑,縮寫(xiě)為eWOM)作為一種可被存儲(chǔ)、搜索和再傳播的口碑形式,其在電影票房預(yù)測(cè)中的表現(xiàn)使得后一種預(yù)測(cè)也成為關(guān)注的方向,尤其是整合電影最初幾天票房、評(píng)級(jí)和口碑?dāng)?shù)據(jù)的方法被證實(shí)是獲得相當(dāng)準(zhǔn)確票房預(yù)測(cè)結(jié)果的方法。
網(wǎng)絡(luò)口碑影響電影票房的機(jī)制和效果都成為研究關(guān)注的重點(diǎn)。網(wǎng)絡(luò)口碑不僅是電影的評(píng)分,其還包含評(píng)論數(shù)、轉(zhuǎn)發(fā)量以及積極和消極評(píng)論的比重等多個(gè)方面。評(píng)論深度和數(shù)量代表了網(wǎng)絡(luò)口碑的量值,而評(píng)論等級(jí)和正面評(píng)論的數(shù)量則表征了評(píng)論的效價(jià)。在反映互動(dòng)總量的口碑量值和反映評(píng)價(jià)情感趨向的口碑效價(jià)之間,傳統(tǒng)的直覺(jué)傾向都是希望干預(yù)口碑效價(jià)以提振票房,“價(jià)位是推動(dòng)票房表現(xiàn)的因素,而不是數(shù)量”,評(píng)論評(píng)分對(duì)電影的銷(xiāo)售有積極影響。在一個(gè)指定的市場(chǎng)區(qū)域內(nèi),效價(jià)是票房收入的重要影響因素。從全球范圍來(lái)看,電影在國(guó)際市場(chǎng)上的口碑和票房是呈現(xiàn)出“共線性”的,影片品質(zhì)決定影片評(píng)價(jià),影片評(píng)價(jià)又決定著影片票房,這也是成熟電影市場(chǎng)的規(guī)律展現(xiàn)。Dellarocas等(2007)、Chintagunta等(2010)的前期研究結(jié)果也都表明了網(wǎng)絡(luò)口碑效價(jià)對(duì)電影票房的正向顯著影響,基于此,本文提出的第一個(gè)核心假設(shè)是:
假設(shè)1:在線評(píng)價(jià)獲得的評(píng)分越高,電影票房表現(xiàn)越好。
實(shí)際上,國(guó)內(nèi)外不少研究也提出了新的觀點(diǎn),認(rèn)為評(píng)論的量值很重要,而效價(jià)則無(wú)關(guān)緊要。網(wǎng)絡(luò)口碑量值特指網(wǎng)絡(luò)口碑評(píng)價(jià)規(guī)模的大小,在一部分研究看來(lái),電影評(píng)分雖然是電影質(zhì)量的表征,其有可能有助于預(yù)測(cè)票房表現(xiàn),但卻不是影響票房成功的因素。另外一些研究也揭示了網(wǎng)絡(luò)口碑與電影票房之間與直覺(jué)相迥異的關(guān)系,結(jié)果顯示了口碑效價(jià)與電影票房無(wú)關(guān),但在線消息量與電影每周票房則存在著顯著相關(guān)。對(duì)美國(guó)動(dòng)畫(huà)電影票房的研究也表明,網(wǎng)絡(luò)口碑量值對(duì)動(dòng)畫(huà)票房收入產(chǎn)生了積極的正向影響,而網(wǎng)絡(luò)口碑褒貶(效價(jià))對(duì)這類(lèi)電影的票房收入并未呈現(xiàn)出顯著影響。在國(guó)家層面的數(shù)據(jù)研究同樣揭示了評(píng)論的量值真正影響著電影的票房表現(xiàn)。整體來(lái)看,大部分網(wǎng)絡(luò)口碑量值和票房收入之間的研究均揭示了兩者存在的顯著正相關(guān)關(guān)系,如Godes等(2004)、Duan等(2008)、Rui(2010)等的前期研究中所發(fā)現(xiàn)的網(wǎng)絡(luò)口碑量值對(duì)電影票房的積極影響。結(jié)合主流影評(píng)網(wǎng)站可獲得的網(wǎng)絡(luò)口碑評(píng)價(jià)數(shù)量方面的數(shù)據(jù)情況,本文提出了后續(xù)幾個(gè)假設(shè):
假設(shè)2:在線參與評(píng)分的人數(shù)越多,電影票房表現(xiàn)越好。
假設(shè)3:在線發(fā)布的短評(píng)數(shù)量越多,電影票房表現(xiàn)越好。
假設(shè)4:在線發(fā)布的影評(píng)數(shù)量越多,電影票房表現(xiàn)越好。
假設(shè)5:在線刊載的新聞數(shù)量越多,電影票房表現(xiàn)越好。
假設(shè)6:在線標(biāo)記“想看”的人數(shù)越多,電影票房表現(xiàn)越好。
相較于格瓦拉和豆瓣,時(shí)光網(wǎng)(www.mtime.com)的電影評(píng)分機(jī)制具有類(lèi)專(zhuān)業(yè)特征,其分項(xiàng)評(píng)分機(jī)制的顯著優(yōu)點(diǎn)是規(guī)避了同類(lèi)網(wǎng)站基于主觀籠統(tǒng)印象和模糊評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行評(píng)價(jià)的弊端,其細(xì)致的評(píng)分機(jī)制、較高的用戶(hù)專(zhuān)業(yè)素質(zhì)和獨(dú)立的發(fā)布載體特點(diǎn),令其成為未來(lái)有條件向IMDb看齊的專(zhuān)業(yè)電影評(píng)價(jià)平臺(tái)。本文以該網(wǎng)站2010年—2019年十年間中國(guó)內(nèi)地制作的、對(duì)白語(yǔ)言為漢語(yǔ)普通話(huà)的各種類(lèi)型的彩色電影為研究對(duì)象,通過(guò)公開(kāi)數(shù)據(jù)的搜集整理,與藝恩票房數(shù)據(jù)(www.endata.com.cn)以及中國(guó)電影數(shù)據(jù)網(wǎng)(www.films.cn)公布的電影人粉絲數(shù)(新浪微博)相匹配,排除缺失值后(無(wú)插補(bǔ))最終獲得有效觀測(cè)樣本541個(gè)。在穩(wěn)健性檢驗(yàn)中,采用了豆瓣(www.douban.com)公開(kāi)的相關(guān)電影數(shù)據(jù)。
1.多元線性回歸模型
本文構(gòu)建了多元線性回歸模型檢驗(yàn)網(wǎng)絡(luò)口碑對(duì)電影票房的影響:
LnBoxoffice=β+βScore+βLnScale+βLnFilmreview+βLnShortcomment+βLnNews+βLnDemand+γControls+ε(1)
其中,LnBoxoffice代表電影票房,從票房的數(shù)據(jù)分布來(lái)看,其曾出現(xiàn)偏態(tài)分布(正偏態(tài)),采用自然對(duì)數(shù)的方式有效消除了右偏問(wèn)題。Score為電影的在線評(píng)分,取值為0~10,Scale為評(píng)分人數(shù),LnFilmreview為長(zhǎng)劇評(píng)數(shù),LnShortcomment為微劇評(píng)數(shù),LnNews為新聞數(shù)量,LnDemand為潛在觀眾數(shù),被解釋變量和主要解釋變量的數(shù)據(jù)采集時(shí)間為2020年9月29日。
Controls是本文的控制變量。在信息較為缺乏的情況下,消費(fèi)者更可能是基于沖動(dòng)和依賴(lài)于影評(píng)的特征信息(如預(yù)告片、劇情介紹、演員目錄、出品公司、制作成本等)來(lái)判斷影片質(zhì)量并以此做出購(gòu)買(mǎi)決策,參照之前已有研究,本文對(duì)如下變量進(jìn)行了控制:電影類(lèi)型(Genre)、電影制式(Type)、主演(LnActor)、片長(zhǎng)(Duration)、年度(Year)和檔期(Schedule)。除在線評(píng)分和片長(zhǎng)變量外,本文對(duì)連續(xù)的自變量均進(jìn)行了對(duì)數(shù)變換,以便使得回歸的結(jié)果更加穩(wěn)健,同時(shí)控制潛在離群值的影響。變量的定義詳見(jiàn)表一。
表一 變量定義表
(續(xù)表)
2.BP神經(jīng)網(wǎng)絡(luò)算法
人工神經(jīng)網(wǎng)絡(luò)是機(jī)器深度學(xué)習(xí)算法的典型代表,既可以應(yīng)用于有監(jiān)督學(xué)習(xí)(回歸、分類(lèi)等),亦可應(yīng)用于無(wú)監(jiān)督學(xué)習(xí)(降維、聚類(lèi)等),與支持向量機(jī)方法相類(lèi)似,其也是一種黑箱算法。與早期單層神經(jīng)網(wǎng)絡(luò)和前饋神經(jīng)網(wǎng)絡(luò)不同,由激活函數(shù)、網(wǎng)絡(luò)結(jié)構(gòu)和優(yōu)化算法所構(gòu)成的反向傳播神經(jīng)網(wǎng)絡(luò)——BP神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)性能上獲得了大幅提升。神經(jīng)網(wǎng)絡(luò)模型的參數(shù)主要包括權(quán)重矩陣、偏誤向量以及包括學(xué)習(xí)率、訓(xùn)練因子、隱藏層層數(shù)、神經(jīng)元個(gè)數(shù)等在內(nèi)的多個(gè)超參數(shù),其能較好地描述數(shù)據(jù)間復(fù)雜的非線性關(guān)系,因此具有非常好的預(yù)測(cè)能力。本研究的人工神經(jīng)網(wǎng)絡(luò)模型設(shè)定為一層隱藏網(wǎng)絡(luò),每層有10個(gè)神經(jīng)元,算法結(jié)構(gòu)如圖一所示。
圖一 電影票房預(yù)測(cè)的BP神經(jīng)網(wǎng)絡(luò)模型
連續(xù)性變量的描述性統(tǒng)計(jì)及相關(guān)關(guān)系如表二、表三所示。從主要變量間相關(guān)系數(shù)的顯著性來(lái)看,網(wǎng)絡(luò)口碑的組成變量均與電影票房在0.01置信水平上統(tǒng)計(jì)差異顯著。為減輕極端觀察值對(duì)研究的影響,研究后續(xù)采用1%的標(biāo)準(zhǔn)對(duì)連續(xù)變量進(jìn)行了縮尾處理。同時(shí),為讓數(shù)據(jù)盡量滿(mǎn)足假設(shè)以便更好地進(jìn)行統(tǒng)計(jì)推斷,對(duì)除在線評(píng)分(Score)和時(shí)長(zhǎng)(Duration)外的連續(xù)變量均采用自然對(duì)數(shù)的方式消除偏態(tài)問(wèn)題,并在線性回歸中采用穩(wěn)健標(biāo)準(zhǔn)誤進(jìn)行估計(jì)以消除異方差對(duì)模型結(jié)果的影響。
表二 變量描述性統(tǒng)計(jì)
(續(xù)表)
表三 主要變量間相關(guān)系數(shù)
從多元線性逐步回歸結(jié)果來(lái)看(見(jiàn)表四),模型中放入網(wǎng)絡(luò)口碑效價(jià)因素(Score),在控制了一系列控制變量后該變量在0.05水平上統(tǒng)計(jì)差異顯著,但是其并未能顯著增加模型的解釋力(模型2)。而當(dāng)模型中加入多個(gè)量值層面的口碑評(píng)價(jià)(模型3),模型的解釋力立刻得到較為顯著的提升,其中新聞數(shù)量(Lnnews)在0.01水平上顯著,評(píng)分人數(shù)(Lnscale)在0.05水平上顯著。數(shù)據(jù)縮尾處理后,模型的解釋力無(wú)顯著變化(模型4),但是微劇評(píng)數(shù)(Lnshortcomment)在0.1水平上表現(xiàn)出顯著。初步來(lái)看,相較于網(wǎng)絡(luò)口碑效價(jià),網(wǎng)絡(luò)口碑量值對(duì)票房預(yù)測(cè)作用更為顯著。
值得注意的是,模型在沒(méi)有放入網(wǎng)絡(luò)口碑量值時(shí),網(wǎng)絡(luò)口碑效價(jià)對(duì)票房的影響是正面的,但加入網(wǎng)絡(luò)口碑量值系列變量后,這一影響機(jī)制發(fā)生了反轉(zhuǎn),在線評(píng)分(Score)對(duì)票房的影響系數(shù)由正轉(zhuǎn)負(fù),且在0.01水平上呈現(xiàn)出顯著。此外,還應(yīng)重點(diǎn)關(guān)注的問(wèn)題是,雖然上述線性回歸都采用了穩(wěn)健標(biāo)準(zhǔn)誤,但是模型的內(nèi)生性問(wèn)題并未從根本上得到解決,因此,有必要就影響機(jī)制做更進(jìn)一步的研究。
表四 多元線性回歸模型
(續(xù)表)
在涉及度量計(jì)算時(shí),變量數(shù)值量級(jí)的差異會(huì)產(chǎn)生很大影響,為提高模型的收斂速度、提高機(jī)器學(xué)習(xí)模型的精度,研究對(duì)主要連續(xù)變量進(jìn)行了min-max歸一化處理,對(duì)分類(lèi)變量進(jìn)行了啞變量處理。根據(jù)電影票房預(yù)測(cè)的BP神經(jīng)網(wǎng)絡(luò)模型(圖一),采用一層隱藏網(wǎng)絡(luò)、每層10個(gè)神經(jīng)元、取訓(xùn)練因子(eta=0.25)的方式進(jìn)行不同次數(shù)的迭代操作,可以發(fā)現(xiàn),隨著迭代次數(shù)的增加,BP神經(jīng)網(wǎng)絡(luò)模型的解釋力也同步上升,迭代1000次時(shí)模型解釋力發(fā)生了躍遷,如表五所示。
表五 BP神經(jīng)網(wǎng)絡(luò)對(duì)電影票房的解釋能力
(續(xù)表)
相較于傳統(tǒng)線性回歸模型,迭代1000次的BP神經(jīng)網(wǎng)絡(luò)模型基本已趨于穩(wěn)定,其校正決定系數(shù)(Adj R-squared)達(dá)到了0.942,與線性回歸模型解釋力相比提升了28.9%,擬合相對(duì)完美,如圖二所示。訓(xùn)練集中機(jī)器學(xué)習(xí)展現(xiàn)出了優(yōu)異的擬合能力,采用非線性函數(shù)方式對(duì)電影票房進(jìn)行預(yù)測(cè),未來(lái)或?qū)⒕哂休^強(qiáng)的實(shí)踐應(yīng)用空間和價(jià)值,當(dāng)然這也需要進(jìn)一步在測(cè)試中集中予以驗(yàn)證。
圖二 神經(jīng)網(wǎng)絡(luò)與線性回歸預(yù)測(cè)電影票房對(duì)比
由于機(jī)器學(xué)習(xí)對(duì)樣本量要求較高,而客觀上囿于當(dāng)前樣本總數(shù)不合適再進(jìn)行二次劃分,故上述神經(jīng)網(wǎng)絡(luò)是將已有全樣本作為訓(xùn)練樣本進(jìn)行的建模,其仍需一批測(cè)試樣本對(duì)模型的外推(預(yù)測(cè)能力)進(jìn)行進(jìn)一步檢驗(yàn)。但換一個(gè)思路,也可通過(guò)BP神經(jīng)網(wǎng)絡(luò)的方法進(jìn)一步找出影響電影票房的關(guān)鍵性因素,從而可以?xún)?yōu)化線性模型對(duì)電影票房的預(yù)測(cè)。在這一設(shè)想下,對(duì)電影票房預(yù)測(cè)的BP神經(jīng)網(wǎng)絡(luò)模型可進(jìn)行適當(dāng)修改,在其他參數(shù)不變的情況下,僅改變神經(jīng)元的個(gè)數(shù)(設(shè)定為1個(gè))和最優(yōu)迭代次數(shù)(iter=500),可以方便地找到在電影票房預(yù)測(cè)中權(quán)重較大的特征(自變量),分別是評(píng)分人數(shù)(Lnscale_w)、微劇評(píng)數(shù)(Lnshortcomment_w)、新聞數(shù)量(Lnnews_w)、題材(Genre)和年份(Year),如表六所示。
表六 BP神經(jīng)網(wǎng)絡(luò)模型特征權(quán)重
(續(xù)表)
表七 優(yōu)化的電影票房預(yù)測(cè)模型
從機(jī)器學(xué)習(xí)遴選的關(guān)鍵解釋變量線性回歸模型可以發(fā)現(xiàn)(見(jiàn)表七),當(dāng)自變量從12個(gè)(基準(zhǔn)線性回歸模型)減少到5個(gè)時(shí),模型的解釋力幾乎沒(méi)有什么變化(校正決定系數(shù)從0.73變化為0.72)。從具體指標(biāo)來(lái)看,在控制類(lèi)型效應(yīng)和年度效應(yīng)后,代表網(wǎng)絡(luò)口碑量值指標(biāo)的評(píng)分人數(shù)(Lnscale_w)、微劇評(píng)數(shù)(Lnshortcomment_w)和新聞數(shù)量(Lnnews_w)均在不同水平上顯著。
以數(shù)據(jù)角度而言,一種常用的穩(wěn)健性檢驗(yàn)方法是剔除可能影響結(jié)論的特殊樣本(極端異常值),從本文之前對(duì)樣本進(jìn)行winsor縮尾處理后進(jìn)行的回歸結(jié)果來(lái)看(模型4),網(wǎng)絡(luò)口碑量值對(duì)電影票房的影響相當(dāng)穩(wěn)定且顯著。為進(jìn)一步揭示研究結(jié)論,本文從以下兩個(gè)方面開(kāi)展了進(jìn)一步的穩(wěn)健性檢驗(yàn)。
1.變換解釋變量
在時(shí)光網(wǎng)之外,諸如豆瓣、貓眼等電影社交平臺(tái)同樣為大眾所熟知,自變量具有不同渠道和方法的測(cè)量為變量替換法提供了可能。研究進(jìn)一步采集了豆瓣電影的評(píng)分?jǐn)?shù)據(jù),基于BP神經(jīng)網(wǎng)絡(luò)進(jìn)行特征選取,得到了完全一致的關(guān)鍵解釋變量。
表八 變換自變量后的核心解釋變量權(quán)重
2.增加遺漏解釋變量
對(duì)電影票房業(yè)績(jī)產(chǎn)生影響的因素很多,除了演員的因素,導(dǎo)演、制片人、發(fā)行公司都被認(rèn)為是可能的關(guān)鍵性因素?;诖?,研究采集了導(dǎo)演相關(guān)數(shù)據(jù)(新浪微博粉絲數(shù)的自然對(duì)數(shù)),同樣基于BP神經(jīng)網(wǎng)絡(luò)進(jìn)行特征選取,與前面結(jié)果不同,長(zhǎng)劇評(píng)數(shù)指標(biāo)(Lnfilmreview_w)特征權(quán)重表現(xiàn)出顯著性,如表九所示。但進(jìn)一步的回歸顯示,如果將長(zhǎng)劇評(píng)數(shù)指標(biāo)放回線性回歸模型(見(jiàn)表十),其既不能增加模型的解釋力,作為自變量本身也未能表現(xiàn)出顯著性。因此,可以認(rèn)為這一自變量實(shí)際上在電影票房預(yù)測(cè)中的作用有限,其之所以能夠在機(jī)器學(xué)習(xí)中呈現(xiàn)特征顯著,主要原因可能是采集樣本過(guò)少。增加的解釋變量(導(dǎo)演)在預(yù)測(cè)模型中也未能表現(xiàn)出顯著性,但這與國(guó)產(chǎn)電影大數(shù)據(jù)分析的結(jié)論相一致——面對(duì)以80后和90后為主導(dǎo)的影視觀眾,知名導(dǎo)演的核心作用并沒(méi)能進(jìn)一步拉升電影票房。
表九 增加遺漏變量后的核心解釋變量權(quán)重
表十 增加遺漏變量后的線性回歸模型
一般認(rèn)為,網(wǎng)絡(luò)口碑對(duì)消費(fèi)者的觀影選擇有著顯著的影響,國(guó)外部分研究也證實(shí)了在發(fā)達(dá)國(guó)家電影市場(chǎng)中口碑評(píng)價(jià)越好的電影票房收入往往也是越高的。但從本文樣本研究來(lái)看,僅就票房預(yù)測(cè)而言,網(wǎng)絡(luò)口碑效價(jià)對(duì)最終票房的預(yù)測(cè)貢獻(xiàn)并不大(如表十一所示)——加入在線評(píng)分(Score)的預(yù)測(cè)模型的校正決定系數(shù)并無(wú)顯著變化。而如果就其影響上看,在線評(píng)分和電影票房之間存在著負(fù)向相關(guān)關(guān)系,這似乎與汪旭輝等(2015)對(duì)中國(guó)電影票房的研究結(jié)論相一致。
表十一 網(wǎng)絡(luò)口碑效價(jià)對(duì)票房的影響
關(guān)于網(wǎng)絡(luò)口碑效價(jià)的研究假設(shè)1沒(méi)有獲得支持。但值得注意的是,網(wǎng)絡(luò)口碑效價(jià)對(duì)電影票房負(fù)向影響是在一個(gè)模型解釋力增加極為有限的情況下顯現(xiàn)的,且這很可能還是一個(gè)高估的結(jié)果,如果繼續(xù)排除遺漏變量或者雙向因果等內(nèi)生性問(wèn)題后,其影響的顯著性或可存疑。
國(guó)內(nèi)電影發(fā)展與國(guó)外成熟產(chǎn)業(yè)間似乎存在著很大的相悖之處,國(guó)產(chǎn)電影“差口碑高票房”的逆增長(zhǎng)現(xiàn)象,可以從兩個(gè)方面進(jìn)一步理解:一種理解是認(rèn)為消費(fèi)者是理性且完全有能力從泛在的網(wǎng)絡(luò)在線評(píng)論中推斷出影片的真實(shí)質(zhì)量,而不必受到電影評(píng)分的左右;另一種可能的解釋是評(píng)價(jià)機(jī)制的自選擇,由于網(wǎng)絡(luò)口碑評(píng)價(jià)有被操縱的可能,水軍對(duì)雇主電影打高分、對(duì)競(jìng)爭(zhēng)對(duì)手電影打低分,直接導(dǎo)致了對(duì)評(píng)分機(jī)制的不信任。
關(guān)于網(wǎng)絡(luò)口碑量值的研究假設(shè)部分獲得了支持(假設(shè)2、假設(shè)3、假設(shè)5)。無(wú)論是評(píng)分人數(shù)、微劇評(píng)數(shù)還是新聞數(shù)量,這些量值實(shí)際上都反映了口碑的知曉和流行程度,“爛片高票房”后面實(shí)際上也生動(dòng)地反映了電影票房的內(nèi)在規(guī)律:在網(wǎng)絡(luò)口碑效價(jià)評(píng)價(jià)上,重復(fù)評(píng)價(jià)、水軍、刷口碑榜等因素對(duì)結(jié)果有較大影響,而這對(duì)網(wǎng)絡(luò)口碑量值的影響要小得多,其原因主要是效價(jià)評(píng)價(jià)是帶有分?jǐn)?shù)權(quán)重杠桿的評(píng)價(jià),而量值評(píng)價(jià)則是均等權(quán)重,這也是人們觀影決策中之所以偏倚網(wǎng)絡(luò)口碑量值的一種解釋。
網(wǎng)絡(luò)口碑量值相較于效價(jià)對(duì)電影票房的決定性影響,為電影營(yíng)銷(xiāo)提供了有益的啟示。對(duì)一個(gè)要求在較短時(shí)間內(nèi)完成的產(chǎn)品擴(kuò)散,過(guò)程不變但行程壓縮毫無(wú)疑問(wèn)會(huì)給營(yíng)銷(xiāo)管理帶來(lái)更多挑戰(zhàn)。電影對(duì)消費(fèi)者而言不是搜尋品而是經(jīng)驗(yàn)品,對(duì)有些觀眾而言,即便是專(zhuān)家的稱(chēng)贊和推薦都不能奏效,他們或許更愿意參考周?chē)后w對(duì)電影的評(píng)價(jià)來(lái)決定這部電影是否值得自己去消費(fèi),這也就是說(shuō),在電影產(chǎn)品屬性之外,網(wǎng)絡(luò)外部性、社會(huì)學(xué)習(xí)實(shí)際上也是解釋票房表現(xiàn)的重要路徑。但值得注意的是,從電影消費(fèi)之后產(chǎn)生的天壤之別的效價(jià)評(píng)分中可以發(fā)現(xiàn),由于信息不對(duì)稱(chēng)、消費(fèi)者意識(shí)形態(tài)和自我建構(gòu)等因素的影響,網(wǎng)絡(luò)口碑效價(jià)的參考價(jià)值相對(duì)有限(但其負(fù)向引導(dǎo)作用是否存在偏誤仍需更多驗(yàn)證),讓更多的受眾“卷入”才是營(yíng)銷(xiāo)的重點(diǎn),廣泛借助媒體推廣、公共關(guān)系、事件營(yíng)銷(xiāo)、“點(diǎn)映”等宣傳推廣手段,讓電影在更大范圍、更多人群中發(fā)酵并催生更多的網(wǎng)絡(luò)口碑——無(wú)論是“吐槽”抑或是“叫好”,這對(duì)提升電影的知曉度及最終票房表現(xiàn)都將產(chǎn)生積極的促進(jìn)作用。
隨著網(wǎng)絡(luò)在線購(gòu)票比例的不斷上升,越來(lái)越多的觀影決策出現(xiàn)在觀眾到達(dá)影院之前。電影購(gòu)買(mǎi)越來(lái)越依賴(lài)于觀眾主動(dòng)的網(wǎng)絡(luò)搜索,他們對(duì)社會(huì)化分享內(nèi)容的識(shí)別機(jī)制直接影響著電影的銷(xiāo)售。評(píng)分人數(shù)、微劇評(píng)數(shù)、新聞數(shù)量在電影票房預(yù)測(cè)中的顯著作用,進(jìn)一步揭示和印證了個(gè)體和專(zhuān)家的評(píng)論參與已成為當(dāng)今電影票房成敗的關(guān)鍵性影響因素。網(wǎng)絡(luò)口碑量值而不是網(wǎng)絡(luò)口碑效價(jià)在票房上發(fā)揮顯著作用,這為電影營(yíng)銷(xiāo)策略的有效調(diào)整提供了思路。勸說(shuō)(網(wǎng)絡(luò)口碑效價(jià))對(duì)于票房表現(xiàn)影響式微,而知曉和從眾(網(wǎng)絡(luò)口碑量值)才是營(yíng)銷(xiāo)應(yīng)當(dāng)主攻的發(fā)力點(diǎn)——在線評(píng)論數(shù)量的多寡實(shí)際上體現(xiàn)了電影的流行性特征,流行性是票房的直接表征,而負(fù)面評(píng)論同樣可以創(chuàng)造出流行性。就此而言,新聞發(fā)布會(huì)、預(yù)告片、主題歌曲、首映活動(dòng)等諸多形式都被認(rèn)為是可以增加觀眾好奇與期待、提升影片話(huà)題討論熱度并最終促成知曉效應(yīng)、從眾效應(yīng)和蜂鳴效應(yīng)的可行路徑。
本文運(yùn)用機(jī)器學(xué)習(xí)的方法提升了對(duì)電影票房的預(yù)測(cè)能力,更為重要的貢獻(xiàn)是,通過(guò)改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型篩選出影響票房表現(xiàn)的關(guān)鍵因素,從而對(duì)電影票房的線性預(yù)測(cè)模型實(shí)現(xiàn)了優(yōu)化改進(jìn)。但值得注意的是,網(wǎng)絡(luò)口碑與電影票房的關(guān)系實(shí)際上并不是外生的,二者存在的反向因果關(guān)系已被相關(guān)研究所證實(shí),找到合適的工具變量進(jìn)一步解決模型的內(nèi)生性問(wèn)題是本文可以進(jìn)一步改進(jìn)之處。
就進(jìn)一步研究而言,本文僅研究了網(wǎng)絡(luò)口碑效價(jià)的一種形式,而潛在消費(fèi)者可能受到其他形式影響,如不進(jìn)一步考慮口碑效價(jià)的具體內(nèi)容,這將不足以深刻理解口碑行為。因此,通過(guò)文本挖掘提取在線評(píng)論中正面負(fù)面情緒比例關(guān)系從而進(jìn)一步理解網(wǎng)絡(luò)口碑效價(jià)對(duì)觀影決策的影響,是未來(lái)值得研究的一個(gè)方向?;谡雇碚摵托畔⒃\斷性理論的分析,網(wǎng)絡(luò)口碑的另一維度——網(wǎng)絡(luò)口碑離散也對(duì)票房有重要影響,網(wǎng)絡(luò)口碑的影響還存在著非全周期性的問(wèn)題,這兩點(diǎn)同樣也值得進(jìn)一步探討。
精彩炫目的高科技影視特效為影視作品創(chuàng)作和實(shí)現(xiàn)帶來(lái)了更多想象空間,但作品的人文情懷、時(shí)代光華和精神共鳴亦不可缺。“惡評(píng)創(chuàng)造票房”的奇觀實(shí)際上是網(wǎng)絡(luò)口碑無(wú)法為觀影決策提供客觀可靠的參考標(biāo)準(zhǔn)下的短暫失序,眼下的熱炒吸睛是資本逐利的應(yīng)時(shí)之舉,但電影美好遠(yuǎn)方必然是道近易從,一個(gè)集專(zhuān)家評(píng)論與網(wǎng)民點(diǎn)評(píng)于一體、規(guī)范可信的網(wǎng)絡(luò)口碑體系不僅能為人們觀影提供有效決策參考,也能成為電影票房名副其實(shí)的風(fēng)向標(biāo)。