吳 玨, 潘 徐
根據(jù)第八屆北京國際電影節(jié)上官方披露的數(shù)據(jù),中國已經成為世界第二大電影市場,2017年的總票房達到了559.11億元,相比2007年,這個數(shù)字已經增長了將近16倍。其中國產電影票房為301.04億元,占據(jù)票房總額53.84%,全國新增銀幕9597塊,銀幕總數(shù)已達到50776塊,位居世界第一,2002年這個數(shù)字還不足2000塊。與此同時,《中華人民共和國電影產業(yè)促進法》于2017年正式實施,宣告了中國電影業(yè)進入了新的階段。中國電影市場高速增長的背后,是電影消費市場、電影產量以及電影產業(yè)的快速擴張,同時也是相關電影、影視研究者面臨的巨大課題。這不僅在于電影市場的變化,還在于在這十幾年間,觀眾的生活方式和觀影環(huán)境也產生了巨變,電影線上社區(qū)、電子購票平臺、宣發(fā)新場景等這一切都為觀眾的口味、電影的發(fā)行以及票房成績帶來更復雜的不確定性。另外,我們還看到,2017年國產電影產生了不少“現(xiàn)象級”的新事物,比如主旋律電影《戰(zhàn)狼2》的票房奇跡,《二十二》《岡仁波齊》等藝術片、紀錄片的觀影熱潮,這是業(yè)內人士始料未及的,說明中國電影市場正在向多元化發(fā)展。以上數(shù)據(jù)都說明,關于中國電影和觀眾,傳統(tǒng)經驗中的一些結論或者規(guī)律可能都在面臨失效,電影投資戰(zhàn)略、宣發(fā)策略、消費者選擇、類型片票房預測等正等待被改寫。
由于電影投資的不確定性,電影票房預測一直是電影產業(yè)中最為人關注的課題之一。目前市場內尚未找到一種統(tǒng)一或公認的方法論。從前人的研究中,我們可以看到,研究者們一直在嘗試探索和驗證與電影票房相關的因素,并且隨著市場環(huán)境的變化,每一代研究者都在更新自己的研究思路和側重點。本研究旨在探索消費者在社交媒體上的內容消費情況與電影票房之間的關系,驗證用戶在電影資訊閱讀上的傾向是否能夠作為電影票房預測的指標。
本文將首先回顧國內外電影票房預測的研究成果,之后將觀眾的觀影期待和消費傾向作為中心,把消費者在社交平臺上的閱讀行為,作為電影上映前、上映前期的觀影期待與消費意向的量化指標,再加入線上電影社區(qū)及影院排片等相關數(shù)據(jù),通過實證的研究方法建構電影票房預測模型,最終確定用戶社交平臺閱讀行為與電影票房成績之間的關系。
電影作為一項投資風險較高的項目,對于其最終經濟收益的考量,是電影產業(yè)的核心議題之一。隨著電影在制作、宣發(fā)等各個階段的成熟,對于電影票房的預測逐漸成為可能,業(yè)界和學界也在不斷探索預測機制或者模型,以期在對票房收入的預估上占有更主動的位置。
較為成熟的電影票房預測模型,最早可追溯到Litman(1989)在20世紀80年代發(fā)表的文章PredictingFinancialSuccessofMotionPictures:The’80sExperience。文中,Litman的思路主要是根據(jù)電影生產過程中的三個階段,將各個階段可以被量化的指標提取出來,通過研究,最終得到的回歸方程如下:
Litman的研究認為,在創(chuàng)意階段,頂級導演、演員、北美地區(qū)出產、科幻電影、續(xù)集這幾個變量與電影票房收入呈正相關,但都不顯著。在發(fā)行階段,暑期檔和大發(fā)行公司具有積極作用,電影提名和專業(yè)影評能夠促進電影票房的收入,且結果顯著。
到了90年代, Sochay(1994)在PredictingthePerformanceofMotionPictures一文中提出了自己的預測模型。該模型依然延續(xù)了三階段的劃分方法。Sochay的創(chuàng)新之處主要在于加入了“市場集中度”這個變量。其回歸方程為:
(CR104指的是電影上映四周后,排名前十的票房收入/總的票房收入的比例)
Sochay的研究認為:MPAA R、市場集中度與電影票房收入負相關。對于市場集中度來說,在第一周到第四周的CR4模型中,第一周的電影票房收入與市場集中度沒有關系;第二周到第四周,市場集中度和電影票房收入是反向關系。這個結論也使得模型更具有動態(tài)性。
2005年,Byeng-Hee Chang和Eyun-Jung Ki(2005)在DevisingaPracticalModelforPredictingTheatricalMoviesSuccess:FocusingontheExperienceGoodProperty一文中,將電影票房預測模型的因變量增加至3個——總票房、首映周票房和放映周數(shù)。自變量仍然基本沿用了前人的設計,但是對續(xù)集、導演和演員這幾個內容性的指標做了細化。續(xù)集1指的是電影續(xù)集,續(xù)集2則是改編自其他媒介的電影續(xù)集;演員1/導演1是指該片第一主角演員/導演最近一部出演的電影票房,演員2/導演2則是該演員/導演所有電影的票房之和。由于學界對這三個指標的作用分歧較大,故而兩位研究者將演員以及導演的影響力分為流行度和歷史口碑兩個維度,將這兩個維度進行量化,試圖探討演員和導演的什么特質影響了票房。該研究最后得到的回歸方程為:
Chang和Ki在結論中認為,明星品牌影響力和導演品牌影響力都未強到可以影響票房成功的地步。但要得出明星與票房之間的關系還言之過早,尤其是考慮到量化電影全部演員影響力和導演影響力的方法還存在一定難度。
以上是針對美國電影票房的研究中最典型的三個預測模型,尤其是Litman的模型,時至今日仍然對國內外學者的研究起到了奠基性的作用(王建陵,2009)。而中國電影市場在成長與規(guī)模擴大中,顯現(xiàn)出了不同于好萊塢的特性,加之互聯(lián)網的崛起后,尤其是線上電影社區(qū)和娛樂社交平臺的勃興,為電影票房帶來了更大的變數(shù)。這些針對海外市場的模型或多或少已經不能適用于國內市場和國產電影,國內的學者開始探索適合中國電影市場票房預測的模型。
王錦慧和尹一伊分別對Litman的模型進行了局部優(yōu)化,并通過一定數(shù)量的中國電影票房結果進行檢驗:王錦慧認為,制作水平、導演執(zhí)導的上一部電影作品的票房收入、書刊(小說、雜志、名著等)改編、動作片和劇情片與票房結果呈現(xiàn)正相關,而演員、檔期、畫質、發(fā)行對于電影票房收入的影響,相對而言沒有那么重要(王錦慧、晏思雨,2015);尹一伊的結果與Litman的不同之處在于,類型對國產影片票房仍然存在影響,知名導演和著名演員仍然對經濟上的成功有顯著影響,檔期對于票房結果沒有顯著相關(尹一伊,2013)。王錦慧在2016年的最新研究中又選取了演員、導演、放映時間、制作公司、發(fā)行公司、影評、特效以及首周票房作為自變量,最終得到的預測模型為:
即認為,首周票房、導演和制作公司是影響最大的3個要素(王錦慧等,2016)。羅曉芃同樣也考慮到了首映周票房作為自變量對票房預測的可能性,該研究嘗試以質量信號傳遞理論為基本理論框架,其結果表明,放映場次和觀影人數(shù)與票房無明顯相關,而在其他條件不變的情況下,電影的前一日票房增加一倍,后一日票房將提高1.14%;票房對低位和高位票價的變動也較為敏感,涉及動作、劇情、喜劇等元素的類型片、檔期內有點映、進口續(xù)集電影、高網絡評分等因素對電影票房也有促進作用(羅曉芃等,2016)。我們發(fā)現(xiàn),以上研究均認同類型片對于中國電影票房的影響,但對于導演、演員、檔期等自變量的結論則大相徑庭。張倫等人的研究則著重在不同類別的電影票房之間的競合關系。其研究證實了電影類別之間同時存在票房的競爭與合作關系(張倫等,2017)。
在學者們不斷思考和驗證影響票房的諸多因素時,電影市場“泛影評化”的趨向使得第三方意見愈加成為重點考慮的因素之一。越來越多的娛樂平臺、社交平臺開發(fā)了電影打分機制、推薦機制和評論社交平臺,電影評論不再是一小部分電影專家的專職,尤其是分數(shù)化的打分機制為電影評價數(shù)據(jù)化提供了基礎。有學者認為,“電影評分的整體化評價成為網絡時代最便捷、最直觀、最經濟的電影評價方式,這也與數(shù)字化的(digital)電影創(chuàng)作和數(shù)據(jù)化(datamation)的電影產業(yè)相一致。群體均分迅速在全球掀起了一陣風潮,作為一種特殊的電影現(xiàn)象,成為電影評價歷史上的一場革命”(王偉,2017,p.15)。在這場“革命”之下,學界也在積極探索網絡評價/網民意見對電影票房的影響。
王煉將網絡搜索作為消費者觀影意愿的指標,并且將電影票房市場劃分為首映周和后續(xù)周分別進行研究。研究結果顯示,在電影上映前一周的網絡搜索指數(shù)增加一倍,首映周票房將提高17%;在后續(xù)周中,這個數(shù)據(jù)為15%(王煉、賈建民,2014)。該研究說明,線上行為在一定程度上可以替代線下行為作為消費者意愿的量化指標,但僅僅考慮“搜索”這個單一行為,略顯單薄。王曉耘等人結合情感分析和神經網絡提出一種基于微博的首映周票房預測模型,該研究的創(chuàng)新之處在于對消費者消費意圖的識別以及對用戶影響力的定義等(王曉耘,2016)。史偉(2015)的研究同樣也運用到了情感分析的工具,其情感預測模型結果顯示,發(fā)表在前1天的電影微博反映的情感信息對票房的預測效果最好。以上兩個研究基本已經“去電影化”,即不考慮電影在創(chuàng)作、發(fā)行等層面的相關因素,僅專注于社交平臺的用戶文本,而忽視了電影作為文化工業(yè)自身所同時具備的藝術性和包含電影宣發(fā)在內的商業(yè)性。在國外學者的研究中,Daehoon Kim等人的研究就嘗試在建立用戶意見語料庫的同時,還結合了包括演員、導演、編劇在內的電影營銷賣點,證明結合電影信息和用戶評價的票房預測模型獲得了更高的準確率(Kim et al.,2013),這將是本文所延續(xù)的研究思路。
縱觀以上種種預測方法,學者們似乎都沒有將消費者本身的偏好和期待納入考慮的范圍。觀眾在決定購買電影票之前,會受到多種信息的影響,包括電影宣發(fā)、專業(yè)評價、民間評價等。上述研究都只關注了電影制作方的視角,而忽略了這些營銷策略對消費者本身的真實效果,只有極少數(shù)的研究采用了問卷法進行消費者意愿調查。與此同時,在線下數(shù)據(jù)極難獲得的情況下,如何將目標消費者和潛在消費者的消費動機量化就成為一個難題。因此,本研究將把消費者在社交平臺上的閱讀行為,作為電影上映前、上映前期衡量觀影期待與消費意向的量化指標,探討電影票房與用戶社交平臺閱讀行為之間的關系。
本研究所建立的票房預測模型基于內容消費者的視角展開,一個普通消費者對于“是否要去看一部電影”的判斷基于三個層面:其一是對電影創(chuàng)作層面的期待值和偏好度,包括演員、導演、風格等種種因素;其二是來自他人的評價,比如來自媒體、社交生活和電影娛樂平臺;其三則是消費場所本身所提供的“菜單”,即影院分配的電影排片占比。
就第一個層面而言,本文將選取社交網站的用戶閱讀數(shù)據(jù)作為數(shù)據(jù)指標,具體的行為數(shù)據(jù)包括電影上映前和首映周閱讀量、互動量等。從上述文獻回顧可以看到,研究者對于演員、導演、風格究竟在多大程度上會影響票房結果,并且如何影響,都處于莫衷一是的狀態(tài)。但如果將問題簡化,即是討論電影創(chuàng)作層面的因素如何影響消費者的觀影行為。因此,研究通過選取用戶在電影上映前對于電影相關資訊的閱讀與反饋情況,量化用戶對于電影資訊的感興趣程度,試圖驗證是否用戶在社交平臺上閱讀相關資訊的活躍度越高,則用戶就越有可能去影院消費該部電影。
王文文在研究中證明了社會化媒體在一定程度上可以對電影票房進行預測,電影上映后一周新浪微博中有關電影的信息數(shù)與豆瓣評分的乘積對票房有直接影響(王文文等,2013)。但在本研究中,在社交平臺的選擇上,將選取今日頭條的閱讀數(shù)據(jù)作為研究對象。今日頭條作為社交平臺的特殊之處在于其個性化推薦的分發(fā)機制,就本研究所著重解決的消費者偏好問題而言,具有代表性。該平臺的分發(fā)原理在于系統(tǒng)會首先采集海量信息,智能分析出熱門資訊,并為所有資訊分別打上各種標簽;其次,推薦引擎會根據(jù)用戶以往獲取信息的情況,建立用戶個人標簽模型。兩者結合、匹配,就能形成個性化推薦機制。因此,今日頭條的閱讀數(shù)據(jù)本身就包含了用戶以往的喜好、偏好和閱讀記錄,使得數(shù)據(jù)更具有延展性。加之今日頭條所采集的資訊既包括自媒體,也包括機構媒體,即同時具備了媒體專業(yè)評價、觀眾意見領袖以及影片營銷資訊,使得用戶接受電影資訊的環(huán)境較為完整。因此,本研究將把今日頭條的閱讀數(shù)據(jù),包括文章數(shù)、閱讀量、評論量、轉發(fā)量、收藏量作為用戶在社交平臺上的閱讀數(shù)據(jù)。另外,需要特別說明的是,從今日頭條平臺所收集到的數(shù)據(jù)均經過了“去重”的處理,也就是說如果有兩篇文章的內容重合度達到了一定的比例,在統(tǒng)計上僅計作一篇。這樣的“脫水”數(shù)據(jù)能夠更加直觀地反映出平臺用戶整體的閱讀興趣和內容消費動態(tài)所在。
在第二個層面上,今日頭條閱讀數(shù)據(jù)解決了用戶關注的問題,但是沒有反應大眾是正向還是負向關注;而電影評價對于票房具有影響。因此,研究將選取豆瓣電影的相關數(shù)據(jù)作為第三方情感評價的量化數(shù)據(jù),包括電影評分(rating)及打分人次(volume)兩個數(shù)據(jù)。
在第三層面上,前兩個層面解決了用戶的問題,而院線對于電影的預期,以及排片安排,也是影響票房的重要因素??紤]院線平均排片的另一個好處是,院線會綜合考慮同期電影競爭,因此,平均排片是一個綜合指標,研究將選取貓眼電影平臺上映第一周的平均排片量作為影院排片占比數(shù)據(jù)。
1. 數(shù)據(jù)準備
綜合以上考慮,本研究將選取以下數(shù)據(jù)以備檢驗:首先是票房數(shù)據(jù)的準備。研究從中國票房網(http://www.cbooo.cn/movies)按照總票房降序排列,爬取了排名前1600部的電影數(shù)據(jù),得到中國電影票房最高的1600部電影。其次是選取社交平臺閱讀數(shù)據(jù)。如前所述,本文使用今日頭條的頭條指數(shù)平臺作為用戶在社交平臺的閱讀數(shù)據(jù),該平臺將為研究提供包括文章數(shù)、閱讀量、評論、轉發(fā)、收藏、喜歡、不喜歡等在內的各項閱讀數(shù)據(jù)。最終,研究爬取了2015—2017年各個電影在大陸上映前兩周的閱讀數(shù)據(jù)。再次,在電影評分數(shù)據(jù)方面,研究結合了前人研究經驗以及實際情況,選定豆瓣電影的相關評分數(shù)據(jù)作為觀眾評分數(shù)據(jù)。最終,爬取了豆瓣電影2015—2017年電影的評分數(shù)據(jù),總計1876部,數(shù)據(jù)包括電影評分、打分人次、電影標簽。貓眼排片數(shù)據(jù):就目前而言,貓眼平臺所提供的排片數(shù)據(jù)是外部人員可獲得相關數(shù)據(jù)較為權威的渠道,因而研究爬取了在2015—2017年上映的全部1962部電影的排片數(shù)據(jù)。根據(jù)行業(yè)經驗,電影上映后七天內的排片數(shù)據(jù)最為關鍵,最后選擇1962部電影上映日起七天內的排片率數(shù)據(jù)。
2. 研究結果
在各項數(shù)據(jù)準備完成之后,利用python工具,以電影名稱作為匹配項,融合了以上四個來源的數(shù)據(jù),最終得到2015—2017年全三年中507部電影的有效數(shù)據(jù)。為了消除奇異值對模型的可能影響,本文刪除了1000萬票房以下的電影數(shù)據(jù),同時結合頭條平臺的平均閱讀數(shù)據(jù),去掉了文章數(shù)在30以下的電影數(shù)據(jù)。在以上數(shù)據(jù)篩選后,最后共計478部電影用于模型構建。
將以上四大來源的字段作為自變量,依次標記為文章(articles)、一周平均排片(seven_arran)、豆瓣評價(rate)、豆瓣評價人數(shù)(rate_num)、閱讀數(shù)(readings)、點贊數(shù)(likes)、踩(unlikes)、收藏(sc)、評論(comments)、轉發(fā)(sharings)進行數(shù)據(jù)分析。研究結果的調整R2為0.966,表明電影票房同自變量的總體相關程度為0.966,相關程度高。
從對各自變量的線性關系顯著性檢驗中看,顯著的自變量有:文章數(shù)、七天平均排片、豆瓣評價人數(shù)、不喜歡(踩)數(shù)、收藏數(shù)和分享數(shù),見表1。
表1 變量線性關系顯著性檢驗一
(續(xù)表)
*在顯著水平為0.05時顯著; **在顯著水平0.01時顯著; ***在顯著水平0.001時顯著。
使用顯著的自變量進行多元線性回歸,R2依然為0.966,說明剔除不顯著自變量對于總體相關程度幾乎無影響。得到回歸方程為:
見表2。
表2 變量線性關系顯著性檢驗二
*在顯著水平為0.05時顯著; **在顯著水平0.01時顯著; ***在顯著水平0.001時顯著。
其中七天平均排片反映了該電影的放映空間大小,從某種程度折射出相關市場對該電影“是否賣座”的估計或者支持程度;文章、豆瓣評價人數(shù)均反映了電影在消費者/用戶中的聲量大小,這與前人研究所得出的“評分人數(shù)重要于電影評分”不謀而合。電影市場中經常會出現(xiàn)“叫好”與“叫座”不同步的現(xiàn)象,其本質也正是“票房更關乎聲量而非質量”。不喜歡數(shù)、收藏數(shù)和分享數(shù)則是諸多閱讀行為中更為主動的深度用戶行為,這說明用戶對于某部電影的主動反饋行為與消費者的市場選擇存在著一定的聯(lián)系。
為了驗證模型的可靠性,本研究選取2018年春節(jié)檔的6部電影作為檢驗,分別為《祖宗十九代》《熊出沒:變形記》《西游記女兒國》《捉妖記2》《唐人街探案2》和《紅海行動》。這六部電影涵蓋了喜劇片、動畫片、續(xù)集、動作片等各個類型的電影,且在票房上均超過1億元,符合研究的數(shù)據(jù)要求。各電影的數(shù)據(jù)收集及預測情況見表3。
表3 2018年春節(jié)檔電影數(shù)據(jù)
從預測票房與實際票房的結果對比來看,平均預測正確率高達91.2%,本研究模型的預測效果得到驗證。但從結果來看,《熊出沒:變形記》的預測結果偏差最大,主要的原因可能與頭條平臺上兒童相關資訊較少的限制有關?!都t海行動》作為春節(jié)檔最強黑馬,其票房表現(xiàn)出乎了許多業(yè)內人士的意料,但通過本研究的預測模型,最終結果準確率達到94.7%。從前期收集的數(shù)據(jù)來看,《紅海行動》雖然在七天排片率并不高,但在平臺文章數(shù)、評分人數(shù)、分享人數(shù)等數(shù)據(jù)上均領先其他影片,這與該電影在實際放映過程中收獲的口碑和討論度并由此帶來的觀影熱潮息息相關。與《戰(zhàn)狼2》的票房奇跡類似,代表了這類新型主旋律電影的崛起。前人經典模型專注在電影制作本身的因素,但是這樣的范式顯然是無法預測到“意外”的到來。
圖1 票房預測模型擬合效果
本研究基于內容消費者的視角展開,從社交媒體資訊消費情況、觀眾評價以及市場放映空間三個維度入手,探討與電影票房結果相關的因素。研究搜集了2015—2017年這三年中總計478部電影的數(shù)據(jù),通過實證的研究方法,發(fā)現(xiàn)顯著的自變量有文章數(shù)、七天平均排片、豆瓣評價人數(shù)、不喜歡(踩)數(shù)、收藏數(shù)和分享數(shù),并得到了票房預測的回歸方程。之后,研究選取了2018年春節(jié)檔的六部電影進行模型驗證,驗證結果的準確率達到91.2%,說明本研究的預測模型具有較高的可靠性。通過實證研究,文章驗證了社交平臺資訊閱讀情況與電影模型之間的相關性,發(fā)現(xiàn)用戶關于某部電影的主動閱讀行為與票房結果顯著相關。
研究還發(fā)現(xiàn),觀眾評分的具體分數(shù)對于最終票房的結果影響較小,而評分人數(shù)則顯著相關。其原因可能在于,對于票房而言,一部好片或爛片,聲量仍然大于質量。丁漢青(2016)在研究中認為,網絡口碑量充當了信息性角色(informative),加強觀影者對電影作品的知曉(awareness),因此網絡口碑量越大意味著越多人知道這部電影,而更高的知名度傾向于產生更好的票房收入,而網絡口碑褒貶則充當了勸服性角色(persuasive)。我們可以看到在樣本電影中,票房超過5億元的影片,平均豆瓣評分僅有6.75分,平均打分人數(shù)約為17萬人,頭條三周文章數(shù)達到588.75篇;而票房超過10億元的電影,平均豆瓣評分也僅有6.74分,但頭條三周文章數(shù)飆升到877.11篇,平均打分人數(shù)高達21萬人。另外,豆瓣平臺作為目前最活躍的線上電影社區(qū)之一,根據(jù)其公布的用戶數(shù)據(jù),截至2016年年底,豆瓣注冊用戶1.5億,月活躍用戶3億。相比于頭部社交平臺,其用戶總量仍然偏小,比如今日頭條截至2016年年底,日活躍用戶就已達到7400萬。而且豆瓣的用戶主要為一、二線城市的白領和大學生,用戶屬性比較突出,其消費品位并不能代表全國電影市場。但是,觀影人數(shù)的多與少卻能從某種程度上是該電影所擁有市場大小的縮影。
研究的創(chuàng)新之處在于放棄了電影生產方面(包括演員、導演、類型等)的因素,而直接將消費者轉換為用戶,從用戶在社交平臺上反映出對某部電影相關資訊的關注程度來預測電影票房成績。前人因為選取樣本或者研究方法的不同,對于電影本身的因素究竟如何決定了票房結果產生了大相徑庭的結果,對于電影市場而言并無特別大的指導意義。尤其是當我們反觀近幾年的電影市場,經常出現(xiàn)“反規(guī)律”的現(xiàn)象,比如新手導演/演員一炮而紅,再比如電影宣發(fā)的策略日新月異,不再是僅僅局限于大牌演員、大牌導演,因而出現(xiàn)了不少“三無”電影(無名導演、無名演員、無宣發(fā)經費)的票房奇跡。從本研究的結果來看,在社交媒體平臺上,用戶的深層互動行為與票房結果顯著相關,這三項都是用戶閱讀行為中情感濃度最強烈的行為,且是被水軍等非正常用戶數(shù)據(jù)干擾最少的閱讀數(shù)據(jù)。因而可以說,這三項指標可以直接轉換為用戶的消費傾向的測量指標。
從研究模型及其驗證結果來看,文章數(shù)在票房結果的預測中具有更為重要的地位,這說明電影資訊的露出仍然是決定電影票房最關鍵的因素。本研究將文章數(shù)理解為電影宣發(fā)力度與用戶間口碑傳播的綜合結果,因為平臺文章除了來自影片方的主動宣發(fā)渠道之外,也有許多自媒體人和用戶的主動寫作行為,而后者既是一種基于口碑自發(fā)的傳播行為,也不排除自媒體人基于市場熱度的內容創(chuàng)作選擇。從這個角度來說,一部電影的宣發(fā)除了需要考慮在上映前的投入,還需要考慮在電影上映后激發(fā)用戶的積極性,維持電影作為話題的熱度,相比于前者的單向傳播與專業(yè)影評,這種來自消費者群體內部的網狀傳播對于激發(fā)票房潛力更加有效。
由于研究便利性,本研究的所有社交媒體數(shù)據(jù)均來自今日頭條閱讀數(shù)據(jù)??紤]到預測模型的科學性和普適性,未來還有待于研究者使用其他平臺的數(shù)據(jù)進行驗證和調整,使得預測模型都能普遍適用于互聯(lián)網資訊的整體消費情況。另外,考慮到今日頭條平臺用戶的閱讀傾向性,本研究的閱讀數(shù)據(jù)可能對于某些類型的電影存在偏向性,比如更有利于國產電影和非冷門的票房預測,從驗證結果我們也可以看到兒童動畫電影的預測結果就存在一定偏差。由于時間有限,未能根據(jù)電影的國別和受眾市場大小進行模型的多樣化建構,在未來的工作中,研究者將針對這兩個方向進行進一步的探索。