張 飛
(東南大學(xué)機(jī)械工程學(xué)院 工業(yè)工程系,江蘇 南京 211189)
本文選取的指標(biāo)共有六項(xiàng),其中包括能代表電影成功的總票房,IMDB評(píng)分,獲獎(jiǎng)次數(shù)等,能代表拍攝電影時(shí)投入的制作花費(fèi)和拍攝時(shí)間。
本文有的數(shù)據(jù)收集自Box Office Mojo官網(wǎng)上的票房排行榜(上映時(shí)間,北美總票房),有的數(shù)據(jù)收集自IMDB電影評(píng)分官網(wǎng)(IMDB評(píng)分),還有數(shù)據(jù)收集自維基百科(獲奧斯卡獎(jiǎng)數(shù),制作花費(fèi),拍攝時(shí)間)進(jìn)行數(shù)據(jù)統(tǒng)計(jì),結(jié)果如表1所示。
主成份分析法也稱主分量分析或矩陣數(shù)據(jù)分析,通過(guò)變量變換的方法把相關(guān)的變量變?yōu)槿舾刹幌嚓P(guān)的綜合指標(biāo)變量。
若某研究對(duì)象有兩項(xiàng)指標(biāo) ζ1和 ζ2,從總體 ζ(ζ1,ζ2)中抽取了 N 個(gè)樣品,它們散布在橢圓平面內(nèi)(見(jiàn)圖1),指標(biāo)ζ1與ζ2有相關(guān)性。η1和η2分別是橢圓的長(zhǎng)軸和短軸,η1⊥η2,故η1與η2互不相關(guān)。其中η1是點(diǎn)ζ(ζ1,ζ2)在長(zhǎng)軸上的投影坐標(biāo),η2是該點(diǎn)在短軸上的投影坐標(biāo)。從圖1可以看出點(diǎn)的N個(gè)觀測(cè)值的波動(dòng)大部分可以歸結(jié)為 η1軸上投影點(diǎn)的波動(dòng),而η2軸上投影點(diǎn)的波動(dòng)較小。若η1作為一個(gè)綜臺(tái)指標(biāo),則η1可較好地反映出N個(gè)觀測(cè)值的變化情況,η2的作用次要。綜合指標(biāo)η1稱為主成份,找出主成份的工作稱為主成份分析。
可見(jiàn),主成份分析即選擇恰當(dāng)?shù)耐队胺较颍瑢⒏呔S空間的點(diǎn)投影到低維空間上,且使低維空間上的投影盡可能多地保存原空間的信息,就是要使低維空間上投影的方差盡可能地大。
圖1 主成份分析法示意圖
為了更直觀的表示電影上映距今多長(zhǎng)時(shí)間與票房之間的關(guān)系,將第一項(xiàng)指標(biāo)“上映時(shí)間”改為“上映距今”,并對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,得到相關(guān)矩陣如表2所示。
表2 標(biāo)準(zhǔn)化處理后的矩陣
運(yùn)行SPSS軟件,錄入上述數(shù)據(jù),進(jìn)行主成份分析,輸出成分矩陣,如表3所示,輸出成分圖,如圖2所示。
表3 成份矩陣
圖2
由主成份計(jì)算結(jié)果可知,選取三個(gè)主成份來(lái)進(jìn)行分析,這三個(gè)主成份的方差累計(jì)貢獻(xiàn)率達(dá)到了99.85%,其中第一主成分占67%,第二主成份占16%,第三主成份占14%,可以認(rèn)為這三個(gè)主成分極大程度上反映了原始數(shù)據(jù)。
在第一主成份中,北美總票房,獲獎(jiǎng)數(shù),制作花費(fèi),拍攝時(shí)間這三個(gè)占有很大的權(quán)重,而且他們的變化方向一致,呈正相關(guān)關(guān)系,這說(shuō)明在拍攝電影時(shí)投入越多資金,拍攝時(shí)間越長(zhǎng),出產(chǎn)的電影越能得到更高的票房,而且更有機(jī)會(huì)獲獎(jiǎng)。事實(shí)上,投入更多資金就意味著能請(qǐng)更好的編劇寫出更好的劇本,請(qǐng)更好的導(dǎo)演和著名影星,更能使用更高級(jí)的道具設(shè)備等,優(yōu)越的硬件條件是出產(chǎn)好電影的基礎(chǔ);投入更多的時(shí)間拍攝就意味著導(dǎo)演對(duì)于每個(gè)鏡頭要求都非常嚴(yán)格,精工細(xì)作才能出產(chǎn)好的電影。
另外,上映距今和總票房之間變化方向相反,呈負(fù)相關(guān)關(guān)系,這與常識(shí)是不相符,一般情況下距今時(shí)間越長(zhǎng),總票房越高,但是現(xiàn)在的金錢與過(guò)去的是不等值的,而且在過(guò)去電影還沒(méi)有現(xiàn)在這么流行,還不是人們?nèi)粘I畋夭豢缮俚囊徊糠?,不是所有人都能看得起電影的,所以一定程度上是可以解釋這種現(xiàn)象。
在第二主成份中,只有IMDB的占有權(quán)重很大,但是可以發(fā)現(xiàn)所有的指標(biāo)變化方向都是一致的,呈正相關(guān)關(guān)系,只是反映沒(méi)有第一主成份里那么明顯,但是也從一定程度上說(shuō)明了第一主成分說(shuō)明的問(wèn)題,不同的是總票房和獲獎(jiǎng)次數(shù)并不能準(zhǔn)確說(shuō)明電影是不是受觀眾喜愛(ài),而IMDB評(píng)分則彌補(bǔ)了這一點(diǎn)??偟膩?lái)說(shuō)就是在拍攝電影時(shí)投入資金越多,拍攝時(shí)間越長(zhǎng),出產(chǎn)的電影越能獲得觀眾的喜愛(ài),從而獲得高票房。
在成分圖中可以更直觀的看出總票房,獲獎(jiǎng)數(shù),評(píng)分等與投入的金錢,時(shí)間之間的關(guān)系。成分圖表明總票房,獲獎(jiǎng)數(shù),IMDB評(píng)分,制作花費(fèi),拍攝時(shí)間這幾項(xiàng)是密切相關(guān)的,且呈正相關(guān)關(guān)系,很好的驗(yàn)證了第一主成分,第二主成分中說(shuō)明的問(wèn)題。
本文利用主成分分析法就卡梅隆的電影相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得出了成功的電影背后少不了時(shí)間和金錢的投入。當(dāng)然,不排除實(shí)際上還有很多影響因素,比如獲獎(jiǎng)次數(shù),就《泰坦尼克號(hào)》來(lái)說(shuō)一下激增到11項(xiàng),這在電影史上是罕有的,也間接說(shuō)明了《泰坦尼克號(hào)》是一部劃時(shí)代的大作;《異形2》屬于恐怖類科幻片,這類影片在當(dāng)時(shí)想被奧斯卡獎(jiǎng)提名都很難,而它是首部獲奧斯卡獎(jiǎng)的恐怖類科幻片,而且還不止一項(xiàng);再說(shuō)票房,北美歷史上是發(fā)生過(guò)通貨膨脹的,這也在一定程度上影響了票房的數(shù)據(jù)……但是計(jì)算結(jié)果還是可以反映一定問(wèn)題的,不影響結(jié)論,在電影投入的越多,拍攝時(shí)間越長(zhǎng),完成的電影就越會(huì)得到觀眾喜歡,票房自然就會(huì)上去。卡梅隆導(dǎo)演就是深諳這個(gè)道理,他從不會(huì)在電影上吝嗇,不論花多大代價(jià),花多長(zhǎng)時(shí)間,都會(huì)完成他的大作,一部《阿凡達(dá)》他醞釀了14年,耗資5億美元(約合人民幣27.2億元),歷時(shí)四年拍制,最終震撼了全世界,十年磨一劍,必是寶劍。
[1]汪應(yīng)洛.系統(tǒng)工程[M].北京:機(jī)械工業(yè)出版社,2009:54-60.
[2]方開(kāi)泰.實(shí)用多元統(tǒng)計(jì)分析[M].上海:華東師范大學(xué)出版社,1989.
[3]崔凝凝,唐嘉庚.基于回歸分析的中國(guó)電影票房影響因素研究[J].江蘇商論,2012(08).
[4]王建陵.當(dāng)代西方電影票房預(yù)測(cè)研究的發(fā)展演變[J].電影藝術(shù),2009(01).