劉亞云 艾均 蘇湛
摘 要:復(fù)雜網(wǎng)絡(luò)理論可用于分析各領(lǐng)域的復(fù)雜系統(tǒng)。針對(duì)中國(guó)內(nèi)地電影的復(fù)雜關(guān)系,設(shè)計(jì)網(wǎng)絡(luò)建模算法,依據(jù)2017年票房榜排名前200的電影信息,以數(shù)據(jù)集中的實(shí)體為節(jié)點(diǎn)、實(shí)體之間的關(guān)系為邊,構(gòu)建復(fù)雜網(wǎng)絡(luò)模型,基于該模型對(duì)2017年度中國(guó)內(nèi)地電影復(fù)雜網(wǎng)絡(luò)進(jìn)行分析。結(jié)果表明,高產(chǎn)演員對(duì)票房無(wú)明顯影響;介數(shù)中心性和特征向量中心性均小于特定值時(shí),電影票房失敗的概率較高;介數(shù)中心性和特征向量中心性分布在特定區(qū)域之內(nèi)時(shí),電影獲得高票房的概率高達(dá)73%。建模實(shí)驗(yàn)與基于模型的分析證明了2017年中國(guó)內(nèi)地電影復(fù)雜網(wǎng)絡(luò)建模的有效性,揭示了電影票房和電影復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)中心性之間的相關(guān)性。
關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò);電影票房;度值中心性;介數(shù)中心性;特征向量中心性
DOI:10. 11907/rjdk. 191629 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類(lèi)號(hào):TP303文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)002-0027-08
英標(biāo):Complex Network Modeling and Analysis of Chinese Mainland Films in 2017
英作:LIU Ya-yun, AI Jun, SU Zhan
英單:(School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology, Shanghai 200093,China)
Abstract: Complex network theory can be used to analyze complex systems in various fields. Aiming at the complex relationship between Chinese mainland movies, the network modeling algorithm was designed. Based on the top 200 movies in the 2017 box office list, the complex network model was constructed by taking the entities in the data set as nodes and the relationship between entities as edges. Based on this model, the 2017 complex network of Chinese mainland films was analyzed. The analysis found that productive actors have no significant influence on the box office; when the betweenness centrality and the eigenvector centrality are less than a certain value, the probability of a failure box office is higher; when the betweenness centrality and the eigenvector centrality are distributed within a specific area, the probability of a movie getting a high box office is as high as 73%. Experiments and analysis proved the effectiveness of the complex network modeling of Chinese movie in 2017, revealing the correlation between the centrality of the box office and the complex network of movies.
Key Words: complex networks; box office; degree centrality; betweenness centrality; eigenvector centrality
0 引言
現(xiàn)實(shí)生活中,許多復(fù)雜系統(tǒng)都可以建模成各種復(fù)雜網(wǎng)絡(luò)進(jìn)行分析。通常而言,復(fù)雜網(wǎng)絡(luò)由許多個(gè)節(jié)點(diǎn)和連接兩節(jié)點(diǎn)的連邊組成,節(jié)點(diǎn)代表現(xiàn)實(shí)生活中的個(gè)體,而連邊則用來(lái)表示個(gè)體之間的關(guān)系。有邊相連的兩個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中被看作是相鄰的。例如,神經(jīng)系統(tǒng)可以看作是大量神經(jīng)細(xì)胞通過(guò)神經(jīng)纖維相互連接形成的網(wǎng)絡(luò)[1];計(jì)算機(jī)網(wǎng)絡(luò)可以看作是自主工作的計(jì)算機(jī)通過(guò)通信介質(zhì)如光纜、雙絞線(xiàn)、同軸電纜等相互連接形成的網(wǎng)[2]。 類(lèi)似的還有電力網(wǎng)絡(luò)、社會(huì)關(guān)系網(wǎng)絡(luò)、交通網(wǎng)絡(luò)等[3-5]。
數(shù)學(xué)家和物理學(xué)家在考慮網(wǎng)絡(luò)時(shí),往往只關(guān)心節(jié)點(diǎn)之間有沒(méi)有邊相連,至于節(jié)點(diǎn)位置、邊的長(zhǎng)短與曲直、是否相交等特性都不在考慮范圍內(nèi)。網(wǎng)絡(luò)不依賴(lài)于節(jié)點(diǎn)的具體位置和邊的具體形態(tài)就能表現(xiàn)出來(lái)的性質(zhì)為網(wǎng)絡(luò)拓?fù)湫再|(zhì),相應(yīng)結(jié)構(gòu)為網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。能描述真實(shí)世界的拓?fù)浣Y(jié)構(gòu)系統(tǒng)研究,大致經(jīng)歷了3個(gè)階段:第一階段,人們認(rèn)為真實(shí)系統(tǒng)各因素之間的關(guān)系可以用一些規(guī)則結(jié)構(gòu)表示,例如二維平面上的歐幾里德格網(wǎng)、最近鄰環(huán)網(wǎng);第二階段,提出了一種新的網(wǎng)絡(luò)構(gòu)造方法,在這種方法下,兩個(gè)節(jié)點(diǎn)之間連邊與否不再是確定的事情,而是根據(jù)一個(gè)概率決定,這樣生成的網(wǎng)絡(luò)為隨機(jī)網(wǎng)絡(luò),隨機(jī)網(wǎng)絡(luò)在很長(zhǎng)一段時(shí)期里被認(rèn)為是描述真實(shí)系統(tǒng)最適宜的網(wǎng)絡(luò)[6-8];直到最近幾年,由于計(jì)算機(jī)數(shù)據(jù)處理和運(yùn)算能力的飛速發(fā)展,人們發(fā)現(xiàn)大量真實(shí)網(wǎng)絡(luò)既不是規(guī)則網(wǎng)絡(luò),也不是隨機(jī)網(wǎng)絡(luò),而是與前兩者皆不同的具有統(tǒng)計(jì)特征的網(wǎng)絡(luò),這樣的網(wǎng)絡(luò)被稱(chēng)為復(fù)雜網(wǎng)絡(luò)(Complex Network)[9-10]。1998年,Watts & Strogatz[1]提出小世界網(wǎng)絡(luò)概念;1999 年, Barabá? & Albert[11] 發(fā)現(xiàn)無(wú)標(biāo)度網(wǎng)絡(luò)特性,突破了單純規(guī)則網(wǎng)絡(luò)和隨機(jī)網(wǎng)絡(luò)模型的束縛,揭示了復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)所包含的各類(lèi)動(dòng)力學(xué)特性與結(jié)構(gòu)特征之間的聯(lián)系,奠定了在實(shí)際網(wǎng)絡(luò)中應(yīng)用研究的基礎(chǔ)[12]。
當(dāng)前,復(fù)雜網(wǎng)絡(luò)用于研究各種類(lèi)型的網(wǎng)絡(luò)和網(wǎng)絡(luò)特征,成為一大研究熱點(diǎn)。它與現(xiàn)實(shí)中各類(lèi)復(fù)雜性系統(tǒng)研究有密切關(guān)系,比如,由一些個(gè)體和個(gè)體之間互相連接而組成的社會(huì)關(guān)系網(wǎng)絡(luò)系統(tǒng)、由很多神經(jīng)細(xì)胞通過(guò)神經(jīng)纖維互相連接組成的神經(jīng)網(wǎng)絡(luò)系統(tǒng)[13],以及電力網(wǎng)絡(luò)系統(tǒng)、交通網(wǎng)絡(luò)系統(tǒng)、生態(tài)系統(tǒng)網(wǎng)絡(luò)系統(tǒng)和新陳代謝網(wǎng)絡(luò)系統(tǒng)[13-14]等。陳培文等[15]將復(fù)雜網(wǎng)絡(luò)與公共交通系統(tǒng)相結(jié)合,系統(tǒng)性分析了北京地鐵早高峰客流現(xiàn)狀,針對(duì)地鐵網(wǎng)絡(luò)運(yùn)營(yíng)提出了建議;張正帥等[16]從復(fù)雜網(wǎng)絡(luò)的角度描述地震活動(dòng)時(shí)空復(fù)雜性特征,為分析研究地震發(fā)生規(guī)律提供了一種新的途徑;傅杰等[17]又從復(fù)雜網(wǎng)絡(luò)理論角度出發(fā),提出了一種基于網(wǎng)絡(luò)凝聚度的電力網(wǎng)絡(luò)關(guān)鍵線(xiàn)路評(píng)價(jià)方法。復(fù)雜網(wǎng)絡(luò)是對(duì)現(xiàn)實(shí)生活中事物間關(guān)系的抽象表示,對(duì)復(fù)雜網(wǎng)絡(luò)的研究可以幫助人們發(fā)掘事物間的深層聯(lián)系,并針對(duì)特定問(wèn)題提出新的解決方案。
電影是集藝術(shù)、經(jīng)濟(jì)和科學(xué)于一體的市場(chǎng)產(chǎn)物,近年來(lái)隨著民眾文化消費(fèi)需求的提升以及影院和銀幕數(shù)量的高速增長(zhǎng),我國(guó)電影行業(yè)呈現(xiàn)持續(xù)繁榮景象[18]。中國(guó)電影產(chǎn)業(yè)經(jīng)歷了突飛猛進(jìn)的發(fā)展,并保持穩(wěn)定增長(zhǎng)的良好態(tài)勢(shì),但也出現(xiàn)了一些不容忽視的問(wèn)題,比如:高產(chǎn)演員參演的影片是否一定會(huì)大賣(mài),在社交網(wǎng)絡(luò)中占據(jù)重要地位的制作機(jī)構(gòu)參與制作的電影是否一定會(huì)取得高票房。目前,各界人士已經(jīng)從傳播學(xué)、經(jīng)濟(jì)學(xué)等角度分析電影票房影響因素,并從不同角度得出與電影票房相關(guān)的一系列理論。文獻(xiàn)[19]通過(guò)對(duì)中國(guó)大陸地區(qū)2012-2016年期間上映電影數(shù)據(jù)進(jìn)行相關(guān)性分析和回歸分析,對(duì)中國(guó)大陸地區(qū)電影票房影響因素進(jìn)行實(shí)證研究;文獻(xiàn)[20]通過(guò)建立票房與明星效應(yīng)之間的回歸模型,對(duì)明星效應(yīng)與中國(guó)電影票房進(jìn)行了實(shí)證研究;文獻(xiàn)[21]結(jié)合反饋神經(jīng)網(wǎng)絡(luò)與中國(guó)內(nèi)地電影市場(chǎng)的實(shí)際情況,提出一種基于多層反饋神經(jīng)網(wǎng)絡(luò)的票房預(yù)測(cè)模型。
復(fù)雜網(wǎng)絡(luò)是當(dāng)前一大研究熱點(diǎn),但是將其應(yīng)用于電影方面卻鮮有涉及。本文基于復(fù)雜網(wǎng)絡(luò)知識(shí),針對(duì)中國(guó)內(nèi)地電影的復(fù)雜關(guān)系,通過(guò)復(fù)雜網(wǎng)絡(luò)與電影相結(jié)合,將復(fù)雜網(wǎng)絡(luò)的研究理論系統(tǒng)化,設(shè)計(jì)網(wǎng)絡(luò)建模算法。依據(jù)2017年票房榜排名前200的電影信息,以數(shù)據(jù)集中的實(shí)體為節(jié)點(diǎn)、實(shí)體之間的關(guān)系為邊,構(gòu)建復(fù)雜網(wǎng)絡(luò)模型,并基于該模型對(duì)2017年度中國(guó)內(nèi)地電影復(fù)雜網(wǎng)絡(luò)進(jìn)行系統(tǒng)研究分析,主要探究以下幾個(gè)問(wèn)題:高產(chǎn)演員參演的電影是否一定會(huì)大賣(mài)?高票房電影在復(fù)雜網(wǎng)絡(luò)中有什么特征?高影響力的制作機(jī)構(gòu)是否一定會(huì)帶來(lái)高票房?通過(guò)建模實(shí)驗(yàn)與基于模型的分析,揭示電影票房和電影復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)中心性之間的相關(guān)性,拓寬電影票房研究的新視角。
1 2017年中國(guó)內(nèi)地電影復(fù)雜網(wǎng)絡(luò)建模
1.1 復(fù)雜網(wǎng)絡(luò)建模算法設(shè)計(jì)與實(shí)現(xiàn)
本文數(shù)據(jù)來(lái)源于國(guó)內(nèi)主要電影媒體網(wǎng)站,如藝恩電影智庫(kù)、時(shí)光網(wǎng)等。研究樣本為2017年中國(guó)內(nèi)地電影票房排行榜前220的電影,涉及電影名稱(chēng)、票房、上映時(shí)間、導(dǎo)演、編劇、制片人 、演員及制作機(jī)構(gòu)。首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,刪除不符合數(shù)據(jù)要求及信息不完整的20部電影,剩余200部。有導(dǎo)演221個(gè),編劇337個(gè),制片人321個(gè),演員756個(gè),制作機(jī)構(gòu)565個(gè),各類(lèi)別統(tǒng)計(jì)數(shù)據(jù)占比如圖1所示。
將數(shù)據(jù)關(guān)系抽象處理成復(fù)雜網(wǎng)絡(luò)圖,進(jìn)行可視化分析,具體數(shù)據(jù)轉(zhuǎn)化算法如圖2所示。該算法主要提取兩列數(shù)據(jù):電影名稱(chēng)、參與電影制作的演職人員及制作機(jī)構(gòu)。根據(jù)提取的數(shù)據(jù),繪制復(fù)雜網(wǎng)絡(luò)圖。復(fù)雜網(wǎng)絡(luò)圖由節(jié)點(diǎn)和邊構(gòu)成。節(jié)點(diǎn)數(shù)據(jù)包括節(jié)點(diǎn)值和權(quán)重,邊數(shù)據(jù)包括出度、入度及權(quán)重。在本文研究中,用無(wú)權(quán)無(wú)向圖,不對(duì)節(jié)點(diǎn)進(jìn)行屬性區(qū)分。原來(lái)的數(shù)據(jù)集中,只能通過(guò)表格信息了解電影基本信息,例如票房、演職人員與相關(guān)制作機(jī)構(gòu)等,無(wú)法探究電影票房、演職人員與制作機(jī)構(gòu)等之間的關(guān)系。但是,將電影相關(guān)的數(shù)據(jù)關(guān)系抽象為復(fù)雜網(wǎng)絡(luò)圖,更便于分析票房與電影、制作機(jī)構(gòu)以及演職人員之間的深層關(guān)系。
1.2 建模規(guī)則
本文對(duì)2017年中國(guó)內(nèi)地電影信息進(jìn)行搜集整理,包括電影名稱(chēng)、票房、上映時(shí)間、導(dǎo)演、編劇、制作人及制作機(jī)構(gòu)。根據(jù)如下規(guī)則,建立復(fù)雜網(wǎng)絡(luò)模型。
規(guī)則一:演員是參演電影的直接主體,與電影票房有著直接聯(lián)系。按照演員與電影之間的聯(lián)系,如果演員參演電影,便認(rèn)為有關(guān)系,分別以電影和演員為節(jié)點(diǎn)、電影與演員之間的關(guān)系為邊,建立電影—演員復(fù)雜網(wǎng)絡(luò)。
規(guī)則二:以導(dǎo)演、編劇、制片人、演員和制作機(jī)構(gòu)為節(jié)點(diǎn),只要人物與人物、人物與制作機(jī)構(gòu)、制作機(jī)構(gòu)與制作機(jī)構(gòu)參與同一部電影制作,便認(rèn)為有關(guān)系,并建立連邊,建立導(dǎo)演—編劇—制片人—演員—制作機(jī)構(gòu)復(fù)雜網(wǎng)絡(luò)。
規(guī)則三:電影票房規(guī)律不僅與參演演員有關(guān),還與導(dǎo)演、編劇、制片人、制作機(jī)構(gòu)有著密切聯(lián)系。這些元素以電影為中介產(chǎn)生聯(lián)系,分別以電影、導(dǎo)演、編劇、制片人、演員、制作機(jī)構(gòu)為節(jié)點(diǎn),電影與人物、電影與制作機(jī)構(gòu)之間的關(guān)系為邊,建立以電影為中心節(jié)點(diǎn)的電影—導(dǎo)演—編劇—制片人—演員—制作機(jī)構(gòu)復(fù)雜網(wǎng)絡(luò)。
通過(guò)以上3種規(guī)則分別建立了3種復(fù)雜網(wǎng)絡(luò),進(jìn)一步探究哪種形式更適合對(duì)2017年中國(guó)內(nèi)地電影票房規(guī)律進(jìn)行分析。電影與演員構(gòu)成的復(fù)雜網(wǎng)絡(luò)如圖3所示(其中,深藍(lán)色節(jié)點(diǎn)為電影節(jié)點(diǎn),粉紅色節(jié)點(diǎn)為人物節(jié)點(diǎn)),不同大小表示不同度值;導(dǎo)演、編劇、制片人、演員以及制作機(jī)構(gòu)構(gòu)成的無(wú)電影復(fù)雜網(wǎng)絡(luò)如圖4所示(其中,粉紅色節(jié)點(diǎn)為人物節(jié)點(diǎn),淺藍(lán)色節(jié)點(diǎn)為制作機(jī)構(gòu)節(jié)點(diǎn),不同大小表示不同度值);電影、導(dǎo)演、編劇、制片人、演員以及制作機(jī)構(gòu)構(gòu)成的有電影復(fù)雜網(wǎng)絡(luò)如圖5所示(其中,深藍(lán)色節(jié)點(diǎn)為電影節(jié)點(diǎn),粉紅色節(jié)點(diǎn)為人物節(jié)點(diǎn),淺藍(lán)色節(jié)點(diǎn)為制作機(jī)構(gòu)節(jié)點(diǎn),不同大小表示不同度值)。算法生成之后的3種復(fù)雜網(wǎng)絡(luò)的具體結(jié)構(gòu)屬性如表1所示,其中,規(guī)則一是以電影、演員為節(jié)點(diǎn),彼此之間聯(lián)系為邊建立的復(fù)雜網(wǎng)絡(luò);規(guī)則二是以導(dǎo)演、編劇、制片人、演員,制作機(jī)構(gòu)為節(jié)點(diǎn),彼此之間聯(lián)系為邊建立的復(fù)雜網(wǎng)絡(luò);規(guī)則三是以電影、導(dǎo)演、編劇、制片人、演員,制作機(jī)構(gòu)為節(jié)點(diǎn),彼此之間聯(lián)系為邊建立的復(fù)雜網(wǎng)絡(luò)。通過(guò)算法生成網(wǎng)絡(luò)時(shí),如果同一演職人員具有多重身份,按一個(gè)節(jié)點(diǎn)進(jìn)行處理。由表1可以看出,按照不同規(guī)則建立的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)屬性差異較大。按照規(guī)則一建立的復(fù)雜網(wǎng)絡(luò),節(jié)點(diǎn)數(shù)僅為957個(gè),社團(tuán)個(gè)數(shù)卻有90個(gè),社團(tuán)規(guī)模較小,整個(gè)復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn)分布比較分散。各節(jié)點(diǎn)間的平均路徑也比較長(zhǎng),相連兩個(gè)節(jié)點(diǎn)平均需要12.86步。按照規(guī)則二建立的復(fù)雜網(wǎng)絡(luò),節(jié)點(diǎn)數(shù)為2 023個(gè),節(jié)點(diǎn)之間的連邊有13 998條,在此規(guī)則下建立的復(fù)雜網(wǎng)絡(luò)無(wú)電影節(jié)點(diǎn),只要人物與制作機(jī)構(gòu)參與同一部電影制作,便認(rèn)為有關(guān)系,這樣通過(guò)電影有間接聯(lián)系的人物與制作機(jī)構(gòu)節(jié)點(diǎn)間便有了直接聯(lián)系,強(qiáng)化了節(jié)點(diǎn)間的連接,造成復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)度過(guò)大、不同類(lèi)型節(jié)點(diǎn)之間的連邊存在大量冗余,使得節(jié)點(diǎn)間的區(qū)分度降低。按照規(guī)則三加入電影節(jié)點(diǎn),建立的復(fù)雜網(wǎng)絡(luò)也是規(guī)則二中5類(lèi)節(jié)點(diǎn)與電影之間的不同二部圖關(guān)系投影所得,其中,節(jié)點(diǎn)數(shù)為2 223,節(jié)點(diǎn)間連邊為2 429條,模塊度為0.895,社團(tuán)結(jié)構(gòu)特性相較于規(guī)則二更為明顯。
1.3 2017年中國(guó)內(nèi)地電影復(fù)雜網(wǎng)絡(luò)模型構(gòu)建
分析發(fā)現(xiàn),不同規(guī)則建立的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)屬性差異較大。規(guī)則一所建復(fù)雜網(wǎng)絡(luò)模型節(jié)點(diǎn)少、社團(tuán)規(guī)模較小、節(jié)點(diǎn)分布較分散,且只將電影票房與演員聯(lián)系在一起,忽略了其它因素影響;規(guī)則二所建復(fù)雜網(wǎng)絡(luò)模型,連邊之間存在大量冗余,整個(gè)網(wǎng)絡(luò)平均度值較大;規(guī)則三的社團(tuán)結(jié)構(gòu)特性相較于規(guī)則二更為明顯,并且加入電影節(jié)點(diǎn)構(gòu)建復(fù)雜網(wǎng)絡(luò),在分析電影票房規(guī)律時(shí)更為直觀(guān)。因此,本文最后選擇規(guī)則三建立包含電影節(jié)點(diǎn)的電影—導(dǎo)演—編劇—制片人—演員—制作機(jī)構(gòu)復(fù)雜網(wǎng)絡(luò)。在該網(wǎng)絡(luò)中,將導(dǎo)演、編劇、制作人、演員和制作機(jī)構(gòu)統(tǒng)一抽象為一類(lèi)節(jié)點(diǎn),沒(méi)有進(jìn)一步對(duì)其屬性進(jìn)行區(qū)分。如果演員出演電影,演職人員和制作機(jī)構(gòu)參與電影制作,就被認(rèn)為與電影有關(guān)。以電影、演職人員以及制作機(jī)構(gòu)為節(jié)點(diǎn),各節(jié)點(diǎn)間的關(guān)系連接為邊建立無(wú)向復(fù)雜網(wǎng)絡(luò),即2017年中國(guó)內(nèi)地電影復(fù)雜網(wǎng)絡(luò)。
2 2017年中國(guó)內(nèi)地電影復(fù)雜網(wǎng)絡(luò)分析
2.1 節(jié)點(diǎn)中心性分析指標(biāo)
本文研究的復(fù)雜網(wǎng)絡(luò)均為無(wú)權(quán)無(wú)向網(wǎng)絡(luò),擬采用社會(huì)網(wǎng)絡(luò)分析法評(píng)價(jià)節(jié)點(diǎn)重要性。社會(huì)網(wǎng)絡(luò)分析方法起始于20世紀(jì)40年代末,常用于評(píng)價(jià)節(jié)點(diǎn)重要性。該方法主要基于這樣一種假設(shè):“重要性等于顯著性”,即節(jié)點(diǎn)重要性等價(jià)于該節(jié)點(diǎn)與其它節(jié)點(diǎn)的連接而使其具有顯著性[22]。復(fù)雜網(wǎng)絡(luò)采用了圖論與社會(huì)網(wǎng)絡(luò)分析[23]中的許多統(tǒng)計(jì)指標(biāo),用于度量網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的復(fù)雜網(wǎng)絡(luò)特征,包括節(jié)點(diǎn)的度值中心性(Degree Centrality)[24]、介數(shù)中心性(Betweenness Centrality)[25]、特征向量中心性(Eigenvector Centrality)[26]等。為研究2017年中國(guó)內(nèi)地電影票房的復(fù)雜網(wǎng)絡(luò)特性,本文對(duì)上述指標(biāo)進(jìn)行了計(jì)算分析。
2.1.1 度值中心性
度值中心性(Degree Centrality)是指節(jié)點(diǎn)的度值越大則節(jié)點(diǎn)越重要,通常用[Ki]表示節(jié)點(diǎn)的度值,該判據(jù)是評(píng)估節(jié)點(diǎn)重要度最簡(jiǎn)單的方法。度值中心性是網(wǎng)絡(luò)節(jié)點(diǎn)重要度的靜態(tài)刻畫(huà),由于網(wǎng)絡(luò)尺寸N不同,通常采用歸一化度值中心性評(píng)估節(jié)點(diǎn)重要度。
度中心性是典型的局部信息判據(jù),不能從網(wǎng)絡(luò)全局信息層次分析節(jié)點(diǎn)重要程度。
2.1.2 介數(shù)中心性
介數(shù)中心性(Betweenness Centrality)基于網(wǎng)絡(luò)全局信息,考察所有節(jié)點(diǎn)對(duì)之間最短路徑的數(shù)目,節(jié)點(diǎn)對(duì)之間的最短路徑通常存在多條,若節(jié)點(diǎn)位于最短路徑上的次數(shù)越多,則該節(jié)點(diǎn)越重要。如果njk是連接節(jié)點(diǎn)j和k之間最短路徑數(shù)目,njk(i)是連接節(jié)點(diǎn)j和k之間包含著節(jié)點(diǎn)i的最短路徑數(shù)目,則節(jié)點(diǎn)i的介數(shù)中心性定義為:
介數(shù)中心性相當(dāng)于一個(gè)節(jié)點(diǎn)擔(dān)任最短路徑橋梁的次數(shù)和所有路徑數(shù)量的比值。因此,當(dāng)一個(gè)節(jié)點(diǎn)出現(xiàn)在其它兩個(gè)節(jié)點(diǎn)間最短路徑上的次數(shù)越多,該節(jié)點(diǎn)的介數(shù)中心值越大。
2.1.3 特征向量中心性
特征向量中心性(Eigenvector Centrality)。一個(gè)節(jié)點(diǎn)特征向量中心性值由其鄰居節(jié)點(diǎn)的值決定,即一個(gè)節(jié)點(diǎn)的中心化指標(biāo)應(yīng)該等于其相鄰節(jié)點(diǎn)的中心化指標(biāo)之線(xiàn)性疊加。節(jié)點(diǎn)i的特征向量中心性定義為:
特征向量中心性反映一個(gè)節(jié)點(diǎn)的重要性不僅與其鄰居節(jié)點(diǎn)的度值有關(guān),也與其鄰居節(jié)點(diǎn)的重要性有關(guān)。
2.2 節(jié)點(diǎn)中心性分析
2.2.1 節(jié)點(diǎn)度值中心性分析
在該無(wú)向復(fù)雜網(wǎng)絡(luò)中,網(wǎng)絡(luò)節(jié)點(diǎn)的度值是指與之相連接的所有邊的總和,電影節(jié)點(diǎn)的度值就是指電影與演職人員、制作機(jī)構(gòu)所有連接邊的總和。在一個(gè)復(fù)雜網(wǎng)絡(luò)中,度值中心性認(rèn)為一個(gè)節(jié)點(diǎn)的相鄰節(jié)點(diǎn)數(shù)目越多,影響力就越大,這是網(wǎng)絡(luò)中刻畫(huà)節(jié)點(diǎn)重要性的最簡(jiǎn)單指標(biāo)。在此網(wǎng)絡(luò)中,電影的度值大小反映了參與電影制作人力資源的多少,即電影節(jié)點(diǎn)的度值越大,表示有越多的人和越多的制作機(jī)構(gòu)參與電影制作。
通過(guò)分析統(tǒng)計(jì),電影票房復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)的平均度為2.185,說(shuō)明在此復(fù)雜網(wǎng)絡(luò)中平均每個(gè)節(jié)點(diǎn)影響2.185個(gè)其它節(jié)點(diǎn)。圖6(a)是度值分布散點(diǎn)圖,可以發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)中度值的分布遵守冪律分布。從度值占比餅狀圖6(b)中可以看出,此網(wǎng)絡(luò)中度值為1的節(jié)點(diǎn)占據(jù)整個(gè)網(wǎng)絡(luò)的79.16%,在剩下節(jié)點(diǎn)中占比較重的也是度值為2的節(jié)點(diǎn),即這些與其它聯(lián)系很少的節(jié)點(diǎn)占據(jù)了網(wǎng)絡(luò)中相當(dāng)大的比重。較高度值節(jié)點(diǎn)占少數(shù),而這些度值較高的節(jié)點(diǎn)具有較強(qiáng)的關(guān)聯(lián)性,主要分布在網(wǎng)絡(luò)結(jié)構(gòu)中心。度值的分布散點(diǎn)圖與度值占比餅狀圖,印證了電影票房復(fù)雜網(wǎng)絡(luò)的無(wú)標(biāo)度性,即在網(wǎng)絡(luò)中的大部分節(jié)點(diǎn)只和很少節(jié)點(diǎn)連接,而有極少節(jié)點(diǎn)與非常多的節(jié)點(diǎn)連接。
圖7是度值與票房分布散點(diǎn)圖,可以看出度值在9~18之間出現(xiàn)票房超過(guò)10億的電影。但是,在該范圍內(nèi),高度值、低票房的電影占到了大多數(shù),說(shuō)明高投資不一定能換得高票房。影響票房因素很多,因此,在電影投資過(guò)程中不能盲目投入,要量化分析,理性投資。
對(duì)本文復(fù)雜網(wǎng)絡(luò)分析發(fā)現(xiàn),任達(dá)華、成龍、岳云鵬節(jié)點(diǎn)度值最高,即2017年出演電影數(shù)量最多。但從圖8高度值演員參演電影排名折線(xiàn)圖(電影排名越小票房越高)發(fā)現(xiàn),2017年參演電影較多的演員中,除成龍外,其他幾位演員所參演的電影只有極少數(shù)有著高票房,說(shuō)明高產(chǎn)演員不一定能帶來(lái)高票房。由此,根據(jù)度值大小計(jì)算方式可知,電影度值大小取決于與電影相關(guān)的人物和制作機(jī)構(gòu)的數(shù)量,并不能真實(shí)表現(xiàn)出電影票房網(wǎng)絡(luò)的中心性。因此,度中心性雖然計(jì)算方便簡(jiǎn)單,但不能很直觀(guān)地反映中國(guó)內(nèi)地票房復(fù)雜網(wǎng)絡(luò)的中心性。
2.2.2 介數(shù)中心性分析
電影是演職人員和電影制作機(jī)構(gòu)合作的橋梁,復(fù)雜網(wǎng)絡(luò)中電影節(jié)點(diǎn)介數(shù)中心性越高,表明該電影越有影響力。與此同時(shí),在復(fù)雜網(wǎng)絡(luò)拓?fù)鋱D中刪除該電影節(jié)點(diǎn)對(duì)其它節(jié)點(diǎn)影響更大。同理,演職人員節(jié)點(diǎn)、制作機(jī)構(gòu)節(jié)點(diǎn)的介數(shù)中心性越大,說(shuō)明他們的影響力越大。
根據(jù)介數(shù)中心性對(duì)節(jié)點(diǎn)進(jìn)行排序,表3是依據(jù)介數(shù)中心性統(tǒng)計(jì)的主要人員及其參演電影排名;圖9是電影介數(shù)中心值與票房的散點(diǎn)分布圖;圖10是介數(shù)中心性排名前50和后50的電影票房折線(xiàn)圖。
參考文獻(xiàn):
[1] WATTS D J, STROGATZ S H. Collective dynamics of ‘small-world networks[J]. Nature,1998,393(6684):440-442.
[2] FALOUTSOS M,F(xiàn)ALOUTSOS P,F(xiàn)ALOUTSOS C. On power-law relationships of the Internet topology[J]. Poceedings of ACM SIGCOMM,1999,29(4):251-262.
[3] LILJEROS F, EDLING C R, AMARAL L A N, et al. The web of human sexual contacts[J]. Nature,2001, 411(6840): 907.
[4] EBEL H, MIELSCH L I, BORNHOLDT S. Scale-free topology of e-mail networks[J].? Physical review E, 2002, 66(3): 035103.
[5] SEN P,DASGUPTA S,CHATTERJEE A,et al. Small-world properties of the Indian railway network[J]. Physical Review E,2003,67(3): 036106.
[6] ERDOS P, RéNYI A. On the evolution of random graphs[J]. Transactions of the American Mathematical Society,1960, 5(1): 17-60.
[7] ERD?S P, RéNYI A. On the strength of connectedness of a random graph[J].? Acta Mathematica Hungarica, 1961, 12(1-2): 261-267.
[8] BOLLOBáS B, SIMON I. Repeated random insertion into a priority queue[J].? Journal of Algorithms,1985,6(4): 466-477.
[9] TRAVERS J, MILGRAM S. The small world problem[J].? Phychology Today, 1967, 1(1): 61-67.
[10] 周濤,柏文潔,汪秉宏,等. 復(fù)雜網(wǎng)絡(luò)研究概述[J]. 物理, 2005, 34(1):31-36.
[11] BARABASI A L, ALBERT R. Emergence of Scaling in Random Networks[J]. Science, 1999, 286(5439):509-512.
[12] 蔡澤祥,王星華,任曉娜. 復(fù)雜網(wǎng)絡(luò)理論及其在電力系統(tǒng)中的應(yīng)用研究綜述[J]. 電網(wǎng)技術(shù),2012, 36(11):114-121.
[13] WANG X F,CHEN G. Complex networks: small-world, scale-free, and beyond[J].? IEEE Circuits and Systems Magazine, 2003, 3(1):6-20.
[14] JEONG H,TOMBOR B,ALBERT R,et al. The large-scale organization of metabolic networks[J]. Nature,2000,407(6804):651-654.
[15] 陳培文,陳峰,胡映月,等. 基于復(fù)雜網(wǎng)絡(luò)的城市軌道交通網(wǎng)絡(luò)中心性研究[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2017(2):97-102.
[16] 張正帥,陳時(shí)軍,周晨,等.? 利用復(fù)雜網(wǎng)絡(luò)技術(shù)分析地震活動(dòng)性特征[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2018(2):10-17.
[17] 傅杰,鄒艷麗,謝蓉. 基于復(fù)雜網(wǎng)絡(luò)理論的電力網(wǎng)絡(luò)關(guān)鍵線(xiàn)路識(shí)別[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2017(3):95-100.
[18] 韓忠明,原碧鴻,陳炎,等. 一個(gè)有效的基于GBRT的早期電影票房預(yù)測(cè)模型[J]. 計(jì)算機(jī)應(yīng)用研究, 2018(2):410-416.
[19] 何雙男. 中國(guó)大陸地區(qū)電影票房影響因素實(shí)證研究[J]. 電影文學(xué), 2017(22):4-8.
[20] 郭新茹,黃舒沁. 明星效應(yīng)與中國(guó)電影票房的實(shí)證研究[J]. 現(xiàn)代傳播:中國(guó)傳媒大學(xué)學(xué)報(bào), 2017(12):120-125.
[21] 鄭堅(jiān),周尚波. 基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)建模[J]. 計(jì)算機(jī)應(yīng)用, 2014, 34(3):742-748.
[22] 赫南,李德毅,淦文燕,等. 復(fù)雜網(wǎng)絡(luò)中重要性節(jié)點(diǎn)發(fā)掘綜述[J]. 計(jì)算機(jī)科學(xué), 2007,34(12):1-5.
[23] 羅家德. 社會(huì)網(wǎng)分析講義[M]. 北京:社會(huì)科學(xué)文獻(xiàn)出版社, 2010.
[24] FREEMAN L C,ROEDER D,MULHOLLAND R R. Centrality in social networks: II. experimental results [J].? Social Networks,1979,2(2):119-141.
[25] LIU Y Y, SLOTINE J J, BARABáSI A L. Controllability of complex networks[J].? Nature, 2011, 473(7346):167.
[26] EVERETT M, BORGATTI S P. Ego network betweenness[J]. Social Networks,2005,27(1):31-38.
[27] 汪宏,鮑中奎,張海峰. 基于標(biāo)簽傳播識(shí)別網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2017(2):19-25.
(責(zé)任編輯:孫 娟)