邢亞彬 史茲國
摘 要:電視收視率受到大家的高度關(guān)注,直接影響到電視節(jié)目的經(jīng)濟效益和廣告價值。常用的電視收視率分析和預測方法包括回歸分析、ARMA模型、人工神經(jīng)網(wǎng)絡(luò)、決策樹算法、支持向量機等,在電視收視率分析和預測過程中常常會借助于SPSS軟件、EViews軟件、Matlab軟件、R軟件等工具進行分析。
關(guān)鍵詞:電視收視率;分析方法;分析工具
中圖分類號:G223 文獻標志碼:A 文章編號:2095-2945(2018)31-0107-03
Abstract: TV ratings are highly concerned by everyone and directly affect the economic benefits and advertising value of TV programs. The common analysis and prediction methods of TV ratings include regression analysis, ARMA model, artificial neural network, decision tree algorithm, support vector machine and so on. In the process of TV rating analysis and prediction, it is often analyzed with the help of SPSS software, EViews software, Matlab software, R software and other tools.
Keywords: television ratings; analytical methods; analytical tools
1 概述
電視收視率是有線電視頻道價值中含金量最高的指標之一,不僅反映了電視節(jié)目在觀眾中的口碑,而且直接關(guān)系到電視節(jié)目的經(jīng)濟效益和廣告價值,受到大家的高度關(guān)注。一直以來,電視收視率的分析和預測是社會各界關(guān)注的熱點,分析和預測的方法眾多,常用的分析和預測方法包括回歸分析、ARMA模型、人工神經(jīng)網(wǎng)絡(luò)、決策樹算法、支持向量機等,在電視收視率分析和預測過程中常常會借助于SPSS軟件、EViews軟件、Matlab軟件、R軟件等工具進行分析。
2 分析方法
2.1 回歸分析
回歸分析是研究變量之間相互關(guān)系的方法,在很多領(lǐng)域應(yīng)用廣泛。根據(jù)變量的數(shù)量和相互關(guān)系,可以分為一元線性回歸、多元線性回歸和非線性回歸等。線性回歸模型的一般形式為:y=?茁0+?茁1x1+?茁2x2+...+?茁pxp+?著,最簡單的線性回歸模型的一般形式為:y=?茁0+?茁1x+?著。線性回歸模型是早期比較常用的電視收視率預測方法,現(xiàn)在已經(jīng)漸漸被其他的分析方法所取代。
2.2 ARMA模型
ARMA模型是自回歸移動平均(Auto-regressive moving average)模型的簡稱,記為ARMA(p,q),是由美國的Box和英國的Jenkins共同創(chuàng)立的一種隨機時間序列預測方法,也稱為B-J法,在短期預測方面具有較好的精度。其基本思想是應(yīng)用數(shù)學模型對時間序列進行近似描述,通過對該模型進行分析,認識時間序列的結(jié)構(gòu)和特征,達到最小方差意義下的最優(yōu)預測。ARMA模型只適用于平穩(wěn)時間序列,對于表現(xiàn)為趨勢性和季節(jié)性的時間序列應(yīng)進行改進,其實質(zhì)是通過差分過程把非平穩(wěn)時間序列轉(zhuǎn)換成平穩(wěn)時間序列后,再應(yīng)用ARMA模型進行分析和預測。
(1)ARIMA模型
ARIMA模型是求和自回歸移動平均模型的簡稱,記為ARIMA(p,d,q),是差分與ARMA模型的結(jié)合。其建模過程包括模型識別階段、參數(shù)估計階段、模型檢驗階段、預測應(yīng)用階段等。ARIMA模型對于短期預測具有較高的精度,隨著預測時間的延后,精度會逐漸下降。
(2)乘積季節(jié)模型
在時間序列模型中,有的序列含有季節(jié)變動規(guī)律,可以通過建立季節(jié)模型進行預測。乘積季節(jié)模型是隨機季節(jié)模型和ARIMA模型的結(jié)合,記為ARIMA(k,D,m)×(p,d,q),其一般形式是:?椎(B)U(BS)△d?犖Xt=?專(B)V(BS)at。由于受到周末、節(jié)假日等因素影響,電視收視率具有明顯的季節(jié)特征,故采用季節(jié)模型進行電視收視率預測較為常見,或者在應(yīng)用其他模型時考慮季節(jié)因素影響進行分析。
2.3 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)又稱為神經(jīng)元網(wǎng)絡(luò),具有特有的非線性適應(yīng)性信息處理能力,能夠自適應(yīng)樣本數(shù)據(jù),在模式識別、智能控制、預測和管理等方面應(yīng)用廣泛。
(1)BP神經(jīng)網(wǎng)絡(luò)
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)實質(zhì)是求解誤差函數(shù)的最小值問題,通常由一個輸入層、若干個隱含層和一個輸出層組成,每層具有多個神經(jīng)元,在網(wǎng)絡(luò)學習過程是不斷修正權(quán)系數(shù)的過程,以使得網(wǎng)絡(luò)的實際輸出值與期望輸出值誤差均方值最小。當網(wǎng)絡(luò)的均方差誤差低于給定值時,表明對給定訓練集學習已經(jīng)滿足要求。
(2)RBF神經(jīng)網(wǎng)絡(luò)
RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)是一種局部逼近的神經(jīng)網(wǎng)絡(luò),由一個輸入層、一個隱含層和一個輸出層組成,其基本思想是用RBF作為隱單元的“基”構(gòu)成隱含層空間,將輸入矢量不通過權(quán)連接,而是直接映射到隱空間上。RBF神經(jīng)網(wǎng)絡(luò)在逼近能力、分類能力和學習速度等方面有較好的表現(xiàn)。RBF神經(jīng)網(wǎng)絡(luò)能夠無限逼近最佳函數(shù)值,不易出現(xiàn)局部最優(yōu)問題,訓練速度快,具有較高的預測精度,能夠很好地解決電視收視率的非線性預測問題,具有一定的現(xiàn)實意義。
2.4 決策樹算法
決策樹是常用的數(shù)據(jù)挖掘方法,是根據(jù)若干輸入變量的值構(gòu)造出一個相適應(yīng)的模型,來預測輸出變量的值,常以樹形結(jié)構(gòu)呈現(xiàn),具有簡單直觀、解讀性強的特點。常用的決策樹算法有ID3、C4.5、C5.0等??梢圆捎脹Q策樹算法進行收視率預測,進而得出具有一定參考價值的結(jié)論,但其具有易產(chǎn)生過擬合現(xiàn)象、只能給出0/1兩態(tài)值等的缺點,可以考慮把該算法與人工神經(jīng)網(wǎng)絡(luò)等方法相結(jié)合,有助于得到更接近實際的結(jié)果。
2.5 支持向量機
SVM是支出向量機(Sport Vector Machine)的簡稱,其基本思想是找到一個超平面,使得它能夠盡可能多地將兩類數(shù)據(jù)點分開,使得分開的兩類數(shù)據(jù)點距離分類面最遠。支持向量機參數(shù)模型主要著眼于利用啟發(fā)式算法對特征選取、參數(shù)選擇等問題進行優(yōu)化,需要耗費較大的計算資源,如果引入其他算法,如改進P-SVM模型,可以提升預測精度,減少參數(shù)調(diào)整過程的運算時間,更具準確性和參考價值。支持向量機在模式識別方面應(yīng)用較為廣泛。
3 電視收視率分析軟件
常用進行電視收視率分析的軟件主要有SPSS軟件、EViews軟件、Matlab軟件、R軟件等。
3.1 SPSS軟件
SPSS是Statistical Package for the Social Sciences的簡稱,是最早的統(tǒng)計分析軟件之一,在調(diào)查統(tǒng)計、市場研究、數(shù)據(jù)分析中應(yīng)用廣泛。其基本功能有數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等,包括描述統(tǒng)計、列聯(lián)表分析、總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成分分析、時間序列分析、非參數(shù)檢驗等多個大類,每個大類中包含多種統(tǒng)計分析方法。在電視收視率分析中,當采用回歸分析、聚類分析、ARIMA等時間序列分析時,常常采用SPSS軟件進行分析。
3.2 EViews軟件
EViews是Econometrics Views的簡稱,是專門從事數(shù)據(jù)分析、回歸分析和預測的計算機軟件,具有操作簡便、界面友好、功能強大的特點,在數(shù)據(jù)分析、經(jīng)濟預測、成本分析等方面應(yīng)用廣泛。EViews軟件是最流行的數(shù)據(jù)分析工具之一,許多高等學校開設(shè)有相應(yīng)的課程,對學生進行訓練和實驗,常常被用來進行包括描述統(tǒng)計分析、回歸分析、時間序列分析、動態(tài)分析、面板數(shù)據(jù)模型等。在電視收視率分析中,當采用趨勢模型、季節(jié)模型、ARMA模型、ARCH類模型時,經(jīng)常采用EViews軟件進行分析。
3.3 Matlab軟件
Matlab是矩陣實驗室(Matrix Laboratory)的簡稱,是一款優(yōu)秀的數(shù)學軟件,在數(shù)據(jù)建模方面應(yīng)用廣泛,具有數(shù)據(jù)處理、圖形繪制、建議預測等多種功能,適用于灰色預測、遺傳算法、粒子群算法、模擬退火算法、人工神經(jīng)網(wǎng)絡(luò)、小波分析、計算機模擬等方面的應(yīng)用。其附加的工具箱,擴展了MATLAB的使用環(huán)境,可以用來解決特定領(lǐng)域特定類型的問題。在電視收視率分析時,當采用人工神經(jīng)網(wǎng)絡(luò)、決策樹、支持向量機等方法時,常常采用Matlab軟件進行分析。
3.4 R軟件
R軟件是免費的自由軟件,它的代碼公開,可以進行修改和補充,它提供了若干統(tǒng)計程序包,具有數(shù)據(jù)存儲和處理、數(shù)組運算工具、統(tǒng)計分析、統(tǒng)計制圖等功能??梢酝ㄟ^R軟件菜單“程序包-安裝程序包”選項下載程序包進行安裝,使用較為方便。R軟件越來越為更多的人所使用。R軟件中的程序包forecast具有自動選擇ARIMA參數(shù)的功能,具有一定的參考價值,簡單快捷,但還是要對其進行鑒別。在電視收視率分析,采用趨勢模型、季節(jié)模型、ARMA模型、GARCH模型、VARMA模型、神經(jīng)網(wǎng)絡(luò)模型時,可以采用R軟件進行分析。
4 結(jié)束語
電視收視率的分析方法眾多,由于數(shù)據(jù)來源方法不同、地區(qū)和時間差異等因素的影響,更由于電視收視率分析的目的和要求存在較大差異,故研究者應(yīng)根據(jù)研究需要合理選擇模型和分析工具。
參考文獻:
[1]易丹輝.時間序列分析:方法與應(yīng)用[M].北京:中國人民大學出版社,2012.
[2]王振龍,胡永宏.應(yīng)用時間序列分析[M].北京:科學出版社,2017.
[3]王立柱.時間序列模型及預測[M].北京:科學出版社,2017.
[4]白曉東.應(yīng)用時間序列分析[M].北京:清華大學出版社,2017.
[5]薛易,陳立萍.統(tǒng)計建模與R軟件[M].北京:清華大學出版社,2013.
[6]吳喜之,劉苗.應(yīng)用時間序列分析:R軟件陪同[M].北京:機械工業(yè)出版社,2014.
[7]易丹輝.數(shù)據(jù)分析與EViews應(yīng)用(第二版)[M].北京:中國人民大學出版社,2014.
[8]司守奎,孫璽菁.數(shù)學建模算法與應(yīng)用[M].北京:國防工業(yè)出版社,2013.
[9]黃文,王正林.數(shù)據(jù)挖掘:R語言實踐[M].北京:電子工業(yè)出版社,2014.
[10]賴國毅,陳超.SPSS17.0中文版常用功能與應(yīng)用實例精講[M].北京:電子工業(yè)出版社,2010.
[11]卓金武,魏永生,秦健,等.MATLAB在數(shù)學建模中的應(yīng)用[M].北京:北京航空航天大學出版社,2014.
[12]陸海鷹.基于線性回歸的電視節(jié)目收視率預測模型[J].當代電視,2012(11):55-57.
[13]周雙嬌.基于乘積季節(jié)模型的湖南衛(wèi)視收視率的分析與預測
[J].湖北理工學院學報,2016(3):33-37.
[14]劉輝,杜秀華.基于ARMA模型的電視臺收視率預測方法設(shè)計和實現(xiàn)[J].控制工程,2009(5):9-11.
[15]梁招娣,劉小龍.基于RBF神經(jīng)網(wǎng)絡(luò)的電視收視率預測[J].河南科學,2013(9):1428-1431.
[16]周蕩蕩,蘇勇.基于決策樹算法的電視收視率預測研究[J].計算機與數(shù)字工程,2017(11):2123-2125.
[17]涂娟娟,劉同明.基于決策樹的電視節(jié)目收視率預測模型[J].微計算信息,2007(3):251-252.
[18]陳青,薛惠鋒,閆莉.基于半模糊核聚類算法的收視率預測研究[J].計算機工程與應(yīng)用,2012(6):151-154.
[19]張晶,白冰,蘇勇.基于貝葉斯網(wǎng)絡(luò)的電視節(jié)目收視率預測研究[J].科學技術(shù)與工程,2007(7):5099-5102.
[20]付連軍.基于probit模型的電視收視率微觀經(jīng)濟計量實證分析[J].市場研究,2006(9):28-33.
[21]張茜,吳超,喬晗,等.基于TEI@I方法論的中國季播電視綜藝節(jié)目收視率預測[J].系統(tǒng)工程理論與實踐,2016(11):2905-2914.
[22]邢亞彬,史茲國.大數(shù)據(jù)背景下江蘇有線電視收視率預測[J].江蘇社會科學,2015(3):257-265.
[23]汪洋,田剛,溫淑鴻.基于BP神經(jīng)網(wǎng)絡(luò)的電視節(jié)目收視率預測模型[J].電視技術(shù),2014(6):94-96.
[24]鄔麗云,曲洲青.基于BP神經(jīng)網(wǎng)絡(luò)的收視率預測[J].中國傳媒大學學報(自然科學版),2011(9):59-62.
[25]姚芳,李越,肖春來.基于時間序列模型的全國30家電臺收視率分析[J].數(shù)學的實踐與認識,2011(7):34-39.
[26]周明雨.A公司戰(zhàn)略性原料藥采購成本控制策略研究[D].上海:華東理工大學,2015.
[27]張克榮,劉武藝.價格波動的研究方法及其模型[J].統(tǒng)計與決策,2011(4):10-12.