• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于主成分分析的電影數(shù)據(jù)研究

      2019-12-16 02:57:56張超
      電腦知識(shí)與技術(shù) 2019年30期
      關(guān)鍵詞:主成分分析數(shù)學(xué)模型

      張超

      摘要:為了綜合分析電影數(shù)據(jù),本文通過工具SPSS19.0,運(yùn)用主成分分析方法,對(duì)樣本進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,建立了對(duì)應(yīng)的數(shù)學(xué)模型,希望為電影制作方和影院提供一定的參考。

      關(guān)鍵詞:主成分分析;數(shù)學(xué)模型;SPSS

      中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A

      文章編號(hào):1009-3044(201 9)30-0001-02

      1概述

      隨著涌現(xiàn)出很多優(yōu)秀并且龐大的電影量,一部電影又包含了眾多的屬性,這些不同的屬性引起的效應(yīng)大小各異。基于龐大的電影數(shù)據(jù),就需要我們用計(jì)算機(jī)來處理和分析,來減少人工工作量,獲得我們想要的信息。本文使用主成分分析方法,對(duì)電影數(shù)據(jù)進(jìn)行綜合統(tǒng)計(jì)分析,希望可以為電影制片方合理分配資源和影院排片提供一定的參考。

      3實(shí)驗(yàn)數(shù)據(jù)

      本文實(shí)驗(yàn)采用了50部電影數(shù)據(jù),其來源于豆瓣網(wǎng)站,包含了導(dǎo)演影響指數(shù)、明星指數(shù)、評(píng)分、片長、是否黃金周、影片類型、是否續(xù)集、想看人數(shù)、制作地區(qū)、票房收入共10個(gè)屬性。其中影片類型和制作地區(qū)數(shù)據(jù)不能直接使用,必須先轉(zhuǎn)換為數(shù)值類型,本文采用最基本的分類標(biāo)記,對(duì)制作地區(qū)中國大陸標(biāo)記為1,香港標(biāo)記為2,美國標(biāo)記為3,印度標(biāo)記為4。同理對(duì)影片類型進(jìn)行標(biāo)記。通過這種簡單的數(shù)值標(biāo)記能確保這兩個(gè)變量能進(jìn)人數(shù)據(jù)分析。

      4主成分分析過程

      本文使用從豆瓣電影搜集的票房相關(guān)數(shù)據(jù)進(jìn)行分析,借助數(shù)據(jù)統(tǒng)計(jì)分析工具SPSS19.0對(duì)樣本數(shù)據(jù)進(jìn)行主成分分析,分析步驟:首先加載數(shù)據(jù):文件一打開一數(shù)據(jù)一選擇本地?cái)?shù)據(jù)。然后分析數(shù)據(jù):分析一降維一因子分析。獲得輸出結(jié)果如下表1、2所示:

      由表1結(jié)果可知,在本例中,成份1、2、3和4的特征值大于1,他們累計(jì)貢獻(xiàn)率達(dá)到70.21%,還算不錯(cuò),所以我們通過主成分分析,可以提取4個(gè)主要成份,轉(zhuǎn)換后的這4個(gè)綜合指標(biāo)可以大致反映原始數(shù)據(jù)。

      使用spss數(shù)據(jù)分析軟件對(duì)電影票房數(shù)據(jù)進(jìn)行分析,從中提取出了4個(gè)主要成份,從表2可知導(dǎo)演影響指數(shù)、評(píng)分、片長和想看人數(shù)在第一主成份具有較高載荷,明星指數(shù)和是否續(xù)集在第二主成份具有較高載荷,第三主成份上沒有反映出較高載荷的指標(biāo),第四主成份主要反映了是否黃金周這一個(gè)指標(biāo)信息。

      用成份矩陣中一個(gè)主成分對(duì)應(yīng)的數(shù)值,與主成分相對(duì)應(yīng)特征值平方根的商,計(jì)算出的數(shù)值便是一個(gè)主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù),便得到4個(gè)主成分的數(shù)學(xué)模型如下:

      5結(jié)束語

      本文通過主成分分析數(shù)據(jù)分析方法,使用spss軟件分析數(shù)據(jù),提取了4個(gè)主成分,他們累計(jì)貢獻(xiàn)率達(dá)到70.21%,轉(zhuǎn)換后的這4個(gè)綜合指標(biāo)可以大致反映原始數(shù)據(jù),并且建立了綜合數(shù)學(xué)模型,對(duì)于電影的綜合評(píng)價(jià)分析具有一定的參考意義。但由于實(shí)驗(yàn)數(shù)據(jù)面窄,某些重要的特征屬性無法獲取,這些因素對(duì)綜合分析電影數(shù)據(jù)都有一定的幫助,未來通過搜集更全面的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行改進(jìn)。

      猜你喜歡
      主成分分析數(shù)學(xué)模型
      AHP法短跑數(shù)學(xué)模型分析
      活用數(shù)學(xué)模型,理解排列組合
      主成分分析法在大學(xué)英語寫作評(píng)價(jià)中的應(yīng)用
      江蘇省客源市場影響因素研究
      SPSS在環(huán)境地球化學(xué)中的應(yīng)用
      考試周刊(2016年84期)2016-11-11 23:57:34
      對(duì)一個(gè)數(shù)學(xué)模型的思考
      長沙建設(shè)國家中心城市的瓶頸及其解決路徑
      古塔形變的數(shù)學(xué)模型
      河南科技(2014年5期)2014-02-27 14:08:47
      石景山区| 绥江县| 陵水| 正蓝旗| 阿勒泰市| 中超| 临猗县| 额尔古纳市| 淮滨县| 西林县| 北辰区| 新绛县| 满城县| 泊头市| 大宁县| 山阴县| 海淀区| 锡林浩特市| 舒城县| 定襄县| 遂宁市| 垫江县| 绥宁县| 德昌县| 东阿县| 仪陇县| 三明市| 汉中市| 聊城市| 宜春市| 读书| 赤壁市| 洪湖市| 开封县| 依兰县| 错那县| 德州市| 定远县| 德钦县| 旬邑县| 乌兰县|