【摘要】 通過(guò)自建電影《流浪地球》的網(wǎng)絡(luò)影評(píng)語(yǔ)料庫(kù),設(shè)計(jì)了基于詞典的情感分析算法,隨機(jī)抽取豆瓣600條網(wǎng)絡(luò)影評(píng)展開(kāi)情感分析,并借助態(tài)度系統(tǒng)對(duì)情感詞進(jìn)行標(biāo)注。結(jié)果發(fā)現(xiàn),觀眾對(duì)技術(shù)和主題滿意度高,對(duì)情節(jié)、表演及語(yǔ)言滿意度低。
【關(guān)鍵詞】 情感分析;網(wǎng)絡(luò)影評(píng);態(tài)度系統(tǒng)
【中圖分類號(hào)】J905? ? ? ? ? 【文獻(xiàn)標(biāo)識(shí)碼】A? ? ? ? ? 【文章編號(hào)】2096-8264(2021)02-0104-02
基金項(xiàng)目:江蘇省研究生科研創(chuàng)新計(jì)劃“基于評(píng)價(jià)理論與Python情感分析的中美德電影跨文化協(xié)同研究”(項(xiàng)目編號(hào):KYCX20_1046)資助項(xiàng)目的階段性成果。
隨著互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡(luò)成為人們?nèi)粘=浑H的熱點(diǎn)領(lǐng)域,影評(píng)也隨之網(wǎng)絡(luò)化。各階層民眾通過(guò)對(duì)電影進(jìn)行描述和評(píng)價(jià),來(lái)表達(dá)自身的美學(xué)認(rèn)知和價(jià)值期許。美國(guó)傳播學(xué)者Herbert Schiller(1982)指出:“電影、廣播、電視、書(shū)籍、新聞等隨處可見(jiàn)的文化產(chǎn)品或服務(wù),不僅提供消息和娛樂(lè),同時(shí)也是傳播社會(huì)價(jià)值或政治觀點(diǎn)的工具,最終它們會(huì)對(duì)社會(huì)和精神結(jié)構(gòu)產(chǎn)生深刻的影響。”然而,目前國(guó)產(chǎn)電影跨文化研究尚存在宏觀研究有余、微觀研究不足等諸多問(wèn)題。因此本文通過(guò)對(duì)影片《流浪地球》的豆瓣網(wǎng)絡(luò)影評(píng)進(jìn)行特征提取和情感分析,并采用態(tài)度系統(tǒng)對(duì)情感詞進(jìn)行標(biāo)注,考察觀眾對(duì)影片從整體到局部的滿意度,以此為自然語(yǔ)言處理、話語(yǔ)分析等相關(guān)研究提供幫助和啟示。
一、國(guó)產(chǎn)電影研究現(xiàn)狀
國(guó)外學(xué)者對(duì)中國(guó)電影的研究建立在跨文化的視角上,他們運(yùn)用西方的電影理論、電影批評(píng)理論考察中國(guó)電影反映的政治、經(jīng)濟(jì)、文化等問(wèn)題,并對(duì)中國(guó)電影在外傳播與接受狀況進(jìn)行研究,相關(guān)成果有Chris Berry、George Semsel等分析了中國(guó)電影的藝術(shù)性;Paul Clark、Nick Browne、Poshek Fu等對(duì)中國(guó)電影的政治元素進(jìn)行解讀;Stephanie Donald、Tonglin Lu等對(duì)中國(guó)電影的現(xiàn)代性及在西方的接受程度研究等。
21世紀(jì)初,隨著國(guó)家廣播電影電視總局廣播影視“走出去工程”正式啟動(dòng),國(guó)產(chǎn)電影的跨文化研究隨之興起,相關(guān)事例有戴元光、邵培仁、項(xiàng)欣、李小麗等對(duì)國(guó)產(chǎn)電影的跨文化傳播策略進(jìn)行了探討;姚朝文、葛玉清、儲(chǔ)常勝等對(duì)特定類型的國(guó)產(chǎn)電影傳播進(jìn)行了研究等。然而以影評(píng)為研究對(duì)象的學(xué)者較少,相關(guān)研究有尚宏通過(guò)23篇中美日專業(yè)影評(píng)對(duì)比中美日三國(guó)的文化差異;李亦中、趙菲運(yùn)用NLTK自然語(yǔ)言處理對(duì)《紐約時(shí)報(bào)》影評(píng)進(jìn)行分析,對(duì)中國(guó)電影在美國(guó)的口碑與傳播進(jìn)行了歷時(shí)性研究。綜上,目前影評(píng)相關(guān)研究存在研究數(shù)量少、語(yǔ)料稀薄、理論運(yùn)用不足等問(wèn)題。因此,本研究將自然語(yǔ)言處理技術(shù)及評(píng)價(jià)理論延伸至電影文化領(lǐng)域,通過(guò)對(duì)網(wǎng)絡(luò)影評(píng)的情感態(tài)度進(jìn)行挖掘,考察觀眾對(duì)影片的接受情況。
二、研究方法
(一)數(shù)據(jù)收集及預(yù)處理
1.語(yǔ)料收集。采用隨機(jī)抽取的方式于豆瓣網(wǎng)站抽取影片《流浪地球》的網(wǎng)絡(luò)影評(píng),保留用戶名和評(píng)分,剔除無(wú)關(guān)項(xiàng)后得到影評(píng)600條共199176字,構(gòu)建小型網(wǎng)絡(luò)影評(píng)語(yǔ)料庫(kù)。
2.分句及去停用詞。首先,對(duì)語(yǔ)料進(jìn)行分句處理,得到4947條分句;其次,采用百度停用詞表對(duì)語(yǔ)料進(jìn)行去停用詞處理,并利用Python進(jìn)行過(guò)濾,得到中文影評(píng)共計(jì)144397字詞;最后,利用結(jié)巴分詞對(duì)語(yǔ)料進(jìn)行分詞。
3.特征提取。分別提取詞頻數(shù)量前200的詞進(jìn)行分類得到特征項(xiàng)。在特征提取方面主要根據(jù)名詞和名詞詞組出現(xiàn)的頻率進(jìn)行提取[1]。最后利用特征項(xiàng)對(duì)語(yǔ)料進(jìn)行歸類。
(二)情感分析框架
情感分析,又稱主客觀分析,以挖掘文本信息中用戶表達(dá)的情感極性為目標(biāo)。常見(jiàn)的情感分析技術(shù)有基于情感詞典的無(wú)監(jiān)督分類方法和基于機(jī)器學(xué)習(xí)的有監(jiān)督分類方法?;谇楦性~典的方法主要根據(jù)情感詞庫(kù)來(lái)匹配計(jì)算評(píng)論的情感傾向,而基于機(jī)器學(xué)習(xí)的方法通過(guò)人工設(shè)計(jì)代表評(píng)論文本的特征,然后抽取評(píng)論特征并表示成文本向量,對(duì)文本進(jìn)行分類(樊振等 2018)。本研究采用基于詞典的情感分析方法對(duì)文本進(jìn)行情感分析。
(三)態(tài)度分析框架
評(píng)價(jià)理論是關(guān)于評(píng)價(jià)的,即語(yǔ)篇中所協(xié)商的各種態(tài)度、所涉及的情感的強(qiáng)度以及表明價(jià)值和與讀者形成聯(lián)盟的各種方式[4]。評(píng)價(jià)理論包括三大系統(tǒng):態(tài)度、介入、級(jí)差,其中態(tài)度系統(tǒng)是中心[3]。態(tài)度系統(tǒng)又可進(jìn)一步劃分為情感、判斷和鑒賞三個(gè)子系統(tǒng)。情感系統(tǒng)關(guān)注積極或消極感情的表達(dá);判斷系統(tǒng)根據(jù)倫理、道德和社會(huì)規(guī)約評(píng)論人的行為;鑒賞系統(tǒng)涉及對(duì)符號(hào)和自然現(xiàn)象的評(píng)價(jià),依據(jù)的是特定領(lǐng)域內(nèi)評(píng)價(jià)的方式和標(biāo)準(zhǔn)[4]。態(tài)度有正面和負(fù)面、顯性和隱性之分,態(tài)度的好壞顯隱與否,取決于表達(dá)態(tài)度的語(yǔ)言意義[2]。
本研究基于情感詞典導(dǎo)出情感詞表,運(yùn)用態(tài)度系統(tǒng)對(duì)情感詞進(jìn)行標(biāo)注,然后利用Antconc 3.4對(duì)特征詞左右緊鄰的語(yǔ)境搭配詞進(jìn)行凸顯檢索,左右窗口大小設(shè)為3,按詞頻排序。通過(guò)情感詞結(jié)合語(yǔ)境分析,對(duì)特征項(xiàng)情感進(jìn)行挖掘。
三、結(jié)果與討論
根據(jù)情感分析的結(jié)果顯示,影評(píng)共有2966條正傾向語(yǔ)句和1981負(fù)傾向語(yǔ)句,可見(jiàn)正負(fù)傾向語(yǔ)句數(shù)差距明顯,說(shuō)明觀眾對(duì)影片總體滿意度高。同時(shí),影評(píng)正傾向語(yǔ)句的占比隨評(píng)分增加而升高,負(fù)傾向語(yǔ)句的占比呈中間高兩邊低的趨勢(shì)。其中,正傾向語(yǔ)句在四分和五分段高于負(fù)傾向語(yǔ)句占比,在其他分段都低于負(fù)傾向語(yǔ)句占比。說(shuō)明三分以上分段觀眾滿意度高,三分以下分段觀眾滿意度低。在影評(píng)詞頻最高的150個(gè)情感詞中,情感類情感詞共43個(gè),判斷類53個(gè),鑒賞類54個(gè)說(shuō)明觀眾以客觀性描述和評(píng)判為主。
通過(guò)對(duì)高頻詞進(jìn)行篩選及分類,得到占比前五位的特征為情節(jié)(21%)、主題(18%)、人物(11%)、技術(shù)(10%)、表演(5%)??梢钥闯?,觀眾對(duì)“情節(jié)”和“主題”層面關(guān)注度高,而對(duì)“表演”層面關(guān)注度較低。說(shuō)明相較于影片的演繹,觀眾更注重視影片內(nèi)容。情感分析結(jié)果顯示,正面語(yǔ)句共1614條,負(fù)面語(yǔ)句共1734條,總體上負(fù)面語(yǔ)句數(shù)略高于正面語(yǔ)句數(shù),且正面情感主要集中在“主題”和“技術(shù)”層面,負(fù)面情感主要集中在“情節(jié)”和“人物”層面。情感詞表中正面情感詞543個(gè),負(fù)面情感詞509個(gè)。在態(tài)度類別上,鑒賞類情感詞數(shù)量最多,情感類情感詞數(shù)量最少。
情節(jié)方面,負(fù)傾向語(yǔ)句數(shù)遠(yuǎn)高于正傾向語(yǔ)句數(shù),情感詞以負(fù)面判斷和正負(fù)面鑒賞為主。評(píng)論大致集中在“故事”“邏輯”和“科學(xué)設(shè)定”三個(gè)方面。觀眾認(rèn)為影片故事“單薄”“倉(cāng)促”,但總體“連貫”“有創(chuàng)意”,邏輯上“混亂”“不合理”且“不容推敲”,科學(xué)設(shè)定更是“不嚴(yán)謹(jǐn)”“漏洞百出”。
主題方面,正傾向語(yǔ)句數(shù)遠(yuǎn)高于負(fù)傾向語(yǔ)句數(shù),情感詞以正面鑒賞和正負(fù)面判斷為主。評(píng)論主要體現(xiàn)在“人類”“希望”“英雄”和“家園”四個(gè)方面。首先,觀眾從影片中感受到了人類的“渺小”,絕望之處的“希望”。其次,中方觀眾認(rèn)為地球是人類的“家園”,與人類“不可分割”。最后,中方觀眾“感動(dòng)”于萬(wàn)千平民英雄,“震撼”于人類最后時(shí)刻的“團(tuán)結(jié)”,對(duì)中國(guó)人能拯救世界感到“自豪”。
人物方面,負(fù)傾向語(yǔ)句數(shù)遠(yuǎn)高于正傾向語(yǔ)句數(shù),情感詞以負(fù)面判斷和負(fù)面鑒賞為主。評(píng)論主要體現(xiàn)在“人物塑造”“人物刻畫(huà)”和“人物情感”三個(gè)方面。中方觀眾認(rèn)為人物塑造“單薄”“混亂”,人物關(guān)系缺乏說(shuō)明;人物刻畫(huà)“隨意”“片面”;人物情感“簡(jiǎn)陋”“泄氣”。具體人物方面,觀眾提及最多的為“劉啟”“韓朵朵”和“劉培強(qiáng)”。對(duì)于劉啟,中方觀眾認(rèn)為其“叛逆”“任性”、稱姥爺為“老東西”讓人不適;對(duì)于韓朵朵,觀眾認(rèn)為其“沒(méi)用”“強(qiáng)行煽情”,關(guān)鍵時(shí)刻的演講更顯“啰嗦”“尷尬”,讓人“著急”;對(duì)于劉培強(qiáng),觀眾認(rèn)為其為救兒子棄全人類的未來(lái)于不顧、作為軍人不服從指令,是“自私”“不負(fù)責(zé)任”的表現(xiàn)。
技術(shù)方面,正傾向語(yǔ)句數(shù)遠(yuǎn)高于負(fù)傾向語(yǔ)句數(shù),情感詞以正面情感和正面鑒賞為主。評(píng)論大多聚焦“特效”“畫(huà)面”和“場(chǎng)景”三個(gè)層面。觀眾認(rèn)為特效“好”“棒”,場(chǎng)景“震撼”“恢弘”,畫(huà)面“考究”“精致”,技術(shù)上甚至是“不輸”好萊塢的。
表演方面,負(fù)傾向語(yǔ)句數(shù)略高于正傾向語(yǔ)句數(shù),情感詞在態(tài)度系統(tǒng)下的分布較為均勻。評(píng)論大致集中在“演技”和“演員”兩個(gè)方面。觀眾認(rèn)為片中老戲骨的演技還是“在線”的,但年輕演員演技“尷尬”,觀眾容易“出戲”。觀眾顯示出對(duì)吳京、吳孟達(dá)的高關(guān)注度,對(duì)于吳京,中方觀眾觀點(diǎn)不一,有部分觀眾認(rèn)為作為投資人,他的眼光不錯(cuò),但演技上有些“過(guò)力”,塑造的形象還停留在電影《戰(zhàn)狼》層面。對(duì)于吳孟達(dá),中方觀眾認(rèn)為“超出預(yù)期”,一反以往的喜劇形象,唯一的不足是戲份太少,可見(jiàn)觀眾對(duì)其的喜愛(ài)。
四、結(jié)論
本研究分析發(fā)現(xiàn),影評(píng)評(píng)分的正負(fù)傾向和觀眾態(tài)度的正負(fù)傾向呈現(xiàn)不協(xié)調(diào)性,由此可見(jiàn),觀眾評(píng)分具有隨機(jī)性、任意性。從特征分布上看,觀眾對(duì)影片情節(jié)、主題關(guān)注度最高,說(shuō)明觀眾更加注重影片內(nèi)容。在中國(guó)工業(yè)技術(shù)日益提升的今天,影片創(chuàng)作者不僅要加強(qiáng)技術(shù)上的投入,也應(yīng)當(dāng)注重對(duì)影片內(nèi)容和人物的打磨。
參考文獻(xiàn):
[1]唐曉波,蘭玉婷.基于特征本體的微博產(chǎn)品評(píng)論情感分析[J].圖書(shū)情報(bào)工作,2016,60(16):121-127.
[2]王振華,張慶彬.基于語(yǔ)料庫(kù)的中外大學(xué)校訓(xùn)意義研究——“評(píng)價(jià)系統(tǒng)”視角[J].外語(yǔ)教學(xué),2013,34(06): 7-12.
[3]司顯柱,徐婷婷.從評(píng)價(jià)理論看報(bào)紙社論的意識(shí)形態(tài)[J].當(dāng)代外語(yǔ)研究,2011(11):17-20.
[4]Martin, J. R., P. P. R. White. The Language of Evaluation: Appraisal in English. New York: Palgrave Macmillan, 2005.
作者簡(jiǎn)介:
鄧燕燕,女,漢族,江蘇南京人,碩士研究生,南京工業(yè)大學(xué)外國(guó)語(yǔ)言文學(xué)學(xué)院,研究方向:德語(yǔ)語(yǔ)言學(xué)、跨文化交際。