• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于統(tǒng)計(jì)和情感分析的在線酒店服務(wù)質(zhì)量監(jiān)測

      2019-10-21 18:19:42馬海容
      度假旅游 2019年1期
      關(guān)鍵詞:統(tǒng)計(jì)方法在線評論情感分析

      馬海容

      摘要:由于在線評價(jià)的主觀性強(qiáng),本研究提出基于統(tǒng)計(jì)和情感分析模型,將文本挖掘技術(shù)引入到酒店顧客在線評論研究中,避免內(nèi)容分析法的主觀性并實(shí)現(xiàn)批量化處理;且對用戶評分進(jìn)行統(tǒng)計(jì)分析,從而對酒店質(zhì)量進(jìn)行監(jiān)測。研究隨機(jī)選定攜程網(wǎng)武漢地區(qū)各類酒店顧客在線評論為研究對象,結(jié)合主客觀指標(biāo)對酒店服務(wù)質(zhì)量加以衡量和監(jiān)測,發(fā)現(xiàn)三星級酒店現(xiàn)階段質(zhì)量亟待改進(jìn)。

      關(guān)鍵詞:統(tǒng)計(jì)方法;情感分析;在線評論;酒店服務(wù)質(zhì)量監(jiān)測

      中圖分類號:F274? ? ? ?文獻(xiàn)標(biāo)識碼:A? ? 文章編號:1672-7517(2019)01-0091-02

      1 引言

      隨著國民經(jīng)濟(jì)的增長和人們生活水平的提高,人們對旅行和精神上的享受越來越重視,酒店作為旅游行業(yè)不可缺省的部分,占舉足輕重的地位。到目前為止,我國各層次類型酒店的設(shè)施設(shè)備已經(jīng)相對完善,但是仍存在很多問題:1)硬件設(shè)施良莠不齊;2)服務(wù)水平參差不齊;3)地域差異明顯等。隨著人們生活水平的提高,人們越來越追求舒適度和良好環(huán)境,價(jià)格優(yōu)勢已被逐漸弱化。隨著互聯(lián)網(wǎng)的快速發(fā)展使網(wǎng)上預(yù)訂勢不可擋,但網(wǎng)上預(yù)訂用戶不能真實(shí)感知酒店服務(wù)質(zhì)量,前用戶評價(jià)很大程度上直接決定了現(xiàn)用戶選擇。現(xiàn)階段人們對酒店服務(wù)質(zhì)量的評判多數(shù)僅限于客觀指標(biāo),例如地理位置、價(jià)格范圍、房間設(shè)施等。本文提出一種結(jié)合客觀指標(biāo)和用戶主觀評論指標(biāo)的模型,通過自然語言處理技術(shù),對無結(jié)構(gòu)的客戶評論進(jìn)行數(shù)據(jù)的自動挖掘,對有結(jié)構(gòu)的評分?jǐn)?shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,結(jié)合客觀和主觀指標(biāo)雙指標(biāo)對酒店質(zhì)量進(jìn)行評價(jià),從而達(dá)到酒店服務(wù)質(zhì)量監(jiān)測的目的。

      2 相關(guān)研究

      目前,酒店在線評論的研究主要集中在評論信息挖掘和評論影響研究兩個方面。但以下三點(diǎn)還有些欠缺:一學(xué)者往往對服務(wù)質(zhì)量的測量、控制和管理方法加以探討,研究方法以定性研究為主,較少運(yùn)用定量研究方法;二在各類型各地區(qū)等細(xì)化維度上的分析或?qū)Ρ妊芯枯^少;三多數(shù)研究的方法為內(nèi)容分析法,不能對評論批量處理。因此,本文提出基于統(tǒng)計(jì)和情感分析的模型,將文本挖掘技術(shù)引入到酒店顧客在線評論研究中,盡量避免內(nèi)容分析法的主觀性并實(shí)現(xiàn)批量化處理;對用戶評分進(jìn)行統(tǒng)計(jì)分析,從而對酒店質(zhì)量進(jìn)行客觀評價(jià)。隨機(jī)選定攜程網(wǎng)武漢地區(qū)各類型酒店顧客在線評論為研究對象,結(jié)合主客觀指標(biāo)對酒店服務(wù)質(zhì)量加以衡量和監(jiān)測。

      3 基于統(tǒng)計(jì)和情感分析的模型

      3.1 基于統(tǒng)計(jì)和情感分析的模型

      本文的研究方法主要是文本挖掘,是在非結(jié)構(gòu)化的文本數(shù)據(jù)中抽取有價(jià)值的信息,包括對從在線酒店評論文本進(jìn)行預(yù)處理、分詞與詞頻統(tǒng)計(jì)、特征選取、情感分析等過程。對有結(jié)構(gòu)的評分統(tǒng)計(jì)分析,結(jié)合主客觀指標(biāo)對酒店質(zhì)量做出評估。

      3.2研究過程

      (1)樣本選取

      本文定向選取攜程網(wǎng)酒店評論5000多條。選取攜程網(wǎng)的理由:a.攜程網(wǎng)有酒店位置、設(shè)施、服務(wù)和衛(wèi)生的打分項(xiàng)(滿分5分);b.對比去哪兒網(wǎng)和藝龍網(wǎng)等多個網(wǎng)站,發(fā)現(xiàn)該網(wǎng)用戶評論長度長,包含有用信息的可能性較大,藝龍網(wǎng)站評論對本研究來說有用內(nèi)容偏少;c.該網(wǎng)多數(shù)配圖評論,更真實(shí);d.該網(wǎng)排名靠前更具權(quán)威性。

      (2)數(shù)據(jù)預(yù)處理

      過濾無意義和質(zhì)量低的評論以降低數(shù)據(jù)噪音,過濾內(nèi)容:a.廣告評論。銷售或轉(zhuǎn)手產(chǎn)品的廣告帖,一般含電話號碼、QQ號或網(wǎng)頁鏈接。b.宣傳評論。宣傳酒店把產(chǎn)品、返現(xiàn)作為活動獎品的宣傳帖。c.無用評論。僅僅包含純大量重復(fù)或者無任何價(jià)值的評論,例:好,很好,贊,差,等。以上評論對酒店評論挖掘無意義,在預(yù)處理時刪除,同時只選取了中文評論加以保證語言的統(tǒng)一性。

      酒店評論信息預(yù)處理后對文本進(jìn)一步處理:a.采用NIPIR分詞。一條評論分詞后得到一個詞向量,且每個詞都帶詞性標(biāo)記,如名詞、動詞、形容和方位詞等,且以“,”“?!薄?!”等將評論劃分為獨(dú)立句子;b.根據(jù)需要對分詞后的結(jié)果去停用詞,去掉還、也、的、地、語氣助詞、方位和時間副詞等;c.觀點(diǎn)抽取,本文情感分析方面選硬件設(shè)施、位置和交通、酒店環(huán)境、服務(wù)、衛(wèi)生、餐飲和價(jià)格七個指標(biāo)對酒店質(zhì)量評價(jià),給定指標(biāo)選取特征詞為:硬件設(shè)施:設(shè)施、裝修、空調(diào)、床、房間、衛(wèi)生間、淋浴、WIFI、隔音;位置:位置、交通;環(huán)境:環(huán)境;服務(wù):前臺服務(wù)、服務(wù)、大堂服務(wù)、門童;餐飲:餐飲、早餐;衛(wèi)生:衛(wèi)生間、衛(wèi)生;價(jià)格:價(jià)格。后根據(jù)給定的特征詞對評論文本分類。

      計(jì)算每句評論中的形容詞與給定特征詞的距離,找到離給定特征詞最近的形容詞(修飾詞)作為觀點(diǎn)詞,形成特征-觀點(diǎn)對。例[早餐也不錯],提取后特征-觀點(diǎn)對是<早餐、不錯>。

      (3)情感分析

      用SO-PMI方法計(jì)算特征-觀點(diǎn)對情感傾向,Turney提出基于情感詞組的SO-PMI語義分類方法,定義逐點(diǎn)互信息量(PMI,Pointwise Mutual Information)計(jì)算兩個詞w1和w2間的語義相關(guān)性:

      計(jì)算抽取的觀點(diǎn)詞與情感詞Positive和Negative的PMI,并利用SO(semantic opinion orientation)來計(jì)算該詞的語義傾向性:

      [SO(w)=PMI(w,"Positive")-PMI(w,"Negative")]? ? ? ? ?(2)

      若SO>0,則表示該特征-觀點(diǎn)對好評(即正面情感),即在這條評論中用戶對該特征好評,若SO<0,說明酒店給了用戶這個特征方面不好的體驗(yàn),即酒店要在這個特征方面做必要的改進(jìn)。計(jì)算每個評論中的特征-觀點(diǎn)對的SO值,然后將七個特征方面SO值匯總,即是每個特征的用戶情感。

      (4)評分統(tǒng)計(jì)分析

      使用SPASS軟件對抓取的每個星級最受歡迎的前50家酒店的設(shè)施、位置、服務(wù)和衛(wèi)生統(tǒng)計(jì)分析,滿分5分,且對來自不同星級酒店數(shù)據(jù)進(jìn)行離散程度、均值分析和雙變量線性相關(guān)分析。

      4 實(shí)驗(yàn)結(jié)果

      4.1情感分類結(jié)果分析

      為保證情感分析實(shí)驗(yàn)的準(zhǔn)確性,選取武漢以下4個類別最受歡迎的酒店各5家,并從每個酒店隨機(jī)選取2016年至今的評論50條。部分?jǐn)?shù)據(jù)為:五星級:硬件設(shè)施389,位置171,環(huán)境70,服務(wù)344,餐飲:132,衛(wèi)生:126,價(jià)格84。注:以涉及的評論句子個數(shù)為計(jì)量單位。例:視野不錯,前臺服務(wù)專業(yè),酒店位置也很好。該評論涉及“服務(wù)”“位置”兩個指標(biāo)。

      從提取的評論分布可看出評論中提到較多的是硬件設(shè)施、位置和服務(wù),且服務(wù)占比最大,由此可見,服務(wù)型行業(yè)未來發(fā)展應(yīng)該更加注重服務(wù)質(zhì)量的提升。

      由分類和情感傾向值計(jì)算部分結(jié)果展示為:五星級正向情感概率為:硬件設(shè)施39.85%,位置70.18%,環(huán)境58.57%,服務(wù)87.21%,餐飲:58.01%,衛(wèi)生:80.16%,價(jià)格23.80%。發(fā)現(xiàn):a.星級越高,相對來說位置、環(huán)境和服務(wù)好評率越高;b.經(jīng)濟(jì)型酒店價(jià)格優(yōu)勢較明顯。c.所有酒店普遍設(shè)施陳舊,星級越低,空調(diào)、隔音等硬件設(shè)施問題越突出。當(dāng)然本實(shí)驗(yàn)獲取的評論樣本有限,可能存在不同程度的偏差,原因如下:a.大部分網(wǎng)站會好評優(yōu)先,且本實(shí)驗(yàn)評論覆蓋有限,因此好評率可能偏高;b.不同星級的評價(jià)標(biāo)準(zhǔn)不同,星級越高,用戶對酒店要求越高;c.情感分類存在錯分,以“,”“。”“!”分割會忽略上下文的關(guān)系,例“沒的說”在文本中不結(jié)合上下文很容易產(chǎn)生歧義使得情感分類出錯。

      4.2評分統(tǒng)計(jì)結(jié)果分析

      對星級酒店最受歡迎前25家酒店評分統(tǒng)計(jì)分析。得到五星級酒店在位置、設(shè)施、服務(wù)和衛(wèi)生四方面的評分均值為4.5120、4.4560、4.5000和4.5960,除設(shè)施外其他指標(biāo)均達(dá)90%,方差分別為0.045,0.060,0.030,0.032,分?jǐn)?shù)差異較小,無突然地跳躍點(diǎn),說明評分較可靠。由此,五星級酒店需優(yōu)化設(shè)施保證其質(zhì)量。四星級酒店評分均值分別為4.4600,4.3440,4.4280,4.5240,服務(wù)和設(shè)施相對較低,三星的酒店評分均值低于二星級及以下的評分均值,說明三星級酒店需要全面整頓,注重服務(wù)質(zhì)量。

      為明確酒店位置、設(shè)施、服務(wù)和衛(wèi)生間關(guān)系,對其做雙變量相關(guān)系分析得:在0.05水平上位置和設(shè)施、位置和服務(wù)、位置和衛(wèi)生顯著相關(guān);在0.01水平上設(shè)施和服務(wù)、設(shè)施和衛(wèi)生、服務(wù)和衛(wèi)生室顯著相關(guān)。各因素之間都有相關(guān)關(guān)系,一般位置越差設(shè)施也會越差,服務(wù)差的酒店衛(wèi)生情況也差。全面的評價(jià)酒店質(zhì)量須著眼于全局。

      5 結(jié)束語

      本研究取得良好效果,說明基于統(tǒng)計(jì)和情感分析的模型確實(shí)可行,綜合分析可知:a.酒店最大的問題是設(shè)施老舊,客戶對設(shè)施滿意度低;b.三星級酒店整體質(zhì)量有待加強(qiáng),各要素都需要嚴(yán)格按照星級要求改進(jìn);c.所有星級酒店都存在某要素不達(dá)星級標(biāo)準(zhǔn)的情況,例如,設(shè)施老舊,管理專業(yè)化程度欠缺;d.服務(wù)質(zhì)量有待加強(qiáng)。

      在本次研究中,發(fā)現(xiàn)三星級酒店問題最大,需要及時改進(jìn),且對比效果明顯。當(dāng)然試驗(yàn)中仍有不足之處:a.數(shù)據(jù)量相對較小;b.情感分類中一句為單位,忽略了句子之間的關(guān)系,可能導(dǎo)致誤分。接下來我會增大數(shù)據(jù)分析,并且通過語義分析和依存句法分析,使得實(shí)驗(yàn)結(jié)果更加精準(zhǔn)。

      參考文獻(xiàn):

      [1] 熊偉,許俊華.基于內(nèi)容分析法的我國經(jīng)濟(jì)型酒店服務(wù)質(zhì)量評價(jià)研究[J].北京第二外國語學(xué)院學(xué)報(bào),2010(11):57-67.

      [2] 曹彬.互聯(lián)網(wǎng)上旅游評論的情感分析及其有用性研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2008.

      [3] 張紫瓊,葉強(qiáng),李一軍.互聯(lián)網(wǎng)商品評論情感分析研究綜述[J].管理科學(xué)學(xué)報(bào),2010,(13):85~96.

      [4] 熊偉 , 高陽 , 吳必虎. 中外國際高星級連鎖酒店服務(wù)質(zhì)量對比研究——基于網(wǎng)絡(luò)評價(jià)的內(nèi)容分析 [J]. 經(jīng)濟(jì)地理 ,2012,32(2):160-165.

      [5] 張慧 . 基于內(nèi)容分析法的高星級飯店服務(wù)質(zhì)量實(shí)證比較研究 [J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào) ,2012(2):77-84.

      [6] 賀飛艷,何炎祥,劉楠,等.面向微博短文本的細(xì)粒度情感特征抽取方法[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2014,50(1):48-54.

      [7] 李湘東,巴志超,黃莉.基于LDA 模型和 HowNet的多粒度子話題劃分方法[J] .計(jì)算機(jī)應(yīng)用研究, 2015,32(6):1625-1629.

      [8]J. Z. Zhai, H. Xu, J. Li, P. JIA.Sentiment Classification for Chinese Reviews Based on Key Substring Features[C]. Proceedings of the Conference on Natural Language Processing and Knowledge Engineering[J]. Dalian, China: IEEE Computer Society, 2009:1-8.

      [9]Detecting Implicit Expressions of Sentiment in Text Based on Commonsense Knowledge. Alexandra Balahur,Jesus M Hermida,Andres Montoyo. Proceeding of the 2th workshop on computational approaches to subjectivity and sentiment analysis ACI-HLT . 2011.

      [10]Automatically generating annotator rationales to improve sentiment, classification. Yessenalina Ainur,Choi Yejin,Cardie Claire. Proceedings of the ACL 2010 Conference Short Papers (ACL) . 2010.

      猜你喜歡
      統(tǒng)計(jì)方法在線評論情感分析
      基于SVM的產(chǎn)品評論情感分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      在線評論情感屬性的動態(tài)變化
      預(yù)測(2016年5期)2016-12-26 17:16:57
      在線評論對電子商務(wù)商品銷量的影響研究
      中文信息(2016年10期)2016-12-12 11:01:20
      漢語詞匯研究中的統(tǒng)計(jì)方法述評
      文教資料(2016年19期)2016-11-07 06:59:27
      統(tǒng)計(jì)方法的改革與創(chuàng)新分析
      統(tǒng)計(jì)方法在企業(yè)財(cái)務(wù)分析中的應(yīng)用
      財(cái)稅管理中的統(tǒng)計(jì)創(chuàng)新研究
      商(2016年22期)2016-07-08 17:08:09
      在線評論對消費(fèi)者購買意圖的影響研究
      商(2016年10期)2016-04-25 10:03:58
      文本觀點(diǎn)挖掘和情感分析的研究
      延边| 五寨县| 白河县| 沈丘县| 图片| 江门市| 宁河县| 元谋县| 安福县| 赤峰市| 元朗区| 铁岭县| 岚皋县| 巴南区| 沂源县| 仙游县| 辽阳市| 南昌县| 城口县| 鹤峰县| 云南省| 固安县| 阿合奇县| 庄浪县| 凯里市| 成武县| 高邑县| 富宁县| 临泽县| 岳西县| 阳信县| 枣阳市| 大邑县| 油尖旺区| 揭东县| 科技| 塔城市| 永德县| 海口市| 呼伦贝尔市| 永靖县|