• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于文本挖掘的旅游目的地游客旅游滿意度探析

      2021-11-21 09:14:25曹宛如
      當代旅游 2021年11期
      關鍵詞:分詞負面滿意度

      曹宛如

      河北地質(zhì)大學,河北石家莊 050031

      引言

      近年來旅游業(yè)實現(xiàn)開放式發(fā)展,在線訂閱旅游行程成為一種人們追捧的新時尚,在線旅游APP用戶規(guī)模穩(wěn)步增長。在線旅游APP推出的旅游行程根據(jù)游客的不同需求推薦各類的方案,游客從推薦中根據(jù)個人的不同需求選取自己喜歡的產(chǎn)品自助訂閱。

      盡管各類在線旅游APP滿足大眾對旅游的多種個性化需求,但是存在的問題仍屢見不鮮,在線訂閱的旅游行程后評價是游客分享旅游體驗的主要渠道,評價的內(nèi)容已經(jīng)成為影響潛在游客的訂閱在線旅游行程重要因素,逐漸成為旅游行業(yè)研究的對象之一,因此通過網(wǎng)絡評論的內(nèi)容分析游客對于在線訂閱的旅游行程的滿意度尤為重要。本文從網(wǎng)絡環(huán)境下游客旅游評論的角度,對游客旅游滿意度進行分析,以適應當前迅速變化的社會環(huán)境以及人們的消費心理的改變[2]。

      一 理論模型構建

      本文文本分析涉及到的理論及方法包括結(jié)巴分詞、決策樹構建和LDA模型等。

      根據(jù)游客對在線訂購的旅游行程產(chǎn)品的評價,基于文本分析對旅游行業(yè)游客滿意度進行分析,具體地,研究工作包含以下幾個方面:

      首先,通過結(jié)巴分詞的方法進行分詞處理[3]。根據(jù)前綴建立游客滿意度評論詞庫,將處理過的評論內(nèi)容進行分詞處理,并進行詞頻統(tǒng)計,繪制詞云圖。

      其次,采用分類回歸決策樹(CART),構建決策樹衡量模型好壞。構造特征空間和標簽,將樣本數(shù)據(jù)劃分為訓練集和測試集,隨機選取滿意度影響因素與對應的情感綜合評價多維數(shù)據(jù)矩陣中的75%作為測試集,其余25%作為驗證集,詞轉(zhuǎn)向量后即可構建決策樹。

      然后,采用情感分析,利用詞典資源、情感語集對分詞的各詞語的詞性進行判斷,建立情感詞庫,對詞語的感情極性進行分析,即判斷某個體對客體的感情傾向的方向,將評論內(nèi)容進行分詞、量化為數(shù)值型數(shù)據(jù),根據(jù)權重匹配得到情感值,做出正面和負面詞云圖,分析結(jié)果。

      最后,使用Python中的Genism庫來構建LDA主題模型對評論內(nèi)容進行分類,它可以以概率分布的形式給出每篇文檔的主題,從而依據(jù)主題分布進行主題聚類或者是文本分類。需要建立詞典及語料庫,利用函數(shù)功能定義余弦相似度函數(shù)做出正面評論和負面評論LDA主題數(shù)尋優(yōu)圖,根據(jù)主題尋優(yōu)圖選取余弦相似度接近于零的主題數(shù),基于每個主題下生成的最有可能詞語分別對正面評論和負面評論進行兩個潛在主題的特征詞提取并分析。

      二 實證分析

      (一)數(shù)據(jù)來源與處理

      由收集的樣例數(shù)據(jù)3990條評論,數(shù)據(jù)分為訓練樣本集和測試樣本集兩部分。首先需要對各網(wǎng)站評論內(nèi)容進行去重和數(shù)據(jù)清洗處理,去重后評論有3814條,并刪除評論中會含有對文本分析沒用價值的詞。

      (二)文本分析

      本文運用結(jié)巴分詞對3814條評論內(nèi)容進行分詞處理,對每條評論的分詞數(shù)量的分布情況進行分析。利用python做出分詞后的詞云圖,用于呈現(xiàn)出現(xiàn)頻次處于前100的高頻詞匯,在詞云圖中,字號最大的是“酒店”,說明作為游客在旅游中最關心的因素是酒店。其次是“廈門”“不錯”“同程”“導游”“鼓浪嶼”“服務”等,詞云圖中大部分的高頻詞都是偏積極或者中性的,說明大多數(shù)游客對于旅游體驗持滿意態(tài)度,并對酒店、導游、服務、時間、安排、早餐幾方面比較看重。

      通過構建決策樹可實現(xiàn)對評論內(nèi)容的情感分類,利用從訓練集的評論內(nèi)容中自動學習到的信息,對測試集評論的情感方向進行預測。經(jīng)過處理后的2844個樣本中,差評、中評和好評的數(shù)量分別為383條、342條和2119條。決策樹計算結(jié)果顯示,訓練樣本集上的準確率為78%,測試樣本集上的準確率為78%。正面情感詞匯的F1-score較高為87%,精確率為78%,召回率為99%。負面情感詞匯的F1-score較低為36%,精確率為70%,召回率為24%。平均的F1-score為71%,總體來說構建模型的效果不錯[4]。

      (三)情感分析

      采用知網(wǎng)發(fā)布的情感語集,并在詞庫中加入新詞“贊”“推薦”“好評”等,以提高情感分析的準確性。接著對于不同的情感方向詞語進行權重分配,然后利用表連接的方式將情感詞庫的權重匹配到前面處理過的評論分詞中,正面詞權重為1,負面詞權重為-1。對于在評論中出現(xiàn)否定詞或者雙重否定的情況,修正情感影響。

      根據(jù)每條評論得到的的情感得分對評論內(nèi)容重新打上情感方向的標簽,情感得分大于零的評論為“正”,得分小于零的為“負”,等于零的為“中”,得到帶有情感方向的評論共3251條。在分析評論的情感方向時,主要分析的是游客對旅游感受的正負面情感方向,因此我們主要分析機器學習方法在正負面的準確率,計算得出總體判斷準確率約為72%。

      由正負面的情感詞云圖的對比可清晰看出,正面的情感詞云圖詞語分布較為密集,負面詞云圖分布較為稀疏。說明對于自己的旅游體驗感覺良好的游客占了絕大多數(shù),只有很少一部分游客對于自己的行程不滿意。主要的負面詞包括“投訴”“失望”“難吃”“無聊”“貴”“不合理”“不負責任”等。由此反映出商家應在食物、服務、價格等方面做出相應改善,以減少游客在這些方面的不滿[5]。

      (四)主題分析

      基于LDA模型的主題分析,它的優(yōu)點能夠精確的反映出他們的主題[1]。本文使用python的genism庫來構建LDA主題模型對評論內(nèi)容進行分類。本次分析中當主題數(shù)為2時余弦相似度幾乎接近于零,因此將正面和負面評論的LDA主題數(shù)都定為2,同時每個主題下生成10個最有可能的詞語。

      根據(jù)對游客旅游積極評論內(nèi)容的兩個潛在主題的特征詞提取,主題1的高頻特征詞如“酒店”“飛機”“房間”“接機”,說明游客對于整個行程中對交通和住宿方面的滿意度較高。主題2的高頻特征詞如“行程”“導游”“廈門”“服務”。主要反映了游客對行程中導游的服務滿意度較高。

      根據(jù)對游客旅游消極評論內(nèi)容的兩個潛在主題的特征詞提取,主題1的高頻特征詞如“差”“客服”“安排”“吃”,說明游客對于行程中客服的安排以及食物方面的滿意度較低。主題2的高頻特征詞如“酒店”“導游”“飛機”“時間”“安排”“房間”。發(fā)現(xiàn)包含的范圍計較廣,無論是導游的服務、時間的安排還是住宿方面都沒有達到游客的滿意。說明商家在行程安排和住宿方面仍有很大的提升空間[6]。

      三 結(jié)語

      本文利用文本挖掘技術在評論內(nèi)容中獲取游客的實際體驗信息,將非結(jié)構化的評論內(nèi)容通過結(jié)巴分詞進行分詞、量化處理,進而轉(zhuǎn)化成結(jié)構型數(shù)據(jù)。進行決策樹模型的構建,將原數(shù)據(jù)集細化區(qū)分為訓練集和測試集,最后構建的模型在測試集上的預測準確率為78%,預測結(jié)果總體上良好。情感得分與游客的滿意度呈現(xiàn)出正相關關系,總體準確率為72%。最后利用LDA模型對評論內(nèi)容的主題進行提取,主要得出以下結(jié)論:游客對于旅游的正面評價遠遠多于負面評價,在對旅游體驗進行評價時,游客往往會更關注兩大方面。一方面是旅游過程中的剛性需求,比如住宿需求、出行需求、餐飲需求等,如在住宿時游客對于住宿環(huán)境、住宿質(zhì)量以及酒店服務等方面十分看重,在選擇出行工具時也會綜合出行工具的性價比及舒適度加以考量。另一方面則是對行程安排、導游、景點客服非必選服務的抉擇,如行程安排的合理性影響了游客對于旅游行程的實際體驗感,導游的服務質(zhì)量會影響游客對剩余行程的繼續(xù)與否,景點客服的服務態(tài)度會影響游客對該景點的回訪率等。

      猜你喜歡
      分詞負面滿意度
      多感謝,生活滿意度高
      工會博覽(2023年3期)2023-04-06 15:52:34
      16城市公共服務滿意度排行
      小康(2021年7期)2021-03-15 05:29:03
      淺談如何提升脫貧攻堅滿意度
      活力(2019年19期)2020-01-06 07:34:38
      明天村里調(diào)查滿意度
      雜文月刊(2019年15期)2019-09-26 00:53:54
      結(jié)巴分詞在詞云中的應用
      智富時代(2019年6期)2019-07-24 10:33:16
      負面清單之后的電改
      能源(2018年8期)2018-09-21 07:57:22
      遠離負面情緒
      值得重視的分詞的特殊用法
      高考分詞作狀語考點歸納與疑難解析
      論英語不定式和-ing分詞的語義傳承
      外語學刊(2011年3期)2011-01-22 03:42:20
      汽车| 扶沟县| 静宁县| 甘谷县| 灵丘县| 阳东县| 海伦市| 平遥县| 登封市| 琼结县| 巧家县| 扶风县| 建德市| 永登县| 杨浦区| 乐都县| 开原市| 宿迁市| 平邑县| 婺源县| 呼和浩特市| 镇沅| 和田市| 荣成市| 永仁县| 通渭县| 噶尔县| 阿图什市| 台东市| 惠东县| 禄劝| 南涧| 禹州市| 紫金县| 炎陵县| 九龙城区| 扶绥县| 长子县| 寻乌县| 杂多县| 应城市|