• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于文本挖掘和情感分析方法的“智慧旅游”服務(wù)質(zhì)量感知研究

      2023-06-25 12:14:08郭佳怡方博平陸欣怡王妮宋濤
      現(xiàn)代信息科技 2023年6期
      關(guān)鍵詞:情感分析智慧旅游

      郭佳怡 方博平 陸欣怡 王妮 宋濤

      摘? 要:智慧旅游是推動智慧城市發(fā)展的重要手段。隨著網(wǎng)絡(luò)評論在旅游生態(tài)中的地位顯著提升,如何通過網(wǎng)評文本反映游客的消費(fèi)體驗(yàn)、服務(wù)質(zhì)量反饋與情感訴求,吸引游客消費(fèi)、取得競爭優(yōu)勢,成為景區(qū)管理人員與主管部門的一項(xiàng)重要工作。基于文本挖掘和情感分析方法,選取景區(qū)和酒店網(wǎng)評文本,識別旅游景點(diǎn)現(xiàn)狀的問題和痛點(diǎn),設(shè)計(jì)科學(xué)、客觀的綜合評價(jià)體系,為景區(qū)與酒店等相關(guān)經(jīng)營者、文旅部門做出更優(yōu)決策提供理論支撐和數(shù)據(jù)支持。

      關(guān)鍵詞:智慧旅游;情感分析;TF-IDF算法;DBSCAN聚類;LDA主題模型

      中圖分類號:TP391;O235? ? 文獻(xiàn)標(biāo)識碼:A? 文章編號:2096-4706(2023)06-0001-06

      Research on Service Quality Perception of “Smart Tourism” Based on Text Mining and Sentiment Analysis Methods

      GUO Jiayi1, FANG Boping1, LU Xinyi1, WANG Ni1, SONG Tao1,2

      (1.School of Science, Huzhou University, Huzhou? 313000, China;

      2.Huzhou Key Laboratory of Data Modeling and Analysis, Huzhou? 313000, China)

      Abstract: Smart tourism is an important means to promote the development of the smart city. With the significant promotion of online comments in the tourism ecology, how to reflect tourists' consumption experience, service quality feedback and emotional demands through online comments text, so as to attract tourists' consumption and gain competitive advantages, has become an important task for scenic spot managers and competent departments. Based on text mining and sentiment analysis methods, the online comments text of scenic spots and hotels are selected to identify the problems and pain points of the current situation of tourist attractions, and a scientific and objective comprehensive evaluation system is designed to provide theoretical and data support for the scenic spots, hotels and other related operators and cultural tourism departments to make better decisions.

      Keywords: smart tourism; sentiment analysis; TF-IDF algorithm; DBSCAN clustering; LDA theme model

      0? 引? 言

      在智慧城市的快速規(guī)劃和發(fā)展進(jìn)程中,智慧旅游的建設(shè)源源不斷地為智慧城市建設(shè)提供動力。各類旅游網(wǎng)站和手機(jī)APP所轄的網(wǎng)評平臺為收集海量旅游用戶評論數(shù)據(jù)提供了方便。但如何對旅游景區(qū)滿意度進(jìn)行用戶情感分析,快速有效篩選和分析有效的評論,成為亟待解決的問題[1-3]。針對此問題,劉曉彤等提出了基于機(jī)器學(xué)習(xí)方法的在線評論情感分析技術(shù)以實(shí)現(xiàn)游客評論的情感數(shù)據(jù)挖掘[1];謝宗彥等[2]基于word2vec工具,程海琪[3]基于情感分類方法對酒店評論進(jìn)行情感分類和主題挖掘;石文華等基于情感傾向和對在線評論進(jìn)行有用性影響因素研究[4];田韶存針對用戶評論提出了一種與評論主題相關(guān)的權(quán)重方式[5];羅新引入集成學(xué)習(xí)方法中的隨機(jī)森林算法進(jìn)行了評論文本的分類模型研究[6];阮光冊采用LDA主題挖掘技術(shù)進(jìn)行了文本主題挖掘研究[7]。然而,這些研究所提出的分類和排序模型依然存在準(zhǔn)確度較低的問題,難以應(yīng)用到大規(guī)模的旅游服務(wù)平臺中。

      為了進(jìn)一步提高游客評論信息在旅游服務(wù)平臺上的分析準(zhǔn)確度,本文基于數(shù)據(jù)挖掘技術(shù)提出了針對游客評論數(shù)據(jù)的情感分類和有效篩選技術(shù)。利用收集自互聯(lián)網(wǎng)公開來源的景區(qū)酒店評價(jià)文本,采用TF-IDF算法對文本數(shù)據(jù)進(jìn)行關(guān)鍵詞提取,結(jié)合語義網(wǎng)絡(luò)分析,獲取印象熱詞;選取K-means聚類算法獲取游客滿意度影響因素,建立基于情感分析的游客滿意度評價(jià)模型;利用隨機(jī)森林(Random Forest)依據(jù)多項(xiàng)指標(biāo)篩選有效評論,構(gòu)建文本有效性評價(jià)體系;最后將情感分類和LDA主題挖掘進(jìn)行融合,建立LDA主題挖掘模型,挖掘景區(qū)酒店的亮點(diǎn)特色。

      1? 數(shù)據(jù)預(yù)處理

      1.1? 數(shù)據(jù)清洗

      數(shù)據(jù)來源為互聯(lián)網(wǎng)公開渠道。數(shù)據(jù)清洗的過程主要包括文本去重、壓縮去詞、短句刪除等。利用Python程序判斷并刪除語料庫中存在的完全重復(fù)文本。使用同義詞詞庫和繁轉(zhuǎn)簡詞庫去除繁體字和近義詞。

      1.2? 中文分詞

      基于Python語言,預(yù)處理選擇中文分詞模塊jieba對評論進(jìn)行分詞,采用精確模式用于去除文本標(biāo)注的無效信息為后續(xù)進(jìn)一步處理做準(zhǔn)備。對于不帶情感的虛詞與實(shí)詞的組合也可以表達(dá)情感傾向這一問題,本文借鑒N-gram語言模型特點(diǎn),以知網(wǎng)HowNet情感詞典為基礎(chǔ),抽取評論預(yù)料中常見組合單元構(gòu)建自定義分詞詞典。獲取每一個(gè)詞的TF-IDF值,采用Gensim模塊的Corpora函數(shù)以及Model函數(shù)進(jìn)行處理,使用TF-IDF算法訓(xùn)練數(shù)據(jù),提取TF-IDF值靠前的100個(gè)詞匯作為自定義詞典,基于自定義詞典對網(wǎng)評文本進(jìn)行分詞,得到更精確的結(jié)果。

      1.3? 去停用詞

      建立停用詞字典,結(jié)合中文停用詞表、哈工大停用詞表、百度停用詞表,在分詞以后去除停用詞和標(biāo)點(diǎn)符號。對文本數(shù)據(jù)分詞后去停用詞的部分結(jié)果如表1所示。

      2? 熱詞提取

      2.1? 基于TF-IDF算法的關(guān)鍵詞提取

      TF-IDF(詞頻-逆文檔頻次算法)是一種基于統(tǒng)計(jì)的計(jì)算方法,常用來評估在一個(gè)文檔中一個(gè)詞對某文檔的重要程度?;赥F-IDF算法,分別選取景區(qū)和酒店10個(gè)關(guān)鍵詞。結(jié)果如表2所示。

      2.2? 語義網(wǎng)絡(luò)分析

      研究景區(qū)及酒店評論的文本數(shù)據(jù)時(shí),利用語義網(wǎng)絡(luò)分析可以挖掘出詞項(xiàng)之間的語義關(guān)聯(lián),在一定程度上可以將由分詞所導(dǎo)致的凌亂的文本結(jié)構(gòu)關(guān)系重新整合,從而還原出單獨(dú)詞項(xiàng)無法表達(dá)出的部分原始文本信息。語義網(wǎng)絡(luò)圖常被用于提取游客選擇目的地的關(guān)注點(diǎn)。由于中文分詞會打亂原來的語句結(jié)構(gòu)、語義關(guān)系,通過語義網(wǎng)絡(luò)能夠很好地重建語義之間的聯(lián)系,從中得出潛藏的信息。使用Networkx生成所需語義網(wǎng)絡(luò)圖,實(shí)現(xiàn)分析網(wǎng)絡(luò)的結(jié)構(gòu)、構(gòu)建網(wǎng)絡(luò)的模型、設(shè)計(jì)新的網(wǎng)絡(luò)算法、繪制網(wǎng)絡(luò)等功能。

      3? 游客滿意度評價(jià)模型構(gòu)建

      3.1? 熱詞挖掘

      3.1.1? 定義熱度指標(biāo)

      熱詞,即熱門詞匯,反映了特定人群在某段時(shí)間普遍關(guān)注的問題和事物。綜合考慮,選取以下指標(biāo)進(jìn)行熱度評價(jià),對每個(gè)景區(qū)和酒店分別計(jì)算熱度指標(biāo):

      (1)該目的地的評論數(shù)量n,評論數(shù)量是熱度的重要表現(xiàn)。

      (2)該目的地最早評論日期與最晚評論日期的間隔天數(shù)m,熱點(diǎn)問題往往在較短時(shí)間內(nèi)集中產(chǎn)生。

      (3)該目的地評論的正向情感次數(shù)a與負(fù)向情感次數(shù)b,評論中越多情感次數(shù)反映更多的關(guān)注度。

      綜上,則目的地?zé)岫裙綖椋?/p>

      (1)

      (2)

      3.1.2? 熱度計(jì)算

      基于以上提出的熱度評價(jià)指標(biāo)體系,計(jì)算各景區(qū)、酒店熱度值。再利用公式計(jì)算每個(gè)詞的熱度值,最后得到每個(gè)景區(qū)及酒店中熱門詞熱度如表3、表4所示。

      3.2? 游客滿意度因素分析

      獲取景區(qū)及酒店游客滿意度影響因素過程在滿意度理論和相關(guān)研究的基礎(chǔ)上進(jìn)行。提取TF-IDF值靠前詞匯作為游客滿意度二級影響因素,采用Word2Vec模型對二級影響因素詞匯進(jìn)行向量化處理,最后采用K-means聚類獲取詞向量的聚類結(jié)果。綜合聚類與內(nèi)容分析結(jié)果,定義服務(wù)、位置、設(shè)施、衛(wèi)生、性價(jià)比五個(gè)指標(biāo)為滿意度一級影響因素。景區(qū)和酒店綜合評價(jià)體系如表5、表6所示。

      3.3? 基于情感分析的游客滿意度評價(jià)模型

      3.3.1? 計(jì)算情感得分

      將評論劃分為短句,應(yīng)用情感傾向分析接口對包含主觀信息的文本進(jìn)行情感傾向性類別(積極、消極和中性)的判斷。定義positive_prob、negative_prob、confidence分別表示評論的積極類別概率、消極類別概率和置信度。定義sentiment表示評論的情感傾向,sentiment有2種取值,0表示負(fù)向,1表示正向。

      滿意度模型各指標(biāo)構(gòu)建如下所示:

      (1)計(jì)算二級影響因素滿意度得分sj,sj表示第j個(gè)二級影響因素的滿意度得分,由于量化后的滿意度影響因素情感極性值在0~1之間,為了統(tǒng)一性,滿意度按照5分制滿分的評價(jià)標(biāo)準(zhǔn)進(jìn)行計(jì)算:

      (3)

      其中? 表示第j個(gè)二級影響因素所包含評價(jià)單元的積極概率和的平均值, 表示消極概率和的平均值。

      (2)計(jì)算二級影響因素權(quán)重ωij,ωij表示第i個(gè)一級影響因素下第j個(gè)二級影響因素測評指標(biāo)的權(quán)重:

      (4)

      其中? 表示第i個(gè)一級影響因素下第j個(gè)二級影響因素的TF_IDF值的和, 為第i個(gè)一級影響因素下第j個(gè)二級影響因素的TF_IDF值。

      (3)計(jì)算一級影響因素權(quán)重ωi,ωi表示一級游客滿意度影響因素中第i個(gè)測評指標(biāo)權(quán)重:

      (5)

      其中, 表示第i個(gè)一級影響因素下第j個(gè)二級影響因素的TF_IDF值的和的均值。

      (4)構(gòu)建基于情感分析的游客滿意度評價(jià)模型,計(jì)算整體滿意度得分HCSI:

      (6)

      3.3.2? 滿意度劃分標(biāo)準(zhǔn)

      綜合情感得分結(jié)果并結(jié)合游客滿意度相關(guān)研究,確定評價(jià)指標(biāo)體系。以情感極性值為基礎(chǔ)來確定二級影響因素的滿意度得分,采用預(yù)處理中 TF-IDF算法得到的結(jié)果作為基礎(chǔ),計(jì)算兩級影響因素的權(quán)重。根據(jù)二級指標(biāo)的權(quán)重得到一級指標(biāo)得分,最后根據(jù)一級指標(biāo)權(quán)重計(jì)算整體游客滿意度得分,制定相關(guān)滿意度等級,劃分結(jié)果如表7所示。

      游客滿意度為高,則該景區(qū)或酒店對應(yīng)的綜合評價(jià)為高層次;游客滿意度為中,則綜合評價(jià)等級為中;游客滿意度為低,則對應(yīng)的景區(qū)或酒店的綜合評價(jià)等級為低。

      4? 基于隨機(jī)森林的信息質(zhì)量有效性分析

      4.1? 文本有效性評價(jià)指標(biāo)體系

      根據(jù)旅游評論信息的特點(diǎn),從信息內(nèi)容質(zhì)量和信息表達(dá)形式質(zhì)量兩個(gè)方面構(gòu)建文本有效性評價(jià)指標(biāo)體系。

      4.1.1? 信息內(nèi)容質(zhì)量

      (1)時(shí)效性。文本內(nèi)容的時(shí)效性是指消費(fèi)者一定時(shí)間內(nèi)感受到內(nèi)容價(jià)值的屬性,信息內(nèi)容的時(shí)效性表明時(shí)間能夠決定信息的效用。本文設(shè)置參數(shù)σ,評論及時(shí)性(X_1)的取值范圍控制在[0-10],計(jì)算公式為:X_1=[T_max-(T_w-T_r)]/σ。其中T_max是評論發(fā)布時(shí)間和評論閱讀時(shí)間的最大差值,T_w是評論發(fā)布時(shí)間,T_r是評論閱讀時(shí)間,σ取值為T_max/10。

      (2)情感性。評論文本中情感詞的頻率很難表達(dá)評論中表達(dá)的積極或消極情緒的強(qiáng)度,本文基于Hownet情感詞典,根據(jù)情感詞典中對應(yīng)詞的相似度對采集到的文本進(jìn)行評分,考慮程度副詞和否定詞對情感值計(jì)算的影響,加權(quán)計(jì)算句子情感強(qiáng)度,輸出評論文本的情感極性和強(qiáng)度。

      (3)相關(guān)性。評論內(nèi)容的相關(guān)性即評論中產(chǎn)品特征的豐富性,由評論中包含的目的屬性特征詞來量化。屬性特征詞通常為名詞或形容詞,是目的地本身及其相關(guān)服務(wù)的客觀表達(dá)。本文提取文本細(xì)節(jié)內(nèi)容,通過分詞、詞性標(biāo)注等處理得到目的地評論詞集合C1。根據(jù)TF-IDF詞頻的統(tǒng)計(jì)對名詞和形容詞進(jìn)行要素量化,得到屬性特征詞集C2。構(gòu)建空間向量模型,匹配評論詞集C1和屬性特征詞集C2,統(tǒng)計(jì)評論中每個(gè)特征詞的出現(xiàn)頻率。

      4.1.2? 信息表達(dá)形式質(zhì)量

      (1)完整性。網(wǎng)評文本的深度主要是指對目的地特征的詳細(xì)描述。本文統(tǒng)計(jì)了每條評論的字?jǐn)?shù),統(tǒng)計(jì)所得字符數(shù)分布較為不均,對字符數(shù)進(jìn)行取對數(shù),Length=Ln(Nr),其中 Nr 為評論字?jǐn)?shù)。

      (2)可理解性。評論的可理解性指文本前后的關(guān)聯(lián)性。本文利用語義文本向量度量評論的可理解性。向量語義的概念是將一個(gè)單詞表示為多維語義空間的一個(gè)點(diǎn)。表示單詞的向量嵌入到特定的向量空間中。

      4.1.3? 關(guān)聯(lián)分析

      (1)DBSCAN聚類。聚類是一種簡單有效的數(shù)據(jù)挖掘技術(shù)。聚類是按照一定的標(biāo)準(zhǔn)將一些事物劃分為若干類別的過程。相似的被聚為一類,不相似的被聚為不同的類。聚類算法種類繁多,比較常見的有:K-means聚類、密度聚類、DBSCAN聚類等。

      現(xiàn)采用的是DBSCAN聚類算法。DBSCAN聚類的模型構(gòu)建思路如圖1所示。

      (2)Apriori算法。Apriori算法是一種基本的發(fā)現(xiàn)頻繁項(xiàng)集的算法。Apriori算法由連接和剪枝兩個(gè)步驟組成。連接是找到Lk,通過L(k-1)與自己連接產(chǎn)生候選k項(xiàng)集的集合Ck;剪枝是通過計(jì)算每個(gè)k項(xiàng)集的支持度來得到Lk,為減少計(jì)算量,可利用到該算法的性質(zhì)即如果一個(gè)k項(xiàng)集的(k-1)項(xiàng)子集不在L(k-1)中,則該候選也不是頻繁的,可以直接從Ck中刪除。其中支持度、置信度、提升度是用來衡量關(guān)聯(lián)性強(qiáng)弱的三個(gè)核心指標(biāo)。

      關(guān)聯(lián)規(guī)則的模型構(gòu)建思路如圖2所示。

      (3)關(guān)鍵技術(shù)路線。評論文本數(shù)據(jù)需要進(jìn)行文本分析,研究技術(shù)路線復(fù)雜,涉及分詞、去停用詞、詞數(shù)統(tǒng)計(jì)等步驟。核心技術(shù)步驟如圖3所示。

      4.2? 隨機(jī)森林分類模型

      隨機(jī)森林算法具有泛化性強(qiáng)、穩(wěn)健性、對噪聲不敏感、能處理連續(xù)屬性等特點(diǎn),適合用于建立文本分類模型。在文本有效性評估時(shí),選用隨機(jī)森林進(jìn)行分類。

      4.2.1? 參數(shù)選擇

      建立隨機(jī)森林分類模型時(shí)設(shè)置3個(gè)重要可調(diào)參數(shù):

      (1)nodesize表示包含樣本的葉節(jié)點(diǎn)數(shù),節(jié)點(diǎn)大小為1表示分類,5表示回歸,取nodesize=1。

      (2)ntree表示森林中樹的數(shù)目,ntree值足夠大時(shí),可保證隨機(jī)森林的總體誤差率趨于穩(wěn)定。實(shí)證表明ntree=59時(shí)分類效果最好,準(zhǔn)確率達(dá)到0.823 5。

      (3)mtry表示每個(gè)節(jié)點(diǎn)的候選特征數(shù),是影響隨機(jī)森林模型性能最明顯的參數(shù)。在分類中mtry建議值是整個(gè)變量個(gè)數(shù)的均方根,因此取mtry=7。

      4.2.2? 隨機(jī)森林分類模型效果評價(jià)

      對于有效性分類預(yù)測預(yù)實(shí)驗(yàn)的評價(jià)標(biāo)準(zhǔn),現(xiàn)采用統(tǒng)計(jì)學(xué)領(lǐng)域常見的精度(Accuracy)、查準(zhǔn)率(Precision)、查全率(Recall)、F1值(F-measure)作為綜合評價(jià)指標(biāo)。結(jié)果顯示準(zhǔn)確率為82.35%,即所有被預(yù)測的樣本,預(yù)測正確的概率為82.35%;精確率為80.77%,說明分類器識別樣本的能力較好;召回率為98.45%,表示被預(yù)測的所有正樣本,能夠被正確預(yù)測的占比;F1值是一個(gè)綜合的評價(jià)指標(biāo),為78.02%。

      4.3? 高效評論排序模型

      分類模型在一定程度上降低了游客獲取信息的時(shí)間成本,但高效評論的數(shù)量仍然眾多。如何向游客優(yōu)先展示最高效的評論是一個(gè)重要的問題。建立基于LDA的排序模型主要過程如下:

      (1)數(shù)據(jù)預(yù)處理。對評論分詞,與停用詞表進(jìn)行匹配,去除無用詞,減少評論的噪音。

      (2)構(gòu)建高效評論-詞頻矩陣。采用向量空間模型構(gòu)造文本向量,用TF-IDF函數(shù)變換。

      (3)LDA建模。主要使用的是建模后得到的評論主題分布表,得到每個(gè)主題詞在每條評論中的概率,為排序模型做準(zhǔn)備。

      (4)關(guān)鍵詞向量計(jì)算。提取所有評論關(guān)鍵詞,構(gòu)造最優(yōu)關(guān)鍵詞向量,取值為TF-IDF。

      (5)基于LDA的排序模型構(gòu)建。根據(jù)評論主題表,計(jì)算評論主題信息的熵值,并基于該值對評論進(jìn)行排序。

      5? 基于TextCNN的主題挖掘模型構(gòu)建

      采用TextCNN卷積神經(jīng)網(wǎng)絡(luò)分類器對文本數(shù)據(jù)進(jìn)行分類,將各情感單元分類到各二級影響因素下,為后續(xù)對各景區(qū)和景點(diǎn)的積極高效評論文本集進(jìn)行主題挖掘,打好基礎(chǔ),進(jìn)一步發(fā)掘其各自優(yōu)勢和特色。主題挖掘思路為:

      (1)對使用卷積神經(jīng)網(wǎng)絡(luò)分類好的文本進(jìn)行分詞。

      (2)使用Counter Vectorizer(Python中scikit-learn矢量化工具)對文檔集合進(jìn)行向量化。

      (3)在scikit-learn工具箱中調(diào)用Latent Dirichlet Allocation函數(shù),在參數(shù)調(diào)整和可視化結(jié)合下,選定主題數(shù)為4。

      (4)經(jīng)過最多40次迭代,初步識別出主題。

      LDA主題挖掘部分結(jié)果如表8所示。

      6? 結(jié)? 論

      本文通過構(gòu)建合理的指標(biāo)選擇和嚴(yán)謹(jǐn)?shù)哪P驮O(shè)計(jì),以景區(qū)及酒店的評論文本集作為數(shù)據(jù)源,利用文本挖掘和情感分析技術(shù),針對游客評論信息展開多角度研究。主要工作包括:

      (1)將數(shù)據(jù)預(yù)處理后,首先根據(jù)構(gòu)建的熱度計(jì)算指標(biāo)體系,得到各家景區(qū)及酒店的熱度值;其次將提取的關(guān)鍵詞作為二級影響因素,選取K-means聚類法并結(jié)合內(nèi)容分析法得到一級影響因素,計(jì)算情感得分,構(gòu)建基于情感分析的游客滿意度評價(jià)模型。

      (2)首先根據(jù)信息質(zhì)量理論構(gòu)建文本有效性評價(jià)指標(biāo)體系,依據(jù)信息內(nèi)容質(zhì)量的三個(gè)指標(biāo)和信息表達(dá)形式的兩個(gè)指標(biāo),利用隨機(jī)森林進(jìn)行有效性分類,并對分類模型進(jìn)行效果評價(jià);其次構(gòu)建基于主題挖掘的排序模型,根據(jù)分類和排序結(jié)果進(jìn)行分析。

      (3)基于評論短文本情感傾向性分析結(jié)果和有效性分析結(jié)果,得到一個(gè)積極且有效的評論文本集,并進(jìn)行LDA主題模型訓(xùn)練與構(gòu)建,挖掘景區(qū)及酒店個(gè)性化特色。

      本文基于數(shù)據(jù)挖掘技術(shù)提出了針對游客評論數(shù)據(jù)的情感分類模型和有效篩選技術(shù),并構(gòu)建了多指標(biāo)有效性評價(jià)體系,下一步的工作是在獲得的計(jì)算機(jī)軟件著作權(quán)[8]的基礎(chǔ)上進(jìn)一步優(yōu)化情感和主題挖掘模型,開發(fā)識別準(zhǔn)確率更高的旅游景區(qū)印象分析系統(tǒng)。

      參考文獻(xiàn):

      [1] 劉曉彤,田大鋼.融合深度學(xué)習(xí)與機(jī)器學(xué)習(xí)的在線評論情感分析 [J].軟件導(dǎo)刊,2019,18(2):1-4.

      [2] 謝宗彥,黎巎,周純潔.基于word2vec的酒店評論情感分類研究 [J].北京聯(lián)合大學(xué)學(xué)報(bào),2018,32(4):34-39.

      [3] 程海琪.基于情感分類的酒店評論短文本主題挖掘 [D].杭州:浙江工商大學(xué),2020.

      [4] 石文華,高羽,胡英雨.基于情感傾向和觀察學(xué)習(xí)的在線評論有用性影響因素研究 [J].北京郵電大學(xué)學(xué)報(bào):社會科學(xué)版,2015,17(5):32-39.

      [5] 田韶存.在線社區(qū)用戶評論有用性研究 [D].濟(jì)南:山東大學(xué),2014.

      [6] 羅新.基于隨機(jī)森林的文本分類模型研究 [J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2016,28(11):50-54.

      [7] 阮光冊.基于LDA的網(wǎng)絡(luò)評論主題發(fā)現(xiàn)研究 [J].情報(bào)雜志,2014,33(3):161-164.

      [8] 郭佳怡,唐矛寧,宋濤,等.旅游景區(qū)印象分析系統(tǒng)V1.0:2022SR0471334 [P].2022-04-14.

      作者簡介:郭佳怡(2001—),女,漢族,山東濟(jì)南人,本科在讀,研究方向:數(shù)據(jù)挖掘;通訊作者:宋濤(1980—),男,江蘇句容人,漢族,講師,博士,研究方向:復(fù)雜系統(tǒng)大數(shù)據(jù)分析、建模與仿真。

      收稿日期:2022-10-28

      基金項(xiàng)目:浙江省自然科學(xué)基金(Z22A013952);浙江省教育廳科研項(xiàng)目資助(Y202248528);浙江省大學(xué)生科技創(chuàng)新活動計(jì)劃項(xiàng)目新苗人才計(jì)劃(2022R431A016);湖州師范學(xué)院大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練科研項(xiàng)目(202101172)

      猜你喜歡
      情感分析智慧旅游
      基于語義的互聯(lián)網(wǎng)醫(yī)院評論文本情感分析及應(yīng)用
      基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評價(jià)對象抽取研究
      基于SVM的產(chǎn)品評論情感分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      在線評論情感屬性的動態(tài)變化
      預(yù)測(2016年5期)2016-12-26 17:16:57
      大連市智慧旅游評價(jià)體系構(gòu)建與實(shí)施措施
      基于智慧旅游背景下的智能手機(jī)App的旅游應(yīng)用研究
      大數(shù)據(jù)時(shí)代黔東南州智慧旅游開發(fā)研究
      淺析智慧旅游管理與智能推薦技術(shù)
      京津冀休閑產(chǎn)業(yè)協(xié)同發(fā)展研究(一)
      洛扎县| 奉贤区| 乳山市| 应用必备| 北海市| 罗山县| 商城县| 安福县| 嵊州市| 都兰县| 双峰县| 宽城| 澄迈县| 平度市| 梁河县| 凌云县| 丰顺县| 云林县| 霍城县| 南和县| 古交市| 黔西| 杂多县| 汕头市| 炎陵县| 竹溪县| 九江县| 邛崃市| 长沙县| 中山市| 拉萨市| 繁昌县| 舞阳县| 广州市| 永年县| 塘沽区| 高雄县| 桐庐县| 金华市| 高唐县| 恩施市|