• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于HowNet和PAT樹的網(wǎng)購評語情感分析

      2016-05-18 02:37:09李永忠胡思琪
      圖書情報研究 2016年3期
      關(guān)鍵詞:傾向性網(wǎng)購評語

      李永忠 胡思琪

      (福州大學(xué)經(jīng)濟(jì)與管理學(xué)院福州350108)

      基于HowNet和PAT樹的網(wǎng)購評語情感分析

      李永忠 胡思琪

      (福州大學(xué)經(jīng)濟(jì)與管理學(xué)院福州350108)

      在對相關(guān)研究情況進(jìn)行總結(jié)與分析的基礎(chǔ)上,通過對HowNet情感詞典進(jìn)行擴(kuò)展并利用基于PAT樹和統(tǒng)計相結(jié)合的分詞方法,對從淘寶網(wǎng)站中獲取的評論內(nèi)容進(jìn)行分析,結(jié)果表明,基于HowNet和PAT樹的情感分析方法對分析網(wǎng)購評論的情感傾向性行之有效,并以淘寶一女裝商家為例進(jìn)行實(shí)證研究,最后指出進(jìn)一步探索情感傾向性分析的幾個方向。

      HowNet情感詞典PAT樹網(wǎng)購評語情感分析

      1 引言

      互聯(lián)網(wǎng)的極速發(fā)展,現(xiàn)代信息化的迅速普及,使得網(wǎng)絡(luò)成為高效、快捷的信息交流平臺,它已經(jīng)深入到人們的學(xué)習(xí)、工作和生活中,成為日常生活中不可或缺的一部分。網(wǎng)絡(luò)購物擁有多方面的優(yōu)勢,如快捷、時尚、省時省力、可選性強(qiáng)等。隨著網(wǎng)上購物人數(shù)的與日俱增,商品評語的數(shù)量也呈指數(shù)型增長,同時每個消費(fèi)者在評論商品的時候,由于用語習(xí)慣的不同,會導(dǎo)致評論的無組織性和非結(jié)構(gòu)化。并且每條評語可能評價的是商品的不同方面,顧客想了解某一方面的內(nèi)容就需要從大量評語中尋找,這將會十分的不易。直接瀏覽商品的評論信息不僅耗時耗力,也很難形成一個客觀整體的印象。顧客在瀏覽評語時主要想了解的一是顧客對該商品的總體印象,褒多于貶或者貶多于褒;二是商品某一具體屬性的信息,如外觀、質(zhì)量、服務(wù)態(tài)度等。各大購物網(wǎng)站的評論功能,給了消費(fèi)者了解商品實(shí)際情況的信息渠道和平臺,其及時、便捷、互動的特性滿足了顧客的信息需求。Nielsen公司的調(diào)研顯示,70%的用戶借助網(wǎng)上評論選擇商品,其受信任程度僅次于親友推薦[1]。對淘寶評語進(jìn)行分析匯總,并將分析結(jié)果展示給消費(fèi)者以及賣家,具有巨大的研究和應(yīng)用價值。

      2 相關(guān)研究情況

      本文對基于情感詞典的網(wǎng)購評論進(jìn)行分析和研究,根據(jù)網(wǎng)購評論來判斷其情感傾向性,因此,對于情感傾向性的分析就變得至關(guān)重要。情感分析方面的研究工作在近年來開始大量涌現(xiàn),這些研究方法大致可以分為兩種:一種是基于情感詞典和語言知識的無監(jiān)督學(xué)習(xí)方法,另外一種是基于情感類別標(biāo)注數(shù)據(jù)的監(jiān)督學(xué)習(xí)方法。本文所采用的是基于情感詞典的無監(jiān)督學(xué)習(xí)方法。

      對于無監(jiān)督學(xué)習(xí)方法,朱嫣嵐、閔錦、周雅倩等學(xué)者基于HowNet,提出了兩種詞匯語義傾向性計算的方法,分別是基于語義相似度的方法和基于語義相關(guān)場的方法。他們通過實(shí)驗(yàn)證明,這兩種方法在漢語常用詞中的判別準(zhǔn)確率可達(dá)80%以上,因此具有一定的實(shí)用價值[2]。曾淑琴、吳揚(yáng)揚(yáng)基于HowNet提出了詞語相關(guān)度模型,這個模型可以計算同種詞性以及不同詞性之間的相關(guān)度,融合了詞語的相似度、關(guān)聯(lián)度和實(shí)例因素,綜合獲得詞語的內(nèi)在相關(guān)性。他們通過對比實(shí)驗(yàn)發(fā)現(xiàn)這個模型所計算的詞語相關(guān)度值更加符合人們主觀上對詞語相關(guān)性的認(rèn)識[3]。柳位平、朱艷輝、栗春亮等學(xué)者在中文詞語相似度計算方法的基礎(chǔ)上,提出了一種中文情感詞語的情感權(quán)值的計算方法,并以HowNet情感詞語集為基準(zhǔn),構(gòu)建了中文基礎(chǔ)情感詞典。他們利用該詞典結(jié)合TF-IDF特征權(quán)值計算方法,對中文文本情感傾向進(jìn)行判別,通過實(shí)驗(yàn)結(jié)果表明,該方法取得了不錯的分類效果[4]。

      監(jiān)督學(xué)習(xí)方法是由Pang和Lee于2004最早提出的用來解決文本情感分類問題的方法,它的整體思想是采取多種特征選擇方法,并同時采用樸素貝葉斯模型、支持向量機(jī)模型和最大熵模型等來識別電影評論中所包含的情感[5]。

      基于PAT樹的相關(guān)研究中,楊文峰和李星利用PAT樹實(shí)現(xiàn)了一種可變長統(tǒng)計語言模型。在該模型的基礎(chǔ)上,通過相關(guān)性檢測,從540M漢語語料中自動提取出了12萬個關(guān)鍵詞候選字串。最后,經(jīng)過分析和篩選,候選字串的準(zhǔn)確度由82.3%上升到96.1%。其實(shí)驗(yàn)結(jié)果表明,基于PAT樹的統(tǒng)計語言模型是實(shí)現(xiàn)未登錄詞提取的有力工具[6]。

      從Web網(wǎng)頁中抽取評論文本是本文對網(wǎng)購評論研究必須要做的。李慧、沈潔、張舒[7]等于2007年提出了一種新穎的REA(Review Extract Algorithm)算法對評論信息進(jìn)行發(fā)現(xiàn)與抽取。抽取過程的完全自動化也因劉偉、嚴(yán)華梁、肖建國[8]等的研究得到了進(jìn)一步的實(shí)現(xiàn)。由于本文的研究對象是來自于淘寶網(wǎng)的評論內(nèi)容,與以往相關(guān)研究的不同之處在于,淘寶網(wǎng)對外提供淘寶開放平臺(Taobao Open Platform),本文通過淘寶開放平臺這個更為便捷的方式來獲取評論內(nèi)容。

      3 評論內(nèi)容的獲取與處理

      3.1 獲取評論內(nèi)容

      立足于淘寶中的各類電子商務(wù)業(yè)務(wù),淘寶開放平臺同時也能夠提供一些原材料給所有來自淘寶外部的合作伙伴,這些原材料包括賬號體系、API、數(shù)據(jù)安全等。本文研究的是淘寶評語的傾向性分析,因此要獲取的是淘寶網(wǎng)的評論數(shù)據(jù),就需要找出一個接口,這個接口作為從淘寶網(wǎng)導(dǎo)出數(shù)據(jù)的媒介。在這個對外部用戶提供的開放平臺中,它調(diào)用接口的方式是通過API來實(shí)現(xiàn)的,并且這些API都基于REST協(xié)議,兼容多種編程語言。通過按照top的規(guī)范POST來調(diào)用參數(shù),這樣淘寶評論數(shù)據(jù)就可以通過相應(yīng)的接口返回來,以此來完成整個數(shù)據(jù)的獲取。

      3.2 評論內(nèi)容的清洗

      一件商品擁有著大量的用戶評論,但是,真正能為研究者的分析提供有價值信息的評論內(nèi)容卻是十分有限的。一個很重要的原因是網(wǎng)頁本身包含有眾多的結(jié)構(gòu)元素,這些無關(guān)的結(jié)構(gòu)元素對評論內(nèi)容造成了很大的干擾;另外一個很重要的原因是網(wǎng)頁本身的內(nèi)容以及商品評論的內(nèi)容中多多少少都會存在與評論無關(guān)的信息,如廣告等。正是由于存在著上述原因,使得評論獲取的難度進(jìn)一步加大,如果獲取的評論內(nèi)容不符合分析的要求,那么情感傾向性的分析結(jié)果也將會有很大的誤差[9]。為此,需要對獲取的評論內(nèi)容進(jìn)行一些必要的處理。下面就列出了一些網(wǎng)頁內(nèi)容處理的方法:

      (1)在很多電子商務(wù)網(wǎng)站中,一些買家并不會對所買的產(chǎn)品進(jìn)行評論或者忘記評論,網(wǎng)站系統(tǒng)會在一定的時間后自動默認(rèn)生成好評,另外,也會有一些買家同時也是賣家,甚至還有一些是專門的廣告黨,專門在評論內(nèi)容中為自己的商品做廣告等等。對于上述這些情況,可以整理出網(wǎng)站系統(tǒng)中默認(rèn)的好評詞和一些明顯的廣告詞,將其過濾掉。

      (2)在同一個賣家購買了多個同樣商品的買家,很有可能將一樣的評論內(nèi)容復(fù)制粘貼到每一件商品的評論欄中,造成評論的重復(fù)。針對重復(fù)兩次或者兩次以上的評價語句,處理方法是只保留其中一條評論內(nèi)容。

      (3)經(jīng)過上述方法處理后,如果評論內(nèi)容中仍然包含有繁體字、錯別字等,可將它們都過濾掉。3.3中文分詞

      中文分詞[10](Chinese Word Segmentation)是指將一個個漢字序列切分成一個一個單獨(dú)的詞的過程。分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。本文采用基于PAT樹和統(tǒng)計相結(jié)合的分詞方法。

      PAT樹作為一種特殊形式的樹結(jié)構(gòu)[11],它的查找結(jié)構(gòu)是運(yùn)用半無限長字串(semi-infinite string,簡稱sistring)來作為字符串的。其主要的節(jié)點(diǎn)包括:內(nèi)部節(jié)點(diǎn),用來存儲不同的bit位在整個sistring字節(jié)序列中的位置(根節(jié)點(diǎn),是所有sistring二進(jìn)制碼中第一個不同的位的位置);外部節(jié)點(diǎn)(葉子節(jié)點(diǎn)),其作用是記錄sistring的首字符在完整sistring中的初始位置(字符索引)和sistring出現(xiàn)的頻次;左指針,若是待存儲的sistring在內(nèi)部節(jié)點(diǎn)所存儲的bit位置上的數(shù)據(jù)是0,那么將這個sistring存儲到該節(jié)點(diǎn)的左子樹中去;右指針,若數(shù)據(jù)是1,那么就存儲到該節(jié)點(diǎn)的右子樹中去。

      這種方法的思路是首先進(jìn)行文本分割,即對獲取的文本進(jìn)行切割,切割標(biāo)志為中英文標(biāo)點(diǎn)符號、空格,并用“/”代替,形成以“/”分割的所有短語的集合,刪除所有非漢語字符,只保留中文字符。然后進(jìn)行正序數(shù)組和逆序數(shù)組的準(zhǔn)備,將切割后的短語轉(zhuǎn)換成半無窮大串?dāng)?shù)組,并將這些數(shù)組去重、合并,統(tǒng)計出各sistring的頻次,為構(gòu)建PAT樹做準(zhǔn)備。最后進(jìn)行中文PAT樹的構(gòu)建、檢索和遍歷,從而完成分詞過程。

      雖然基于PAT樹和統(tǒng)計相結(jié)合的分詞方法有著很高的效率,但該方法也是有一定的局限性,比如說可能會分割出一些共現(xiàn)頻度很高,但卻并不是詞的常用字組,例如“之一”、“這一”、“有的”等等之類的詞,并且對常用詞的識別精度較差,時空開銷會比較大。

      4 網(wǎng)購評語傾向性判斷

      4.1 基于HowNet的情感詞典擴(kuò)展

      HowNet(中文名稱為知網(wǎng))是一個以漢語和英語的詞語所代表的概念為描述對象,同時以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識知識庫[12]。它提出一切的概念都是由形態(tài)不一的義原組合而成的,而且能夠根據(jù)一個有限的義原集體來構(gòu)建一個無限的概念集體,同時描繪出概念與概念之間的聯(lián)系,對于屬性之間的關(guān)系也可被描繪出來。劉群和李素建提出一種運(yùn)算義原間相似程度的方法,該方法如公式(1)所示,義原樹中的距離由dist(p1,p2)來代表,而α則表示一個正的可變參數(shù)[13]。

      在判斷某個詞的情感傾向方面劉群和李素建的方法還不是很完善。例如“美麗”與“賊眉鼠眼”是一對相對立的詞,運(yùn)用該方法得出的相似度為0.81,而“美麗”與“優(yōu)雅”是一對相近的詞,但是它們的相似度卻為0.78,比0.81還要低。江敏、肖詩斌、王弘蔚等[14]的詞匯相似度的運(yùn)算方法給出了全新的見解,方法見公式(2)。

      同時,有以下規(guī)定:①若是一對義原間存在著對義或者反義,那么其相似度為-l;②若是一對義原的路徑中存在著對義或者反義,那么其相似度就為-1*sim(p1,p2)。sim(p1,p2)所表示的是把距離最近的一對存在著對義或者反義的義原節(jié)點(diǎn)當(dāng)作是同一個節(jié)點(diǎn)來看待,然后再配合運(yùn)用前面所提到的公式(1)。

      任何一個詞的語義傾向性度量值,都可運(yùn)用前面所提到的方法,依據(jù)這個詞和兩組基準(zhǔn)詞的語義關(guān)系的密切度運(yùn)算出來。對于這兩組基準(zhǔn)詞中的每一個詞來說,它們皆有其顯著的傾向性,其中一組代表正面情感,另一組代表負(fù)面情感。傾向性度量值可由公式(3)計算得出,在公式中正面基準(zhǔn)詞組由seedl代表,負(fù)面基準(zhǔn)詞組由seed2代表,它們的個數(shù)分別是n和m:

      若結(jié)果是正數(shù),那么說明該詞是褒義的,若結(jié)果是負(fù)數(shù),那么說明該詞是貶義的。本文采用HowNet特有的關(guān)于情感研究方面的專用詞典,并依據(jù)公式(3)求出其中各個詞的情感強(qiáng)度以及情感傾向,同時通過對已有的情感詞典進(jìn)行擴(kuò)展,得到了一個更完整的情感詞典HWSD。HWSD一共收納了8 337個中文詞匯,有褒義詞4 093個,貶義詞4 244個。

      4.2 修飾詞詞典的構(gòu)建

      網(wǎng)民在評論的時候,會用大量的副詞來對情感詞匯進(jìn)行修飾,因此為了更好地計算出評論的傾向性,需要建立一個修飾詞詞典。文獻(xiàn)[15]給出了副詞的各種類型以及它們所主要囊括的詞匯,本文抽取當(dāng)中帶有不同語氣強(qiáng)弱的副詞以及否定副詞來建立修飾詞詞典。運(yùn)用一個二元組Item〈Adv,Modality〉來代表,當(dāng)中Adv代表的是詞匯的名稱,Modality代表的是這個詞的語氣強(qiáng)度,它的取值范圍在-1或(0,2)之間。否定副詞的語氣強(qiáng)度為-1,其它副詞的語氣強(qiáng)度在(0,2)之間,越是靠近0則代表這個副詞所表示的強(qiáng)度就越弱,越是接近2則代表這個副詞所表示的強(qiáng)度就越強(qiáng)烈。

      4.3 網(wǎng)購評語傾向性判斷

      修飾詞詞典構(gòu)建完成后,就可以進(jìn)行最后的評語傾向性判斷了,具體的網(wǎng)購評語傾向性判斷過程如圖1所示:

      圖1 淘寶評語傾向性判斷過程

      由于網(wǎng)購用戶的評語大多都很簡短,因此對于已經(jīng)分詞好的評語,依據(jù)搭建完成的情感詞典以及修飾詞詞典,就可以快速、精準(zhǔn)的運(yùn)算出評語的傾向性了。本文通過逗號、句號等標(biāo)點(diǎn)符號將各條評語劃分成n個句子,用Sen1、Sen2、…、Senn來表示。同時抽取出每個句子中的情感詞,若是情感詞Wi之前有1~2個副詞對其進(jìn)行修飾,并且這1~2個副詞Advi1、Advi2位于修飾表中,則該情感詞所呈現(xiàn)出來的傾向性以及強(qiáng)度,可由公式(4)求得。

      如果句子Senm中包含有k個情感詞,并記作W1、W2、…、Wk,那么該句子Senm所呈現(xiàn)出來的傾向性以及強(qiáng)度,可由公式(5)求得。

      則包含有n個句子的評語Ci最終所呈現(xiàn)出來的傾向性,可由公式(6)求得。

      我們規(guī)定,如果Oci的得分在[-0.1,0.1]之間,那么該評論記為中性評論,如果大于0.1,則記為正向評論,如果小于-0.1,就為負(fù)向評論。

      有了每條評語的得分之后,就可以根據(jù)這些得分以及評語的個數(shù)來得出該商品的綜合評分。計算過程為分別統(tǒng)計正向評論、負(fù)向評論和中性評論的個數(shù),求出正向評論、負(fù)向評論和中性評論的得分總數(shù),得到商品的綜合得分,平均得分也可以因此得到。最后,通過統(tǒng)計正向評論、負(fù)向評論和中性評論所占的百分比,來了解顧客對該商品的喜愛程度。我們規(guī)定,正向評論的百分比在85%以上,表明用戶喜愛此種商品,正向評論的百分比在75%~85%之間,則說明用戶比較喜歡該種商品,正向評論的百分比在65%~75%之間,則說明用戶對該種商品的情感一般,如果正向評論的百分比低于65%,那么就表示該商品不受用戶喜愛。

      在淘寶網(wǎng)站中,按銷售數(shù)量排名,分別是女裝(女士精品)、化妝品(護(hù)膚品)、珠寶(首飾、手表)和日用品,因此為了使樣本具有代表性,本文選擇了一家賣女裝的商家進(jìn)行研究,從中選擇某件商品中的1 382條評論進(jìn)行情感傾向性分析。通過最終計算可以得到:

      該商品的綜合評分為344.2分,平均得分為0.249分。其中正向評論個數(shù)為1 220個,所占比例為88.28%,中性評論個數(shù)為136個,所占比例為9.84%,負(fù)向評論個數(shù)為26個,所占比例為1.88%。那么,淘寶網(wǎng)就可以將這些數(shù)據(jù)展示在評論網(wǎng)頁中供消費(fèi)者瀏覽,消費(fèi)者可以從這些數(shù)據(jù)中了解到,該商品是很受用戶喜愛的,可以放心購買;同時,其他商家也可以照此與自家的產(chǎn)品進(jìn)行比較,明確自家商品不足的地方,可想法改進(jìn)。

      5 結(jié)論

      目前,情感分析領(lǐng)域的研究主要集中在主觀性內(nèi)容識別、褒貶情感分類以及在線評論的經(jīng)濟(jì)價值挖掘等幾個方面[16],大部分研究借鑒文本挖掘、信息檢索、機(jī)器學(xué)習(xí)、自然語言處理、統(tǒng)計學(xué)等方面的技術(shù)和方法,也提出了一些針對評論情感分析的特定方法。孫先和段卓將基于詞典的情感分析方法引入到微博的情感分析中去,他們綜合考慮了程度、否定副詞等上下文語境對情感詞的影響,從實(shí)驗(yàn)結(jié)果來看,其方法比較有效[17]。但該方法還比較簡單直觀,準(zhǔn)確率并不是很高。因此,為了提高準(zhǔn)確率,本文運(yùn)用HowNet情感詞典并進(jìn)行相關(guān)擴(kuò)展,運(yùn)用基于PAT樹和統(tǒng)計相結(jié)合的分詞方法,來更好地完成評論情感分析工作。

      本文通過對商品評論的分析來研究淘寶網(wǎng)用戶的情感傾向性,整合用戶購買某一商品后的感受,同時統(tǒng)計不同用戶的評論信息,綜合展示商品的受歡迎程度。淘寶等購物網(wǎng)站就可以把商品評論的綜合數(shù)據(jù)呈現(xiàn)出來給消費(fèi)者以及賣家瀏覽,從這些數(shù)據(jù)中消費(fèi)者可以了解到其他用戶對于某種商品的情感傾向性分布,以此來優(yōu)化自己的購買決策;同時生產(chǎn)商和銷售商一方面可以了解到消費(fèi)者對其商品和服務(wù)的反饋信息,另一方面還可以知道消費(fèi)者對自己和對競爭對手的評價,從而來改進(jìn)自身的產(chǎn)品并改善服務(wù),從中贏得競爭優(yōu)勢。

      目前,電子商務(wù)管理的熱點(diǎn)問題和難點(diǎn)問題眾多,網(wǎng)購評論情感傾向性分析就是其中之一,也正因?yàn)槿绱?,為了電子商?wù)的良好發(fā)展,在情感傾向性分析方面仍需要投入更多的時間和精力。在本文研究的基礎(chǔ)上,還可以進(jìn)行進(jìn)一步探索的方向大致包括以下幾點(diǎn):

      (1)本文所涉及的領(lǐng)域比較少,基于HowNet的情感詞典較單一,可以通過從多種情感詞典出發(fā)來分析評論的傾向性,這樣匯總得到的結(jié)果會更為理想。

      (2)數(shù)據(jù)庫中保存了評論的IP地址和評論時間,可以進(jìn)一步分析淘寶消費(fèi)者的地域和評論時間與該話題之間的聯(lián)系,也許能挖掘到更為有趣的信息。

      (3)增強(qiáng)對包括附和、諷刺、比喻、正話反說等等這些更加復(fù)雜、更加自由的網(wǎng)購評論的處理能力。同時,與時俱進(jìn)的搜集更多不同的習(xí)慣用語以及句式的不同搭配等。

      總體來說,網(wǎng)購評論的情感傾向性研究還不是很完善,還有很長的路要走,仍需相關(guān)技術(shù)研究人員投入更多的時間與精力。

      [1]Global Trust in Advertising and Brand Messages[EB/OL].[2015-06-30].http://www.nielsen.com/us/en/insights/reports/ 2012/global-trust-in-advertising-and-brand-messages.html.

      [2]朱嫣嵐,閔錦,周雅倩,等.基于HowNet的詞匯語義傾向計算[J].中文信息學(xué)報,2005,20(1):14-20.

      [3]曾淑琴,吳揚(yáng)揚(yáng).基于HowNet的詞語相關(guān)度計算模型[J].微型機(jī)與應(yīng)用,2012,31(8):77-80.

      [4]柳位平,朱艷輝,栗春亮,等.中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J].計算機(jī)應(yīng)用,2009,29(10):2875-2877.

      [5]Pang B,Lee L.A sentimental education:Sentiment analysis using subjectivitysummarization based on minimum cuts[C]//Proceedings of the 42nd annual meeting on Association for Computational Linguistics.Association for Computational Linguistics,2004:271-278.

      [6]楊文峰,李星.基于PAT TREE統(tǒng)計語言模型與關(guān)鍵詞自動提?。跩].計算機(jī)工程與應(yīng)用,2001(15):17-20.

      [7]李慧,沈潔,張舒,等.基于頁面分塊與信息熵的評論發(fā)現(xiàn)及抽取[J].計算機(jī)應(yīng)用研究,2007,24(2):269-271,291.

      [8]劉偉,嚴(yán)華梁,肖建國,等.一種Web評論自動抽取方法[J].軟件學(xué)報,2010,21(12):3220-3236.

      [9]Hu M,Liu B.Mining and summarizing customer reviews[C]//Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining.ACM,2004:168-171.

      [10]李淑英.中文分詞技術(shù)[J].科技信息,2007(36):65-66.

      [11]柳佳剛,曾利軍.基于PAT-tree的中文搜索引擎結(jié)果聚類算法[J].情報雜志,2009,28(12):32-34.

      [12]HowNet knowledge database[EB/OL].[2015-06-30].http://www.keenage.com/.

      [13]劉群,李素建.基于《知網(wǎng)》的詞匯語義相似度的計算[OL].

      [2015-06-30].http://www.docin.com/p-23739023.html.

      [14]江敏,肖詩斌,王弘蔚,等.一種改進(jìn)的基于《知網(wǎng)》的詞語語義相似度計算[J].中文信息學(xué)報,2008,22(5):84-89.

      [15]現(xiàn)代漢語副詞表[OL].[2015-06-30].http://wenku.baidu. com/link?url=BoCWgoG04G_iOO0tDvaZZS85de5VEdgRRNHOXtQ9w6GjurS0B1DShCCJ-zQvZBoISVuRFBmbgpWqoj-B06c8KU9usI6SyY8QMb7q8oSjy7wq.

      [16]張紫瓊,葉強(qiáng),李一軍.互聯(lián)網(wǎng)商品評論情感分析研究綜述[J].管理科學(xué)學(xué)報,2010,13(6):84-96.

      [17]孫先,段卓.基于情感詞語義的中文微博情感挖掘[J].信息與電腦,2013(3):84-85.

      (責(zé)任編校駱雪松)

      Sentiment Analysis of the Comments on Online Shopping Based on HowNet and PAT Tree

      Li Yongzhong,Hu Siqi
      School of Economics and Management,Fuzhou University,Fuzhou 350108,China

      By summarizing and analyzing the related research,extending the HowNet sentiment dictionary and adopting the combined approaches of PAT tree and statistics the present article makes an analysis of the comments obtained from the website of Taobao.The results showed that it is effective to employ the sentiment analysis method based on HowNet and PAT tree to analyze the sentimental tendency of comments on online shopping.In addition,taking a business selling women’s clothes as an example,an experimental study was conducted.Several directions of further exploring the sentimental tendency were also pointed out at the end of the paper.

      HowNet sentiment dictionary;PAT tree;comment on online shopping;sentiment analysis

      G353.12

      李永忠,男,1963年生,副教授,研究方向?yàn)殡娮诱?wù)、信息產(chǎn)業(yè)合作,發(fā)表論文50余篇;胡思琪,女,1993年生,2013級信息管理與信息系統(tǒng)專業(yè)碩士研究生,發(fā)表論文1篇。

      猜你喜歡
      傾向性網(wǎng)購評語
      教老媽網(wǎng)購
      基于模糊數(shù)學(xué)法的阿舍勒銅礦深部巖體巖爆傾向性預(yù)測
      網(wǎng)購寒假作業(yè)
      網(wǎng)購寒假作業(yè)
      流沙河語錄及諸家評語
      網(wǎng)購那些事兒
      商周刊(2018年23期)2018-11-26 01:22:22
      關(guān)于醫(yī)患沖突報道的傾向性分析——以“湘潭產(chǎn)婦死亡案”為例
      “沒準(zhǔn)兒”“不一定”“不見得”和“說不定”的語義傾向性和主觀性差異
      語言與翻譯(2015年4期)2015-07-18 11:07:43
      怎樣為作文寫評語
      散文百家(2014年11期)2014-08-21 07:16:36
      一種面向博客群的主題傾向性分析模型
      长沙市| 乌拉特前旗| 夹江县| 象山县| 丰都县| 梧州市| 黔西县| 丰都县| 苍山县| 聂拉木县| 商水县| 江永县| 株洲县| 舞钢市| 北碚区| 炉霍县| 和静县| 宁德市| 承德市| 三原县| 河东区| 宝应县| 桦川县| 阿坝| 通河县| 青阳县| 甘洛县| 威宁| 美姑县| 开远市| 柳州市| 大化| 进贤县| 神木县| 唐海县| 台中县| 壤塘县| 大田县| 商河县| 方正县| 福州市|