林明明,邱云飛,邵良杉
(1. 遼寧工程技術大學 軟件學院,遼寧 葫蘆島 125100;2. 遼寧工程技術大學 系統(tǒng)工程研究所,遼寧 葫蘆島 125100)
基于三維坐標的模糊量化情感分類方法
林明明1,邱云飛1,邵良杉2
(1. 遼寧工程技術大學 軟件學院,遼寧 葫蘆島 125100;2. 遼寧工程技術大學 系統(tǒng)工程研究所,遼寧 葫蘆島 125100)
針對微博情感分類問題,構造了基于三維坐標的模糊量化情感分類算法,通過將情感模糊量化,對微博進行多情感分類。首先對情感模糊處理,將情感分為六大類,根據六大類,定義并計算句子的模糊情感;其次將情感量化處理,根據情感類別構造三維坐標模型,將模糊情感值作為句子的坐標,通過坐標將句子映射到三維坐標模型中,使其量化;最后通過模糊量化處理后,根據與坐標軸的夾角判斷句子最終的情感分類。通過實驗,對三個作者的微博進行模糊量化處理,對其情感分類,實驗結果的F值達到85%以上,同時與三種經典算法進行對比實驗,準確率有了明顯的提高。
微博情感;模糊量化;情感分類;模糊情感;三維坐標
隨著微博時代的到來,越來越多的人有自己的微博,在微博上發(fā)表對某件事的看法,表達自己的情感,然而面對大量的微博內容,快速判斷作者的情感非常不便,不能在短時間內準確掌握作者的情感,因此,快速判斷微博的情感是一個急需解決的問題。近年來,大多數學者只是將微博情感分為積極的和消極的,然而人們的情感并不止這兩類,需要對情感進行更細致的分類,所以本文將情感細化為六大類。由于語言和情感的特點,本文提出了將情感模糊量化處理,首先,由于微博情感并不單一,具有多態(tài)性,并不能精確判斷句子的情感類別,往往一句話中可能包含多個類別,關鍵看句子更傾向于哪一類別就判斷為哪一類別,這就是句子的模糊性,因此將句子模糊處理;其次,又由于情感模糊的復雜性不便于判斷,要想確定句子的所屬類別,就需要將情感進行定量分析,所以,將句子的模糊性進行量化處理,通過量化計算,將情感進行最終分類。本文提出了模糊量化情感分類算法,構造了三維坐標模型,定義了模糊情感,通過計算詞語相似度,將其轉化為模糊情感值,根據模糊情感最終確定句子的坐標值,將句子映射到三維坐標中,使句子量化,根據與坐標軸的夾角對微博句子進行多情感分類。通過與PMI-IR[1]算法、貝葉斯算法[2]、K-means算法[3]進行比較,本文算法的準確率有了明顯的提高。
近年來,國內外相關學者對情感分類進行了研究,有些專家通過語義傾向性對情感進行分類,Turney[1,4-5]提出了Pointwise Mutual Information (PMI) and Information Retrieval(IR)算法的語義傾向性方法Semantic Orientation (SO)進行情感分類,以及對PMI-IR算法中的公式進行逐步改進,并且還對SO-PMI和SO-LAS的方法進行了比較。文獻[6]在PMI-IR算法中利用兩對種子詞進行測試,通過搜索引擎的NEAR操作,分別將搜索窗口大小調到10和20進行測試,對手機評論進行了情感分類。文獻[7-8]通過PMI-IR算法對中文進行情感分類,前者指出了英文中的分詞容易而中文的卻不同,還指出中文的種子詞不像英文中那么容易選出,后者提出了種子詞的選擇方法,選出SO值最高和最低的三組詞作為種子詞對。文獻[9]指出了PMI-IR算法的不足并進行克服,只考慮兩個形容詞“不”和“有點”,通過算法預測形容詞的極性。以上都沒有針對中文特點進行很大的改動,只是在借助處理英文的特點來處理中文,對中文語言并不是很適用。
除了基于語義傾向性的算法,還有通過詞典和相似度等方法進行情感分析,文獻[10]構建一個非正式語言詞典,或者這些語言不在正式的詞典中出現,往往這些詞可以判斷句子的情感傾向性。文獻[11]通過在微博中計算共現概率去學習出候選情感詞,改進了詞典,通過實驗驗證抽取的新詞匯構建的詞典在情感分類中優(yōu)于兩個經典的語料詞典。文獻[12]基于上下文語義相似度來計算文本語義相似性,由于一些詞無法在同義詞詞典中找到,所以通過Google搜索引擎,搜索兩個項的共現概率,從而計算兩個項的關系,進而得到相似度。文獻[13]提出了情感敏感詞典的方法解決交叉領域的情感分類問題。文獻[14]提出將動詞作為核心元素,確定情感傾向性。文獻[15]對電影評論的情感進行二元分類。
以上都是對情感進行二元分類,然而人們的情感并不止積極的和消極的。文獻[16-18]將情感細化,文獻[16]提出了一種基于PMI-IR算法對博客進行四種情感的分類,喜、怒、哀、懼。但是只考慮了形容詞和副詞的短語,并不全面。文獻[17]用χ2的方法將情感分為五類,生氣、高興、驚訝、憎恨、悲傷。文獻[18]將情感分為六大類,憤怒、厭惡、害怕、喜歡、悲傷、驚訝。通過共現概率來計算互信息判斷情感。但這些文獻對積極類只劃分為一個類,并不能很好地表達積極類的情感。
基于以上國內外的研究,本文根據中文語言特點,構造了提取中文語言短語的規(guī)則,并且將情感分為六大類,即: 樂、好、忠、怒、哀、懼。將積極類和消極類都分別細化為三類,提出了模糊量化情感分類算法,對微博情感進行分類。
人們的情感總體分為兩大類,積極的和消極的,然而,這兩大類情感并不能很好地表達人們的喜怒哀樂,所以本文將情感細化。到目前為止,心理學家和語言學家對情感做了不同的劃分[19-22],因為人類的情感非常復雜,不容易界定,所以并沒有一個統(tǒng)一的標準對其劃分。之前有學者將“驚”作為一類[17-18],本文沒有將“驚”作為一類,因為,“驚”可以代表積極的,也可以代表消極的,單從“驚”類的詞無法判斷句子的情感傾向性,并且“驚”是由其他情感所導致,或許是高興的,或許是憤怒的,因此,本文沒有將“驚”單獨劃分一類。根據眾多學者對情感的分類,以及根據后文三維坐標模型建立的需求,本文將情感分為六大類: 樂、好、忠、怒、哀、懼。其中,樂、好、忠為積極的類,怒、哀、懼為消極的類。這六大類可以代表人們的基本情感類別。分類結果如表1所示。
表1 情感分類表
4.1 模糊情感定義
本文并沒有直接考慮句子中詞語的詞義進行情感分析,而是從詞性入手,對于句子li,帶有感情色彩的都是形容詞、副詞或動詞等短語,而數詞、代詞等詞或短語并不能表達情感,所以要確定句子的模糊情感值,首先要提取句子中表達情感的短語,盡可能地將具有情感傾向性的短語篩選出來,同時盡可能地不篩選出非情感短語,然后確定短語模糊情感值。Turney提出了五種英文短語的規(guī)則[1],但并不適合中文,因此文本根據中文語言的特點,通過詞性標注,定義提取中文短語的規(guī)則如表2。
表2 提取中文短語規(guī)則
續(xù)表
4.2 模糊情感計算
本文根據詞語的相似度確定模糊情感,計算每個句子中表達情感的短語與每一大類的種子詞的相似度來確定每一大類的模糊值,Turney提出的PMI-IR[5]算法計算詞語相似度的方法如式(1)所示。
根據模糊情感定義,公式(1)所計算的值顯然不適合做模糊情感值,因為根據對數函數的性質,函數圖像過(1,0)點,自變量小于1時,函數值為負數,根據公式中的比值意義,結果必然小于1,那么,自變量的值越大,函數值的絕對值越小,也就是說共現次數越大,所占的比重越小,不符合模糊情感的定義。因此,為了使對數值都大于零,本文將函數向左移一個點,使其過(0,0)點,這樣在自變量大于零時,函數值單調遞增并全部大于零。所以文本定義公式(2)計算詞語相似度。
(2)
在搜索引擎中搜索詞語時,搜索的結果是包含搜索短語的全部結果,這其中,前面帶有否定詞的短語也會包含在搜索結果中,如果帶有否定詞,整個詞語及句子的意思就是相反的,這樣的結果并不是所需要的,因此搜索時要避免結果中包含否定詞。設not為否定詞,phrase-not表示搜索詞去掉前面的否定詞,seedw-not表示種子詞去掉前面的否定詞,這樣搜索的結果更真實。
根據公式(2),首先需要選擇種子詞,本文將情感分為六大類,所以,需要選擇六大類的種子詞,由于每一大類單單一個詞語并不能明確代表一大類,并且不同的種子詞在搜索引擎中出現的次數不同,因此共現次數就會有所影響。為了使每一大類的種子詞出現的次數大致相同,本文選擇種子詞集代替種子詞進行計算,只有保證每一大類的種子詞集單獨出現的總數相同,才能確保短語與每一大類種子詞的共現次數有可比性,因為,如果某一大類種子詞單獨出現的次數很少,那么共現次數就會更少,而如果另一大類種子詞單獨出現的次數很多,那么共現次數的機會就會很多,所以必須保證每一大類的種子詞集單獨出現的總數相同,計算的結果才有可比性。由于每個詞單獨出現的次數不同,為了使每一大類種子詞集單獨出現的總數相同,所以每一大類的種子詞集的個數不同,例如,“怒”類中的詞單獨出現的次數相比“樂”類少很多,因此“怒”類的種子詞集個數比較多,本文通過Google搜索引擎搜索,每一大類種子詞集單獨出現的總數為3 500 000左右。種子詞集如表3所示。
表3 種子詞集表
設“樂”類種子詞集為集合LE={高興,歡喜},“好”類種子詞集為集合HAO={渴望,思念,贊揚},“忠”類種子詞集為集合ZHONG={信任,忠實,忠誠,誠懇,鐘情,鐘愛,崇拜},“怒”類種子詞集為集合NU={憤怒,生氣,憎惡,惡心,厭惡,憤懣,憤激,憤慨,發(fā)火,憤恨,激憤,發(fā)怒,氣憤},“哀”類種子詞集為集合AI={傷心,失望},“懼”類種子詞集為集合JU={恐慌,猶豫,害怕,恐懼}。
由于將種子詞集代替種子詞計算,并且各個類的種子詞集單獨出現的總數大致相同,所以可以將公式(2)簡化為公式(3),設CLASS為六大類其中的一個類,s_class為相應類別的種子詞。
(3)
確定句子li的模糊情感fuzzy_li,首先要確定li中phrasej的模糊情感fuzzy_phj。根據公式(3)和種子詞集得到公式(4)計算phrasej的模糊情感值,其中,s_le,s_hao,s_zhong,s_nu,s_ai,s_ju分別為樂、好、忠、怒、哀、懼的種子詞。
(4)
根據phrasej的模糊情感定義及phrasej和li的關系,li的模糊情感可以寫為
其中,n為句子中提取出情感短語的個數,再根據公式(5)計算li的模糊情感。
(5)
通過計算可以確定句子li的模糊情感fuzzy_li={H,G,F,A,S,D}的各個值。為了更準確地得到句子屬于每一大類的程度,本文將句子映射到坐標中。
由于人們的情感非常復雜,不容易準確分類,所以要將情感進行清晰的度量,即量化處理,通過三維坐標模型,準確將句子定位到坐標中,使句子情感量化,進行情感分類。根據表1對情感的分類,將“樂、好、忠”分別作為X,Y,Z的正半軸,將“怒、哀、懼”分別作為X,Y,Z的負半軸,正半軸和負半軸的類并不需要是一對反義類,因為本文將正半軸和負半軸分開計算,二者互不沖突。三維坐標模型如圖1所示。
圖1 三維坐標模型圖
根據模糊情感的計算,li的每一類的模糊值都不是零,并且都是正數。根據式(5),共現次數越大,PMI值越大,就越接近這個類,因此將PMI值作為句子的三維坐標值。本文將積極類和消極類分開計算,設句子的積極向量為qp,消極向量為qn。根據三維坐標的特點,設句子正半軸的坐標為:xp,yp,zp,負半軸的坐標為:xn,yn,zn。對于正半軸,將“樂、好、忠”的模糊值賦值給正半軸的坐標,即:xp=H,yp=G,zp=F,對于負半軸,將“怒、哀、懼”的模糊值相反數賦值給負半軸的坐標,即:xn=-A,yn=-S,zn=-D。將正半軸的三個坐標值作為積極向量qp,負半軸的三個坐標值作為消極向量qn,因此確定句子的積極向量為qp=(xp,yp,zp),消極向量為qn=(xn,yn,zn)。
(6)
(7)
如果通過公式(6)和(7)分別求句子積極向量和消極向量與坐標軸的夾角,這樣算出的積極夾角和消極夾角無法進行比較,只能將積極的夾角和消極的夾角分別比較,這樣無法確定句子的最終情感傾向,如果要將積極和消極夾角同時比較,公式中的分母必須一樣,因此將余弦值公式(6)和公式(7)改為公式(8)和公式(9)。
(8)
(9)
將分母進行統(tǒng)一,這樣才可以將積極和消極進行比較,通過公式(8)和公式(9)可以求出向量qp和qn與X,Y,Z軸的單位向量求余弦值。再通過余弦值,根據公式(10)和公式(11)求出與各個坐標軸的夾角。
(10)
(11)
如圖1所示,句子li為“今天發(fā)生的一切都很愉快!”,經過計算,得到fuzzy_li={0.074,0.032,0.044,0.036,0.023,0.046},因此,li的qp=(0.074,0.032,0.044),qn=(-0.036,-0.023,-0.046),為了便于在圖中便于表示,將li的坐標值放大100倍,這并不影響計算結果,qp與X,Y,Z軸的夾角分別為: 17.15°,65.28°,55.23°,qn與X,Y,Z軸的夾角分別為: 118.07°,107.12°,126.27°,即qn與X,Y,Z軸的補角分別為: 61.93°,72.88°,53.73°,因此,minjiao=17.15°,maxjiao的補角為53.73°,所以該句子判斷為積極類的“樂”類。通過三維坐標模型,將句子映射到其中,直接將句子定位到坐標中,如果不映射到坐標中,無法比較句子屬于某一類別的程度,所以通過夾角,不僅得到句子的類別,而且還能得到屬于某一類別的程度,即越接近坐標軸越屬于某一類,最終可以綜合看到整個坐標中句子分布情況,實現了對句子情感進行量化處理,通過情感量化,對情感分類。
首先,對句子進行分詞,然后去掉停用詞等噪聲,再根據表2提取短語。本文根據中科院的ICTCLAS對微博句子集L={l1,l2,…,ln}分詞,并進行詞性標注,根據表2提取短語的規(guī)則提取出每句中表達情感的短語phrasej。
然后,確定模糊情感。借助Google搜索引擎中的高級搜索模式,根據公式(4),計算每個phrasej的模糊情感fuzzy_phi={hj,gj,fj,aj,sj,dj},通過li中每個phrasej的模糊情感值,根據公式(5)計算每個li的模糊情感fuzzy_li={H,G,F,A,S,D}。
第三,確定qp和qn。根據得到的模糊情感值確定積極向量qp和消極向量qn。
第四,確定minjiao和maxjiao。根據公式(8)和公式(9),計算li的qp和qn分別與X,Y,Z軸的單位向量的余弦值,再根據公式(10)和公式(11)計算li與每個軸的夾角,得到正半軸的最小角minjiao,和負半軸的最大角maxjiao。
第五,比較并確定類別。如果minjiao較小,該句子為積極類中相應最小角的類,反之,為消極類中相應最大角的類。
具體算法步驟如算法1所示。
算法1 模糊量化情感分類算法
7.1 模糊量化情感分類算法實驗
本文通過新浪API獲取了三個作者的新浪微博,第一個作者的微博為2353條,第二個作者的微博為995條,第三個作者的微博為1564條。兩名實驗員同時對三名作者的微博進行情感標記,取出標記相同的微博作為實驗數據,取第一個作者的2085條微博,第二個作者的789條微博,第三個作者的1247條微博進行實驗。如果對大規(guī)模文本進行實驗,需要用聯機處理,因為本文的數據量相對較小,單機就可以進行實驗。
通過模糊量化情感分類算法,對三個作者的微博分別進行情感分類。分類結果如表4所示。
根據表4,三個作者的微博正確分類結果與人工標記對比圖如圖2所示。
從圖2可以看出,作者1和作者2積極情感的微博要多于消極情感的微博,作者3消極情感的微博要多于積極情感的微博。從這三個圖中可以看出,“樂”和“好”的準確率要比其他類別低,因為這兩個類別很相似,一句積極的話中往往“樂”和“好”的模糊值會很相近,因此,會把“樂”的句子誤判為“好”類,也會把“好”的句子誤判為“樂”類。
表4 實驗結果表
圖2 正確分類與人工標記對比圖
7.2 對比實驗
為了說明本文的先進性和有效性,本文將模糊量化情感分類算法與幾個經典的分類或聚類算法進行比較,本文分別和PMI-IR算法、K-均值聚類算法,樸素貝葉斯方法進行比較,三種方法的結果如表5所示。
(1) PMI-IR方法: Turney提出的PMI-IR算法,根據本文提出的選取中文短語的規(guī)則,以及本文選取的種子詞集,根據PMI-IR算法對三個作者的微博進行情感傾向性判斷。
(2) K-均值聚類: 根據本文構造的方法提取每句話的情感傾向性短語,同時將本文選取的種子詞作為初始聚類中心點,根據K-均值聚類方法對3個作者的微博進行情感傾向性判斷。
(3) 樸素貝葉斯方法: 根據本文構造的方法提取每句話的情感傾向性短語,本文將三個作者的微博語料庫,對每一類別平均分成五組,進行五倍交叉實驗,依次選取每一類中的一組作為測試集,其他的作為訓練集,進行樸素貝葉斯分類。
表5 對比實驗結果
7.3 實驗評價
為了驗證本文的全面性和準確性,評價標準采用準確率(Precision)、召回率(Recall)以及F值(F-measure)用來評價整體性能。根據算法特點,本文對準確率、召回率和F值進行定義。
根據定義,本文的算法和三種經典的方法準確率比較如表6所示。
根據定義,本文分別用四種方法計算三個作者的準確率,召回率和F值的平均值如圖3,圖4和圖5所示。
從圖3和圖4可以看出,本文的準確率和召回率都高于其他三種方法,結合準確率和召回率,本文通過F值綜合評價試驗,從圖5可以看出,本文的F值都達到了85%以上,而PMI-IR方法用本文提取中文情感短語的方法平均F值達到了75%左右,K-均值和貝葉斯方法基本都達到了80%以上,所以,可以看出本文的方法可以有效地判斷出微博的情感。
表6 準確率比較表
圖3 準確率結果圖
圖4 召回率結果圖
圖5 F值結果圖
由于微博數量劇增,根據微博內容自動判斷作者的情感是一個急需解決的問題,并且人們的情感非常豐富,所以不能只將情感分為積極的和消極的,因此本文將情感類別細化,分為六大類,即: 樂、好、忠、怒、哀、懼,提出了基于三維坐標模型的模糊量化情感分類算法,對微博進行多情感分類。由于中文語言的復雜性,并不能精確判斷句子的情感類別,需要將句子模糊處理,而要想確定句子的所屬類別,只有將句子的模糊性進行量化處理,才可以將句子進行計算判斷。本文根據六大類情感,提出了模糊量化情感分類算法,構造了三維坐標模型,通過句子的模糊情感值將句子映射到三維坐標中,使其進行定量計算,最終判斷句子的情感類別,實現了句子的模糊量化處理。通過實驗,F值達到了85%以上,與其他三種方法進行對比實驗,準確率有了明顯的提高,因此,該算法可以有效地將情感分為六大類。
[1] Turney P D. Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews[C]//Proceedings of the 40th annual meeting on association for computational linguistics,2002: 417-424.
[2] Domingos P,Pazzani M. On the optimality of the simple Bayesian classifier under zero-one loss[J]. Machine learning,1997,29(2-3): 103-130.
[3] Huang J Z,Ng M K,Rong H,et al. Automated variable weighting in k-means type clustering[J]. Pattern Analysis and Machine Intelligence,IEEE Transactions on,2005,27(5): 657-668.
[4] Turney P D. Mining the web for synonyms: PMI-IR versus LSA on TOEFL[C]//Proceedings of the 12th European Conference on Machine Learning. Springer-Verlag,2001: 491-502.
[5] Turney P D,Littman M L. Measuring praise and criticism: Inference of semantic orientation from association[J]. ACM Transactions on Information Systems (TOIS),2003,21(4): 315-346.
[6] ZI-qiong Z,Yi-jun L I,Qiang Y E,et al. Sentiment classification for Chinese product reviews using an unsupervised internet-based method[C]//Proceedings of the IEEE,2008: 3-9.
[7] Ye Q,Shi W,Li Y. Sentiment classification for movie reviews in Chinese by improved semantic oriented approach[C]//Proceedings of the 39th AnnualHawaii International Conference on. IEEE,2006,3: 53b-53b.
[8] Shi L,Jun-zuo Y,Qiang Y. An experimental research on sentiment classification of Chinese reviews by semantic orientation method[C]//Proceedings of the IEEE,2008: 3999-4004.
[9] Xu G,Huang C,Wang H. Automatically Predicting the Polarity of Chinese Adjectives: Not,a Bit and a Search Engine[M]//Chinese Lexical Semantics. Springer Berlin Heidelberg,2013: 453-465.
[10] Cui A,Zhang H,Liu Y,et al. Lexicon-Based Sentiment Analysis on Topical Chinese Microblog Messages[M]//Semantic Web and Web Science. SpringerNew York,2013: 333-344.
[11] Feng S,Wang L,Xu W,et al. Unsupervised Learning Chinese Sentiment Lexicon from Massive Microblog Data[M]//Advanced Data Mining and Applications. SpringerBerlin Heidelberg,2012: 27-38.
[12] Martinez-Gil J,Aldana-Montes J F. Semantic similarity measurement using historical google search patterns[J]. Information Systems Frontiers,2013: 1-12.
[13] Bollegala D,Weir D,Carroll J. Cross-Domain Sentiment Classification using a Sentiment Sensitive Thesaurus[J]. IEEE Transactions on Knowledge and Data Engineering,2012.
[14] Karamibekr M,Ghorbani A A. Verb Oriented Sentiment Classification[C]//Proceedings of the IEEE,2012,1: 327-331.
[15] Shi L,Jun-zuo Y,Qiang Y. An experimental research on sentiment classification of Chinese reviews by semantic orientation method[C]//Proceedings of the IEEE,2008: 3999-4004.
[16] Duan X,He T,Song L. Research on sentiment classification of Blog based on PMI-IR[C]//Proceedings of the IEEE,2010: 1-6.
[17] Ning Y,Zhu T,Wang Y. Affective-word based Chinese text sentiment classification[C]//Pervasive Computing and Applications (ICPCA),2010 5th International Conference on. IEEE,2010: 111-115.
[18] Kozareva Z,Navarro B,Vázquez S,et al. UA-ZBSA: a headline emotion classification through web information[C]//Proceedings of the 4th International Workshop on Semantic Evaluations,2007: 334-337.
[19] 林傳鼎.社會主義心理學中的情緒問題[J].社會心理科學,2006,21(83): 37-62.
[20] 許小穎,陶建華.漢語情感系統(tǒng)中情感劃分的研究[C]∥第一屆中國情感計算及智能交互學術會議論文集.北京: 中國中文信息學會,2003: 199-205.
[21] Ekman P. Facial expression and emotion[J]. American Psychologist,1993,48(4): 384-392.
[22] Zhang Y,Li Z,Ren F,et al. Semi-automatic emotion recognition from textual input based on the constructed emotion thesaurus[C]//Proceedings of 2005 IEEE International Conference on.2005: 571-576.
Three-dimensional Coordinate Based Fuzzy Quantification for Sentiment Classification
LIN Mingming1,QIU Yunfei1,SHAO Liangshan2
(1. School of Software,Liaoning Technical University,Huludao,Liaoning 125100,China;2. System Engineering Institute,Liaoning Technical University,Huludao,Liaoning 125100,China)
A fuzzy quantification based on the three-dimensional coordinate is presented for microblog sentiment classification. Firstly,we define and divide the microblog sentiment into six classes,and calculate the fuzzy sentiment. Secondly,we construct the three-dimensional coordinate based on the sentiment classes,and mapped the sentences into the three-dimensional. Finally,we decide the sentiment classification of the sentence according to the angle between the sentence and axis. Through the experiment on classifying three authors’ microblogs,the F-measure reaches more than 85%,outperforming three classical algorithms.
sentiment of microblog; fuzzy quantifying; sentiment classification; fuzzy sentiment; three-dimensional coordinate
林明明(1989—),碩士研究生,主要研究領域為數據挖掘、情感分析。E?mail:glcylin@163.com.邱云飛(1976—),博士,教授,主要研究領域為數據挖掘、情感分析。E?mail:qyflntu@163.com.邵良杉(1961—),博士,教授,主要研究領域為數據挖掘、情感分析。E?mail:lntushao@163.com.
2014-01-17 定稿日期: 2014-06-09
國家自然科學基金(70971059);遼寧省創(chuàng)新團隊項目(2009T045);遼寧省高等學校杰出青年學者成長計劃(LJQ2012027)。
1003-0077(2016)03-0152-11
TP391
A