杜 銳,朱艷輝,田海龍,劉 璟,馬 進(jìn)
(湖南工業(yè)大學(xué) 計(jì)算機(jī)與通信學(xué)院,株洲 湖南 412007)
基于平滑SO-PMI算法的微博情感詞典構(gòu)建方法研究
杜 銳,朱艷輝,田海龍,劉 璟,馬 進(jìn)
(湖南工業(yè)大學(xué) 計(jì)算機(jī)與通信學(xué)院,株洲 湖南 412007)
對(duì)現(xiàn)有情感詞典在微博情感分類中的適用性進(jìn)行了分析,針對(duì)現(xiàn)有情感詞典在微博中情感詞覆蓋度低的問題,整合現(xiàn)有情感詞典資源,構(gòu)建了一個(gè)微博基礎(chǔ)情感詞典,同時(shí)提出了一種基于拉普拉斯平滑的SO-PMI算法對(duì)微博基礎(chǔ)情感詞典中沒有收錄的情感詞傾向性進(jìn)行判斷,最后利用微博情感詞典與拉普拉斯平滑的SO-PMI算法對(duì)微博情感詞典進(jìn)行了構(gòu)建,并對(duì)所構(gòu)建微博情感詞典的分類性能進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該方法所構(gòu)建的情感詞典在微博情感分類中能達(dá)到較好的分類效果。
中文微博;情感詞典;情感分類;平滑
隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,以微博為代表的社交媒體得到了廣泛的應(yīng)用。在微博中,人們可以享受快捷的獲取信息的方式,也可以分享自己身邊有趣的人或事。在海量的微博文本中包含著大量表達(dá)人們情感的主觀性文本,這些主觀性的微博在文本長(zhǎng)度、表達(dá)方式、語(yǔ)言風(fēng)格等方面與傳統(tǒng)評(píng)論存在著較大的區(qū)別,分析主觀文本的情感傾向是輿情監(jiān)控的重要基礎(chǔ)。
在微博情感分析中,微博情感詞典的構(gòu)建具有重要的研究意義和使用價(jià)值,其不僅能為情感分析的研究提供參考,而且在情感特征選擇及特征降維等方面有著重要的應(yīng)用。在情感詞典的構(gòu)建過(guò)程中,情感詞的傾向性計(jì)算是重點(diǎn)也是難點(diǎn)。目前,計(jì)算情感詞傾向性的方法主要有基于語(yǔ)義相似度的計(jì)算與基于統(tǒng)計(jì)的計(jì)算方法。
文獻(xiàn)[1]采用HowNet和NTUSD 2種資源對(duì)現(xiàn)有情感詞典進(jìn)行擴(kuò)展,建立了一個(gè)具有傾向性程度的情感詞典。文獻(xiàn)[2]提出了一種自動(dòng)構(gòu)建與上下文相關(guān)的情感詞典的最優(yōu)化方法。文獻(xiàn)[3]利用知網(wǎng)進(jìn)行同義詞擴(kuò)展,提出一種HowNet和PMI(pointwise mutual information)相融合的詞語(yǔ)極性計(jì)算方法。
基于HowNet的語(yǔ)義相似度計(jì)算方法[4]以及基于SO-PMI(semantic orientation-pointwise mutual information)的情感詞傾向性計(jì)算方法[5],這2種方法的共同點(diǎn)是:需要選取一定數(shù)量的正面種子詞和負(fù)面種子詞。不同點(diǎn)是:前者通過(guò)計(jì)算未知詞與正、負(fù)面種子詞相似度的方法判斷未知詞的傾向性,其中詞語(yǔ)的相似度采用計(jì)算2個(gè)詞語(yǔ)義原相似度的最大值而得到[6];而后者通過(guò)互信息計(jì)算未知詞與正、負(fù)面種子詞關(guān)聯(lián)度的方法對(duì)未知詞的傾向性進(jìn)行判斷。上述2種方法在情感詞的傾向性判斷中取得了一定的效果,但是在中文微博中,由于網(wǎng)絡(luò)新詞較多,部分詞如“給力”“正能量”“坑爹”等在HowNet中找不到義原,進(jìn)而也就無(wú)法根據(jù)2個(gè)詞義原的相似度計(jì)算詞語(yǔ)的相似度。因此,基于HowNet的語(yǔ)義相似度計(jì)算方法對(duì)微博中部分詞的傾向性判斷并不適用。
基于SO-PMI的方法需要計(jì)算候選情感詞與種子詞的互信息,種子詞通常選詞頻較高的情感詞。而在微博中,若選取詞頻較高的情感詞作為種子詞則會(huì)帶來(lái)如下問題:由于同一情感詞可能在一條微博中出現(xiàn)多次,而在其他微博中出現(xiàn)的次數(shù)較少或并不出現(xiàn),若將該情感詞選為種子詞則候選情感詞與該種子詞在整個(gè)語(yǔ)料中同現(xiàn)的次數(shù)可能為0,候選情感詞與種子詞的互信息無(wú)法計(jì)算,進(jìn)而無(wú)法判斷候選情感詞的情感傾向性。因此基于SO-PMI的方法在判斷微博中情感詞的傾向性時(shí)也存在局限性,本文在已有情感詞典資源的基礎(chǔ)上,提出了一種基于改進(jìn)SO-PMI的微博情感詞典構(gòu)造方法。
情感詞典是指由一系列情感詞及其相應(yīng)的傾向性值構(gòu)成的詞集合。在含有情感詞的微博情感句中,情感詞是進(jìn)行傾向性判斷的重要特征。雖然,已有一些研究機(jī)構(gòu)發(fā)布了一系列情感詞典如《知網(wǎng)》情感詞詞典[7]、《大連理工大學(xué)情感本體》[8]等,這些情感詞典為情感分類的研究提供了重要的參考。但由于微博中網(wǎng)絡(luò)新詞和網(wǎng)絡(luò)用語(yǔ)層出不窮,現(xiàn)有情感詞典對(duì)微博中所有情感詞的覆蓋程度難以確定。為此,本文對(duì)現(xiàn)有情感詞典在微博中情感詞的覆蓋程度進(jìn)行了分析。
課題組首先從COAE2013(2013年中文傾向性評(píng)測(cè))任務(wù)三發(fā)布的微博評(píng)測(cè)標(biāo)注語(yǔ)料中隨機(jī)選取正、負(fù)面微博各100條,采用ICTCLAS[9]分詞后,人工挑選微博中所有的正、負(fù)情感詞及情感短語(yǔ),其中正面情感詞及短語(yǔ)119個(gè)、負(fù)面情感詞及短語(yǔ)99個(gè)。然后,對(duì)現(xiàn)有情感詞典資源《知網(wǎng)》《大連理工大學(xué)情感本體》分別進(jìn)行了整理,情感詞典整理結(jié)果如表1所示。
表1 微博基礎(chǔ)情感詞典Table 1 The basic sentiment lexicon of microblog
表1中,Dalian為大連理工大學(xué)情感本體,Co為合并HowNet與Dalian情感詞典并去掉重復(fù)的詞構(gòu)成的情感詞典,即微博基礎(chǔ)情感詞典。將上述整理后的情感詞典分別與人工挑選的微博正、負(fù)情感詞進(jìn)行對(duì)比,并計(jì)算整理后的情感詞典對(duì)微博中情感詞的覆蓋程度,覆蓋度計(jì)算為:
式中:m為整理后與基礎(chǔ)情感詞典完全匹配的情感詞個(gè)數(shù);n為正、負(fù)微博情感詞個(gè)數(shù)。
利用上述公式分別計(jì)算HowNet正、負(fù)情感詞典及Dalian正、負(fù)情感詞典對(duì)微博正、負(fù)面情感詞的覆蓋度,其覆蓋度結(jié)果如圖1所示。
圖1 正、負(fù)情感詞覆蓋度Fig. 1 The coverage of positive and negative sentiment words
由圖1可以看出,HowNet正面情感詞典對(duì)微博正面情感詞的覆蓋程度較好,Dalian負(fù)面情感詞對(duì)微博負(fù)面情感詞典的覆蓋程度較好,微博基礎(chǔ)情感詞典對(duì)微博的正、負(fù)面情感詞覆蓋程度有顯著提升,因此,整合現(xiàn)有情感詞典在一定程度上能提高微博中情感詞的覆蓋度。但是,整合后的情感詞典離完全覆蓋微博中的正、負(fù)情感詞還有一定的差距。
當(dāng)微博條數(shù)增加時(shí),需要判斷整合后的情感詞典是否具有穩(wěn)定性,即隨著微博條數(shù)的增加,情感詞典對(duì)微博中情感詞的覆蓋度是否保持不變。為了對(duì)情感詞典的穩(wěn)定性進(jìn)行分析,本文共進(jìn)行了8組實(shí)驗(yàn),每組分別選取50, 100, 150, 200, 250, 300, 350, 400條微博,人工挑選出每組中的所有微博情感詞,并利用微博基礎(chǔ)情感詞典計(jì)算其對(duì)微博中情感詞的覆蓋度,其計(jì)算結(jié)果如圖2所示。
圖2 情感詞覆蓋度隨微博條數(shù)的變化趨勢(shì)Fig. 2 The sentiment words coverage changed with the numbers of microblog
由圖2可知,當(dāng)微博條數(shù)增加時(shí),微博基礎(chǔ)情感詞典對(duì)微博中的情感詞覆蓋度降低。分析其原因,隨著微博條數(shù)增加時(shí),微博中的情感詞也隨之增加,而部分情感詞如網(wǎng)絡(luò)新詞、情感短語(yǔ)等并沒有在整合后的微博基礎(chǔ)情感詞典中收錄。因此,整合后的基礎(chǔ)情感詞典在微博中并不具有穩(wěn)定性。
2.1 候選微博情感詞的提取
候選微博情感詞是指微博中可能是情感詞的詞或短語(yǔ),其主要以名詞、動(dòng)詞、形容詞、副詞存在。因此,微博中候選情感詞的提取可以通過(guò)分詞后詞語(yǔ)的詞性而得到,但僅僅以詞性作為候選情感詞的提取方式則會(huì)產(chǎn)生過(guò)多的候選情感詞,為了減少候選情感詞的粗糙程度,本文采用如下方式提取微博中的候選情感詞。
首先,采用ICTCLAS對(duì)微博進(jìn)行分詞,提取詞性為/a, /v, /n, /vn, /ag, /vi的詞作為待入選候選微博情感詞;然后,待入選候選微博情感詞分別與微博基礎(chǔ)情感詞典中的正、負(fù)情感詞匹配,正面匹配相同的詞存入sp,記sp={a1, a2, …, an},負(fù)面匹配相同的詞存人sn,記sn={b1, b2, …, bm};則未匹配的詞即為候選微博情感詞,將該類詞存入sd,記為sd={c1, c2, …, cp}。
2.2 判斷候選微博情感詞傾向性
在利用SO-PMI算法對(duì)候選微博情感詞的傾向性進(jìn)行判斷時(shí)需選取情感種子詞,通常種子詞采用詞頻統(tǒng)計(jì)的方式選取詞頻較高的情感詞作為種子詞。但由于微博文本長(zhǎng)度較短,詞頻較高的種子詞其文檔頻率并不一定高,若情感種子詞在較少的微博中出現(xiàn),則微博候選情感詞與情感種子詞在訓(xùn)練語(yǔ)料中同現(xiàn)的次數(shù)較少或不同現(xiàn)而無(wú)法計(jì)算其互信息。因此,為了避免上述問題的出現(xiàn),認(rèn)為,種子詞的選取應(yīng)選取文檔頻次較高的情感詞而并非詞頻較高的情感詞。若候選情感詞與情感種子詞在整個(gè)語(yǔ)料中同現(xiàn)的次數(shù)為0,則候選情感詞與情感種子詞的互信息無(wú)法計(jì)算,進(jìn)而無(wú)法判斷候選情感詞的情感傾向性。為了避免解決上述問題,本文對(duì)SO-PMI算法進(jìn)行了如下改進(jìn)。
設(shè)有n個(gè)正面情感種子詞:P={p1, p2, …, pn},m個(gè)負(fù)面情感種子詞:N={r1, r2, …,rm},則對(duì)候選微博情感詞中的每個(gè)詞ci(i=1, 2, …, p),其與正面情感種子詞pj(j=1, 2, …, n)的互信息為
式中:p(ci, pj)為詞ci與正面情感種子詞pj在訓(xùn)練語(yǔ)料中同現(xiàn)的概率;
p(ci), p(pj)為詞ci, pj在訓(xùn)練語(yǔ)料中出現(xiàn)的概率。
在實(shí)際計(jì)算過(guò)程中,上述概率值可用頻率進(jìn)行估計(jì),因此有以下公式,即
式(3)~(5)中:count(ci, pj)為表示詞ci與pj在訓(xùn)練語(yǔ)料中同現(xiàn)的微博條數(shù);
count(ci)為包含詞ci的微博條數(shù);
count(pj)為包含詞pj的微博條數(shù);
q為訓(xùn)練集中總的微博條數(shù)。
將式(3)~(5)帶入式(2)后得到式(6):
由于在實(shí)際計(jì)算過(guò)程中count(ci, pj)的值可能為0,此時(shí)計(jì)算PMI值將無(wú)意義,因此,本文對(duì)式(3)引入拉普拉斯平滑技術(shù):
則式(6)可改進(jìn)為:
同理,詞ci(i=1, 2, …, p)與負(fù)面情感種子詞rj(j=1, 2, …, m)的互信息可進(jìn)行相應(yīng)的改進(jìn),則詞ci的SOPMI值可用如下公式計(jì)算:
將式(9)化簡(jiǎn)后可變?yōu)椋?/p>
在封閉的訓(xùn)練語(yǔ)料中,出現(xiàn)正、負(fù)面種子情感詞的微博條數(shù)是固定的,因此j可看做一個(gè)常數(shù),其取值范圍為(0, +∞)。在訓(xùn)練語(yǔ)料中,如果
即詞ci與pj, rj在訓(xùn)練語(yǔ)料中同現(xiàn)的微博條數(shù)相等,則ci可視為中性詞,即
而根據(jù)式(10)計(jì)算后有
因此,改進(jìn)后的SO-PMI值的計(jì)算公式為:
最終,候選微博情感詞的情感傾向性可通過(guò)式(16)進(jìn)行判斷:若式(16)大于0則詞ci被判定為正面情感詞;若式(16)小于0則詞ci被判定為負(fù)面情感詞;若式(16)等于0則ci被判定為中性詞。將被判定為正面的情感詞加入到sp中,被判定為負(fù)面的情感詞加入到sn中,最后將加入了正、負(fù)情感詞的sp與sn合并,組成微博領(lǐng)域情感詞典。
3.1 實(shí)驗(yàn)數(shù)據(jù)選擇
實(shí)驗(yàn)采用COAE2014任務(wù)四的評(píng)測(cè)語(yǔ)料,其中共有40 000條微博(含干擾數(shù)據(jù))。首先,對(duì)評(píng)測(cè)語(yǔ)料進(jìn)行分詞、去除非法字符、數(shù)據(jù)格式規(guī)范化處理;然后,采用2.1~2.2節(jié)中的方式提取候選微博情感詞、計(jì)算候選情感詞的權(quán)值,并構(gòu)造微博情感詞典;最后利用構(gòu)造的微博情感詞典,對(duì)40 000條微博數(shù)據(jù)進(jìn)行情感傾向性判斷,以判別微博情感詞典構(gòu)建的質(zhì)量。
3.2 種子詞個(gè)數(shù)對(duì)微博情感詞典的影響
為了考察種子詞的選取對(duì)構(gòu)建微博情感詞典的影響,實(shí)驗(yàn)分別選取了5, 10, 15, 20, 25個(gè)TF-IDF值較高的正、負(fù)面種子情感詞,并用所選取的情感詞利用式(16)構(gòu)建微博情感詞典,采用準(zhǔn)確率、召回率、F-measure對(duì)微博情感詞典構(gòu)建的效果進(jìn)行量化分析,其中準(zhǔn)確率(presion)、召回率(recall)、F-measure的計(jì)算方式如下:
實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 情感詞典準(zhǔn)確率、召回率、F-measure與種子詞個(gè)數(shù)的變化趨勢(shì)Fig. 3 The emotional dictionary presion, recall and F-measure changed with seed word numbers
從圖3可知,隨著種子詞個(gè)數(shù)的增加,準(zhǔn)確率、召回率、F-measure隨之增加,表明情感詞典構(gòu)建越準(zhǔn)確。分析其原因,主要由于種子情感詞個(gè)數(shù)越多,其參與有效計(jì)算的情感詞隨之增加,從而減少個(gè)別情感詞對(duì)候選情感詞SO-PMI值的影響,因此,計(jì)算出的候選情感詞的傾向性值的可信度較大,從而使識(shí)別出的有效情感詞個(gè)數(shù)增加,準(zhǔn)確率、召回率、F-measure隨之增加。
3.3 微博情感詞典的應(yīng)用驗(yàn)證
為了驗(yàn)證微博情感詞典在微博情感分析中的應(yīng)用適用性,實(shí)驗(yàn)應(yīng)用情感詞典并采用基于規(guī)則的方法對(duì)40 000條微博進(jìn)行情感傾向性判斷,其判斷結(jié)果如表2所示。
表2 微博傾向性分析結(jié)果Table 2 Result of the microblog tendency analysis
表2中PosP, PosR, PosF分別為正面準(zhǔn)確率、召回率和F值,NegP, NegR, NegF分別為負(fù)面準(zhǔn)確率、召回率和F值,Hit_run3為采用基礎(chǔ)情感詞典[10]判斷微博情感傾向性的結(jié)果,Medians為COAE2014評(píng)測(cè)中的平均值。由表2可知,利用本文方法構(gòu)建的微博情感詞典在情感分析中較Hit_run3效果要好,且高于評(píng)測(cè)中的平均值。分析其原因:文獻(xiàn)[10]所構(gòu)建的情感詞典對(duì)網(wǎng)絡(luò)情感詞的覆蓋度較低,而本文方法在構(gòu)建的基礎(chǔ)情感詞典的基礎(chǔ)上,采用改進(jìn)的SO-PMI算法有效發(fā)現(xiàn)候選情感詞中的網(wǎng)絡(luò)情感詞,因而識(shí)別效果較好,有效驗(yàn)證了本文方法構(gòu)建的微博情感詞典在微博情感分析中的有效性。
本文針對(duì)SO-PMI算法在判斷微博中候選情感詞的傾向性時(shí),對(duì)情感詞傾向性判斷不準(zhǔn)的問題,在SO-PMI算法的基礎(chǔ)上,引入拉普拉斯平滑技術(shù)對(duì)SO-PMI算法進(jìn)行了改進(jìn)。采用改進(jìn)后的SO-PMI算法在COAE2014評(píng)測(cè)語(yǔ)料的基礎(chǔ)上構(gòu)建了微博情感詞典,利用構(gòu)建的微博情感詞典對(duì)微博進(jìn)行情感傾向性分析。實(shí)驗(yàn)結(jié)果表明,本文方法構(gòu)建的情感詞典在微博情感分析中具有較好的識(shí)別效果。
由于在分詞過(guò)程中,存在候選情感詞分詞不準(zhǔn)的問題,同時(shí)在構(gòu)建詞典中沒有考慮微博中表情符號(hào)的情感傾向性,因此在應(yīng)用情感詞典進(jìn)行微博情感傾向性判斷時(shí)存在召回率不高的問題,這表明采用規(guī)則的方法進(jìn)行傾向性判斷存在一定的局限性,因此在規(guī)則的基礎(chǔ)上融合機(jī)器學(xué)習(xí)的方法對(duì)微博進(jìn)行傾向性判斷將是下一步研究工作的重點(diǎn)。
[1]楊 超,馮 時(shí),王大玲,等. 基于情感詞典擴(kuò)展技術(shù)的網(wǎng)絡(luò)輿情傾向性分析[J]. 小型微型計(jì)算機(jī)系統(tǒng),2010,31(4):691-695. Yang Chao,F(xiàn)eng Shi,Wang Daling,et al. Analysis on Web Public Opinion Orientation Based on Extending Sentiment Lexicon[J]. Journal of Chinese Computer Systems,2010,31(4):691-695.
[2]Lu Y,Castellanos M,Dayal U,et al. Automatic Construction of a Context-Aware Sentiment Lexicon :An Optimization Approach[C]//World Wide Web Conference Series. Newyork:ACM,2011,347-356.
[3]王振宇,吳澤衡,胡方濤. 基于HowNet 和PMI的詞語(yǔ)情感極性計(jì)算[J]. 計(jì)算機(jī)工程,2012,38(15):187-189. Wang Zhenyu,Wu Zeheng,Hu Fangtao. Words Sentiment Polarity Calculation Based on HowNet and PMI[J]. Computer Engineering,2012,38(15):187-189.
[4]朱嫣嵐,閔 錦,周雅倩,等. 基于HowNet的詞匯語(yǔ)義傾向性計(jì)算[J]. 中文信息學(xué)報(bào),2006,20(1):14-20. Zhu Yanlan,Min Jin,Zhou Yaqian,et al. Semantic Orientation Computing Based on HowNet[J]. Journal of Chinese Information Processing,2006,20(1):14-20.
[5]Turney P D,Littman M L. Measuring Praise and Criticism: Inference of Semantic Orientation from Association[J]. ACM Transactions on Information Systems,2003,21(4):315-346.
[6]知網(wǎng). 《知網(wǎng)》情感分析用詞語(yǔ)集[EB/OL]. [2015-04-15]. http://www.keenage.com/html/c_index.html. HowNet. Words Set for Sentiment Analysis of HowNet [EB/OL]. [2015-04-15]. http://www.keenage.com/html/ c_index.html.
[7]大連理工大學(xué)信息檢索研究室. 大連理工大學(xué)情感詞匯本體庫(kù)[EB/OL]. [2015-04-15]. http://ir.dlut.edu.cn/ EmotionOntologyDownload.asp? xutm_source= weibolife. Information Retrieval Laboratory of Dalian University of Technology. Emotional Vocabulary Ontology Library of Dalian University of Technology[EB/OL]. [2015-04-15]. http://ir.dlut.edu.cn/EmotionOntologyDownload.aspx? utm_source= weibolife.
[8]ICTCLAS分詞系統(tǒng). ICTCLAS下載[EB/OL]. [2015-06-11]. http://ictclas/org/ictclas_download.aspx. ICTCLAS Word Segmentation System. ICTCLAS Download [EB/OL]. [2015-06-11]. http://ictclas/org/ ictclas_download. aspx.
[9]劉 群,李素建. 基于《知網(wǎng)》的詞匯語(yǔ)義相似度的計(jì)算[EB/OL]. [2015-06-15]. http://www.docin.com/ p-655858216.html. Liu Qun, Li Sujian. Lexical Semantic Similarity Computing Based on HowNet[EB/OL]. [2015-06-15]. http://www. docin.com/ p-655858216.html.
[10]柳位平,朱艷輝,栗春亮. 中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J]. 計(jì)算機(jī)應(yīng)用,2009,29(10):2875-2877. Liu Weiping,Zhu Yanhui,Li Chunliang. Research on Building Chinese Basic Semantic Lexicon[J]. Journal of Computer Applications,2009,29(10):2875-2877.
(責(zé)任編輯:申 劍)
Research on Construction of Microblog Sentiment Lexicon Based on the Smooth SO-PMI Algorithm
Du Rui,Zhu Yanhui,Tian Hailong,Liu Jing,Ma Jin
(School of Computer and Communication,Hunan University of Technology,Zhuzhou Hunan 412007,China)
Analyzed the applicability of the existing sentiment lexicon in the microblog sentiment classification. In view of low coverage of the existing sentiment lexicon, built a basic microblog sentiment lexicon by integrating the existing sentiment lexicon, and put forward a Laplacian-based smooth SO-PMI algorithm to judge emotional orientation of the words which not included in the basic sentiment lexicon, finally applied the microblog sentiment lexicon and the Laplacian smooth SO-PMI algorithm to construct the microblog sentiment lexicon, and tested the constructed lexicon classification capabilities. Experimental results showed that the constructed microblog sentiment lexicon achieved good effect inmicroblog sentiment classification.
chinese microblog;sentiment lexicon;sentiment classification;smoothing
TP391.1
A
1673-9833(2015)05-0077-05
10.3969/j.issn.1673-9833.2015.05.016
2015-07-13
國(guó)家自然科學(xué)基金資助項(xiàng)目(61170102),國(guó)家社會(huì)科學(xué)基金資助項(xiàng)目(12BYY045),湖南省教育廳重點(diǎn)項(xiàng)目基金資助項(xiàng)目(15A049),湖南工業(yè)大學(xué)研究生創(chuàng)新基金資助項(xiàng)目(CX1313)
杜 銳(1987-),男,湖北仙桃人,湖南工業(yè)大學(xué)碩士生,主要研究方向?yàn)槲谋咎幚恚珽-mail:578781015@qq.com
朱艷輝(1968-),女,湖南株洲人,湖南工業(yè)大學(xué)教授,主要從事文本分類和信息檢索方面的教學(xué)和研究,E-mail:swayhzhu@163.com