吳財貴 龔文輝 付青
摘要:話題檢測與輿情分析是網(wǎng)絡(luò)輿情監(jiān)控中的熱點(diǎn)問題,對熱點(diǎn)話題進(jìn)行檢測并對輿情預(yù)警度進(jìn)行分析將有助于輿情監(jiān)控和管理??紤]話題的周期性,建立基于時間窗口的原始指標(biāo),利用主成分分析方法得到有關(guān)綜合指標(biāo),利用兩層隱含層的BP神經(jīng)網(wǎng)絡(luò)方法建立輿情分析判別模型;利用MB-SinglePass算法對數(shù)據(jù)進(jìn)行話題檢測,并選取10個話題進(jìn)行輿情預(yù)警度判別,實(shí)現(xiàn)對微博話題的檢測與輿情分析。最后將話題檢測結(jié)果與人工標(biāo)記話題結(jié)果進(jìn)行比較分析,驗(yàn)證了話題檢測算法的正確性和有效性。同時通過與其它輿情分析判別模型進(jìn)行實(shí)驗(yàn)比較,發(fā)現(xiàn)在實(shí)驗(yàn)條件相同的情況下,該原始指標(biāo)和分析判別模型得到的輿情預(yù)警度分類結(jié)果準(zhǔn)確率更高,增加的時間成本代價也在可接受范圍內(nèi)。
關(guān)鍵詞:話題檢測; 輿情分析; BP神經(jīng)網(wǎng)絡(luò)模型; 主成分分析
DOIDOI:10.11907/rjdk.173265
中圖分類號:TP3-0
文獻(xiàn)標(biāo)識碼:A 文章編號文章編號:1672-7800(2018)008-0085-05
英文摘要Abstract:Topic detection and public opinion analysis is the hot topic in network public opinion monitoring.The analysis of hot topics and public opinions are helpful to the public opinion monitoring and management.In this paper,we consider the topic periodicity,establish the original index based on the time window appiy the principal component analysis method to get the relevant comprehensive index and use two layers of hidden layer BP neural network method to establish public opinion analysis and judgment model.The MB-Single Pass algorithm is used to detect the topic data and selecte 10 topics for public opinion and early warning judgment,and microblogging topic detection and public opinion analysis are realized.The results of the topic test and the results of artificial markers are compared and analyzed,which validates the correctness and the effectiveness of the topic detection algorithm.The experimental results show that the experimental results are in the same experimental conditions,the original indicators and the public opininon analysis form judgment model are more accurate,the additional time costs in the acceptable range.
英文關(guān)鍵詞Key Words:topic detection; public opinion analysis; BP neural network model; principal component analysis
0 引言
微博作為用戶參與、傳播式的網(wǎng)絡(luò)信息交互平臺,能夠?qū)崟r反映當(dāng)前社會的焦點(diǎn)話題與民眾輿論傾向。對焦點(diǎn)話題進(jìn)行輿論監(jiān)測,有助于輿情監(jiān)控部門進(jìn)行相應(yīng)的輿情分析。話題檢測技術(shù)是進(jìn)行輿情分析的基礎(chǔ)與前提,針對微博話題的檢測研究主要從以下3個方面進(jìn)行:①微博數(shù)據(jù)預(yù)處理;②微博數(shù)據(jù)特征選擇;③微博話題聚類算法研究。
微博數(shù)據(jù)預(yù)處理主要是對微博數(shù)據(jù)進(jìn)行分詞操作及詞性標(biāo)注,然后去除噪聲,目前使用最多的方法是中科院的ICTCLAS分詞方法[1-2]。微博數(shù)據(jù)的特征選取主要有文檔頻率、互信息和信息增益3種權(quán)值計算方式[1-3],通過計算有關(guān)特征詞的權(quán)值大小,選取權(quán)值大的前幾項作為數(shù)據(jù)特征項,從而實(shí)現(xiàn)數(shù)據(jù)特征的選取。微博話題聚類算法根據(jù)各微博話題提取的微博數(shù)據(jù)特征進(jìn)行話題聚類,從而實(shí)現(xiàn)話題檢測,常用的有增量聚類算法[1]、基于主題模型的算法[4]以及增量K-means算法[5]等。周剛等[1]對該算法進(jìn)行改進(jìn),將微博發(fā)布時間作為處理順序,從而降低了算法對處理順序的敏感度;姜曉偉等[6]針對特定主題進(jìn)行話題發(fā)現(xiàn)與排序,引入LDA主題模型實(shí)現(xiàn)詞的聚類與特定主題挖掘。
在輿情分析研究方面,姚長青等[7]提出基于主題的輿情跟蹤方法,運(yùn)用信息增益和互信息對特征項進(jìn)行權(quán)值計算,采用Bayes、K近鄰和Rocchio方法分別對給定的主題事件進(jìn)行輿情跟蹤,從而有效分析熱點(diǎn)事件的發(fā)展趨勢;李弼程等[8]采用軍事領(lǐng)域的戰(zhàn)場態(tài)勢分析與威脅估計思想對網(wǎng)絡(luò)輿情態(tài)勢分析與預(yù)警進(jìn)行研究,在提出相應(yīng)特征提取技術(shù)的同時,建立適合計算機(jī)實(shí)現(xiàn)的網(wǎng)絡(luò)輿情態(tài)勢分析模式;曾潤喜等[9]通過研究網(wǎng)絡(luò)輿情分級預(yù)警機(jī)制,構(gòu)建出基于警源、警兆和警情3類指標(biāo)的體系模型;孫玲芳等[10]建立3級指標(biāo)體系,分別從輿情危險度、輿情擴(kuò)散度和輿情熱度3個維度對事件進(jìn)行考慮,提出基于云模型的網(wǎng)絡(luò)突發(fā)群體事件輿情危機(jī)預(yù)警方法;陳新杰等[11]通過傳播擴(kuò)散、發(fā)布主體、內(nèi)容要素和輿情受眾4個指標(biāo)監(jiān)測網(wǎng)絡(luò)輿情發(fā)展演變過程。
本文基于饒浩等[12]提出的方法進(jìn)行改進(jìn),根據(jù)話題的周期性特點(diǎn),引入基于時間窗口的原始指標(biāo),提出基于主成分分析和兩層隱含層BP神經(jīng)網(wǎng)絡(luò)模型的微博話題輿情分析方法。首先對微博數(shù)據(jù)進(jìn)行話題檢測,然后利用主成分分析方法對選取的指標(biāo)參數(shù)進(jìn)行主成分提取,將提取的主成分作為BP神經(jīng)網(wǎng)絡(luò)輸入層,根據(jù)該模型進(jìn)行話題輿情預(yù)警度學(xué)習(xí)分類,從而實(shí)現(xiàn)在線話題的輿情預(yù)警度判別。
1 話題檢測算法
1.1 數(shù)據(jù)采集與預(yù)處理
本文通過新浪微博提供的API接口對其平臺上的數(shù)據(jù)進(jìn)行采集,利用中科院的分詞系統(tǒng)ICTCLAS對獲取的微博數(shù)據(jù)進(jìn)行分詞及詞性標(biāo)注。數(shù)據(jù)預(yù)處理目的是去除微博數(shù)據(jù)中的噪聲信息,本文根據(jù)微博數(shù)據(jù)特點(diǎn),利用分詞得到的有關(guān)詞性將其中的URL、表情符號、標(biāo)點(diǎn)符號等噪聲剔除。同時,為了降低特征向量維度,本文根據(jù)停用詞庫剔除數(shù)據(jù)中的停用詞。所得結(jié)果如圖1所示。
1.2 話題檢測
為了更好地描述話題間的相似度,選用文獻(xiàn)[1]使用的組合相似度計算方法和主題模型更新策略。在相似度計算方面,選用語義相似度、雅可比相似度和余弦相似度組合計算的方法,如式(1)所示。
話題檢測算法主要沿用文獻(xiàn)[1]中的方法,具體流程如下:①數(shù)據(jù)采集及預(yù)處理。對微博數(shù)據(jù)進(jìn)行采集、分詞、去停用詞和有關(guān)詞項的信息增益權(quán)重計算等預(yù)處理操作;②話題主題模型建立。根據(jù)預(yù)處理和有關(guān)權(quán)重組成話題主題向量;③使用MB-SinglePass算法對話題主題向量進(jìn)行話題聚類。若是第一條話題數(shù)據(jù),則將其設(shè)為新話題類,否則進(jìn)入下一步;④若后面話題與某一話題類別中的話題是轉(zhuǎn)發(fā)和評論關(guān)系,或其最大相似度大于MB-SinglePass算法設(shè)定的聚類閾值,則將其歸為一類并更新話題向量,進(jìn)入第⑥步,否則進(jìn)行第⑤步;⑤若最大相似度值小于MB-SinglePass算法中的創(chuàng)新閾值,則將其設(shè)為一個新話題類別,否則將其歸為同一話題類別。同時判斷該測試話題與最大相似度話題之間是否具有好友或粉絲關(guān)系,若是,則更新話題向量,否則不更新;⑥判斷是否是最后一條話題數(shù)據(jù),若不是,進(jìn)入第③步,否則結(jié)束該算法流程。
通過上述流程實(shí)現(xiàn)話題聚類,然后對每個類別中的話題特征向量進(jìn)行特征項重復(fù)次數(shù)計算,并按降序排列,最后選取前10個特征項作為話題主題描述向量。
2 主成分分析與BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)模型分為信息的正向傳播子過程和誤差的反向傳播子過程兩部分,具有3個層次結(jié)構(gòu),分別為輸入層、隱含層和輸出層。輸入層將有關(guān)特征參數(shù)作為輸入節(jié)點(diǎn)分布于輸入層上;隱含層主要將輸入層的數(shù)據(jù)信息進(jìn)行變換,其層數(shù)選取和節(jié)點(diǎn)數(shù)目可自主設(shè)定,但考慮各隱含層節(jié)點(diǎn)數(shù)目對BP神經(jīng)網(wǎng)絡(luò)模型性能的影響,可根據(jù)公式(2)對節(jié)點(diǎn)個數(shù)進(jìn)行調(diào)節(jié);輸出層接收隱含層傳遞的信息,并完成一次正向傳播子過程。誤差的反向傳播子過程是當(dāng)上述操作的輸出層結(jié)果與期望輸出結(jié)果不一致時,根據(jù)誤差函數(shù)(見式(3))計算誤差,然后利用梯度下降法按照輸出層-隱含層-輸入層反向傳播順序,對其各層次間的權(quán)值進(jìn)行更新。上述兩個子過程反復(fù)、交替進(jìn)行,直至其輸出誤差降低至可接受的閾值范圍內(nèi),或其學(xué)習(xí)過程達(dá)到預(yù)期設(shè)定的學(xué)習(xí)次數(shù)。
考慮微博網(wǎng)絡(luò)輿情預(yù)判指標(biāo)間可能存在的相關(guān)性,本文采用以下兩種方式進(jìn)行處理:①根據(jù)主成分分析方法消除指標(biāo)間存在的相關(guān)性;②根據(jù)原始指標(biāo)間的相關(guān)性,利用其組合形成的線性表達(dá)函數(shù)得到綜合指標(biāo)。
本文利用主成分分析方法構(gòu)建指標(biāo)參數(shù)體系,選取特征值大于1且原始指標(biāo)中大多數(shù)信息可被解釋的若干個綜合指標(biāo)替代原始指標(biāo),從而減少指標(biāo)數(shù)量并去除原始數(shù)據(jù)中的冗余信息,使數(shù)據(jù)更具代表性。將該綜合指標(biāo)作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入層節(jié)點(diǎn)數(shù)據(jù),通過信息的正向傳播子過程和誤差反向傳播子過程反復(fù)、交替進(jìn)行,得到有關(guān)輸出層結(jié)果,實(shí)現(xiàn)話題等級分類。建立的BP神經(jīng)網(wǎng)絡(luò)模型如圖2所示。
3 實(shí)驗(yàn)及結(jié)果分析
本文通過新浪微博API提供的C#接口,對其微博數(shù)據(jù)進(jìn)行采集,包括用戶名、用戶ID、微博數(shù)據(jù)內(nèi)容、源微博ID、地點(diǎn)信息、相關(guān)微博評論信息等。本文實(shí)驗(yàn)選用2016年10月24日、25日、26日、29日和30日5天的微博數(shù)據(jù),對其中的140 202條數(shù)據(jù)進(jìn)行人工標(biāo)注(其中每日數(shù)據(jù)量分別為18 000、25 000、30 700、29 000、37 502條),對標(biāo)注結(jié)果進(jìn)行評價及分析。
本文沿用文獻(xiàn)[1]的話題組合相似度的加權(quán)系數(shù)值,即(α,β,γ)=(0.3,0.3,0.4)。
本文開發(fā)環(huán)境選用VS2012,采用C#語言進(jìn)行數(shù)據(jù)獲取及C++語言進(jìn)行數(shù)據(jù)處理與分析。
3.1 微博話題檢測結(jié)果分析
本文采用文獻(xiàn)[1]的方法對采集到的數(shù)據(jù)進(jìn)行話題檢測,話題聚類結(jié)果如圖3所示。
由圖3可得實(shí)驗(yàn)話題聚類結(jié)果與人工標(biāo)記的話題聚類結(jié)果基本一致,僅存在較小差異。差異形成的部分原因是由于微博數(shù)據(jù)中存在類似“分享圖片”的無效微博,但在一定程度上不影響最終話題檢測結(jié)果。
話題聚類完成后,對該類話題進(jìn)行主題描述,將描述結(jié)果與人工提取話題進(jìn)行比較分析,如表1所示。
由表1可知微博話題描述結(jié)果與人工對微博話題描述結(jié)果基本一致,并發(fā)現(xiàn)其與對應(yīng)話題的微博內(nèi)容高度相似,說明本文方法能有效地對聚類的微博數(shù)據(jù)進(jìn)行描述。
另外為測試本文使用方法的性能,選用采集到的2016年10月24日微博話題數(shù)據(jù)進(jìn)行準(zhǔn)確率P、召回率R及F值比較(見式(4)),結(jié)果如圖4所示。
其中,c為正確識別的熱點(diǎn)話題數(shù),o為識別的熱點(diǎn)話題數(shù),l為人工標(biāo)記的該段時間內(nèi)熱點(diǎn)話題數(shù)。
從圖4中可以看出,MB-SinglePass算法可得到較為滿意的結(jié)果,充分證明了算法的正確性和有效性。
3.2 主成分分析與BP神經(jīng)網(wǎng)絡(luò)模型應(yīng)用
3.2.1 話題集選取方式
目前,由于沒有輿情預(yù)警度評價標(biāo)準(zhǔn)庫,本文依照文獻(xiàn)[12]的訓(xùn)練樣本和測試樣本選取方式,以驗(yàn)證說明本文所使用指標(biāo)和模型的有效性。具體說明如下:根據(jù)新浪微博提供的2013年年度及各月份熱門話題進(jìn)行數(shù)據(jù)采集,將2013年年度熱門微博話題視為輿情預(yù)警度最嚴(yán)重的I級,各月份微博熱門話題排名在前的視為II級,排名在中間的視為III級,余下視為IV級,將以上數(shù)據(jù)作為訓(xùn)練樣本集,如表2所示。同理將2014年的有關(guān)話題作為測試樣本集,如表3所示。
3.2.2 話題數(shù)據(jù)主成分分析及BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
本文將用戶粉絲數(shù)followers_cont、用戶關(guān)注數(shù)friends_count、用戶微博數(shù)statuses_count、T1~T4共4個時間窗口下微博內(nèi)容評論數(shù)comments_count_t1、comments_count_t2、comments_count_t3、comments_count_t4,微博內(nèi)容轉(zhuǎn)發(fā)數(shù)reposts_count_t1、reposts_count_t2、reposts_count_t3、reposts_count_t4及評論速率hot_t1、hot_t2、hot_t3、hot_t4和轉(zhuǎn)發(fā)速率hotSpread_t1、hotSpread_t2、hotSpread_t3、hotSpread_t4共19個參數(shù)作為微博熱度評價的原始指標(biāo),其中本文4個時間窗口大小固定,都為12個小時,即T1=T2=T3=T4=12。對上述19個原始指標(biāo)進(jìn)行主成分分析,得到9個不相關(guān)的綜合指標(biāo)X1、X2、X3、X4、X5、X6、X7、X8、X9,其包含了原始指標(biāo)中91.591%的信息(見圖5),從而實(shí)現(xiàn)在盡量不損失信息的情況下,消除原始指標(biāo)間的相關(guān)性并降低復(fù)雜度。
對19個原始指標(biāo)進(jìn)行線性組合,獲得各綜合指標(biāo)相關(guān)系數(shù)如圖6所示。
將得到的9個綜合指標(biāo)作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入層節(jié)點(diǎn)數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建。
3.2.3 輿情預(yù)警度分類結(jié)果分析
通過已建立的BP神經(jīng)網(wǎng)絡(luò)模型對2013年各級訓(xùn)練樣本集進(jìn)行BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí),然后對2014年各級測試樣本集進(jìn)行分類得出分類結(jié)果。通過與文獻(xiàn)[12]進(jìn)行1~4級準(zhǔn)確率的比較,結(jié)果分析如表4所示。
為了對本文采用的綜合指標(biāo)進(jìn)行結(jié)果驗(yàn)證分析,采用的訓(xùn)練樣本集和測試樣本集與文獻(xiàn)[12]相同,結(jié)果分析指標(biāo)也相同。
從表4中可得出以下結(jié)論:與文獻(xiàn)[12]采用的綜合指標(biāo)相比,當(dāng)BP神經(jīng)網(wǎng)絡(luò)隱含層都選用單層且訓(xùn)練迭代次數(shù)同為297次時,本文方法訓(xùn)練所花時間略低于文獻(xiàn)[12]方法,最終錯誤率都保證在e-05級別上,差異可忽略不計。在分類結(jié)果準(zhǔn)確率上,本文所采用的綜合指標(biāo)得到的結(jié)果要優(yōu)于文獻(xiàn)[12],充分說明考慮話題周期性特點(diǎn)、基于時間窗口的指標(biāo)參數(shù)選取優(yōu)于文獻(xiàn)[12]提供的指標(biāo)參數(shù);與只選用單層隱含層的BP神經(jīng)網(wǎng)絡(luò)相比,采用兩層和三層隱含層的BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練迭代次數(shù)一致時,其最終錯誤率同樣可忽略不計;采用兩層隱含層較之單層隱含層,訓(xùn)練所花時間增加了0.274s,三層隱含層則增加了0.528s,這是采用多層隱含層需要付出的時間成本代價;使用兩層和三層隱含層的BP神經(jīng)網(wǎng)絡(luò)在各級準(zhǔn)確率方面都得到了較大提高,在一定程度上降低了輿情預(yù)警度誤差等級,保證了輿情預(yù)警度的準(zhǔn)確率;采用三層隱含層的BP神經(jīng)網(wǎng)絡(luò)較之兩層隱含層的BP神經(jīng)網(wǎng)絡(luò),其性能指標(biāo)并未得到有效改變,反而增加了一定時間成本,說明采用兩層隱含層的BP神經(jīng)網(wǎng)絡(luò)已達(dá)到最佳效果。
綜上分析可知,本文采用指標(biāo)較之文獻(xiàn)[12]采用指標(biāo)能夠更好地進(jìn)行話題輿情分析。同時將BP神經(jīng)網(wǎng)絡(luò)的隱含層設(shè)置為兩層時將得到最佳的分類效果,且增加的時間成本是可接受的。
3.3 微博話題輿情分析
本文利用上述BP神經(jīng)網(wǎng)絡(luò)模型對話題數(shù)最多的前10個話題進(jìn)行輿情預(yù)警度分類,選取各話題聚類結(jié)果中最靠前的話題進(jìn)行原始指標(biāo)數(shù)據(jù)采集,得出相應(yīng)綜合指標(biāo),以此作為已訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)閾值,通過測試得出其對應(yīng)的輿情預(yù)警度,結(jié)果如表5所示。
由表5可得,對MB-SinglePass話題檢測算法得到的前10個話題進(jìn)行輿情預(yù)警度分類,得出2個I級和II級,以及3個III級和IV級預(yù)警度話題。通過上述分類結(jié)果,可進(jìn)行話題輿情預(yù)警度監(jiān)控,重點(diǎn)關(guān)注輿情預(yù)警度達(dá)到III級及以上級別的話題走向,從而在話題輿情分析和管理方面發(fā)揮指導(dǎo)性作用。
4 結(jié)語
本文主要研究微博話題輿情分析模型的原始指標(biāo)選取,通過對選取的19個原始指標(biāo)進(jìn)行主成分分析得到綜合指標(biāo),建立兩層隱含層的BP神經(jīng)網(wǎng)絡(luò)模型,用于微博話題的輿情分析與判別。通過實(shí)驗(yàn)結(jié)果分析得出,本文選用的原始指標(biāo)及所構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)模型較之文獻(xiàn)[12]在輿情預(yù)警度與準(zhǔn)確度方面有較大提高。同時采用MB-SinglePass話題檢測算法進(jìn)行微博話題檢測,運(yùn)用建立的輿情分析判別模型對檢測出的話題進(jìn)行輿情預(yù)警度判別,實(shí)現(xiàn)在線微博話題的輿情分析,為輿情監(jiān)控部門等相關(guān)機(jī)構(gòu)的話題輿情監(jiān)控提供有效依據(jù)。
由于本文采集數(shù)據(jù)使用的新浪微博API接口限制,在進(jìn)行數(shù)據(jù)采集時存在一定困難,因而在進(jìn)行原始指標(biāo)選取時不得不考慮數(shù)據(jù)獲取難度等問題。同時BP神經(jīng)網(wǎng)絡(luò)本身存在的一些缺點(diǎn)和局限性,在一定程度上也影響了話題預(yù)警度的分類精度。因此,后期將致力于研究學(xué)習(xí)分類模型以及相關(guān)原始指標(biāo)選取問題,旨在進(jìn)一步提高話題輿情度的分類精度,同時研究話題變化趨勢與時間周期的相關(guān)性,以實(shí)現(xiàn)對話題的趨勢分析。
參考文獻(xiàn):
[1] 周剛,鄒鴻程,熊小兵,等.MB-SinglePass:基于組合相似度的微博話題檢測[J].計算機(jī)科學(xué),2012(10):198-202.
[2] WU P,LI S K.Social network analysis layout algorithm under ontology model[J].Journal of Software,2011,6 (7):1321-1328.
[3] LIU H.Internet public opinion hotspot detection and analysis based on K-means and SVM algorithm[C].Proc of International Conference on Information Science and Management Engineering,2010:257-261.
[4] PENNACCHIOTTI M,GURUMURTHY S.Investigating topic models for social media user recommendation[C].Proc of the 20th Int Conf Companion on World Wide Web.New York:ACM,2011:101-102.
[5] 李勝東,呂學(xué)強(qiáng),施水才,等.基于話題檢測的自適應(yīng)增量K-means算法[J].中文信息學(xué)報,2014(6):190-193.
[6] 姜曉偉,王建民,丁貴廣.基于主題模型的微博重要話題發(fā)現(xiàn)與排序方法[J].計算機(jī)研究與發(fā)展,2013(S1):179-185.
[7] 姚長青,杜永萍.基于主題的輿情跟蹤方法研究及性能評價[J].圖書情報工作,2012(18):50-53,109.
[8] 李弼程,林琛,周杰,等.網(wǎng)絡(luò)輿情態(tài)勢分析模式研究[J].情報科學(xué),2010(7):1083-1088.
[9] 曾潤喜.網(wǎng)絡(luò)輿情突發(fā)事件預(yù)警指標(biāo)體系構(gòu)建[J].情報理論與實(shí)踐,2010(1):77-80.
[10] 孫玲芳,林偉健.基于云模型的網(wǎng)絡(luò)突發(fā)群體事件預(yù)警方法的研究[J].計算機(jī)與現(xiàn)代化,2016(5):61-66,72.
[11] 陳新杰,呼雨,蘭月新.網(wǎng)絡(luò)輿情監(jiān)測指標(biāo)體系構(gòu)建研究[J].現(xiàn)代情報,2012(5):4-7,20.
[12] 饒浩,陳海媚.主成分分析與BP神經(jīng)網(wǎng)絡(luò)在微博輿情預(yù)判中的應(yīng)用[J].現(xiàn)代情報,2016(7):58-62,70.
(責(zé)任編輯:黃 ?。?/p>