• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)的設(shè)計

      2020-04-08 09:30粱藝瓊
      電腦知識與技術(shù) 2020年3期
      關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)設(shè)計

      粱藝瓊

      摘要:針對輿情分析系統(tǒng)而言,其對提升學(xué)校管理水平有著很大的意義和作用。當前,隨著的信息化技術(shù)發(fā)展水平的不斷提升,網(wǎng)絡(luò)技術(shù)的發(fā)展也變得越來越穩(wěn)定。在這種背景下,本文即對基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)的設(shè)計進行了簡單的研究和分析,希望可以為相關(guān)人員提供一定的幫助。

      關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);輿情分析系統(tǒng);設(shè)計

      中圖分類號:TP393 文獻標識碼:A

      文章編號:1009-3044(2020)03-0001-02

      現(xiàn)階段,隨著信息技術(shù)發(fā)展速度的不斷加快,計算機網(wǎng)絡(luò)已經(jīng)逐漸與人們的生活以及工作結(jié)合在了一起,其為人們帶來一定便利的同時,也為學(xué)校管理工作的開展帶來了很多挑戰(zhàn)。并且,由于經(jīng)濟全球化進程推進速度的不斷加快,信息的傳播速度也日益提升,很多關(guān)乎切身利益以及社會熱點問題使得越來越多的人在網(wǎng)上展開討論,從而形成了網(wǎng)絡(luò)輿論。如果不能及時地進行干預(yù),那么就非常容易出現(xiàn)群體事件。因此,為了可以為學(xué)生營造一個良好的學(xué)習環(huán)境,在今后的發(fā)展過程中,應(yīng)該強化對數(shù)據(jù)挖掘技術(shù)的應(yīng)用,合理的對輿情分析系統(tǒng)進行設(shè)計。

      1 基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)設(shè)計的必要性分析

      針對網(wǎng)絡(luò)輿情監(jiān)控平臺來說,其主要的作用就是針對海量數(shù)據(jù),科學(xué)的對網(wǎng)絡(luò)輿情進行研究和分析。在實際的發(fā)展過程中,隨著信息技術(shù)發(fā)展速度的不斷提升,網(wǎng)絡(luò)輿情分析也逐漸成了數(shù)據(jù)挖掘的重點內(nèi)。并且,合理的開展網(wǎng)絡(luò)輿情分析,其主要的目的就是對海量數(shù)據(jù)信息進行深入挖掘,有效地將隱藏在數(shù)據(jù)背后的輿情觀點分析出來[1]。針對這一環(huán)節(jié)而言,其核心技術(shù)具體涵蓋數(shù)據(jù)采集以及主體跟蹤等。

      針對文本分類來說,主要的側(cè)重點就是中文的文本分類。近年來,由于研究進程的不斷深入,在文本分類領(lǐng)域,應(yīng)用的先進方法也變得越來越多,包括:KNN算法以及決策樹算法等。

      一般情況下,文本聚類的主要目標就是依照文本的相似程度,有效且精準地對文本進行聚合[2]。同時,現(xiàn)階段,文本聚類屬于一種無監(jiān)督的機器學(xué)習方法,在應(yīng)用過程中,人們不需要訓(xùn)練過程,也不用事先對文檔進行標注,其靈活性非常高,自身的自動處理能力也相對較強。因此,隨著技術(shù)的不斷發(fā)展,其也逐漸成了組織文本信息以及摘要的關(guān)鍵方法。通常而言,文本聚類具有很多的算法,包括:劃分法以及層次法等。其中,針對劃分法來說,其所涵蓋的K-Means算法,無論是在實現(xiàn)難度,還是在計算速度方面,其都有著十分不錯的表現(xiàn),非常適合應(yīng)用在挖掘大數(shù)據(jù)集中[3]。

      對于主題跟蹤來說,其主要的目的就是對用戶所感興趣的主題進行跟蹤,在眾多其海量的數(shù)據(jù)信息中,找到屬于該主題的內(nèi)容。在主題跟蹤中,無論是訓(xùn)練與分類的算法,還是訓(xùn)練的樣本數(shù),都會在一定程度上對跟蹤的質(zhì)量造成非常嚴重的影響。同樣,與文本分類較為相同的是,KNN算法以及決策樹算法等都能夠在數(shù)據(jù)的挖掘中發(fā)揮著非常重要的作用和價值。

      現(xiàn)階段,由于社會核心技術(shù)水平提升速度的不斷加快,網(wǎng)絡(luò)輿情監(jiān)控也得到了前所未有的發(fā)展。尤其是進入21世紀以來,無論是國內(nèi),還是國外,都在強化對可以應(yīng)用實際場景的商業(yè)平臺的研究。但是,針對中職學(xué)校來說,由于其網(wǎng)絡(luò)輿情具有較強的特殊性,而這一情況的存在,也使得一些比較成熟的商用系統(tǒng)不能更好地在學(xué)校中應(yīng)用,其自身的價值以及作用也不能更好地發(fā)揮出來。綜合而言,在學(xué)校的實際發(fā)展過程中,為了可以為學(xué)生營造一個良好的輿情環(huán)境,在今后的發(fā)展過程中,必須結(jié)合實際情況,加大基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)設(shè)計力度,保證學(xué)校管理工作的開展可以更加有序和順利[4]。

      2 基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)的設(shè)計分析

      2.1 輿情分析系統(tǒng)的設(shè)計思路

      在對基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)進行具體的設(shè)計過程中,本系統(tǒng)強化了對數(shù)據(jù)挖掘技術(shù)以及智能處理技術(shù)等的應(yīng)用,實現(xiàn)了多種技術(shù)的有效融合。

      在具體的系統(tǒng)設(shè)計期間,首先應(yīng)該對數(shù)據(jù)來源進行明確,校園網(wǎng)的建立,當前已經(jīng)成為中職學(xué)校的信息陣地,與其他的網(wǎng)站不同,校園網(wǎng)站自身所包含的內(nèi)容具有較強的多樣性,內(nèi)容涵蓋的方面非常多,甚至隨著信息技術(shù)水平的不斷提升,越來越多的中職學(xué)校也紛紛建立了學(xué)生互動交流平臺,學(xué)生可以通過這一平臺,互相認識,自由的自身觀點進行發(fā)布,也可以提出對學(xué)習管理的建議等[5]。

      信息預(yù)處理模塊:對于這一模塊,其主要涵蓋了網(wǎng)頁凈化以及中文分詞等。

      輿情分析模塊:這一模塊主要包含了話題評等。并且各個模塊是可以獨立存在的。

      2.2 基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)的總體設(shè)計分析

      在具體的輿情分析系統(tǒng)設(shè)計工作進行和開展過程中,其主要是針對學(xué)校輿情做出管理預(yù)警,科學(xué)應(yīng)用現(xiàn)代化先進手段和技術(shù),有效且合理的對系統(tǒng)設(shè)計工作進行完成。因為中職學(xué)校輿情的特殊性不同于其他網(wǎng)站,所以,在系統(tǒng)設(shè)計階段,應(yīng)該綜合考量[6]。

      第一,對數(shù)據(jù)來源進行明確。一般情況下,在中職學(xué)校的實際發(fā)展過程中,其網(wǎng)絡(luò)輿情的表現(xiàn)具有較強的多元化,針對同一個問題,或者不同的領(lǐng)域的問題,其都會存在不同的態(tài)度以及看法。同時,由于網(wǎng)絡(luò)空間的自由性,其也為學(xué)生提供了很多自由發(fā)表自身意見的平臺。所以,在實際的系統(tǒng)設(shè)計階段,針對學(xué)校存在的突發(fā)事件等,都會在一定程度上引發(fā)學(xué)生們的討論。故而,針對這一情況,學(xué)校應(yīng)該將社會熱點論壇等作為信息來源,以便可以有效對學(xué)校于輿情進行管理和區(qū)分。

      第二,信息采集以及網(wǎng)頁預(yù)處理。針對網(wǎng)頁預(yù)處理,其主要的目的就是可以有效地對信息資源進行收集,同時利用網(wǎng)頁的分析采集,科學(xué)的將時間以及發(fā)帖人等信息精準的進行提取。而針對信息采集,其具體的作用就是對網(wǎng)絡(luò)爬蟲等工具進行應(yīng)用,并讓其作為信息采集模塊,以便可以從指定的網(wǎng)站上獲取信息到本地,最后對相關(guān)數(shù)據(jù)進行更新[7]。

      第三,輿情分析。所謂的輿情分析,具體就是指網(wǎng)絡(luò)輿情管理的核心,同時也是較為煩瑣的一個環(huán)節(jié)。主要對信息進行分類識別的前提下,有效跟蹤和記錄。

      第四,輿情管理。依照上述輿情分析的最終結(jié)果,在對實際情況進行了解以及明確的前提下,對進行科學(xué)且有效的劃分,合理地進行操作。如下為輿情分析系統(tǒng)總體設(shè)計模塊圖。

      2.3 輿情分析系統(tǒng)的功能模塊設(shè)計

      第一,信息采集模塊。在實際的輿情分析系統(tǒng)中,針對信息采集來說,其是非常關(guān)鍵的一部分內(nèi)容,可以達到對指定論壇網(wǎng)絡(luò)信息和相應(yīng)的學(xué)校社區(qū)的數(shù)據(jù)進行采集的目的,也可以對這些信息進行有效的存儲,以保證后續(xù)的數(shù)據(jù)篩選工作可以有序進行。通常情況下,在這一模塊中,比較長應(yīng)用的工具為網(wǎng)絡(luò)爬蟲等,設(shè)定初始化種子樣本,并通過解析,在IP地址下載相對應(yīng)的網(wǎng)頁,同時對已經(jīng)獲得的網(wǎng)頁進行超鏈研究,盡可能多的將結(jié)構(gòu)等信息的分析出來,從而更加精準的對網(wǎng)頁內(nèi)容是否重復(fù)進行檢查和判斷,最后將網(wǎng)頁采集后,合理地將數(shù)據(jù)存儲到數(shù)據(jù)庫中。

      第二,信息預(yù)處理模塊。針對這一模塊來說,具體涵蓋內(nèi)容如圖2所示。

      第三,輿情分析模塊。針對這一模塊,具體涵蓋了話題識別模塊等。其中,話題識別模塊:新話題的實現(xiàn)應(yīng)用了改進后的Single-Pass聚類算法,多中心的表現(xiàn)形式可以而更加直觀地將輿情話題的動態(tài)變化展現(xiàn)出來。話題跟蹤模塊具體包含了構(gòu)造分類模型,模型評估及文章分類模塊。在具體的設(shè)計階段,先對分類模型進行科學(xué)的構(gòu)建,在結(jié)合具體情況,合理的評估分類模型,在依照模型,對文章的相似度進行精準的計算,最終對其類別進行明確。

      第四,輿情管理模塊。這一模塊是系統(tǒng)的最后一個環(huán)節(jié),其包含了用戶管理以及權(quán)限管理等。其中,針對用戶管理,具體是指在系統(tǒng)中,設(shè)計用戶登錄以及退出等模塊,并有效地進行增加和刪減操作,科學(xué)的設(shè)置用戶信息。對于權(quán)限管理,主要是在系統(tǒng)的實際應(yīng)用期間,由于角色的差異,其權(quán)限也會存在很大差別,在操作過程中,需要對角色進行授權(quán)認證等。

      3 結(jié)束語

      在具體的教學(xué)工作進行和開展過程中,為了可以最大限度地降低網(wǎng)絡(luò)輿情問題出現(xiàn)幾率,科學(xué)對面臨的困境進行規(guī)避,學(xué)校在各項工作進行階段,應(yīng)該強化對數(shù)據(jù)挖掘技術(shù)的應(yīng)用,設(shè)計并實現(xiàn)一個基于數(shù)據(jù)挖掘技術(shù)的輿情分析系統(tǒng)。并且,通過對分布式文件系統(tǒng)存儲數(shù)據(jù)的合理應(yīng)用,同時將云計算技術(shù)進行科學(xué)的結(jié)合,有效提升系統(tǒng)執(zhí)行的穩(wěn)定性以及效率。此外,通過話題發(fā)現(xiàn)以及輿情分析跟蹤,可以在第一時間對網(wǎng)絡(luò)輿情進行監(jiān)控,正確地進行引導(dǎo),保證中職學(xué)校學(xué)生管理工作可以順利且有效地進行和開展。

      參考文獻:

      [1]陳紀銘,卜曉.基于數(shù)據(jù)挖掘的城市旅游輿情分析系統(tǒng)設(shè)計與實現(xiàn)[J].電子技術(shù)與軟件工程,2019(8):174-175.

      [2]余宏.大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)輿情分析在企業(yè)管理中的應(yīng)用研究[J]現(xiàn)代計算機:專業(yè)版,2018(32):62-66.

      [3]徐明波,王群.我國“中考加分”問題的網(wǎng)絡(luò)輿情分析——基于五大綜合類門戶網(wǎng)站的研究[J].湖北師范大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2018,38(5):124-129.

      [4]吳欣怡,湯靜.新時代網(wǎng)絡(luò)輿情的大數(shù)據(jù)技術(shù)應(yīng)用與研究[J].計算機產(chǎn)品與流通,2018(9):81.

      [5]王若宇.大數(shù)據(jù)下的網(wǎng)絡(luò)輿情分析研究——評《網(wǎng)絡(luò)輿情分析技術(shù)》[J].新聞戰(zhàn)線,2018(16):177.

      [6]陳藝卓,基于數(shù)據(jù)挖掘的高校網(wǎng)絡(luò)輿情分析系統(tǒng)設(shè)計與實現(xiàn)[J].電子技術(shù)與軟件工程,2016(23):189.

      [7]袁鍵,田宏林,張濤.互聯(lián)網(wǎng)輿情搜索分析系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機與數(shù)字工程,2012,40(1):93-96.

      猜你喜歡
      數(shù)據(jù)挖掘技術(shù)設(shè)計
      何為設(shè)計的守護之道?
      瞞天過?!律O(shè)計萌到家
      設(shè)計秀
      有種設(shè)計叫而專
      數(shù)據(jù)挖掘技術(shù)及其在醫(yī)學(xué)信息領(lǐng)域的應(yīng)用
      設(shè)計之味
      乳山市| 浦北县| 蒙阴县| 沽源县| 洛川县| 崇仁县| 静安区| 凤庆县| 满洲里市| 宜都市| 吴江市| 老河口市| 旬邑县| 永年县| 济南市| 黄平县| 天祝| 松滋市| 泸定县| 宁晋县| 霍城县| 东城区| 绥滨县| 漳平市| 南乐县| 遂溪县| 修文县| 绵竹市| 灵山县| 绥中县| 灌云县| 闸北区| 泊头市| 五峰| 都兰县| 陆良县| 新野县| 宁国市| 竹北市| 田林县| 舒兰市|