• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于隨機(jī)森林和Apriori 的心理問題預(yù)測技術(shù)研究

      2022-12-01 06:00:52劉俠賈妮
      電子設(shè)計(jì)工程 2022年23期
      關(guān)鍵詞:項(xiàng)集數(shù)據(jù)挖掘森林

      劉俠,賈妮

      (陜西中醫(yī)藥大學(xué),陜西 咸陽 712000)

      隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,人們生活質(zhì)量提高的同時(shí),所面對(duì)的壓力也隨之增加。高校生由于就業(yè)、學(xué)習(xí)、情感等方面的影響,心理壓力也存在逐年上升的趨勢[1]。因此,學(xué)校和家長除了關(guān)注學(xué)生的教育外,還應(yīng)當(dāng)關(guān)注其心理健康狀態(tài),及時(shí)發(fā)現(xiàn)問題,并提前做好預(yù)防措施。根據(jù)當(dāng)前的相關(guān)研究來看,有些青年學(xué)生由于從小受到的挫折較少,所以當(dāng)其面對(duì)較大壓力或挫折時(shí),較容易產(chǎn)生負(fù)面情緒。同時(shí),這類人群從主觀上又抵制通過與人交流來緩解情緒,從而造成了一定程度的心理問題[2-4]。但目前對(duì)心理問題的智能化分析研究仍相對(duì)較少,而已有的算法也或多或少存在效率和準(zhǔn)確率不足等問題?;谏鲜霈F(xiàn)象,亟需建立一套完整的心理問題預(yù)測方法,從而對(duì)高校生心理狀態(tài)進(jìn)行有效的監(jiān)測與防控。

      為此,該文將人工智能與數(shù)據(jù)分析領(lǐng)域的數(shù)據(jù)挖掘算法引入到心理問題研究中,提出了基于隨機(jī)森林?jǐn)?shù)據(jù)挖掘算法的心理問題預(yù)測方法。該方法通過對(duì)數(shù)據(jù)庫中的原始數(shù)據(jù)進(jìn)行選擇、預(yù)處理、深度挖掘等操作,實(shí)現(xiàn)對(duì)知識(shí)的挖掘。同時(shí),還能將挖掘出的知識(shí)通過可視化界面進(jìn)行展示。最后三項(xiàng)實(shí)驗(yàn)結(jié)果驗(yàn)證了該文方法的有效性與可靠性,為有效監(jiān)測學(xué)生心理健康狀態(tài),并及時(shí)采取對(duì)應(yīng)措施提供了重要參考。

      1 數(shù)據(jù)挖掘

      1.1 基本原理

      數(shù)據(jù)挖掘(Data Mining,DM)是一種融合計(jì)算機(jī)學(xué)、人工智能、數(shù)據(jù)庫等多種學(xué)科的數(shù)據(jù)處理技術(shù),其是數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(KDD)的重要環(huán)節(jié)[5-6]。具體是指從海量的、未處理的、模糊的應(yīng)用數(shù)據(jù)中,獲取隱藏在數(shù)據(jù)深層、人們之前不了解但是又具有研究意義的信息與知識(shí)的過程,這些信息包括趨勢、特征、規(guī)則以及相關(guān)性等。與傳統(tǒng)數(shù)據(jù)分析不同,數(shù)據(jù)挖掘所得出的結(jié)果不依賴于任何的假設(shè),其能夠較大程度地避免主觀因素的影響,從而保證結(jié)果的客觀性與準(zhǔn)確性。

      一個(gè)典型的數(shù)據(jù)挖掘系統(tǒng)通常由數(shù)據(jù)源層、數(shù)據(jù)挖掘?qū)右约叭藱C(jī)交互層三部分組成[7-9],具體如圖1 所示。

      圖1 數(shù)據(jù)挖掘系統(tǒng)組成

      其中,數(shù)據(jù)源層在功能上可以分為兩部分:

      1)數(shù)據(jù)庫、數(shù)據(jù)倉庫以及一些其他的數(shù)據(jù)存儲(chǔ)器。其功能是存儲(chǔ)通過各種方式獲取到的信息數(shù)據(jù)。數(shù)據(jù)倉庫與數(shù)據(jù)庫所存儲(chǔ)的數(shù)據(jù)有所差異,區(qū)別主要在于數(shù)據(jù)庫中存儲(chǔ)的是未經(jīng)過任何處理的原始數(shù)據(jù);而數(shù)據(jù)倉庫中則是包含一些為了滿足實(shí)際數(shù)據(jù)分析而對(duì)原始數(shù)據(jù)進(jìn)行簡單處理后所得到的數(shù)據(jù)[10]。

      2)數(shù)據(jù)(倉)庫服務(wù)器。其主要功能是根據(jù)用戶的個(gè)性化數(shù)據(jù)挖掘請(qǐng)求在數(shù)據(jù)庫等數(shù)據(jù)存儲(chǔ)器中調(diào)取符合要求的數(shù)據(jù)。

      數(shù)據(jù)挖掘?qū)邮钦麄€(gè)系統(tǒng)的關(guān)鍵層,負(fù)責(zé)接收和處理用戶請(qǐng)求,同時(shí)反饋?zhàn)罱K的數(shù)據(jù)挖掘結(jié)果,其包括數(shù)據(jù)挖掘引擎、知識(shí)庫等。

      人機(jī)交互層負(fù)責(zé)給用戶提供一個(gè)與系統(tǒng)交互的可視化界面,用戶可通過該層輸入其所需信息。此外,數(shù)據(jù)挖掘系統(tǒng)也可通過該層將最終的數(shù)據(jù)處理結(jié)果直觀地反饋給用戶。

      1.2 數(shù)據(jù)挖掘過程

      數(shù)據(jù)挖掘通常是指從原始數(shù)據(jù)中獲取所需知識(shí)的完整過程。數(shù)據(jù)挖掘系統(tǒng)對(duì)數(shù)據(jù)的挖掘可分為三個(gè)階段[11]:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘以及知識(shí)解釋與表達(dá)。其過程如圖2 所示。

      圖2 數(shù)據(jù)挖掘過程

      各環(huán)節(jié)的詳細(xì)解釋如下:

      1)數(shù)據(jù)準(zhǔn)備

      數(shù)據(jù)挖掘所面對(duì)的是海量的數(shù)據(jù),這些數(shù)據(jù)通常儲(chǔ)存在數(shù)據(jù)庫中,同時(shí)并未經(jīng)過任何加工處理,且無法直接用于深層信息的挖掘,因此需要首先進(jìn)行數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備由數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理及數(shù)據(jù)轉(zhuǎn)換組成,數(shù)據(jù)選擇是指根據(jù)用戶的數(shù)據(jù)挖掘請(qǐng)求從數(shù)據(jù)庫中挑選出符合要求的原始數(shù)據(jù),即目標(biāo)數(shù)據(jù);數(shù)據(jù)預(yù)處理則是為了解決原始數(shù)據(jù)中包含的諸多問題,例如噪聲、缺省等,該預(yù)處理內(nèi)容包括數(shù)據(jù)清洗、推導(dǎo)缺值數(shù)據(jù)、去除重復(fù)信息以及數(shù)據(jù)類型轉(zhuǎn)換等[12];數(shù)據(jù)轉(zhuǎn)換是將數(shù)據(jù)從一種表現(xiàn)形式變成另一種表現(xiàn)形式的過程,將預(yù)處理后的數(shù)據(jù)轉(zhuǎn)換成所需的數(shù)據(jù)表現(xiàn)形式。數(shù)據(jù)準(zhǔn)備是整個(gè)數(shù)據(jù)挖掘過程中耗時(shí)較長的一步,其質(zhì)量較大程度上影響了后續(xù)數(shù)據(jù)挖掘的效率及結(jié)果的準(zhǔn)確性。

      2)數(shù)據(jù)挖掘

      數(shù)據(jù)挖掘是整個(gè)系統(tǒng)的核心過程,也是技術(shù)難點(diǎn)所在,通過對(duì)目標(biāo)數(shù)據(jù)的個(gè)性化分析,進(jìn)而挖掘其內(nèi)在知識(shí)。這一步首先根據(jù)用戶需求確定具體的挖掘任務(wù),然后根據(jù)挖掘任務(wù)確定最適合數(shù)據(jù)處理的數(shù)據(jù)挖掘算法,最后則是進(jìn)行數(shù)據(jù)挖掘操作,以獲得最終結(jié)果[13]。目前常用的數(shù)據(jù)挖掘算法包括決策樹算法、隨機(jī)森林、邏輯回歸、支持向量機(jī)以及樸素貝葉斯算法等,在實(shí)際選擇中,需根據(jù)具體的挖掘任務(wù)確定。

      3)知識(shí)解釋與表達(dá)

      知識(shí)解釋與表達(dá)是指將數(shù)據(jù)挖掘的結(jié)果用可視化且易于理解的方式進(jìn)行解釋與表達(dá),從而確保用戶能夠了解知識(shí)的使用方式[14]。值得注意的是,數(shù)據(jù)挖掘階段所得到的結(jié)果可能存在冗余或無關(guān)的知識(shí),此時(shí)就需要進(jìn)行去除操作;此外,也有可能得到不滿足用戶需求的結(jié)果,則需要重新進(jìn)行上述步驟。

      2 心理問題預(yù)測

      2.1 設(shè)計(jì)架構(gòu)

      該文利用數(shù)據(jù)挖掘提出的心理問題預(yù)測技術(shù)主要是對(duì)心理數(shù)據(jù)的分析與處理,以便及時(shí)發(fā)現(xiàn)其中存在的問題。其具體的技術(shù)設(shè)計(jì)架構(gòu)如圖3 所示。

      圖3 心理問題預(yù)測技術(shù)架構(gòu)

      2.2 隨機(jī)森林

      隨機(jī)森林(Random Forest,RF)是解決實(shí)際應(yīng)用中分類問題的一種高度、靈活的數(shù)據(jù)挖掘算法[15]。分類通常是指將待分類項(xiàng)按照一定規(guī)則映射到預(yù)先定義好的類的過程。隨機(jī)森林從根本上是若干相互獨(dú)立的“樹”共同完成數(shù)據(jù)分析的方法,其基本組成單元是決策樹。構(gòu)建隨機(jī)森林模型的示意圖如圖4 所示。

      圖4 構(gòu)建隨機(jī)森林模型示意圖

      上述過程可簡單描述為:首先根據(jù)實(shí)際需要將待處理數(shù)據(jù)集(訓(xùn)練數(shù)據(jù)集)進(jìn)行隨機(jī)采樣,以此得到n個(gè)訓(xùn)練子集,各決策樹根據(jù)逐一對(duì)應(yīng)的訓(xùn)練子集獨(dú)立進(jìn)行模型的學(xué)習(xí)與訓(xùn)練,進(jìn)而得到n個(gè)不同的決策樹。這些決策樹既相互獨(dú)立又相互聯(lián)系,共同組成隨機(jī)森林。隨機(jī)森林中的“隨機(jī)”一方面體現(xiàn)在訓(xùn)練數(shù)據(jù)集的選擇“隨機(jī)”,另一方面也體現(xiàn)在決策樹訓(xùn)練時(shí),屬性(特征)的選擇“隨機(jī)”。

      利用隨機(jī)森林模型對(duì)新樣本數(shù)據(jù)進(jìn)行處理時(shí),其中包含的所有決策樹均會(huì)判斷該樣本應(yīng)屬于哪個(gè)類別,并進(jìn)行內(nèi)部投票。進(jìn)而選取最優(yōu)解作為隨機(jī)森林的分類預(yù)測結(jié)果。

      2.3 Apriori算法

      Apriori 算法是一種解決關(guān)聯(lián)規(guī)則問題的數(shù)據(jù)挖掘算法[16],文中提出Apriori 算法的目的在于探尋海量信息之間的隱含聯(lián)系或相關(guān)性。其常用于挖掘信息中出現(xiàn)次數(shù)最多的信息集合(即頻繁集),這些集合通常能夠指導(dǎo)事務(wù)的決策。Apriori 算法的工作流程如圖5 所示。

      圖5 Apriori算法工作流程示意圖

      該算法在整體上可以分為兩個(gè)過程:連接過程和剪枝過程。其中,各自對(duì)應(yīng)的核心算法為候選項(xiàng)集產(chǎn)生函數(shù)和頻繁項(xiàng)集剪枝函數(shù)。Apriori 算法的工作流程可描述為:

      1)對(duì)待處理數(shù)據(jù)集進(jìn)行掃描,同時(shí)計(jì)算各項(xiàng)支持度,產(chǎn)生候選項(xiàng)集;

      2)根據(jù)預(yù)先設(shè)定的最小支持度閾值,對(duì)候選項(xiàng)集中的數(shù)據(jù)進(jìn)行過濾,形成頻繁項(xiàng)集;

      3)對(duì)頻繁項(xiàng)集進(jìn)行連接,形成新的候選項(xiàng)集,重復(fù)進(jìn)行步驟2)直至滿足終止條件為止,即頻繁項(xiàng)集對(duì)應(yīng)的候選項(xiàng)集為空集;

      4)輸出此時(shí)的頻繁項(xiàng)集,并將其進(jìn)行連接,形成最終的關(guān)聯(lián)規(guī)則。

      3 實(shí)驗(yàn)測試

      為了驗(yàn)證該文提出的基于隨機(jī)森林?jǐn)?shù)據(jù)挖掘方法的心理問題預(yù)測技術(shù)的有效性與可靠性,驗(yàn)證方法性能是否滿足要求且功能是否完善,該文進(jìn)行了三項(xiàng)實(shí)驗(yàn),分別為單元測試、性能測試及預(yù)測效果測試。

      3.1 環(huán)境搭建

      在進(jìn)行實(shí)驗(yàn)前需要搭建測試系統(tǒng)環(huán)境,相關(guān)環(huán)境信息如表1 所示。

      表1 測試環(huán)境系統(tǒng)參數(shù)

      3.2 單元測試

      單元測試也稱為功能測試,是對(duì)系統(tǒng)、方法、算法等使用最廣泛的一種測試。單元測試是對(duì)組成模塊的獨(dú)立測試,主要是為了測試各組成模塊能否按設(shè)計(jì)要求實(shí)現(xiàn)所對(duì)應(yīng)的功能。該測試可以無需等到開發(fā)完成后進(jìn)行,在設(shè)計(jì)開發(fā)階段便可展開。該項(xiàng)實(shí)驗(yàn)的測試內(nèi)容及測試結(jié)果如表2 所示。

      表2 單元測試結(jié)果

      由表2 可知,利用該文方法建立的系統(tǒng)涉及到的各組成模塊均能夠按照設(shè)計(jì)需求較好地實(shí)現(xiàn)其所對(duì)應(yīng)的功能,并為后續(xù)進(jìn)行的其他項(xiàng)測試奠定了良好的基礎(chǔ)。

      3.3 性能測試

      性能測試主要測試系統(tǒng)在多種正常、負(fù)載、峰值測試情況下的實(shí)際表現(xiàn)。通過多次實(shí)驗(yàn)發(fā)現(xiàn),利用該文方法建立的系統(tǒng)始終處于良好的工作狀態(tài),并保持較高的運(yùn)行速度。同時(shí),CPU 使用率也低于預(yù)期值,且資源耗費(fèi)較少。相關(guān)性能測試的結(jié)果如表3所示。

      表3 性能測試結(jié)果

      3.4 預(yù)測效果測試

      最后是心理問題的預(yù)測效果測試。為了體現(xiàn)該文提出方法的優(yōu)勢,設(shè)置人工分析和關(guān)聯(lián)分析算法作為結(jié)果對(duì)照組。實(shí)驗(yàn)數(shù)據(jù)為某高校的年度心理問卷調(diào)查結(jié)果,預(yù)測效果如表4 所示。

      表4 不同算法的心理問題預(yù)測準(zhǔn)確率

      由4 表可以得出,該文預(yù)測準(zhǔn)確率平均值為88.74%,而人工分析和關(guān)聯(lián)分析預(yù)測準(zhǔn)確率平均值分別為68.22%和57.38%,該文方法對(duì)于心理問題預(yù)測的準(zhǔn)確率明顯高于其他兩種方法,平均準(zhǔn)確率能夠達(dá)到88.74%,這對(duì)于及時(shí)發(fā)現(xiàn)學(xué)生人群中所存在的心理問題具有重要意義。

      4 結(jié)束語

      該文介紹了數(shù)據(jù)挖掘系統(tǒng)的基本原理,分析了數(shù)據(jù)挖掘系統(tǒng)從原始數(shù)據(jù)中獲取所需知識(shí)的完整過程,根據(jù)數(shù)據(jù)挖掘中用來處理分類問題的隨機(jī)森林算法與用來處理關(guān)聯(lián)規(guī)則問題的Apriori 算法,提出了基于隨機(jī)森林?jǐn)?shù)據(jù)挖掘方法的心理問題預(yù)測方法。采用該方法完成對(duì)系統(tǒng)的搭建并進(jìn)行了單元測試、性能測試以及預(yù)測效果測試,測試結(jié)果表明,各組成模塊均能夠按照設(shè)計(jì)需求較好地實(shí)現(xiàn)對(duì)應(yīng)功能,且系統(tǒng)整體可在負(fù)載、正常、峰值下穩(wěn)定運(yùn)行。

      猜你喜歡
      項(xiàng)集數(shù)據(jù)挖掘森林
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      哈Q森林
      哈Q森林
      哈Q森林
      哈Q森林
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      一種頻繁核心項(xiàng)集的快速挖掘算法
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      浪卡子县| 合肥市| 乌拉特前旗| 镇江市| 沿河| 平利县| 阿拉善右旗| 乐至县| 霍州市| 汝州市| 沙湾县| 腾冲县| 库车县| 阜平县| 利辛县| 荔波县| 调兵山市| 祁连县| 攀枝花市| 亚东县| 裕民县| 鹰潭市| 罗甸县| 漳州市| 雅安市| 庆城县| 体育| 焦作市| 和政县| 鹤庆县| 东城区| 林芝县| 临汾市| 阳春市| 武汉市| 辰溪县| 双城市| 宁夏| 冀州市| 文安县| 牡丹江市|