• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術(shù)在大學(xué)生心理測(cè)評(píng)數(shù)據(jù)中研究應(yīng)用

      2015-12-10 11:34張繼美
      電腦知識(shí)與技術(shù) 2015年26期
      關(guān)鍵詞:數(shù)據(jù)挖掘

      張繼美

      摘要:隨著當(dāng)前社會(huì)生活節(jié)奏加快、社會(huì)競(jìng)爭(zhēng)激烈和就業(yè)壓力加大等,大學(xué)生心理問題日益成為高校和社會(huì)關(guān)注的焦點(diǎn)。高校開始重視大學(xué)生的心理健康教育,開展定期的大學(xué)生心理測(cè)評(píng)工作,積累了大量的心理檔案數(shù)據(jù)。對(duì)這些心理測(cè)評(píng)數(shù)據(jù)的分析篩選與研究也成為眾多高校教師和科研人員的研究方向之一。近年來數(shù)據(jù)挖掘技術(shù)在大學(xué)生心理領(lǐng)域中的研究日益廣泛,在對(duì)學(xué)生心理問題的分析研究中也出現(xiàn)了各種數(shù)據(jù)挖掘技術(shù)和算法。數(shù)據(jù)挖掘是上世紀(jì)末興起的一種智能數(shù)據(jù)分析技術(shù),也被稱為數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn),它可以從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、或其他存儲(chǔ)庫(kù)中提取或挖掘出有用的知識(shí)[1]。

      關(guān)鍵詞:數(shù)據(jù)挖掘;大學(xué)生心理;心理測(cè)評(píng)

      中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)26-0012-02

      當(dāng)前我們國(guó)家經(jīng)濟(jì)水平提高,網(wǎng)絡(luò)的快速發(fā)展帶來信息量的劇增,人們的物質(zhì)生活水平大幅度提升,可人們心理負(fù)擔(dān)的加重和心理問題的出現(xiàn)也日益受到關(guān)注,特別是代表創(chuàng)新、青春與活力一群的現(xiàn)代大學(xué)生群體。隨著當(dāng)前社會(huì)生活節(jié)奏加快與社會(huì)競(jìng)爭(zhēng)激烈、就業(yè)壓力加大等,大學(xué)生還要面臨著對(duì)新環(huán)境的適應(yīng),專業(yè)方向的選擇與認(rèn)同,人際關(guān)系的處理,青春的躁動(dòng)和戀愛的問題等,致使大學(xué)生心理負(fù)重增大,心理、情緒、思維和觀念意識(shí)都在發(fā)生著變化。很多調(diào)查數(shù)據(jù)顯示出現(xiàn)心理問題的大學(xué)生比例在增加,很多校園惡性事件也源于學(xué)生心理問題,國(guó)家對(duì)大學(xué)生心理問題提起了重視,各高校也在加強(qiáng)大學(xué)生的心理健康教育。合理利用高校心理檔案系統(tǒng)中的大量數(shù)據(jù)進(jìn)行研究工作,對(duì)高校加強(qiáng)心理健康教育、預(yù)防學(xué)生出現(xiàn)心理問題、進(jìn)行心理干預(yù)和心理咨詢工作提供幫助。

      學(xué)生綜合素質(zhì)改革的要求下,結(jié)合計(jì)算機(jī)技術(shù)的現(xiàn)代化教育管理模式已經(jīng)應(yīng)用在廣大高等院校。目前心理測(cè)評(píng)系統(tǒng)已經(jīng)應(yīng)用到各高校中,很多高校每年都會(huì)對(duì)學(xué)生進(jìn)行心理測(cè)評(píng),而SCL-90心理測(cè)評(píng)量表是常用的心理測(cè)量量表之一。高校積累了大量的學(xué)生心理測(cè)評(píng)數(shù)據(jù),對(duì)這些心理測(cè)評(píng)數(shù)據(jù)的分析篩選與研究也成為眾多高校教師科研人員的研究方向之一。近年來數(shù)據(jù)挖掘技術(shù)在大學(xué)生心理領(lǐng)域中的研究日益廣泛,在對(duì)學(xué)生心理問題的分析研究中也出現(xiàn)了各種數(shù)據(jù)挖掘技術(shù)和算法。

      1 數(shù)據(jù)挖掘概述

      隨著計(jì)算機(jī)和信息時(shí)代的飛速發(fā)展,人們對(duì)數(shù)據(jù)的收集、存儲(chǔ)和訪問的能力大大提高,海量數(shù)據(jù)的快速增長(zhǎng)已遠(yuǎn)遠(yuǎn)超過人們的理解,傳統(tǒng)的數(shù)據(jù)分析工具顯得力不從心。如何有效組織海量數(shù)據(jù),尋找有價(jià)值的知識(shí),從而幫助人類做出正確決策,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生;數(shù)據(jù)挖掘是上世紀(jì)末興起的一種智能數(shù)據(jù)分析技術(shù),也被稱為數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn),它可以從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、或其他存儲(chǔ)庫(kù)中提取或挖掘出有用的知識(shí) [1]。

      對(duì)于高校的學(xué)生心理檔案系統(tǒng),數(shù)據(jù)源主要包括學(xué)生基本信息、主要社會(huì)關(guān)系和個(gè)性心理特征等,其中個(gè)性心理特征一般使用相關(guān)的心理測(cè)量量表進(jìn)行問卷測(cè)量。數(shù)據(jù)挖掘比較重要的環(huán)節(jié)是數(shù)據(jù)預(yù)處理,對(duì)采集的數(shù)據(jù)源進(jìn)行清洗加工和提煉,提煉出高質(zhì)量的樣本集再進(jìn)行數(shù)據(jù)挖掘。從數(shù)據(jù)本身來考慮,數(shù)據(jù)挖掘通常需要有數(shù)據(jù)信息收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換、數(shù)據(jù)挖掘?qū)嵤┻^程、模式評(píng)估和知識(shí)表示等8個(gè)步驟??梢詣澐譃槿齻€(gè)階段:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘和結(jié)果知識(shí)表示。如圖1所示。

      圖1 數(shù)據(jù)挖掘過程

      2數(shù)據(jù)挖掘技術(shù)在大學(xué)生心理問題中研究應(yīng)用

      2.1聚類分析

      聚類分析是指從一個(gè)給定的數(shù)據(jù)集的對(duì)象之間搜索有價(jià)值關(guān)系的數(shù)據(jù),是將研究對(duì)象分為相對(duì)同質(zhì)的群組(clusters)的統(tǒng)計(jì)分析技術(shù)。聚類過程是一組物理或抽象的對(duì)象,根據(jù)它們之間的相似性,分為若干組,類似的對(duì)象分為一組,一個(gè)集群是由彼此相似的對(duì)象集合組成,不同的聚類對(duì)象是不相似的[2]。聚類方法主要包括劃分方法、分類方法和層次模型法、基本網(wǎng)格法或基于密度的分類方法等。李哲等[3]運(yùn)用聚類分析方法對(duì)學(xué)生心理檔案數(shù)據(jù)進(jìn)行分析,采用聚類分析的k-means算法將具有相似特征的學(xué)生劃分到同一組,再分析同組學(xué)生共性。

      2.2決策樹技術(shù)

      決策樹是一種典型的分類方法,是根據(jù)數(shù)據(jù)集特點(diǎn)構(gòu)造分類器,把未知的數(shù)據(jù)樣本映射到給定的分類類別中,內(nèi)部進(jìn)行分類屬性的比較,根據(jù)屬性值的不同向下形成分支,從上到下最終成為一個(gè)類似的樹結(jié)構(gòu)圖。每個(gè)內(nèi)部節(jié)點(diǎn)的決策樹屬性表示一個(gè)測(cè)試,每個(gè)分支表示測(cè)試的結(jié)果,每一個(gè)葉節(jié)點(diǎn)表示一個(gè)類別,從根到葉結(jié)點(diǎn)的路徑形成一條合取規(guī)則。目前應(yīng)用比較廣泛的典型決策樹算法主要有:ID3,C4.5,CART等。

      如何構(gòu)造決策樹的小尺寸和高精度是決策樹算法的核心內(nèi)容,構(gòu)造決策樹的過程中,第一步是根據(jù)訓(xùn)練樣本集生成決策樹,第二步是通過對(duì)上一階段決策樹的檢驗(yàn)和修正,剪除冗余分枝和影響準(zhǔn)確性的分枝。

      何廣東[4]運(yùn)用ID3算法生成有無焦慮癥狀的決策樹模型,并通過對(duì)提取的規(guī)則進(jìn)行分析得出結(jié)論,性別和家庭和睦程度是影響焦慮癥的最相關(guān)屬性。張俊生等[5]以大學(xué)生心理檔案系統(tǒng)中心理測(cè)量量表為數(shù)據(jù)源,篩選出心理異常學(xué)生為測(cè)評(píng)數(shù)據(jù)作為數(shù)據(jù)集,采用C4.5算法構(gòu)造決策樹進(jìn)行數(shù)據(jù)挖掘研究。周小剛等[6]選取廣東陽(yáng)江職業(yè)技術(shù)學(xué)院學(xué)生的癥狀自評(píng)量表SCL-90的測(cè)評(píng)結(jié)果數(shù)據(jù)作為訓(xùn)練樣本集,采用C4.5算法構(gòu)造決策樹,挖掘出學(xué)生軀體化和敵對(duì)屬性在大學(xué)生心理健康問題中起比較重要的決定作用。

      2.3 關(guān)聯(lián)規(guī)則分析

      關(guān)聯(lián)規(guī)則挖掘剛開始是R.Agrawal等就超市的購(gòu)物籃問題分析提出的,其目的是找到不同的商品超市交易數(shù)據(jù)庫(kù)之間的關(guān)系,發(fā)現(xiàn)超級(jí)市場(chǎng)中用戶購(gòu)買的商品之間內(nèi)在的關(guān)聯(lián)關(guān)系,并用知識(shí)的形式表示出來[1]。關(guān)聯(lián)規(guī)則的挖掘過程主要包括兩個(gè)步驟:第一步是找到所有的數(shù)據(jù)集高頻項(xiàng)目團(tuán)隊(duì),第二步是從這些高頻率項(xiàng)目團(tuán)隊(duì)中產(chǎn)生關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘的指標(biāo)是適用于數(shù)據(jù)記錄的離散值,如果原始索引在數(shù)據(jù)庫(kù)中是連續(xù)數(shù)據(jù),則需要先進(jìn)行適當(dāng)?shù)臄?shù)據(jù)離散化處理,再進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,處理是否合理會(huì)影響關(guān)聯(lián)規(guī)則挖掘的結(jié)果,因此數(shù)據(jù)處理是數(shù)據(jù)挖掘的重要步驟。

      經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法有Apriori算法和FP-growth算法,Apriori算法多次掃描交易數(shù)據(jù)庫(kù),每一次用候選高頻項(xiàng)目團(tuán)隊(duì)產(chǎn)生頻繁集;FP-growth算法直接用樹結(jié)構(gòu)得到一個(gè)頻繁集,降低掃描事務(wù)數(shù)據(jù)庫(kù)次數(shù),提高算法效率[1]。關(guān)聯(lián)規(guī)則挖掘技術(shù)已被廣泛應(yīng)用于銀行,保險(xiǎn),電信,零售和市場(chǎng)營(yíng)銷等方面。

      何廣東[4]運(yùn)用關(guān)聯(lián)規(guī)則的Apriori算法對(duì)學(xué)生有無焦慮癥狀進(jìn)行挖掘,由關(guān)聯(lián)規(guī)則分析出家庭不和睦的學(xué)生表現(xiàn)出了焦慮癥狀。在學(xué)生心理管理系統(tǒng)中應(yīng)用關(guān)聯(lián)規(guī)則挖掘技術(shù),主要目標(biāo)是尋找學(xué)生心理檔案的大量數(shù)據(jù)項(xiàng)中隱藏的某種聯(lián)系或相關(guān)性[7]。學(xué)生心理問題不能僅根據(jù)測(cè)量結(jié)果簡(jiǎn)單判斷,應(yīng)結(jié)合學(xué)生個(gè)人基本信息和主要社會(huì)關(guān)系等,挖掘出其中的關(guān)聯(lián)性。

      2.4 其他數(shù)據(jù)挖掘技術(shù)

      其他常用的數(shù)據(jù)挖掘技術(shù)有貝葉斯分類方法、神經(jīng)網(wǎng)絡(luò)分類方法、粗糙集方法、模糊集合方法和模糊評(píng)價(jià)方法等。黃中海[8]設(shè)計(jì)實(shí)現(xiàn)了基本CART決策樹算法、BP人工神經(jīng)網(wǎng)絡(luò)算法和模式識(shí)別網(wǎng)絡(luò)算法的大學(xué)生心理挖掘模型,并分別對(duì)三種分類挖掘模型進(jìn)行測(cè)試、比較和分析,設(shè)計(jì)出綜合三種方法的數(shù)據(jù)挖掘內(nèi)核程序。郭晶晶[9]通過向10個(gè)專業(yè)學(xué)生發(fā)放問卷的方式獲取數(shù)據(jù)源,然后分層抽樣收集學(xué)生問卷,構(gòu)造心理評(píng)測(cè)模型,運(yùn)用綜合模糊評(píng)價(jià)法分析計(jì)算出大學(xué)生心理健康的評(píng)判區(qū)間。

      3 結(jié)束語(yǔ)

      數(shù)據(jù)挖掘技術(shù)在大學(xué)生心理問題領(lǐng)域的研究及對(duì)大學(xué)生心理測(cè)評(píng)數(shù)據(jù)的分析研究是當(dāng)前心理領(lǐng)域的研究熱點(diǎn),還有很多數(shù)據(jù)挖掘算法可以應(yīng)用。根據(jù)學(xué)生心理測(cè)評(píng)數(shù)據(jù)的特征選擇合適的數(shù)據(jù)挖掘算法是今后需要不斷研究和探索的一個(gè)方向。

      參考文獻(xiàn):

      [1] 陳志泊. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社, 2009.

      [2] 朱明. 數(shù)據(jù)挖掘[M].安徽:中國(guó)科學(xué)技術(shù)大學(xué)出版社, 2002.

      [3] 李哲, 張映雪, 胡蕙. 聚類分析在大學(xué)生心理健康管理中的應(yīng)用[J].湖北工程學(xué)院學(xué)報(bào), 2014(11).

      [4] 何廣東. 數(shù)據(jù)挖掘在大學(xué)生心理問題中應(yīng)用[J].無線互聯(lián)科技, 2013(2).

      [5] 張俊生, 張華. 決策樹算法在大學(xué)生心理檔案系統(tǒng)中的應(yīng)用研究[J].價(jià)值工程, 2012(17).

      [6] 周小剛, 周萍, 彭文惠. 決策樹算法在大學(xué)生心理健康評(píng)測(cè)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件, 2011(10).

      [7] 張俊生, 張華. 數(shù)據(jù)挖掘在學(xué)生心理管理系統(tǒng)中應(yīng)用[J]. 計(jì)算機(jī)與網(wǎng)絡(luò), 2012(2).

      [8] 黃中海. 數(shù)據(jù)挖掘在高等學(xué)生心理危機(jī)預(yù)防中的應(yīng)用[D]. 武漢科技大學(xué), 2015.

      [9] 郭晶晶. 基于數(shù)據(jù)挖掘的大學(xué)生心理問題分析[J]. 淮北職業(yè)技術(shù)學(xué)院學(xué)報(bào), 2015(2).

      猜你喜歡
      數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      數(shù)據(jù)挖掘的分析與探索
      數(shù)據(jù)挖掘技術(shù)綜述與應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
      高級(jí)數(shù)據(jù)挖掘與應(yīng)用國(guó)際學(xué)術(shù)會(huì)議
      正宁县| 永宁县| 洪雅县| 莱芜市| 肥东县| 兴义市| 固始县| 吉木萨尔县| 水富县| 辽中县| 天门市| 读书| 雷州市| 南宫市| 文水县| 普安县| 手游| 中阳县| 罗甸县| 娄烦县| 海盐县| 双牌县| 景泰县| 沐川县| 碌曲县| 苗栗县| 宣武区| 安庆市| 旅游| 伽师县| 晋中市| 隆尧县| 长岛县| 句容市| 三都| 沙河市| 平和县| 安图县| 察雅县| 临夏市| 苏尼特右旗|