• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度學習的網(wǎng)絡心理咨詢問題智能多分類模型

      2018-11-07 09:18:14程會林曾偉楊琳琳岑蕭萍蔣琳琳
      卷宗 2018年27期
      關鍵詞:卷積神經網(wǎng)絡

      程會林 曾偉 楊琳琳 岑蕭萍 蔣琳琳

      摘 要:為了簡化網(wǎng)絡心理咨詢分診流程和降低咨詢助理的勞動強度,提出一種基于深度學習的網(wǎng)絡心理咨詢問題智能多分類模型。采用Word2vec對來訪者的自述情況進行文本特征提取,設計卷積神經網(wǎng)絡的深度學習分類器,實現(xiàn)對來訪者咨詢問題的智能分類。與傳統(tǒng)機器學習分類方法相比,所提方法的準確率提升約20%。本研究為網(wǎng)絡心理咨詢問題的智能分診提供了一種新方法。

      關鍵詞:網(wǎng)絡心理咨詢;自述分類,Word2vec;卷積神經網(wǎng)絡

      1 引言

      隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,網(wǎng)絡心理咨詢逐漸發(fā)展起來,僅“525心理網(wǎng)”便已解決近857萬個心理問題。心理咨詢網(wǎng)站一般配備有一名咨詢助理,根據(jù)來訪者的自述情況進行分類,匹配到合適的心理咨詢師。然而,這種分診的準確性與效率依賴于咨詢助理的經驗知識。為減輕咨詢助理的負擔,本文提出一種對咨詢問題進行智能分診的方法。傳統(tǒng)的分類方法需要進行復雜的處理來進行特征提取,再根據(jù)提取的特征來訓練分類器。卷積神經網(wǎng)絡通過結構重組和減少權值將特征提取和分類功能進行融合,這種結構比以往多種算法性能更為高效[7]。因此,本文擬利用文本挖掘技術,設計卷積神經網(wǎng)絡多分類模型,對來訪者的自述情況進行智能分類,簡化分診流程。

      2 實驗步驟與分析

      2.1 流程圖

      2.2 數(shù)據(jù)預處理

      為獲得數(shù)據(jù),訓練分類模型以供使用,本文利用八爪魚采集器從“咨詢中國網(wǎng)”中爬取“公益心理問答模塊”數(shù)據(jù),共得到6個類別,分別為“婚戀情感”“親子關系”“人際關系”“認識自我”“壓力疏導”及“子女成長”。但每一類數(shù)據(jù)的數(shù)量不同,為使訓練時類別均衡,本文將“親子關系”“人際關系”及“子女成長”合并為“關系成長”類。最終共有4個類別,其中婚戀情感自述情況條數(shù)310條,關系成長自述情況條數(shù)284條,認識自我自述情況條數(shù)310條,壓力疏導自述情況條數(shù)310條。

      利用結巴分詞(jieba)將爬取的數(shù)據(jù)分詞,因文本并不長,所以未加載停用詞,例如“我覺得我活得很累”被分為了“我覺得我活得很累”。

      將分詞后結果轉為txt文本,代入Word2vec模型[1],得到256維的詞向量,即一個中文詞(t)由256個數(shù)字表示,表示為R(t)。為訓練出更好的詞匯模型,本文使用約43萬條,涉及影視、小說、心理、司法內容的文本進行訓練,得到新的Word2vec結果。

      R(t)=Word2vec(t)

      接著利用訓練得到的Word2vec模型,計算每條自述情況的向量R(dj),即句子dj中n個詞匯的Word2vec向量的均值,表示為:

      2.3 模型構建

      以256維的文本向量作為特征,分類標簽作為label,分別使用決策樹[2]、隨機森林[3]、SVM[4]及卷積神經網(wǎng)絡[5]進行建模。

      將一條文本所得的256維向量看作16×16的二維矩陣。將32個5×5的小型矩陣,作為第一層的卷積核,對于大矩陣中的每個值,計算其周圍的值與卷積核對應位置的乘積,將結果相加最終得到的終值則為新矩陣該位置的值。

      一層卷積的操作可概括為:

      (1)文本向量通過多個不同的卷積核的濾波,并加偏置,提取出局部特征,每一個卷積核映射出一個新的2D文本。

      (2)將前面卷積核的濾波輸出結果,進行非線性的激活函數(shù)ReLU處理。

      (3)對激活函數(shù)的結果進行最大池化,保留最顯著的特征,實現(xiàn)數(shù)據(jù)壓縮,并提升模型的畸變容忍能力。

      在第一層卷積層中,共有32個5×5的卷積核,第二層為64個5×5的卷積核,利用relu作為激活函數(shù),全連接得到自述情況的分類。并利用AdamOptimizer不斷優(yōu)化得到結果,經過20000次迭代后,得到準確率最高的的模型。

      2.4 實驗結果

      從實驗結果可以看出,相較于傳統(tǒng)分類方法,卷積神經網(wǎng)絡在短文本的分類中更具優(yōu)勢。準確率得到大大提升。卷積神經網(wǎng)絡通過卷積核的權值共享,減少了參數(shù)個數(shù),亦提取了顯要特征,通過梯度下降算法的參數(shù)更迭,使得模型的準確率得以大大提升。

      2.5 實驗進階

      在得到關于自述情況的分類后,可得知其咨詢的問題所屬大類為何,即可推薦擅長此大類的心理咨詢師。而實際情況中,推薦時若能夠更加細致,則心理咨詢師的推薦將能夠更加個性化。根據(jù)自述情況中來訪者的期望,自動篩選出重要信息,例如希望心理咨詢師性別為男,年齡為30歲以上等等。

      本文簡單化處理,對于心理咨詢師的要求,統(tǒng)一在文本的最后,表述為:“心理咨詢師要……”,便可使用正則表達式,獲取其對咨詢師的要求,接著由“性別……”“……歲”等模式的正則,繼續(xù)細化出要求得到的結果,由機器直接獲取信息,按照心理咨詢師的標簽,進行推薦。

      3 結語

      與傳統(tǒng)方法對比,卷積神經網(wǎng)絡在短文本分類上訓練效果更好,但準確率仍有提升的空間。若能考慮到關鍵詞在分類過程中的顯著作用,相信能夠得到更好的結果。例如通過“老公”,“男朋友”兩詞,即可判定此文本屬于婚戀情感類。但可以肯定的是,卷積神經網(wǎng)絡在心理咨詢自述情況上的分類是有應用價值的。當配合以正則表達式,便可更個性化推薦心理咨詢師。

      參考文獻

      [1]王奕森,夏樹濤.集成學習之隨機森林算法綜述[J].信息通信技術,2018,12(01):49-55.

      [2]郭東亮,劉小明,鄭秋生.基于卷積神經網(wǎng)絡的互聯(lián)網(wǎng)短文本分類方法[J].計算機與現(xiàn)代化,2017(04):78-81.

      [3]唐明,朱磊,鄒顯春.基于Word2Vec的一種文檔向量表示[J].計算機科學,2016,43(06):214-217+269.

      [4]張棪,曹健.面向大數(shù)據(jù)分析的決策樹算法[J].計算機科學,2016,43(S1):374-379+383.

      [5]崔建明,劉建明,廖周宇.基于SVM算法的文本分類技術研究[J].計算機仿真,2013,30(02):299-302+368.

      [6]許闖.網(wǎng)絡心理咨詢五步法[J].政工導刊,2017(07):40-41.

      [7]夏從零,錢濤,姬東鴻.基于事件卷積特征的新聞文本分類[J].計算機應用研究,2017,34(04):991-994.

      猜你喜歡
      卷積神經網(wǎng)絡
      基于深度神經網(wǎng)絡的微表情識別
      卷積神經網(wǎng)絡中減少訓練樣本時間方法研究
      卷積神經網(wǎng)絡語言模型研究
      基于卷積神經網(wǎng)絡的車輛檢索方法研究
      基于卷積神經網(wǎng)絡溫室智能大棚監(jiān)控系統(tǒng)的研究
      基于深度卷積神經網(wǎng)絡的物體識別算法
      深度學習算法應用于巖石圖像處理的可行性研究
      軟件導刊(2016年9期)2016-11-07 22:20:49
      基于深度卷積網(wǎng)絡的人臉年齡分析算法與實現(xiàn)
      軟件工程(2016年8期)2016-10-25 15:47:34
      深度學習技術下的中文微博情感的分析與研究
      軟件(2016年5期)2016-08-30 06:27:49
      基于卷積神經網(wǎng)絡的樹葉識別的算法的研究
      眉山市| 民和| 昌宁县| 县级市| 会理县| 元朗区| 任丘市| 哈巴河县| 屯留县| 庄河市| 三明市| 磴口县| 汪清县| 宜城市| 彭山县| 龙陵县| 含山县| 浙江省| 平遥县| 青海省| 万盛区| 临沭县| 惠安县| 通榆县| 昌江| 陆川县| 友谊县| 鄯善县| 南澳县| 满洲里市| 米泉市| 确山县| 沁源县| 蓝山县| 江阴市| 昆明市| 库伦旗| 平南县| 平顺县| 凤城市| 内乡县|