• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于生活日志的情緒識(shí)別

      2021-03-18 07:18:04王鵬宇馬為之劉奕群馬少平
      中文信息學(xué)報(bào) 2021年1期
      關(guān)鍵詞:日志正確率標(biāo)簽

      王鵬宇,張 敏,馬為之,劉奕群,馬少平

      (1. 清華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)系,北京 100084;2. 清華大學(xué) 人工智能研究院,北京 100084;3. 清華大學(xué) 北京信息科學(xué)與技術(shù)國家研究中心,北京 100084)

      0 引言

      抑郁癥已經(jīng)成為威脅當(dāng)代人精神和生理健康的重要因素。其不僅是導(dǎo)致精神障礙和自殺的主要原因之一,而且還與某些生理疾病相關(guān)。調(diào)查和分析[1]表明,抑郁癥與生理疾病(如中風(fēng))的發(fā)病率和死亡率風(fēng)險(xiǎn)的顯著增高有一定的相關(guān)性。因此,如何有效防治抑郁癥已經(jīng)成為現(xiàn)代醫(yī)學(xué)一個(gè)重要的課題。

      目前對于抑郁癥的診察和治療手段主要側(cè)重于對患者的確診和治療,而缺乏對于潛在抑郁癥用戶的檢測手段。由于用戶對情緒傾向的自檢不一定準(zhǔn)確,潛在抑郁癥用戶并不容易察覺自己的情緒狀況。此外,缺乏對患者情緒的實(shí)時(shí)監(jiān)測手段,依靠定時(shí)給藥等治療方式難以應(yīng)對突發(fā)的激烈情緒波動(dòng)。同時(shí),抑郁癥存在一定的復(fù)發(fā)率,對于已治愈者,還缺少長期有效的觀測手段。

      抑郁癥的主要特征包括心情低落、缺乏興趣等情緒表現(xiàn),故實(shí)時(shí)有效地判斷和識(shí)別用戶情緒的方法對于抑郁癥的發(fā)現(xiàn)和治療大有意義。首先,實(shí)時(shí)的情緒識(shí)別有利于用戶自檢,便于潛在患者及時(shí)尋求醫(yī)療幫助;其次,醫(yī)生可以通過對患者的情緒監(jiān)測來判斷是否應(yīng)該改變治療方式;最后,對于一度治愈抑郁癥的人群,同樣可以確認(rèn)其是否再次發(fā)病。

      對用戶的情緒識(shí)別,尤其是實(shí)時(shí)的多模態(tài)情緒識(shí)別是近年來情感識(shí)別領(lǐng)域的熱點(diǎn)話題。由于人們展現(xiàn)情緒的手段包括文字、表情、語音、動(dòng)作、生理信號等多模態(tài)的方式,將用戶的多模態(tài)的生活日志信息應(yīng)用于情感預(yù)測的方式也已經(jīng)被認(rèn)為是主流的情緒識(shí)別手段。Busso 等人[2]的實(shí)驗(yàn)也表明,融合了用戶多方面生活日志的模型在情緒識(shí)別方面優(yōu)于僅使用單一數(shù)據(jù)的模型。要做到實(shí)時(shí)、準(zhǔn)確地識(shí)別情緒,采集用戶多種生活日志數(shù)據(jù)可以說是勢在必行。

      由于用戶情緒是用戶對于外在事物的生理反應(yīng),所以用戶生理和行為上的各種信息就成了用戶情緒的直觀表現(xiàn)之一。這些信息包括心率、血壓、步數(shù)、活動(dòng)類型和活動(dòng)強(qiáng)度等,對用戶生活日志的采集和分析,將會(huì)給預(yù)測用戶情感和保障用戶健康帶來莫大幫助。近年來,智能可穿戴設(shè)備的普及,使得從用戶處全天候大量采集生理活動(dòng)信息數(shù)據(jù)成為可能,相關(guān)的生活記錄信息已被應(yīng)用到心理健康領(lǐng)域的研究中,這為我們的工作提供了思路。

      1 研究目標(biāo)和內(nèi)容

      本工作的目標(biāo)為試圖提出一種基于用戶生活日志信息的情緒識(shí)別方法,并檢驗(yàn)將其應(yīng)用于一般用戶和抑郁癥患者用戶的效果。

      由于本工作為將基于生活日志的情緒識(shí)別方法應(yīng)用在抑郁癥領(lǐng)域的初次嘗試,沒有相應(yīng)的成熟數(shù)據(jù)集,故本工作中,我們將從收集和整理用戶生活日志和情感標(biāo)簽數(shù)據(jù)出發(fā),構(gòu)建數(shù)據(jù)集,進(jìn)而對生活日志數(shù)據(jù)的特征進(jìn)行統(tǒng)計(jì)分析。

      另外,由于基于生活日志的抑郁癥相關(guān)研究還屬于新的領(lǐng)域,所以我們的工作將更加側(cè)重于對情緒識(shí)別可行性和可擴(kuò)展性的研究上,而非提出新模型。本工作嘗試將生活日志數(shù)據(jù)應(yīng)用在一般用戶和抑郁癥患者用戶具體的情緒預(yù)測工作中,檢驗(yàn)使用生活日志對抑郁癥患者情緒預(yù)測的可行性,并進(jìn)行相應(yīng)的對比實(shí)驗(yàn),對結(jié)果及其意義進(jìn)行討論。

      2 相關(guān)工作

      2.1 用戶生理特征和情緒的關(guān)系

      心理學(xué)研究已經(jīng)對用戶的一系列生理特征諸如血壓、心率、運(yùn)動(dòng)情況和用戶情緒之間的關(guān)系展開了探索。其中對于血壓的研究中,Davydov等人的實(shí)驗(yàn)[3]指出,心血管收縮壓的強(qiáng)度與用戶的消極情緒喚起度有著直接的聯(lián)系;Southard等人關(guān)于28位青少年血壓和情感的研究[4]表明,血液的動(dòng)態(tài)收縮壓與焦慮、敵對、抑郁和緊張的情緒呈正相關(guān)關(guān)系,而動(dòng)態(tài)舒張壓與青少年敵意、抑郁和不安情緒以及其對環(huán)境的敵意感知相關(guān);而在關(guān)于靜息收縮壓的研究中,Johnson對32名男性志愿者的壓力和喚起度的測量和分析[5]顯示,靜息收縮壓水平和部分用戶的焦慮情緒有相關(guān)性。關(guān)于心率的研究中,Brosschot等人的實(shí)驗(yàn)[6]發(fā)現(xiàn),相比積極情緒,消極情緒對于心率的影響時(shí)間更長;而Joel等人的研究[7]揭示,在緊張性刺激的應(yīng)激源影響下的高頻心率變化和抑郁情緒有關(guān)。

      除了循環(huán)系統(tǒng)方面的研究,還有一部分研究人員對用戶的腦電圖(EEG)和皮膚電流反映(GSR)曲線進(jìn)行了研究。Li Yang等人[8]針對腦電情感識(shí)別問題提出了一種新的回歸模型,并在14名受試者的腦電情感數(shù)據(jù)上進(jìn)行了驗(yàn)證;Pawel 等人[9]將EEG和GSR信息結(jié)合起來,對27名被試者的觀影情緒進(jìn)行了識(shí)別;在Vahey等人的一篇綜述[10]中陳述了這一事實(shí): 情緒障礙的人群的GSR曲線更加平緩,同時(shí)平均曲線高度也低于正常人群。

      用戶運(yùn)動(dòng)狀態(tài)和睡眠質(zhì)量的研究也已經(jīng)有所進(jìn)展,Thayer等人發(fā)現(xiàn)[11],人的情緒傾向與每天走的步數(shù)有關(guān),步數(shù)越多,越容易產(chǎn)生積極的情緒傾向;Sano 等人對大學(xué)生睡眠時(shí)間和睡眠不規(guī)則性的分析[12]顯示,悲傷情緒和不良健康相關(guān)因素之間有統(tǒng)計(jì)學(xué)意義的關(guān)聯(lián),睡眠規(guī)律是比睡眠時(shí)間更重要的情緒鑒別器。

      2.2 基于生活日志信息的分析與挖掘

      通過智能設(shè)備對用戶進(jìn)行全天候的信息采集,可以使我們方便地獲得更加豐富的數(shù)據(jù)供學(xué)習(xí)和訓(xùn)練。同時(shí),用戶的生活記錄信息受到包括自然語言理解和情感識(shí)別等領(lǐng)域在內(nèi)的各個(gè)研究領(lǐng)域的重視,NTCIR-13[13]也將用戶生活記錄信息的處理作為其核心任務(wù)之一。

      在有關(guān)用戶生活日志數(shù)據(jù)的研究中,情感相關(guān)的研究取得了多樣的成果。Rika Mochizuki等人提出了基于用戶生活日志比較的情感交流[14]和情感分享[15]模型;Nomiya等人[16]提出了基于面部表情在生活日志視頻中探測情感場景的算法。

      此外,生活日志信息也被用于人格分析和用戶的個(gè)性化建模領(lǐng)域,同樣取得了相當(dāng)可靠的結(jié)果。Soleimaninejadian 等人的實(shí)驗(yàn)[17]中,將用戶的性別、情緒變化、心率和房間的信息用作材料,分析了用戶人格方面的特征;Mafrur等人[18]則基于智能手機(jī)傳感器收集的信息,對用戶進(jìn)行了行為識(shí)別以及個(gè)性化的行為建模,并提出了數(shù)據(jù)缺失的解決方案。

      2.3 現(xiàn)有工作中的不足

      在現(xiàn)有研究用戶生理與情緒相關(guān)性的心理學(xué)實(shí)驗(yàn)中,多限定測量用戶在相對特殊條件下的情感,或者使用不便攜帶的儀器測量用戶的生理信號,難以做到一般性和便攜性;而現(xiàn)有的生活日志相關(guān)研究中,多數(shù)情況下只采用某一種生理信息作為參考,并且難以做到實(shí)時(shí)預(yù)測。另外,在抑郁癥相關(guān)的生活日志采集與相應(yīng)的情感識(shí)別方面,目前還是空白。而本文的工作將直接以用戶在一般生活中的多種生理數(shù)據(jù)為依據(jù),嘗試實(shí)時(shí)預(yù)測情感。同時(shí),我們的工作也將驗(yàn)證基于生活日志的情緒識(shí)別在抑郁癥相關(guān)場景下是否可行。

      3 數(shù)據(jù)的采集與分析

      3.1 生活日志數(shù)據(jù)的采集與整合

      由于本工作是生活日志應(yīng)用于抑郁癥患者情緒識(shí)別的第一個(gè)工作,沒有成熟的抑郁癥患者相關(guān)生活日志和情緒標(biāo)簽的數(shù)據(jù)集。因此,本工作必須從收集一般用戶和患者用戶的生活日志和情感標(biāo)簽數(shù)據(jù)出發(fā),同時(shí)整合已有的其他方面的生活日志數(shù)據(jù)集,構(gòu)建本工作所需的抑郁癥相關(guān)的生活日志與情感數(shù)據(jù)集。

      3.1.1 手環(huán)數(shù)據(jù)的采集與整合

      本工作中,使用小米手環(huán)3及與其配套的開源安卓應(yīng)用Gadgetbridge作為數(shù)據(jù)的采集手段,對1位一般用戶和兩位抑郁傾向用戶進(jìn)行了數(shù)據(jù)采集。通過定期將用戶的手環(huán)與Gadgetbridge應(yīng)用進(jìn)行同步,采集并保存用戶的生活日志數(shù)據(jù),三位用戶均全天佩戴手環(huán)。與此同時(shí),本工作還整合了開源的LifeMusic數(shù)據(jù)集中13位一般用戶的數(shù)據(jù)。

      手環(huán)數(shù)據(jù)的采集頻率為每分鐘一次,采集的生活日志數(shù)據(jù)包括4種特征: 用戶在采集數(shù)據(jù)時(shí)的活動(dòng)類型、用戶當(dāng)時(shí)的活動(dòng)強(qiáng)度、用戶的心率、以及該分鐘內(nèi)用戶走過的步數(shù)。

      3.1.2 用戶情感標(biāo)簽的采集與整合

      用戶在佩戴手環(huán)采集生活日志數(shù)據(jù)的同時(shí),也按照要求記錄自己每日的活動(dòng)。其記錄的信息包括: 活動(dòng)開始時(shí)間和結(jié)束時(shí)間、活動(dòng)的類型、活動(dòng)起止時(shí)的情緒。完整的情感標(biāo)簽采集表格及示例數(shù)據(jù)如表1所示,其中“情緒”一欄為從表2中展示的12種預(yù)選項(xiàng)中選擇一項(xiàng)。

      同時(shí),為減少用戶記錄壓力,我們僅要求用戶約每小時(shí)記錄一次情感標(biāo)簽數(shù)據(jù)。將采集到的情感標(biāo)簽添加到生活日志數(shù)據(jù)上,構(gòu)建原始的生活日志-情感標(biāo)簽數(shù)據(jù)集。

      表1 情感標(biāo)簽采集表格及數(shù)據(jù)示例

      表2 情緒可選項(xiàng)

      3.2 數(shù)據(jù)集規(guī)模與無效數(shù)據(jù)篩除

      數(shù)據(jù)采集過程中,由于手環(huán)佩戴時(shí)不可避免地存在偶發(fā)的接觸不良問題,因此采集到的數(shù)據(jù)中存在31.3%的無效數(shù)據(jù),將這些數(shù)據(jù)篩除后,得到數(shù)據(jù)集規(guī)模如下:

      生活日志數(shù)據(jù): 總條數(shù)為218 330條,包含16人共241天次的數(shù)據(jù),其中患者用戶數(shù)據(jù)為15 044條,時(shí)間跨度17天。

      原始情感標(biāo)簽數(shù)據(jù): 共290條原始數(shù)據(jù),其中患者用戶共41條原始記錄。

      3.3 情感標(biāo)簽的補(bǔ)充

      在原始數(shù)據(jù)集中,情感標(biāo)簽數(shù)據(jù)僅為290條,難以作為訓(xùn)練數(shù)據(jù)進(jìn)行實(shí)驗(yàn),因此,需要考慮合適的標(biāo)簽補(bǔ)充方式,基于已有的情感標(biāo)簽數(shù)據(jù),合理地補(bǔ)充情感標(biāo)簽,以使情感標(biāo)簽數(shù)據(jù)數(shù)量達(dá)到足以進(jìn)行訓(xùn)練的程度。在本文實(shí)驗(yàn)中,采用了以下兩種方法對情感標(biāo)簽進(jìn)行補(bǔ)充:

      (1) 基于活動(dòng)的情感填充方法: 用戶在進(jìn)行同一種活動(dòng)時(shí),如果時(shí)間跨度不大,且活動(dòng)開始與結(jié)束時(shí)情感標(biāo)簽一致,則有理由認(rèn)為進(jìn)行該活動(dòng)時(shí)用戶的情感標(biāo)簽與該活動(dòng)起止時(shí)間的情感標(biāo)簽一致。按此規(guī)則對原數(shù)據(jù)集進(jìn)行填充,取填充后數(shù)據(jù)集中所有帶有情感標(biāo)簽的數(shù)據(jù)點(diǎn),構(gòu)成新數(shù)據(jù)集,稱為活動(dòng)填充數(shù)據(jù)集。

      (2) 基于原有標(biāo)簽的情感標(biāo)簽填充: 由于用戶記錄情感標(biāo)簽數(shù)據(jù)的時(shí)間點(diǎn)往往是在其情緒較為明顯的時(shí)候,而在此前后,情緒的變化需要時(shí)間完成,所以可以認(rèn)為時(shí)間上緊鄰原始數(shù)據(jù)的情感標(biāo)簽和該情感標(biāo)簽具有一致性。按此規(guī)則對原數(shù)據(jù)集進(jìn)行填充,取填充后數(shù)據(jù)集中所有帶有情感標(biāo)簽的數(shù)據(jù)點(diǎn),構(gòu)成新數(shù)據(jù)集,稱為標(biāo)簽填充數(shù)據(jù)集。

      3.4 數(shù)據(jù)集部分特征統(tǒng)計(jì)與分析

      首先對兩類用戶的活動(dòng)強(qiáng)度進(jìn)行占比統(tǒng)計(jì),得到圖1和圖2。由這兩個(gè)圖可知,一般用戶的較高強(qiáng)度活動(dòng)的時(shí)間占比高于患者用戶,而對兩類用戶的步數(shù)進(jìn)行統(tǒng)計(jì)則發(fā)現(xiàn),絕大多數(shù)時(shí)間內(nèi),兩類用戶的步數(shù)均為0。

      圖1 一般用戶活動(dòng)強(qiáng)度占比

      圖2 患者用戶活動(dòng)強(qiáng)度占比

      將兩類用戶的活動(dòng)強(qiáng)度和步數(shù)分別按照頻數(shù)進(jìn)行統(tǒng)計(jì),得到圖3和圖4,其中圖4的分布曲線經(jīng)過局部放大。由這兩圖可知,盡管一般用戶的最大活動(dòng)強(qiáng)度和步數(shù)大于患者用戶,兩類用戶的活動(dòng)強(qiáng)度和步數(shù)頻數(shù)分布曲線趨勢基本相同,在頻數(shù)分布的意義上,兩類用戶無法得到明確區(qū)分。

      圖3 按頻數(shù)統(tǒng)計(jì)的活動(dòng)強(qiáng)度曲線圖

      圖4 按頻數(shù)統(tǒng)計(jì)的步數(shù)曲線圖

      4 基于生活日志的情緒預(yù)測

      4.1 任務(wù)描述

      本節(jié)中,我們對一般用戶和抑郁癥患者用戶進(jìn)行情緒預(yù)測。情感預(yù)測任務(wù)使用生活日志和情感標(biāo)簽訓(xùn)練模型,使模型能夠預(yù)測給定的生活日志特征對應(yīng)的情感標(biāo)簽。由于本文工作首次涉及抑郁癥患者情緒識(shí)別問題,因而側(cè)重于驗(yàn)證既有情緒識(shí)別模型的可行性,觀察不同用戶的效果和用戶間差異,同時(shí)探究方法本身的可擴(kuò)展性。

      統(tǒng)計(jì)分析的結(jié)果表明,單純從數(shù)據(jù)的頻數(shù)和分布來看,難以區(qū)分兩類用戶。

      4.2 特征與模型設(shè)計(jì)

      4.2.1 生活日志特征設(shè)計(jì)

      本文選取從手環(huán)采集到的用戶活動(dòng)類型、活動(dòng)強(qiáng)度、心率和步數(shù)這4個(gè)維度的特征用作實(shí)驗(yàn)數(shù)據(jù)。在收集到的生活日志數(shù)據(jù)中,活動(dòng)類型數(shù)據(jù)在形式上與其他3種數(shù)據(jù)有較大差異: 首先其數(shù)值為離散數(shù)據(jù),其次其數(shù)值代表的含義與數(shù)值大小沒有關(guān)系。因而對所有出現(xiàn)的活動(dòng)類型、頻數(shù)進(jìn)行統(tǒng)計(jì),結(jié)果如表3所示。

      表3 對活動(dòng)類型的頻數(shù)統(tǒng)計(jì)

      統(tǒng)計(jì)結(jié)果顯示,排名前6的活動(dòng)類型頻數(shù)和其他活動(dòng)類型頻數(shù)之和處于同一數(shù)量級范圍內(nèi),所以可將活動(dòng)類型以one_hot的形式拆分成7維向量,以彌補(bǔ)原始用戶生活日志特征維數(shù)過少的缺陷,在實(shí)驗(yàn)中我們也將該方法與不拆分用戶活動(dòng)類型的方法進(jìn)行了對比。

      4.2.2 多維度情感模型與情感標(biāo)簽合并

      兩個(gè)較重要的多維度情感模型是Russel等人于1980年提出的Arousal-Valence模型[19]與Mehrabian等人于1996年提出的PAD模型(Pleasure Arousal Dominance,PAD)[20]。模型使用多維連續(xù)值描述具體的情感,可以更加細(xì)致地對情感進(jìn)行區(qū)分或?qū)η楦卸x距離。下面分別介紹兩個(gè)模型的概念。

      如圖5所示,以喚起度和正負(fù)性為平面的兩個(gè)維度,所有的常見情感以坐標(biāo)系中的點(diǎn)的形式存在于平面內(nèi)。其中喚起度描述情感的強(qiáng)度,即情感中含有的能量多少;而正負(fù)性代表情感的傾向,即情感是積極的還是消極的。喚起度和正負(fù)性的取值范圍是區(qū)間[-1,1],在這個(gè)模型下,情感被表示為二元組(a,v)的形式,兩個(gè)維度分別對應(yīng)Arousal和Valence的取值,情感積極性越高,喚醒度越強(qiáng),其位置越靠近右上角,反之,則越靠近左下角。

      圖5 喚起度—正負(fù)性情感平面

      在PAD模型中,P維度起到衡量情感正負(fù)性的作用,而新引入的D維度則起到衡量產(chǎn)生情緒的個(gè)體對當(dāng)時(shí)情景和周圍人的控制狀態(tài)。在PAD三維模型下,一些僅憑喚起度和正負(fù)性不易區(qū)分的情感,如憤怒和恐懼,可以得到很好的區(qū)分。

      在數(shù)據(jù)集中,實(shí)際出現(xiàn)的情感標(biāo)簽為除“發(fā)怒”外的11種。其中存在部分傾向相近的情緒。由于實(shí)際上我們更加關(guān)注的是情感本身的正負(fù)性和喚醒度相關(guān)的特征,所以可以將情感標(biāo)簽按照喚起度-正負(fù)性模型的四象限合并成表4中顯示的5類。將此合并方法應(yīng)用到“活動(dòng)填充數(shù)據(jù)集”和“標(biāo)簽填充數(shù)據(jù)集”上,分別得到“活動(dòng)填充-合并數(shù)據(jù)集”和“標(biāo)簽填充-合并數(shù)據(jù)集”,以便驗(yàn)證該方法的效果。

      表4 情感標(biāo)簽合并結(jié)果

      4.2.3 基于決策樹的集成學(xué)習(xí)模型

      對于數(shù)據(jù)量較小的生活日志數(shù)據(jù)集,提高模型正確率的方法選用集成學(xué)習(xí)方法。目前比較主流的集成學(xué)習(xí)方法之一,是以決策樹作為弱分類器來實(shí)現(xiàn)集成學(xué)習(xí)的方法。而在本文中,我們用來預(yù)測用戶情緒的模型為Breiman提出的隨機(jī)森林(RF)算法[21]和Friedman提出的GBDT算法[22],二者所使用的弱學(xué)習(xí)器均為CART樹。

      CART樹包含分類樹和回歸樹,二者的區(qū)別為樣本輸出的連續(xù)性。其中前者基于基尼系數(shù)進(jìn)行優(yōu)化,后者則基于方差。按照特征值A(chǔ)進(jìn)行劃分的樣本D,其基尼系數(shù)如式(1)所示。

      (1)

      CART分類樹的建立就是不斷選擇基尼系數(shù)最小的劃分點(diǎn)和特征進(jìn)行二分類,預(yù)測時(shí)選擇樣本點(diǎn)所在葉節(jié)點(diǎn)中概率最大的值。

      基于回歸樹的集成學(xué)習(xí)算法,其本質(zhì)是在預(yù)測時(shí),考慮處于回歸樹森林中的多棵回歸樹的預(yù)測結(jié)果,最終優(yōu)化模型整體的預(yù)測結(jié)果。其中,隨機(jī)森林算法使用CART樹作為弱學(xué)習(xí)器,在學(xué)習(xí)器的集成上使用了bagging原理,其中各個(gè)弱學(xué)習(xí)器之間沒有關(guān)系。隨機(jī)森林的特點(diǎn)在于,隨機(jī)選取一部分樣本特征作為決策樹子樹劃分的依據(jù),使得模型的泛化能力更強(qiáng)。在進(jìn)行分類預(yù)測時(shí),采用投票法(分類樹)或取均值(回歸樹)作為輸出。

      而GBDT算法則采用了boosting原理,用前一輪迭代得到的強(qiáng)學(xué)習(xí)器和損失函數(shù)建立弱學(xué)習(xí)器,使得本輪的損失函數(shù)最小,進(jìn)而構(gòu)造更強(qiáng)的學(xué)習(xí)器。通過前一次的結(jié)果改變新增弱學(xué)習(xí)器的分類或回歸方式,通過集成來不斷嘗試提高整體強(qiáng)學(xué)習(xí)器正確率P(Precision)。

      4.3 情緒預(yù)測實(shí)驗(yàn)設(shè)置

      我們基于用戶不同日期間數(shù)據(jù)的獨(dú)立性,設(shè)計(jì)了一個(gè)包含三個(gè)使用不同訓(xùn)練數(shù)據(jù)進(jìn)行測試的對比實(shí)驗(yàn)框架,并且在這個(gè)框架下,驗(yàn)證不同情感標(biāo)簽補(bǔ)充方法合并情感標(biāo)簽與否的效果優(yōu)劣。對比實(shí)驗(yàn)框架的設(shè)計(jì)思路是: 選取某用戶某天的數(shù)據(jù)作為測試集,在余下的數(shù)據(jù)中選擇訓(xùn)練數(shù)據(jù)。訓(xùn)練手段采用GBDT和RF算法。框架內(nèi)包含的三個(gè)實(shí)驗(yàn)如下:

      實(shí)驗(yàn)一基于全體數(shù)據(jù)的學(xué)習(xí)和預(yù)測,將其余所有數(shù)據(jù)作為訓(xùn)練集。

      實(shí)驗(yàn)二僅使用自身數(shù)據(jù)的學(xué)習(xí)和預(yù)測,將該用戶的其余數(shù)據(jù)作為訓(xùn)練集。

      實(shí)驗(yàn)三僅使用他人數(shù)據(jù)進(jìn)行預(yù)測,使用其他人的數(shù)據(jù)作為訓(xùn)練集。

      上述三個(gè)實(shí)驗(yàn)均使用用戶情感預(yù)測的正確率作為評價(jià)標(biāo)準(zhǔn),分別計(jì)算數(shù)據(jù)集上的平均正確率和用戶的平均正確率。

      其中,實(shí)驗(yàn)一與實(shí)驗(yàn)二對比,可以驗(yàn)證他人數(shù)據(jù)的有無是否對情感預(yù)測有積極影響;實(shí)驗(yàn)一與實(shí)驗(yàn)三對比,可以驗(yàn)證在僅有他人數(shù)據(jù)的情況下是否能夠進(jìn)行相對準(zhǔn)確的預(yù)測;三者對比,可以對不同人認(rèn)知情感的偏差這一現(xiàn)象進(jìn)行分析。

      4.4 實(shí)驗(yàn)結(jié)果分析

      實(shí)驗(yàn)一 基于全體數(shù)據(jù)的學(xué)習(xí)預(yù)測

      使用GBDT和RF方法,在4個(gè)數(shù)據(jù)集上進(jìn)行基于全體數(shù)據(jù)的學(xué)習(xí)和預(yù)測,其平均正確率如表5所示。由表5可知,使用隨機(jī)猜測方法的對照組命中率接近于用戶情緒類別的倒數(shù),而使用用戶的生活日志數(shù)據(jù)進(jìn)行情感預(yù)測可以得到相對較優(yōu)的結(jié)果。其中,在使用全部數(shù)據(jù)時(shí),GBDT的表現(xiàn)要優(yōu)于RF,由4個(gè)數(shù)據(jù)集結(jié)果比較可知,無論是否合并標(biāo)簽數(shù)據(jù),使用基于活動(dòng)的情感標(biāo)簽填充方式的表現(xiàn)都要明顯好于基于標(biāo)簽的填充方式,這表明使用基于活動(dòng)的標(biāo)簽填充方式所補(bǔ)充的數(shù)據(jù)更加貼近于用戶的實(shí)際情感數(shù)據(jù)。進(jìn)一步表明,用戶的情緒變化依賴于活動(dòng),在短時(shí)間內(nèi)進(jìn)行同一活動(dòng)的情況下情緒傾向于穩(wěn)定;而在活動(dòng)狀態(tài)進(jìn)行轉(zhuǎn)換時(shí),用戶的情緒也傾向于發(fā)生變化。此外,活動(dòng)類別的分割對于預(yù)測正確率有一定提升。

      表5 是否分割活動(dòng)類別結(jié)果對比(%)

      對于情感標(biāo)簽合并的效果而言,由原有的11分類問題簡化為5分類問題后,正確率確實(shí)有所提高,但并沒有顯著提高正確率,這與原有數(shù)據(jù)集中情感標(biāo)簽并非均勻分布有關(guān)。

      統(tǒng)計(jì)GBDT方法在活動(dòng)填充-合并數(shù)據(jù)集上得到的各用戶平均正確率,繪制圖6,對結(jié)果進(jìn)行用戶粒度的分析。在基于全體數(shù)據(jù)的學(xué)習(xí)和預(yù)測中,患者用戶達(dá)到的最高預(yù)測正確率為56.46%,而除1號、6號、7號之外的用戶的平均正確率可達(dá)50.51%。對于5號和14號用戶,其正確率可以達(dá)到93.26%和75.21%。表明基于生活日志和情感標(biāo)簽,可以對部分用戶進(jìn)行有效的預(yù)測。

      表6 實(shí)驗(yàn)一不同數(shù)據(jù)集結(jié)果對比(%)

      對于數(shù)據(jù)異常的6號用戶,經(jīng)比對預(yù)測結(jié)果和情感標(biāo)簽,發(fā)現(xiàn)該用戶傾向于將大多數(shù)標(biāo)簽標(biāo)注為“愉悅”等積極情感,而基于全體數(shù)據(jù)訓(xùn)練的模型對此給出的預(yù)測則大多數(shù)為“平靜”。這說明6號用戶的標(biāo)注可能存在個(gè)人偏差,即情感標(biāo)注與實(shí)際情緒不一致。

      圖6 實(shí)驗(yàn)一用戶平均正確率

      實(shí)驗(yàn)二 僅使用用戶自身數(shù)據(jù)的學(xué)習(xí)預(yù)測

      GBDT和RF在僅使用用戶自身數(shù)據(jù)時(shí),用同樣方法繪制用戶粒度分析圖(見圖7)。由圖7可見,大部分用戶的數(shù)據(jù)中,實(shí)驗(yàn)一的平均正確率要高于實(shí)驗(yàn)二的平均正確率。然而也存在反常的用戶,1號、6號和7號用戶僅在使用自己的數(shù)據(jù)時(shí),取得較高的正確率,而9號用戶在使用自己的數(shù)據(jù)時(shí),正確率反而偏低。對于這些反常用戶進(jìn)行預(yù)測結(jié)果和用戶標(biāo)簽的比對后發(fā)現(xiàn),1號和7號與6號相反,傾向于向數(shù)據(jù)集中標(biāo)注“無聊”和“抑郁”;9號用戶的標(biāo)注則表現(xiàn)為每天的情感較為單一,但每天之間情感差異很大,導(dǎo)致實(shí)驗(yàn)二中,多數(shù)情況下測試集中幾乎不包含訓(xùn)練集的數(shù)據(jù)。

      圖7 實(shí)驗(yàn)二用戶平均正確率

      綜合實(shí)驗(yàn)一和實(shí)驗(yàn)二的結(jié)果,我們提出了用戶認(rèn)知不一致現(xiàn)象的猜想。該現(xiàn)象的表現(xiàn)有兩個(gè),一是1號、6號和7號展現(xiàn)的用戶對自己情緒的認(rèn)知與實(shí)際情緒之間存在不一致;二是用戶之間對于相同情緒的認(rèn)識(shí)不盡相同。當(dāng)算法的預(yù)測,尤其是基于全部用戶數(shù)據(jù)的多種方法預(yù)測接近且與用戶的標(biāo)簽不一致時(shí),不能簡單地當(dāng)作錯(cuò)誤來認(rèn)識(shí),應(yīng)考慮用戶認(rèn)知不一致現(xiàn)象發(fā)生的可能性。此時(shí)的預(yù)測結(jié)果有其特別的意義,代表著判斷出的用戶未能察覺或者認(rèn)識(shí)錯(cuò)誤的潛在情緒。

      實(shí)驗(yàn)三 僅使用他人數(shù)據(jù)的學(xué)習(xí)預(yù)測

      本實(shí)驗(yàn)的用戶平均正確率如圖8所示。

      圖8 實(shí)驗(yàn)三用戶平均正確率

      由圖8可知,對于大部分新用戶,僅使用他人數(shù)據(jù)預(yù)測也有相當(dāng)高的正確率,對于編號15的患者用戶而言,使用一般用戶數(shù)據(jù)進(jìn)行情感預(yù)測的正確率可以達(dá)到56.46%。表明患者的情緒可以使用一般人數(shù)據(jù)進(jìn)行正常預(yù)測。其意義在于: 一方面說明患者情緒和一般用戶情緒與生活日志數(shù)據(jù)的對應(yīng)規(guī)律大體相同,并非不可預(yù)測;另一方面,訓(xùn)練相應(yīng)的情緒預(yù)測模型,不需要采集大量的患者數(shù)據(jù),使用一般用戶數(shù)據(jù)即可得到相對較好的結(jié)果。另外,對比實(shí)驗(yàn)二和實(shí)驗(yàn)三的數(shù)據(jù)可以發(fā)現(xiàn),對于大多數(shù)用戶,完全使用用戶自己的數(shù)據(jù)進(jìn)行預(yù)測的準(zhǔn)確性要略高于僅使用他人數(shù)據(jù),這說明個(gè)人數(shù)據(jù)所帶有的偏差確實(shí)會(huì)影響情緒預(yù)測的正確率。

      5 總結(jié)與未來工作

      本文是首個(gè)利用生活日志數(shù)據(jù)進(jìn)行抑郁癥用戶情緒識(shí)別和分析的工作,對基于生活日志的情緒識(shí)別方法在此方面的應(yīng)用可行性進(jìn)行了驗(yàn)證。

      這項(xiàng)工作中,我們從零開始收集和整合用戶的生活日志和情感標(biāo)簽數(shù)據(jù),構(gòu)建了包含兩類用戶的生活日志情感數(shù)據(jù)集,并進(jìn)行了數(shù)據(jù)的統(tǒng)計(jì)分析。我們以GBDT和RF作為訓(xùn)練模型,設(shè)計(jì)了包含使用全體數(shù)據(jù)、用戶自身數(shù)據(jù)和僅使用他人數(shù)據(jù)的三個(gè)對比實(shí)驗(yàn)的框架進(jìn)行了實(shí)驗(yàn),比對了情感標(biāo)簽不同補(bǔ)充方式的效果和不同用戶的訓(xùn)練數(shù)據(jù)之間的偏差對于識(shí)別正確率的影響。提出了有關(guān)用戶認(rèn)知不一致問題的猜想,并對其進(jìn)行了分析。該現(xiàn)象的發(fā)現(xiàn)對于心理抑郁分析有一定的啟示作用,但徹底確認(rèn)還需更多數(shù)據(jù)支持。

      未來我們將收集更大規(guī)模的數(shù)據(jù)集以供進(jìn)一步的實(shí)驗(yàn),從而探究用戶認(rèn)知不一致現(xiàn)象和提高模型的可靠性。同時(shí),需要發(fā)掘更加準(zhǔn)確的情感記錄手段,使用戶的情感記錄更加貼近實(shí)際。此外,還要結(jié)合心理學(xué)的研究與實(shí)踐,改進(jìn)模型效果,提出新模型。

      猜你喜歡
      日志正確率標(biāo)簽
      一名老黨員的工作日志
      門診分診服務(wù)態(tài)度與正確率對護(hù)患關(guān)系的影響
      扶貧日志
      心聲歌刊(2020年4期)2020-09-07 06:37:14
      無懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      游學(xué)日志
      生意
      品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
      生意
      標(biāo)簽化傷害了誰
      江都市| 宣化县| 元谋县| 阳山县| 夹江县| 炎陵县| 墨竹工卡县| 上饶市| 公主岭市| 瑞丽市| 资溪县| 安化县| 云梦县| 出国| 浠水县| 桑日县| 阿荣旗| 清远市| 旬阳县| 霍邱县| 蓬安县| 任丘市| 凉城县| 杂多县| 尼玛县| 天等县| 厦门市| 莱芜市| 上高县| 太康县| 台江县| 文成县| 大庆市| 黑水县| 金山区| 台前县| 辽阳市| 和田县| 龙游县| 清涧县| 临猗县|