(北京科技大學(xué)土木與資源工程學(xué)院,北京,100083)
社會(huì)工業(yè)化和城市地下空間的不斷發(fā)展使得有限空間作業(yè)環(huán)境增多,有限空間由于其作業(yè)空間小、進(jìn)出口常處于關(guān)閉狀態(tài)而容易導(dǎo)致溫度和濕度較高。高溫環(huán)境指35℃以上的生活環(huán)境和32℃以上的生產(chǎn)環(huán)境,高濕環(huán)境指相對(duì)濕度在60%以上的環(huán)境[1]。高溫高濕環(huán)境使得人體產(chǎn)生熱應(yīng)力,熱應(yīng)力會(huì)使人感覺(jué)意識(shí)模糊、疲勞乏力,較大的熱應(yīng)力會(huì)導(dǎo)致人產(chǎn)生熱疾病甚至死亡[2-4]。LIND等[5]認(rèn)為人體進(jìn)入高溫高濕環(huán)境時(shí),失水量逐漸增多,從而導(dǎo)致人體不能形成熱適應(yīng),在高溫高濕環(huán)境下,在較短時(shí)間內(nèi)停留能避免環(huán)境對(duì)人體的傷害。有限空間作業(yè)環(huán)境并非專門(mén)用于人員作業(yè),一般不設(shè)置固定式溫度濕度傳感器,而手持式溫度濕度測(cè)量?jī)x在有限空間內(nèi)操作復(fù)雜且占用人力資源,作業(yè)人員對(duì)溫度、濕度難以精確判斷,因而,無(wú)法主觀辨別進(jìn)入的有限空間是否為高溫高濕環(huán)境,缺乏相應(yīng)的警覺(jué)心理。人體進(jìn)入高溫高濕環(huán)境時(shí),為適應(yīng)環(huán)境會(huì)自動(dòng)調(diào)整產(chǎn)熱與散熱的平衡[6],從而導(dǎo)致人體的相關(guān)生理參數(shù)發(fā)生變化,如血管擴(kuò)張、心跳加速、每博輸出量減少、血壓改變等[7-8]。人體的光電容積脈搏波(photoplethysmography,PPG)含有心臟搏動(dòng)、血管、呼吸頻率、血壓等信息[9-10],信號(hào)的測(cè)量簡(jiǎn)單快速,不對(duì)人體產(chǎn)生創(chuàng)傷,是一種合適的反映人體生理狀態(tài)的信號(hào)。隨著智能穿戴設(shè)備的發(fā)展,在線實(shí)時(shí)監(jiān)測(cè)PPG信號(hào)并進(jìn)行數(shù)據(jù)處理成為可能。金龍哲等[11-12]通過(guò)監(jiān)測(cè)人體的PPG信號(hào),分析人體生理狀態(tài)進(jìn)而判斷其所處的環(huán)境。當(dāng)人體處于舒適環(huán)境和高溫高濕環(huán)境中時(shí),其生理狀態(tài)存在差異,本文通過(guò)PPG信號(hào)的差異性對(duì)高溫高濕環(huán)境和舒適環(huán)境這2種模式進(jìn)行識(shí)別。傳統(tǒng)的統(tǒng)計(jì)學(xué)方法對(duì)信號(hào)進(jìn)行識(shí)別時(shí)需要進(jìn)行特征提取,人為設(shè)計(jì)特征提取方法存在特征提取不完全、特征有效性低、信息處理速度慢等問(wèn)題[13-15]。本文利用深度學(xué)習(xí)自動(dòng)提取PPG信號(hào)中的特征并進(jìn)行分類,通過(guò)殘差神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程,保證卷積層提取到特征的有效性和完備性,提高模式識(shí)別的準(zhǔn)確率[16-19]。
實(shí)驗(yàn)設(shè)置的高溫高濕環(huán)境為:溫度35℃,相對(duì)濕度80%。根據(jù)PMV(predictedmean vote)指數(shù)[19]設(shè)置正常舒適環(huán)境的溫度為25℃,相對(duì)濕度為30%。實(shí)驗(yàn)人員共15名,包括8名男生(平均年齡22歲)和7名女生(平均年齡22歲),這15名被試人員的生理狀態(tài)良好,實(shí)驗(yàn)前無(wú)飲酒、飲用咖啡、藥物治療等情況。實(shí)驗(yàn)地點(diǎn)為北京科技大學(xué)土木與資源工程學(xué)院微環(huán)境實(shí)驗(yàn)室,該實(shí)驗(yàn)室能夠調(diào)節(jié)內(nèi)部溫度、濕度及各種氣體環(huán)境。本實(shí)驗(yàn)經(jīng)北京科技大學(xué)倫理道德委員會(huì)批準(zhǔn)。
實(shí)驗(yàn)開(kāi)始前,調(diào)節(jié)實(shí)驗(yàn)室環(huán)境到指定的溫度和濕度,調(diào)節(jié)完成后被試人員進(jìn)入環(huán)境內(nèi)。待實(shí)驗(yàn)室環(huán)境進(jìn)一步穩(wěn)定后,開(kāi)始采集被試人員的PPG信號(hào)。采集完畢后,實(shí)驗(yàn)人員離開(kāi)實(shí)驗(yàn)室充分休息,休息結(jié)束后進(jìn)行下一次實(shí)驗(yàn)。本次實(shí)驗(yàn)共進(jìn)行30組,每組采集數(shù)據(jù)時(shí)間為3~5min,實(shí)驗(yàn)設(shè)備采樣頻率為500 Hz。采集到的PPG信號(hào)如圖1所示。
圖1 PPG信號(hào)振幅與時(shí)間的關(guān)系Fig.1 Relationship between amplitude and timeof PPG signal
采集數(shù)據(jù)過(guò)程中由于存在電磁輻射、呼吸、運(yùn)動(dòng)等干擾,因而信號(hào)存在較多噪聲,需要對(duì)信號(hào)進(jìn)行預(yù)處理。信號(hào)處理軟件為Matlab,具體處理過(guò)程如下。
1)剔除野值。原始的PPG信號(hào)可能存在野值,根據(jù)不同個(gè)體差異設(shè)置不同的過(guò)濾閾值將野值剔除。
2)去除基線漂移。PPG信號(hào)采集過(guò)程中出現(xiàn)的基線漂移是采集過(guò)程中被試細(xì)微運(yùn)動(dòng)造成的,以“db5”小波基對(duì)原始信號(hào)進(jìn)行10級(jí)分解,利用第8級(jí)近似分量重建信號(hào),獲得信號(hào)的基線漂移趨勢(shì)并去除。
3)小波去噪。利用小波變換rigrsure閾值規(guī)則對(duì)信號(hào)進(jìn)行去噪,該閾值規(guī)則使用無(wú)偏風(fēng)險(xiǎn)估計(jì)。設(shè)置閾值方法為“soft”,閾值尺度的調(diào)整方法為“sln”。離散小波變換的級(jí)數(shù)為5,小波基為“db5”。
4)去除高頻噪聲。高頻噪聲出現(xiàn)的原因主要是存在電磁輻射。利用滑動(dòng)平均濾波器對(duì)信號(hào)進(jìn)行平滑處理去除高頻噪聲,滑動(dòng)平均的窗寬設(shè)置為20。
5)歸一化處理。傳統(tǒng)的數(shù)據(jù)歸一化方法是將全部的數(shù)據(jù)同時(shí)進(jìn)行歸一化,保證數(shù)據(jù)進(jìn)行相同縮放,保留較多的信息。由于不同個(gè)體的PPG信號(hào)振幅存在較大差異,這種差異大于由于環(huán)境變化所引起的PPG信號(hào)差異,因而,在進(jìn)行歸一化時(shí),將不同個(gè)體的PPG信號(hào)分別進(jìn)行歸一化。此方法可以將信號(hào)振幅內(nèi)所包含的信息去除,降低了個(gè)體間的差異。歸一化使用matlab的mapminmax函數(shù)將數(shù)據(jù)歸一化到[-1,1]。
數(shù)據(jù)預(yù)處理后得到較高信噪比的信號(hào),數(shù)據(jù)預(yù)處理過(guò)程中信號(hào)的能量與頻率的關(guān)系如圖2所示。
圖2 數(shù)據(jù)預(yù)處理過(guò)程信號(hào)的能量與頻率的關(guān)系Fig.2 Relationship between energy and frequency of predisposing signal of data
為保證PPG信號(hào)的識(shí)別速度,將采集的3~5min之內(nèi)的信號(hào)切分為每256個(gè)采樣點(diǎn)為1組數(shù)據(jù),每組數(shù)據(jù)含有1個(gè)以上完整波形,共獲得7 200組數(shù)據(jù)。采取隨機(jī)切割的方法對(duì)數(shù)據(jù)進(jìn)行切割。從隨機(jī)點(diǎn)開(kāi)始,依次切割數(shù)據(jù),且在切割過(guò)程中數(shù)據(jù)未重復(fù)使用。數(shù)據(jù)切割完成后,利用reshape函數(shù)將數(shù)據(jù)從一維拓展到二維,即從1×256轉(zhuǎn)換為16×16,以提高訓(xùn)練準(zhǔn)確率。
數(shù)據(jù)切割完成后,將數(shù)據(jù)隨機(jī)分為訓(xùn)練集和測(cè)試集,訓(xùn)練集含有6 480組數(shù)據(jù),測(cè)試集含有720組數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程屬于有監(jiān)督學(xué)習(xí),因而,需要對(duì)每組數(shù)據(jù)進(jìn)行標(biāo)記,本文將高溫高濕環(huán)境下采集的PPG信號(hào)標(biāo)記為1,將舒適環(huán)境采集的PPG信號(hào)標(biāo)記為0。
2.1.1 激活函數(shù)
激活函數(shù)是神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)內(nèi)部的映射函數(shù),該函數(shù)能夠保證計(jì)算過(guò)程的非線性。隨著神經(jīng)網(wǎng)絡(luò)層數(shù)和每層神經(jīng)元個(gè)數(shù)增加,神經(jīng)網(wǎng)絡(luò)內(nèi)部激活函數(shù)的個(gè)數(shù)也會(huì)增加,提高了神經(jīng)網(wǎng)絡(luò)的復(fù)雜度。
本文激活函數(shù)使用ReLU(rectified lineruints)函數(shù),該函數(shù)的表達(dá)式為
該函數(shù)的輸入范圍為實(shí)數(shù)域,輸出范圍為[0,+∞)。ReLU函數(shù)由于沒(méi)有受指數(shù)函數(shù)的影響,因而簡(jiǎn)化了計(jì)算過(guò)程,提高了計(jì)算速度,使得整個(gè)神經(jīng)網(wǎng)絡(luò)的計(jì)算成本降低。
2.1.2 優(yōu)化算法
本文所使用的優(yōu)化算法為Adam(adaptive momentestimation)算法。Adam算法是一種一階優(yōu)化算法,它能基于訓(xùn)練數(shù)據(jù)迭代更新神經(jīng)網(wǎng)絡(luò)權(quán)重。Adam算法兼具AdaGrad(adaptive gradient algorithm)和RMSProp(rootmean square prop)算法的優(yōu)點(diǎn)。Adam算法基于一階矩均值計(jì)算適應(yīng)性參數(shù)學(xué)習(xí)率,同時(shí)利用了梯度的二階矩均值。
2.1.3 損失函數(shù)
本文使用交叉熵函數(shù)作為損失函數(shù),公式為式中:H為交叉熵;P為表征真實(shí)值分布情況的變量;Q為表征預(yù)測(cè)值分布情況的變量。交叉熵可以用于衡量P和Q分布的相似性。
利用Tensorflow搭建殘差神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)中包含4個(gè)卷積層、4個(gè)批歸一化層、4個(gè)ReLU層和2個(gè)全連接層。卷積層具體參數(shù)設(shè)置如表1所示。
表1 卷積層超參數(shù)Table1 Convolution layer superparameters
原始的數(shù)據(jù)經(jīng)過(guò)人為歸一化處理,然而,中間層數(shù)據(jù)隨著訓(xùn)練參數(shù)的更新,數(shù)據(jù)分布發(fā)生變化,當(dāng)網(wǎng)絡(luò)層數(shù)較多時(shí),中間層輸入數(shù)據(jù)的分布變化較大,從而使得網(wǎng)絡(luò)的泛化性能降低,因而,數(shù)據(jù)在進(jìn)入ReLU函數(shù)之前進(jìn)行批歸一化處理,以便解決訓(xùn)練的中間層數(shù)據(jù)分布發(fā)生變化的情況。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
訓(xùn)練過(guò)程迭代時(shí),每個(gè)批次喂入數(shù)據(jù)120組,共喂入54個(gè)批次。迭代次數(shù)設(shè)置為3 000次,當(dāng)測(cè)試集準(zhǔn)確率高于98%時(shí)自動(dòng)停止迭代。停止迭代后,將所有訓(xùn)練集和測(cè)試集數(shù)據(jù)輸入模型,并根據(jù)輸出結(jié)果與標(biāo)記的結(jié)果進(jìn)行對(duì)比以獲得模型的準(zhǔn)確率、損失值及評(píng)價(jià)指標(biāo)。
殘差神經(jīng)網(wǎng)絡(luò)訓(xùn)練共進(jìn)行了489次迭代。在迭代過(guò)程中,訓(xùn)練集準(zhǔn)確率、測(cè)試集準(zhǔn)確率、訓(xùn)練集交叉熵、測(cè)試集交叉熵如圖4所示。從圖4可見(jiàn):最終模型的訓(xùn)練集準(zhǔn)確率為99.8%,測(cè)試集準(zhǔn)確率為98.3%,訓(xùn)練集交叉熵為0.363,測(cè)試集交叉熵為0.383。訓(xùn)練集與測(cè)試集準(zhǔn)確率相差較小,為1.5%,因而認(rèn)為該網(wǎng)絡(luò)的訓(xùn)練結(jié)果有較強(qiáng)的泛化能力。
圖3 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Neuralnetwork structure
圖4 訓(xùn)練過(guò)程中準(zhǔn)確率與迭代次數(shù)的關(guān)系Fig.4 Relationship between accuracy and iteration times in training iteration processes
混淆矩陣是分析模型訓(xùn)練結(jié)果的重要方法,可以通過(guò)混淆矩陣判斷模型的分類能力。神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果的混淆矩陣如圖5所示(其中,坐標(biāo)刻度數(shù)據(jù)0和1為標(biāo)簽,是對(duì)數(shù)據(jù)的一種標(biāo)記)。從圖5可見(jiàn):模型在測(cè)試集的準(zhǔn)確率為98.3%;在訓(xùn)練集中,高溫高濕環(huán)境和舒適環(huán)境的查準(zhǔn)率分別為99.8%和99.8%,查全率分別為99.8%和99.8%;在測(cè)試集中,高溫高濕環(huán)境和舒適環(huán)境的PPG信號(hào)查準(zhǔn)率分別為96.9%和99.7%,查全率分別為99.7%和97.1%。高溫高濕環(huán)境雖然對(duì)人體產(chǎn)生不良影響,然而,該影響并不是瞬時(shí)的和致命性的,因而,對(duì)高溫高濕傷害預(yù)警的查準(zhǔn)率更關(guān)鍵,訓(xùn)練集和測(cè)試集對(duì)高溫高濕環(huán)境的查準(zhǔn)率相差2.9%,因而認(rèn)為通過(guò)訓(xùn)練所得的模型在實(shí)際使用中有較強(qiáng)的泛化能力,能夠?qū)Ω邷馗邼癍h(huán)境和舒適環(huán)境的PPG信號(hào)進(jìn)行較好識(shí)別。
受試者工作特征曲線(receiver operating characteristic curve,ROC)可以表征模型的分類性能,模型的ROC曲線如圖6所示(真陽(yáng)率指檢測(cè)出來(lái)的真陽(yáng)性樣本數(shù)除以所有真實(shí)陽(yáng)性樣本數(shù);假陽(yáng)率指檢測(cè)出來(lái)的假陽(yáng)性樣本數(shù)除以所有真實(shí)陽(yáng)性樣本數(shù))。ROC曲線與橫坐標(biāo)所圍成的面積為AUC,AUC與分類性能的關(guān)系如表2所示。由圖6可知:訓(xùn)練集和測(cè)試集ROC的AUC都接近于1,因而認(rèn)為訓(xùn)練所得的模型能夠?qū)PG信號(hào)進(jìn)行準(zhǔn)確分類。
圖5 混淆矩陣Fig.5 Confusion matrixes
圖6 ROC曲線Fig.6 ROC curves
表2 AUC與分類性能Table2 AUC and classification performance
利用PPG信號(hào)進(jìn)行預(yù)警時(shí),需要采集人體的PPG信號(hào)。使用本文方法,在采集頻率為500 Hz時(shí),每次使用256個(gè)采集點(diǎn),需要時(shí)間為0.512 s,即人體進(jìn)入高溫高濕環(huán)境在生理參數(shù)自動(dòng)調(diào)整后的0.512 s時(shí)開(kāi)始發(fā)出預(yù)警,這樣,在較短的預(yù)警時(shí)間能夠保證進(jìn)入高溫高濕環(huán)境的人員及時(shí)知曉自身當(dāng)前生理狀態(tài),提高警惕以保證自身安全,同時(shí)能夠使得作業(yè)人員在工作一定時(shí)間后及時(shí)退出高溫高濕環(huán)境進(jìn)行休息,減少身體損傷。
1)人體在高溫高濕環(huán)境和舒適環(huán)境產(chǎn)生的PPG信號(hào)存在差異,通過(guò)殘差神經(jīng)網(wǎng)絡(luò)訓(xùn)練獲得的模型能夠識(shí)別這種差異,進(jìn)而對(duì)人體是否處于高溫高濕環(huán)境進(jìn)行預(yù)警。
2)通過(guò)訓(xùn)練殘差神經(jīng)網(wǎng)絡(luò)對(duì)人體處于不同環(huán)境的PPG信號(hào)進(jìn)行識(shí)別分類,訓(xùn)練集和測(cè)試集的準(zhǔn)確率分別為99.8%和98.3%,對(duì)高溫高濕環(huán)境的查準(zhǔn)率分別為99.8%和96.9%;該模型的AUC接近1.00,分類性能優(yōu)良,有較強(qiáng)的泛化能力。
3)預(yù)警模型輸入的數(shù)據(jù)為0.512 s采集到的PPG信號(hào)。人體進(jìn)入高溫高濕環(huán)境時(shí)生理參數(shù)發(fā)生變化,在變化后的0.512 s即可對(duì)作業(yè)人員發(fā)出預(yù)警。