劉語詩 趙秀栩 馮鶴云 顏 延*
1(武漢理工大學機電工程學院 武漢 430070)
2(數(shù)字制造湖北省重點實驗室 武漢 430070)
3(中國科學院深圳先進技術研究院 深圳 518055)
神經退行性疾病(Neural Degenerative Diseases,NDDs)患者步態(tài)異常,嚴重影響日常行動,臨床癥狀表現(xiàn)為行走過程中震顫、動作遲緩等步態(tài)異常。其中,最常見的疾病患者有 3種:肌硬化癥(Amyotrophic lateral sclerosis,ALS)患者(步態(tài)如圖 1 所示)、亨廷頓病(Huntington’s Disease,HD)患者(步態(tài)如圖 2 所示)以及帕金森病(Parkinson’s Disease,PD)患者(步態(tài)如圖 3所示)。由圖 1~3 可知,在行走模式上,不同的 NDDs 患者會表現(xiàn)出不同的異常特征,因此,從病人步態(tài)信息中提取 NDDs 評估特征和生物標記,研究正常受試者(步態(tài)如圖 4 所示)和患有NDDs 受試者的步態(tài)差異,進行異常步態(tài)的檢測和識別,對 NDDs 的早期監(jiān)測、健康風險預警和病程評估都具有重要意義。
圖1 肌硬化癥步態(tài)示意圖Fig. 1 Gait diagram of muscular sclerosis
圖2 亨廷頓病步態(tài)示意圖Fig. 2 Gait diagram of Huntington’s disease
圖3 帕金森病步態(tài)示意圖Fig. 3 Gait diagram of Parkinson’s disease
圖4 正常受試者步態(tài)示意圖Fig. 4 Schematic diagram of normal subjects’ gait
在行走過程中,人體從同一只腳跟離地跨出到再次腳跟著地的行進過程被稱為一個步態(tài)周期,重復該動作的時間間隔被稱為步幅。一個步態(tài)周期可進一步地被劃分為支撐相(下肢接觸地面及承重力的時間)和擺動相(腳離開地面向前邁步到再次落地之間的時間)[1-2]。步態(tài)動力學能夠揭示不同 NDDs 患者的運動障礙與行走模式。在行走過程中,ALS 患者主要表現(xiàn)為肌無力、肌肉萎縮、束縛等引起的肌肉運動障礙[3];HD 患者的特征則是表現(xiàn)為不自主地抽搐[4];PD 患者的步態(tài)障礙尤為明顯,主要表現(xiàn)為靜態(tài)震顫、步態(tài)凍結等[5]。由于步態(tài)異常模式的多樣化,相關研究者們將許多生物標志物和分析方法用于異常步態(tài)的檢測與評估。
利用人體傳感信息進行異常步態(tài)識別,是健康檢測領域快速發(fā)展的重要課題之一。近年來,學者們主要從 4 個方面開展異常步態(tài)的識別:基于計算機視覺的步態(tài)識別、基于肌電信號的步態(tài)識別、基于慣性傳感器的步態(tài)識別以及基于足底壓力的步態(tài)識別。研究發(fā)現(xiàn),可靠、精確的異常步態(tài)監(jiān)測手段,能輔助醫(yī)生診斷疾病,也可以用于日常生活中保健與智能疾病的監(jiān)測。1994 年,麻省理工學院的 Niyogi 等[6]從步態(tài)圖像中提取時域、頻域特征用來識別步態(tài),發(fā)現(xiàn)不同個體的步態(tài)能夠得到有效鑒別,從此基于計算機視覺的步態(tài)識別開啟了新篇章。Tang 等[7]將步態(tài)周期按不同的階段輸入卷積神經網(wǎng)絡模型,并結合視頻提取有效的連續(xù)輪廓差異圖,實現(xiàn)了步態(tài)檢測,在公共數(shù)據(jù)集上取得了較高的精度。徐俞弢等[8]利用 Vicon 系統(tǒng)獲取左右腳踝的運動軌跡,進而分析個人的左右步態(tài)對稱性。2019 年,趙雨佳[9]提出了一種基于稀疏學習的方法,該方法可篩選出有效的疾病特征,實現(xiàn)對 NDDs 的早期檢測,對不同疾病的分類可達到90% 左右的準確率。21 世紀初,Anderson 等[10]首次將肌電信號加入步態(tài)動作的研究中,從此,基于肌電信號的步態(tài)識別成為一個新的研究方向。2019 年,Becker 等[11]采集了實驗者在跑步時的 6 塊下肢肌電信號,并通過評估發(fā)現(xiàn),6 塊肌肉中的比目魚肌的肌電信號與步速具有良好的相關性,可通過肌電信號的強弱來判斷步速的大小。Zawawi 等[12]提取了步態(tài)肌電信號的電壓均方根、頻率平均值、方差以及標準差 4 個特征,并對肌肉骨骼疾病健康檢查任務中的肌電進行分類,實驗結果表明,基于支持向量機的分類準確率超過 80%,能夠幫助康復中心進行疾病診斷。目前,基于慣性傳感器的步態(tài)識別是研究較為廣泛的步態(tài)識別。Mileti 等[13]提出一種可對 PD 患者腿部的加速度數(shù)據(jù)進行分類的馬爾可夫模型,實驗結果表明,該方法在異常步態(tài)的檢測上效果顯著。Camps 等[14]提出了基于深度學習的模型,通過從腰部采集傳感器數(shù)據(jù),來進行異常步態(tài)的識別,實驗結果證明,腰部的傳感器數(shù)據(jù)可以很好地區(qū)分不同類型的步態(tài)。Lee 等[15]利用從慣性傳感器獲取三軸加速度信息和角速度信息來區(qū)分不同步態(tài),并在正常人與偏癱患者的兩種步態(tài)中得到了驗證。通過可穿戴式鞋子中的傳感器提取行走過程中的力信號,基于足底壓力傳感器可以準確獲得步幅、支撐相以及擺動相的足底壓力信息。Hausdorff[16]提出一種基于分形的分析方法來顯示步幅波動時間序列的變化,并利用步幅間隔波動對步態(tài)節(jié)奏進行統(tǒng)計分析,以利于 PD 檢測,該方法主要利用了信號輪數(shù)和步態(tài)節(jié)律的標準差(σ)等特征[17]。此外,還有學者利用統(tǒng)計參數(shù)對 NDDs 進行分析[18-19],Wahid 等[20]對 PD 患者和健康受試者之間的時空模型進行了研究,提出了一種混合時空模型[21],該模型可用于步態(tài)數(shù)據(jù)中的 PD 檢測,還可對其嚴重程度進行等級劃分。2015 年,Baratin 等[22]運用小波特征證明步態(tài)的不對稱性,并利用步態(tài)的規(guī)律性識別步態(tài),驗證了步態(tài)規(guī)律在步態(tài)識別中的有效性。2018 年,Ye 等[23]提出一種神經網(wǎng)絡自適應能力與模糊邏輯定性方法相結合的自適應神經模糊推理模型,用于神經退行性步態(tài)節(jié)奏波動的分析。Zeng 等[24]提出一種具有較強判別性的確定性學習方法,用于 NDDs 的分類,取得了良好的分類性能?;陔p足運動數(shù)據(jù)融合的時域、頻域分析方法,不僅反映了運動的生理相關性,而且還能夠獲得各種 NDDs 患者運動不對稱的差異特征[25]。2020 年,江俊敏[26]從足底壓力信號中提取了多種步態(tài)信息,并從非線性動力學的角度判斷不同信號的混沌特性以實現(xiàn)對 NDDs 的正常分類。Ren 等[27]提取步態(tài)時間序列中的相位同步指數(shù)以及條件熵兩種特征進行 NDDs 分類。經驗模態(tài)分解[28]、基于規(guī)則的方法[29]、基于距離度量的稀疏編碼[30]、多重分形去趨勢互相關分析[31]、基于模糊遞歸圖的紋理分析[32]等也是 NDDs 識別中步態(tài)節(jié)奏波動分析的重要工具。通過對不同特征的表征能力進行大量研究,進一步證明了 NDDs 是引起步態(tài)異常的主要因素之一。
本文主要從以下 3 個方面進行研究:
(1)基于足底壓力的 NDDs 步態(tài)數(shù)據(jù)庫,采用一種非線性動力學特征分析的步態(tài)建模方法,從步態(tài)周期的不同階段進行特征提取,該方法能對步態(tài)周期間隔時間序列的相空間重構進行拓撲建模,從而提取具有非線性動力學的特征;
(2)在 NDDs 數(shù)據(jù)集中對本實驗方法進行驗證,采用留一交叉驗證,在 ALS、HD 以及 PD患者與正常組的分類識別實驗中,模型的工作特征曲線面積(Area Under Receive-Operator-Curve,AUC)值分別為 0.875 0、0.940 6、0.958 3,具有較高的識別水平;
(3)此外,本實驗還采用固定周期滑動窗對數(shù)據(jù)集進行劃分,再次驗證了本實驗方法的有效性。實驗結果表明,在基于 50 個步態(tài)間隔的時間序列的異常步態(tài)識別中,模型的 AUC 值分別為 0.914 6、0.962 3、0.961 4,明顯優(yōu)于相同數(shù)據(jù)集的其他非線性特征識別的準確率。
本實驗采用的 NDDs 步態(tài)數(shù)據(jù)庫由美國哈佛醫(yī)院提供,是目前被廣泛使用的步態(tài)數(shù)據(jù)集(具體內容見 http://www.physionet.org/physiobank/database/gaitndd)[33]。該數(shù)據(jù)庫主要包括 64 位受試者:健康受試者 16 名,年齡(39.3±18.5)歲,男性 2 名、女性 14 名;ALS 患者 13 名,年齡(54.9±13.4)歲,男性 10 名、女性 3 名;HD 患者 20 名,年齡(47.7±12.2)歲,男性 6 名、女性 14 名;PD 患者 15 名,年齡(66.8±10.9)歲,男性 10 名、女性 5 名。實驗中對不同類型人群在行走過程中的步態(tài)數(shù)據(jù)進行采集,以實現(xiàn)對NDDs 病理生理學機制的研究。該數(shù)據(jù)集中的步態(tài)信號由足底壓力傳感器采集,傳感器內置的模式轉換器有 12 位,采樣頻率為 300 Hz。實驗過程中,每個受試者在長 77 m 的走廊中以正常速度行走 5 min。數(shù)據(jù)集還提供了步態(tài)周期的時間信息、左右足的跨步間隔、左右擺動間隔、左右站姿間隔以及其對應的比例信息。本文主要基于步態(tài)跨步、擺動以及站姿間隔時間序列 3 種步態(tài)階段研究其動態(tài)變化信息。
本實驗時長為 5 min,但走廊長度為 77 m,為保證時長,被試人員在行走過程中需要多次折返,而折返過程會導致數(shù)據(jù)異常,給實驗帶來干擾。因此,本實驗對異常值進行了處理,方法如下:對于每一個時間序列,分別計算出數(shù)據(jù)中的中值(μ)、標準差(s),對于時間序列中的每個值ti,當ti<μ+2s或ti>μ+2s時,ti會被替換成中值,其他數(shù)值不變。此外,由于步態(tài)起步過程中所采集的時間序列不夠穩(wěn)定,所以為了最大限度地減少步態(tài)數(shù)據(jù)的啟動效應,在構建數(shù)據(jù)集時,本實驗將步態(tài)時間序列前 20 s 的數(shù)據(jù)刪除。經上述步驟后,再對數(shù)據(jù)進行歸一化處理,可以大大提高數(shù)據(jù)在運算過程中的收斂速度,從而提高效率。
其中, 為延遲嵌入后的時間序列; 為相空間延遲參數(shù);d為相空間的嵌入維數(shù),選擇適當?shù)那度雲(yún)?shù) 和d能夠提高模型的魯棒性。在以往的研究過程中,也有許多相空間重建的方法被提出,如平均互信息法[36]、選擇最佳延遲參數(shù)的相關策略[37-38]以及基于幾何信息選擇延遲參數(shù)的方法[39]和偽近鄰的算法[35]等?;谙嚓P研究[40]發(fā)現(xiàn),固定 的尺寸不變,不會影響實驗結論的有效性。因此,基于平均互信息法原則及固定的 尺寸,本實驗對時間序列進行最優(yōu)延遲參數(shù)的選擇。先設置不同的延時參數(shù),然后利用分類器分別進行測試,最后選擇 、 作為實驗的最佳參數(shù)。如圖 5 所示,將時間序列映射到空間中形成點云,構建出最佳的相空間系統(tǒng)。
圖5 正常步態(tài)和帕金森異常步態(tài)的三維點云Fig. 5 3D point cloud of normal gait and abnormal gait of Parkinson’s disease
持續(xù)同調是拓撲分析的主要工具之一,對于點云所處的抽象拓撲空間,可通過該工具對其進行分析。分析原理為利用單純復形序列來描述數(shù)據(jù)點之間的關系,提取有效拓撲特征[41]。其中,單純復形是一種利用點(0-單純形)、線(1-單純形)、三角形面(2-單純形)、四面體(3-單純形)等幾何對象來拼接或粘合成整個拓撲空間的數(shù)據(jù)結構(如圖 6 所示)。同理,在高維空間中,由兩個及兩個以上的單純形連接而成的形狀被稱為單純復形。
圖6 單純形Fig. 6 Simplex
持續(xù)同調的建模首先是將拓撲空間中的單個點視為具有半徑的 -小球,不同半徑參數(shù) 的拓撲性質可以采用不同的單純復形表示。在半徑增大的過程中,形成了不同的基于 的單純復形序列(如圖 7 所示),在這個過程中能夠獲取不同拓撲對象的生存信息,從而實現(xiàn)對點云所處抽象拓撲空間的特征描述。具體構建過程如下:
圖7 持續(xù)同調的二維點云建模過程Fig. 7 2D point cloud modeling process based on persistent homology
(1)將點云空間中點的半徑都設置為 ,當半徑較小時,空間中的點相互獨立,此時,數(shù)據(jù)點之間通過 0-單純形進行構建;
(2)隨著 的不斷增大,空間中的 -小球慢慢產生交集,產生交集的個體的數(shù)量開始增多,數(shù)據(jù)點之間開始通過 1-單純形進行構建。隨著半徑繼續(xù)增大,更多的 -小球慢慢產生交集,之前產生交集的數(shù)據(jù)點會不斷地消失,并生成新的融合體,構建出新的單純復形序列。隨著產生交集的數(shù)據(jù)點越來越多,融合體越來越大,單純復形的構建也隨之復雜;
(3)當 增加到無窮大時,所有連接個體融合,之前的所有單純形也合并成一個更加復雜的單純復形結構。
在單純復形構建的過程中會形成不同的拓撲特征:0-階同調孔洞、1-階同調孔洞以及n-階同調孔洞,其中,0-階同調孔洞如圖 8 中的 B0所示,1-階同調孔洞如圖 8 中的 B1所示。在點云的變化過程中,通過持續(xù)條碼記錄不同拓撲特征的持續(xù)狀態(tài)[42],如圖 8 藍色直線所示,直線的長度代表拓撲特征的生存時間,當半徑參數(shù)不同時,會有不同的拓撲特征出現(xiàn)和消失,且每個特征的生存時間不同。對于每個條形碼,都可以用單個序對 進行表示。對于點云所處的拓撲空間,可以用如下集合來表示其特征:
圖8 拓撲空間分析以及拓撲印記的提取Fig. 8 Topological space analysis and topological imprint extraction
其中,M為 0-階同調孔洞的個數(shù);N為 1-階同調孔洞的個數(shù);每個序對為不同狀態(tài)時 0-階同調、1-階同調出生和死亡的時間。
為了提取特征方便,將每個拓撲特征條形碼的出生時間(bi)和死亡時間(di)分別作為坐標軸的x軸和y軸,轉換為如圖 9 所示的持續(xù)散點圖。正常步態(tài)和 PD 異常步態(tài)的持續(xù)散點圖信息如圖 9 所示,通過散點圖可以觀察到不同步態(tài)提取的拓撲特征具有顯著差異,基于該散點圖也可以獲取不同的信息來進行步態(tài)識別。
圖9 不同步態(tài)的出生死亡散點圖Fig. 9 Scatter plot of birth and death in asynchronous state
本研究選取k=1 作為最大值,提取不同步態(tài)的 PL 特征,并將其與機器學習相結合進行分類。提取 PL 特征如圖 10 所示,以帕金森步態(tài)為例,其中藍色代表 0-階同調的 PL 特征,紅色代表 1-階同調的 PL 特征。通過觀察圖 10 可知,正常步態(tài)和異常步態(tài)的 0-階同調的 PL 特征并無明顯區(qū)別,而 1-階同調的 PL 特征圖存在顯著區(qū)別,所以,本文利用基于拓撲分析的 1-階同調的 PL 特征來區(qū)分健康組與異常組的步態(tài)時間序列。
圖10 正常步態(tài)和帕金森異常步態(tài)的 0-階同調、1-階同調的 PL 特征圖Fig. 10 PL features of order 0 homology and order 1 homology of normal gait and Parkinson’s abnormal gait
本研究基于非線性拓撲特征的機器學習算法對正常步態(tài)與異常步態(tài)進行評估,主要包括正常組與 ALS 組、正常組與 HD 組、正常組與 PD 組的 3 個二分類問題,由于數(shù)據(jù)集中包含的對象數(shù)量有限,所以本實驗采用了留一交叉驗證的方法。文獻[3,16,24]中存在相同的識別問題,即采用數(shù)據(jù)集中的一個單獨樣本作為該任務的測試樣本,其余則作為訓練樣本,以更好地提取有效特征。為進一步說明該方法的有效性,本實驗將每個時間序列分割成更短的切片,以生成更大的數(shù)據(jù)集,利用滑動窗的方法將一個完整步態(tài)周期分為左右腳步幅間隔、左右腳擺動間隔以及左右腳站立間隔 6 個時間序列。實驗過程中發(fā)現(xiàn),當窗口長度少于 50 個點時,相空間重構就會失敗,所以為保證相空間成功構建,提取有效特征,且創(chuàng)建的數(shù)據(jù)集更大,本實驗選擇每段的時間序列為 50 個點。通過上述方法對每個類別都作相應拓展后,采用訓練集∶測試集為 1∶1 的方式進行實驗。
由于每個時間序列都是相互獨立的,不同時間序列所構建的拓撲特征是不同的。如圖 11 所示,在不同步態(tài)周期中,左右腳與地面接觸的面積是不同的,但人體體重不會隨著位置的移動而發(fā)生改變,因此隨著面積的改變,足底壓力所獲取的信息是不同的。此外,步態(tài)周期雖然具有一定的規(guī)律,但是并不穩(wěn)定,將不同腳跨步間隔的足底壓力信息列入考慮范圍,將能夠更全面地獲取受試者在行走過程中不同狀態(tài)的步態(tài)特征。本實驗采用多特征融合的方法,即波動融合(將左腳和右腳的步幅間隔、擺動間隔以及站立間隔都進行融合),然后使用樸素貝葉斯(Naive Bayes,NB)、支持向量機(Support Vector Machine,SVM)和隨機森林(Random Forest,RF)3 種具有代表性的分類器對模型進行綜合評估,并利用受試者 AUC 值來衡量每個模型的識別能力,AUC值越大,模型的魯棒性越好。
圖11 步態(tài)周期示意圖Fig. 11 Schematic diagram of gait cycle
本研究基于步態(tài)時間序列特征的融合,以驗證所提取方法的有效性。首先,基于原始 4 種時間為 5 min 的步態(tài)時間序列進行評估,在提取 1-階同調的 PL 特征后使用留一驗證法,然后利用NB、SVM、RF 3 個分類器分別對正常與 ALS、正常與 HD、正常與 PD 3 組進行分類,以 AUC值為結果進行評估,評估結果如表 1 所示。由表 1 可知,特征融合的效果比單一特征效果好,在 ALS 與正常組中,使用 NB 分類器的效果最佳,其 AUC 值為 0.875 0;在 HD 與正常組中,使用 NB 分類器效果最佳,AUC 值為 0.940 6;在 PD 與正常組中,3 種分類器效果均高于平均水平,其中,NB 及 RF 分類器的效果較好,分別為 0.958 3 與 0.958 0。
表1 基于原始數(shù)據(jù)的評估結果Table 1 Experimental results based on raw data
在重新擴展的數(shù)據(jù)集上,采用相同的拓撲特征以及分類器對模型進行驗證,并以 AUC 值為結果進行評估,實驗結果如表 2 所示。由表 2 可知,在 ALS 與正常組中,采用 RF 分類器效果最佳,AUC 值達到 91.46%,明顯優(yōu)于基于原始步態(tài)數(shù)據(jù)的實驗結果;在 HD 與正常組中,NB 和SVM 的結果要明顯弱于 RF 分類器,最佳 AUC值為 96.23%;在 PD 與正常組中,NB 分類器沒有良好的魯棒性,其最佳分類結果是由 RF 分類器產生的,AUC 值為 96.14%。
表2 基于重新擴建數(shù)據(jù)集的實驗結果Table 2 Experimental results based on the re-expanded data set
目前,關于步態(tài)節(jié)律以及半周期的研究都經歷了較長的發(fā)展期,研究者們采用不同的特征來區(qū)分健康受試者與 ALS、HD 和 PD 受試者,以及其他異常步態(tài)者。傳統(tǒng)的平均值、標準差等統(tǒng)計參數(shù)特征提取方法只考慮了有限的一維數(shù)據(jù)特征,忽略了步態(tài)節(jié)律在相位空間中的非線性動力學特征。在特征提取的過程中,大部分主要針對步幅以及步幅變化進行研究,對左右腳步幅間隔、擺動間隔以及站立間隔相結合的研究較少,在特征信息的提取過程中,會導致部分信息遺漏。在同一數(shù)據(jù)集上,將本文方法與其他方法進行對比[26],對比結果如表 3 所示。由表 3 可知,在 ALS 患者與正常受試者步態(tài)的檢測中,效果最好的是近似熵與模糊熵,但其分類結果只有 71.42%,明顯低于本文方法 87.50% 的識別準確率。在 HD 患者與正常受試者步態(tài)的識別中,模糊熵的識別準確率最高,但也只達到了77.78%,比本文方法識別的準確率還要低 16%。在 PD 患者與正常受試者步態(tài)的檢測中,樣本熵、模糊熵的非線性特征檢測結果較好,然而僅達到 75.00%,與本文方法 95.83% 的識別率仍有較大差距。由近似熵、樣本熵、模糊熵 3 種非線性特征的對比可知,在異常步態(tài)識別中,模糊熵的表現(xiàn)最好,但仍低于本文所用的 PL 非線性特征。綜上所述,在基于非線性特征的異常步態(tài)識別中,本文方法具有較為明顯的優(yōu)勢。
表3 相同數(shù)據(jù)集的非線性特征結果對比Table 3 Comparison of nonlinear characteristic results of the same data set
本文提出一種全新的方法用于異常步態(tài)的識別,該方法研究了步態(tài)相空間的拓撲特征,由于拓撲特征具有隨著疾病的干擾而改變的特點,所以這些特征能夠作為 NDDs 潛在的生物標志之一。此外,步態(tài)節(jié)律也會受到信號的非線性以及非平穩(wěn)性的影響,因此,采用拓撲非線性動態(tài)建模的方法能夠很好地保留步態(tài)特征的空間特性以及非線性特征。由表 1 可知,在異常步態(tài)識別的應用中,進一步擴展數(shù)據(jù)集,拓撲非線性動態(tài)建模的方法仍可取得較好的結果,使得該方法的優(yōu)良性能得到了進一步驗證。
綜上所述,本文提出的基于拓撲非線性動力學的異常步態(tài)檢測的優(yōu)點如下:
(1)基于步態(tài)周期的特征提取,考慮了不同階段的步態(tài)特征及左右腳之間的協(xié)同信息;
(2)提取特征時,采用一種新的拓撲特征,保留了步態(tài)變化過程中非線性動力學的特點;
(3)在 ALS、HD 以及 PD 分類中,本文方法均獲得較高的準確率,明顯優(yōu)于其他非線性動力學特征。
本文提出了一種基于拓撲特征分析的異常步態(tài)非線性分析方法,探討了拓撲特征在 NDDs 方面的應用,研究了 ALS、HD、PD 患者的步態(tài)拓撲特征差異,構造了基于步態(tài)拓撲特征信息的機器學習分類模型,實現(xiàn)了 NDDs 異常步態(tài)的精準分類。在對 ALS、HD 以及 PD 患者步態(tài)的檢測任務中,分別獲得了 91.46%、96.23%、96.14%的準確率,驗證了拓撲非線性特征在步態(tài)分析中顯著的表征能力,及良好的異常識別能力,為臨床或康復中的步態(tài)信息分析提供了一種新的思路。