段淑斐,王俊芹,DINGAM Camille,張雪英,孫 穎
(1.太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院,山西 太原 030024;2.天津大學(xué) 電氣自動(dòng)化與信息工程學(xué)院,天津 300072)
構(gòu)音障礙(Dysarthria)是指由于中樞神經(jīng)系統(tǒng)的損傷,致使患者言語(yǔ)運(yùn)動(dòng)不協(xié)調(diào),從而導(dǎo)致言語(yǔ)障礙的現(xiàn)象[1].運(yùn)動(dòng)性構(gòu)音障礙屬于構(gòu)音障礙中的一種,它是由于神經(jīng)和肌肉的器質(zhì)性病變,造成與構(gòu)音相關(guān)的肌肉收縮力減弱及運(yùn)動(dòng)不精確或不協(xié)調(diào)[2],進(jìn)而出現(xiàn)呼吸、喉發(fā)音、共鳴、構(gòu)音和韻律等異常[3].因此對(duì)于構(gòu)音障礙的正確診斷、評(píng)價(jià)是患者康復(fù)治療中必備的一項(xiàng)內(nèi)容,對(duì)于構(gòu)音障礙病情嚴(yán)重程度的評(píng)估或病情分級(jí)在言語(yǔ)治療中也起著至關(guān)重要的作用[4].目前在對(duì)構(gòu)音障礙的分析評(píng)估上,病情分級(jí)的方法通常是主觀分析為主,客觀分析為輔[5],在針對(duì)病患的診斷和治療中主要依賴于評(píng)估者的主觀感受,且需要評(píng)估者具有較高的專(zhuān)業(yè)技能水平,這樣會(huì)限制診斷的準(zhǔn)確率,且結(jié)果不具有廣泛性.隨著機(jī)器學(xué)習(xí)、人工智能技術(shù)的發(fā)展,對(duì)構(gòu)音障礙的研究也已不限于醫(yī)學(xué)領(lǐng)域,例如研究者可以將病理語(yǔ)音及發(fā)音特征提取出來(lái),利用計(jì)算機(jī)進(jìn)行數(shù)據(jù)分析與病情分級(jí),為構(gòu)音障礙患者的診斷評(píng)估提供較為準(zhǔn)確客觀的方法,并且研究結(jié)果能推動(dòng)醫(yī)學(xué)上自動(dòng)分級(jí)檢測(cè)技術(shù)的發(fā)展.
在現(xiàn)有的對(duì)構(gòu)音障礙識(shí)別的研究中,研究者大多通過(guò)提取音頻特征,如音頻的能量特征與基音周期[6]、共振峰集中率[7]、韻律特征與倒譜系數(shù)的融合特征[8]等進(jìn)行分析,用以區(qū)別構(gòu)音障礙患者與正常人.上述研究雖然增強(qiáng)了構(gòu)音障礙識(shí)別的客觀性,但對(duì)于運(yùn)動(dòng)性構(gòu)音障礙而言,了解構(gòu)音器官的運(yùn)動(dòng)模式,獲得動(dòng)態(tài)發(fā)音空間的位置信息,才是幫助構(gòu)音障礙患者的有效方法[9].因此為了探究構(gòu)音障礙患者的動(dòng)態(tài)發(fā)音空間及位置信息,張丞然[6]通過(guò)計(jì)算每個(gè)目標(biāo)因素的發(fā)音位置點(diǎn)的分布,發(fā)現(xiàn)構(gòu)音障礙患者的發(fā)音區(qū)域比正常說(shuō)話人的區(qū)域要小,且更靠近口腔前部.然而,患者在語(yǔ)音的連接中發(fā)生構(gòu)音障礙的可能性比在單音素水平上更高[10-11],在日常交流中,詞匯和句子是基本、有效的語(yǔ)言,短語(yǔ)發(fā)音除了可以很好地檢驗(yàn)說(shuō)話人表達(dá)單個(gè)單詞的能力[12],還可以檢驗(yàn)連續(xù)發(fā)音時(shí)語(yǔ)音連接的流暢性.對(duì)構(gòu)音障礙患者的發(fā)音空間進(jìn)行的探索不僅可以用來(lái)尋找構(gòu)音障礙患者與正常人發(fā)音特征之間的差異,還可以用于對(duì)構(gòu)音障礙患者進(jìn)行病情分級(jí).2015年的Interspeech計(jì)算機(jī)輔助語(yǔ)言學(xué)大賽[4]就關(guān)注了帕金森患者的病情分級(jí),如Willamson等[13]提出了基于通道延遲相關(guān)和協(xié)方差矩陣的帕金森病理分級(jí)系統(tǒng).然而該挑戰(zhàn)任務(wù)主要集中在提取語(yǔ)音的頻譜和韻律特征方面,缺乏發(fā)音特征.
本文基于多倫多大學(xué)開(kāi)發(fā)的TORGO數(shù)據(jù)庫(kù)[15],首先對(duì)連續(xù)發(fā)音時(shí)不同說(shuō)話者舌部的發(fā)音運(yùn)動(dòng)軌跡以及空間位移進(jìn)行對(duì)比,探究構(gòu)音障礙與發(fā)音空間的關(guān)系.隨后利用K-means算法計(jì)算出空間的質(zhì)心,在SPSS軟件[14]中對(duì)此質(zhì)心數(shù)據(jù)進(jìn)行單變量方差分析、箱線圖分析,進(jìn)一步對(duì)構(gòu)音障礙者與正常人、不同病情程度的構(gòu)音障礙患者之間的差異進(jìn)行分析.最后選取質(zhì)心和位移中值兩個(gè)發(fā)音空間特征,分別采用J48決策樹(shù)以及隨機(jī)森林(Random Forest,RF)分類(lèi)器對(duì)正常人、輕度、中度、重度構(gòu)音障礙患者進(jìn)行病情分級(jí),最后對(duì)4種不同人群的正確分類(lèi)率進(jìn)行比較.
TORGO數(shù)據(jù)庫(kù)是由加拿大多倫多大學(xué)計(jì)算機(jī)科學(xué)與語(yǔ)音語(yǔ)言病理學(xué)系聯(lián)合Holland-Bloorview兒童康復(fù)醫(yī)院共同開(kāi)發(fā)的包含了近23 h的英文語(yǔ)音數(shù)據(jù),以及與聲音數(shù)據(jù)同步的發(fā)音運(yùn)動(dòng)數(shù)據(jù).受試者包括8名構(gòu)音障礙患者(3女5男)、7名正常說(shuō)話者(3女4男).其中構(gòu)音障礙患者為腦癱和肌萎縮性側(cè)索硬化患者,這兩種病因也是最常見(jiàn)的導(dǎo)致患者語(yǔ)音殘疾的原因.數(shù)據(jù)庫(kù)中所有數(shù)據(jù)集合都包含4種閱讀文本,語(yǔ)料分別由非詞短語(yǔ)(Non-words)、短語(yǔ)(Short words)、限制句子(Restricted sentences)和非限制句(Non-restricted sentences)構(gòu)成.
鑒于舌部在發(fā)音中的重要作用,我們只選擇在舌部上的3個(gè)傳感器位置點(diǎn)作為研究對(duì)象,這3個(gè)位置點(diǎn)分別在舌面上的Sensor 3舌尖(Tongue Tip,TT——舌尖后的1 cm處),Sensor 2舌中(Tongue Middle,TM——舌尖線圈后面的3 cm處)和Sensor 1舌根(Tongue Back,TB——舌中線圈后面2 cm處),如圖1所示.
為了探究不同病情嚴(yán)重程度的構(gòu)音障礙患者其發(fā)音空間的異同,并進(jìn)行病情分級(jí)研究,因此選擇了兩名輕度患者DS01、DS02;一名中度患者DS03;一名重度患者DS04作為研究對(duì)象.此外,另選兩名正常說(shuō)話人NS01、NS02作為對(duì)照.所有說(shuō)話者發(fā)音的文本內(nèi)容均選擇為短語(yǔ),再對(duì)短語(yǔ)內(nèi)容進(jìn)行進(jìn)一步篩選,使得每位說(shuō)話者所說(shuō)的文本內(nèi)容均相同.數(shù)據(jù)庫(kù)篩選的情況如表1所示,表1中DS(Dysarthria speaker)表示有構(gòu)音障礙的說(shuō)話者,NS(Normal speaker)表示正常說(shuō)話者.
圖1 傳感器位置點(diǎn)Fig.1 Sensor position point
表1 數(shù)據(jù)庫(kù)篩選情況Tab.1 Database filtering
利用統(tǒng)計(jì)分析軟件SPSS繪制出說(shuō)話者在講短語(yǔ)時(shí)舌部運(yùn)動(dòng)軌跡的3維散點(diǎn)圖,對(duì)比不同說(shuō)話者的發(fā)音空間以及位置分布.此處以短語(yǔ)“yes”為例,列出DS01(輕度)、DS03(中度)、DS04(重度)患者與NS01(正常人)舌尖處運(yùn)動(dòng)的3維散點(diǎn)圖,如圖2所示.
圖2 講短語(yǔ)“yes”時(shí)舌尖處的3維散點(diǎn)圖對(duì)比Fig.2 Comparison of three-dimensional scatter diagram of tongue tip when speaking the phrase ‘yes’
通過(guò)對(duì)比觀察說(shuō)話者講話時(shí)舌部固定發(fā)音位置點(diǎn)的3維運(yùn)動(dòng)散點(diǎn)圖(運(yùn)動(dòng)軌跡),可以對(duì)構(gòu)音障礙患者的病情嚴(yán)重程度進(jìn)行簡(jiǎn)單地判斷.從圖2中即可初步判斷DS01輕度至DS04重度患者病情程度呈遞增趨勢(shì),因?yàn)樗麄兊陌l(fā)音軌跡較NS01的相似性逐漸減小,NS01在講“yes”時(shí)舌尖呈現(xiàn)“Y”字形的運(yùn)動(dòng)軌跡,DS01輕度患者的舌尖呈現(xiàn)“V”字形的運(yùn)動(dòng)軌跡,而DS03中度患者的舌尖呈現(xiàn)一條類(lèi)似“V”字形右半部分的軌跡且較為雜亂,DS04重度患者舌尖的運(yùn)動(dòng)軌跡則與NS01無(wú)任何相似之處.
說(shuō)話者在講第i條短語(yǔ)(例如“yes”)時(shí),在固定發(fā)音位置點(diǎn)(例如舌尖)的某一方向上(例如X方向)的發(fā)音位置數(shù)據(jù)用向量Xi表示,表示錄制第i條發(fā)音短語(yǔ)的位置數(shù)據(jù),1≤i≤n,n為所講短語(yǔ)的條數(shù).則在講“yes”時(shí)舌尖處X方向上的最大及最小位移分別是
Xmax,i=max(Xi)i=1,2,…,n,
(1)
Xmin,i=min(Xi)i=1,2,…,n.
(2)
那么在該方向上的位移中值為
(3)
如圖3所示,列出不同說(shuō)話者在講短語(yǔ)“yes”時(shí)舌尖分別在前后(X方向)、左右(Y方向)、上下(Z方向)上最大位移Xmax,i與最小位移Xmin,i的對(duì)比,以及位移中值Xmed,i.
圖3 講短語(yǔ)“yes”時(shí)舌尖位移的對(duì)比Fig.3 Comparison of displacement of tongue tip when speaking the phrase ‘yes’
在圖3中,3名患者在X,Y,Z3方向上舌尖的位移均比正常人的位移小,由此可以發(fā)現(xiàn)相比于正常人,構(gòu)音障礙患者舌部在口腔中發(fā)音時(shí)位置更偏后、偏左、偏下(向前為X的正方向、向右為Y的正方向、向上為Z的正方向);只觀察上下(Z)方向上的位移數(shù)據(jù),可以發(fā)現(xiàn)重度患者的舌尖位移最低、輕度患者的舌尖位移最高,說(shuō)明病情越嚴(yán)重,其舌尖位移的位置越低,舌部越無(wú)力抬起.此外,在前后(X)與左右(Y)方向上,均為輕度患者與正常患者的位移差最大.
2.2.1 K-means聚類(lèi)算法
K-means算法的基本思想是:先確定常數(shù)K,該常數(shù)代表聚類(lèi)類(lèi)別數(shù),首先隨機(jī)選定初始點(diǎn)為質(zhì)心,并通過(guò)計(jì)算每一個(gè)樣本與質(zhì)心之間的相似度(這里為歐氏距離),將樣本點(diǎn)歸到最相似的類(lèi)中.再重新計(jì)算每個(gè)類(lèi)的質(zhì)心(即為類(lèi)中心),重復(fù)此過(guò)程直至質(zhì)心不再改變,最終就確定了每個(gè)樣本所屬的類(lèi)別以及每個(gè)類(lèi)的質(zhì)心.
當(dāng)以歐氏距離作為衡量樣本與質(zhì)心之間的相似度時(shí),K-means算法的目標(biāo)函數(shù)為
(4)
其中:N是數(shù)據(jù)數(shù)目;C是劃分簇的數(shù)目;rc是一個(gè)0到1之間的變量,當(dāng)數(shù)據(jù)點(diǎn)xn被歸類(lèi)到C簇時(shí)為1,否則為0.K-means算法的目標(biāo)就是最小化這個(gè)目標(biāo)函數(shù).
由于此處每條短語(yǔ)的發(fā)音軌跡只有一個(gè),即只有一個(gè)聚類(lèi)類(lèi)別,因此常數(shù)K為1,聚類(lèi)中心μ是距離每一個(gè)樣本點(diǎn)xn的歐氏距離均最小的點(diǎn),將其作為該發(fā)音運(yùn)動(dòng)軌跡的質(zhì)心,該質(zhì)心可以表示如下:
μ=min{‖xn-μ‖2|n=1,2,…,N}.
(5)
為進(jìn)一步探究不同病情程度的構(gòu)音障礙患者之間的差異性,我們利用K-means聚類(lèi)算法求出各說(shuō)話者在講每一條短語(yǔ)時(shí)發(fā)音運(yùn)動(dòng)軌跡的質(zhì)心.
以DS03患者的質(zhì)心數(shù)據(jù)為因變量,分別以DS01患者和DS04患者的質(zhì)心數(shù)據(jù)為協(xié)變量進(jìn)行單變量方差分析,其顯著性結(jié)果如表2(見(jiàn) 第292頁(yè))所示.若結(jié)果中p<0.05,則說(shuō)明兩個(gè)變量之間存在顯著性差異,反之說(shuō)明兩個(gè)變量之間不存在顯著性差異,且p越接近于1,兩變量間的差異性越小(由于DS04患者沒(méi)有舌根處的發(fā)音運(yùn)動(dòng)數(shù)據(jù),因此只進(jìn)行了舌中、舌尖處質(zhì)心數(shù)據(jù)的顯著性對(duì)比分析).
在表2中,可以看到無(wú)論在舌中還是舌尖處,在上下(Z)方向上3種病情程度的患者之間的p值均小于0.200,平均值為0.078;而在前后(X)、左右(Y)方向上的顯著性均大于在上下(Z)方向,其中前后方向上不同病情患者間p值均值為0.538,左右方向不同病情患者間p值均值為0.861.說(shuō)明不同病情嚴(yán)重程度的構(gòu)音障礙患者之間的發(fā)音運(yùn)動(dòng)主要差異在上下方向上.
表2 DS03中度與DS01輕度、DS04重度患者之間的顯著性分析結(jié)果Tab.2 Significant results among DS01 mild,DS03 moderate and DS04 severe patients
2.2.3 箱線圖分析
在箱線圖的數(shù)據(jù)統(tǒng)計(jì)描述中,5個(gè)統(tǒng)計(jì)量分別是最小值、第一四分位數(shù)Q1(下四分位數(shù))、中位數(shù)Q2、第三四分位數(shù)Q3(上四分位數(shù))與最大值,四分位距dIQR=Q3-Q1.在Q3+1.5dIQR和Q3-1.5dIQR處為內(nèi)限,內(nèi)限之外的點(diǎn)用圓圈標(biāo)注為異常值;在Q3+3dIQR和Q3-3dIQR處為外限,外限之外的點(diǎn)用星型標(biāo)注為極端值,此處將異常值與極端值統(tǒng)稱(chēng)為偏離值.
式(5)是發(fā)出某一短語(yǔ)時(shí)固定發(fā)音位置點(diǎn)的3維質(zhì)心,那么在n條短語(yǔ)的發(fā)音中在Y(左右)方向上的最大值、最小值分別為
μy,max=max(μyj)j=1,2,…,n,
(6)
μy,min=min(μyj)j=1,2,…,n.
(7)
將n條短語(yǔ)發(fā)音的Y方向的質(zhì)心數(shù)據(jù)從小到大排序?yàn)閧μy1<μy2<…<μyj<…<μyn},j=1,2,…,n.那么下四分位數(shù)、中位數(shù)、上四分位數(shù)分別為
μyQ11≤Q1=(n+1)×0.25≤j≤n,
(8)
μyQ21≤Q2=(n+1)×0.5≤j≤n,
(9)
μyQ31≤j≤Q3=(n+1)×0.75≤n.
(10)
圖4所示為DS01(輕度)、DS03(中度)與NS01(正常人)舌尖(TT)處質(zhì)心數(shù)據(jù)在Y方向上的箱線圖對(duì)比,由此圖可以得到如下結(jié)論:
南昌大學(xué)教授彭迪云提出,鄉(xiāng)村振興首先要做好鄉(xiāng)村脫貧,鄉(xiāng)村脫貧要借助金融的力量,金融是現(xiàn)代經(jīng)濟(jì)的核心,金融扶貧是打贏脫貧攻堅(jiān)戰(zhàn)的重大舉措和關(guān)鍵支撐。金融助推國(guó)家精準(zhǔn)扶貧,不但是金融相關(guān)部門(mén)的責(zé)任與使命,更是整個(gè)金融行業(yè)潛力的再發(fā)掘的重要機(jī)遇。他在論文中以江西為例專(zhuān)門(mén)就農(nóng)村金融精準(zhǔn)扶貧的成效進(jìn)行了評(píng)價(jià),并提出了應(yīng)對(duì)的政策建議。
圖4 舌尖處左右方向的質(zhì)心數(shù)據(jù)箱線圖Fig.4 Boxplot of phonological centroid data for the left and right of the tongue tip
(1)構(gòu)音障礙患者在左右(Y)方向上的發(fā)音位置質(zhì)心偏離值分布與正常人的相反.即正常人在左右方向上的發(fā)音位置質(zhì)心偏離值分布偏左,而構(gòu)音障礙患者在左右方向上的發(fā)音位置質(zhì)心偏離值分布偏向右邊.
(2)對(duì)比構(gòu)音障礙患者與正常人,發(fā)現(xiàn)構(gòu)音障礙患者的偏離值分布較為分散且范圍較大,而正常人的偏離值分布較為集中且范圍小.
(3)在構(gòu)音障礙患者之間進(jìn)行比較,可以發(fā)現(xiàn)患者的病情較嚴(yán)重時(shí),其發(fā)音運(yùn)動(dòng)的質(zhì)心箱圖中四分位距更大,且中位數(shù)位置也更偏.
本節(jié)選取發(fā)音運(yùn)動(dòng)軌跡的質(zhì)心與位移中值兩個(gè)發(fā)音空間特征,分別輸入到J48決策樹(shù)和隨機(jī)森林分類(lèi)器中,進(jìn)行對(duì)正常人、輕度構(gòu)音障礙患者、中度構(gòu)音障礙患者、重度構(gòu)音障礙患者的分類(lèi)識(shí)別,共有4種組合方式.J48決策樹(shù)的置信因子設(shè)置為0.25,每個(gè)葉的最小實(shí)例數(shù)量設(shè)置為2.然后,從篩選后的數(shù)據(jù)中,選取65%作為訓(xùn)練集,35%作為測(cè)試集,并采用5折交叉驗(yàn)證法來(lái)檢驗(yàn)特征以及識(shí)別網(wǎng)絡(luò)的性能.
圖5 兩種分類(lèi)器對(duì)短語(yǔ)發(fā)音空間特征的識(shí)別率Fig.5 Recognition rate of two classifiers for phrase pronunciation space features
采用兩種分類(lèi)器對(duì)兩種發(fā)音空間特征進(jìn)行分類(lèi)的識(shí)別率見(jiàn)圖5,可以發(fā)現(xiàn)用隨機(jī)森林分類(lèi)器對(duì)不同病情程度的構(gòu)音障礙患者和正常人識(shí)別的識(shí)別率均比用J48決策樹(shù)的要高.另外,在說(shuō)話者的發(fā)音空間特征方面,對(duì)位移中值的識(shí)別率總是大于對(duì)質(zhì)心的識(shí)別率.
上述4種組合方式得出的混淆矩陣見(jiàn)表3~表6.其中對(duì)輕度DS的誤判共有6次、對(duì)中度DS的誤判共有1次、對(duì)重度DS和NS的誤判均共有4次,說(shuō)明4種情況的分類(lèi)器均對(duì)中度DS的預(yù)測(cè)效果最好.此外,在表4和表6中,兩種分類(lèi)器對(duì)位移中心的分類(lèi)識(shí)別中,對(duì)中度DS和重度DS均不存在誤判,說(shuō)明對(duì)位移中值進(jìn)行分類(lèi),可以很好地區(qū)分中度和重度構(gòu)音障礙患者.
表3 J48決策樹(shù)對(duì)質(zhì)心的分類(lèi)Tab.3 Classification of centers of mass by J48 decision tree
表4 J48決策樹(shù)對(duì)位移中心的分類(lèi)Tab.4 Classification of displacement centers by J48 decision tree
表5 隨機(jī)森林對(duì)質(zhì)心的分類(lèi)Tab.5 Classification of centers of mass by random forest
表6 隨機(jī)森林對(duì)位移中心的分類(lèi)Tab.6 Classification of displacement centers by random forests
為進(jìn)一步直觀地對(duì)比構(gòu)音障礙患者病情分級(jí)的準(zhǔn)確率,計(jì)算正確分類(lèi)率來(lái)進(jìn)行分析.正確分類(lèi)率通過(guò)靈敏度(True positive rate)λTP來(lái)表示,計(jì)算方式如下:
(11)
其中:kTP表示預(yù)測(cè)類(lèi)別為正,真實(shí)類(lèi)別為正的樣本數(shù),即某一真實(shí)類(lèi)別被正確預(yù)測(cè)的個(gè)數(shù);kFN表示預(yù)測(cè)類(lèi)別為負(fù),真實(shí)類(lèi)別為正的樣本數(shù),即某一真實(shí)類(lèi)別被錯(cuò)誤預(yù)測(cè)的個(gè)數(shù).圖6為發(fā)音空間特征是質(zhì)心的正確分類(lèi)對(duì)比圖.圖7為發(fā)音空間特征是位移中值的正確分類(lèi)對(duì)比圖.
圖6中,對(duì)于輕度DS,隨機(jī)森林進(jìn)行分類(lèi)時(shí)的正確率為98.39%,比J48決策樹(shù)提高了1.62%;對(duì)于中度DS,隨機(jī)森林進(jìn)行分類(lèi)時(shí)的正確率為100%,比J48決策樹(shù)提高了3.23%;對(duì)于重度DS,隨機(jī)森林進(jìn)行分類(lèi)時(shí)的正確率為96.77%,比J48決策樹(shù)提高了6.45%.對(duì)于正常人,隨機(jī)森林與J48決策樹(shù)的分類(lèi)正確率相同.
圖7中,對(duì)于輕度DS,隨機(jī)森林進(jìn)行分類(lèi)時(shí)的正確率為98.39%,比J48決策樹(shù)提高了1.62%.對(duì)于中度DS、重度DS、正常人,隨機(jī)森林與J48決策樹(shù)的分類(lèi)正確率相同.
圖6 發(fā)音特征為質(zhì)心的正確分類(lèi)率Fig.6 Correct classification rate of the centroid as the articulatory feature
綜上所述,采用隨機(jī)森林分類(lèi)器對(duì)受試者的舌部位移中值這一發(fā)音運(yùn)動(dòng)特征進(jìn)行分類(lèi)識(shí)別時(shí),可以得到最優(yōu)識(shí)別性能,同時(shí)也說(shuō)明了隨機(jī)森林在對(duì)質(zhì)心與位移中值兩個(gè)發(fā)音運(yùn)動(dòng)特征的選擇性方面具有一定的優(yōu)越性.
對(duì)于構(gòu)音障礙患者的評(píng)估與治療的研究越來(lái)越多,此前的研究大多是基于聲學(xué)特征的.對(duì)發(fā)音運(yùn)動(dòng)過(guò)程中發(fā)音器官的發(fā)音位置進(jìn)行直接測(cè)量,得出發(fā)音運(yùn)動(dòng)特征并對(duì)其進(jìn)行分析研究,更有利于分析構(gòu)音障礙的特征,尋找構(gòu)音障礙患者與正常人、構(gòu)音障礙患者之間的差異.首先,本文基于發(fā)音空間特征,分析了構(gòu)音障礙患者與正常人在講話時(shí)發(fā)音位置在空間中的分布,通過(guò)對(duì)比構(gòu)音障礙患者與正常人發(fā)音運(yùn)動(dòng)的3維散點(diǎn)運(yùn)動(dòng)軌跡,發(fā)現(xiàn)了構(gòu)音障礙患者發(fā)音時(shí)舌部較正常人偏后、偏左、偏下的結(jié)論,以及正常人與構(gòu)音障礙患者之間、不同病情程度的構(gòu)音障礙患者之間的差異主要在上下運(yùn)動(dòng)方向,且病情越嚴(yán)重,患者舌部越無(wú)力,運(yùn)動(dòng)位置越靠下.其次,對(duì)使用K-means聚類(lèi)算法找出的質(zhì)心與位移中值兩個(gè)發(fā)音空間特征,分別采用J48決策樹(shù)以及隨機(jī)森林分類(lèi)器對(duì)正常人,輕度、中度、重度構(gòu)音障礙患者進(jìn)行分類(lèi)識(shí)別,發(fā)現(xiàn)采用隨機(jī)森林分類(lèi)器對(duì)受試者的舌部位移中值發(fā)音運(yùn)動(dòng)特征進(jìn)行分類(lèi)識(shí)別時(shí)可達(dá)到最優(yōu)識(shí)別性能.在今后的研究中,可以尋找更準(zhǔn)確的發(fā)音空間特征或是發(fā)音運(yùn)動(dòng)特征,進(jìn)行構(gòu)音障礙患者的病情分級(jí)研究.本文采用公開(kāi)數(shù)據(jù)庫(kù)進(jìn)行試驗(yàn),但是數(shù)據(jù)庫(kù)中的被試構(gòu)音障礙患者人數(shù)較少,且存在被測(cè)點(diǎn)發(fā)音位置數(shù)據(jù)缺失的情況,而且在實(shí)驗(yàn)中,本文所用數(shù)據(jù)庫(kù)中的數(shù)據(jù)是經(jīng)過(guò)同一文本內(nèi)容的篩選后得到的,進(jìn)一步減少了數(shù)據(jù)量,因此在算法的普適性方面有待后續(xù)研究進(jìn)行完善.