語(yǔ)音治療是唇腭裂綜合序列治療的重要組成部分,基于音標(biāo)的主觀語(yǔ)音評(píng)價(jià)被認(rèn)為是腭裂語(yǔ)音治療的“金標(biāo)準(zhǔn)”
。主觀語(yǔ)音評(píng)價(jià)是通過(guò)專業(yè)人員主觀判聽來(lái)判斷語(yǔ)音清晰度和發(fā)音錯(cuò)誤類型的測(cè)試,需要專業(yè)團(tuán)隊(duì)實(shí)施,存在易受環(huán)境干擾和個(gè)體偏差影響等局限性
。利用儀器進(jìn)行檢查分析的客觀語(yǔ)音評(píng)價(jià)能對(duì)主觀評(píng)價(jià)進(jìn)一步佐證與補(bǔ)充,常用方法包括X 線片、鼻咽內(nèi)窺鏡、語(yǔ)音頻譜分析儀等,但無(wú)法避免空間限制、侵入性等問(wèn)題
。近年來(lái),計(jì)算機(jī)語(yǔ)音處理系統(tǒng)和頻譜分析逐漸被應(yīng)用到唇腭裂語(yǔ)音評(píng)價(jià)中,其具有簡(jiǎn)單、無(wú)創(chuàng)、不受年齡限制等優(yōu)勢(shì),可彌補(bǔ)傳統(tǒng)主觀和客觀評(píng)價(jià)的不足。筆者就計(jì)算機(jī)科學(xué)在腭裂語(yǔ)音識(shí)別、分析和治療方面的研究現(xiàn)狀進(jìn)行綜述,為臨床腭裂語(yǔ)音治療提供研究思路。
唇腭裂語(yǔ)音治療作為一種長(zhǎng)期隨訪的持續(xù)性治療,無(wú)需過(guò)多的輔助設(shè)備支持,因此可以適應(yīng)在線智能平臺(tái)診療的模式。
妊娠期糖尿?。℅DM),指在妊娠期間首次發(fā)現(xiàn)或者發(fā)生的糖尿病,是比較特殊的一種糖尿病類型,對(duì)孕婦和嬰兒的身心健康有較大的威脅,可能嚴(yán)重影響嬰兒的身體情況和發(fā)育,并且導(dǎo)致孕婦并發(fā)高血壓等并發(fā)癥,而妊娠期糖尿病患者早期進(jìn)行有效治療后,可以減輕糖尿病對(duì)自身和嬰兒的損傷,因此,研究妊娠期糖尿病正規(guī)治療對(duì)妊娠結(jié)局的影響對(duì)提高妊娠成功率、分娩成功率具有至關(guān)重要的意義。該次研究回顧調(diào)查醫(yī)院內(nèi)2015年9月—2018年9月收治的200例患者為研究對(duì)象,現(xiàn)將研究結(jié)果報(bào)道如下。
國(guó)外已有基于物聯(lián)網(wǎng)(The internet of things,IOT)架構(gòu)的遠(yuǎn)程語(yǔ)音治療平臺(tái)用于評(píng)估病理語(yǔ)音,APLo、SpeakGeek 等系統(tǒng)在初步使用中均卓有成效
。在線平臺(tái)能夠使醫(yī)患雙方進(jìn)行便捷的實(shí)時(shí)交互,保證醫(yī)生密切掌握患者治療進(jìn)度,以便制定個(gè)體精準(zhǔn)、適應(yīng)患者身心發(fā)育的治療計(jì)劃。
公共服務(wù)機(jī)制要得到健康穩(wěn)定運(yùn)行,必須有相應(yīng)保障機(jī)制支持,我國(guó)人口多、地域廣,社會(huì)保障制度要得到全面貫徹和執(zhí)行存在較大困難。社會(huì)保障機(jī)制必須將廣大人民群眾做為維護(hù)對(duì)象,才能使公共服務(wù)真正為大眾受惠。我國(guó)存在東西部差別大、城鄉(xiāng)分離嚴(yán)重、收入差距大等問(wèn)題,造成公共服務(wù)的區(qū)域性差異,諸多問(wèn)題的凸顯,映射出我國(guó)保障機(jī)制的不健全,難以統(tǒng)一協(xié)調(diào)公共服務(wù)事業(yè)的健康發(fā)展。因此建立一部健全完整的公共服務(wù)保障法迫在眉睫。
目前,計(jì)算機(jī)科學(xué)在唇腭裂語(yǔ)音評(píng)價(jià)及治療方面尚未出臺(tái)具體治療方案和治療規(guī)范,與主觀評(píng)價(jià)結(jié)合的治療模式也有待進(jìn)一步臨床試驗(yàn)后進(jìn)行補(bǔ)充完善。但從言語(yǔ)障礙領(lǐng)域的應(yīng)用來(lái)看,其對(duì)于患兒年齡和術(shù)后時(shí)間點(diǎn)的要求相比常規(guī)治療無(wú)顯著差異,因此可沿用目前廣泛認(rèn)可的序列治療時(shí)間線。同時(shí),在主觀評(píng)價(jià)中,噪聲干擾的影響是致命性的,人工智能可以通過(guò)優(yōu)化算法或是增設(shè)濾波設(shè)備來(lái)消除混響,減少殘留噪聲,增強(qiáng)識(shí)別精度,降低環(huán)境要求
;柔性壓電聲學(xué)傳感器等最新設(shè)備的推出在語(yǔ)音接收和分析方面已有了接近甚至超越人耳的潛質(zhì)
,加之以當(dāng)下普及的各類移動(dòng)終端設(shè)備,其治療模式已沒(méi)有明顯的硬件設(shè)備障礙;深度神經(jīng)網(wǎng)絡(luò)的出現(xiàn)確保人工智能能夠進(jìn)行自我補(bǔ)足與完善。因此就發(fā)展?jié)摿Χ?,基于?jì)算機(jī)科學(xué)的唇腭裂語(yǔ)音評(píng)價(jià)與治療體系是超越傳統(tǒng)主觀評(píng)價(jià)模式的。由于尚無(wú)具體臨床案例治療效果的參考,計(jì)算機(jī)科學(xué)輔助的語(yǔ)音治療模式在實(shí)施過(guò)程中也可能遭遇尚未發(fā)現(xiàn)的障礙。
例如,在言語(yǔ)失用癥領(lǐng)域,人工智能可輔助檢測(cè)患者嘴部姿勢(shì)來(lái)協(xié)助治療人員進(jìn)行語(yǔ)言康復(fù)訓(xùn)練,使醫(yī)生能夠同期對(duì)多位患者進(jìn)行治療,從而提高臨床效率
;基于個(gè)人移動(dòng)終端的治療應(yīng)用程序在初步臨床試驗(yàn)中也已證明對(duì)慢性表達(dá)性失語(yǔ)癥有益
,這些運(yùn)用人工智能輔助治療的案例對(duì)唇腭裂語(yǔ)音治療的程序開發(fā)有極大的參考意義。
不難發(fā)現(xiàn),盡管未有國(guó)際通用的治療軟件推行,但人工智能在言語(yǔ)障礙領(lǐng)域已有初步的臨床使用,其在易用性、依從性、普適性、準(zhǔn)確性及治療效率上均有優(yōu)勢(shì)。結(jié)合目前已有的唇腭裂語(yǔ)音識(shí)別進(jìn)展,人工智能技術(shù)結(jié)合主觀評(píng)價(jià)的腭裂語(yǔ)音治療模式應(yīng)當(dāng)是切實(shí)可行的,該治療模式可以提供更頻繁和更有針對(duì)性的方案,輔之以語(yǔ)音生成的視覺交互,視聽結(jié)合的治療模式對(duì)于患兒而言更符合其知識(shí)攝取的客觀需求,大大提高交互效率
。
目前對(duì)于腭裂語(yǔ)音識(shí)別方面的研究大多僅局限于獨(dú)立的聲學(xué)特征辨別,且沒(méi)有大規(guī)模應(yīng)用于臨床的報(bào)道出現(xiàn),綜合多參數(shù)建立判別函數(shù)并結(jié)合前沿硬件設(shè)施的識(shí)別系統(tǒng)可能是打破這一瓶頸的研究方向之一。
物聯(lián)網(wǎng)和涉及智能設(shè)備的人工智能平臺(tái)在言語(yǔ)障礙等疾病方面已有了初步嘗試,已有研究證明此類治療方式有助于患者臨床癥狀的改善
。從廣義上劃分,唇腭裂也屬于器質(zhì)性的言語(yǔ)障礙,可以嘗試借鑒此類治療模式。
近年來(lái),針對(duì)高鼻音、咽擦音、聲門塞音等腭裂語(yǔ)音中特征性代償發(fā)音錯(cuò)誤的針對(duì)性研究也逐漸增多,其識(shí)別分析技術(shù)已有較為成熟的結(jié)果。輔音省略是最典型、最常見的代償性發(fā)音,使用機(jī)械設(shè)備克服病理性語(yǔ)音數(shù)據(jù)采集困難的客觀條件,并通過(guò)波形差分析方法可以達(dá)成對(duì)輔音省略88.9%的準(zhǔn)確檢測(cè)
;通過(guò)聽覺濾波器和多通道模型相結(jié)合的方法能夠?qū)ρ什烈舻念l譜特征進(jìn)行提取并增強(qiáng),使自動(dòng)檢測(cè)能夠?qū)崿F(xiàn)高達(dá)94.95%的正確率
;除此之外,利用1/3 倍頻程算法提取特征譜線的技術(shù)也可以實(shí)現(xiàn)咽擦音與正常擦音的自動(dòng)分類檢測(cè)
;而將聲門塞音的多種聲學(xué)特征參數(shù)結(jié)合識(shí)別的檢測(cè)系統(tǒng)可以達(dá)到90%的信息熵正確率
。結(jié)合以上研究,不難發(fā)現(xiàn)硬件和軟件的進(jìn)步和優(yōu)化都是腭裂語(yǔ)音識(shí)別技術(shù)逐步成熟的重要基石。由于單一聲學(xué)參數(shù)的使用在普遍評(píng)價(jià)上易出現(xiàn)系統(tǒng)偏差,對(duì)于各種代償性發(fā)音不同側(cè)重的譜系剖析也能使自動(dòng)識(shí)別的準(zhǔn)確性和特征性不斷提高。同時(shí),相較主觀評(píng)價(jià)僅能通過(guò)增加檢驗(yàn)人員數(shù)量或是重復(fù)測(cè)評(píng)來(lái)避免差錯(cuò)而言,借助智能語(yǔ)音識(shí)別能夠從切分算法、能量分布、物理收音等多角度來(lái)保證和提高判斷評(píng)價(jià)的準(zhǔn)確性
,這是精準(zhǔn)醫(yī)療所必須的。
(1)項(xiàng)目設(shè)立階段:針對(duì)項(xiàng)目立項(xiàng)階段的危險(xiǎn)源,具體辨識(shí)內(nèi)容涉及項(xiàng)目地址的確定、項(xiàng)目平面布局情況、項(xiàng)目建筑體的運(yùn)輸條件及消防安全等;另外還有關(guān)于生產(chǎn)設(shè)計(jì)方面的因素,包括工藝路線設(shè)計(jì)與安全設(shè)施布置、物料選擇與特殊的大型大體設(shè)備配置等,以及項(xiàng)目具體的作業(yè)環(huán)境,比如生產(chǎn)帶來(lái)的粉塵、噪音、高溫、輻射、有毒氣體方面的影響。
在線唇腭裂語(yǔ)音治療要求高質(zhì)量的語(yǔ)音傳輸來(lái)保證主觀評(píng)價(jià)的準(zhǔn)確性,需克服手持式電子設(shè)備計(jì)算能力有限的問(wèn)題,目前已有較為成熟的自適應(yīng)模型來(lái)更好地使語(yǔ)音特征序列與單詞網(wǎng)絡(luò)對(duì)齊
。包括科大訊飛等在內(nèi)的科技公司對(duì)移動(dòng)終端處理能力的提升已有相當(dāng)?shù)倪M(jìn)展,硬件條件基本滿足語(yǔ)音治療的使用需求。
以人工智能媒介進(jìn)行唇腭裂語(yǔ)音治療的基礎(chǔ)是通過(guò)語(yǔ)音信號(hào)處理和模式建立讓計(jì)算機(jī)自動(dòng)識(shí)別和分析患者語(yǔ)音特征。這避免了個(gè)體聽力敏感度和傾向性對(duì)評(píng)價(jià)結(jié)果造成的系統(tǒng)誤差,也減少了主觀語(yǔ)音評(píng)價(jià)專業(yè)化學(xué)習(xí)及培訓(xùn)的難度。在醫(yī)療領(lǐng)域,已有研究發(fā)現(xiàn)人工智能對(duì)于自閉癥譜系障礙患者的語(yǔ)音分析優(yōu)于語(yǔ)音治療師的主觀判斷,其能夠降低結(jié)果的假陽(yáng)性率與假陰性率
;而結(jié)合多種語(yǔ)音信號(hào)特征或建立語(yǔ)音障礙數(shù)據(jù)庫(kù)的人工智能分析已能在多種不同的環(huán)境下較為精確地分辨帕金森病癥語(yǔ)音
。
唇腭裂對(duì)患者在情緒表達(dá)、幸福指數(shù)、環(huán)境適應(yīng)能力上均有不同程度的影響,患者在接受語(yǔ)音治療時(shí)正處于心智成熟和建立價(jià)值觀的關(guān)鍵時(shí)期,接受器質(zhì)性治療的同時(shí)心理治療也不容忽視。目前以人工智能為基礎(chǔ)的社交機(jī)器人對(duì)于自閉癥兒童言語(yǔ)表達(dá)上的治療有較多臨床研究支持,其外觀及治療形式相比傳統(tǒng)治療而言能顯著減低患兒的社交焦慮并提高自我表達(dá)的積極性,從而提升治療效果
。完善的智能治療平臺(tái)能涵蓋教學(xué)功能、激勵(lì)特征和定量特征功能,可在沒(méi)有醫(yī)務(wù)工作人員的情況下用于全局評(píng)估,從而促進(jìn)治療效率的提高和合理的醫(yī)療資源分配
,有助于唇腭裂綜合序列治療的多地域普遍開展。
我國(guó)的唇腭裂語(yǔ)音治療尚未有大范圍的遠(yuǎn)程在線治療實(shí)施,醫(yī)療資源緊張、專業(yè)化團(tuán)隊(duì)缺乏、高精尖技術(shù)欠缺都是亟待解決的因素,并且當(dāng)下在線醫(yī)療尚處于發(fā)展階段,其知名度與認(rèn)可度仍有待提高。
——因戰(zhàn)爭(zhēng)關(guān)閉6年的敘利亞大馬士革國(guó)家博物館重新開放。敘利亞文物和博物館管理局局長(zhǎng)馬哈茂德·哈穆德表示
遠(yuǎn)程在線平臺(tái)在目前唇腭裂綜合序列治療中亦未獲得較高水平的開發(fā)和使用,除了軟硬件條件限制之外,臨床醫(yī)生、研究人員以及計(jì)算機(jī)工程師三者之間合作有限,無(wú)法進(jìn)行細(xì)致的交流反饋從而進(jìn)行共同開發(fā)也是阻礙因素之一
。應(yīng)當(dāng)大力推動(dòng)醫(yī)工交叉項(xiàng)目的落實(shí)與研究,促進(jìn)科研成果的臨床轉(zhuǎn)化。
2.3 堅(jiān)持不同角度看問(wèn)題,多元化多視角的審視問(wèn)題的復(fù)雜性的工作方式。由于企業(yè)經(jīng)營(yíng)管理者與職工身處不同的階層,要想開展好思想政治教育工作,不能僅僅從口號(hào)、空話入題,而是要打動(dòng)員工的內(nèi)心出發(fā),用真情實(shí)感感染人,不回避矛盾,正視矛盾、以走訪、調(diào)查、以事實(shí)為依據(jù),從根本上剖析問(wèn)題存在的原因,以討論、探討或征求意見的方式與職工進(jìn)行交流,幫助職工解決好各類問(wèn)題和困難,使職工感受到企業(yè)對(duì)他們的重視、關(guān)心和愛護(hù),解決當(dāng)前問(wèn)題,避免后續(xù)問(wèn)題的再次發(fā)生。
計(jì)算機(jī)科學(xué)在唇腭裂語(yǔ)音治療領(lǐng)域的使用是客觀需要和未來(lái)發(fā)展的雙重要求,基于智能平臺(tái)的語(yǔ)音治療可以成為唇腭裂患者語(yǔ)音治療的有效輔助手段,靈活運(yùn)用人工智能媒介與主觀評(píng)價(jià)體系的結(jié)合是唇腭裂綜合序列治療的前景模式之一。智能唇腭裂語(yǔ)音識(shí)別已有一定的研究基礎(chǔ)和進(jìn)展,但目前尚未應(yīng)用于臨床。未來(lái)研究方向可著眼于高效精準(zhǔn)的語(yǔ)音識(shí)別和能夠自我學(xué)習(xí)完善的人工智能治療程序,依托于醫(yī)工交叉項(xiàng)目實(shí)現(xiàn)人工智能在唇腭裂語(yǔ)音治療領(lǐng)域的成果轉(zhuǎn)化。
【Author contributions】 Guo YB wrote the article. Cai M revised the paper. All authors read and approved the final manuscript as submitted.
[1]Fitzpatrick B, Coad J, Sell D, et al. Assessing speech at three years of age in the cleft palate population: a scoping review of assessment practices[J]. Int J Lang Commun Disord, 2020, 55(2):165-187.doi:10.1111/1460-6984.12517.
[2]Chapman KL, Baylis A, Trost-Cardamone J, et al. The americleft speech project:a training and reliability study[J].Cleft Palate Craniofac J,2016,53(1):93-108.doi:10.1597/14-027.
[3]Kobayashi Y, Kanamori D, Fujii N, et al. Velopharyngeal closure analysis using four-dimensional computed tomography: a pilot study of healthy volunteers and adult patients with cleft palate[J].BMC Med Imaging, 2019, 19(1): 54. doi: 10.1186/s12880-019-0350-4.
[4]Toki EI,Pange J,Mikropoulos TA.An online expert system for diagnostic assessment procedures on young children's oral speech and language[J]. Procedia Computer Science, 2012, 14: 428-437.doi:10.1016/j.procs.2012.10.049.
[5]Lee LM, Le HH, Jean FR. Improved model adaptation approach for recognition of reduced-frame-rate continuous speech[J]. PLoS One,2018,13(11):e0206916.doi:10.1371/journal.pone.0206916.
[6]Nakai Y,Takiguchi T,Matsui G,et al.Detecting abnormal word utterances in children with autism spectrum disorders:machine-learning-based voice analysis
speech therapists[J]. Percept Mot Skills,2017,124(5):961-973.doi:10.1177/0031512517716855.
[7]Kuresan H, Samiappan D, Masunda S. Fusion of WPT and MFCC feature extraction in Parkinson′s disease diagnosis[J]. Technol Health Care,2019,27(4):363-372.doi:10.3233/THC-181306.
[8]He L, Wang XY, Zhang J, et al. Automatic detection of consonant omission in cleft palate speech[J]. Int J Speech Technol, 2019, 22(1):59-65.doi:10.1007/s10772-018-09570-w.
[9]付佳,田婷,唐銘,等.結(jié)合PECGTFs 和SSMC 的腭裂語(yǔ)音咽擦音自動(dòng)檢測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(24):102-109.doi:10.3778/j.issn.1002-8331.1808-0265.Fu J,Tian T,Tang M,et al.Automatic detection algorithm for cleft palate speech pharyngeal fricatives combined with PECGTFs and SSMC[J]. Comput Eng Appl, 2019, 55(24):102-109. doi:10.3778/j.issn.1002-8331.1808-0265.
[10] 何飛,孟雨璇,田維維,等.基于多延遲四階累積量倍頻程譜線的腭裂語(yǔ)音咽擦音自動(dòng)檢測(cè)算法[J].計(jì)算機(jī)科學(xué),2020,47(1):144-152.doi:10.11896/jsjkx.180701349.He F,Meng YX,Tian WW,et al.Automatic detection algorithm of pharyngeal fricative in cleft palate speech based on multi-delay fourth-order cumulant octave spectral line[J]. Comput Sci, 2020,47(1):144-152.doi:10.11896/jsjkx.180701349.
[11] He L, Zhang J, Liu Q, et al. Automatic detection of glottal stop in cleft palate speech[J]. Biomed Signal Process Control, 2018, 39:230-236.doi:10.1016/j.bspc.2017.07.027.
[12] 王熙月,黃毅鵬,錢佳慧,等.基于聲學(xué)特征的腭裂語(yǔ)音聲韻母切分[J]. 計(jì)算機(jī)工程與應(yīng)用, 2018, 54(8): 123-130, 136. doi:10.3778/j.issn.1002-8331.1611-0388.Wang XY, Huang YP, Qian JH, et al. Initial and final segmentation in cleft palate speech based on acoustic characteristics[J].Comput Eng Appl, 2018, 54(8): 123-130, 136. doi: 10.3778/j.issn.1002-8331.1611-0388.
[13] Furlong L, Erickson S, Morris ME. Computer-based speech therapy for childhood speech sound disorders[J]. J Commun Disord,2017,68:50-69.doi:10.1016/j.jcomdis.2017.06.007.
[14] Castillo JC, álvarez-Fernández D, Alonso-Martín F, et al. Social robotics in therapy of apraxia of speech[J]. J Healthc Eng, 2018:7075290.doi:10.1155/2018/7075290.
[15] Stark BC, Warburton EA. Improved language in chronic aphasia after self-delivered iPad speech therapy[J]. Neuropsychol Rehabil,2018,28(5):818-831.doi:10.1080/09602011.2016.1146150.
[16] Kersey AJ, Emberson LL. Tracing trajectories of audio-visual learning in the infant brain[J]. Dev Sci, 2017, 20(6): 12480. doi:10.1111/desc.12480.
[17] Franceschini S, Trevisan P, Ronconi L, et al. Action video games improve reading abilities and visual-to-auditory attentional shifting in English-speaking children with dyslexia[J].Sci Rep,2017,7(1):5863.doi:10.1038/s41598-017-05826-8.
[18] Sartorato F, Przybylowski L, Sarko DK. Improving therapeutic outcomes in autism spectrum disorders:enhancing social communication and sensory processing through the use of interactive robots[J]. J Psychiatr Res, 2017, 90: 1-11. doi: 10.1016/j.jpsychires.2017.02.004.
[19] Vucovich M, Hallac RR, Kane A, et al. Automated cleft speech evaluation using speech recognition[J]. J Craniomaxillofac Surg,2017,45(8):1268-1271.doi:10.1016/j.jcms.2017.05.002.
[20] Lee SC,Wang JF,Chen MH.Threshold-based noise detection and reduction for automatic speech recognition system in human-robot interactions[J]. Sensors (Basel), 2018, 18(7): 2068. doi: 10.3390/s18072068.
[21] Jung YH, Hong SK, Wang HS, et al. Flexible piezoelectric acoustic sensors and machine learning for speech processing[J]. Adv Mater,2020,32(35):e1904020.doi:10.1002/adma.201904020.
[22] Jesus LM, Santos J, Martinez J. The table to tablet (T2T) speech and language therapy software development roadmap[J]. JMIR Res Protoc,2019,8(1):e11596.doi:10.2196/11596.