• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      采用聲調(diào)基頻特征的民族語聲調(diào)識別

      2021-01-26 03:42:24龍潤田
      貴州民族研究 2020年11期
      關(guān)鍵詞:廣州話平調(diào)基頻

      龍潤田

      (首都師范大學(xué) 文學(xué)院,北京100089)

      一、引言

      普通話、漢語方言及大部分分布在中國南方的少數(shù)民族語言均具有聲調(diào)。這些語言的聲調(diào)具有很強的別義能力。在語音信號處理中,聲調(diào)作為語音的重要組成部分,其對于聲調(diào)的識別及合成研究亦具有重要的意義。

      對于聲調(diào)識別,利用聲調(diào)與基音頻率間的關(guān)系實現(xiàn)語音的識別已成為研究者們的共識。常用的語音識別方法包括隱馬爾科夫模型(HMM)[1-2],神經(jīng)網(wǎng)絡(luò)[3-4],支持向量機(SVM)[5-6]以及特征聚類[7]等。對于HMM、神經(jīng)網(wǎng)絡(luò)以及SVM而言,這3類方法均需要在識別前進行聲調(diào)模型的訓(xùn)練或設(shè)計分類器來對未知聲調(diào)進行識別。對于特征聚類的聲調(diào)識別,則通過不同聲調(diào)間參數(shù)的區(qū)分性,利用聲調(diào)特征進行聚類分析達到聲調(diào)識別的目的。除了識別算法外,聲調(diào)識別特征也是聲調(diào)識別的重要組成部分,目前的聲調(diào)識別特征主要包括語音聲學(xué)特征[1,2,6]、基頻特征[5,8]等。常用的特征包括基音頻率、短時能量以及基頻衍生的幾何特征,如基頻的長度、斜率、最值等。

      對聲調(diào)的研究,語言學(xué)研究者更關(guān)注聲調(diào)的調(diào)類歸并、劃分及其歷史演變過程。但從田野調(diào)查中獲取的語音材料,在未經(jīng)聽辨記音的情況下,往往不可能獲知其到底具有幾個聲調(diào),這時,采用模型訓(xùn)練的方法,并不能夠較為迅速準確地獲取聲調(diào)的類別和調(diào)值。對于特征聚類的識別方法,在聚類分析前一般需要事先給定聚類類別的數(shù)目,在不知道確切的聲調(diào)類別數(shù)目時,將會給聚類識別帶來較大的困難。同時,語言田野調(diào)查的錄音數(shù)據(jù),常常不局限于一種語言。采用模型訓(xùn)練、設(shè)計分類器的方法,在轉(zhuǎn)化語言后又需要重新訓(xùn)練模型、設(shè)計分類器,時效性較差。

      針對以上問題,文章從基頻曲線的區(qū)分特征出發(fā),提出了一種基于基頻特征的聲調(diào)聚類識別方法。根據(jù)不同的語言調(diào)查情況采用不同的聚類算法對提取的基頻特征進行無監(jiān)督自動分析聚類,以獲得聲調(diào)識別的結(jié)果,同時在此方法的基礎(chǔ)上建立了少數(shù)民族語單音節(jié)聲調(diào)識別系統(tǒng)。相較于針對單一語言的聲調(diào)識別系統(tǒng),本系統(tǒng)可適用于絕大多數(shù)聲調(diào)語言的聲調(diào)識別標注。

      二、聲調(diào)與基頻特征

      大多數(shù)語音的原始數(shù)據(jù)是難以直接被計算機系統(tǒng)處理分析的,需要提取一些合適的表征特征來表示原始的語音數(shù)據(jù)。對于語音聲波本身包括了許多的干擾因素和冗余信息,例如,噪音干擾、電流干擾等。很多的語音信息蘊含在語音信號中,需要進行處理才能顯現(xiàn)。這時直接采用語音信號波形進行語音聲調(diào)識別分析并不現(xiàn)實。必須對語音信號選取相應(yīng)特征,剔除語音中不必要信息以提高語音聲調(diào)識別的準確性。

      在聲調(diào)研究中,不同的研究針對聲調(diào)描述方法各不相同,王士元根據(jù)區(qū)別性特征理論使用曲、高、央、中、升、降、凸七類對聲調(diào)進行描述[9],沈炯和劉俐李采用音區(qū)特征和曲拱特征描述聲調(diào)[10-11],朱曉農(nóng)提出了分域四度標調(diào)法[12-13],金健等則從音高、調(diào)形凹凸、平拱時長及斜率的角度描述聲調(diào)[14]。在聲調(diào)識別中,彭剛、王士元提取了20種不同的特征來對廣東話的聲調(diào)進行識別[5],宋剛、姚艷紅則利用基頻曲線的9種不同特征進行普通話的基頻擬合與識別[8]。

      本文對聲調(diào)曲線提取了10類不同的特征,分別是:(1) 基頻起始點和終止點的幅度差(音高變化),(2) 基頻曲線長度(時長),(3) 基頻的最大值,(4) 基頻最小值,(5) 基頻曲線極值點(拐點), (6) 極值點前基頻曲線的斜率,(7) 極值點以后基頻曲線的斜率,(8) 極值點前段基頻曲線的變化幅度,(9) 極值點后段基頻曲線的變化幅度,(10) 基頻的均值。該10類聲調(diào)曲線特征基本涵蓋了前述研究者所用的區(qū)分特征,并能夠較為完整合理地描述基頻曲線的變化。

      三、聲調(diào)識別系統(tǒng)

      一個完整的聲調(diào)聚類識別系統(tǒng)如圖1所示?;诼晫W(xué)特征參數(shù)的聲調(diào)聚類識別標注系統(tǒng)大致可分為參數(shù)提取和特征聚類識別兩個部分。

      圖1 基于聲學(xué)特征參數(shù)聚類的聲調(diào)識別系統(tǒng)

      在數(shù)據(jù)特征參數(shù)提取階段,首先需要對語音信號進行預(yù)處理,提取語音中的有聲段。由于聲調(diào)特征主要蘊藏在語音音節(jié)的韻母段中,因此在提取語音有聲段后,還需要進行聲韻的切分工作,而提取韻母段。對于聲韻切分而言,其精確程度決定了所提取的聲調(diào)基頻曲線的準確度。在進行聲韻切分后,采用STRAIGHT分析算法[15]提取語音的基頻曲線。在獲得基頻曲線后,由于多數(shù)聲調(diào)中均存在彎頭降尾,因此還需要對所提取的基頻曲線剔除掉彎頭降尾的影響。彎頭降尾的剔除包括錯誤基頻的處理和彎頭降尾的處理兩個部分。剔除彎頭降尾影響后的聲調(diào)基頻曲線即可看作為聲調(diào)的調(diào)型曲線。對于處理后的基頻曲線,采用線性擬合的方法進行規(guī)整處理,提取10類基頻特征用于聲調(diào)的特征識別。在本系統(tǒng)中,10類特征均是在擬合曲線上獲取的。因此,擬合曲線和原始基頻曲線的相似度會對最終的聲調(diào)識別結(jié)果產(chǎn)生很大的影響。

      在特征識別階段,首先需要對每條聲調(diào)基頻曲線所提取的10類特征進行規(guī)整處理,將所有的特征放在同一度量下進行識別聚類,以防止奇異特征的參量過大導(dǎo)致聲調(diào)識別錯誤。對特征進行規(guī)整處理后,即可根據(jù)需要對聲調(diào)數(shù)據(jù)進行無監(jiān)督的聚類識別。對于聲調(diào)的聚類識別可以分為兩種,當知道聲調(diào)的正確分類數(shù)目時,采用K-means 聚類對數(shù)據(jù)進行快速的聚類識別。當不知道聲調(diào)類別時,則可通過AP聚類算法[16]進行聲調(diào)的無監(jiān)督自動聚類識別。對獲得的識別結(jié)果,則可通過聽辨類內(nèi)的極小部分語音或在聲調(diào)調(diào)域內(nèi)直接觀察即可確定聲調(diào)調(diào)值,據(jù)此給語音數(shù)據(jù)進行聲調(diào)標注。

      四、民族語聲調(diào)識別測試

      少數(shù)民族語和漢語方言的聲調(diào)識別標注測試采用已完成記音標注的語料進行。在聲調(diào)識別測試中,將所有語料的標注信息去除后進行無監(jiān)督的語音聲調(diào)識別,將識別結(jié)果與標注信息比較計算識別正確率。

      本文采用的語音聲調(diào)識別語料。由“斐風(fēng)”田野調(diào)查錄音軟件錄制,包括:侗語邦寨話、壯語橫縣話、粵語廣州話、湘語長沙話共4種語言,每種語言包括700~3000個不等的單音節(jié)詞,覆蓋所有聲韻及聲調(diào)類型。其中侗語、壯語、湘語的發(fā)音人為男性,廣州話的發(fā)音人為女性。語料錄音的采樣頻率為44100Hz,16bit量化,單聲道波形文件。所有語音全部由專業(yè)語言研究者進行聽辨校驗,保證記音的準確性。

      (一) 侗語邦寨話聲調(diào)識別結(jié)果

      邦寨侗語共有9個舒聲調(diào)、6個促聲調(diào)。其中促聲調(diào)的8調(diào)和9’調(diào)、9調(diào)和10調(diào)的調(diào)值相同,6個調(diào)類實際歸并為4個調(diào)值[17]。后文為了敘述簡便,我們將8調(diào)和9’調(diào)全部標記為8調(diào),9調(diào)和10調(diào)全部標記為9調(diào)。邦寨侗語在調(diào)型上包含5個平調(diào),3 個升調(diào)和1個降調(diào)。根據(jù)本文所述方法對所有邦寨侗語語料進行已知聲調(diào)類別的聚類識別。

      其聲調(diào)識別率如表1所示??v向為聚類所得調(diào)類調(diào)值,橫向為聽辨記音的調(diào)類調(diào)值。大體上,聚類結(jié)果與聽辨記音結(jié)果相類似,錯誤聚類結(jié)果較少,歸類錯誤的聲調(diào)主要集中在兩個聲調(diào)的交叉重合區(qū)域內(nèi)。識別錯誤的情況主要存在于兩個相似聲調(diào)的重合區(qū)域。例如低平調(diào)1’調(diào)(調(diào)值11)、2 調(diào)(調(diào)值22) 存在相互識別的情況,同樣,高平調(diào)3調(diào)(調(diào)值33)、5調(diào)(調(diào)值55)、6調(diào)(調(diào)值44) 以及促聲調(diào)7’調(diào)(調(diào)值55) 也存在類似現(xiàn)象。其原因在于相互識別的聲調(diào),其調(diào)型相同或相似,僅存在音高(基頻) 上的差異。

      表1 侗語邦寨話聲調(diào)聚類識別結(jié)果表

      (二) 壯語橫縣話聲調(diào)識別結(jié)果

      橫縣壯語中共有10個聲調(diào),其中舒聲調(diào)6個,促聲調(diào)4個。包含平調(diào)6個、降調(diào)2個和升調(diào)2個。對其進行自動分類的聲調(diào)識別,系統(tǒng)給出的最終聚類結(jié)果為10類,其基頻分布也與傳統(tǒng)音位學(xué)調(diào)類相一致。

      橫縣壯語的聲調(diào)基頻的聚類識別率如表2所示:縱向為聚類所得調(diào)類,橫向為聽辨記音的調(diào)類。大體上,聚類結(jié)果與聽辨記音結(jié)果相類似,錯誤聚類結(jié)果較少。對于識別錯誤的情況。發(fā)現(xiàn)在橫縣壯語中,平調(diào)的識別率最低,降調(diào)的識別率最高。究其原因,主要是在橫縣壯語的聲調(diào)系統(tǒng)中,平調(diào)的個數(shù)占了60%。在平調(diào)中,存在3調(diào)(調(diào)值33)、4調(diào)(調(diào)值22) 這樣的低平調(diào)和5調(diào)(調(diào)值55) 這樣的高平調(diào)。對于兩個低平調(diào),其調(diào)型差異較小,特征差異主要來自于聲調(diào)音高差異(基頻值)。類似的,對于1調(diào)(調(diào)值35) 和2調(diào)(調(diào)值13) 也有類似的情況,導(dǎo)致其聚類識別率較低。

      表2 橫縣壯語聲調(diào)聚類識別結(jié)果表

      (三) 粵語廣州話的聲調(diào)識別結(jié)果

      廣州話有9個聲調(diào)。在作單字音研究時廣州話描寫為11個聲調(diào)。與9調(diào)描述相比其陰平調(diào)被劃分為上陰平和下陰平,同時在入聲中增加了一個變?nèi)隱18]。11調(diào)的廣州話聲調(diào)系統(tǒng)中,共有7個舒聲調(diào)、4 個促聲調(diào)。從調(diào)型上看,有平調(diào)3個、升調(diào)2 個、降調(diào)2個。不考慮入聲區(qū)別僅從調(diào)型上來分,廣州話可以分為7類。使用本文所述方法對廣州話所有單音節(jié)詞語料提取相應(yīng)的特征參數(shù)并進行聚類識別。針對于調(diào)型的聲調(diào)識別結(jié)果如下:

      在采用的廣州話語料中,調(diào)型為平調(diào)的33調(diào)、22 調(diào)以及23調(diào)、21調(diào)的識別率較低,其原因在于33調(diào)與22調(diào)均為平調(diào)調(diào)型,且其在調(diào)域內(nèi)相對接近,很容易將22調(diào)識別為33調(diào)判斷識別為33調(diào),對于22調(diào)和21調(diào)以及23調(diào)和33調(diào)也存在類似的情況。

      表3 廣州話聲調(diào)調(diào)型聚類識別結(jié)果表

      (四) 湘語長沙話的聲調(diào)識別結(jié)果

      長沙話屬于湘語長益片長沙方言,共有6個聲調(diào)。分別是陰平(調(diào)值33)、陽平(調(diào)值13)、上聲(調(diào)值41)、陰去(調(diào)值55),陽去(調(diào)值11)和入聲(調(diào)值24)。其中陰去的實際調(diào)值為45,陽去的實際調(diào)值為21。使用上述方法進行聲調(diào)自動分類識別分析,最終獲得6類分析識別結(jié)果,其基頻分布也與傳統(tǒng)音系學(xué)的調(diào)類相一致。

      在長沙話的聲調(diào)識別結(jié)果中,調(diào)型相近或者相似的幾個聲調(diào)的聲調(diào)識別率較低。在調(diào)域中,33 調(diào)的調(diào)型和調(diào)值都與24調(diào)13調(diào)較為相似,這使得計算機在進行特征分析判斷的時候極有可能出現(xiàn)誤判。類似的,13調(diào)也有很多被誤判為33 調(diào)。

      表4 長沙話聲調(diào)聚類分析識別結(jié)果表

      五、結(jié)論

      本文提出的特征聚類聲調(diào)識別方法對于聲調(diào)系統(tǒng)復(fù)雜的語言,其聲調(diào)識別正確率達到75%以上。建立的聲調(diào)聚類識別系統(tǒng)在語音調(diào)查聲調(diào)自動記音上具有一定的適用性。該方法是對田野調(diào)查語料的聲調(diào)進行自動聚類識別的一次嘗試。相對于傳統(tǒng)工程領(lǐng)域的聲調(diào)識別方法,聲調(diào)特征聚類算法不需要進行聲調(diào)建模,也沒有訓(xùn)練的過程,這使得在處理大量數(shù)據(jù)時,聚類算法不僅能節(jié)約更多的時間,同時獲得較高的識別效果。

      在識別過程中,調(diào)型相似的聲調(diào),區(qū)分度較差,識別率較低。尋找聲調(diào)區(qū)分特征,提高聲調(diào)識別效率將是后續(xù)的工作方向。

      少數(shù)民族語類型十分多樣。本聲調(diào)識別系統(tǒng)雖然對少數(shù)民族語和漢語方言的多種聲調(diào)類型進行識別測試,獲得了一定效果。但嚴格地來說,這只是一個小范圍內(nèi)的嘗試,語料僅包含了南方少數(shù)民族語中常見的平調(diào)、升調(diào)、降調(diào)、曲折調(diào)。對于其他一些特殊形式的聲調(diào),識別系統(tǒng)還沒有進行嘗試。

      猜你喜歡
      廣州話平調(diào)基頻
      國學(xué)周周讀
      語音同一認定中音段長度對基頻分析的影響
      基于時域的基頻感知語音分離方法?
      蒼梧白話中的指示代詞“噉蚊”和“咁”
      香港說廣州話的學(xué)生習(xí)得普通話咝音聲母的研究
      橋面鋪裝層對中小跨徑橋梁基頻影響分析
      菏澤大平調(diào)的傳承及保護策略研究*
      黃河之聲(2019年5期)2019-12-18 12:47:03
      “咁”和“噉蚊”在梧州話與廣州話中的區(qū)別與聯(lián)系
      45000kHz基頻晶體濾波器
      電子制作(2017年20期)2017-04-26 06:57:35
      RCM維修管理模式在平調(diào)系統(tǒng)設(shè)備維修中的應(yīng)用
      宿松县| 赤峰市| 石渠县| 双柏县| 荥经县| 龙海市| 庄河市| 阳曲县| 旺苍县| 昆明市| 青浦区| 蕲春县| 和田市| 阳西县| 宁都县| 仙桃市| 丹凤县| 东辽县| 岳池县| 博野县| 武平县| 凤冈县| 阿拉善左旗| 峨眉山市| 临安市| 淮滨县| 赤水市| 永德县| 牙克石市| 慈溪市| 永州市| 天等县| 钦州市| 莲花县| 河南省| 卫辉市| 永春县| 响水县| 慈溪市| 东乡县| 安庆市|