• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      說話人確認(rèn)中基于無監(jiān)督聚類的得分規(guī)整

      2019-10-30 01:08:38古斌郭武
      數(shù)據(jù)采集與處理 2019年5期
      關(guān)鍵詞:規(guī)整語料均值

      古斌郭武

      (中國科學(xué)技術(shù)大學(xué)語音及語言信息處理國家工程實(shí)驗(yàn)室,合肥,230026)

      引 言

      說話人確認(rèn)(Speaker verification,SV)是判斷一段測試語音與其所聲明身份是否一致的過程,是一個(gè)典型的二分類模式識(shí)別任務(wù)。在說話人確認(rèn)中,需要計(jì)算每段測試語料與其聲明說話人模型之間的得分,然后將得分與設(shè)定的判決門限比較并作出判決,該門限對(duì)所有測試語音都是同一個(gè)數(shù)值[1]。受語料之間信道、語種、時(shí)長、性別等因素的影響,不同的說話人模型、不同冒認(rèn)者的得分分布往往不同,這種固定數(shù)值的門限會(huì)導(dǎo)致整個(gè)系統(tǒng)的性能受到嚴(yán)重的影響。

      在進(jìn)行生物輻射影響評(píng)價(jià)時(shí),經(jīng)常會(huì)用到分級(jí)的評(píng)價(jià)結(jié)構(gòu)。較低層級(jí)的評(píng)價(jià)頗為保守,但只需要極少的數(shù)據(jù)輸入,多用于初步篩選;較高層級(jí)的評(píng)價(jià)則更為接近現(xiàn)實(shí)情況,結(jié)果更加準(zhǔn)確,但相應(yīng)的也需要更多的數(shù)據(jù),尤其是當(dāng)?shù)氐臏y量數(shù)據(jù)。在進(jìn)行生物輻射影響評(píng)價(jià)時(shí),通常會(huì)先采用較低層級(jí)的方法來進(jìn)行篩選,對(duì)于可能出現(xiàn)影響的情況再進(jìn)行高層級(jí)地仔細(xì)評(píng)價(jià)。

      材料力學(xué)[1-2]是固體力學(xué)的一個(gè)分支,與彈性力學(xué)[3]相比,研究的構(gòu)件局限在桿件這一相對(duì)簡單的形式上,包括在載荷或溫度變化作用下桿件的強(qiáng)度、剛度和穩(wěn)定性問題。材料力學(xué)是一門重要的技術(shù)基礎(chǔ)課,包括機(jī)械、土木、水利和交通等專業(yè)的學(xué)生都要求必須修讀。雖然大部分學(xué)生在中小學(xué)就學(xué)習(xí)了牛頓力學(xué)的基本常識(shí),但是一般直到開始學(xué)習(xí)材料力學(xué),才開始接觸力學(xué)中最重要的一些概念,比如應(yīng)力和應(yīng)變等。由于材料力學(xué)本身內(nèi)容繁雜,概念抽象,對(duì)數(shù)學(xué)工具的應(yīng)用要求較高,再加上力學(xué)課程的課時(shí)安排在很多高校中并不充裕,在實(shí)際的教學(xué)實(shí)踐中發(fā)現(xiàn)相當(dāng)多的學(xué)生對(duì)這門課的掌握并不理想。

      為了使得不同說話人模型、不同冒認(rèn)者的得分分布趨于一致,從而使得固定的門限能夠比較好地區(qū)分目標(biāo)說話人和冒認(rèn)者,一般采用得分規(guī)整的方法來實(shí)現(xiàn)這一目的。通常有2種規(guī)整的途徑,一種是規(guī)整目標(biāo)說話人模型的得分分布,例如零規(guī)整(Z-norm),另一種是規(guī)整冒認(rèn)者得分分布,例如測試規(guī)整(T-norm),在這二者的基礎(chǔ)上,又衍生出了一系列得分規(guī)整方法,包括ZT-norm[2]、S-norm[3]、Top-norm[4]等。目前得分規(guī)整已在說話人確認(rèn)系統(tǒng)中的得到廣泛運(yùn)用,并在高斯混合模型-通用背景模型(Gaussian mixture models,universal background model,GMM-UBM)[5]、i-vector[6]、x-vector[7]等系統(tǒng)中取得顯著效果。

      近幾年的研究中,如何挑選合適的測試語料與其聲明身份組成測試從而得到接近真實(shí)測試條件的得分分布參數(shù)是一關(guān)鍵問題[8]。由于測試集的得分分布實(shí)際上是無法事先獲知的,為了盡量縮小估計(jì)分布與真實(shí)分布之間的偏移,研究者們提出了自適應(yīng)得分規(guī)整方法。一些研究者從說話人特征層面來挑選規(guī)整數(shù)據(jù)[9-10],挑選與測試數(shù)據(jù)盡可能相似的數(shù)據(jù),還有一些研究者選擇從得分層面來挑選規(guī)整數(shù)據(jù),對(duì)規(guī)整集合得分只取值較大的若干個(gè)得分用于統(tǒng)計(jì)分布參數(shù)[11-12]。近幾年的應(yīng)用中,從得分層面挑選規(guī)整數(shù)據(jù)的自適應(yīng)得分規(guī)整方法應(yīng)用更加廣泛[13-15]。

      得分規(guī)整總體邏輯思路就是把所有冒認(rèn)者得分規(guī)整到同一分布上,消除說話內(nèi)容、語速等因素的影響[16],從而通過一個(gè)合理的門限來獲得最好的識(shí)別性能。NIST SRE 2016測試集出現(xiàn)了以往數(shù)據(jù)集中未曾出現(xiàn)過的語種,開發(fā)集中只有部分無標(biāo)簽數(shù)據(jù)與測試集標(biāo)簽信息相匹配,因此無法針對(duì)每個(gè)說話人或測試語句挑選合適的規(guī)整數(shù)據(jù)集,根據(jù)以往的研究,此時(shí)需要使用自適應(yīng)得分規(guī)整的方法。在選擇得分最高的一些冒認(rèn)者得分來估計(jì)規(guī)整參數(shù)時(shí),對(duì)每個(gè)待規(guī)整對(duì)象(說話人模型或測試語料)都取相同數(shù)量的較大得分,這些數(shù)值較大的得分不服從高斯分布,因此必然與測試集的分布存在偏差。

      林業(yè)資源是我國能源資源儲(chǔ)備體系的重要組成部分,對(duì)維護(hù)生態(tài)平衡、促進(jìn)國民經(jīng)濟(jì)健康發(fā)展以及提高人們生活質(zhì)量都產(chǎn)生了積極促進(jìn)作用。完善林業(yè)資源保護(hù)措施,提升森林防火管理模式的實(shí)用性和有效性,有助于緩解當(dāng)前林業(yè)資源無法滿足經(jīng)濟(jì)社會(huì)高速發(fā)展對(duì)大量林業(yè)資源需求的矛盾,為充分發(fā)揮林業(yè)資源對(duì)經(jīng)濟(jì)社會(huì)的促進(jìn)作用奠定基礎(chǔ)。

      由表2~6可以看出,29個(gè)樣品個(gè)共有峰的相對(duì)保留時(shí)間漂移不大。由表3可見,不同品種棗葉的指紋圖譜相似度存在差異。根據(jù)與S30(對(duì)照圖譜[14])相似度的大小,可將樣品分為三類:Ⅰ類相似度為85%~91%,Ⅱ類相似度為92%~95%,Ⅲ類相似度大于95%;S1、S11、S17、S18、S24棗葉指紋圖譜相似度為85%~91%,為Ⅰ類; S12、S20、S23、S28、S29棗葉的指紋圖譜相似度為92%~95%,為Ⅱ類;其余的為Ⅲ類。相似度可以體現(xiàn)不同批次樣品間各成分在種類及其相對(duì)量上的整體相似程度。分析結(jié)果表明,29個(gè)品種棗葉樣品的成分和含量相似度較高,但仍然存在一定差異。

      1 得分規(guī)整

      1.1 基礎(chǔ)得分規(guī)整方法

      聚類完成后,可以認(rèn)為K-means聚類獲得的K個(gè)類別的得分代表著不同匹配程度的測試得分類,類中心數(shù)值越大的類得分所對(duì)應(yīng)的冒認(rèn)者測試語料與聲明說話人在性別、語種等方面信息匹配程度越高。

      本文使用NIST SRE 2016測試集作為系統(tǒng)性能評(píng)估數(shù)據(jù)集,測試集為廣東話與菲律賓塔加路語2種語言的混合數(shù)據(jù)集。測試集中說話人注冊語音為時(shí)長60 s的語料,說話人模型由1段或3段語料注冊得到;測試語料時(shí)長均勻分布在10~60 s,目標(biāo)說話人測試37058條,冒認(rèn)者測試19494662條。

      故障處理結(jié)束后,對(duì)調(diào)度系統(tǒng)進(jìn)行修復(fù)維護(hù)。對(duì)計(jì)算機(jī)站控系統(tǒng)的各個(gè)設(shè)備進(jìn)行狀態(tài)檢查,通過在線自診斷確定故障發(fā)生的部位,用交互方式在線對(duì)數(shù)據(jù)庫中的各個(gè)數(shù)據(jù)項(xiàng)進(jìn)行修改和增刪,及時(shí)處理故障完成修復(fù)工作,保證調(diào)度系統(tǒng)能夠盡快投入運(yùn)行。

      目前為止,富春江浮標(biāo)站為富春江上唯一氣象監(jiān)測站,資料的時(shí)間序列也有限,而且維護(hù)維修程序相對(duì)繁瑣,資料的連續(xù)性有時(shí)無法得到保障。因此對(duì)浮標(biāo)站和周邊站點(diǎn)的對(duì)比分析,找到其與周邊站點(diǎn)一些定性定量的規(guī)律顯得尤為重要。風(fēng)向?qū)庀鬄?zāi)害的主導(dǎo)作用不明顯,故下面主要對(duì)城區(qū)國家站(58449)、浮標(biāo)站(K1600)、江南站(K1240)以及新沙島站(K1712)4個(gè)站的風(fēng)速做一定的對(duì)比分析。

      T-norm與Z-norm相似,不同的是它利用每段測試語料與不同冒認(rèn)說話人模型進(jìn)行測試得到得分,從而統(tǒng)計(jì)每段測試語句的得分分布參數(shù)并對(duì)測試得分進(jìn)行規(guī)整。T-norm可以較好地消除測試語音環(huán)境對(duì)輸出評(píng)分分布的影響,但是得分分布參數(shù)需在實(shí)際測試時(shí)獲取,屬于在線計(jì)算,會(huì)降低模型識(shí)別速度。基于Z-norm、T-norm的規(guī)整方法,又衍生出了S-norm、ZT-norm、TZ-norm等一系列方法,其中S-norm是將Z-norm和T-norm規(guī)整后的得分進(jìn)行加權(quán)求和,該方法憑借其優(yōu)異的性能在近些年獲得了廣泛應(yīng)用。

      物質(zhì)文化,即是校園文化的基礎(chǔ)。它的存在與校園的每個(gè)角落,環(huán)境、設(shè)施等等。物質(zhì)文化比較重點(diǎn)的方面是學(xué)校內(nèi)部的綠化、教學(xué)設(shè)施、實(shí)驗(yàn)設(shè)備等幾個(gè)對(duì)日常影響較大的方面,物質(zhì)文化相較于精神文化,更加的直觀,只要進(jìn)到學(xué)校,就能夠?qū)@個(gè)學(xué)校的物質(zhì)文化好與壞一覽無遺。

      1.2 自適應(yīng)得分規(guī)整方法

      自適應(yīng)得分規(guī)整方法在基礎(chǔ)得分規(guī)整方法之上對(duì)規(guī)整數(shù)據(jù)進(jìn)行了選擇。在這類方法中,只有部分被選中的規(guī)整數(shù)據(jù)用于統(tǒng)計(jì)得分的均值和標(biāo)準(zhǔn)差,被選中的這部分?jǐn)?shù)據(jù)可能隨著每一個(gè)規(guī)整對(duì)象而變化。以Top-norm為例。在Top-norm中,規(guī)整數(shù)據(jù)集中的每條語句都參與得分計(jì)算,但是只有得分值最大的N個(gè)得分將被用于統(tǒng)計(jì)規(guī)整時(shí)所使用的均值和方差,圖1以某個(gè)說話人模型在規(guī)整數(shù)據(jù)集上的得分分布為例,展示了自適應(yīng)規(guī)整數(shù)據(jù)選擇的過程,其中橫軸表示得分的數(shù)值大小,縱軸表示得分在單位區(qū)間內(nèi)出現(xiàn)的次數(shù)。

      該種自適應(yīng)得分挑選的方法如今已廣泛應(yīng)用于Z-norm、T-norm、S-norm等基礎(chǔ)得分規(guī)整方法中,本文所提出的自適應(yīng)得分規(guī)整方法將與該種方法進(jìn)行對(duì)比。在本文中使用該種方法時(shí)會(huì)在相應(yīng)的基礎(chǔ)規(guī)整方法前用“Top”標(biāo)注。

      2 基于無監(jiān)督聚類的得分規(guī)整

      圖1 自適應(yīng)規(guī)整數(shù)據(jù)選擇Fig.1 Adaptive normalization data selection

      步驟3當(dāng)模型參數(shù)收斂或達(dá)到最大迭代次數(shù)時(shí)終止參數(shù)更新,否則跳轉(zhuǎn)至步驟1。

      2.1 冒認(rèn)者得分篩選

      對(duì)于注冊集中第m個(gè)說話人模型em,與包含L條語料的規(guī)整數(shù)據(jù)集測試后可得到L個(gè)測試得分{s(em,t*l),l∈[1,L]},利用K-means算法對(duì)L個(gè)得分進(jìn)行聚類,然后僅保留均值靠前的若干類得分作為篩選后得分。具體算法如下:

      步驟1隨機(jī)選擇K個(gè)初始中心點(diǎn){μ1,μ2,…,μK}。

      步驟2計(jì)算每個(gè)測試得分到K個(gè)中心點(diǎn)歐式距離,根據(jù)最小歐式距離劃分每個(gè)測試得分所屬類別C(μk),當(dāng)s(em,t*l)∈C(μk)則對(duì)于?k'∈ [1,K]有

      魯棒水印算法有較多的研究成果,本文用基于小波變換的水印兩次嵌入算法[11]進(jìn)行實(shí)驗(yàn)。對(duì)如圖1 所示的1200×933 的原始唐卡圖像嵌入如圖2 所示的154×447 的二值水印圖像,含水印唐卡圖像如圖3 所示,從圖3 中提取的水印如圖4 所示。因?yàn)樘瓶▓D像紋理復(fù)雜度高,嵌入水印信息后透明性很好,且魯棒水印算法能抵抗常見的各種攻擊,具有較好的抗攻擊能力。

      步驟3根據(jù)每個(gè)類別的得分更新每個(gè)類別中心點(diǎn),其中|C(μk)|表示C(μk)類中的得分個(gè)數(shù)

      步驟4當(dāng)每個(gè)類別更新后的中心點(diǎn)相較未更新中心點(diǎn)的距離小于設(shè)定閾值或迭代次數(shù)大于設(shè)定值,此時(shí)認(rèn)為聚類數(shù)據(jù)已收斂,否則跳轉(zhuǎn)至步驟2。

      Z-norm和T-norm是使用最為廣泛的2種得分規(guī)整方法,Z-norm利用實(shí)際說話人模型{e1,e2,…,eM}對(duì)大量冒認(rèn)者語料進(jìn)行測試,得到測試得分其中em表示注冊集中第m個(gè)說話人模型表示規(guī)整數(shù)據(jù)集中第l條冒認(rèn)者語料,統(tǒng)計(jì)每個(gè)說話人模型得分均值μ(em)和標(biāo)準(zhǔn)差σ(em)。

      由于得分值較大的冒認(rèn)者在實(shí)際測試時(shí)最難以分辨,需要更多地關(guān)注這類較大值得分,因此舍棄中心值較小的得分類,保留前K'個(gè)聚類中的得分,如圖2所示。在本文Z-norm中K取6,K'取3;T-norm中K取3,K'取2。

      2.2 GMM擬合得分分布

      不同于以往假設(shè)每個(gè)待規(guī)整對(duì)象對(duì)于冒認(rèn)者者得分分布服從單高斯分布,本文假設(shè)其得分分布滿足更為復(fù)雜的混合高斯分布,在2.1節(jié)篩除部分冒認(rèn)者得分的基礎(chǔ)上,引入GMM模型擬合保留得分的分布。

      圖2 得分篩選示意圖Fig.2 Score screening schematic

      鑒于2.1節(jié)已經(jīng)獲得了K'個(gè)得分類,可以按這K'個(gè)類的均值和標(biāo)準(zhǔn)差初始化K'個(gè)高斯的GMM模型均值和標(biāo)準(zhǔn)差,權(quán)重初始值wi按照式(4)初始化

      式中:|C|為保留的總得分個(gè)數(shù),|C(μi)|表示第i類中的得分個(gè)數(shù)。利用EM算法對(duì)保留的得分進(jìn)行進(jìn)一步聚類直至滿足收斂條件,GMM模型的參數(shù)按式(5)—(8)進(jìn)行更新:

      步驟1計(jì)算每個(gè)得分在每個(gè)高斯的占有率

      本文提出了一種新的自適應(yīng)得分規(guī)整方法,利用無監(jiān)督聚類對(duì)每個(gè)待規(guī)整對(duì)象的得分集合進(jìn)行聚類,然后對(duì)數(shù)據(jù)進(jìn)行篩選,并且用混合高斯函數(shù)來擬合經(jīng)過篩選后的冒認(rèn)者得分分布,取均值最大的高斯函數(shù)的均值和標(biāo)準(zhǔn)差作為規(guī)整參數(shù),可以縮小與測試集的真實(shí)得分分布之間的偏差,減小通過固定數(shù)量的得分統(tǒng)計(jì)分布參數(shù)時(shí)丟失的分布信息,從而提高整體識(shí)別性能。本文在NIST SRE 2016數(shù)據(jù)集的測試集上進(jìn)行實(shí)驗(yàn)驗(yàn)證,從結(jié)果上來看,明顯優(yōu)于傳統(tǒng)的方法。

      步驟2根據(jù)每個(gè)高斯的占有率更新GMM參數(shù)

      本節(jié)以Z-norm為例,說明基于聚類的得分規(guī)整。

      《殘疾人康復(fù)服務(wù)“十三五”實(shí)施方案》中指出到2020年,有需求的殘疾兒童和持證殘疾人接受基本康復(fù)服務(wù)的比例達(dá)80%以上。為實(shí)現(xiàn)這一目標(biāo),提出了“實(shí)施殘疾人精準(zhǔn)康復(fù)服務(wù)、提升殘疾人康復(fù)服務(wù)專業(yè)化水平”等措施。同時(shí)提出“加強(qiáng)康復(fù)醫(yī)院、康復(fù)醫(yī)學(xué)科規(guī)范化建設(shè)”。在《殘疾人精準(zhǔn)康復(fù)服務(wù)行動(dòng)實(shí)施方案》中也指出為每個(gè)社區(qū)(村)配備一名社區(qū)康復(fù)協(xié)調(diào)員,與社區(qū)(村)醫(yī)生共同組成殘疾人精準(zhǔn)康復(fù)服務(wù)小組。可見,康復(fù)醫(yī)學(xué)將在當(dāng)前推進(jìn)殘疾人小康進(jìn)程中發(fā)揮著不可替代的作用,在基層康復(fù)服務(wù)實(shí)踐其重要意義也不可或缺。

      當(dāng)GMM模型收斂后,取均值最大的高斯單元均值μ(etop-gaussm)和標(biāo)準(zhǔn)差σ(etop-gaussm)作為當(dāng)前說話人模型的得分規(guī)整參數(shù),如圖3所示,其中縱軸表示得分在單位區(qū)間內(nèi)出現(xiàn)的概率。

      圖3 GMM得分規(guī)整示意圖Fig.3 GMM score normalization Schematic

      3 實(shí)驗(yàn)配置與結(jié)果

      3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)價(jià)指標(biāo)

      訓(xùn)練數(shù)據(jù)集包括 NIST SRE 2004、2005、2006、2008、2010,SwitchBoard以及Mixer6數(shù)據(jù)集中的部分?jǐn)?shù)據(jù),共計(jì)87457條數(shù)據(jù),數(shù)據(jù)時(shí)長主要分布在30 s~3 min,大部分內(nèi)容為網(wǎng)絡(luò)語音、室內(nèi)錄音以及電話中的英文對(duì)話。這些數(shù)據(jù)主要用于UBM、i-vector因子分析的載荷矩陣、PLDA的載荷矩陣訓(xùn)練。

      開發(fā)集中包含一份無標(biāo)簽數(shù)據(jù),為廣東話與菲律賓塔加路語兩種語言的混合數(shù)據(jù),開發(fā)集中只有該部分?jǐn)?shù)據(jù)語種與測試集匹配,以往研究證明若測試集與規(guī)整數(shù)據(jù)集語種不匹配得分規(guī)整將很難獲得效果,因此這部分?jǐn)?shù)據(jù)將用于得分規(guī)整,共計(jì)2272條語音。從這些無標(biāo)簽數(shù)據(jù)中隨機(jī)挑選3/4數(shù)據(jù)作為Z-norm集,剩余作為T-norm集,將說話人模型與Z-norm集、測試語料與T-norm集組合構(gòu)造測試用于得分規(guī)整。

      機(jī)能實(shí)驗(yàn)室重組后,在人員方面僅剩實(shí)驗(yàn)室技術(shù)人員,而教師負(fù)責(zé)實(shí)驗(yàn)教學(xué),在編制上不屬于實(shí)驗(yàn)室。教師和實(shí)驗(yàn)技術(shù)人員缺少溝通和理解,實(shí)驗(yàn)室教學(xué)與管理出現(xiàn)了脫軌,工作銜接不上,給日常實(shí)驗(yàn)教學(xué)順利進(jìn)行增加許多困難[6]。實(shí)驗(yàn)技術(shù)人員必須具有整體觀念和團(tuán)結(jié)協(xié)作精神,在工作上與教研室教師互相配合,遇到問題及時(shí)溝通、商討,凡事從整體利益出發(fā),保證工作順利進(jìn)行。實(shí)驗(yàn)技術(shù)人員和教師在專業(yè)分工、職業(yè)規(guī)劃、工作價(jià)值追求等方面都不盡相同,合理地對(duì)待這種差異,用平等的態(tài)度看待彼此的工作,有利于營造全體教職人員團(tuán)結(jié)和諧的工作氛圍,符合整個(gè)學(xué)校教學(xué)體系建設(shè)的初衷。

      然后利用這2個(gè)分布參數(shù)對(duì)含有說話人模型em的實(shí)際測試得分S(em,*)進(jìn)行規(guī)整

      本文采用NIST SRE 2016官方計(jì)劃中的等錯(cuò)誤率(Equal error rate,EER),最小錯(cuò)誤代價(jià)函數(shù)(Minimal detection cost function,Min_DCF)和實(shí)際的錯(cuò)誤代價(jià)函數(shù)(Actual detection cost function,Act_DCF)作為評(píng)價(jià)指標(biāo)[17]。

      為了體現(xiàn)估計(jì)的得分分布參數(shù)與真實(shí)分布參數(shù)的差異,另外給出均值和標(biāo)準(zhǔn)差2個(gè)偏差參數(shù)的定義

      式中:N為測試集中待規(guī)整對(duì)象的數(shù)量,對(duì)于Z-norm,N為注冊說話人數(shù)量,對(duì)于T-norm,N為測試語料數(shù)量,μ?n、σ?n為根據(jù)規(guī)整集得分估計(jì)的均值和標(biāo)準(zhǔn)差,μn、σn為根據(jù)真實(shí)測試得分統(tǒng)計(jì)的結(jié)果。通過這2個(gè)參數(shù)來比較不同算法對(duì)于真實(shí)得分分布的擬合能力,越小則代表擬合能力越強(qiáng)。

      3.2 系統(tǒng)描述

      本文采用基于i-vector和概率線性判別分析(Probabilistic linear discriminant analysis,PLDA)的說話人確認(rèn)系統(tǒng)。在得到PLDA測試得分之后,采用各種得分規(guī)整方法進(jìn)行得分規(guī)整。整個(gè)流程主要使用Kaldi toolkit[18]開源代碼實(shí)現(xiàn)。

      Z-norm可以較好地消除說話人模型之間的分布差異性,屬于離線計(jì)算,在模型訓(xùn)練階段就可以獲得分布參數(shù),在測試階段不會(huì)額外占用計(jì)算時(shí)間。

      在特征提取階段,首先提取加上一階二階差分后共計(jì)60維的梅爾頻率倒譜系數(shù)(Mel frequency cepstrum coefficient,MFCC)特征,使用3 s的平滑窗作均值方差規(guī)整,然后通過基于能量的語音活動(dòng)檢測(Voice activity detection,VAD)算法去除靜音幀。

      在模型訓(xùn)練階段使用NIST SRE 2016開發(fā)集中的無標(biāo)簽數(shù)據(jù)訓(xùn)練具有全對(duì)角協(xié)方差矩陣的UBM模型,該模型有2048個(gè)高斯成分,利用訓(xùn)練數(shù)據(jù)集與UBM模型訓(xùn)練i-vector生成矩陣,提取600維的i-vector向量,然后訓(xùn)練集測試集各自進(jìn)行均值中心化,通過線性判別分析(Linear discriminant analysis,LDA)將i-vector降維至400維,利用無標(biāo)簽數(shù)據(jù)作主成分分析(Principal component analysis,PCA)白化,所有數(shù)據(jù)進(jìn)行長度規(guī)整后作概率形式的線性判別分析(Probabilistic linear discriminant analysis,PLDA)得到測試得分,訓(xùn)練和測試過程均為性別、文本無關(guān)。

      本文根據(jù)不同的得分規(guī)整方法,構(gòu)建了不同的得分規(guī)整系統(tǒng)進(jìn)行對(duì)比:

      系統(tǒng)0:得分不做規(guī)整,這是基線(Baseline)系統(tǒng)。

      教師應(yīng)更多地采取贊許、表揚(yáng)和鼓勵(lì)、給予信任性委托等措施來培養(yǎng)他們的自尊心,使其自尊自立、自愛自強(qiáng),并且在此基礎(chǔ)上,培養(yǎng)學(xué)生的集體榮譽(yù)感。

      自動(dòng)上料的運(yùn)行軌跡為:在初始狀態(tài)機(jī)構(gòu)處于左側(cè)上方位置,上電以后機(jī)構(gòu)下行至左側(cè)下方位置;開始吸紙,然后回到左側(cè)上方,行至中間位置停下;機(jī)構(gòu)開始前伸,上料完畢。

      系統(tǒng)1~3:使用所有得分進(jìn)行Z-norm、T-norm、S-norm;這些算法是目前廣泛采用的算法,也是對(duì)比系統(tǒng)。

      系統(tǒng)4~6:使用數(shù)據(jù)自適應(yīng)選擇的方法進(jìn)行Z-norm、T-norm、S-norm。這是參考文獻(xiàn)[12]所采用的算法。本文中Z-norm中N取150,T-norm中N取100,在這兩個(gè)參數(shù)上本文系統(tǒng)性能最佳,后面的描述中按此種做法所做的規(guī)整將在規(guī)整方法前加Top,例如Top Z-norm,這些屬于對(duì)比系統(tǒng)。

      系統(tǒng)7~9:利用基于GMM的Z-norm、T-norm、S-norm。后面的描述中按此種做法所做的規(guī)整將在規(guī)整方法前加GMM,例如GMM Z-norm。

      3.3 實(shí)驗(yàn)結(jié)果與分析

      從表1中各項(xiàng)指標(biāo)可看出,系統(tǒng)9 GMM S-norm整體性能最佳,EER為13.69,而Min_DCF和Act_DCF為0.7167和0.7214,這2項(xiàng)指標(biāo)較Baseline分別有7.1%和22.0%的相對(duì)改進(jìn),較自適應(yīng)得分規(guī)整方法也有3.3%和6.3%的相對(duì)優(yōu)化。

      從基本的規(guī)整方法來看,S-norm效果要好于Z-norm、T-norm,說明S-norm充分結(jié)合了二者的優(yōu)點(diǎn),實(shí)現(xiàn)了性能互補(bǔ)。對(duì)比系統(tǒng)1~3、4~6以及系統(tǒng)7~9可知,從自適應(yīng)選取規(guī)整得分策略來看,選取靠前的得分統(tǒng)計(jì)規(guī)整參數(shù)性能更優(yōu),這一定程度上是因?yàn)榭壳暗牡梅旨舷鄬?duì)目標(biāo)說話人真實(shí)得分有更加穩(wěn)定的均值和標(biāo)準(zhǔn)差,而靠后的得分相對(duì)目標(biāo)說話人得分波動(dòng)性比較大,將使得每個(gè)說話人的理想最佳門限和統(tǒng)一的判決門限相差較遠(yuǎn)。在此基礎(chǔ)上,使用基于聚類的變長數(shù)量得分的策略要優(yōu)于選定固定數(shù)量得分,這得益于GMM模型在刻畫數(shù)據(jù)分布時(shí)的優(yōu)勢,從而使用該模型進(jìn)行聚類能夠得到更加穩(wěn)定的均值和方差,這也表明利用GMM模型能有效地解決在選取固定數(shù)量的得分計(jì)算規(guī)整參數(shù)時(shí)分布信息丟失的問題。

      表1 不同得分規(guī)整方法實(shí)驗(yàn)結(jié)果Tab.1 Results of different scoring normalization methods

      為了更近一步說明GMM模型在獲得規(guī)整參數(shù)時(shí)的優(yōu)勢,表2給出式(9,10)定義的均值和標(biāo)準(zhǔn)差偏差參數(shù)。

      從表2可以看出,無論是Z-norm還是T-norm,基于聚類的得分規(guī)整方法的均值偏差都要明顯小于選取固定數(shù)量個(gè)得分的規(guī)整方法,二者的方差偏差基本屬于同一水平。本文基于GMM的規(guī)整方法首先剔除了靠后的得分類,可以縮小與真實(shí)分布均值上的差距,然后利用GMM軟聚類的方法使得保留的每個(gè)得分點(diǎn)都參與規(guī)整參數(shù)的計(jì)算,這樣可以縮小標(biāo)準(zhǔn)差與真實(shí)分布的偏差,因此基于聚類的得分規(guī)整可更加有效地?cái)M合真實(shí)的得分分布。

      表2 不同得分規(guī)整方法偏差參數(shù)Tab.2 Bias of different score normalization methods

      4 結(jié)束語

      本文采用聚類手段,替代了以往自適應(yīng)規(guī)整算法中直接取得分最高的特定數(shù)量個(gè)得分統(tǒng)計(jì)分布參數(shù)這一做法,選取變長個(gè)得分參與分布參數(shù)計(jì)算,獲得了很好的性能提升。進(jìn)一步的工作可以將從特征端規(guī)整數(shù)據(jù)自適應(yīng)挑選和本文從得分端的規(guī)整數(shù)據(jù)自適應(yīng)挑選結(jié)合起來以獲得進(jìn)一步的改進(jìn)。

      猜你喜歡
      規(guī)整語料均值
      300kt/a硫酸系統(tǒng)規(guī)整填料使用情況簡介
      基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
      提高日用玻璃陶瓷規(guī)整度和表面光滑度的處理方法
      佛山陶瓷(2016年11期)2016-12-23 08:50:27
      電梯的建筑化藝術(shù)探索
      大觀(2016年9期)2016-11-16 10:31:30
      均值不等式失效時(shí)的解決方法
      均值與方差在生活中的應(yīng)用
      華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
      基于發(fā)音機(jī)制的貪婪自適應(yīng)語音時(shí)長規(guī)整算法
      關(guān)于均值有界變差函數(shù)的重要不等式
      對(duì)偶均值積分的Marcus-Lopes不等式
      丰县| 云林县| 涡阳县| 祁连县| 绍兴市| 沂水县| 安庆市| 九龙坡区| 溆浦县| 柳江县| 宕昌县| 绥中县| 无极县| 侯马市| 林甸县| 兴宁市| 从化市| 商水县| 清新县| 红安县| 富源县| 封开县| 镇安县| 井研县| 门源| 琼结县| 丰都县| 荆门市| 四子王旗| 板桥市| 凌云县| 宜城市| 北京市| 三台县| 丹东市| 嘉义市| 江都市| 玉树县| 崇仁县| 平阳县| 丰都县|