近日,小米米家智能生活新品發(fā)布會在京召開,搭載地平線自主研發(fā)的增強語音抽取(Enhanced Speech Extraction,簡稱ESE)方案的三款小米智能設(shè)備——小米小愛音箱PLAY、小米小愛音箱萬能遙控板及小米“小愛老師” 口袋英語外教重磅亮相。繼此前助力小米小愛觸屏音箱打造智能語音前端,此次,地平線再度賦能小米AIoT多款產(chǎn)品,打造流暢自然的人機交互體驗。
針對此次發(fā)布的小愛音箱PLAY及小愛音箱萬能遙控板,地平線進一步升級了ESE方案,顯著提升了回聲干擾下的喚醒率。與此同時,地平線還與小米大腦保持緊密合作,對語音識別技術(shù)進行融合訓(xùn)練,使得語音識別準確度有了大幅提升。
據(jù)悉,地平線針對此次發(fā)布的小愛音箱PLAY和小愛音箱萬能遙控板進行了深度優(yōu)化,CPU和內(nèi)存占用率降低了30%,顯著降低了功耗。同時,考慮到喚醒率和誤報率對用戶體驗的影響,地平線研發(fā)人員還對喚醒詞的發(fā)音特點、使用場景及噪音類型進行了深入的分析,采用業(yè)內(nèi)領(lǐng)先的深度神經(jīng)網(wǎng)絡(luò)技術(shù)方案,有針對性地進行了系統(tǒng)優(yōu)化。
采用地平線ESE方案的口袋英語外教——小米“小愛老師”也作為此次重磅產(chǎn)品之一亮相。“小愛老師”既是AI翻譯機、AI口語訓(xùn)練機、AI錄音筆、AI復(fù)讀機,也是AI電子詞典、AI背單詞機。與小愛音箱不同的是,“小愛老師”是通過按鍵控制拾音的起始和結(jié)束,非持續(xù)拾音,這對算法的快速跟蹤提出了挑戰(zhàn)。針對這點,地平線專門優(yōu)化了ESE方案,加入自適應(yīng)均衡機制適配識別模型,同時通過對前端進行算法優(yōu)化有效實現(xiàn)語音降噪,使得小米“小愛老師”語音識別率保持在業(yè)內(nèi)較高水平。(霍娜)