張歡
近日,地平線宣布與理想達成合作。基于領(lǐng)先的語音交互技術(shù),地平線為理想ONE增程式智能電動車配備“車載多音區(qū)交互技術(shù)”,支持多達4路人聲分離和6路音區(qū)檢測,實現(xiàn)全車多路拾音、人聲定位、降噪、回聲消除和語音喚醒,打造精準的全車語音交互。在今年年內(nèi)交付的理想ONE車內(nèi),用戶即可體驗到地平線AI賦能的車內(nèi)智能交互系統(tǒng)。
地平線多音區(qū)方案利用理想ONE車內(nèi)的四個高靈敏度麥克風(fēng),加上地平線領(lǐng)先的聲源定位、盲源分離和降噪算法,能夠?qū)崿F(xiàn)對不同位置乘客的語音指令的精準區(qū)分和識別,快速響應(yīng)乘客對于車輛設(shè)置、導(dǎo)航、音樂、視頻等多種需求,讓車內(nèi)交互更加方便快捷。該方案聲源定位準確率高達95%,遠超市場現(xiàn)有的語音分區(qū)方案。
此外,為提高用戶車內(nèi)語音交互體驗,地平線的語音方案能夠支持免喚醒命令詞達30余個,覆蓋導(dǎo)航、娛樂、車控、服務(wù)等大多數(shù)日常用車場景,用戶無需語音喚醒,即可輕松進行基本的控制。而近百萬條級別的語料訓(xùn)練,使得喚醒和控制更加精準。
為應(yīng)對未來更多車型車內(nèi)復(fù)雜的環(huán)境,除了采用領(lǐng)先的降噪和語音算法,地平線還創(chuàng)造性地將語音技術(shù)與視覺技術(shù)在算法層面進行深度融合,“語音+視覺”雙保障,極大地提升車內(nèi)的語音感知能力,可以在高噪音、強干擾及低聲量情況下保證高喚醒率和高識別率。