什么是Kaldi?
Kaldi是目前全球最流行的開源語音識別工具集。Kaldi在學術界降低了語音技術的入門門檻,為各大學術研究和挑戰(zhàn)賽提供基線系統(tǒng)。
初創(chuàng)公司和團隊紛紛使用Kaldi,結合自己的數(shù)據(jù)迅速驗證業(yè)務,并為用戶服務。幾乎所有做語音識別的機構和企業(yè)都在使用Kaldi。
Kaldi的前身是基于Daniel Povey博士提出的SGMM模型,Daniel主導了Kaldi項目的開發(fā)和維護,開發(fā)了很多Kaldi模型(包括目前使用廣泛的Chain模型),維護了一個開源的語音識別語料庫(OpenSLR),并基于此開發(fā)了大量的語音識別訓練腳本。Daniel幾乎24小時在線回答Kaldi社區(qū)用戶的問題,他的努力獲得了社區(qū)的認可。
下面談談Kaldi的發(fā)展歷程。
2009年,在約翰霍普金斯大學夏季研討會上,語音識別工具包Kaldi正式開始開發(fā),并完成了早期的系統(tǒng),包括輕量級的解碼器和基于HTK的訓練腳本。
2010年,布爾諾理工大學Kaldi研討會,Kaldi作為語音識別工具包的功能被完善,同時研究人員開發(fā)了獨立于HTK的訓練腳本,大量的代碼在2010年被開發(fā)。緊接著后面的每一年,Kaldi都做出了里程碑的貢獻。
Kaldi在學術界的地位非常高,因為開源模式開放共享共建精神,奠定了它在學術界的扎實地位,成為了學術研究的利器,大大降低了準入門檻,今天有4000多篇論文都在引用Kaldi。
在工業(yè)界,Kaldi是語音落地的基石。只需對Kaldi做簡單的封裝,即可構建承受真實場景壓力的語音引擎。很難找到一家研究語音算法的機構或企業(yè)不使用Kaldi,基于Kaldi的語音引擎,正在每天為數(shù)億用戶持續(xù)提供服務。
2019年,Daniel正式加入小米。最近幾個月,學術界、工業(yè)界的同行都在稱贊小米,我們沒想到Kaldi有如此大的影響力,也沒想到Daniel在業(yè)界如此地受尊重。
很多開源界和AI界,尤其是語音界的人紛紛稱贊小米為中國語音界作出的巨大貢獻,這從側面反映了Kaldi在業(yè)界的影響力。
Daniel為什么選擇小米?我個人認為,除了小米對技術的熱愛、對技術人才的重視之外,最重要的兩個原因是小米強大的AIoT生態(tài),以及小米極致的開源文化。
什么是AIoT生態(tài)?小米的AIoT生態(tài)為什么如此強大?談到生態(tài),我們先談一下我們所處的這個智能新時代。智能新時代是AI、IoT、5G三個時代的交匯期。
為順應這個時代,小米在2019年年初啟動了“手機+AIoT”雙引擎戰(zhàn)略,AIoT第一次被提升到了與手機同樣重要的位置。
小米布局AIoT非常早,2014年就開始布局生態(tài)鏈,布局智能家居。目前,小米的AIoT平臺已經(jīng)是全球首屈一指的消費級AIoT平臺,AIoT平臺連接的智能設備數(shù)超過2.52億臺,并且,這個數(shù)字還不包括小米所有的智能手機、筆記本等。
為什么語音技術在AIoT生態(tài)中如此重要?從IoT到AIoT,我們正在經(jīng)歷一個質(zhì)變。
第一,從GUI到VUI是交互的質(zhì)變,G是指圖形、用戶界面,V更多的是指聲音。
第二,從IoT到AIoT發(fā)生著從個體到整體的質(zhì)變,從互聯(lián)互通到以人為中心的智能服務質(zhì)變,其背后都是AI的功勞,所以,從IoT到AIoT正在經(jīng)歷一個巨大的質(zhì)變。
談到小米的AIoT戰(zhàn)略,不得不提小愛同學。小愛同學最早是一個語音助理,后來被升級為智能助理。
廣義的定義是小米的AI系統(tǒng)把小愛同學打造成分布式計算能力,小愛同學被定義為小米AIoT生態(tài)的核心。小米強大的AIoT生態(tài),我認為是吸引Daniel、吸引Kaldi來到小米、來到中國的一個理由。
小米純粹、極致地擁抱開源文化,是吸引Daniel加入小米的一個重要理由。小米幾年前喊出開源的理念,今天這個理念被業(yè)界同行高度認同,這個理念是:不僅要站在巨人的肩膀上,而且還要為巨人指方向。
過去20年,我堅定地認為開源是軟件的未來;過去3年,我更加堅信開源是AI的未來。Daniel最在意的是能不能保證Kaldi100%地開源,他非常崇尚技術,非常純粹,也追求極致。近半年多來,Kaldi有很多新的進展,并有很多貢獻者提交代碼。
Daniel加入小米后,小米集團技術委員會專門成立了一個新的團隊,叫新一代語音技術,由Daniel直接帶領這個團隊。
目前,這個團隊發(fā)展得非常好,希望未來Kaldi能真正在小米得以發(fā)揚光大,真正做到四贏:Daniel和Kaldi項目要贏,Kaldi的全球社區(qū)要贏,小米AIoT生態(tài)要贏,基于Kaldi的初創(chuàng)公司也要贏。我們要堅持開放和共享,實現(xiàn)多方共贏。
我們會一如既往地秉承“堅持開源”的理念,打造Kaldi,讓Kaldi在中國所有開源熱愛者的推動下,成為一個比較典型的開源項目,成為一個沒有國界的全球化的開源項目。