田亮
2015年12月21日下午,《環(huán)球人物》記者一走進(jìn)北京國(guó)家會(huì)議中心,就聽到林志玲的聲音:“AI(人工智能)復(fù)始,萬(wàn)物更新,科大訊飛發(fā)布會(huì)馬上就要開始,請(qǐng)將手機(jī)調(diào)至靜音……”記者心想:“難道林志玲也來(lái)參加發(fā)布會(huì)了?不對(duì)呀,她來(lái)了也不會(huì)干這個(gè)活??!”再仔細(xì)一聽,聲音原來(lái)是由科大訊飛公司合成的,幾乎真假難辨。
好戲還在后頭。此次發(fā)布會(huì)的重頭產(chǎn)品——“訊飛DingDong音箱”當(dāng)天的表現(xiàn)堪稱驚艷。一位工作人員通過(guò)它預(yù)訂了一張北京到合肥最便宜的機(jī)票,跟它進(jìn)行了10余輪對(duì)話,“訊飛DingDong音箱”都從容應(yīng)對(duì),還能識(shí)別“剛才”等語(yǔ)境語(yǔ)詞。訂完機(jī)票,工作人員還通過(guò)直接與“訊飛DingDong音箱”說(shuō)話,就打開了加濕器和空調(diào)。經(jīng)過(guò)幾分鐘的交流,它記住了工作人員的聲音,兩個(gè)陌生人成了“朋友”。
在這次發(fā)布會(huì)上,科大訊飛董事長(zhǎng)劉慶峰以人工智能60周年切入,興奮地說(shuō):“中國(guó)人在人工智能上缺席了60年,從今往后,中國(guó)的人工智能水平將引領(lǐng)世界!”他告訴《環(huán)球人物》記者說(shuō):“2015年7月10日,我在向李克強(qiáng)總理做匯報(bào)時(shí)說(shuō),未來(lái)的創(chuàng)新創(chuàng)業(yè),中國(guó)如果不能抓住人工智能的產(chǎn)業(yè)主導(dǎo)權(quán),又將像原來(lái)一樣給全世界打工,處于價(jià)值鏈的低端。掌握了人工智能產(chǎn)業(yè)的主導(dǎo)權(quán),我們就有全球話語(yǔ)權(quán)?!眲c峰接受《環(huán)球人物》記者采訪時(shí)說(shuō)。
機(jī)器的普通話水平可比一般人高
科大訊飛是亞太地區(qū)最大的語(yǔ)音與人工智能上市公司,在語(yǔ)音合成、語(yǔ)音識(shí)別和自然語(yǔ)言理解技術(shù)等方面居于全球領(lǐng)先位置,人臉識(shí)別技術(shù)更是超過(guò)美國(guó)聯(lián)邦調(diào)查局。可這家企業(yè)從創(chuàng)辦到成為上市公司,不過(guò)16年時(shí)間。
1990年,劉慶峰在中國(guó)科技大學(xué)(以下稱科大)讀書時(shí),就一心想出國(guó)深造,但老師王仁華改變了他的想法。“王仁華是科大第一個(gè)讓本科生在實(shí)驗(yàn)室搞研究的,我就是其中之一?!眲c峰說(shuō),“我一看,實(shí)驗(yàn)室里太有意思了,機(jī)器居然能說(shuō)話!我就在實(shí)驗(yàn)室里搞起科研?!?/p>
大四時(shí),王老師拿來(lái)一款日本人設(shè)計(jì)的軟件,運(yùn)算能力很低。他想讓劉慶峰把它的效率提高一倍。劉慶峰用一個(gè)月時(shí)間把它的運(yùn)算速度提高了10倍。王老師說(shuō):“你干脆用它做一個(gè)語(yǔ)音合成器。”劉慶峰本來(lái)準(zhǔn)備跟師兄們做一套語(yǔ)音合成系統(tǒng),參加國(guó)家的比賽。王老師看到劉慶峰的實(shí)力后,又讓他自己做了一套系統(tǒng),這樣科大以兩套系統(tǒng)參賽。賽后,評(píng)委們對(duì)劉慶峰的作品感到很驚訝。
當(dāng)時(shí),語(yǔ)音合成有兩種方法:一是把每個(gè)音節(jié)拼到一起,音質(zhì)好,但計(jì)算機(jī)讀出來(lái)顯得很頓、很不自然;二是模擬人發(fā)音的生理過(guò)程,把氣流、聲帶等設(shè)計(jì)成各種參數(shù),聽起來(lái)就很流暢,但音質(zhì)不高,吐字不清。劉慶峰把這兩種方法結(jié)合起來(lái),引起很大的轟動(dòng)。1998年,他在業(yè)界率先讓計(jì)算機(jī)語(yǔ)音合成水平達(dá)到3分,在國(guó)際上拿了不少獎(jiǎng)?!安ヒ魡T水平是5分,普通人說(shuō)話水平是4分?!蹦壳埃炎寵C(jī)器的英語(yǔ)口語(yǔ)水平達(dá)到4.2分,“美國(guó)的MIT能拿3.6分,我們是全世界唯一超過(guò)4分、比普通人念得好的”。
1999年,劉慶峰讀博士時(shí)創(chuàng)辦了科大訊飛,“當(dāng)時(shí)就有信心做到世界第一”。但他很快發(fā)現(xiàn),在市場(chǎng)上取得突破要比技術(shù)上更難。最早,他率領(lǐng)團(tuán)隊(duì)開發(fā)了一套面向大眾的桌面語(yǔ)音軟件,但“當(dāng)時(shí)盜版太嚴(yán)重,肯花幾百塊錢買軟件的都是領(lǐng)導(dǎo)干部,他們又不會(huì)用電腦,甚至沒(méi)開顯示屏就打來(lái)電話說(shuō)軟件有問(wèn)題”。再加上沒(méi)有更好的銷售渠道,又不敢做廣告,這款產(chǎn)品“完全失敗”了。
后來(lái),劉慶峰轉(zhuǎn)為做行業(yè)產(chǎn)品。那時(shí),168電話查詢平臺(tái)全靠播放錄音,解決不了海量和動(dòng)態(tài)信息,劉慶峰就通過(guò)使用語(yǔ)音合成打動(dòng)了對(duì)方,但要掏錢時(shí)對(duì)方就不買了。對(duì)方說(shuō):“你們幾個(gè)小屁孩在一起搞了個(gè)小公司,我們?cè)趺锤一◣装偃f(wàn)買你們的產(chǎn)品?我們情愿買華為、中興的,即使他們的產(chǎn)品沒(méi)有語(yǔ)音合成功能也無(wú)所謂?!?/p>
最后,劉慶峰通過(guò)把技術(shù)賣給華為這樣的公司才總算開始贏利?!跋瘛甶ntel inside那樣,我們強(qiáng)調(diào)‘iFLYTEK inside(內(nèi)置訊飛科技)理念,逐漸有一批行業(yè)內(nèi)的伙伴認(rèn)識(shí)到我們的價(jià)值。2000年年底,我們發(fā)展了50多個(gè)客戶?!?008年,科大訊飛上市。就像在技術(shù)上的創(chuàng)新一樣,劉慶峰在市場(chǎng)上的創(chuàng)新還有很多。近年來(lái),科大訊飛的營(yíng)業(yè)收入仍然保持著40%—60%的高增長(zhǎng)率。
從能聽會(huì)說(shuō)到能理解會(huì)思考
《環(huán)球人物》:語(yǔ)音識(shí)別與人工智能是怎樣的關(guān)系?
劉慶峰:語(yǔ)音是人工智能最重要的切入點(diǎn),它是人機(jī)交互的入口,不是一個(gè)簡(jiǎn)單的錄入、合成,而是遠(yuǎn)場(chǎng)識(shí)別、噪音識(shí)別、多輪交互、Always On(隨時(shí)都在聽候指令)。今天手機(jī)中的軟件,必須點(diǎn)一下,它才能工作。而像“叮咚音箱”這樣的設(shè)備,無(wú)需點(diǎn)擊按鈕,直接告訴它干什么即可。
比如,我說(shuō)“給老爸打個(gè)電話”,設(shè)備會(huì)問(wèn)“老爸電話是多少”,我告訴它老爸的電話,它就能記住,下次就不用再問(wèn)了。再比如,你說(shuō)“我想聽劉德華的歌”,設(shè)備第一次可能會(huì)問(wèn)你喜歡什么類型的,你告訴它,它就能自動(dòng)幫你選出來(lái),聽過(guò)多次劉德華的歌之后,它就可以根據(jù)你說(shuō)話的語(yǔ)氣、語(yǔ)境自行判斷出你想聽哪首歌,會(huì)慢慢變得比你更懂你。
《環(huán)球人物》:以語(yǔ)音為入口,需要一個(gè)安靜的環(huán)境,但這個(gè)環(huán)境并不容易獲得。
劉慶峰:我們可以進(jìn)行噪音識(shí)別,比如在汽車環(huán)境下,在高噪音環(huán)境下,讓語(yǔ)音識(shí)別達(dá)到實(shí)用門檻,我們?cè)跇I(yè)界已率先獲得突破。2015年4月,寶馬汽車做了車載語(yǔ)音識(shí)別水平測(cè)試,我們是86%的準(zhǔn)確率,美國(guó)Nuance取得第二名,準(zhǔn)確率只有74%,而實(shí)用門檻是85%。
位于安徽合肥的科大訊飛公司總部。
《環(huán)球人物》:移動(dòng)互聯(lián)網(wǎng)之后,人工智能是否將挑起下一個(gè)時(shí)代的大梁?
劉慶峰:人工智能的時(shí)代已經(jīng)到來(lái)。IT產(chǎn)業(yè)發(fā)展過(guò)程中經(jīng)歷了5次浪潮,計(jì)算機(jī)面市是第一次,小型機(jī)是第二次,PC是第三次,互聯(lián)網(wǎng)是第四次,移動(dòng)互聯(lián)網(wǎng)是第五次。下一個(gè)風(fēng)口就是萬(wàn)物互聯(lián),以智能家居、穿戴式設(shè)備、車載電子等為代表。如果設(shè)備離你比較遠(yuǎn),你沒(méi)辦法用手、鍵盤操控,或者在走路或開車等移動(dòng)情況下使用設(shè)備,就必須要用語(yǔ)音來(lái)操控。所以,我覺(jué)得語(yǔ)音為主、觸摸與鍵盤為輔的人機(jī)交互時(shí)代正在向我們走來(lái)。
我們現(xiàn)在正努力使人工智能設(shè)備從能聽會(huì)說(shuō)向能理解會(huì)思考轉(zhuǎn)變。如果機(jī)器設(shè)備不能理解、思考是沒(méi)法交互的。我們平時(shí)用百度搜索,結(jié)果可能有千百條,那是因?yàn)橛衅聊?。在萬(wàn)物互聯(lián)時(shí)代,如果用語(yǔ)音交互的話,一條一條報(bào)給你聽,你可能聽到第八個(gè)就崩潰了,所以設(shè)備必須能準(zhǔn)確理解,多輪交互。
人工智能的三個(gè)階段
《環(huán)球人物》:很多人了解人工智能是從美國(guó)大片開始,像“鋼鐵俠”這樣的能力,現(xiàn)在能否實(shí)現(xiàn)?
劉慶峰:現(xiàn)在我們把人工智能發(fā)展分為3個(gè)階段,第一階段是計(jì)算智能,就像IBM的“深藍(lán)”電腦能贏國(guó)際象棋大師,那是因?yàn)樗挠?jì)算能力強(qiáng),把所有可能性都算一篇,所以計(jì)算智能階段,機(jī)器已經(jīng)超過(guò)人了。第二階段是感知智能,像人有視覺(jué)系統(tǒng),機(jī)器可以有紅外、紫外系統(tǒng);人有聽覺(jué)系統(tǒng),機(jī)器有超聲和次聲系統(tǒng),人的正常聽覺(jué)范圍是50到3400赫茲,而這個(gè)范圍以外的聲音機(jī)器也能聽見?,F(xiàn)在的很多領(lǐng)域,機(jī)器的感知智能已經(jīng)超過(guò)人了。第三階段是認(rèn)知智能,現(xiàn)在還面臨巨大的挑戰(zhàn)。像“鋼鐵俠”這樣的機(jī)器人,現(xiàn)實(shí)中其軀體部分已經(jīng)做得越來(lái)越接近人了,關(guān)鍵是大腦,還面臨挑戰(zhàn)。
《環(huán)球人物》:怎么判斷、比較機(jī)器的智能化水平?
劉慶峰:現(xiàn)在有兩種測(cè)試。一種是圖靈測(cè)試:人和機(jī)器都躺在你后面,你們聊天,你的問(wèn)題有的機(jī)器回答,有的人回答,你判斷回答你問(wèn)題的是機(jī)器還是人,如果機(jī)器的回答讓你認(rèn)為它是個(gè)人,它就通過(guò)圖靈測(cè)試了。
隨著人工智能的發(fā)展,現(xiàn)在人們提得更多的評(píng)價(jià)方法是機(jī)器能否通過(guò)高考。美國(guó)華盛頓大學(xué)圖靈中心提出讓機(jī)器人通過(guò)美國(guó)的生物學(xué)科入學(xué)考試。日本的目標(biāo)是由國(guó)立情報(bào)研究所提出來(lái)的,準(zhǔn)備讓機(jī)器人在2021年考上亞洲排名第一的東京大學(xué)。在我們中國(guó),2014年啟動(dòng)了人工智能的一個(gè)標(biāo)志性項(xiàng)目——科技部首個(gè)人工智能重大切入項(xiàng)目,科大訊飛為總牽頭單位,目標(biāo)是三到五年內(nèi),機(jī)器人能考上一本。機(jī)器考及格很容易,因?yàn)樗赡苤粦{借記憶就能實(shí)現(xiàn);考上三本就很難了,需要比一般的學(xué)生強(qiáng);要考上一本,意味著要超過(guò)80%的考生,這就要靠很強(qiáng)的邏輯推理。
《環(huán)球人物》:現(xiàn)實(shí)生活中,人工智能有哪些較為成熟的應(yīng)用?
劉慶峰:2015年7月,我們?cè)诎不盏暮戏屎桶矐c做初三學(xué)生學(xué)業(yè)水平測(cè)試,英語(yǔ)和語(yǔ)文作文,先是老師打分,然后機(jī)器打分,把有差距的挑出來(lái),由人工專家組來(lái)評(píng),到底哪個(gè)打得準(zhǔn)。結(jié)果80%以上的情況是機(jī)器比人準(zhǔn),引起業(yè)界非常大的轟動(dòng)。日本高考機(jī)器人項(xiàng)目組長(zhǎng)2015年7月20日到科大訊飛參觀,感到很震驚,回去就寫文章說(shuō),中國(guó)的人工智能水平已經(jīng)超過(guò)了日本。
下一步在醫(yī)療領(lǐng)域,人工智能可以解決全科醫(yī)生奇缺的問(wèn)題,它可以像幫助學(xué)生學(xué)習(xí)一樣,學(xué)習(xí)過(guò)各種病歷,然后幫助醫(yī)生進(jìn)行分析。我們正在合肥做驗(yàn)證,國(guó)家衛(wèi)計(jì)委也非常關(guān)心。人工智能可以在非常多的領(lǐng)域代替或輔助人工,將來(lái)會(huì)深刻改變整個(gè)社會(huì)。
人物簡(jiǎn)介:
劉慶峰,1973年生,安徽涇縣人,畢業(yè)于中國(guó)科技大學(xué)。1999年創(chuàng)辦科大訊飛公司,現(xiàn)任董事長(zhǎng),2013年當(dāng)選CCTV中國(guó)經(jīng)濟(jì)年度人物。