李世鵬
科大訊飛是目前亞太地區(qū)成立最早、最大的AI語音公司,擁有八千多名員工以及兩個(gè)國(guó)家工程實(shí)驗(yàn)室。2017年,科大訊飛被《MIT技術(shù)評(píng)論》命名為世界上50個(gè)家最聰明的公司之一,科大訊飛在這50家公司中排在第六位,在中國(guó)排在第一位。
如今,人工智能已上升為國(guó)家戰(zhàn)略,更是掀起了人工智能的熱潮。中國(guó)在人工智能領(lǐng)域的發(fā)展實(shí)行“三步走”戰(zhàn)略:第一步,2020年我國(guó)部分人工智能達(dá)到世界水平;第二步,2025年人工智能成為國(guó)家主要生產(chǎn)力的驅(qū)動(dòng)力;第三步,2030年我國(guó)人工智能與世界強(qiáng)國(guó)并駕齊驅(qū)。
科學(xué)家探索人工智能有兩個(gè)方向:一是運(yùn)用大數(shù)據(jù)進(jìn)行深度學(xué)習(xí),包括基于深度神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算;二是腦科學(xué)研究,該研究現(xiàn)正處在發(fā)展初期。目前大部分人講的人工智能還是基于大數(shù)據(jù)和深度學(xué)習(xí)。
人工智能發(fā)展也是一步一步發(fā)展來的,從計(jì)算智能到感知智能,最后到認(rèn)知智能。感知智能中的很多問題已經(jīng)初步解決了,現(xiàn)在很多都是認(rèn)知智能,也就是說怎么對(duì)內(nèi)容進(jìn)行認(rèn)知,有什么數(shù)據(jù)訓(xùn)練它,它就知道該做什么事情,遠(yuǎn)遠(yuǎn)沒有達(dá)到認(rèn)知這層。但是通過腦科學(xué)的研究,現(xiàn)在慢慢地向認(rèn)知智能這方面發(fā)展,但是認(rèn)知智能還有很長(zhǎng)的路要走。
在人工智能領(lǐng)域科大訊飛有一個(gè)大布局,我們分兩手抓。第一手抓基礎(chǔ)研究,我所在的人工智能研究院會(huì)在基礎(chǔ)算法、人工智能基本框架方面發(fā)力,做深層研究,跟世界上最先進(jìn)的學(xué)校,包括兩個(gè)星期前跟MIT簽了合作協(xié)議。也就是說跟世界最牛的學(xué)校的教授、研究員們一起探索人工智能下一步發(fā)展的基礎(chǔ)研究。
另外,科大訊飛是一家腳踏實(shí)地的公司,我們的口號(hào)是頂天立地。立地就是要把人工智能技術(shù)運(yùn)用到實(shí)踐中,提供更好的產(chǎn)品和服務(wù)。首先,科大訊飛是一個(gè)語音公司。在語音合成和語音識(shí)別上有很深的積累。我們?cè)噲D用人工智能來打破人跟機(jī)器以及人與人之間的交流障礙。一方面在語音合成上,科大訊飛一直走在世界前面,連續(xù)12年蟬聯(lián)世界語音合成競(jìng)賽冠軍。另一方面是語音識(shí)別,2015年科大訊飛語音識(shí)別在世界上首次打敗速記員,2016年在語音識(shí)別競(jìng)賽中取得第一。科大訊飛除了標(biāo)準(zhǔn)語音識(shí)別之外,還兼顧多種地方方言。
語音識(shí)別之后,下一步是如何打破人與人之間交流困難的瓶頸,這便涉及翻譯能力??拼笥嶏w把語音識(shí)別、翻譯及合成集成到產(chǎn)品里去,比如科大訊飛的翻譯機(jī),該機(jī)可以實(shí)現(xiàn)中文與小語種互譯。另一個(gè)是會(huì)議翻譯系統(tǒng),我們的系統(tǒng)在今年轉(zhuǎn)播“兩會(huì)”的時(shí)候,實(shí)時(shí)把總理的漢語講話轉(zhuǎn)寫成漢字,同時(shí)翻譯成其他各種語言,包括少數(shù)民族語言。
科大訊飛不但是一家語音公司,現(xiàn)在還是一家視覺處理公司。2017年的國(guó)際測(cè)試科大訊飛位居第一,且是國(guó)內(nèi)首家運(yùn)用人工智能通過中國(guó)醫(yī)生資格考試并獲得456的高分。我們把這套系統(tǒng)應(yīng)用于輔助治療,基于基礎(chǔ)醫(yī)學(xué)知識(shí)及以往診斷歷史大數(shù)據(jù),可以幫助醫(yī)生去診斷并發(fā)現(xiàn)一些醫(yī)生可能會(huì)忽視的病因,也可能會(huì)糾正一些誤判的病因。目前,這些技術(shù)已應(yīng)用于實(shí)踐。
科大訊飛亦廣泛關(guān)注教育,即通過教學(xué)大數(shù)據(jù),包括老師的講稿、學(xué)生的作業(yè)、考試成績(jī),進(jìn)行分析并掌握每個(gè)學(xué)生知識(shí)的欠缺程度,具體就是知道學(xué)生在答題的過程中哪個(gè)部分出了問題,并且把有問題的知識(shí)點(diǎn)重新反映到知識(shí)圖譜里去,這樣對(duì)每個(gè)學(xué)生的弱項(xiàng)和強(qiáng)項(xiàng)有一個(gè)清晰的認(rèn)識(shí),老師可以根據(jù)系統(tǒng)針對(duì)性制定授課內(nèi)容并根據(jù)每個(gè)學(xué)生對(duì)知識(shí)的掌握程度合理安排作業(yè),提高學(xué)習(xí)效率。我們還有一套語言測(cè)試自動(dòng)打分系統(tǒng)。國(guó)內(nèi)30個(gè)省的1.2萬個(gè)學(xué)校在使用該系統(tǒng),其中中學(xué)百強(qiáng)就有68所,去年有14個(gè)省的高考狀元是這套系統(tǒng)的用戶。
另外,我們有一套幫助司法部門的AI系統(tǒng)。該系統(tǒng)跟醫(yī)院輔助治療系統(tǒng)很像,基于司法判案立案的大數(shù)據(jù)形成輔助判案系統(tǒng),幫助法官、檢察官、律師更好進(jìn)行判案。該系統(tǒng)最大的優(yōu)點(diǎn)是排除人情緒化判案、提高準(zhǔn)確率。以上包括語音識(shí)別、翻譯及合成皆屬于感知智能層面,并未觸及認(rèn)知智能。斯坦福大學(xué)一個(gè)SKAD測(cè)試,機(jī)器讀一篇文章,并回答提問。這是很難的工作,必須對(duì)內(nèi)容充分理解才行??拼笥嶏w于2017年在SKAD測(cè)試獲得第一,但各方面都在變化,技術(shù)也需不斷更新。這些都需要認(rèn)知技術(shù)革新來解決實(shí)際問題。傳統(tǒng)的圖靈測(cè)試已經(jīng)被打破,更難的是對(duì)常識(shí)性的東西進(jìn)行測(cè)試。比如說一個(gè)爸爸舉不起他的兒子,人的直覺是因?yàn)閮鹤雍苤兀绾巫寵C(jī)器把常識(shí)性的東西推算出來,那是很有挑戰(zhàn)性的一個(gè)問題。
最后,分享一下人工智能的開放平臺(tái),跟今天的主題很相關(guān)??拼笥嶏w的AIUI平臺(tái)把AI技術(shù)開放給成千上萬開放者進(jìn)行新的應(yīng)用開發(fā),自2016年至今AIUI系統(tǒng)已擁有82萬個(gè)開發(fā)團(tuán)隊(duì),每天活躍用戶訪問量46億。科大訊飛是科學(xué)院AI聯(lián)盟的理事長(zhǎng)單位,作為在智能語音方面國(guó)家四大平臺(tái)之一,科大訊飛聯(lián)合高校,已牽頭在合肥建一個(gè)產(chǎn)業(yè)園區(qū)。人工智能的發(fā)展需要全球通力合作,優(yōu)化資源配置,改變世界指日可待。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)