人們關心人工智能都聚焦兩個問題,一是人工智能現(xiàn)在發(fā)展到了什么程度?下一步我們該怎么辦?人工智能的發(fā)展比較緩慢。當時人工智能主要提出了兩個模型,一個是以知識和經(jīng)驗為基礎的符號推理模型,用來解決人類理性的智能。但是這個工作進展得比較慢。直到2011年,這個模型才取得較大進展,典型的案例就是IBM做的watson系統(tǒng),在人機競賽上打敗了人類。
為什么能取得這個結果呢?主要原因是,原來專家系統(tǒng)的知識是非常稀缺和昂貴的,而且要把這個知識放到計算機里面去,用人工的方法輸進去難度非常大,所以當時進展比較慢。為什么2011年能取得很大進展呢?最主要的原因就是這里面把互聯(lián)網(wǎng)的大眾知識輸入到系統(tǒng),不需要經(jīng)過人工加工。
第二個模型是機器學習或者叫做神經(jīng)網(wǎng)絡。當時神經(jīng)網(wǎng)絡在應用上的進展也很慢,最主要原因是當時神經(jīng)網(wǎng)絡輸入要靠人工設計或者來編制特征。這種情況下我們要做大規(guī)模的系統(tǒng)就很困難。這個問題到本世紀初有了很大的轉折,即我們現(xiàn)在講的深度學習。把神經(jīng)元網(wǎng)絡的層次增加以后,機器學習得到了根本性的改變,從原始的淺層學習變成現(xiàn)在的深度學習。另一個重要改變是我們把原始的數(shù)據(jù)輸進去,不必人工干預,這樣就使得深度學習變成一個大眾化的,大家普遍能用的工具,不需要擁有專業(yè)知識。由于這樣的革命性變化,這個技術正被廣泛采用。
深度學習最典型的應用是解決問題,即模式識別。圍棋為什么能夠成功呢?我們把下圍棋看成模式識別,通過深度學習圍棋程序,2015年以前只能達到業(yè)余五段,通過深度學習以后,在兩年的時間能夠實現(xiàn)三級跳,從業(yè)余變成專業(yè),從專業(yè)變成世界冠軍,現(xiàn)在已遠遠超過世界冠軍。其中最重要的原因就是利用了大量的數(shù)據(jù)。
從目前來看,我們重要的任務就是把深度學習,以及早期的符號推理模型應用到交通、家庭、健康、教育等領域。我們國家特別強調(diào)在金融和智能制造的應用。我們可以看到我們國家的很多獨角獸企業(yè),都是借助于深度學習技術,集中在圖像處理和語音識別這兩個領域。
但是,我們也必須看到深度學習的局限性,也就是我們一方面要充分進一步應用深度學習,但是另一方面盡管它可以在各個領域應用,但是也必然受到多種條件的制約。
現(xiàn)在用大數(shù)據(jù)建立的識別系統(tǒng),盡管在某個指標上超過人類,但其他方面跟人類相比差距非常大。計算機的圖像識別率即使能達到跟人差不多,但仍有錯訛。我們?nèi)右粋€噪聲給計算機就可以讓它識別成任何東西,這是它很大的弱點。這個弱點在很多應用場合里面是不允許的,如果在人臉識別、圖像識別里面有這樣的錯誤還可以容忍的話,如果這樣的錯誤出現(xiàn)在決策上的話,那是人們不可理解的。
我們目前仍然面臨挑戰(zhàn),雖然人工智能取得了一些進展,但仍然有很大的局限性。應對這種局限性,深圳非常重視基礎研究,發(fā)展新的理論來引領技術的突破,克服目前人工智能存在的局限性并擴大應用領域,這樣才有可能真正使得人工智能讓人類生活得更美好。
(本文摘編于中國科學院院士、清華大學人工智能研究院院長張鈸在第二十屆高交會上的演講。)