方向生
從2016年年初AlphaGo戰(zhàn)勝李世石,獲得韓國棋院頒發(fā)的“名譽職業(yè)九段”證書開始,人工智能逐漸進入大眾的視野。2017年是人工智能作為科學概念提出的61周年,愈演愈烈的AI浪潮成為最引人注目的科技熱點之一。
近年來,隨著人工智能的計算能力大幅提升,深度學習算法不斷提高,機器學習變得更為強大。同時,數(shù)據(jù)量的急劇增長大大推動了算法發(fā)展和人工智能研發(fā)加速。目前,人工智能已具備實現(xiàn)大規(guī)模商用的潛力,特別是在語音識別、無人駕駛等領域都有大爆發(fā)的趨勢。
人工智能對大規(guī)模并行計算、深度學習算法、大數(shù)據(jù)的要求,決定了目前只有少數(shù)幾家頂級的互聯(lián)網公司才具備進行研究和商業(yè)化的能力。2016年9月,谷歌、亞馬遜、Facebook、IBM 及微軟等幾家公司宣布成立AI聯(lián)盟,并取了個很長的名字——Partnership on Artificial Intelligence to Benefit People and Society,意為“為大眾和社會謀福祉的 AI 合作組織”。這是一個非盈利性組織,旨在促進公眾對 AI 的理解,以及制定行業(yè)標準。
這幾家公司都是國外人工智能領域的頂級玩家,當然國內也不乏百度、阿里巴巴等佼佼者。
谷歌
大家對谷歌人工智能的了解可能開始于AlphaGo,它在深度學習的幫助下達到了戰(zhàn)勝圍棋高手的水準。雖然 1997年IBM公司的“深藍”計算機就已用窮舉法擊敗世界國際象棋冠軍了,但與能夠深度學習的AlphaGo不可同日而語。
谷歌的人工智能在語言和圖像識別方面尤其出色。2016年5月19日,在年度I/O開發(fā)者大會上,谷歌發(fā)布了配有內置揚聲器的語音激活設備Google Home,其語音功能非常強大,可以直接與用戶進行雙向對話,實現(xiàn)了用語音控制整個智能家居系統(tǒng)的預期目標。
目前,谷歌公司公布了它的深度機器學習開源平臺——TensorFlow。任何人只要擁有電腦和網絡連接,并懂一點點深度學習算法,就能使用有史以來最強大的機器學習平臺。
亞馬遜
除了我們所熟知的電子商務零售平臺之外,亞馬遜其實也是人工智能領域的種子選手。當谷歌、微軟、IBM都在宣傳自己的AI技術進展時,鮮有宣傳的亞馬遜卻已將至少百萬臺智能音響Amazon echo推廣至普通家庭,在世界第一的公有云AWS上提供AI技術支持。而實現(xiàn)這一功能的,是其背后的Alexa系統(tǒng)。
Alexa系統(tǒng)是首個通過語音指令驅動的 AI 語音助理軟件。亞馬遜的Alexa系統(tǒng)在競爭中處于優(yōu)勢地位,亞馬遜甚至已經在深入研究如何根據(jù)語音推測出人類的情感變化。
2016年12 月,在新零售業(yè)務Amazon Go中,亞馬遜充分展示了機器視覺、深度學習算法和傳感器三大技術整合的人工智能系統(tǒng)的能力。
微軟
聊天機器人小冰和小娜(Cortana)作為虛擬助理已被大多數(shù)微軟用戶所熟悉,它們背后所代表的就是微軟多年以來對機器學習、對話識別和自然語言領域的投入和深度研究成果。20多年前,在微軟研究院成立初期就有部分工作集中在包括語音識別、自然語言和計算機視覺等在內的人工智能研究上,有力推進了人工智能以及包括機器學習等在內的相關領域的發(fā)展。
最近,微軟研究院利用深度學習,在語音識別和圖像識別上又有重大突破,并將其成果應用到諸多微軟產品中。2016年10月17日,微軟宣布實現(xiàn)了語音識別的重大突破——機器語音識別錯誤率 (WER) 降至5.9%,此舉可與職業(yè)轉錄員媲美。在圖像理解方面,微軟的技術已超越人類,將錯誤率降至3.57%,而人類的錯誤率是5.1%。
IBM
沃森(Watson)是IBM公司研發(fā)的人工智能系統(tǒng)。2011年2月,在美國最受歡迎的智力問答節(jié)目《危險邊緣》中,沃森打敗了人類對手,用自然語言實現(xiàn)深度問答,展示了其強大的學習能力。
2016年8月,在學習了海量醫(yī)學論文后,沃森用10分鐘左右的時間,為一名60歲的女性患者診斷出了很難判斷的白血病類型,并向東京大學醫(yī)科學研究所的醫(yī)務人員提出了適當?shù)闹委煼桨?,為這名女性患者的及早康復作出了貢獻。
2016年11月,IBM 宣布該公司的研究團隊成功地將深度學習和神經網絡技術應用于對癌細胞有絲分裂的識別中。這有望改變現(xiàn)有的癌癥診斷方式,降低錯誤率。
阿里巴巴
2016年8月,阿里巴巴推出了人工智能ET。ET基于強大的阿里云計算能力,學習海量的人類大數(shù)據(jù),正在多個領域不斷進化。目前,ET已具備智能語音交互、圖像/視頻識別、交通預測、情感分析等技能。
ET能實現(xiàn)直播實時字幕、看圖說話、個性化推薦、體育視頻分析等功能,幫助人們更好地接受和處理各種格式的信息,還能提供包括智能客服、工業(yè)設備異常檢測、法庭庭審速記、金融風控、電子商務惡意行為監(jiān)測等企業(yè)解決方案,幫助企業(yè)、機構降低成本,提高效率,減少風險。同時,ET還實現(xiàn)了交通預測和社會公眾趨勢預測,提高相關單位的社會公眾服務和管理水平。在浙江省交通運輸廳與阿里巴巴合作試點的“杭州城市數(shù)據(jù)大腦”項目中,實時路況監(jiān)測成本下降了90%,未來路況預測準確率高達91%以上。
百度
作為最早布局人工智能的技術公司之一,百度公司研發(fā)的“百度大腦”已建成超大規(guī)模的神經網絡,擁有萬億級的參數(shù)、千億樣本、千億特征訓練,能模擬人腦的工作機制。
百度大腦以 API 或 SDK 的形式,將人工智能的圖像、語音、自然語言處理、用戶畫像等核心能力對外共享。