王金橋
在4日2017百度AI開發(fā)者大會上,主辦方展示了一段百度創(chuàng)始人李彥宏乘無人駕駛汽車上路的視頻,后來被細(xì)心的網(wǎng)友發(fā)現(xiàn)有實(shí)線并道等違章行為。這場小風(fēng)波再度引發(fā)對人工智能的討論。以從業(yè)人員的角度看,這本身就說明人工智能仍有很大局限性。
人工智能誕生60余年來,經(jīng)歷兩起兩落。隨著2013年深度學(xué)習(xí)算法取得突破性進(jìn)展,人工智能再度迎來高潮。2016年谷歌“阿爾法狗”戰(zhàn)勝世界圍棋冠軍李世石更是引發(fā)新一輪狂熱,創(chuàng)業(yè)公司紛紛涌現(xiàn),大量資本迅速流入,有機(jī)構(gòu)預(yù)計(jì)2020年全球該領(lǐng)域市場規(guī)模將超千億美元?!鞍柗ü贰钡膭倮?,科幻電影的夸張渲染,也使得普羅大眾對人工智能充滿無限的期待。
人工智能目前的確在某些領(lǐng)域超過人類:2014年人臉識別精度達(dá)到98.52%,超過人類平均識別水平(97.53%);2016年人工智能在圖像分類任務(wù)中的錯誤率已降至4.94%,人眼辨識的錯誤率約為5.1%。然而,這些“成功”只是在限定任務(wù)限定場景限定條件中,而非復(fù)雜的實(shí)際環(huán)境。
就人臉識別來說,該技術(shù)目前在對身份證和現(xiàn)場照片進(jìn)行1:1比對時,表現(xiàn)往往超過人眼,但在光線復(fù)雜的場景下,識別人臉的準(zhǔn)確率只有約75%,仍低于人類整體的識別水平。
人工智能的發(fā)展分為弱人工智能、強(qiáng)人工智能、超人工智能三個階段。其中,弱人工智能階段是指機(jī)器看起來智能,但并不真正擁有智能;只有在強(qiáng)人工智能階段,機(jī)器才能真正推理和解決問題,甚至具有自我意識;超人工智能階段的機(jī)器則在所有領(lǐng)域都比最聰明的人類更強(qiáng)。
總體來看,當(dāng)前人工智能的進(jìn)步主要借助于數(shù)據(jù)的爆炸式增長、計(jì)算資源的極大豐富,及以深度學(xué)習(xí)為代表的算法在語音識別、視覺理解、自然語言處理等任務(wù)上取得的突破性進(jìn)展,并不真正擁有智能。盡管進(jìn)步神速,但人工智能仍處于初級階段。
以“阿爾法狗”為例,即便它解決了圍棋問題,也不代表類似技術(shù)可解決其他問題,視覺理解、自然語言處理、推理、決策等問題依然存在。不僅如此,將驅(qū)動“阿爾法狗”的技術(shù)應(yīng)用于實(shí)際生產(chǎn),可能還需多年。在不同應(yīng)用場景之下,人工智能又有著完全不同的實(shí)現(xiàn)難度和時間進(jìn)度。
連一向?yàn)槿斯ぶ悄艽缘睦铋_復(fù)都坦言,現(xiàn)在人工智能的投資和估值存在泡沫。雖然我們經(jīng)常在媒體上看到某家人工智能公司在圖像識別或上路測試中取得新進(jìn)展,但那些往往只是算法在某種特定場景下識別率又提升了百分之零點(diǎn)幾。這在技術(shù)上或許是重大進(jìn)步,但在實(shí)際應(yīng)用場景下不一定是。復(fù)雜的應(yīng)用環(huán)境、全面完善數(shù)據(jù)的缺乏、高性能芯片的研發(fā)進(jìn)度等因素,決定了感知智能技術(shù)距離應(yīng)用普及還需要至少5年到10年。
現(xiàn)階段較為成熟的語音技術(shù)面臨同樣的問題——應(yīng)用場景有限,只能保證近場語音識別的準(zhǔn)確率。圖像識別實(shí)踐機(jī)會最多,但具體到安防、醫(yī)療、電商、輔助駕駛等應(yīng)用場景,遠(yuǎn)非完美;自然語言處理在互聯(lián)網(wǎng)行業(yè)中應(yīng)用最為成熟,但涉及推理決策層面,技術(shù)還有待突破。
人工智能的廣泛應(yīng)用基于技術(shù),應(yīng)用周期較短,但技術(shù)周期較長。人工智能當(dāng)前的熱潮得益于學(xué)術(shù)界上一輪深度學(xué)習(xí)算法的突破,但應(yīng)用紅利總有用盡之日,認(rèn)知層的技術(shù)突破和基礎(chǔ)資源積累才是長期重點(diǎn)。人工智能毫無疑問是未來,但只有當(dāng)相關(guān)技術(shù)真正成熟,可被廣泛應(yīng)用于大多數(shù)行業(yè)時,我們才能迎來真正沒有泡沫的人工智能時代?!?/p>
(作者是中國科學(xué)院自動化研究所研究員)