如何讓AI和人類一樣聰明
兩百多年前,一位名叫JosephJacquard的法國織工發(fā)明了一種紡織機器,大大簡化了紡織生產(chǎn)。在這之前,從事紡織工作的通常是地位低下的男孩子,要想編出特定的花紋,這些年輕的學(xué)徒們必須小心謹慎地將錢穿進織機,根據(jù)紙質(zhì)穿孔卡上面的孔來決定每針每線的打法。所以,這款機器在當時取得了巨大成功,經(jīng)過改造后,成為了連接人類與計算機的第一個接口;二十世紀的大部分時間里,程序員像織工一樣用穿孔卡片來編寫代碼,他們把大量的虛擬信息編寫在紙質(zhì)卡片上,除了專家之外很少有人能懂這種語言,而且卡片本身也不太方便,又極易磨損。后來,計算機接口變得越來越自然,也越來越靈活,生硬的程序指令也簡化成了“If x,theny.Whena,tryh”。而在Iacquard發(fā)明織布機幾百年后的今天,我們只需跟亞馬遜的Echo知會一聲就能喝到一壺咖啡,問一下蘋果的Siri就可以知道距離最近的洗車處在哪里。為了和機器互動得更加自然,我們學(xué)會了讓機器模仿人類。
人工智能發(fā)展的初期,研究人員發(fā)現(xiàn)了莫拉維克悖論:人類做起來看似費力的任務(wù)(比如計算)對于電腦來說很容易,而人類很容易做到的事情(比如在喧鬧的酒吧分辨出朋友的聲音),對于人工智能來說卻一直很難掌握。研發(fā)設(shè)計一臺能在規(guī)則游戲中(比如國際象棋)打敗人類的電腦并沒有挑戰(zhàn)性;邏輯機也能很好地解決邏輯問題。然而,至今還沒有工程師研發(fā)出能玩跳房子游戲的機器人。奧地利機器人專家Hans Moravec認為這可能與進化有關(guān)。人類在近幾十萬年里才進化出高級推理的能力,還沒有足夠的時間將其進化或完善到像運動能力或者視覺能力一樣優(yōu)秀。我們最擅長的事情很大一部分是不需要意識介入的,這些先天能力通過遺傳從遠古時期流傳下來,并不依仗后天經(jīng)驗的積累。但是,由于邏輯推理是我們所能感知的第一種生物推理形式,我們的思維機器必然以邏輯為基礎(chǔ)。
我們通常把計算機比喻成大腦,但計算機的工作方式卻與生物學(xué)毫無關(guān)聯(lián)。目前仍在使用的計算結(jié)構(gòu)是由數(shù)學(xué)家Johnvon Neumann和他的同事們在1945年首次提出的?,F(xiàn)代筆記本電腦與過去繁重的穿孔卡片在概念匕并無差異,只不過工程師們把紙質(zhì)卡片換成了純電動的開關(guān)信號,在vonNeumann式計算機里,所有的數(shù)據(jù)處理都由中央處理器控制。程序指令和數(shù)據(jù)通過—系列0和1序列從內(nèi)存?zhèn)鬏數(shù)街醒胩幚砥骼铮拖裨谝粡垙埓┛卓ㄆ坝涗浘幋a。雖然多核計算機可以同時運行多個程序,但處理效果畢竟有限,軟件工程師必須精心編排這些信息流才能避免災(zāi)難性系統(tǒng)故障的發(fā)生。相比之下,大腦中則有數(shù)十億個處理器在同時處理數(shù)據(jù),這些處理器也就是我們的神經(jīng)元。與電腦類似,神經(jīng)元之間的信息交流傳遞通過電脈沖的二進制語言進行。而兩者區(qū)別在于,無論是通過基因遺傳還是后天習(xí)得,每個神經(jīng)元都已預(yù)先設(shè)定好,在有明確目標的情況下可以直接進行運算。于是信息處理可以自然進行,也就無需中央處理器了。
再來看看視覺能力。我們通過數(shù)百萬有序排列的感光細胞來感知這個世界,在神經(jīng)活動的作用下,每個感光細胞都為呈現(xiàn)物象扮演著極其微小又具體的角色。這些細胞把外界物體的影像信息傳輸?shù)酱竽X,經(jīng)視覺神經(jīng)系統(tǒng)加工后,逐步形成了視覺。而von Neumann式計算機里只有一個單一的邏輯核心,除了處理相同的數(shù)據(jù)量外,還要處理運行指令。雖然計算機電路傳輸數(shù)據(jù)的速度要比大腦突觸陜得多,但在此過程中也消耗了巨大的能量。1990年,加州理工學(xué)院傳奇的工程師Carver Mefad就曾準確預(yù)言道,如今電腦處理一個單一指令所消耗的能量會是人腦進行一個突觸活動的一千萬倍。
近期人工智能領(lǐng)域的多數(shù)成就都歸功于生物學(xué)隱喻。例如,從Siri到谷歌翻譯,其技術(shù)基礎(chǔ)——深度學(xué)習(xí)(Deepkaming),就運用了幾個相互關(guān)聯(lián)的神經(jīng)處理層,而這些處理層則仿造了人體中構(gòu)成皮質(zhì)的神經(jīng)元層。如果在von Neumann式計算機上運行最先進的神經(jīng)網(wǎng)絡(luò),計算的確精密,但依然會耗費大量能源。去年三月,谷歌旗下DeepMind公司開發(fā)的AlphaGo擊敗了世界圍棋冠軍。但其數(shù)據(jù)庫是經(jīng)過三千萬步走子訓(xùn)練而建成的,也因此耗費了約一百萬瓦電(對比之下,其對手的大腦只耗費了五萬分之一的能量,約二十瓦電)。同樣地,幾年前,谷歌大腦模擬器在YouTube視頻里識別貓臉的實驗中共使用了一萬六千個核心處理器,而這些處理器本身也耗電巨大。如今,企業(yè)又把人工智能運用到個人設(shè)備上,智能手機可以識別家庭成員,可以預(yù)感我們的情緒,甚至可以建議我們調(diào)整用藥。為了完成上述功能,人工智能設(shè)備需要運行比超級計算機還快的算法,還需要在計算機中模擬進行生物實驗。
幾十年來,Mead和其他公司一直致力于相關(guān)研究,工程師們也一直在競相研發(fā)第一個所謂的神經(jīng)形態(tài)芯片供消費者使用。2014年,斯坦福大學(xué)KwabenaBoahen的研究小組研發(fā)出了低功耗的Neurogrid芯片;高通預(yù)計其Zeroth處理器將于2018年面市,這款處理器也仿造了人類大腦。而IBM的TrueNorth最近才剛從數(shù)字樣機階段過渡到可用產(chǎn)品階段。這個芯片由一百萬個硅神經(jīng)元組成,這些核心微處理器可以像人腦突觸一樣與其它核譴接交流。在這里,媒介即是信息;每個神經(jīng)元既是程序又是處理單元。芯片不再是單邊接收感官數(shù)據(jù),而是通過它的突觸網(wǎng)絡(luò)全方位接收數(shù)據(jù)。IBM聲稱,這種芯片在實時模式識別方面(比如語音處理和圖像分類)非常有用。但其最大的進步還在于高能效:這款芯片每平方厘米耗電僅二十毫瓦,比傳統(tǒng)的芯片低不止一千倍。
同時,TrueNorth也可以模擬大腦的一些缺陷。幾十億年來,生命逐漸學(xué)會接受并且適應(yīng)了自己身體的不完美,比如視力模糊、聽力有限等。盡管生命通過分子間一些不可預(yù)知的相互作用來感知這個世界,但通常感官并沒有那么準確可靠。從數(shù)學(xué)意義上來說,一個缺陷可能是一大特點。事實證明,隨機性大大增強了概率算法的計算能力,也為人工智能奠定了基礎(chǔ);比如,噪聲輸入會影響人工智能的行為輸出,可以避免碰到棘手的情況。為模擬這一隨機性,TrueNorth的每個神經(jīng)元都配備了散亂數(shù)目產(chǎn)生器。同樣為了更加便利地實現(xiàn)這一目的,IBM正在開發(fā)另一個芯片,只不過非晶態(tài)材料換成了具有一定隨機眭的晶態(tài)材料。這也是目前計算機領(lǐng)域發(fā)生概念性轉(zhuǎn)變的核心所在:越來越多的工程師開始利用物質(zhì)本身的計算性能,并不像對待穿孔卡片那樣排斥其固有的缺陷。未來,物質(zhì)將不再執(zhí)行計算指令,其本身就會計算。
鑒于目前對大腦運作方式的研究缺乏共識,在神經(jīng)科學(xué)家看來,以上的設(shè)計或多或少像動畫片一樣有些不切實際。但是,即使不能完全反映生物學(xué)現(xiàn)實,近期人工智能領(lǐng)域取得的成功也足夠證明,就算這些設(shè)計是動畫片,也會是有用的動畫片。事實上,這些研究可能最終會證實或者推翻目前我們對大腦的認知;就像物理學(xué)家Richard Feynman所說的那樣,“我所無法創(chuàng)造的,我也無法理解。”或者可以這么說,力量源于簡潔。布蘭迪斯大學(xué)的神經(jīng)學(xué)家EveMarder也認為,模型模擬的細節(jié)越多,犯的錯誤也會越多,因為神經(jīng)生物學(xué)極其復(fù)雜,我們自己還十分無知。設(shè)計一款實用性人工智能產(chǎn)品可能沒有必要嚴格仿生,比如TmeNorth就不能獨立學(xué)習(xí)。要完成某一特定任務(wù),它必須在傳統(tǒng)計算機匕運行才能得到優(yōu)化。所以,TrueNorth雖然是仿造了生物體,但也犧牲了部分生物特性。這種做法或許沒錯,誰說大腦的每一個特征都值得模仿?我們?nèi)梭w自身的算法也未必理想。正如達爾文證實的那樣,進化的過程并不是一場趨于完美的不懈競賽。在我看來,它更像是一場漫無目的的閑游。