商政淳
摘 要:人工智能是繼互聯(lián)網(wǎng)革命之后的又一次人類文明重大進步,將極大的改變?nèi)藗兩畹母鱾€方面,本文嘗試對人工智能科學和技術做一個深入淺出全貌梳理,以加深對其本質(zhì)的認識。
關鍵詞:人工智能;數(shù)理邏輯;機器學習
一、引子
人工智能在科學上不是一個生疏的名詞,由于近期阿爾法圍棋機器人在與人類頂級職業(yè)棋手的對決賽事上,戰(zhàn)績斐然,從而再次喚起了公眾對人工智能的高漲熱情。不僅如此,考試答題、新聞寫作、無人駕駛汽車、人臉識別等等,人工智能涉足眾多領域,發(fā)展前景令人期待。人工智能究竟是什么?這是一個廣闊且深邃的話題,這里嘗試著做一個簡明的闡述。概括地講:人工智能的目標是實現(xiàn)計算機像人類一樣思考和行動。
二、從計算談起
人類一直夢想把自己的思維數(shù)學化,即實現(xiàn)思維過程可計算,這是早期人工智能萌芽。計算分為:“運算”和“推理”,人工智能借助于后者。從自然語言中提煉知識,主要包括概念和推理。當然不是所有的自然語言都能用來思考,選擇能夠判斷非真即假的陳述句作為基本概念的描述,例如:“雪是白的”、“1+1=2”,叫做“命題”。大量陳述句可以被繼續(xù)分解為兩個部分,例如:“張三是學生”(主體身份)、“張三和李四是兄弟”(主體間關系),叫做“謂詞”。最終用非、和、或等進行組合搭配,形成接近現(xiàn)實社會的復雜概念。
概念之間存在從前提到結(jié)論的因果關系,語言實踐總結(jié)出三類推理關系。
(1)必要不充分:“地面潮濕(前提),下雨了(結(jié)論)”;
(2)充分不必要:“如果天不下雨(前提),我就去(結(jié)論)”;
(3)充分且必要:“觸犯刑律,當依刑法論處(互為前提和結(jié)論)”。
提取充分不必要為推理形式,即前提為真,結(jié)論必為真。
在直觀、不嚴謹、非形式化的基礎上,完成重要升華——數(shù)學化,主要包括形式化和公理化。
所謂形式化就是用符號替代自然語言。例如: P替代陳述句; P(x)替代謂詞,其中P代表屬性和關系,x代表主體;┐、∧、∨替代非、和、或;→替代推理等等。所謂公理化就是從最少的幾條公理出發(fā),使用規(guī)則,進而得出所有結(jié)論。即用最少的符號、規(guī)則、公理、推理表達完整體系。至此就初步建立了一套數(shù)理邏輯的系統(tǒng)方法,模擬人腦的思考過程。
專家系統(tǒng)就是以數(shù)理邏輯為基礎開發(fā)的早期人工智能典型產(chǎn)品,它只需給出初始和約束條件,根據(jù)規(guī)則,就可以由計算機自動演繹得出結(jié)果。這個階段的人工智能非常初級,完全是以人的先驗知識為化身,沒有學習能力,理論上也存在重大缺陷,根據(jù)哥德爾不完全定理,存在既不能證明為真,也不能證明為假的命題。一句話,存在數(shù)理邏輯人工智能范疇無法求解的問題。
三、知識從哪里來
早期人工智能還存在一大問題,知識系統(tǒng)的開發(fā)需要領域?qū)<液腿斯ぶ悄軐<乙煌槿耄@給大規(guī)模應用普及帶來極大障礙,如何實現(xiàn)計算機自我學習——機器學習,成為下一代人工智能的迫切任務。
機器學習目標是研究知識的形成,參照人類經(jīng)驗:海量外部感知+人腦思考=知識,由此假想出機器學習技術組成是:輸入訓練數(shù)據(jù)+學習算法=輸出知識模型,學習算法是核心。
人類存在兩種主要學習方式:對已有知識的學習(監(jiān)督、半監(jiān)督學習)和自我學習(無監(jiān)督學習)。
(一)監(jiān)督學習
監(jiān)督學習是有參照學習。例如:西瓜包括色澤、根蒂、敲聲、重量、產(chǎn)地等一系列“特征”,每個特征又包括一系列“值”,如色澤:青綠、烏黑、淺白……;根蒂:卷縮、稍卷、硬挺……;敲聲:濁響、沉悶、清脆……;產(chǎn)地:南方瓜、本地瓜、北方瓜……。每個西瓜都有一組數(shù)據(jù),一堆西瓜構(gòu)成一組輸入訓練數(shù)據(jù)。參照標準可以是簡單的“好瓜”、“壞瓜”,也可以是復雜的“沙瓤瓜”、“水瓤瓜”……。依據(jù)參照標準進行分類(算法),當很多組訓練數(shù)據(jù)反復訓練之后,就得到一個選擇西瓜的“模型”。
(二)無監(jiān)督學習
無監(jiān)督學習是無參照學習。例如:一堆西瓜,分別測量每個西瓜的指標,如“密度”、“含糖率”、…,反復對比西瓜之間的數(shù)據(jù),最后將相似度高的放在一類。
(三)人工神經(jīng)元網(wǎng)絡
為了深度模擬人類思考,機器學習人工智能干脆直接移植了人腦神經(jīng)元網(wǎng)絡機制,也稱“深度學習”。神經(jīng)元由細胞體和細胞突組成,細胞突又分為樹突和軸突,樹突接收外來刺激(多個),軸突發(fā)出刺激(一個),無數(shù)神經(jīng)元相互對接,連接成神經(jīng)元網(wǎng)絡。參照建立人工神經(jīng)元網(wǎng)絡模型:用突觸(可賦權值的多路輸入)替代樹突;用替加法器代細胞體;用激活函數(shù)替代軸突。由于“模型”先定,訓練數(shù)據(jù)是逆向傳播(輸出到輸入),核心算法是“加權取合”,最后正向求解(輸入到輸出)。例如:選西瓜從神經(jīng)元網(wǎng)絡的輸出端反向訓練,每個西瓜都在多路輸入上留下“權值”:青綠(色澤)、卷縮(根蒂)、濁響(敲聲)……反復訓練數(shù)據(jù)后得到具體問題的神經(jīng)元網(wǎng)絡。
四、實踐出真知
神經(jīng)元網(wǎng)絡幾乎涵蓋了所有震撼應用!激發(fā)了對人類原始智能進化的空前興趣,探索低級智能機制——行為人工智能,成為人工智能研究的又一大亮點。
遺傳算法是行為人工智能的典型代表。與人工神經(jīng)元網(wǎng)絡一樣,行為人工智能直接移植了自然生物進化機制。
自然生物進化的機理是:物競天擇。種群中優(yōu)質(zhì)個體有機會勝出是“物競”,實際勝出則是“天擇”。
參照建立人工遺傳算法機制:確定初始種群;適應度計算替代物競;選擇、交叉和變異替代天擇。
人工遺傳算法的步驟是:計算出種群中所有個體接近未來目標的系數(shù)(適應度計算);用概率選出優(yōu)秀個體(選擇);個體間大概率成對交叉復制重組(交叉);個體內(nèi)小概率突變(變異);在沒有外界干預下反復迭代完成進化。
五、智慧之光伸向遠方
數(shù)理邏輯、機器學習、行為智能是三個發(fā)展階段,是從高、中、低三個層次模擬人類智能,也是一個整體。數(shù)理邏輯是自上而下的方法,把先驗知識存儲在“黑箱”中,不必知道黑箱內(nèi)部構(gòu)造。優(yōu)點是:用接近人類自然語言的形式表達知識和推理。不足是:應用繁雜,無法普及,沒有學習能力。
機器學習是自下而上的方法,設計“黑箱”內(nèi)部結(jié)構(gòu),基于部分先驗知識,自我訓練。優(yōu)點是:應用簡潔,效率突出,具備學習能力。不足是:知識表達隱含晦澀。行為智能也是自下而上的方法,借鑒人類智慧歷經(jīng)漫長實踐進化而來的事實,模擬身體的運作機制,物競天擇。優(yōu)點是:擅長解決適應性、行為反應等問題。不足是:無法解決高級智能問題。
總之,人工智能無論在理論和實踐上還都相當初級,只是借助計算機技術的鼎力相助,使原始的人工智能得以在應用中大放異彩,人工智能的未來充滿坎坷,但無限美好。