什么是人工智能?
很多人都以為“人工智能=會思考的機器人”,然而事實并非如此。人工智能的定義其實相當寬泛,從學科定義的角度來說,它是研究、開發(fā)用于模擬、擴展人的智能的一門新學科,屬于計算機科學的一個分支。
人工智能簡史
從“網(wǎng)紅”AlphaGo的學習方式看人工智能
“網(wǎng)紅”AlphaGo(阿爾法狗)是人工智能中一個成功的典型,贏了韓國棋手李世石,令眾人皆知。
一、AlphaGo的獲勝秘訣:深度學習
深度學習的前身是神經(jīng)網(wǎng)絡,主要是指研究人員通過程序語言教會電腦模擬人類思考。比如我們初學“1+1=2”的時候,父母教我們通過數(shù)手指頭的方式來計算;而研究人員教電腦學習的方式則比較簡單,輸入的是已知信息,其中“1”和“+”就是輸入給電腦的,電腦輸出的就是結果“2”(電腦上是采用“二進制”進行計算的,感興趣的同學可查閱更詳細的資料)。無論是通過計算、判斷還是推理,像這樣認知的過程都可以稱為“學習”。
二、深度學習=“監(jiān)督學習”+“評價網(wǎng)絡”+其他
1.“監(jiān)督學習”
打個比方,一個擁有過目不忘的超能力的同學,根本不用學習方法原理和解題技巧,只要記住近乎無限量的題目和答案,考試就能得到高分。同理,AlphaGo不用學習下棋的方法,只要有充足的存儲空間就夠了。設計人員向其大量輸入這個世界上職業(yè)棋手的棋譜(也就是說它記住了題目和答案),以預測對手最有可能落子的位置。
用這種學習方式,AlphaGo完全不用去思考“如何才能贏”這件事,只要能夠預測對手的落子即可。公開數(shù)據(jù)顯示,目前AlphaGo預測對手落子位置的正確率是67%。
2.“評價網(wǎng)絡”
舉個例子,在打籃球時,某同學會不斷觀察對方防線變化,如果能找到防守球員注意力最不集中的地方,就有較大的機會進球。類似地,AlphaGo會預測對手后續(xù)落子位置的概率,通過嵌套函數(shù)找到最優(yōu)解。當然,AlphaGo的勝率跟向下預測的步數(shù)有關,向下預測的步數(shù)越多,計算量就越龐大,同時勝率也越高。
但是AlphaGo的能力顯然不止于此,除了預測對手落子后的勝率,它還會模擬自己落子后可能會遇到的情況。就像考生不斷地出試卷考自己那樣,AlphaGo除了會和對手下棋,還會和自己下棋,以確定自己下一步怎么走勝率最高。在未來,設計人員還會將一個評估體系植入AlphaGo當中,使其能夠更加準確地評估所下這一步棋的好壞。
一言以概之,這種機器學習方式不局限于一步的輸贏,而是將格局放大,更關注最后結果。
看到這里,同學們應該明白了:其實并不是AlphaGo打敗了李世石,而是研究人員用智慧戰(zhàn)勝了李世石。除了監(jiān)督學習和評價網(wǎng)絡,人工智能學習的方式還有很多。與人類相比,它們不僅“過目成誦”,而且其擁有的超高的計算速度和準確性也讓人類望塵莫及。
作者簡介:大寶,人工智能愛好者,算法工作者,目前在一家區(qū)塊鏈創(chuàng)業(yè)公司工作。