深度學(xué)習(xí)大神解答機(jī)器學(xué)習(xí)與AI發(fā)展

2016-05-26 10:41張巨巖等

大學(xué)生 2016年10期

張巨巖等

Yoshua Bengio，計(jì)算機(jī)科學(xué)家，畢業(yè)于加拿大麥吉爾大學(xué)，在MIT和AT&T貝爾實(shí)驗(yàn)室做過(guò)博士后研究員，自1993年之后在蒙特利爾大學(xué)任教，與 Yann LeCun（燕樂(lè)純）、 Geoffrey Hinton并稱為“深度學(xué)習(xí)三巨頭”，也是神經(jīng)網(wǎng)絡(luò)復(fù)興的主要的三個(gè)發(fā)起人之一。

他對(duì)機(jī)器學(xué)習(xí)愛(ài)好者提問(wèn)的各種解答讓我們能深入了解深度學(xué)習(xí)及AI（人工智能）未來(lái)發(fā)展趨勢(shì)。

Q：理解大腦對(duì)于理解深度學(xué)習(xí)來(lái)說(shuō)有多重要？反過(guò)來(lái)呢？

A：就像許多早期從事神經(jīng)網(wǎng)絡(luò)研究的人（包括我的同事Geoff Hinton和Yann LeCun）一樣，我相信，當(dāng)我們思考我們對(duì)于大腦已經(jīng)知道了什么的時(shí)候，我們會(huì)有不錯(cuò)的機(jī)會(huì)來(lái)從中學(xué)習(xí)一些對(duì)于搭建AI來(lái)說(shuō)有用的東西，并且這一點(diǎn)隨著神經(jīng)科學(xué)家們收集了越來(lái)越多的大腦數(shù)據(jù)而變得越來(lái)越確定。

這個(gè)信念與相反的想法也是有聯(lián)系的——為了真正理解為何大腦讓我們擁有智能，我們需要對(duì)于大腦中發(fā)生的事構(gòu)建一個(gè)“機(jī)器學(xué)習(xí)”的解釋，也就是說(shuō)，搭建一個(gè)計(jì)算的、數(shù)學(xué)的模型來(lái)解釋我們的大腦是怎樣學(xué)習(xí)如此復(fù)雜的東西、又怎樣表現(xiàn)出如此成功的信度分配的。

為了驗(yàn)證這個(gè)解釋，我們應(yīng)該能夠運(yùn)行一種機(jī)器學(xué)習(xí)算法，它擁有從神經(jīng)生物學(xué)中提取出來(lái)的基本原則，但它沒(méi)有必要理解這些原則（但是可能有必要將這些原則在它的“大腦”中實(shí)現(xiàn)，或是為它提供一些我們與生俱來(lái)的知識(shí)）。就我所知而言，我們還沒(méi)有明白，腦內(nèi)神經(jīng)元突觸應(yīng)該怎樣產(chǎn)生變化，才能讓作為一個(gè)整體的大腦對(duì)于世界有更好的理解、做出更好的行為。這是這些日子經(jīng)常在我腦海中徘徊不去的話題之一。

Q：有沒(méi)有深度學(xué)習(xí)永遠(yuǎn)不能學(xué)會(huì)的東西？

A：這取決于你說(shuō)的深度學(xué)習(xí)指什么。如果你指的是現(xiàn)在我們知道的算法，那么答案很有可能是“是的”。但是，毫無(wú)疑問(wèn)，隨著這個(gè)領(lǐng)域的研究不斷探索，深度學(xué)習(xí)還在繼續(xù)演化，很明顯深度學(xué)習(xí)的應(yīng)用范圍有不斷擴(kuò)大的趨勢(shì)。

神經(jīng)網(wǎng)絡(luò)曾經(jīng)在模式識(shí)別問(wèn)題上非常成功，音素識(shí)別和物體識(shí)別都是很好的例子。然而，我們可以看到越來(lái)越多神經(jīng)網(wǎng)絡(luò)方面的工作正在靠近傳統(tǒng)的AI領(lǐng)域，比如推理、知識(shí)表征、以及操作符號(hào)數(shù)據(jù)。我相信，這些近期的工作只不過(guò)是冰山一角，當(dāng)然我的手里并沒(méi)有水晶球來(lái)做預(yù)言。如果我們未來(lái)對(duì)于深度學(xué)習(xí)的定義中，包括了以受神經(jīng)啟發(fā)的算法來(lái)復(fù)制所有人類認(rèn)知能力的能力，那么“這個(gè)領(lǐng)域中沒(méi)有深度學(xué)習(xí)學(xué)不會(huì)的事情”的假設(shè)就是相當(dāng)合理的。

不過(guò)，到時(shí)候，可能會(huì)有一些人類永遠(yuǎn)不能學(xué)會(huì)的任務(wù)，對(duì)于這些任務(wù)，很容易得出結(jié)論：沒(méi)有機(jī)器能完美地完成這些任務(wù)，因?yàn)橛脕?lái)訓(xùn)練的樣本數(shù)量太局限了。

Q：深度學(xué)習(xí)研究將去往何方？

A：研究從定義上來(lái)說(shuō)就是在不斷探索的，這意味著首先我們不知道什么能起效，其次我們需要探索許多途徑，我們需要整個(gè)科學(xué)社區(qū)在研究方向上有很大的差異性。所以我只能告訴你我目前的直覺(jué)，我在哪些地方看到吸引了我直覺(jué)的重要挑戰(zhàn)和機(jī)遇。下面是其中的一些：

（1）非監(jiān)督式學(xué)習(xí)是關(guān)鍵，我們現(xiàn)在的做法還并不正確（我和其他人在這一方面寫過(guò)、說(shuō)過(guò)很多觀點(diǎn)試圖糾正）。

（2）深度學(xué)習(xí)研究可能會(huì)繼續(xù)擴(kuò)張，從原本的傳統(tǒng)模式識(shí)別任務(wù)擴(kuò)張到AI的全部任務(wù)，包括符號(hào)操作、記憶、規(guī)劃和推理。這對(duì)于完整地理解自然語(yǔ)言和與人對(duì)話（即通過(guò)圖靈測(cè)試）來(lái)說(shuō)將會(huì)非常重要。相似的是，我們見證著深度學(xué)習(xí)正在延伸到強(qiáng)化學(xué)習(xí)、控制以及機(jī)器人學(xué)的領(lǐng)域，而這只不過(guò)是一個(gè)開始。

（3）對(duì)于AI，我們可能仍然需要再獲得許多知識(shí)，更好地理解大腦并嘗試找到大腦運(yùn)作的機(jī)器學(xué)習(xí)解釋。

（4）最大似然可以加以改進(jìn)，當(dāng)在復(fù)雜的高維度領(lǐng)域中學(xué)習(xí)時(shí)（非監(jiān)督式學(xué)習(xí)和結(jié)構(gòu)化輸出情景中興起的情況），它不一定是最佳的目標(biāo)。

（5）基于深度學(xué)習(xí)的AI（不只是消費(fèi)者產(chǎn)品）將會(huì)很大地受益于計(jì)算力的大幅提高，這可能意味著出現(xiàn)專門的硬件；這是因?yàn)锳I需要大量關(guān)于世界的知識(shí)（然后對(duì)它們進(jìn)行推理），這就需要用非常大量的數(shù)據(jù)來(lái)訓(xùn)練大型模型，這一切都需要比我們現(xiàn)在使用的高得多的計(jì)算力。

Q：為什么非監(jiān)督學(xué)習(xí)很重要？深度學(xué)習(xí)在其中起什么作用？

A：深度學(xué)習(xí)其實(shí)是關(guān)于學(xué)習(xí)表征方式，這意味著學(xué)習(xí)有益于捕捉我們所關(guān)注的統(tǒng)計(jì)相關(guān)性的中間概念、特征或隱性變量。這些相關(guān)性來(lái)自于從輸入變量到輸出變量的監(jiān)督學(xué)習(xí)過(guò)程，或在變量的任何子集之間的非監(jiān)督學(xué)習(xí)過(guò)程。通常來(lái)說(shuō)，監(jiān)督學(xué)習(xí)用于教電腦學(xué)會(huì)對(duì)解決特定任務(wù)很重要的中間概念（例如類別）。然而，我們看到監(jiān)督式深層網(wǎng)絡(luò)在它們的網(wǎng)絡(luò)層中可以發(fā)掘出有意義的中間概念。非監(jiān)督學(xué)習(xí)很相似，不同在于我們讓模型捕捉了所有變量之間可能的相關(guān)性，不區(qū)別輸入和輸出。用監(jiān)督學(xué)習(xí)來(lái)完成AI可能需要讓電腦從所有與這些概念有關(guān)的數(shù)據(jù)集中學(xué)會(huì)所有對(duì)我們很重要的概念。這不是人類的學(xué)習(xí)方式：是的，由于語(yǔ)言的存在，我們得到了一些闡明新概念的示例，但是我們觀察到的很多東西并沒(méi)有明確的標(biāo)記，至少一開始是這樣的。

孩子們并沒(méi)有讓大人告訴他們每幅圖的每個(gè)像素是什么，或者每幅圖中的物體是什么，什么是語(yǔ)法結(jié)果，每句話中的每個(gè)單詞的確切意思是什么。我們從簡(jiǎn)單的觀察中提取出大部分信息（可能通過(guò)“動(dòng)作—感知”循環(huán)），而這就是非監(jiān)督學(xué)習(xí)的基本原理。我們希望深度非監(jiān)督學(xué)習(xí)將能夠發(fā)現(xiàn)（可能需要很少的標(biāo)記數(shù)據(jù)的幫助）所有的概念和事情發(fā)生的起因（一些被直接標(biāo)記好，一些沒(méi)有標(biāo)記），進(jìn)而解釋我們看到的現(xiàn)象。所以我相信這個(gè)方向上的進(jìn)步對(duì)實(shí)現(xiàn)AI有本質(zhì)性推動(dòng)作用。

如果你仔細(xì)想想，科學(xué)家正在做非監(jiān)督學(xué)習(xí)：觀察世界，想出解釋某種現(xiàn)象的模型，收集更多觀察數(shù)據(jù)（雖然是有目的的）來(lái)測(cè)試它們，接著不斷地改進(jìn)這種解釋世界運(yùn)行原理的模型。

Q：在研究預(yù)料之外的實(shí)驗(yàn)結(jié)果時(shí)，比如你覺(jué)得某個(gè)想法應(yīng)該會(huì)有效，結(jié)果在實(shí)驗(yàn)里卻沒(méi)有效果，你會(huì)用到什么技術(shù)？

A：通常來(lái)說(shuō)，這要么是一個(gè)bug，要么就是更有趣的情況：它證明了你腦海中的模型應(yīng)該改一改了！你需要變得善于尋找bug（這需要練習(xí)），在機(jī)器學(xué)習(xí)中這并不是一件容易的事，因?yàn)樵S多bug仍然會(huì)允許其繼續(xù)學(xué)習(xí)，只不過(guò)效果不那么好了。但無(wú)論如何，當(dāng)實(shí)驗(yàn)結(jié)果與你的期望不符時(shí)，不要無(wú)視它！這是一個(gè)你應(yīng)該為之熱切期盼的機(jī)會(huì)。

有時(shí)候你腦海中的模型是錯(cuò)誤的，但是別人可能不覺(jué)得你的結(jié)果讓他們驚訝，于是你將需要通過(guò)交流（可能是寫一篇論文，或者是與其他研究人員探討）來(lái)找出錯(cuò)誤。

我最好的調(diào)試工具是我腦海中的模擬系統(tǒng)。讓模型在你的腦海中運(yùn)轉(zhuǎn)，越詳細(xì)越好，然后試著想象有什么事可能發(fā)生。

Q：深度學(xué)習(xí)之后機(jī)器學(xué)習(xí)中的“下一個(gè)”大事會(huì)是什么？

A：第一，我根本沒(méi)有水晶球。第二，據(jù)我所知，當(dāng)我們實(shí)現(xiàn)了人類級(jí)別的AI后，深度學(xué)習(xí)的使命就結(jié)束了，而我很難預(yù)見這之后會(huì)發(fā)生什么。深度學(xué)習(xí)為神經(jīng)網(wǎng)絡(luò)帶來(lái)了一些想法。隨著時(shí)間推移，其他概念也會(huì)加入其中，從而一點(diǎn)點(diǎn)向著實(shí)現(xiàn)AI方向努力。

我真的認(rèn)為有些想法會(huì)歷久彌新。這像是在問(wèn)“我們研究了過(guò)擬合、欠擬合和容量之后，機(jī)器學(xué)習(xí)的下一個(gè)大事件是什么？”（過(guò)擬合、欠擬合和容量在1980年代后期開始盛行）這些想法永遠(yuǎn)不會(huì)過(guò)時(shí)，因?yàn)樗鼈兎浅Ｓ杏谩ｏ@然這類想法，如學(xué)習(xí)復(fù)合函數(shù)（深度）的提出（和重要性），會(huì)歷久彌新。但單憑其自身無(wú)法保證這一點(diǎn)，我們還有很多工作要完成。

Q：一個(gè)人怎樣才能開始機(jī)器學(xué)習(xí)？對(duì)于一個(gè)熟悉機(jī)器學(xué)習(xí)基本概念的人來(lái)說(shuō)，開始接觸深度學(xué)習(xí)時(shí)有什么不錯(cuò)的資源？

A：首先你需要在數(shù)學(xué)和計(jì)算機(jī)科學(xué)方面有適當(dāng)?shù)幕A(chǔ)。深度學(xué)習(xí)方面，你可以看看MIT出版社的《深度學(xué)習(xí)》（現(xiàn)在可以在線閱讀，最終MIT出版社會(huì)將它印刷成冊(cè)）第1部分，重溫一下數(shù)學(xué)和計(jì)算機(jī)科學(xué)的知識(shí)、或是看一下數(shù)學(xué)和計(jì)算機(jī)科學(xué)中哪些領(lǐng)域與深度學(xué)習(xí)最有關(guān)系。然后你需要了解一些機(jī)器學(xué)習(xí)方面的知識(shí)（有一些不錯(cuò)的書，比如Chris Bishop寫的和Kevin Murphy寫的，視頻有吳恩達(dá)的coursera課程和Hugo Larochelle的神經(jīng)網(wǎng)絡(luò)授課視頻，你也可以從《深度學(xué)習(xí)》這本書的第5章中獲得許多基本知識(shí)的總結(jié)）。

然后你需要開始練習(xí)，也就是說(shuō)，親手編寫一些學(xué)習(xí)算法、用數(shù)據(jù)來(lái)訓(xùn)練它們——比如說(shuō)，嘗試參加一些Kaggle競(jìng)賽。

同時(shí)，繼續(xù)保持閱讀。如果你對(duì)于深度學(xué)習(xí)感興趣，我的書《深度學(xué)習(xí)》中第3章將會(huì)為你使用大多數(shù)常見的算法打下基礎(chǔ)。到那時(shí)，你應(yīng)該有了足夠的背景知識(shí)、能夠以穩(wěn)定的頻率來(lái)閱讀勾起你興趣的論文了。另外《深度學(xué)習(xí)》可以在網(wǎng)站上（http：//www.deeplearningbook.org/）閱讀所有的草稿了。

Q：你對(duì)于進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域的年輕研究者們有什么建議？

A：確認(rèn)你在數(shù)學(xué)和計(jì)算機(jī)科學(xué)領(lǐng)域（包括實(shí)際的部分，也就是編程）有扎實(shí)的背景。讀書和讀（大量的）論文，但這還不夠：你需要培養(yǎng)出你的直覺(jué)，這可以通過(guò)（1）自己編寫很多學(xué)習(xí)算法，如嘗試重現(xiàn)文獻(xiàn)中的方法；（2）例如參加比賽或者在重現(xiàn)文獻(xiàn)中方法后進(jìn)一步改善結(jié)果，從而學(xué)會(huì)去調(diào)試超參數(shù)（hyper-parameters）和探索（框架、目的函數(shù)等等）變異性。然后找到合作者，你可以與他們一起對(duì)想法進(jìn)行頭腦風(fēng)暴，并與他們一起分擔(dān)探索和測(cè)試新想法的工作量。當(dāng)然能與一個(gè)已有的團(tuán)隊(duì)一起工作非常理想，或者如果你是一位大學(xué)教師的話，你可以招募你自己的學(xué)生，和他們一起工作。

責(zé)任編輯：方丹敏

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

深度學(xué)習(xí)大神解答機(jī)器學(xué)習(xí)與AI發(fā)展