• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      “語(yǔ)言與智能技術(shù)”多人談

      2016-05-30 10:48:04連誼慧
      語(yǔ)言戰(zhàn)略研究 2016年6期
      關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)深度人類

      連誼慧

      編者的話:人工智能近年來的飛速發(fā)展離不開自然語(yǔ)言處理技術(shù),即讓機(jī)器理解人類的語(yǔ)言。自然語(yǔ)言處理技術(shù)的發(fā)展和應(yīng)用正在改變著人類的生存方式。它既是語(yǔ)言生活的重要組成部分,也是推動(dòng)語(yǔ)言發(fā)揮社會(huì)功能的重要?jiǎng)恿Α?月28日,中國(guó)中文信息學(xué)會(huì)和中國(guó)計(jì)算機(jī)學(xué)會(huì)聯(lián)合主辦的“首屆語(yǔ)言與智能高峰論壇”在北京召開。在論壇的討論環(huán)節(jié)中,八位專家就“語(yǔ)言與智能技術(shù)的未來發(fā)展”發(fā)表看法,分別探討了類人語(yǔ)言理解系統(tǒng)的特點(diǎn)、深度學(xué)習(xí)的原理及應(yīng)用、AlphaGo成功的啟示、未來五年語(yǔ)言理解領(lǐng)域關(guān)鍵技術(shù)和研究方向等問題。本期我們整理了這部分發(fā)言,以饗讀者。

      關(guān)注人類學(xué)習(xí)語(yǔ)言的過程

      孫 樂(中國(guó)科學(xué)院軟件研究所) 人類智能的演化歷經(jīng)猿腦到人類祖先的進(jìn)化,靈巧手及簡(jiǎn)單工具的使用,基因遺傳智力的發(fā)展,大腦容量持續(xù)增加以及語(yǔ)言的出現(xiàn)。其中基因遺傳智力、大腦容量的增大以及語(yǔ)言的出現(xiàn),是人類智能發(fā)展的幾個(gè)關(guān)鍵節(jié)點(diǎn)。

      人類語(yǔ)言不同于動(dòng)物語(yǔ)言的地方在于:人類的語(yǔ)言單位是非常明晰的,音義結(jié)合具有任意性,語(yǔ)言具有結(jié)構(gòu)性、開放性、可傳授性,不受時(shí)間、地點(diǎn)的約束,我們可以看到,人類語(yǔ)言的句子可以進(jìn)行切分,而且可以依據(jù)語(yǔ)法把切分得到的成分重新進(jìn)行組合,生成新的語(yǔ)言片斷,從而能夠用有限的符號(hào)表達(dá)出無限的意義。

      以色列歷史學(xué)家尤瓦爾·赫拉利在《人類簡(jiǎn)史》中提到,距今7萬(wàn)年前智人的認(rèn)知能力發(fā)生了革命性的變化,智人在與其他人類物種的競(jìng)爭(zhēng)中勝出的原因,最有可能的是智人擁有獨(dú)特的語(yǔ)言。這本書給出了幾個(gè)例子,當(dāng)智人會(huì)講述河邊有只獅子的時(shí)候,實(shí)際上是具有了傳達(dá)身邊環(huán)境信息的能力,而進(jìn)一步能夠規(guī)劃并執(zhí)行復(fù)雜的計(jì)劃,比如狩獵。此外,智人逐漸具備了另外一個(gè)能力,就是八卦,這實(shí)際上是人和人之間對(duì)社會(huì)關(guān)系的信息的傳遞,也意味著人類開始有了能夠傳達(dá)虛構(gòu)概念信息的能力。有了虛構(gòu)故事以后,就可以組織更大更有凝聚力的團(tuán)體,也可以開展陌生人之間的分工合作和協(xié)同創(chuàng)新。

      當(dāng)代最有影響力的哲學(xué)家卡爾波普爾教授提出了三個(gè)世界的理論。他把世界分成客觀世界、精神世界和知識(shí)世界,而這三個(gè)世界之間是交互的,進(jìn)而形成了人類社會(huì)與自然界之間錯(cuò)綜復(fù)雜的關(guān)系。自然語(yǔ)言正是對(duì)這三個(gè)世界的描述。隨著語(yǔ)言研究的深入,我們?cè)絹碓秸J(rèn)識(shí)到問題并不僅僅在于語(yǔ)言的復(fù)雜性,而在于整個(gè)世界的復(fù)雜性。

      在人類語(yǔ)言的習(xí)得過程中最關(guān)鍵的是出生后五年的時(shí)間,從牙牙學(xué)語(yǔ)到單個(gè)詞的發(fā)音,到兩個(gè)詞的組合,最后到短語(yǔ)、復(fù)雜句子的掌握。對(duì)這個(gè)過程的論述有兩種傳統(tǒng)論點(diǎn):一是喬姆斯基的先天論,語(yǔ)言功能被編碼于人類大腦之中;二是斯金納的后天論,語(yǔ)言通過學(xué)習(xí)原理獲得。

      如今的AI(Artificial Intelligence,人工智能)大勢(shì),涉及從邏輯推理到規(guī)則專家系統(tǒng),到深度學(xué)習(xí)、機(jī)器學(xué)習(xí)的大數(shù)據(jù)智能??梢哉f,大數(shù)據(jù)時(shí)代代表的人工智能系統(tǒng),不但要有數(shù)據(jù)、模型,還需要有大規(guī)模的知識(shí)和強(qiáng)大的計(jì)算能力。在這一主題下,我們應(yīng)重點(diǎn)關(guān)注人類學(xué)習(xí)語(yǔ)言的過程,并研究如何構(gòu)建一個(gè)類人的語(yǔ)言理解系統(tǒng)。未來五年,語(yǔ)言理解領(lǐng)域中需重點(diǎn)突破哪些關(guān)鍵技術(shù)、拓展哪些研究方向,還有待學(xué)界共同探索。

      從“遷移學(xué)習(xí)”反觀人類如何學(xué)習(xí)語(yǔ)言

      楊 強(qiáng)(香港科技大學(xué)) 人是否能夠從少量的樣本學(xué)習(xí)語(yǔ)言,這是關(guān)系到人工智能發(fā)展的一個(gè)核心命題。對(duì)此,我們目前還不知道人是怎么學(xué)習(xí)語(yǔ)言的,而更多的只是知道如何讓機(jī)器學(xué)習(xí)語(yǔ)言。但是,我們會(huì)從一些現(xiàn)象中看出這一點(diǎn):我有很多朋友在美國(guó),也在做自然語(yǔ)言處理研究,但是當(dāng)他們有了小孩子以后,觀察自己的孩子學(xué)習(xí)語(yǔ)言,會(huì)發(fā)現(xiàn)語(yǔ)言學(xué)可能“白費(fèi)了”。孩子往往能舉一反三,不知道哪一天就學(xué)會(huì)了語(yǔ)言,他們就覺得非常的驚喜。

      從機(jī)器智能的角度有幾個(gè)方面可以作為研究的入口,比如“遷移學(xué)習(xí)”。在“深度學(xué)習(xí)”和“強(qiáng)化學(xué)習(xí)”策略的基礎(chǔ)上,把模型從一個(gè)通用的場(chǎng)景遷移到一個(gè)個(gè)性化的場(chǎng)景,遷移到小數(shù)據(jù)以及有冷啟動(dòng)需求的場(chǎng)景,就可以引入“遷移學(xué)習(xí)”。我認(rèn)為人類正是在大腦已經(jīng)有了很多固定的模型的基礎(chǔ)上,再借助其中一些可以改變的地方,通過“遷移學(xué)習(xí)”,加上環(huán)境影響以及初始幾年的觀察去學(xué)習(xí)語(yǔ)言。

      腦科學(xué)研究也呼應(yīng)了這一假設(shè)。中國(guó)科學(xué)院外籍院士蒲慕明教授在第二屆人工智能大會(huì)上表示,人類在一開始確實(shí)存在很多神經(jīng)網(wǎng)絡(luò),留給后天學(xué)習(xí)的空間,但是隨著年齡增長(zhǎng),很多又被遺忘,遺忘的速度和人類的疾病又直接相關(guān)。如果遺忘得太多就變成老年癡呆,如果遺忘得比較慢就會(huì)變成自閉癥。這完全是從生物學(xué)角度來觀察,卻給了我們新的啟發(fā)。

      語(yǔ)言理解領(lǐng)域未來五年的機(jī)遇和挑戰(zhàn)

      胡 郁(科大訊飛股份有限公司) 在語(yǔ)言理解領(lǐng)域,研究需要和工業(yè)應(yīng)用緊密結(jié)合,但二者卻有著各自的特點(diǎn)。

      首先,是它們關(guān)注的領(lǐng)域不同,分工也不一樣,而且各自的發(fā)展是交錯(cuò)遞進(jìn)的。比如說,做語(yǔ)音識(shí)別的黃金時(shí)間是20世紀(jì)90年代,有大量的文章建立在隱馬爾可夫模型基礎(chǔ)上,建立在貝葉斯網(wǎng)絡(luò)的基礎(chǔ)上,取得了不少研究成果。然而最終這方面的技術(shù)在工業(yè)上的應(yīng)用卻比較有限。事實(shí)證明,近十年來深度神經(jīng)網(wǎng)絡(luò)方面的研究成果卻被工業(yè)界所廣泛使用。

      其次,對(duì)于同樣的領(lǐng)域,學(xué)術(shù)研究和工業(yè)應(yīng)用的出發(fā)點(diǎn)和研究路徑也不同。以深度神經(jīng)網(wǎng)絡(luò)為例,可以通過它很簡(jiǎn)單地用大數(shù)據(jù)去凝練一個(gè)東西。從工業(yè)界的角度來說,這沒有問題,因?yàn)楣I(yè)界要看最終結(jié)果,只要能夠?yàn)槲宜?,整合起來用到產(chǎn)品上并產(chǎn)生效益即可。而研究不是這樣的套路,研究需要去了解其背后的模型以及方法,包括其內(nèi)部的結(jié)合規(guī)律。學(xué)術(shù)研究需要“積累一桶水”,而工業(yè)生產(chǎn)可能“只取一瓢飲”。從技術(shù)發(fā)展的角度講,技術(shù)總要從初步研究階段到達(dá)技術(shù)爆炸階段,然后躍過技術(shù)爆炸,再到技術(shù)普及的階段。

      未來五年,學(xué)術(shù)界應(yīng)主要做兩方面的事情,一是進(jìn)行更加前瞻性的研究。比如腦科學(xué)領(lǐng)域,它對(duì)人工神經(jīng)網(wǎng)絡(luò)到底會(huì)產(chǎn)生什么影響。二是深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用型研究。在這方面,工業(yè)界的廣泛應(yīng)用已經(jīng)形成了大數(shù)據(jù)。學(xué)術(shù)界需要在此基礎(chǔ)上深入發(fā)掘,看看里面還有沒有其他的機(jī)器學(xué)習(xí)規(guī)律和需要解決的問題。對(duì)于工業(yè)界,目前有兩大挑戰(zhàn)。一是在技術(shù)還不完美的情況下將其充分應(yīng)用,如何揚(yáng)長(zhǎng)避短、取長(zhǎng)補(bǔ)短,并通過產(chǎn)品設(shè)計(jì)和場(chǎng)景設(shè)計(jì)讓技術(shù)真正有用。二是對(duì)技術(shù)本身的拓展,如何充分發(fā)揮已有的大數(shù)據(jù)和人工智能成果,聯(lián)合學(xué)術(shù)界進(jìn)行深入研究。

      什么是“語(yǔ)言的理解”

      聶建云(加拿大蒙特利爾大學(xué)) 什么是語(yǔ)言的理解?在不同的時(shí)期談到的語(yǔ)言理解,意義不一樣。過去,某個(gè)人對(duì)語(yǔ)言的理解就是會(huì)用這個(gè)語(yǔ)言,比如寫一個(gè)句子可能沒有語(yǔ)法錯(cuò)誤等,據(jù)此可以認(rèn)定他已對(duì)該語(yǔ)言有一定的理解能力。而現(xiàn)在我們講的語(yǔ)言理解更多是從語(yǔ)義角度來說的,比如說話人所講的一些概念、所要說的內(nèi)容,我們能否完整地理解。

      此外,語(yǔ)言的理解存在不同的層次。舉一個(gè)例子,某人寫了一篇英語(yǔ)文章,但其英語(yǔ)不是很好,叫一個(gè)人去改英語(yǔ)。修改者對(duì)文章的內(nèi)容或許并不理解,但他完全可以從語(yǔ)言的角度進(jìn)行修改。這時(shí)候我們說他對(duì)文章有一定的理解,并非意味著對(duì)其內(nèi)容有完整的理解,而是對(duì)語(yǔ)言本身有一定的理解。而更深入的層次,應(yīng)該是對(duì)語(yǔ)言本身和文章內(nèi)容的雙重理解。

      因此,我們考慮建立一個(gè)完整的語(yǔ)言理解體系,必須明確目標(biāo),即做到哪一個(gè)層次。對(duì)于相關(guān)領(lǐng)域的企業(yè),有哪些任務(wù),需要用什么手段去完成,這和語(yǔ)言理解到什么程度,針對(duì)哪個(gè)方向、哪個(gè)方面的理解密切相關(guān)。某個(gè)方面的運(yùn)用可能并不需要對(duì)語(yǔ)言里的每一個(gè)層次都去理解,可能只需要某一個(gè)方面的理解。比如,我們對(duì)英語(yǔ)的改錯(cuò),可能對(duì)內(nèi)容不需要理解,只需對(duì)表面的現(xiàn)象做一些修改即可。

      另外,在促進(jìn)語(yǔ)言理解方面,少量樣本學(xué)習(xí)非常重要。目前,我們尚未充分發(fā)揮其作用。學(xué)界做了很多知識(shí)圖譜,重點(diǎn)關(guān)注如何將其從大數(shù)據(jù)里挖出來并形成規(guī)律,然而對(duì)這些知識(shí)如何運(yùn)用卻挖掘得比較少。究其原因,我們從文本里挖掘知識(shí)的前提是描述知識(shí)本身,而要去描述對(duì)知識(shí)的應(yīng)用則困難得多。從這個(gè)角度上來說,少量樣本學(xué)習(xí)的研究有更加廣闊的空間,應(yīng)引起更多的關(guān)注。

      如何構(gòu)建一個(gè)類人的語(yǔ)言理解系統(tǒng)

      王海峰(百度公司) 構(gòu)建類人的語(yǔ)言理解系統(tǒng),首先要確定“類”的內(nèi)涵。比如,我問一個(gè)人他專業(yè)領(lǐng)域之外的問題,他能聽清楚我說的每一個(gè)字卻無法回答我的問題。如果我去問這個(gè)領(lǐng)域的專家,專家一定可以回答。然而,若一個(gè)90后的小朋友用網(wǎng)絡(luò)語(yǔ)言的表達(dá)方式來問他,他則不一定能聽懂,從而也無法回答。反過來,如果他聽懂了問題并用一種專業(yè)的表述來回答,這個(gè)小朋友也聽不懂。

      這里涉及一系列的問題。以問答系統(tǒng)為例,一是要有對(duì)人類語(yǔ)言的理解,二是要有對(duì)知識(shí)的掌握和運(yùn)用,三是要有語(yǔ)言的生成,這樣一個(gè)問答系統(tǒng)才能夠形成。這是計(jì)算機(jī)模擬人的問答交流的過程,而模擬人的翻譯過程又是另一套方法。因此到目前為止,我們還無法去建立一個(gè)完全通用的“類人”系統(tǒng),“類人”和目標(biāo)設(shè)定密切相關(guān)。

      對(duì)語(yǔ)言的理解,對(duì)知識(shí)的掌握和運(yùn)用,其背后是什么?我認(rèn)為是基于大規(guī)模數(shù)據(jù)的深入挖掘。不管是挖掘語(yǔ)言規(guī)律,還是挖掘知識(shí),或是運(yùn)用這些知識(shí)去推理,都需要從海量數(shù)據(jù)中做數(shù)據(jù)挖掘。目前,從完成任務(wù)的角度來說,在某些方面,計(jì)算機(jī)的水平甚至比人的水平還要高,比如“百度翻譯”,可以翻譯幾十種語(yǔ)言,很多場(chǎng)景下翻譯結(jié)果基本是可靠的,從某種程度上來說這超出了一個(gè)人的能力。

      人和機(jī)器的不同在于,人可以去舉一反三,或采用這樣一種學(xué)習(xí)模式,而機(jī)器不是“看到一個(gè)反三個(gè)”,而是可以直接看到一百個(gè)、一千個(gè),甚至更多,進(jìn)而去學(xué)習(xí)、整理。比如,一個(gè)翻譯系統(tǒng),我們可以用數(shù)以億計(jì)的人翻譯過的、從互聯(lián)網(wǎng)中挖掘出來的雙語(yǔ)數(shù)據(jù)去訓(xùn)練它。再比如,AlphaGo之所以可以戰(zhàn)勝李世石,正是因?yàn)樗軌蚶糜?jì)算機(jī)的優(yōu)勢(shì)看到更多的棋譜,從而進(jìn)行學(xué)習(xí)。因此,機(jī)器和人的學(xué)習(xí)機(jī)理不一樣,這也正是計(jì)算機(jī)進(jìn)行語(yǔ)言理解的優(yōu)勢(shì),是我們構(gòu)建“類人”的語(yǔ)言理解系統(tǒng)的基礎(chǔ)。

      從技術(shù)向原理回歸

      邢 波(美國(guó)卡耐基梅隆大學(xué)) 這幾年在機(jī)器學(xué)習(xí)以及NLP(Natural Language Processing, 自然語(yǔ)言處理)領(lǐng)域,刷比分的文章層出不窮,我對(duì)此比較擔(dān)憂。我認(rèn)為,學(xué)者們應(yīng)有自覺的沖動(dòng)和熱情去關(guān)注技術(shù)的原創(chuàng)性和原理的突破。

      從我個(gè)人的觀察以及與很多同行的交流來看,很多談?wù)摱技性趯?duì)于問題的描述或者宏觀性的展望,少有對(duì)于技術(shù)性或者原理性的執(zhí)著。很多知名學(xué)者和研發(fā)領(lǐng)袖的大量言論、頻繁演說都集中在這個(gè)層面。近幾年,這種情況在機(jī)器學(xué)習(xí)領(lǐng)域中非常突出。甚至還有一些近乎輕浮的觀點(diǎn),諸如建議初學(xué)者不要從理論開始入手,不要在算法上花費(fèi)太多時(shí)間,甚至無需懂線性代數(shù)這樣的誤導(dǎo)性極強(qiáng)的、來自個(gè)別新潮明星應(yīng)用工程師們的論調(diào)在公共論壇中大行其道,被奉為圭臬。

      特別是當(dāng)有一個(gè)“大錘子”,像深度學(xué)習(xí)這樣的方法出現(xiàn)之后,就更加速了大家去“摘果子”的熱情,對(duì)原創(chuàng)性、原理性的熱情便減弱了。原創(chuàng)性研究和對(duì)原理的探索非??菰?,回報(bào)周期長(zhǎng),但卻是任何一個(gè)學(xué)科發(fā)展的必要環(huán)節(jié)。此外,這樣的工作不是某個(gè)人、某部分人或者某個(gè)團(tuán)體能夠獨(dú)立完成的,它需要學(xué)術(shù)界和工業(yè)界共同合作完成。

      一個(gè)好的研究環(huán)境不存在學(xué)校和企業(yè)、工程和理科的區(qū)別,一個(gè)好的學(xué)者必須擁有融會(huì)貫通的能力,能夠在對(duì)實(shí)際問題進(jìn)行深入理解的同時(shí)充分地掌握原理。而這往往是我們?cè)诂F(xiàn)代科學(xué)環(huán)境里缺乏的一種學(xué)術(shù)品位。

      舉個(gè)例子,如果在原理不明的情況下去推動(dòng)一個(gè)產(chǎn)品,你是否敢用,如何介紹給別人用呢?原理不清,就表示你對(duì)其結(jié)果沒有十分的把握,在這種情況下售賣產(chǎn)品有極大的風(fēng)險(xiǎn)性。就最近的特斯拉自動(dòng)駕駛車事故來說,一個(gè)機(jī)器視覺或者機(jī)器人專家絕不會(huì)在自動(dòng)車上把手離開方向盤去睡覺,因?yàn)樗肋@個(gè)系統(tǒng)其實(shí)沒有那么可靠。但是由于過度的宣傳以及社會(huì)對(duì)人工智能的依賴和期待,人們往往忽視了它的局限和缺陷。這就需要學(xué)者和工程師對(duì)產(chǎn)品的原理和透明度有執(zhí)著的追求,也需要媒體、政府對(duì)人工智能應(yīng)用開發(fā)的理性和冷靜,對(duì)基礎(chǔ)研究的理解和重視。

      在常規(guī)的人工智能開發(fā)中去做任何一個(gè)突破性的判斷,都值得研發(fā)者充分思考。希望大家更冷靜一些,去關(guān)注數(shù)學(xué)原理,重視枯燥的基礎(chǔ)性的工作,在實(shí)現(xiàn)的形式和算法的保障方面多下功夫。

      語(yǔ)言理解的數(shù)據(jù)、方法和應(yīng)用

      周 明(微軟亞洲研究院) 關(guān)于語(yǔ)言理解領(lǐng)域,我特別關(guān)注三方面的問題:

      一是數(shù)據(jù)。過去幾年無論是做搜索還是做語(yǔ)音,方法在一定水平情況下動(dòng)不了的時(shí)候,誰(shuí)有大數(shù)據(jù)誰(shuí)就最厲害,比如搜索,學(xué)術(shù)界玩兒了半天IR(Information Retrieval,信息檢索),沒有大規(guī)模的用戶搜索的日志和反饋數(shù)據(jù),水平根本上不去。語(yǔ)音也一樣,像Siri,把海量用戶的每天使用的語(yǔ)音數(shù)據(jù)拿過來重新訓(xùn)練系統(tǒng),Siri的語(yǔ)音就提高了很多。似乎數(shù)據(jù)工作包括獲得數(shù)據(jù)、整理數(shù)據(jù),從數(shù)據(jù)中做出一些歸類、聚類,發(fā)現(xiàn)知識(shí)和規(guī)律,似乎是很煩瑣的工作,但卻是我們這個(gè)學(xué)科的根本。在今年的ACL(Annual Meeting of the Association for Computational Linguistics,計(jì)算語(yǔ)言學(xué)年會(huì))上,少有學(xué)者談數(shù)據(jù)的問題。我認(rèn)為數(shù)據(jù)是值得大家好好討論的問題,尤其是對(duì)中國(guó)學(xué)者而言,如果狠抓各類有用數(shù)據(jù),包括無標(biāo)注、有標(biāo)注的數(shù)據(jù),就很有希望實(shí)現(xiàn)趕超。

      二是方法。將“遷移學(xué)習(xí)”演繹一下,就是將在A領(lǐng)域好用的方法,放到B領(lǐng)域去研究、繼承和發(fā)展。通過應(yīng)用可以發(fā)現(xiàn)有什么更好的方法,會(huì)遇到哪些挑戰(zhàn),遇到挑戰(zhàn)后如何調(diào)整?這樣又會(huì)產(chǎn)生新的方法。遷移的概念,推而廣之,其實(shí)就是跨學(xué)科合作或跨領(lǐng)域合作的問題。目前神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯很熱,可是我們從中發(fā)現(xiàn)了很多問題,比如丟詞特別厲害,或者翻出了多余的片段。現(xiàn)在大家都在把統(tǒng)計(jì)機(jī)器翻譯的方法一點(diǎn)點(diǎn)放到神經(jīng)網(wǎng)絡(luò)中去?,F(xiàn)在神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯中的Attention 模型,它是概率分布式的,對(duì)每個(gè)詞的翻譯,要利用所對(duì)應(yīng)的源語(yǔ)句子的詞匯,按照不同的概率發(fā)生作用。統(tǒng)計(jì)機(jī)器翻譯中的成分,比如翻譯概率和詞匯對(duì)齊,通過這種方式融入到神經(jīng)網(wǎng)絡(luò)中,我認(rèn)為就是一種有效的方法的遷移和融合,只不過上升到了一個(gè)新的概念。目前,多數(shù)文章都從自己的角度闡述了應(yīng)用神經(jīng)網(wǎng)絡(luò)改進(jìn)某些NLP(自然語(yǔ)言處理)任務(wù),但是少有將領(lǐng)域有關(guān)的知識(shí)、規(guī)則和深度學(xué)習(xí)相融合的研究。我認(rèn)為這兩者融合未來非常重要。

      三是應(yīng)用。自然語(yǔ)言處理是一個(gè)應(yīng)用學(xué)科,要由應(yīng)用來牽動(dòng)科研的發(fā)展,如果沒有應(yīng)用驅(qū)動(dòng),可以天天談腦科學(xué)的問題,談50年、500年也還是這些問題。通過應(yīng)用將研究的長(zhǎng)遠(yuǎn)目標(biāo)和短期目標(biāo)結(jié)合起來,是學(xué)科發(fā)展的關(guān)鍵。

      最后談?wù)凬LP未來的研究重點(diǎn),我比較關(guān)注如下兩個(gè)方面。一是上下文建模和多輪對(duì)話。我們做機(jī)器翻譯,做問答系統(tǒng),做聊天系統(tǒng),目前面臨的最大問題就是對(duì)上下文建模的能力不足,而且多輪對(duì)話能力不足。隨著手機(jī)的應(yīng)用越來越普及,NLP工作者渴望解決口語(yǔ)現(xiàn)象和多輪對(duì)話問題。也許深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)會(huì)有很好的用武之地。二是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯。目前已有很好的進(jìn)展,但是方興未艾。其中探討神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯和統(tǒng)計(jì)翻譯各種形式(模型、特征)的結(jié)合,將會(huì)有很大的發(fā)展前途。

      AlphaGo的成功對(duì)語(yǔ)言理解有何啟發(fā)

      馬少平(清華大學(xué)) AlphaGo(一款圍棋人工智能程序,由Google旗下的DeepMind公司研發(fā))到底成功在哪里?從原理上說,其核心是深度學(xué)習(xí)、左右手互搏以及強(qiáng)化學(xué)習(xí),但如果從方法策略上來說,它與以前的成果,比如深藍(lán)(IBM公司生產(chǎn)的一臺(tái)超級(jí)國(guó)際象棋電腦),存在很大的不同。

      兩者之不同和圍棋本身的特點(diǎn)有關(guān)。圍棋感性的東西多,模樣怎么樣,是厚還是薄,這些東西很難描述,過去之所以認(rèn)為計(jì)算機(jī)下圍棋存在困難,正是因?yàn)檫@一點(diǎn)。深藍(lán)采用α-β剪枝的辦法,有一套評(píng)價(jià)體系,評(píng)價(jià)完全是靠知識(shí)。IBM在研發(fā)時(shí)請(qǐng)了很多下棋高手、國(guó)際大師幫他們總結(jié)各種知識(shí),最后再結(jié)合搜索來實(shí)現(xiàn)。 而多年來圍棋的評(píng)價(jià)一直沒有得到解決。AlphaGo靠深度學(xué)習(xí)來解決了評(píng)價(jià)的問題。它有四個(gè)網(wǎng)絡(luò),包括快速網(wǎng)絡(luò)、兩個(gè)策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)。其中,快速網(wǎng)絡(luò)嚴(yán)格來說不是深度的,是很淺的,甚至就是一個(gè)回歸,是根據(jù)人的知識(shí)在幾萬(wàn)個(gè)模式的基礎(chǔ)上構(gòu)成的。它在AlphaGo中起了很大的作用,然而單靠它可能打不過李世石。它的網(wǎng)絡(luò)速度非??欤鹊诙?、第三個(gè)網(wǎng)絡(luò)快一千倍左右,在蒙特卡羅樹搜索(Monte Carlo Tree Search)時(shí)用于模擬,可以在同等時(shí)間內(nèi)快一千倍。這對(duì)最終勝負(fù)起到了關(guān)鍵作用。

      因此,AlphaGo既有人的知識(shí),又有深度學(xué)習(xí)感性的東西,同時(shí)又借助了蒙特卡羅樹搜索。知識(shí)和搜索都是傳統(tǒng)的基于符號(hào)主義人工智能的精髓,而深度學(xué)習(xí)是所謂的連接主義。這樣,AlphaGo把符號(hào)主義的方法跟連接主義的方法很好地融合在一起。這是他成功的地方。

      現(xiàn)在大家都運(yùn)用深度學(xué)習(xí),靠數(shù)據(jù)驅(qū)動(dòng),把知識(shí)完全拆解掉了。然而,我們應(yīng)該深入思考如何把規(guī)則和知識(shí),即傳統(tǒng)的符號(hào)主義思想和深度學(xué)習(xí)的連接主義思想結(jié)合到自然語(yǔ)言處理中,這樣才能夠解決問題。兩者通常是互補(bǔ)的。舉個(gè)例子,AlphaGo跟李世石比賽第四盤下輸了,源于一步錯(cuò)著,至少到7月份距離比賽已經(jīng)過去了4個(gè)月的時(shí)候,AlphaGo也未能解決這個(gè)問題,即便經(jīng)過長(zhǎng)時(shí)間訓(xùn)練,仍然沒有解決?;谏疃葘W(xué)習(xí)大量數(shù)據(jù)的訓(xùn)練方法,想把一個(gè)錯(cuò)誤改掉是很難的,而且改正以后其他問題不一定不出現(xiàn)。而基于知識(shí)和規(guī)則,就很容易避免。

      將知識(shí)、規(guī)則與深度學(xué)習(xí)相結(jié)合,AlphaGo給予我們很深的啟示。這也應(yīng)該是自然語(yǔ)言處理領(lǐng)域今后努力的方向。

      責(zé)任編輯:劉玥妍

      猜你喜歡
      神經(jīng)網(wǎng)絡(luò)深度人類
      人類能否一覺到未來?
      深度理解一元一次方程
      人類第一殺手
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      1100億個(gè)人類的清明
      深度觀察
      深度觀察
      深度觀察
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      阿巴嘎旗| 滨州市| 河北区| 平乐县| 佛坪县| 齐河县| 都兰县| 芮城县| 福州市| 达日县| 长海县| 监利县| 崇信县| 黑山县| 泽州县| 寿宁县| 广州市| 玉门市| 巴里| 昭通市| 玉龙| 浮山县| 滁州市| 广昌县| 枣庄市| 临武县| 德江县| 萨迦县| 双流县| 民权县| 萍乡市| 滁州市| 卓尼县| 通辽市| 北京市| 台中市| 花莲市| 兰州市| 商水县| 呼伦贝尔市| 盐山县|