肖燁晗
摘 要 本文首先對人工智能、自然語言生成技術(shù)進行了簡要的介紹,從而對自然語言生成技術(shù)在“微軟小冰”中的應(yīng)用、自然語言生成技術(shù)在漢語言幽默自動生成中的應(yīng)用展開分析,并根據(jù)人工智能與自然語言技術(shù)結(jié)合的實例,總結(jié)了人工智能和自然語言技術(shù)的結(jié)合對生活的改變。
關(guān)鍵詞 自然語言生成;人工智能;微軟小冰;漢語言幽默
中圖分類號 TP3 文獻標(biāo)識碼 A 文章編號 1674-6708(2019)232-0155-02
自然語言生成技術(shù)對人工智能的發(fā)展有多方面的影響,如可以改善人機關(guān)系、方便人機互動等,將人工智能推向另一個更高的層面。本文主要從人工智能概述、自然語言生成技術(shù)概述、自然語言生成技術(shù)在“微軟小冰”中的應(yīng)用和自然語言生成技術(shù)在漢語言幽默自動生成中的應(yīng)用出發(fā),淺析自然語言生成技術(shù)在人工智能領(lǐng)域的應(yīng)用。
1 人工智能概述
人工智能是一門研究、開發(fā)用于模擬、延伸和擴展人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的新興科學(xué)技術(shù)。它誕生于20世紀(jì)50至60年代,經(jīng)過了幾十年的發(fā)展,已經(jīng)逐漸成為了計算機學(xué)科的一個重要分支[ 1 ]。下文將對人工智能發(fā)展史、人工智能的分類、人工智能的主要應(yīng)用領(lǐng)域3個方面來介紹人工智能。
1.1 人工智能的發(fā)展史
在1936年,英國數(shù)學(xué)家圖靈(A.M.Turing)提出了著名的圖靈機模型,而之后他又在1950年所發(fā)布的《計算機能思維嗎》一文中,提到了機器能夠思維的論述,為人工智能技術(shù)的發(fā)展方向和模式打下了基礎(chǔ)。1956年,達特茅斯會議(Dartmouth)中第一次提出了“人工智能”這一概念,成為人工智能的起點。60年代,自然語言通訊成為當(dāng)時的研究熱點,這標(biāo)志著人工智能技術(shù)掀開了嶄新的一頁。70年代,經(jīng)過不懈的研究,一批具有專家水平的程序系統(tǒng)相繼問世,知識專家系統(tǒng)飛速發(fā)展。80年代以后,更多的科學(xué)家圍繞人工智能的知識表示、推理、學(xué)習(xí)進行新的研究?,F(xiàn)今,人工智能的應(yīng)用得到了新的推廣,開始向更多更大的方面進行推進。
1.2 人工智能的分類
人工智能可分為強人工智能和弱人工智能兩大類,而“強人工智能”又可分為類人人工智能和非類人的人工智能?!叭跞斯ぶ悄堋敝傅氖遣痪邆渥晕宜伎肌⒆晕彝评?、解決問題能力的人工智能。而“強人工智能”具備了自主感知、自主思維和自主行動的能力。類人的人工智能,機器完全按照人類的思維和行動方式來執(zhí)行;非類人的人工智能則是有特殊的思維和行動方式,不會按照人類的模式來活動。目前,人類所研究的人工智能還處于弱人工智能階段[ 2 ]。
1.3 人工智能的重要領(lǐng)域
經(jīng)過半個多世紀(jì)的發(fā)展,人工智能目前有很多的研究和應(yīng)用領(lǐng)域。智能檢索、模式識別、專家系統(tǒng)和神經(jīng)網(wǎng)絡(luò)是其中最重要的4個領(lǐng)域,以下將分別介紹這些領(lǐng)域。智能檢索是結(jié)合了人工智能技術(shù)的新一代檢索技術(shù),可以從現(xiàn)今信息爆炸的時代中準(zhǔn)確的找出我們所需要的信息。智能識別是計算機實現(xiàn)對環(huán)境和個體的自動判讀和處理。目前在文字、語音、指紋的識別,醫(yī)學(xué)診斷的方面有很大的應(yīng)用。專家系統(tǒng)可利用某一領(lǐng)域的專門知識求解專門問題。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)是由大量神經(jīng)處理單元互聯(lián)而成的網(wǎng)絡(luò),是對人腦的抽象和模擬。人工神經(jīng)網(wǎng)絡(luò)是為了獲得一個問題的結(jié)果,而有針對性的解決技術(shù)。人工神經(jīng)網(wǎng)絡(luò)具有很強的學(xué)習(xí)能力,可以很好代替人工來完成一些復(fù)雜工作。
2 自然語言生成技術(shù)概述
自然語言生成(Natural Language Generation)是人工智能和計算機語言學(xué)的一門分支,而語言生成系統(tǒng)就是基于語言信息處理的計算機模型。自然語言生成的工作過程是從抽象的概念開始,逐步通過系統(tǒng)的語法規(guī)則來生成文本。開發(fā)運用自然語言生成技術(shù)有兩個主要目的:一是利用語言知識來生成文本、分析報告、幫助消息等;二是作為鑒定特殊語言的一種手段,從理論和描述上,工作過程與研究自然語言有著密切的聯(lián)系[ 3 ]。這充分說明了自然語言生成技術(shù)的重要性。
2.1 自然語言系統(tǒng)結(jié)構(gòu)
自然語言系統(tǒng)體系結(jié)構(gòu)包括內(nèi)容規(guī)劃、句子規(guī)劃、和表層生成3個基本功能模塊。內(nèi)容規(guī)劃確定內(nèi)容并完成結(jié)構(gòu)規(guī)劃,句子規(guī)劃則是進一步明確規(guī)劃文本的細節(jié),而表層生成則是將句子規(guī)劃后的文本描述映射到文字、標(biāo)點等方面,形成表層文本。也就是說,前兩者決定輸出的內(nèi)容,而第三者決定輸出的方法[ 4 ]。
2.2 自然語言生成發(fā)展與現(xiàn)狀
自然語言生成技術(shù)已誕生近半個世紀(jì),科學(xué)家們一直致力于使這項技術(shù)能夠更加成熟。首先是在特殊語言狀況下廣泛深入處理;另一方面是在同一環(huán)境下使用多種語言進行生成。一般情況下,人工智能系統(tǒng)并不關(guān)心輸出數(shù)據(jù)(即句子)的細節(jié)。人工智能目前對人類語言的理解上存在局限性,不能完全代替人類[ 5 ]。目前自然語言生成技術(shù)存在著數(shù)據(jù)集缺乏;生成文本短,數(shù)據(jù)簡單;評價方法不獨立;無法滿足商業(yè)應(yīng)用等問題[ 6 ]。這說明,現(xiàn)在的自然語言生成技術(shù)還需要進一步研究和發(fā)展。
3 在“微軟小冰”中的應(yīng)用
微軟小冰已經(jīng)升級到了第六代。在4年前微軟小冰剛剛出現(xiàn)的時候,很多人對它的看法只是一個單純的聊天工具。在第三代的時候,小冰平均每次和用戶進行16組對話,這是一個十分驚人的數(shù)字,是當(dāng)時同類產(chǎn)品的8倍[7]。而到了第六代的時候,小冰得到了全面的提升,甚至有了自己的全息影像。小冰的EQ和IQ得到了充分的升級,現(xiàn)在的小冰已經(jīng)支持全雙工使用共感模型,而同時創(chuàng)作等能力也得到了升級。微軟中國通過使用自然語言生成技術(shù),創(chuàng)造出了一個超前的產(chǎn)品。第六代的微軟小冰已經(jīng)是一個完整的情感計算框架[8]。小冰取得這么大的成就,得益于自然語言生成技術(shù)的不斷完善。這短短四年,已經(jīng)可以看出自然語言生成技術(shù)的發(fā)展速度是十分快的。
在微博上,有網(wǎng)友問小冰:“照片里的人是誰?”,而小冰回答“咳咳,就是最美麗可愛的美少女我啊?!笔紫?,小冰通過文字識別和分析提取出了問題是在詢問人,而之后,小冰通過圖像分析識別出了照片里的人是自己,再經(jīng)過系統(tǒng),得出回答的關(guān)鍵詞,并進行加工,最后回答了這個問題。由此可以看出,小冰現(xiàn)在已經(jīng)具有了更加完善的系統(tǒng),可以輕易做到很多其他人工智能做不到的事情了。
目前,類似小冰的聊天機器人正在逐步發(fā)展,為可以在使其具有更加完備的處理系統(tǒng),更加像人一樣思考上做出努力。
4 在漢語言幽默自動生成中的應(yīng)用
幽默是人類所特有的復(fù)雜認(rèn)知行為,分為語言型幽默和非語言型幽默。語言型幽默是在語言文字表現(xiàn)上的幽默,而非語言型幽默則是在語言之外的方面表現(xiàn)的幽默。目前的自然語言生成技術(shù)不具備生成高質(zhì)量故事的能力,所以在漢語言幽默上自然語言生成技術(shù)還需要進一步的發(fā)展[ 9 ]。
如果計算機具備了類似于人類的幽默感, 就可以認(rèn)為計算機本身具有了一定特點,且這些特點極具創(chuàng)造性與個性。計算機在完成復(fù)雜任務(wù)的同時,也可以借助這種幽默提升用戶的體驗。同時,如果人工智能具有了幽默感,將會為我們的日常生活增添許多樂趣。
5 總結(jié)與展望
目前自然語言生成技術(shù)已得到了廣泛的應(yīng)用,和很多的系統(tǒng)進行了有機的結(jié)合。自然語言生成技術(shù)具有很多的用途,未來一定能和更多的方面進行結(jié)合。但其本身作為系統(tǒng),并沒有辦法像人一樣進行處理,還比較死板。而人工智能目前處于弱人工智能的階段,人工智能還無法具有情感,但可以根據(jù)所獲得的知識,在某些方面勝過人類。
這兩項技術(shù)目前仍處于萌芽的階段,需要不斷進行研究。就自然語言生成來說,如果能使自然語言生成更加類似于人類的表達應(yīng)該是接下來一個十分重點的研究科課題。而對于人工智能來說,使人工智能更加聰明,更加多變,更好適應(yīng)人類社會生活則是十分重要的研究。相信在將來,這兩項技術(shù)間的融合能夠更加完美地進入人類的社會生活。
參考文獻
[1]鄒蕾,張先鋒.人工智能及其發(fā)展應(yīng)用[J].信息網(wǎng)絡(luò)安全,2012(2):11-13.
[2]本刊編輯部.人工智能概述[J].保密科學(xué)技術(shù),2017(11):8-9.
[3]張建華,陳家駿.自然語言生成綜述[J].計算機應(yīng)用研究,2006(8):1-3,13.
[4]于振龍.基于LSTM的自然語言生成技術(shù)研究與實現(xiàn)[D].北京:北京郵電大學(xué),2018.
[5]蔣茜謙.人工智能已經(jīng)掌握人類語言了嗎[J].計算機與網(wǎng)絡(luò),2018,44(24):16-17.
[6]曹娟,龔雋鵬,張鵬洲.數(shù)據(jù)到文本生成研究綜述[J].計算機技術(shù)與發(fā)展,2019(1):1-6.
[7]張文彬.微軟小冰進化第三代 擁有圖像識別能力[J].計算機與網(wǎng)絡(luò),2015,41(15):14-15.
[8]陸飛.第六代微軟“小冰”正式發(fā)布[J].計算機與網(wǎng)絡(luò),2018,44(15):73.
[9]譚紅葉,閆真,李茹,等.邁向創(chuàng)造性語言生成:漢語幽默自動生成的探索[J].中國科學(xué):信息科學(xué),2018,48(11):1497-1509.