• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      本體聊天機(jī)器人的設(shè)計(jì)與應(yīng)用

      2016-10-13 21:02:27王磊魏勇邸建勛楊小琳
      自動(dòng)化與信息工程 2016年4期
      關(guān)鍵詞:聊天本體定義

      王磊 魏勇 邸建勛 楊小琳

      ?

      本體聊天機(jī)器人的設(shè)計(jì)與應(yīng)用

      王磊 魏勇 邸建勛 楊小琳

      (31008部隊(duì))

      針對(duì)互聯(lián)網(wǎng)檢索技術(shù)在專業(yè)領(lǐng)域知識(shí)查詢存在的相關(guān)信息過多、需人工篩選的問題,基于聊天機(jī)器人發(fā)展現(xiàn)狀,引入本體技術(shù)作為聊天機(jī)器人的規(guī)則庫存儲(chǔ)載體;基于本體規(guī)則庫的樹形層次結(jié)構(gòu),設(shè)計(jì)規(guī)則匹配算法;通過系統(tǒng)規(guī)劃和模塊劃分,構(gòu)建一款既能聊天又能解答氣象專業(yè)知識(shí)的聊天機(jī)器人。對(duì)聊天機(jī)器人在專業(yè)領(lǐng)域的應(yīng)用和發(fā)展有一定的促進(jìn)作用,為領(lǐng)域知識(shí)共享和獲取提供一個(gè)便捷快速的平臺(tái)。

      聊天機(jī)器人;本體;規(guī)則樹;規(guī)則匹配算法

      0 引言

      隨著科學(xué)技術(shù)和信息技術(shù)的迅猛發(fā)展以及互聯(lián)網(wǎng)的廣泛應(yīng)用,人們對(duì)于知識(shí)的需求量越來越大?,F(xiàn)階段,在追求知識(shí)信息量的同時(shí),更加注重獲取知識(shí)的便捷快速和質(zhì)量。

      互聯(lián)網(wǎng)技術(shù)的突飛猛進(jìn)已經(jīng)能夠滿足人們對(duì)知識(shí)“量”的需求,但卻無法保證知識(shí)的“質(zhì)”。人們通過各種檢索引擎(百度、Google、Sogo等),從互聯(lián)網(wǎng)獲得大量的信息,但從中篩選有用的信息卻是比較繁瑣困難的過程[1]?,F(xiàn)階段,因?yàn)榇蟛糠炙阉饕婊诖ヅ淠J?,檢索的無用相關(guān)信息較多,不能滿足用戶比較復(fù)雜的檢索要求,檢索結(jié)果不盡如人意[2]。

      聊天機(jī)器人是一個(gè)模仿人的語言習(xí)慣,通過模式匹配的方式尋求最佳答案的自動(dòng)問答系統(tǒng)[3]。一問一答,不存在信息篩選的困惑。所有問題的答案均是根據(jù)已建立的規(guī)則庫進(jìn)行規(guī)則匹配和推理得到,具有準(zhǔn)確性高、知識(shí)獲取便捷的特點(diǎn)。通過記錄對(duì)話歷史信息、主動(dòng)轉(zhuǎn)移話題、主動(dòng)提問等方式,實(shí)現(xiàn)人與人對(duì)話的模擬。目前比較成熟的聊天機(jī)器人有TalkBot、Elbot、eLise、Alice、Laylahbot、小黃雞等等[4]。由于氣象知識(shí)專業(yè)性較強(qiáng),在氣象領(lǐng)域中應(yīng)用聊天機(jī)器人進(jìn)行氣象知識(shí)的問答對(duì)規(guī)則庫的設(shè)計(jì)要求比一般系統(tǒng)更高。構(gòu)建的規(guī)則庫要求結(jié)構(gòu)更加完整,條理更加清晰,答案更加準(zhǔn)確。

      本體作為一種新型的數(shù)據(jù)存儲(chǔ)模型,在信息存儲(chǔ)、共享等領(lǐng)域有著越來越廣泛的應(yīng)用。它以樹形存儲(chǔ)結(jié)構(gòu)為原型,具有極強(qiáng)的層次結(jié)構(gòu)和知識(shí)關(guān)聯(lián)性關(guān)系,符合聊天機(jī)器人的規(guī)則樹要求[5],同時(shí)還能應(yīng)用本體的關(guān)聯(lián)性特點(diǎn)進(jìn)行語義擴(kuò)展查詢,因此本文選用本體作為聊天機(jī)器人的規(guī)則存儲(chǔ)模型。

      1 聊天機(jī)器人概述

      聊天機(jī)器人主要通過自然語言,以聊天的方式與人交互,根據(jù)人的語言習(xí)慣,結(jié)合用戶問題,給出人性化的回答。最早的聊天機(jī)器人是1956年由Jaseph Weizenbaum創(chuàng)造的“Eliza”[6]。它根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行搜索,基本上能夠?qū)崿F(xiàn)人機(jī)間的簡(jiǎn)單對(duì)話。但由于Eliza僅僅根據(jù)第一個(gè)關(guān)鍵詞搜索答案,沒有進(jìn)行優(yōu)先級(jí)比較、規(guī)則最優(yōu)匹配等步驟,使得一些優(yōu)先級(jí)較低的規(guī)則幾乎永遠(yuǎn)不會(huì)被匹配到。

      隨后聊天機(jī)器人進(jìn)入快速發(fā)展階段?!癈laude”加入了模式匹配,提升了回答語句語法以及語義的準(zhǔn)確性;“Cyber Ivar”提升響應(yīng)速度的同時(shí),極大地增強(qiáng)了知識(shí)庫;“Alice”定義了豐富的標(biāo)簽,具有各種擬人的智能[7]。

      聊天機(jī)器人相關(guān)技術(shù)的發(fā)展日趨完善。語法分析、句法分析、問題分類、命名實(shí)體識(shí)別、句型識(shí)別、語義分析、語料庫技術(shù)、相似度計(jì)算、模式匹配等技術(shù)在聊天機(jī)器人中的應(yīng)用和發(fā)展完善進(jìn)一步促進(jìn)了聊天機(jī)器人的智能化。

      聊天機(jī)器人經(jīng)過60多年的發(fā)展,已經(jīng)形成了一套相對(duì)完整的理論和實(shí)踐體系,但也存在一定的缺陷。目前,幾乎所有的聊天機(jī)器人主要采用模式匹配的方法來尋找最佳答案,基于程序和談話技巧設(shè)計(jì),對(duì)于常識(shí)性問題往往采用側(cè)面回答的方式。例如,當(dāng)用戶問:“您知道云分為哪幾類嗎?”,聊天機(jī)器人的回答是“這個(gè)太簡(jiǎn)單了,咱換個(gè)話題吧。”,這樣的回答無法滿足用戶的真實(shí)需求。

      為了解答用戶各種專業(yè)問題,聊天機(jī)器人在其他領(lǐng)域的應(yīng)用也越來越廣泛,特別在英語教學(xué)、電子商務(wù)等領(lǐng)域得到越來越多的青睞。這些專家機(jī)器人除具有基本的聊天對(duì)話功能外,還能進(jìn)行專業(yè)領(lǐng)域問題的解答,充分發(fā)揮了聊天機(jī)器人便捷和快速反應(yīng)的優(yōu)勢(shì)。

      2 本體的構(gòu)建

      本體的概念最初來源于哲學(xué)領(lǐng)域,現(xiàn)階段在語義檢索、知識(shí)智能查詢等方面已得到廣泛應(yīng)用[8]。它以樹形存儲(chǔ)結(jié)構(gòu)為原型,主要包括3個(gè)要素:核心元素集、元素間的關(guān)系和元素的屬性(數(shù)據(jù)屬性、對(duì)象屬性),通常也稱作類、實(shí)例和關(guān)系。

      目前本體的構(gòu)建主要以人工構(gòu)建為主,本體自動(dòng)構(gòu)建、半自動(dòng)構(gòu)建有一定的發(fā)展,但目前相對(duì)成熟穩(wěn)定的方法比較少[9]。在實(shí)際運(yùn)用中存在構(gòu)建過于死板、層次結(jié)構(gòu)不準(zhǔn)等問題。本文結(jié)合自動(dòng)構(gòu)建中語料抽取原理,采用人工構(gòu)建方法,具體流程如下:

      1) 下級(jí)子類劃分

      為使本體構(gòu)建層次關(guān)系清晰、知識(shí)涵蓋全備,首先把知識(shí)劃分為多個(gè)下級(jí)子類,再分別對(duì)每個(gè)子類進(jìn)行知識(shí)填充;

      2) 給定知識(shí)術(shù)語

      給定與各個(gè)下級(jí)子類相關(guān)的氣象學(xué)科中的各種概念、定律、現(xiàn)象和公式等,涵蓋領(lǐng)域中的各個(gè)知識(shí)點(diǎn)[10];

      3) 確定層次關(guān)系

      將給定的各種概念劃分成層次關(guān)系,層次結(jié)構(gòu)的劃分可依據(jù)不同的專業(yè)方向劃分不同的層次關(guān)系,也可根據(jù)具體應(yīng)用劃分所需要的層次結(jié)構(gòu)。

      4) 定義實(shí)例

      定義實(shí)例主要指將領(lǐng)域知識(shí)作為本體中概念的實(shí)例進(jìn)行語義標(biāo)注,并根據(jù)本體的定義來描述領(lǐng)域知識(shí)屬性的過程;

      5) 定義實(shí)例屬性

      屬性包括數(shù)據(jù)屬性和對(duì)象屬性。數(shù)據(jù)屬性是指本體中概念與數(shù)據(jù)類型之間的關(guān)系;對(duì)象屬性是指本體中概念之間的相互關(guān)系[11]。本文根據(jù)需要定義如下屬性,數(shù)據(jù)屬性有:描述(des)、中文標(biāo)題(cnTitle)、英文標(biāo)題(enTitle)等;對(duì)象屬性有:兄弟類(hasBrother)、子類(hasChildren)、父類(isChildOf)。

      3 基于本體的規(guī)則匹配

      規(guī)則匹配是智能機(jī)器人的核心算法,算法設(shè)計(jì)的好壞直接影響智能機(jī)器人的聊天效果。好的匹配算法也需要結(jié)構(gòu)完善、規(guī)則涵蓋全面的規(guī)則庫作為底層支撐[12]。

      結(jié)合本體的樹形結(jié)構(gòu),為提高匹配的準(zhǔn)確度和匹配速度,本文將規(guī)則庫構(gòu)建為規(guī)則樹,并以本體作為存儲(chǔ)模型,將本體中的實(shí)例和實(shí)例屬性對(duì)應(yīng)為規(guī)則中的條件和結(jié)果,已知實(shí)例則輸出實(shí)例屬性[13]。規(guī)則本體的簡(jiǎn)化模型如圖1所示。

      圖1 規(guī)則本體簡(jiǎn)化模型

      根據(jù)圖1可知,以規(guī)則開始的規(guī)則有:規(guī)則a-規(guī)則b、規(guī)則a-規(guī)則c、規(guī)則a-規(guī)則d、規(guī)則a-規(guī)則b-規(guī)則e、規(guī)則a-規(guī)則b-規(guī)則f、規(guī)則a-規(guī)則b-規(guī)則f-規(guī)則j等。

      規(guī)則匹配采取深度優(yōu)先匹配算法,如果匹配的規(guī)則以規(guī)則a開始,則進(jìn)一步匹配規(guī)則a的下一級(jí)規(guī)則,直到所有規(guī)則全部匹配完畢,輸出最后一級(jí)規(guī)則對(duì)應(yīng)的答案,結(jié)束匹配;如果未找到規(guī)則a,則剔除規(guī)則a,重復(fù)上述匹配流程。

      現(xiàn)舉例如下:用戶輸入“請(qǐng)給出云的定義和分類”,進(jìn)行中文分詞的結(jié)果為“請(qǐng)/給出/云/的/定義/和/分類”,提取問題核心關(guān)鍵詞為“云”、“定義”和“分類”。系統(tǒng)在規(guī)則樹中以“云”為根節(jié)點(diǎn)進(jìn)行規(guī)則匹配,如果未找到,則剔除“云”,開始以“定義”進(jìn)行深度優(yōu)先的遍歷搜索;如果找到“云”,則搜索“云”的子規(guī)則中是否存在“定義”節(jié)點(diǎn),如果不存在,則剔除“定義”節(jié)點(diǎn),否則繼續(xù)深度搜索循環(huán),直到找到“云-定義-分類”這條路徑,得到答案進(jìn)行輸出。匹配算法流程圖如圖2所示。

      4 聊天機(jī)器人的設(shè)計(jì)

      聊天機(jī)器人的工作原理:當(dāng)用戶輸入問題后,機(jī)器人對(duì)問題進(jìn)行中文分詞,抽取問題核心關(guān)鍵詞,通過規(guī)則匹配算法進(jìn)行規(guī)則的最優(yōu)匹配,找到規(guī)則庫中對(duì)應(yīng)的最佳規(guī)則。對(duì)于規(guī)則庫中暫時(shí)沒有的規(guī)則,則轉(zhuǎn)入一般算法,進(jìn)行主動(dòng)提問或者主動(dòng)轉(zhuǎn)移話題處理,給出預(yù)先設(shè)置的通用答案,并記錄用戶問題,等待領(lǐng)域?qū)<业卿浗鉀Q[14]。系統(tǒng)結(jié)構(gòu)圖如圖3所示。

      圖3 系統(tǒng)結(jié)構(gòu)圖

      為便于系統(tǒng)設(shè)計(jì)管理,根據(jù)聊天機(jī)器人功能需求和相關(guān)技術(shù),將聊天機(jī)器人分為人機(jī)交互、分詞、規(guī)則匹配、知識(shí)庫管理和用戶管理5個(gè)功能模塊。系統(tǒng)管理員通過用戶管理模塊為用戶分配用戶名和用戶權(quán)限;領(lǐng)域?qū)<依弥R(shí)管理模塊定期對(duì)記錄的未回答問題進(jìn)行解答,并更新到知識(shí)本體中;用戶通過人機(jī)交互模塊,與聊天機(jī)器人進(jìn)行對(duì)話,輸入所要查詢的知識(shí)或信息;系統(tǒng)將用戶請(qǐng)求通過分詞模塊進(jìn)行分詞,提取問題核心關(guān)鍵詞,并利用規(guī)則匹配模塊,得到問題最佳答案,返回給用戶,如果問題暫無答案,則將問題入庫,等待專家解答。

      5 系統(tǒng)實(shí)現(xiàn)

      系統(tǒng)實(shí)現(xiàn)主要用到的基礎(chǔ)軟件設(shè)計(jì)平臺(tái)有Java開發(fā)平臺(tái)Eclipse、本體設(shè)計(jì)平臺(tái)Protégé和數(shù)據(jù)庫平臺(tái)達(dá)夢(mèng)數(shù)據(jù)庫。根據(jù)本體構(gòu)建流程,結(jié)合維基百科知識(shí)結(jié)構(gòu)[6],構(gòu)建了氣象知識(shí)規(guī)則匹配庫,部分截圖如圖4所示。

      圖4 本體規(guī)則庫

      利用國產(chǎn)達(dá)夢(mèng)數(shù)據(jù)庫,建立數(shù)據(jù)表USER,用于存儲(chǔ)用戶權(quán)限及訪問流量信息,同時(shí)初始化問題反饋表QuestionList,記錄存儲(chǔ)系統(tǒng)暫未解答的用戶請(qǐng)求信息;基于開源信息檢索引擎Lucene工具包實(shí)現(xiàn)用戶請(qǐng)求的中文分詞[15]處理,按照規(guī)則匹配算法,完成了本體聊天機(jī)器人原型系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)。

      原型系統(tǒng)主界面如圖5所示。

      圖5所示,用戶登錄后,與聊天機(jī)器人進(jìn)行對(duì)話,咨詢“南京的氣候類型是什么?”,系統(tǒng)進(jìn)行規(guī)則匹配找到最佳答案并返回給用戶,快速地解決了用戶的知識(shí)需求。當(dāng)匹配不到問題答案時(shí),系統(tǒng)調(diào)用一般算法,給出通用性答案,如圖6所示。同時(shí)為便于規(guī)則庫的完善,對(duì)于未做解答的問題,系統(tǒng)存入數(shù)據(jù)庫,等待專家登錄進(jìn)行解答,如圖7所示。

      專家解答完畢后,系統(tǒng)進(jìn)行相關(guān)問題和答案的規(guī)則入庫,進(jìn)一步優(yōu)化完善規(guī)則庫。

      圖5 系統(tǒng)主界面

      圖6 系統(tǒng)調(diào)用一般算法

      圖7 問題解答界面

      6 結(jié)語

      聊天機(jī)器人經(jīng)過60多年的發(fā)展已日趨成熟,但聊天機(jī)器人的應(yīng)用才剛開始,人們對(duì)聊天機(jī)器人的定義也在不斷發(fā)展變化。特別是將聊天機(jī)器人應(yīng)用到心理咨詢、教育教學(xué)、電子商務(wù)訂單處理等領(lǐng)域,對(duì)機(jī)器人的要求越來越高[16]。

      本文結(jié)合聊天機(jī)器人的主動(dòng)式問答機(jī)制,利用本體的層次結(jié)構(gòu)構(gòu)建規(guī)則庫,設(shè)計(jì)并實(shí)現(xiàn)了基于本體的氣象知識(shí)聊天機(jī)器人。該機(jī)器人不僅會(huì)聊天,更是一個(gè)知識(shí)淵博的氣象專家。在保證知識(shí)獲取“量”的同時(shí),進(jìn)一步提高了知識(shí)獲取的快捷性和準(zhǔn)確性,為氣象知識(shí)共享提供了一個(gè)更加便捷的平臺(tái)。

      聊天機(jī)器人須具有結(jié)構(gòu)完善的規(guī)則庫,這對(duì)規(guī)則本體的構(gòu)建提出更高的要求。要使本體聊天機(jī)器人能夠推廣應(yīng)用到更廣泛的領(lǐng)域,必須進(jìn)一步完善、規(guī)范規(guī)則領(lǐng)域本體構(gòu)建方法,特別是研究設(shè)計(jì)規(guī)則本體的自動(dòng)構(gòu)建方法,將極大地促進(jìn)領(lǐng)域聊天機(jī)器人的推廣應(yīng)用。

      [1] 李冠林,顧大權(quán),侯太平,等.氣象信息主動(dòng)服務(wù)系統(tǒng)的實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2013,33(S1):109-111.

      [2] 管建和,甘劍峰.基于Lucene全文檢索引擎的應(yīng)用研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(2):489-491.

      [3] Zakos J, Capper L. CLIVE – An Artificially Intelligent Chat Robot for Conversational Language Practice[C]. Hellenic Conference on Artificial Intelligence: Theories, MODELS and Applications. Springer-Verlag, 2008:437-442.

      [4] 馮德虎.基于ALICE的研究生招生咨詢智能聊天機(jī)器人研究與實(shí)現(xiàn)[D].成都:西南交通大學(xué),2013:1-57.

      [5] 王曼,吳振忠.基于領(lǐng)域本體的語義搜索——帶權(quán)最短路徑方法[J].計(jì)算機(jī)與現(xiàn)代化,2013(9):1-7.

      [6] 王磊,顧大權(quán),侯太平,等.基于維基百科的氣象本體的自動(dòng)構(gòu)建[J].計(jì)算機(jī)與現(xiàn)代化,2014(6):129-131,136.

      [7] Wallace, Richard S. (2009). The anatomy of ALICE Parsing the Turing Test (pp. 181-210): Springer.

      [8] 杜小勇,李曼,王大治.語義Web與本體研究綜述[J].計(jì)算機(jī)應(yīng)用,2004, 24 (10):14-16,20.

      [9] 金鑫.面向Web信息資源的領(lǐng)域本體模型自動(dòng)構(gòu)建機(jī)制的研究[J].計(jì)算機(jī)科學(xué),2012,39(6):213-216.

      [10] Hwang M, Kong H, Kim P. The Design of the Ontology Retrieval System on the Web[C]. Advanced Communication Technology, 2006. Icact 2006. the, International Conference. 2006:1815-1818.

      [11] Vallet D, Fernández M, Castells P. An Ontology-Based Information Retrieval Model[M]. The Semantic Web: Research and Applications. Springer Berlin Heidelberg, 2005:103-110.

      [12] 王偉輝,耿國華,周明全.規(guī)則軟件系統(tǒng)模式匹配算法研究綜述[J].小型微型計(jì)算機(jī)系統(tǒng),2012,33(5):913-920.

      [13] 杜均,蔡之華,陳云亮,等.規(guī)則樹—柵格圖像分層次關(guān)聯(lián)規(guī)則提取方法[J].計(jì)算機(jī)工程,2005,31(11):85-87.

      [14] 武婉萍.網(wǎng)絡(luò)機(jī)器人的交互功能設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2012:1-76.

      [15] Huang Changning, Zhao Hai. Chinese word segmentation: A decade review[J]. Journal of Chinese Information Processing, 2007,21(3):8-20.

      [16] 李玉敏.電子商務(wù)訂單實(shí)時(shí)處理的軟件機(jī)器人實(shí)現(xiàn)[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,30(3):48-51.

      The Design and Application of Chat Robot Based on the Ontology

      Wang Lei Wei Yong Di Jianxun Yang Xiaolin

      (31008 Troop)

      According to the characteristics of internet searching technology in the professional field which has too much correlation useless information and need people to filter useful information manually, the paper summarizes the development and status quo of chat robot. On this basis, we introduce the ontology technology as the storage carrier of chat robot rule repository. Based on the tree structure of ontology, the paper designs the rule matching algorithm. Through the system planning and module dividing, we build a chat robot which can not only chat with people but also solve meteorological professional problems. The paper, as it were, promotes the development and application of chat robot in the professional field, and provides a more convenient domain knowledge acquiring and sharing platform.

      Chat Robot; Ontology; Rule Tree; Rule Matching Algorithm

      王磊,男,1990年生,碩士研究生,工程師,主要研究方向:語義檢索。E-mail:449644183@qq.com

      魏勇,男,1987年生,博士研究生,工程師,主要研究方向:人工智能。

      猜你喜歡
      聊天本體定義
      Abstracts and Key Words
      對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
      我就是不想跟你聊天了
      意林(2017年9期)2017-06-06 10:26:12
      敞開門聊天
      成功的定義
      山東青年(2016年1期)2016-02-28 14:25:25
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      修辭學(xué)的重大定義
      Care about the virtue moral education
      卷宗(2013年6期)2013-10-21 21:07:52
      山的定義
      教你正確用(十七)
      海外英語(2006年11期)2006-11-30 05:16:56
      华坪县| 丹凤县| 本溪| 保德县| 东至县| 北流市| 宜春市| 砀山县| 柳河县| 微山县| 丰台区| 许昌市| 武乡县| 柘城县| 志丹县| 宜宾县| 滨海县| 原阳县| 东城区| 惠东县| 茂名市| 循化| 天镇县| 循化| 米泉市| 竹溪县| 恩施市| 峡江县| 永康市| 洛扎县| 三亚市| 新郑市| 临泽县| 青岛市| 昌图县| 康保县| 东丽区| 苍南县| 炉霍县| 剑阁县| 潍坊市|