錢(qián)春陽(yáng)
摘要:針對(duì)目前智慧校園中的各業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)孤島,以及訪問(wèn)缺乏統(tǒng)一平臺(tái)入口的問(wèn)題,提出了在移動(dòng)互聯(lián)網(wǎng)下使用智能聊天技術(shù)借助微信構(gòu)建智慧校園信息平臺(tái)。該系統(tǒng)使用基于語(yǔ)義分析的關(guān)鍵詞提取技術(shù)構(gòu)建聊天過(guò)程,使智慧校園數(shù)據(jù)信息的獲取更加的智能化和友好化。
關(guān)鍵詞:智能聊天;智慧校園;微信;語(yǔ)義分析;關(guān)鍵詞提取
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1009-3044(2018)11-0218-02
1 概述
隨著當(dāng)前信息化技術(shù)的發(fā)展,高校的信息化水平也逐漸提升,智慧校園建設(shè)也在各大專(zhuān)院校陸續(xù)展開(kāi)。各種信息化數(shù)據(jù)系統(tǒng)是智慧校園構(gòu)建中重要的組成部分,包括OA系統(tǒng)、教務(wù)系統(tǒng)、科研系統(tǒng)、郵件系統(tǒng)、學(xué)生信息系統(tǒng)以及校園內(nèi)的各種論壇平臺(tái)等,各院系部門(mén)之間也重復(fù)建設(shè)各種業(yè)務(wù)系統(tǒng)。這種情況的出現(xiàn)會(huì)導(dǎo)致各業(yè)務(wù)系統(tǒng)之間彼此信息孤立,給使用者帶來(lái)諸多不便。
同時(shí),隨著智能化終端的大規(guī)模普及,以及類(lèi)似于微信等即時(shí)通訊軟件的廣泛使用,利用先進(jìn)的智能聊天技術(shù)來(lái)構(gòu)建智慧校園信息平臺(tái)就顯得意義非常重大,該平臺(tái)可以讓校園里的使用者很方便地通過(guò)聊天技術(shù)獲取各種數(shù)據(jù),讓移動(dòng)終端成為智慧校園數(shù)據(jù)信息的入口,也有助于解決校園中各業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)孤島問(wèn)題。
2 智能聊天工具的選擇
目前隨著互聯(lián)網(wǎng)的發(fā)展,聊天入口有很多種實(shí)現(xiàn)方式,可以借助實(shí)體機(jī)器人實(shí)現(xiàn)人機(jī)對(duì)話的智能聊天方式,也可以借助即時(shí)通訊軟件,譬如QQ聊天或者微信公眾平臺(tái)的方式去實(shí)現(xiàn)。鑒于目前校園里的微信的普及,該智能聊天系統(tǒng)采用微信公眾號(hào)實(shí)現(xiàn)聊天功能。采用微信公眾號(hào)作為聊天工具有以下幾個(gè)優(yōu)點(diǎn):一、微信用戶(hù)龐大,校園里的教師,學(xué)生都是其使用者,不需要推廣,并且采用微信公眾號(hào)操作簡(jiǎn)單方便,容易上手。二、微信擁有比較完備的API文檔,支持各種系統(tǒng)的接入功能,對(duì)于系統(tǒng)的開(kāi)發(fā)更加方便,而且該智能聊天系統(tǒng)采用的圖靈機(jī)器人也支持微信接口的接入,具備豐富的文檔,便于系統(tǒng)代碼的編寫(xiě)[1]。
3智能聊天過(guò)程設(shè)計(jì)
3.1聊天數(shù)據(jù)信息的分類(lèi)
在聊天過(guò)程中,為了增加聊天的智能性與友好性,現(xiàn)將聊天數(shù)據(jù)信息分為兩類(lèi),一種是無(wú)效數(shù)據(jù)信息,一種是有效數(shù)據(jù)信息。基于這兩種不同的聊天數(shù)據(jù)信息,采用不同的處理方法。
1)無(wú)效數(shù)據(jù)信息
無(wú)效數(shù)據(jù)信息就是指在智能聊天過(guò)程中,產(chǎn)生的聊天數(shù)據(jù)經(jīng)過(guò)語(yǔ)意識(shí)別后,不會(huì)調(diào)用智慧校園中業(yè)務(wù)系統(tǒng)的非有效數(shù)據(jù)信息。
為什么會(huì)產(chǎn)生無(wú)效數(shù)據(jù)?因?yàn)樵谡麄€(gè)智能聊天過(guò)程中,聊天信息是不能進(jìn)行有效控制與屏蔽的,允許聊天數(shù)據(jù)產(chǎn)生者輸入一些與智慧校園業(yè)務(wù)無(wú)關(guān)的信息。但是這部分無(wú)關(guān)的數(shù)據(jù)又不能因?yàn)槠錁I(yè)務(wù)無(wú)關(guān)性而置之不理,或者采用極端的屏蔽行為,這就是無(wú)效數(shù)據(jù)信息產(chǎn)生的原因。面對(duì)無(wú)效數(shù)據(jù)信息,系統(tǒng)借助智能聊天工具-圖靈機(jī)器人。
圖靈機(jī)器人是個(gè)性化機(jī)器人的開(kāi)放平臺(tái),可以為使用者提供智能聊天的API接口。圖靈機(jī)器人基于DeepQA深度問(wèn)答技術(shù),對(duì)中文的識(shí)別準(zhǔn)確率高達(dá)90%,是目前中文語(yǔ)境下智能化程度最高的機(jī)器人。圖靈機(jī)器人的核心功能之一就是智能對(duì)話。智能對(duì)話是指,圖靈機(jī)器人可賦予軟硬件產(chǎn)品中文自然語(yǔ)言交互的能力。在當(dāng)前的聊天系統(tǒng)中我們可使用圖靈機(jī)器人的接口來(lái)處理無(wú)效數(shù)據(jù)信息的對(duì)話問(wèn)題,讓聊天系統(tǒng)更加的智能化,友好化。
2)有效數(shù)據(jù)信息
在智能聊天系統(tǒng)的構(gòu)建中,除了無(wú)效數(shù)據(jù)信息就是有效數(shù)據(jù)信息,有效數(shù)據(jù)信息主要通過(guò)語(yǔ)義識(shí)別去分析聊天內(nèi)容,并且將有用的數(shù)據(jù)提取出來(lái),通過(guò)接口傳遞到后臺(tái)業(yè)務(wù)系統(tǒng),查詢(xún)或者處理所需的數(shù)據(jù)。
對(duì)于有效數(shù)據(jù)信息,智能聊天系統(tǒng)采用語(yǔ)義分析方法的關(guān)鍵詞提取去獲取有用的關(guān)鍵詞,然后與已存入的關(guān)鍵詞進(jìn)行匹配,如果匹配成功,就去查詢(xún)對(duì)應(yīng)的接口以獲取業(yè)務(wù)數(shù)據(jù)。該處理方法借助語(yǔ)義分析法的關(guān)鍵詞提取算法來(lái)完成整個(gè)聊天過(guò)程。
3.2 基于語(yǔ)義分析的關(guān)鍵詞提取方案
目前關(guān)鍵詞提取方案有很多,但是主要有三類(lèi):1)基于統(tǒng)計(jì)特征,如詞語(yǔ)出現(xiàn)頻度的統(tǒng)計(jì);2)基于詞語(yǔ)網(wǎng)絡(luò),根據(jù)相應(yīng)的規(guī)則講文字轉(zhuǎn)換為詞語(yǔ)網(wǎng)絡(luò),利用詞語(yǔ)網(wǎng)絡(luò)計(jì)算的關(guān)鍵度;3)基于語(yǔ)義,根據(jù)文字的語(yǔ)義特征提取關(guān)鍵詞或者轉(zhuǎn)換關(guān)鍵詞。在對(duì)應(yīng)當(dāng)前的智能聊天系統(tǒng)中,很明顯第三種基于語(yǔ)義特征更適合我們的關(guān)鍵詞提取方案。本系統(tǒng)設(shè)計(jì)中,在智能聊天過(guò)程中選擇采用了基于語(yǔ)義分析的關(guān)鍵詞提取[2]。
該方案的關(guān)鍵在于可以將對(duì)應(yīng)的關(guān)鍵詞根據(jù)相似語(yǔ)義轉(zhuǎn)換成系統(tǒng)對(duì)應(yīng)的關(guān)鍵詞以便于業(yè)務(wù)接口的數(shù)據(jù)傳遞。
例如:學(xué)生小A通過(guò)智能聊天系統(tǒng)查詢(xún)自己的期末考試成績(jī),智能聊天系統(tǒng)簡(jiǎn)稱(chēng)小智。對(duì)話如下:
小A:你好
小智:你好(圖靈機(jī)器人)
小A:我的語(yǔ)文課本在哪里?(此話是無(wú)效數(shù)據(jù)信息,但是有“語(yǔ)文”等關(guān)鍵詞,需要通過(guò)語(yǔ)義分析進(jìn)行判斷)
語(yǔ)義分析過(guò)程:獲取關(guān)鍵詞:語(yǔ)文、課本、在哪里。智能聊天系統(tǒng)對(duì)這幾個(gè)關(guān)鍵詞進(jìn)行分析,迅速將當(dāng)前關(guān)鍵詞與在系統(tǒng)中的關(guān)鍵詞進(jìn)行匹配,如果系統(tǒng)中能夠匹配上,或者匹配多個(gè),則將結(jié)果羅列出來(lái)。假設(shè)系統(tǒng)中匹配上“語(yǔ)文”關(guān)鍵詞,有“語(yǔ)文期末成績(jī)”,“語(yǔ)文期中成績(jī)”兩個(gè)接口信息,于是將兩個(gè)接口名稱(chēng)都返回至聊天窗口。讓小A選擇:(1)語(yǔ)文期末成績(jī)(2)語(yǔ)文期中成績(jī)(3)都不是,如果小A選擇(1)或者(2)則將對(duì)應(yīng)的學(xué)期信息返回到聊天窗口讓小A進(jìn)一步選擇學(xué)期,從而獲取信息。如果小A選擇(3)則自動(dòng)跳轉(zhuǎn)至圖靈機(jī)器人進(jìn)行回答。
小A:我想知道我這學(xué)期的語(yǔ)文期末成績(jī)
語(yǔ)義分析過(guò)程:獲取關(guān)鍵詞:知道、這學(xué)期、語(yǔ)文、期末、成績(jī)。智能聊天系統(tǒng)對(duì)這幾個(gè)關(guān)鍵詞進(jìn)行分析,分為兩類(lèi):
a.語(yǔ)文、期末、成績(jī),這三個(gè)關(guān)鍵詞可以從系統(tǒng)中匹配。
b.知道、這學(xué)期,這兩個(gè)關(guān)鍵詞無(wú)法從系統(tǒng)中進(jìn)行匹配。
此時(shí),智能聊天系統(tǒng)迅速與系統(tǒng)中的關(guān)鍵詞進(jìn)行匹配,于是匹配上“語(yǔ)文期末成績(jī)”這個(gè)接口,但是僅僅從“語(yǔ)文期末成績(jī)”并不能通過(guò)接口獲取對(duì)應(yīng)數(shù)據(jù),因?yàn)檫€有兩個(gè)關(guān)鍵詞沒(méi)有使用,此時(shí)通過(guò)語(yǔ)義分析對(duì)關(guān)鍵詞進(jìn)行轉(zhuǎn)換,用“知道”去匹配系統(tǒng)中的同義關(guān)鍵詞并轉(zhuǎn)換,可轉(zhuǎn)換成“查詢(xún)”關(guān)鍵詞,用“這學(xué)期”去匹配系統(tǒng)中的同義關(guān)鍵詞并進(jìn)行轉(zhuǎn)換,可轉(zhuǎn)換成當(dāng)前學(xué)期的數(shù)字信息,譬如201801,即2018年第1學(xué)期,也就是教學(xué)中的2017-2018第2學(xué)期。
于是,小A的聊天信息轉(zhuǎn)換成:查詢(xún)201801學(xué)期的語(yǔ)文期末分?jǐn)?shù)。
然后再根據(jù)當(dāng)前微信號(hào)在系統(tǒng)中注冊(cè)的信息,獲取學(xué)生學(xué)號(hào)。傳至后臺(tái)就是查詢(xún)學(xué)號(hào)為*****201801學(xué)期的語(yǔ)文期末分?jǐn)?shù)。根據(jù)對(duì)應(yīng)的接口,將查詢(xún)的信息反饋到小A的微信聊天客戶(hù)端。至此通過(guò)智能聊天系統(tǒng)整個(gè)查詢(xún)過(guò)程結(jié)束[3,4]。
從以上的聊天對(duì)話中可知,如果想要準(zhǔn)確迅速通過(guò)智能聊天系統(tǒng)獲取有效的信息,需要準(zhǔn)確的傳達(dá)聊天信息,避免系統(tǒng)返回一些無(wú)效信息,從而降低查詢(xún)效率。
4 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
智能聊天系統(tǒng)在智慧校園中包含兩部分:一是移動(dòng)端的微信公眾號(hào)、另一個(gè)是后臺(tái)管理系統(tǒng)。后臺(tái)管理系統(tǒng)采用Java語(yǔ)言編寫(xiě)的B/S模式的管理系統(tǒng),整個(gè)系統(tǒng)基于MVC開(kāi)發(fā)模式,利用當(dāng)前流行的SSM(SpringMVC+Spring+Mybatis)框架進(jìn)行編寫(xiě),頁(yè)面采用Bootstrap前端框架,數(shù)據(jù)庫(kù)采用mysql。聊天工具借助微信公眾號(hào),同時(shí)利用圖靈機(jī)器人與基于語(yǔ)義分析的智能聊天技術(shù)完成聊天過(guò)程的設(shè)計(jì)。
4.1 聊天系統(tǒng)主流程設(shè)計(jì)
1)用戶(hù)通過(guò)微信工具進(jìn)行聊天,聊天內(nèi)容通過(guò)語(yǔ)義分析平臺(tái)判斷聊天信息是否有效,如果是有效信息則轉(zhuǎn)入智慧校園平臺(tái)接口,去訪問(wèn)各業(yè)務(wù)系統(tǒng),并將查詢(xún)信息返回給微信客戶(hù)端。
2)如果判斷是無(wú)效信息,則直接通過(guò)圖靈機(jī)器人響應(yīng)到微信客戶(hù)端。
3)如果無(wú)法判斷,則直接進(jìn)行匹配展現(xiàn)類(lèi)似接口信息列表,讓用戶(hù)進(jìn)行選擇,如果都不是,則轉(zhuǎn)入圖靈機(jī)器人,如果選擇其一則轉(zhuǎn)入智慧校園平臺(tái)(接口)去訪問(wèn)各業(yè)務(wù)系統(tǒng),并將查詢(xún)信息返回給微信客戶(hù)端[5]。
4.2 模塊的設(shè)計(jì)
基于智能聊天技術(shù)的智慧校園信息平臺(tái)從用戶(hù)的角色與所對(duì)應(yīng)服務(wù)的角度考慮功能模塊的設(shè)計(jì)。主要包括四大功能模塊:用戶(hù)管理、語(yǔ)義分析算法、關(guān)鍵詞管理、接口管理。
用戶(hù)管理:該模塊包含用戶(hù)名管理、角色管理,權(quán)限管理等。需要考慮用戶(hù)注冊(cè)信息與數(shù)據(jù)庫(kù)的用戶(hù)信息是否對(duì)應(yīng),以及所映射的功能權(quán)限分配。
語(yǔ)義分析算法:該模塊功能是對(duì)輸入的聊天信息進(jìn)行判斷,判斷其是有效信息或者無(wú)效信息,還是無(wú)法判斷。主要算法思想是對(duì)所輸入信息根據(jù)語(yǔ)義進(jìn)行分析轉(zhuǎn)換,如果系統(tǒng)中不能對(duì)相關(guān)的關(guān)鍵詞進(jìn)行匹配,需要根據(jù)語(yǔ)義轉(zhuǎn)換對(duì)應(yīng)的關(guān)鍵詞以利于接口的數(shù)據(jù)傳遞。
關(guān)鍵詞管理:該模塊包含接口關(guān)鍵詞信息以及近義詞轉(zhuǎn)換信息。接口關(guān)鍵詞是指我們預(yù)先設(shè)置的接口信息關(guān)鍵詞,用來(lái)匹配用戶(hù)輸入的聊天信息。近義詞轉(zhuǎn)換信息是指對(duì)無(wú)法識(shí)別的關(guān)鍵詞通過(guò)近義詞轉(zhuǎn)換成系統(tǒng)可以識(shí)別的關(guān)鍵詞。
接口管理:該模塊的功能是將處理過(guò)的聊天信息傳遞給各業(yè)務(wù)系統(tǒng)。由于智慧校園平臺(tái)接入較多子系統(tǒng),所以需要對(duì)每個(gè)子系統(tǒng)對(duì)應(yīng)的接口進(jìn)行管理。整個(gè)功能模塊如圖2:
4.3 基于智能聊天技術(shù)的智慧校園平臺(tái)效果分析
由于微信的普及以及各接口文檔較為齊全,微信與圖靈機(jī)器人的數(shù)據(jù)傳遞,以及微信與后臺(tái)管理的信息傳遞均較為理想。對(duì)于表述較為精確的聊天信息則可以迅速獲取后臺(tái)數(shù)據(jù)。但是語(yǔ)義分析平臺(tái)對(duì)復(fù)雜語(yǔ)義的聊天信息判斷則較為困難,很多復(fù)雜語(yǔ)義和有效信息、無(wú)效信息的轉(zhuǎn)換不夠準(zhǔn)確,還有一些復(fù)雜語(yǔ)義實(shí)際上是無(wú)效信息,則經(jīng)過(guò)語(yǔ)義平臺(tái)的判斷呈現(xiàn)較多接口的可能,實(shí)際上是降低了平臺(tái)的智能化效果[6][7]。
5 總結(jié)
基于智能聊天技術(shù)的智慧校園信息平臺(tái)基本上可以滿(mǎn)足用戶(hù)通過(guò)微信聊天方式對(duì)校園業(yè)務(wù)數(shù)據(jù)的獲取,但是在語(yǔ)義分析的關(guān)鍵詞匹配與近義詞轉(zhuǎn)換上需要進(jìn)一步的研究,后期的研究方向上考慮在語(yǔ)義分析上加入人工神經(jīng)網(wǎng)絡(luò)的自適應(yīng)學(xué)習(xí)模型進(jìn)行近義詞的轉(zhuǎn)換,以提高語(yǔ)義分析的精確度,更好的為智慧校園的建設(shè)與發(fā)展服務(wù)。
參考文獻(xiàn):
[1] 楊晨.利用微信平臺(tái)開(kāi)發(fā)教學(xué)支持服務(wù)系統(tǒng)的技術(shù)實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2017(8):103-104.
[2] 王立霞,淮曉永.基于語(yǔ)義的中文文本關(guān)鍵詞提取算法[J].計(jì)算機(jī)工程,2012(1):1-4.
[3] 徐杰.基于微信平臺(tái)的財(cái)務(wù)代理系統(tǒng)設(shè)計(jì)[J].會(huì)計(jì)信息化,2017(1):1-4.
[4] 趙玲玲.基于 Android 的智能聊天機(jī)器人設(shè)計(jì)[J].現(xiàn)代計(jì)算機(jī),2016(25):79-82.
[5] 姚飛.清華智能聊天機(jī)器人“小圖”的移動(dòng)應(yīng)用[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2014(Z1):120-126.
[6] 鄧媛.高校圖書(shū)館微信資源共建系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].圖書(shū)館學(xué)研究,2014(10):41-47.
[7] 騰訊. 微信公眾平臺(tái)開(kāi)發(fā)者文檔[EB/OL].http://mp.weixin.qq.com