盧致亮 匡先進(jìn) 曾趙錦
【摘要】? ? 自然語言處理是IT技術(shù)重要的創(chuàng)新之一,本文針對(duì)電力客服系統(tǒng)的需求,結(jié)合自然語言處理技術(shù)討論了一種電力客服系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)過程。討論了系統(tǒng)構(gòu)建過程中涉及的實(shí)現(xiàn)模式、系統(tǒng)組件、核心算法等內(nèi)容。該系統(tǒng)以電力服務(wù)為知識(shí)庫(kù)數(shù)據(jù)源,利用自然語言處理技術(shù)進(jìn)行分詞及詞向量轉(zhuǎn)換,利用知識(shí)庫(kù)訓(xùn)練并構(gòu)建模型,最終完成電力智能客服系統(tǒng)的構(gòu)建,其運(yùn)行效果良好。
【關(guān)鍵詞】? ?自然語言處理? ? 智能問答? ? 電力服務(wù)
引言:
人工智能技術(shù)在飛速發(fā)展,并迅速應(yīng)用于各行各業(yè)。電力系統(tǒng)關(guān)系到國(guó)計(jì)民生,人工智能在電力系統(tǒng)中的應(yīng)用必將有效提升電力運(yùn)維的效率與安全。人工智能系統(tǒng)與電力系統(tǒng)的融合體現(xiàn)在諸多方面,本文以電力智能客服系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)為切入點(diǎn),將自然語言處理技術(shù)應(yīng)用于電力系統(tǒng)的自動(dòng)運(yùn)維,使電力系統(tǒng)的運(yùn)維向自動(dòng)化、智能化方向發(fā)展。
智能手機(jī)的普及讓用戶希望擁有更便捷的信息獲取方式和更人性化的人機(jī)交互體驗(yàn)。此背景下,我們進(jìn)行了電力客服系統(tǒng)的研究與開發(fā),在工單大數(shù)據(jù)技術(shù)的助力下,構(gòu)建了一個(gè)能夠快速吸收和利用已有知識(shí)的對(duì)話理解模型,對(duì)用戶的問題通過自然語言處理技術(shù)進(jìn)行分析,采用機(jī)器學(xué)習(xí)方法構(gòu)建和優(yōu)化問答模型,構(gòu)建出一個(gè)高效、準(zhǔn)確的智能問答系統(tǒng)。
本文組織如下,首先介紹了電力客服系統(tǒng)的研究意義,并對(duì)當(dāng)前國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行了分析;然后討論了相關(guān)系統(tǒng)組件、核心算法、自然語言處理方法;最后給出了電力智能客服系統(tǒng)模型的構(gòu)建流程。
一、研究現(xiàn)狀
智能問答系統(tǒng)可以定義為能與人進(jìn)行對(duì)話的應(yīng)用程序,即采用文字、語音來與計(jì)算機(jī)進(jìn)行交互的問答系統(tǒng)。問答系統(tǒng)的發(fā)展經(jīng)歷了漫長(zhǎng)的歷史。
1988年,Berkeley研發(fā)了聊天機(jī)器人UC[1],該系統(tǒng)通過自然語言交互界面為用戶使用系統(tǒng)提供幫助。此后延伸出多種類似系統(tǒng),如 YAP[2]用于電話信息查詢,CSIEC[2]則用于學(xué)習(xí)輔助。
國(guó)內(nèi),中科院于1998年構(gòu)建了第一個(gè)人機(jī)對(duì)話系統(tǒng)[3]。初期的問答系統(tǒng)常限定于某特定領(lǐng)域,結(jié)合知識(shí)庫(kù)和推理機(jī)而形成專家系統(tǒng)(ES)[5]。
在電力系統(tǒng)運(yùn)維方面,目前應(yīng)用于電力系統(tǒng)的方法有神經(jīng)網(wǎng)絡(luò)[4]、模糊集理論[6]等。神經(jīng)網(wǎng)絡(luò)具有良好分類性,被廣泛應(yīng)用于電力系統(tǒng)的監(jiān)測(cè)、診斷、實(shí)時(shí)控制、符合預(yù)測(cè)以及狀態(tài)評(píng)估等不同的領(lǐng)域[7]。模糊集則可完成傳統(tǒng)數(shù)學(xué)方法難以描述的模糊計(jì)算問題,目前已應(yīng)用于電力系統(tǒng)的系統(tǒng)規(guī)劃、模糊控制等方面[8],這些方法在構(gòu)建智能問答系統(tǒng)方面也具有較大的潛力。
當(dāng)前,越來越多的公司、研究機(jī)構(gòu)在進(jìn)行智能問答技術(shù)的研發(fā),如微軟、蘋果、劍橋大學(xué)等,工業(yè)界和學(xué)術(shù)界已產(chǎn)出一些比較成熟的智能問答系統(tǒng)。實(shí)際中,電力客服系統(tǒng)因其友好、便捷和及時(shí)的特點(diǎn)而迅速受到客戶的認(rèn)可。
三、系統(tǒng)架構(gòu)
電力客服系統(tǒng)是智能問答系統(tǒng)中的一種特殊應(yīng)用,該系統(tǒng)涉及自然語言處理、工單數(shù)據(jù)分析以及問答模型構(gòu)建,其關(guān)鍵算法涉及NLP的語義分析和情感分析。
3.1電力客服系統(tǒng)實(shí)現(xiàn)模式
問答模型分為兩類,一類通過遵循特定規(guī)則來生成答案;另一類則使用人工智能方法生成答案。
3.1.1基于規(guī)則的系統(tǒng)
該模式的標(biāo)準(zhǔn)結(jié)構(gòu)由人工智能標(biāo)記語言(AIML)構(gòu)建,其局限是只能理解其編碼范圍內(nèi)的問題,預(yù)定義的問答規(guī)則定義了客戶與系統(tǒng)對(duì)話的范圍,答案僅出現(xiàn)于匹配模式中。基于規(guī)則的系統(tǒng)更易構(gòu)建,因其使用簡(jiǎn)單的算法來理解用戶輸入并查詢相應(yīng)的答案,適用于系統(tǒng)中基礎(chǔ)知識(shí)的問答。
3.1.2基于機(jī)器學(xué)習(xí)的系統(tǒng)
該模型使用機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練,通過自然語言處理技術(shù)來理解特定問題并生成相應(yīng)的答案。系統(tǒng)開發(fā)時(shí)采用知識(shí)庫(kù)來存儲(chǔ)并描述系統(tǒng)的角色,用對(duì)話記錄進(jìn)行模型的反復(fù)訓(xùn)練,算法結(jié)合模型與新收到的話語自動(dòng)生成匹配答案。其特點(diǎn)是能理解自然語言,并可在對(duì)話過程中持續(xù)學(xué)習(xí)以提升其智能化水平。
3.2電力客服系統(tǒng)的組件
整個(gè)系統(tǒng)因涉及不同的異構(gòu)組件而變得復(fù)雜,其系統(tǒng)結(jié)構(gòu)取決于多種因素,如問答內(nèi)容的用例、領(lǐng)域以及系統(tǒng)類型等,系統(tǒng)的關(guān)鍵組件如下:
3.2.1問答系統(tǒng)
問答系統(tǒng)負(fù)責(zé)回答客戶的常見問題??蛻舻膯栴}由問答系統(tǒng)進(jìn)行解釋,答案則來自知識(shí)庫(kù)的匹配,知識(shí)庫(kù)的構(gòu)建可用手工訓(xùn)練或自動(dòng)訓(xùn)練方式。手動(dòng)訓(xùn)練需要領(lǐng)域?qū)<揖幹瞥R妴栴}列表并描述其答案,系統(tǒng)基于此列表來匹配近似問題并查詢得到相應(yīng)答案。自動(dòng)化訓(xùn)練則需要向系統(tǒng)傳遞訓(xùn)練數(shù)據(jù),如工單,知識(shí)庫(kù)由訓(xùn)練得到,問答引擎生成問題和答案的對(duì)應(yīng)列表并據(jù)此對(duì)問題自動(dòng)匹配其答案。
3.2.2自然語言處理
自然語言處理技術(shù)將用戶的消息上下文化,其作用是理解用戶表述的內(nèi)容,并將其轉(zhuǎn)換為計(jì)算機(jī)能識(shí)別和處理的信息。
NLP涵兩個(gè)部件,即意圖分類器和實(shí)體提取器。意圖分類器在輸入內(nèi)容和回答內(nèi)容之間構(gòu)建映射關(guān)系;實(shí)體提取器負(fù)責(zé)從用戶的輸入中識(shí)別關(guān)鍵字,幫助確定用戶的操作意圖。
NLP引擎還包含反饋機(jī)制和學(xué)習(xí)策略。反饋機(jī)制是用戶為系統(tǒng)提供的反饋信息,它可納入評(píng)價(jià)系統(tǒng)中,即用戶在對(duì)話結(jié)束時(shí)對(duì)交互系統(tǒng)進(jìn)行評(píng)分,以此激勵(lì)系統(tǒng)進(jìn)行改進(jìn)。學(xué)習(xí)策略是一種泛型學(xué)習(xí)框架,系統(tǒng)經(jīng)訓(xùn)練后可以在對(duì)話中創(chuàng)建更為通用的網(wǎng)絡(luò)模型。
3.2.3前端系統(tǒng)
前端系統(tǒng)是用戶與電力客服系統(tǒng)交互的系統(tǒng),它是面向客戶的系統(tǒng),如微信、門戶網(wǎng)站或移動(dòng)APP等。
3.2.4節(jié)點(diǎn)服務(wù)器/流量服務(wù)器
服務(wù)器接收用戶請(qǐng)求并將它路由至相應(yīng)組件,內(nèi)部組件的響應(yīng)通常流量服務(wù)器路由至前端系統(tǒng)。
3.2.5后端集成
電力客服系統(tǒng)可與現(xiàn)有的后端系統(tǒng)(CRM、數(shù)據(jù)庫(kù)、支付系統(tǒng)等)集成,以增強(qiáng)電力客服系統(tǒng)的整體功能。
3.3電力客服系統(tǒng)核心算法
電力客服系統(tǒng)可采用不同分類模型來工作,核心模塊包括自然語言理解和自然語言處理。
3.3.1算法模式
算法用于構(gòu)建分類器和創(chuàng)建問答模型,復(fù)雜結(jié)構(gòu)由多個(gè)問答模型組合迭代而成。神經(jīng)網(wǎng)絡(luò)用權(quán)重向量來連接輸入與輸出,如前所述,NLP處理輸入時(shí)每個(gè)句子都會(huì)被分解為單詞,每個(gè)單詞都會(huì)用作神經(jīng)網(wǎng)絡(luò)的輸入,通過訓(xùn)練數(shù)據(jù)的多次迭代計(jì)算其加權(quán)連接,每次計(jì)算都使答案更準(zhǔn)確。對(duì)于新輸入的句子,它的分詞會(huì)被計(jì)算頻次和特征,進(jìn)而進(jìn)行推斷,得分高者最有可能與輸入相關(guān)聯(lián),即為答案。
3.3.2自然語言理解
自然語言理解(NLU)通過分解查詢信息來幫助系統(tǒng)理解用戶請(qǐng)求。它有實(shí)體、意圖和上下文三方面內(nèi)容。
實(shí)體是系統(tǒng)從用戶查詢中提取的關(guān)鍵字,用以了解用戶的需求。意圖則有助于系統(tǒng)識(shí)別用戶輸入所對(duì)應(yīng)的操作。上下文用于關(guān)聯(lián)提問意圖,而舍棄對(duì)問題本身的分析和記錄。上下文對(duì)于NLU算法而言極其重要,若分析對(duì)話的歷史則需存儲(chǔ)對(duì)話中所有的問題,隨著數(shù)量的增加,分析過程變得異常復(fù)雜,使用上下文則可拋棄對(duì)對(duì)話歷史的存儲(chǔ)轉(zhuǎn)而記錄對(duì)話狀態(tài)。
3.3.3自然語言處理
自然語言處理(NLP)是將客戶的文本、語音轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)以篩選相關(guān)答案的過程。該過程涉及情感分析、標(biāo)記化、規(guī)范化和依賴解析等。
情感分析算法通過讀入實(shí)體來理解用戶的情感。標(biāo)記化是將一組單詞分成片段的過程,使其在語言上具有極強(qiáng)的語義征性。實(shí)體識(shí)別是模型需要查找的單詞類別,如產(chǎn)品名、用戶名或地址等。規(guī)范化是處理用戶輸入中常見錯(cuò)誤的過程,它使系統(tǒng)不會(huì)因?yàn)橛脩舻恼`輸入而誤導(dǎo)整個(gè)服務(wù)流程。依賴解析是在用戶輸入的文本中查找對(duì)象的主語、動(dòng)詞、名詞和常用短語的過程,由此找到用戶意圖的依賴關(guān)系。綜上,NLP將自然語言翻譯成特定模式的文本組合,通過該組合來映射最優(yōu)答案。
四、結(jié)束語
本文討論了基于自然語言處理的電力客服系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)方法。該系統(tǒng)從運(yùn)維的實(shí)際需求出發(fā),以提供良好的服務(wù)為目的,將自然語言處理技術(shù)應(yīng)用于電力運(yùn)維系統(tǒng)中客服問答系統(tǒng)的構(gòu)建。
實(shí)際中,電力客服系統(tǒng)為無限量的用戶提供大規(guī)模的實(shí)時(shí)連接并像人一樣與客戶交互,使客戶輕松獲得優(yōu)質(zhì)的服務(wù)和良好的體驗(yàn)。企業(yè)通過該系統(tǒng)可以高效地完成自動(dòng)運(yùn)維工作,從而節(jié)約資源和成本,其經(jīng)濟(jì)效益顯著。
參? 考? 文? 獻(xiàn)
[1] Robert Wilensky, David N. Chin, Marc Luria, James Martin, James Mayfield, and Dekai Wu. The Berkeley Unix Consultant project.Computational Linguistics, 14(4), 1988.
[2] Lovis C Wagner J Griesser V Michel PA Scherrer JR. Baud RH, Rassinoux AM. Knowledge sources for natural language processing.Proc AMIA Annu Fall Symp, 70(4), 1996.
[3]初敏. 人機(jī)對(duì)話系統(tǒng)工程. 中國(guó)科協(xié)青年學(xué)術(shù)年會(huì), 1998.
[4] Computing Machinery. Computing machinery and intelligence-am turing. Mind, 59(236):433, 1950.
[5] Buchanan B. G. and Heuristic DENDRAL. A program for generating expiator hypotheses in organic chemistry: Machine intelligence.Edinburgh: Edinburgh University Press, page 209, 1969.
[6] Lotfi A Zadeh. Fuzzy sets. In Fuzzy sets, fuzzy logic, and fuzzy systems: selected papers by Lotfi A Zadeh, pages 394–432. World Scientific, 1996.
[7]劉秀玉, 劉嶠, 王日見, 張少華. 一種基于模糊邏輯和神經(jīng)網(wǎng)絡(luò)的電力負(fù)荷預(yù)測(cè)方法. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版), 2001(01).
[8]嚴(yán)華, 吳捷, 馬志強(qiáng), 吳列鑫. 模糊集理論在電力系統(tǒng)短期負(fù)荷預(yù)測(cè)中的應(yīng). 電力系統(tǒng)自動(dòng)化, 2000(11).
通信作者:盧致亮,(1985.6- ),男,漢,江西省南康,大學(xué)本科,工程師,主要研究方向?yàn)殡娮有畔ⅰ?/p>