閆 碩,付麗琴,邢亞英,侯佳麗,馬 玲
(北京經(jīng)濟(jì)管理職業(yè)學(xué)院 人工智能學(xué)院,北京 100102)
隨著數(shù)字技術(shù)智能化的發(fā)展,目前智能客服已經(jīng)應(yīng)用到生產(chǎn)生活的多個(gè)領(lǐng)域[1]。但是由于不同的場(chǎng)景有不同的需求,并且針對(duì)的用戶群體特征也不同,因此特定領(lǐng)域的智能客服的系統(tǒng)設(shè)計(jì)需要更精細(xì)的研究[2-3]。
自2019 年國(guó)家首次提出對(duì)高職院校實(shí)施擴(kuò)招以來,高職院校擴(kuò)招規(guī)模逐年遞增,高校招生工作日益繁重。伴隨著招生咨詢?nèi)藬?shù)的激增,為了使有限的招生辦公室人力從簡(jiǎn)單的接聽電話的工作中解放出來,提升工作效率,減少學(xué)生或家長(zhǎng)在電話咨詢中的等待時(shí)間,建設(shè)一個(gè)智能客服系統(tǒng),通過智能客服的智能問答方式提升效率,降低招生工作的壓力迫在眉睫[4]。招生智能客服系統(tǒng)主要有以下幾個(gè)目標(biāo):一是代替人工在線開展服務(wù);二是增加機(jī)器人功能,實(shí)現(xiàn)招生相關(guān)問題回復(fù);三是建設(shè)知識(shí)庫,梳理和總結(jié)相關(guān)知識(shí);四是建設(shè)招生智能咨詢微信公眾號(hào),對(duì)招生相關(guān)問題進(jìn)行智能回復(fù)。其整體流程如圖1 所示。
圖1 整體流程圖
智能客服系統(tǒng)的核心技術(shù)包含語音識(shí)別、自然語言處理(Natural Language Processing,NLP)、語音合成、對(duì)話管理以及知識(shí)庫等。
語音識(shí)別技術(shù)是指自動(dòng)語音識(shí)別,也就是將語音信號(hào)處理成機(jī)器能夠讀取的內(nèi)容,過程包含語音特征提取、模式匹配及參考模式庫等3 個(gè)步驟。即通過模數(shù)轉(zhuǎn)換、量化降噪等方法,將輸入的語音信號(hào)進(jìn)行數(shù)據(jù)清洗,然后提取特征,并將其與已經(jīng)建立好的語音特征庫通過對(duì)比得到最優(yōu)的識(shí)別結(jié)果。語音識(shí)別技術(shù)是校園招生客服系統(tǒng)實(shí)現(xiàn)的技術(shù)基礎(chǔ)。利用語音識(shí)別技術(shù)使機(jī)器能夠?qū)⒄猩稍冇脩舻恼Z音數(shù)據(jù)實(shí)時(shí)識(shí)別成文本內(nèi)容,是校園招生客服系統(tǒng)的第一步工作。
自然語言處理是計(jì)算機(jī)模擬人與人之間進(jìn)行語言交互的過程,從而能夠使機(jī)器理解人類語言的過程。同時(shí)使機(jī)器能夠具備與人一樣的交流和寫作能力,生成一段自然語言文本。在校園招生客服系統(tǒng)中,機(jī)器利用自然語言處理技術(shù)對(duì)招生咨詢用戶的文本內(nèi)容進(jìn)行分析,從而更好地識(shí)別用戶的意圖。然后機(jī)器根據(jù)用戶意圖,結(jié)合知識(shí)庫內(nèi)容給出最佳的回復(fù)結(jié)果,當(dāng)前結(jié)果為文本數(shù)據(jù)。自然語言處理過程是校園招生客服系統(tǒng)的技術(shù)核心,如何使機(jī)器更好地識(shí)別用戶意圖并反饋?zhàn)罴呀Y(jié)果,是評(píng)判智能客服質(zhì)量好壞的直觀指標(biāo)。
語音合成是將文本內(nèi)容轉(zhuǎn)換為語音的過程。也就是將機(jī)器產(chǎn)生的或者從外輸入的文本數(shù)據(jù)變成人類口語表達(dá)的方式輸出的過程。在校園招生客服系統(tǒng)中,將機(jī)器反饋的最佳結(jié)果文本內(nèi)容轉(zhuǎn)化成用戶能夠直接聽懂的語音內(nèi)容,主要依賴語音合成技術(shù)。語音合成技術(shù)使機(jī)器能夠具備和人一樣能夠說話的功能,除了需要能夠?qū)⑽谋緝?nèi)容完成語音轉(zhuǎn)化,好的智能客服系統(tǒng)需要對(duì)語音的韻律、語氣等進(jìn)行優(yōu)化調(diào)試,使機(jī)器不僅從內(nèi)容更要從表達(dá)都更接近于真實(shí)的人類。
對(duì)話管理是模擬人機(jī)對(duì)話的全過程,并對(duì)過程進(jìn)行管理,主要包括以下幾點(diǎn)。首先是對(duì)對(duì)話狀態(tài)進(jìn)行維護(hù),實(shí)時(shí)對(duì)用戶前后時(shí)刻對(duì)話狀態(tài)和行為進(jìn)行記錄和更新;其次是對(duì)機(jī)器應(yīng)對(duì)進(jìn)行決策,也就是根據(jù)用戶的狀態(tài)和對(duì)話內(nèi)容確定下一步的機(jī)器行為;再次是后端交互,實(shí)時(shí)反饋決策結(jié)果,并生成文本信息;最后是提供期望,根據(jù)用戶的輸入信息,判斷用戶的期望,對(duì)用戶輸出符合期望的回復(fù),滿足用戶需求。此過程離不開訓(xùn)練師進(jìn)行對(duì)話維護(hù)、管理及訓(xùn)練。
知識(shí)庫主要存儲(chǔ)和管理學(xué)校各個(gè)方面的基本信息和學(xué)校歷屆招生所獲得的經(jīng)驗(yàn)知識(shí)。知識(shí)庫的好壞直接影響招生智能客服服務(wù)質(zhì)量的好壞,不僅需要專人進(jìn)行維護(hù)和積累,而且要求機(jī)器能夠結(jié)合用戶的信息反饋,自主更新和完善現(xiàn)有的知識(shí)庫。
知識(shí)庫主要用于檢索,是智能客服系統(tǒng)的數(shù)據(jù)核心模塊,需要詳盡數(shù)據(jù)庫的支持。在招生客服系統(tǒng)中,從學(xué)校到二級(jí)學(xué)院再到具體專業(yè)、從衣食住行到學(xué)習(xí)就業(yè)等等很多方面的問題都需要進(jìn)行完整的收集和整理,并且按照不同的渠道和方式進(jìn)行更加細(xì)致的定向分類。完善的知識(shí)庫系統(tǒng)直接關(guān)系到對(duì)話管理的實(shí)際運(yùn)行質(zhì)量,可以幫助招生咨詢的用戶直觀了解相關(guān)的信息,使對(duì)話更具人性化。
校園招生智能客服系統(tǒng)相對(duì)于傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,數(shù)據(jù)分析采用了大數(shù)據(jù)分析挖掘技術(shù)和自然語言處理等技術(shù)[5];業(yè)務(wù)應(yīng)用采用語音識(shí)別與語音合成等技術(shù)[6-7]。該系統(tǒng)進(jìn)行服務(wù)過程中的數(shù)據(jù)可以實(shí)現(xiàn)自動(dòng)采集,不需要人為統(tǒng)計(jì),并且依托強(qiáng)大的算力,對(duì)數(shù)據(jù)采集來源實(shí)現(xiàn)全覆蓋,保證數(shù)據(jù)完整性[8];利用語音對(duì)話實(shí)時(shí)轉(zhuǎn)文本,可以進(jìn)行語義分析,從而能夠快速定位問題,提升問答效率。
校園招生智能客服系統(tǒng)支持學(xué)校官網(wǎng)、學(xué)校官方微信公眾號(hào)、微信小程序等終端接入,整體體系架構(gòu)分為數(shù)據(jù)源、語音技術(shù)、控制管理、業(yè)務(wù)服務(wù)及前端接入共五層,如圖2 所示。
圖2 體系架構(gòu)
數(shù)據(jù)源層包含了多種類型的知識(shí)數(shù)據(jù),如對(duì)話數(shù)據(jù)、問答數(shù)據(jù)、知識(shí)等,并且包含了對(duì)話服務(wù)數(shù)據(jù)、人工坐席人員數(shù)據(jù)、系統(tǒng)統(tǒng)計(jì)數(shù)據(jù)、分析處理數(shù)據(jù)、配置管理數(shù)據(jù)以及服務(wù)評(píng)價(jià)數(shù)據(jù)等。數(shù)據(jù)源層的核心是專家知識(shí)庫。專家知識(shí)庫提供大量的學(xué)校各個(gè)學(xué)院、專業(yè)等系統(tǒng)知識(shí),支撐應(yīng)用層高效問答。
語音技術(shù)層用于用戶語音的識(shí)別、語義理解以及自然語言生成與回復(fù),包含語音識(shí)別技術(shù)、自然語言處理技術(shù)以及語音合成技術(shù)等,依賴于服務(wù)基礎(chǔ)層的能力,使應(yīng)用層能夠?qū)崿F(xiàn)最精準(zhǔn)、最高效的功能;將招生咨詢用戶的語音輸入轉(zhuǎn)成文本,并通過分詞、標(biāo)注、句法分析等自然語言處理技術(shù)實(shí)現(xiàn)對(duì)用戶語義的理解。同時(shí),語音技術(shù)層根據(jù)用戶語義從專家知識(shí)庫中匹配最佳話術(shù),并通過語音合成技術(shù)將其轉(zhuǎn)化為語音回復(fù)。
控制管理層用于對(duì)話管理以及在進(jìn)行語義分析之后進(jìn)行與專家知識(shí)庫的匹配。招生咨詢中,用戶的交流不是單次的問答,經(jīng)常是經(jīng)過多輪的交互問答,因此需要通過控制管理層不斷理解用戶的真實(shí)意圖,從而在專家?guī)熘姓业脚c用戶真實(shí)意圖最相符的最優(yōu)話術(shù)。
業(yè)務(wù)服務(wù)層直接面向招生咨詢用戶,包含了在線客服、智能語音客服以及運(yùn)營(yíng)分析等在內(nèi)的應(yīng)用,同時(shí)可以實(shí)現(xiàn)系統(tǒng)管理和統(tǒng)一門戶,主要有自助服務(wù)和客服服務(wù)。自助服務(wù)是用戶進(jìn)入時(shí)的第一層服務(wù)方式,自動(dòng)識(shí)別用戶的問題和需求,匹配最佳話術(shù),并進(jìn)行語音回復(fù);當(dāng)自助服務(wù)沒辦法解決用戶問題或者用戶自主選擇人工服務(wù)時(shí),則接入人工服務(wù)。
前端接入層直接對(duì)接云平臺(tái)和第三方入口,提供多種途徑的客服入口,以方便不同的用戶進(jìn)行招生咨詢;同時(shí),為方便管理和維護(hù),提供運(yùn)營(yíng)分析和平臺(tái)后臺(tái)管理系統(tǒng)。
本文基于訊飛開放平臺(tái)進(jìn)行校園招生智能語音客服系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。訊飛開放平臺(tái)是科大訊飛提供的以語音交互為核心的人工智能開放平臺(tái),包括語音識(shí)別、自然語言處理及語音合成等核心技術(shù)模塊。
用戶進(jìn)行招生咨詢時(shí),校園招生智能語音客服系統(tǒng)調(diào)用語音識(shí)別模塊,將用戶語音識(shí)別成文本數(shù)據(jù),然后調(diào)用自然語言處理模塊對(duì)文本數(shù)據(jù)進(jìn)行處理,識(shí)別用戶意圖;根據(jù)用戶意圖結(jié)合知識(shí)庫得到最佳回復(fù)結(jié)果,再次調(diào)用語音合成模塊,將最佳回復(fù)結(jié)果轉(zhuǎn)化成語音回復(fù)用戶。該系統(tǒng)支持多輪識(shí)別和交互,并支持轉(zhuǎn)人工等功能,以使用戶得到滿意的咨詢體驗(yàn),同時(shí)降低招生工作人員的工作負(fù)擔(dān)。部分人機(jī)交互界面如圖3 所示。
圖3 部分人機(jī)交互平臺(tái)實(shí)現(xiàn)界面
系統(tǒng)搭建完成后,進(jìn)行電話測(cè)試,并將語音交互結(jié)果進(jìn)行實(shí)時(shí)轉(zhuǎn)寫,部分測(cè)試情況如圖4 所示。
圖4 語音交互轉(zhuǎn)寫測(cè)試
系統(tǒng)完成后進(jìn)行訓(xùn)練調(diào)試,根據(jù)測(cè)試結(jié)果對(duì)系統(tǒng)進(jìn)行相應(yīng)的優(yōu)化,并進(jìn)一步完善知識(shí)庫。最后,由40 人評(píng)測(cè)小組分別對(duì)系統(tǒng)性能進(jìn)行了全面的測(cè)試,總測(cè)試通話2 000 次,人機(jī)交互10 000 多輪,得到性能結(jié)果如表1 所示。
表1 性能測(cè)試結(jié)果
基于智能語音的校園招生智能客服系統(tǒng)將智能語音、自然語言處理等多種前沿技術(shù)相結(jié)合并應(yīng)用在校園招生服務(wù)業(yè)務(wù)中,有效地降低了學(xué)校招生工作的強(qiáng)度和難度,提升了整個(gè)招生咨詢過程的效率和用戶體驗(yàn)。