李 飛,丁常坤,王江淮,時代紅
(科大國創(chuàng)云網(wǎng)科技有限公司,安徽 合肥 230088)
當今社會隨著語音技術的進步,語音導航技術已經(jīng)成為運營商客服中心的主流配置。如何有效地檢測智能語音流程的質量已經(jīng)成為困擾運營商的一個問題。通過傳統(tǒng)手段:人工撥測+文本交互測試的方式,存在人工測試費時費力,效率低下;無法及時發(fā)現(xiàn)流程故障;文本測試無法模擬真實環(huán)境;業(yè)務流程覆蓋面窄等缺點。亟需重點研究覆蓋全業(yè)務流程的自動撥測方法,實現(xiàn)替代人工撥測,對智能客服系統(tǒng)語音域運行質量、業(yè)務準確性進行主動監(jiān)控。充分發(fā)掘自動撥測潛力,建立語音域高效運維機制,支撐業(yè)務運營人員監(jiān)控、測試、優(yōu)化重點高頻流程,提高智能客服系統(tǒng)的適用性與穩(wěn)定性。
現(xiàn)有技術的缺陷和不足:
(1)原有手段測試耗時費力、效率低;
(2)業(yè)務流程環(huán)節(jié)種類覆蓋面窄;
(3)流程異常故障發(fā)現(xiàn)不及時;
(4)系統(tǒng)運行分析無測試數(shù)據(jù)支撐。
一種智能語音客服自動撥測方法是基于MRCP框架、語音引擎實現(xiàn)實時語音流的轉寫,結合NLP(自然語言處理)技術實現(xiàn)意圖識別,模擬人工實現(xiàn)智能語音助手全流程的自動撥測方法。
呼叫中心外呼方式大致分為:手動抽測、文本檢測、自動語音撥測等方式。
這種模式的要點主要是通過人工選取一部分典型的號碼,針對不同的業(yè)務流程進行抽檢的方式進行撥測,該種方式主要存在的問題是重復性的勞動,無法做到全面的撥測,有時不能真正發(fā)現(xiàn)問題,撥測的結果未能完整記錄。
通過質檢的方式將客戶與智能語音客服對話錄音進行轉譯分析,由結果分析問題。該種方式最大的問題是受到語音質量及轉譯質量的限制,且該種方式屬于事后質檢,在發(fā)現(xiàn)問題上存在延后、不及時等問題。
這種模式通過建設一套自動化的方法模擬人工與智能語音對話,模擬人工常見的業(yè)務撥測行為,并對整個撥測過程和結果進行記錄,由分析平臺實時對撥測結果進行分析,如發(fā)現(xiàn)問題則根據(jù)告警規(guī)則進行告警通知,該種方法的優(yōu)勢是簡單直觀、無需人員參與,可靈活地設置撥測的時間段,告警方式多樣化,發(fā)現(xiàn)問題及時性高。
自動語音撥測的實施方式、原理和主要流程如圖1所示。
圖1 自動語音撥測實現(xiàn)流程圖
(1)“傻瓜式”定制撥測業(yè)務流程:系統(tǒng)升級提供表單引導式進行定制撥測業(yè)務,由平臺進行轉換為撥測流程,實現(xiàn)運營人員自主配置撥測業(yè)務流程目的。
(2)撥測頻次、時間段靈活設置:對于同一個導航業(yè)務流程,白天和晚間可能有差異,月初和月末可能有差異。對于運營人員來說不同時間的關注點也不一樣,對撥測任務的撥測頻次以及分時段撥測可配置,能夠更加靈活適應撥測業(yè)務時間段差異性。
(3)根據(jù)閥值制定告警級別:系統(tǒng)支持告警級別、告警內(nèi)容、告警號碼等內(nèi)容的可配置,支持根據(jù)不同的告警等級自動選擇通過短信或電話形式進行告警。根據(jù)實際指標值與設置的指標閾值比較,區(qū)分緊急及一般監(jiān)控告警。
(4)應用場景說明
按鍵IVR:監(jiān)控IVR按鍵后客服熱線平臺返回結果的時延情況、返回結果的準確性情況、是否能按設置好的IVR路徑進入到相應的子階段、按鍵后客服熱線平臺拒識場景等。
智能語音客服:模擬用戶的問法驗證能否返回正確的識別結果、智能客服平臺的接入時延、智能客服平臺的識別返回時延、智能客服平臺人機交互的流程是否正常、智能客服平臺對用戶問法的拒識、語速、口音等場景。
MRCP(Media Resource Control Protocol)是媒體資源控制協(xié)議英文全稱。MRCP協(xié)議是針對媒體資源和IP網(wǎng)絡起草的目前使用的標準協(xié)議。它的主要目的是對基于網(wǎng)絡的媒體處理資源(語音識別,語音合成),提供一個標準的、一致的,并且靈活的接口。當然,現(xiàn)在的MRCP版本已經(jīng)進行了升級,特別是MRCP v2以后,更多的是應用場景使用在了基于IP的語音通信中。簡單來說,MRCP協(xié)議借助其他協(xié)議(RTSP/SIP)創(chuàng)建一個控制會話來實現(xiàn)媒體資源服務器端和客戶端之間的控制。準確地說,MRCP是一種框架,也是一種協(xié)議。MRCP的框架定義了各種網(wǎng)絡要素和它們的關系,并且也設定了在MRCP中其他協(xié)議之間的會話管理和媒體處理等關系(例如SIP和RTP)。MRCP協(xié)議本身也提供了對媒體源的控制機制,例如控制語音識別和語音合成等。所以通常環(huán)境下,我們?yōu)榱朔奖?,稱之為MRCP協(xié)議。
MRCP的設計目的是支持客戶端對服務器端發(fā)起一個請求,設定一個在網(wǎng)絡中部署的媒體資源。MRCP的主要目的在于語音處理資源的處理,這些語音處理資源包括:語音識別,語音合成,語音錄音和講話人的認證和確認。MRCP借用了SIP協(xié)議來支持MRCP的處理流程,SIP可以使用SIP URL通過網(wǎng)絡來支持MRCP客戶端來獲取媒體資源,并且可以查詢獲取到媒體類型和其支持能力。它一旦獲取到正確的媒體資源服務器信息,SIP將會創(chuàng)建2個通信管道,一個是用來支持媒體會話,它支持發(fā)送或接收語音數(shù)據(jù)。這些數(shù)據(jù)可能是從媒體資源服務器發(fā)出也可能是來自于媒體資源服務器。另外一個管道是控制會話,它用來支持MRCP客戶端和媒體資源服務器之間的請求通信,從服務器端返回響應消息和事件。這里,MRCP協(xié)議是運行在控制會話之上。如圖2所示展示了一個基本的MRCP框架。
媒體資源服務器端也同樣包括了MRCP協(xié)議棧和SIP協(xié)議棧。服務器端的MRCP執(zhí)行的是服務器端的MRCP協(xié)議棧,并且對MRCP客戶端的請求做出響應,生成事件。如圖2所示,服務器端包括了各種媒體資源,例如語音識別,合成等引擎。當客戶端請求多個資源時,這些資源可以共享同一媒體會話或支持針對每個媒體資源的專有會話。圖3比較清晰地解釋了上面的架構示例。
圖2 MRCP框架圖
圖3 MRCP交互圖
MRCP充分地利用了SIP協(xié)議的優(yōu)勢,非常完美地解決了管理媒體和控制會話的問題。從SIP協(xié)議的角度來看,它管理的會話屬性本身不是最重要的,它更側重于對媒體資源的定位,提供一個整合功能。因為SIP協(xié)議提供的媒體資源服務器查詢服務,MRCP客戶端可以獲得關于媒體資源的支持能力。
MRCP本身是C/S架構的,分為客戶端和服務端,他的開源實現(xiàn)有Unimrcp,客戶可根據(jù)需要基于該框架做自己的語音引擎接入和功能擴展,對接的語音引擎可以是百度、訊飛或其他,其中百度和訊飛都有了自己的Mrcp Server實現(xiàn)。在實際使用過程中,可對接不同的語音引擎平臺。這里以當前我們用到的開源呼叫中心平臺FreeSWITCH、以及百度的MRCP服務端Mrcp Server為例介紹相關配置和工作流程。
(1)在FreeSWITCH中,自帶的mod_unimrcp模塊,本身已經(jīng)實現(xiàn)了MRCP客戶端的功能,這里以模塊用到的v2版本的配置文件為例。配置如下:
(2)接下來修改unimrcp默認使用的ASR驅動,可以編輯/usr/local/freeswitch/conf/autoload_configs/unimrcp.conf.xml,編輯修改default-tts-profile和default-asrprofile為我們新創(chuàng)建的unimrcpserver-mrcp2。配置如下:
這樣便實現(xiàn)了Mrcp客戶端的配置,可對接實際的MrcpServer端,測試實時語音合成和實時識別服務的可用性;其他平臺的對接均可參照該種方法進行配置使用。
本方法目的是通過建設自動撥測基礎模塊、設置靈活的監(jiān)控方式和流程配置,升級優(yōu)化撥測的基礎功能,提高撥測靈活性、實用性,為智能客服運維工作提供支撐,更好地服務生產(chǎn)。本方法和主要流程步驟如下:(1)撥測準備階段:創(chuàng)建自定義撥測流程和撥測參數(shù),包括了撥測時間、撥測周期、撥測流程、告警文本/語音、設置告警閥值、告警通知等級等參數(shù)。通過自定義的撥測流程和策略,可實現(xiàn)7*24 h不間斷自動檢測;通過定義復雜撥測流程可實現(xiàn)全業(yè)務流程(覆蓋IVR按鍵、智能語音客服的全業(yè)務流程)的重復撥測。(2)撥測過程中:撥測任務觸發(fā)執(zhí)行后,撥測系統(tǒng)按照撥測流程進行撥測,根據(jù)撥測業(yè)務標準流程走向進行分析判斷,對存在問題的環(huán)節(jié),在撥測業(yè)務流程的各個環(huán)節(jié)均進行問題檢測和詳細日志記錄以及觸發(fā)相應的告警機制進行告警通知處理。根據(jù)設置的告警級別通過對應配置的告警方式(短信、郵件、電話)和告警級別進行通知告警。撥測過程中可產(chǎn)生詳細的撥測過程數(shù)據(jù)和日志供業(yè)務運營系統(tǒng)分析處理。對于告警通知,系統(tǒng)會自動將撥測的告警情況及時發(fā)送運維人員處理,從而實現(xiàn)整體運營監(jiān)控閉環(huán)管理。(3)撥測完成后:撥測系統(tǒng)提供整個撥測過程的詳細錄音、撥測過程中數(shù)據(jù)、撥測日志,為業(yè)務運營系統(tǒng)提供數(shù)據(jù)分析和支撐基礎,為優(yōu)化和提高智能運營撥測流程提供幫助和指導。
本方法的具體實現(xiàn)流程步驟如圖4所示。
圖4 自動語音撥測實現(xiàn)步驟
本方法的具體實現(xiàn)原理如下。
(1)通過業(yè)務流程編輯器預先編制的撥測業(yè)務流程,執(zhí)行環(huán)節(jié)動作如撥號、錄音、按鍵、放音、掛機、撥測策略、時間、頻率、告警策略、告警參數(shù)等撥測參數(shù),創(chuàng)建并啟動撥測任務。撥測任務執(zhí)行后,待撥測任務觸發(fā)后,首先通過撥測平臺MRCP模塊實時抓取語音音頻流,通過MRCP協(xié)議,交給MRCP服務端進行音頻實時轉寫,將轉寫結果交給意圖處理模塊進行語義識別處理分析意圖,識別進一步的撥測動作,從而達到業(yè)務撥測的目的。
(2)其中意圖識別處理基于客戶畫像模型(通過對客戶數(shù)據(jù)采集、清洗分析和數(shù)據(jù)建模,形成有效的客戶畫像模型),如圖5所示,結合改進的fastText的模型結構可對客戶意圖進行分類,客戶意圖可細分為“業(yè)務查詢類”和“業(yè)務辦理類”,它的特點在于可使用更短的時間實現(xiàn)意圖的精確識別。
圖5 意圖精準識別過程圖
(3)通話過程將由設備全程錄音,產(chǎn)生后的PCM文件經(jīng)過轉碼生成符合接口調用的WAV文件碼;日志記錄模塊對語音撥測的過程數(shù)據(jù)和撥測日志信息進行記錄并提供接口以便業(yè)務運營平臺調用、分析和處理。
(4)在撥測過程中,如某個環(huán)節(jié)出現(xiàn)故障或錯誤并觸發(fā)告警機制,告警通知模塊則根據(jù)用戶配置的告警策略、告警信息以合適的告警方式通知運維人員。
本文提出了實現(xiàn)對智能語音客服自動撥測實現(xiàn)方法,解決人工抽檢無法準確定位問題、效率低、質檢不全面等問題。該方法的優(yōu)點如下。
(1)支持7*24 h不間斷自動檢測,效率高。每天24 h都可以進行模擬人工去撥測10 000平臺,解決以往故障發(fā)現(xiàn)不及時,只能靠客戶使用后的反饋,或者分析后臺使用數(shù)據(jù)才能發(fā)現(xiàn)問題。
(2)覆蓋全部業(yè)務流程,支持全業(yè)務流程重復撥測。可以覆蓋IVR按鍵、智能客服的全業(yè)務流程,對于重要的業(yè)務流程可重復撥測,確保智能語音客服平臺的正常運行。
(3)能及時發(fā)現(xiàn)問題,并主動發(fā)現(xiàn)自動告警。通過設置監(jiān)控指標閾值與實際撥測情況比較,并根據(jù)告警級別,能夠實現(xiàn)嚴重告警將電話通知相關運維人員,一般告警將由短信、郵件通知。自動將撥測的告警情況及時發(fā)送運維人員處理,實現(xiàn)整體運營監(jiān)控閉環(huán)管理。
(4)撥測過程可產(chǎn)生詳細數(shù)據(jù)供業(yè)務系統(tǒng)運營分析。撥測過程會產(chǎn)生各種類型日志信息和撥測過程數(shù)據(jù),用戶可設置信息記錄級別,該撥測數(shù)據(jù)可為其他運營分析系統(tǒng)提供數(shù)據(jù)支撐。
以機器替代人工撥測的方式,對智能客服系統(tǒng)語音域運行質量、業(yè)務準確性進行主動監(jiān)控,建立語音域高效運維機制,支撐業(yè)務運營人員監(jiān)控、測試、優(yōu)化重點高頻流程,提高智能客服系統(tǒng)適用性與穩(wěn)定性。