蘇立偉, 劉振華, 陳海燕
(廣東電網(wǎng)有限責任公司 客戶服務中心, 廣州 528000)
隨著電力改革發(fā)展,電力企業(yè)與客戶的溝通交流越來越多,95598客戶服務熱線仍是電力企業(yè)與客戶之間進行溝通交流使用頻率最頻繁的服務渠道。盡管電力企業(yè)與客戶之間的互動渠道日益增多,但相較于其他溝通方式,語音交流具有交互便捷、蘊含豐富信息等優(yōu)點[1],對于客服而言,能更直接明了地了解到客戶意圖。調(diào)查發(fā)現(xiàn):一個具有10個坐席的呼叫中心一天的話務量是5 000通電話,話音量約為500個小時[2]。
電力企業(yè)的運營管理中,客服人員與客戶的對話質(zhì)量將直接影響客戶的用電體驗,客服人員的服務質(zhì)量在電力企業(yè)的發(fā)展進程中有著至關重要的作用[3]。絕大部分隱藏在語音文件中的價值信息未被有效挖掘。運營商針對目前大量錄音數(shù)據(jù)暫無系統(tǒng)化的分析、質(zhì)檢、運營解決方案。如何通過智能語音分析的技術(shù)應用,實現(xiàn)基于智能語音分析的客服智慧運營管理解決方案, 從而有效提升智能化運營手段、強化內(nèi)部管理、聚焦客戶服務心聲,提高客戶服務滿意度,有效降低客戶投訴率[4]??头行膶νㄔ捯纛l進行質(zhì)檢,就是對95598服務熱線的客服人員的話務質(zhì)量進行監(jiān)測與評分,通過監(jiān)測客服人員的服務水平,以考核結(jié)果來定量評價客服人員的工作質(zhì)量,依據(jù)公平客觀的結(jié)果來評估客服中心的運行情況[5],以確??头藛T的總體服務水平,提高客戶的滿意度。
傳統(tǒng)的質(zhì)檢方法以人工抽樣質(zhì)檢錄音,客服人員每天處理數(shù)萬通電話,而質(zhì)檢人員對所有的通話錄音只能通過隨機抽樣的方式進行人工測聽,這種方法不僅工作量大、覆蓋面窄、抽檢率低,同時由于質(zhì)檢人員的判斷具備主觀性,難以有效客觀地對整體服務質(zhì)量進行合理評價。一通錄音平均時長為120秒, 通過語音質(zhì)檢可以直接定位到問題工單, 每通約節(jié)約66秒, 每天將節(jié)約23.8小時[6]。
問題語音檢出方法設計方案
針對傳統(tǒng)的質(zhì)檢方法所存在的缺陷,本設計提供一種問題語音檢出方法和裝置,屬于呼叫系統(tǒng)技術(shù)領域。其中,問題語音檢出方法包括:向呼叫中心獲取錄音音頻數(shù)據(jù);將獲取的錄音音頻數(shù)據(jù)轉(zhuǎn)化為文本格式的數(shù)據(jù);所述文本格式的數(shù)據(jù)中包括坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù);采用預設的質(zhì)檢匹配算法對坐席文本數(shù)據(jù)進行評分,得到錄音音頻數(shù)據(jù)的服務質(zhì)量分值;如果所述服務質(zhì)量分值小于設定閾值,發(fā)出問題提示,以提示用戶對所述錄音音頻數(shù)據(jù)進行人工質(zhì)檢[7]。通過對錄音數(shù)據(jù)的監(jiān)測、提煉, 定期整理出涉及公司業(yè)務流程、管理漏洞、產(chǎn)品缺陷、服務短板等方面的問題, 為提高公司整體服務能力、減少服務短板提供依據(jù)[8]。本發(fā)明實施例提供的問題語音檢出方法和裝置,對錄音音頻數(shù)據(jù)自動進行識別和評分,可以實現(xiàn)全面覆蓋,檢出問題通話錄音,提示用戶對問題通話錄音進行人工質(zhì)檢,大大減少了質(zhì)檢工作人員的工作量。
1) 向呼叫中心獲取錄音音頻數(shù)據(jù)
與95598呼叫平臺錄音數(shù)據(jù)庫實現(xiàn)無縫對接和交互,根據(jù)錄音編號信息,查詢該錄音在呼叫平臺的存儲路徑信息。根據(jù)錄音存儲路徑,獲取錄音文件及對應XML文件(包含用戶來電信息)[9]。并將所有錄音文件進行轉(zhuǎn)碼(8K 16bit編碼格式),使用SFTP傳輸方式上傳至語音分析引擎作保存及語音識別。
2) 轉(zhuǎn)譯錄音音頻數(shù)據(jù)
通過語音轉(zhuǎn)譯引擎將獲取的錄音音頻數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的文本格式數(shù)據(jù);所述文本格式的數(shù)據(jù)中包括坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)[10]。將非結(jié)構(gòu)化的錄音音頻數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的文本信息數(shù)據(jù)是實現(xiàn)該問題語音檢出方法的一項核心功能,轉(zhuǎn)譯成結(jié)構(gòu)化文本信息數(shù)據(jù)后,有利于錄音定位、問題檢出、便捷檢索等[11]。
3) 錄音預質(zhì)檢
采用預設的質(zhì)檢匹配算法對所述坐席文本數(shù)據(jù)進行預質(zhì)檢評分,并檢出錄音存在的差錯問題,得到所述錄音音頻數(shù)據(jù)的服務質(zhì)量分值;如果所述服務質(zhì)量分值小于設定閾值,發(fā)出問題提示,以提示用戶對所述錄音音頻數(shù)據(jù)進行人工質(zhì)檢。
通過上述三步,將對從呼叫中心所獲取的全量錄音音頻數(shù)據(jù)進行全自動質(zhì)檢,保證錄音覆蓋面廣、質(zhì)檢客觀,并有效檢出錄音中存在的差錯問題,同時在轉(zhuǎn)譯文本數(shù)據(jù)中標記差錯位置,有利于后期進行人工質(zhì)檢時進行定位與質(zhì)檢,保證其準確性與工作效率。
本設計提供了一種問題語音檢出方法。當成功從呼叫中心獲取所需錄音音頻數(shù)據(jù),則需要后續(xù)一系列適當?shù)牟僮鲗栴}錄音成功檢出。
2.1.1 語音轉(zhuǎn)文本方式一
根據(jù)所述錄音音頻數(shù)據(jù)中包含的不同語音的音色、音調(diào)及用語,將所述錄音音頻數(shù)據(jù)區(qū)分為坐席音頻數(shù)據(jù)和客戶音頻數(shù)據(jù);
將所述坐席音頻數(shù)據(jù)轉(zhuǎn)化為坐席文本數(shù)據(jù);
將所述客戶音頻數(shù)據(jù)轉(zhuǎn)化為客戶文本數(shù)據(jù)[12]。
2.1.2 語音轉(zhuǎn)文本方式二
將獲取的錄音音頻數(shù)據(jù)整體轉(zhuǎn)化為文本格式的數(shù)據(jù);
對所述文本格式的數(shù)據(jù)進行語義識別和上下文匹配,將所述文本格式的數(shù)據(jù)區(qū)分為坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)。
2.2.1 錄音預質(zhì)檢方式一
采用余弦相似性算法和/或漢明距離算法對所述坐席文本數(shù)據(jù)進行評分,得到所述錄音音頻數(shù)據(jù)的服務質(zhì)量分值。
2.2.2 錄音預質(zhì)檢方式二
采用余弦相似性算法判斷所述坐席文本數(shù)據(jù)中所包含的預設的標準用語的數(shù)量;
根據(jù)所述標準用語的數(shù)量,確定所述錄音音頻數(shù)據(jù)的服務態(tài)度分值;
采用漢明距離算法判斷所述坐席文本數(shù)據(jù)中所包含的客戶信息是否正確,確定所述錄音音頻數(shù)據(jù)的服務有效性分值;
根據(jù)所述服務態(tài)度分值和所述服務有效性分值,得到所述錄音音頻數(shù)據(jù)的服務質(zhì)量分值[13]。
2.2.3 錄音預質(zhì)檢方式三
對所述服務態(tài)度分值和所述服務有效性分值進行加權(quán)處理,得到所述錄音音頻數(shù)據(jù)的服務質(zhì)量分值。
2.2.4 錄音預質(zhì)檢方式四
采用關鍵詞匹配算法,判斷所述坐席文本數(shù)據(jù)中是否包含預設的服務禁語;
如果是,從所得的服務質(zhì)量分值中扣除設定的第一分值。
2.2.5 錄音預質(zhì)檢方式五
當采用關鍵詞匹配算法,判斷所述坐席文本數(shù)據(jù)中不包含預設的服務禁語時,采用同義詞匹配算法,判斷所述坐席文本數(shù)據(jù)中是否包含預設的服務禁語;
如果是,從所得的服務質(zhì)量分值中扣除設定的第一分值。
以提示框的形式,顯示包含所述錄音音頻數(shù)據(jù)編號的問題提示信息。
本設計提供了一種問題語音檢出裝置。該裝置包含問題語音檢出的流程中各模塊功能,能有效將問題語音檢出。
用于向呼叫中心獲取錄音音頻數(shù)據(jù)。該方法可以在計算機中通過執(zhí)行應用程序?qū)崿F(xiàn),該應用程序自動向呼叫中心獲取錄音音頻數(shù)據(jù)。呼叫中心可以是與各個坐席通話終端連接的中心服務器或存儲器。
獲取的錄音音頻數(shù)據(jù)中包括通話時間、通話終端號及通話錄音,還可以包括坐席服務人員的工號。
用于將獲取的錄音音頻數(shù)據(jù)轉(zhuǎn)化為文本格式的數(shù)據(jù);所述文本格式的數(shù)據(jù)中包括坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)。
具體可以根據(jù)錄音音頻數(shù)據(jù)中包含的不同語音的音色、音調(diào)及用語,將錄音音頻數(shù)據(jù)區(qū)分為坐席音頻數(shù)據(jù)和客戶音頻數(shù)據(jù),然后將坐席音頻數(shù)據(jù)對應轉(zhuǎn)化為坐席文本數(shù)據(jù),將客戶音頻數(shù)據(jù)轉(zhuǎn)化為客戶文本數(shù)據(jù)?;蛘?,可以將獲取的錄音音頻數(shù)據(jù)先整體轉(zhuǎn)化為文本格式的數(shù)據(jù),然后對文本格式的數(shù)據(jù)進行語義識別和上下文匹配,將文本格式的數(shù)據(jù)區(qū)分為坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)。
用于采用預設的質(zhì)檢匹配算法對所述坐席文本數(shù)據(jù)進行評分,得到所述錄音音頻數(shù)據(jù)的服務質(zhì)量分值。
可以采用余弦相似性算法或者漢明距離算法對坐席文本數(shù)據(jù)進行評分,得到錄音音頻數(shù)據(jù)的服務質(zhì)量分值。也可以采用余弦相似性算法判斷坐席文本數(shù)據(jù)中所包含的預設的標準用語的數(shù)量;根據(jù)標準用語的數(shù)量,確定錄音音頻數(shù)據(jù)的服務態(tài)度分值;采用漢明距離算法判斷坐席文本數(shù)據(jù)中所包含的客戶信息是否正確,確定錄音音頻數(shù)據(jù)的服務有效性分值;根據(jù)服務態(tài)度分值和服務有效性分值,得到錄音音頻數(shù)據(jù)的服務質(zhì)量分值。
3.3.1 余弦相似性算法
采用余弦相似性算法判斷坐席文本數(shù)據(jù)中所包含的預設的標準用語的數(shù)量,即采用余弦相似性算法將坐席文本數(shù)據(jù)中的詞句與預設的標準用語進行比對。
將坐席文本數(shù)據(jù)中的詞句作為第一向量,將預設的標準用語作為第二向量,通過計算兩個向量的夾角余弦值來評估二者的相似度。具體來說,余弦函數(shù)是三角函數(shù)的一種,在Rt△ABC(直角三角形)中,∠C=90°,∠A的余弦是它的鄰邊比三角形的斜邊,即cosA=b/c,也可寫為cosA=AC/AB。余弦函數(shù):f(x)=cosx(x∈R)。
對于二維空間,根據(jù)向量點積公式,可以得知 ,假設向量a、b的坐標分別為(x1,y1)、(x2,y2),則。
設向量A=(A1,A2,…,An),B=(B1,B2,…,Bn),則,其中,Ai、Bi指詞頻。
如果坐席文本數(shù)據(jù)中的語句與某個預設的標準用語的余弦相似度達到0.75,則認為坐席文本數(shù)據(jù)中包含該預設的標準用語。統(tǒng)計坐席文本數(shù)據(jù)中所包含的預設的標準用語的數(shù)量,數(shù)量每增加一個,服務態(tài)度分值就增加一個設定值。數(shù)量越多,錄音音頻數(shù)據(jù)的服務態(tài)度分值越高。
3.3.2 漢明距離算法
漢明距離算法判斷坐席文本數(shù)據(jù)中所包含的客戶信息是否正確。SimHash(漢明距離)算法將一個文檔轉(zhuǎn)換成64位的字節(jié),然后通過判斷兩個字節(jié)的漢明距離確定相似度。通過simhash算法可以分別計算出坐席文本數(shù)據(jù)中所包含的客戶信息的simhash值和預存的客戶信息的simhash值,通過計算出的兩個simhash值來計算兩者之間的漢明距離,根據(jù)漢明距離來比較兩者之間的相似度。漢明距離是指兩個相同長度的字符串相同位置上不同的字符的個數(shù)。
漢明距離算法主要包括分詞、hash(哈希算法)、加權(quán)、合并和降維五個步驟。首先針對坐席文本數(shù)據(jù)中的一段語句,進行分詞,得到有效的特征向量,然后為每一個特征向量設置1-5等5個級別的權(quán)重(如果是給定一個文本,那么特征向量可以是文本中的詞,其權(quán)重可以是這個詞出現(xiàn)的次數(shù))。
用于如果所述服務質(zhì)量分值小于設定閾值,發(fā)出問題提示,以提示用戶對所述錄音音頻數(shù)據(jù)進行人工質(zhì)檢。
判斷服務質(zhì)量分值是否小于設定閾值;如果是,發(fā)出問題提示,以提示用戶對錄音音頻數(shù)據(jù)進行人工質(zhì)檢,以提示框的形式,顯示包含錄音音頻數(shù)據(jù)編號的問題提示信息。
本次設計研究應用于95598電力客服智能質(zhì)檢系統(tǒng)的問題語音檢出方法,構(gòu)建基于語言智能處理技術(shù)的新一代智能客服,形成跨語言、全流程、深層次的客服智能化理解、處理與服務能力[14]優(yōu)化傳統(tǒng)以人工抽樣質(zhì)檢錄音的質(zhì)檢方法,避免質(zhì)檢覆蓋面窄、抽檢率低、問題檢出率低的情況,通過全量自動質(zhì)檢錄音,能夠有效自動檢出全量錄音中存在問題,發(fā)出問題提示,以提示用戶對所述錄音音頻數(shù)據(jù)進行人工質(zhì)檢。通過這種方法,能夠避免質(zhì)檢人員隨機抽檢的主觀性與隨機性,有效對整體的客服服務質(zhì)量進行客觀合理的評價。
利用設計的問題語音檢出裝置將問題語音檢出方法實施,通過將95598錄音文件轉(zhuǎn)譯為結(jié)構(gòu)化的文本,改變傳統(tǒng)的人工抽檢,采用預設的質(zhì)檢匹配算法對全量文本數(shù)據(jù)進行預質(zhì)檢并檢出存在問題的錄音并提示用戶,便于后續(xù)的人工質(zhì)檢工作。經(jīng)由智能質(zhì)檢系統(tǒng), 同時結(jié)合業(yè)務模型, 對全量錄音將被篩選分析, 此時研究將傳統(tǒng)的隨機抽樣方式轉(zhuǎn)變成程序進行, 然后篩選出可能有問題的通話記錄再交由人工進行質(zhì)檢大大提高了質(zhì)檢的覆蓋面積, 根據(jù)系統(tǒng)詞語庫設定敏感用詞以及抽樣方法的篩選, 使得每個客服的質(zhì)檢范圍都是一致的, 使質(zhì)檢更加具備公平性與針對性, 為市場需求以及傾聽用戶需求提供有效的數(shù)據(jù)[15]。
目前問題語音檢出方法主要應用于95598電力客服智能質(zhì)檢系統(tǒng)中,在應用效果日趨成熟后,可將其推廣至電力行業(yè)的其他客服渠道中如統(tǒng)一服務平臺的各遠程渠道、營業(yè)廳的客服渠道等,力求能對所有渠道的客戶服務內(nèi)容進行收集與分析,獲取具備業(yè)務價值的數(shù)據(jù),并持續(xù)提升南方電網(wǎng)的客戶服務水平。