王翀 周龍飛 張祖耀
關(guān)鍵詞:活動理論 AI語音交互 聽障騎手 參與式設(shè)計 App設(shè)計
引言
目前,我國聽障人群就業(yè)情況并不樂觀,截止2021年底,我國聽說障礙人群將達到2780萬人次,已經(jīng)實現(xiàn)就業(yè)人數(shù)819萬,就業(yè)率僅達到聽障人群總?cè)藬?shù)的30%,剩余的大部分聽說障礙人士仍處于無業(yè)或者失業(yè)的狀態(tài)。這類人群的就業(yè)率低,很大程度上是因為溝通交流帶來的問題。隨著消費的升級,社會群體對外賣配送服務(wù)的需求不斷增加,越來越多的聽障人士加入到“外賣騎手”的行業(yè)中。但現(xiàn)有的外賣配送App使用邏輯對于聽障騎手并不友好,嚴重影響了他們的配送效率。文章通過基于活動理論的AI語音交互產(chǎn)品設(shè)計模型構(gòu)建,將AI語音技術(shù)引入到外賣配送App設(shè)計中,通過整合新興技術(shù)并關(guān)聯(lián)實際運用場景的方式解決社會問題[1]。并采用協(xié)同參與的設(shè)計方式來確保用戶需求的真實性和完整性,為聽障騎手優(yōu)化配送流程,提高溝通效率,改善他們的就業(yè)環(huán)境和條件。
一、AI語音技術(shù)與應(yīng)用趨勢
隨著信息化時代的不斷發(fā)展,智能化技術(shù)和大數(shù)據(jù)分析成為了時代的焦點,AI語音技術(shù)也應(yīng)運而生。2018年,Google創(chuàng)造了AI電話Duplex,此后AI語音技術(shù)的商業(yè)價值開始迅速發(fā)展[2]。通過語音識別(ASR)、語音合成(TTS)和自然語音處理(NLP)這三大AI語音技術(shù),依托語音信號處理、深度學(xué)習(xí)、模式識別等手段來實現(xiàn)人機溝通和信息傳遞。目前,社會的運作方式已經(jīng)被人工智能技術(shù)所改變,并且滲透到了各行各業(yè)之中,給社會帶來了前所未有的變革[3]。AI語音技術(shù)也已經(jīng)廣泛地運用在社會中,提高了生活和工作的效率。尤其是針對聽障人群,為他們的溝通交流帶來了新的可能性。
(一)技術(shù)構(gòu)成,文章在設(shè)計實踐中主要運用到的AI語音技術(shù)。
1.語音識別技術(shù)(ASR)。即將機器理解和識別的人類的聲音并轉(zhuǎn)化為文字的過程,是語音交互中最基礎(chǔ)的一個AI技術(shù)環(huán)節(jié),一般包含4個基本流程:語音輸入、編碼、解碼、文本輸出,如圖1。語音識別大體可分為兩種識別方式,一種是“傳統(tǒng)”識別方式,其聲學(xué)模型一般采用混合高斯隱形馬爾科夫模型;而另一種是采用深度神經(jīng)網(wǎng)絡(luò)的“端對端”識別方式。目前語音識別技術(shù)已經(jīng)廣泛運用于人于機器、人與人之間的交流和溝通,大大提高了特殊場合的溝通效率。
2.語音合成技術(shù)(TTS)。即將文本信息轉(zhuǎn)化成語音的技術(shù),其基本流程有4個環(huán)節(jié):文本語言處理、韻律處理、發(fā)聲單元拼接、語音輸出,如圖2。在20世紀初,科學(xué)家開始使用簡單的語音單元來建立語音庫,使用電子器件來模擬人發(fā)聲的技術(shù)。20世紀末,隨著集成電路的發(fā)展,出現(xiàn)了相對復(fù)雜的電子發(fā)聲器,開始使用存放真人語音樣本的語音庫,通過適合的語音拼接來提高語音合成的輸出質(zhì)量。與此同時,基于統(tǒng)計建模和機器學(xué)習(xí)的HMM參數(shù)合成方法得到普及。隨著AI技術(shù)的發(fā)展,基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的語音合成技術(shù)逐漸成為該領(lǐng)域的核心,深度學(xué)習(xí)的算法也可以更好地模仿人聲變化的規(guī)律,使AI坐席語音更加真實。
(二)應(yīng)用案例和趨勢。現(xiàn)階段,AI語音技術(shù)已經(jīng)開始利用自身的優(yōu)點逐漸優(yōu)化聽障人群的日常生活。音書App是一款為聽障人群打造的溝通交流軟件,無障礙溝通和語音訓(xùn)練是其主要的兩大功能。通過語言識別技術(shù)(ASR)將4米以內(nèi)的語音信息轉(zhuǎn)化為文字,改善聽障人群之間的溝通。在語音訓(xùn)練中,利用AI智能測評技術(shù)對聽障人群的語言發(fā)音進行打分,來提升該人群的普通話水平,提高了與健聽人群之間的溝通效率。但是在特殊的工作環(huán)境中,常規(guī)的聽障溝通軟件并不能滿足工作的需求,近年來,聽障人群的就業(yè)問題引起了社會極大的關(guān)注,在解決就業(yè)問題的同時,如何提高該群體的工作效率、降低他們的工作成本成為了當下新起的課題。
二、基于活動理論的AI語音交互產(chǎn)品設(shè)計模型構(gòu)建
隨著社會整體的消費升級和形態(tài)的變化,新興產(chǎn)業(yè)的不斷涌現(xiàn)催生了新的設(shè)計對象,設(shè)計者需要將不同領(lǐng)域的知識進行交叉融合進行再設(shè)計[4]。在外賣行業(yè)中,聽障人士的加入引發(fā)了外賣配送App與他們之間的不兼容性問題,這種問題的出現(xiàn)是因為設(shè)計者在設(shè)計相關(guān)產(chǎn)品的同時,沒有將聽障人群視為可能的使用對象而導(dǎo)致的[5]。由于聽力上的障礙,這類騎手不能像普通騎手一樣通過接打電話的方式進行溝通和交流。在這種情況下,基于用戶協(xié)作和用戶需求的設(shè)計就顯得格為重要。
(一)理論基礎(chǔ)?;顒永碚摚ˋctivity Theory)強調(diào)人作為主體在事物發(fā)展過程中所具備的動力和目的性,并認識到工具和規(guī)則在人類活動中起到的橋梁作用[6~7]。人的活動和意識是辯證統(tǒng)一的整體,外部活動促進了意識認知的發(fā)展。在活動理論中,活動是最基礎(chǔ)的分析單元,活動系統(tǒng)由三個主要成分和三個次要成分構(gòu)成,主要成分包括主體、客體和共同體,次要成分包括工具、規(guī)則和勞動分工,主要成分之間的聯(lián)系又由次要成分構(gòu)成,它們的關(guān)系如圖3所示。
(二)基于活動理論的AI語音交互產(chǎn)品設(shè)計模型?;顒永碚撓到y(tǒng)地將個體、工具和社會性形式整合成一個統(tǒng)一的整體,彼此之間都產(chǎn)生了緊密的聯(lián)系[8]。文章提出的AI語音交互產(chǎn)品設(shè)計模型是在活動理論的基礎(chǔ)上根據(jù)AI語音交互活動中可能涉及到的構(gòu)成要素進行分析得出的,如圖4。該模型中涉及的主體既是AI語音技術(shù)的需求者和產(chǎn)品使用者,在模型中簡稱為用戶,他們是AI語音交互活動的主體,是整個活動的核心部分。客體是需要使用AI語音技術(shù)達成的目標,在對主體的需求進行分析后得到。共同體是設(shè)計者,設(shè)計者根據(jù)主體用戶的需求結(jié)合AI語音技術(shù)設(shè)計出可以達到客體目標的產(chǎn)品,在整個模型中起到了主導(dǎo)作用,協(xié)調(diào)各元素之間的關(guān)系。規(guī)則是AI語音技術(shù)需求,建立在用戶和設(shè)計者之間,用于給設(shè)計者的設(shè)計做出引導(dǎo),以便設(shè)計出更完善的產(chǎn)品來提供給用戶使用。工具是AI語音技術(shù),通過關(guān)鍵功能的使用幫助用戶達到客體的目標。勞動分工由AI語音技術(shù)載體來替代,載體是指搭載AI語音技術(shù)的輸出平臺,幫助用戶完成交互的任務(wù)。設(shè)計者會根據(jù)用戶的實際需求和目標來選擇合適的AI語音技術(shù)載體。
在活動理論中,每個構(gòu)成活動的要素之間都存在著緊密的聯(lián)系,在AI語音交互產(chǎn)品設(shè)計模型中也同樣適用,并影響著設(shè)計活動的先后順序。首先是交換系統(tǒng),在用戶、設(shè)計者和AI語音技術(shù)需求之間形成,用戶可以在這個系統(tǒng)中將自己的需求傳遞給設(shè)計者,設(shè)計者也可以通過相關(guān)定性研究來獲取有價值的信息。這些需求和信息構(gòu)成了AI語音交互產(chǎn)品設(shè)計模型中的規(guī)則成分,為設(shè)計者的設(shè)計提供方向。其次是生產(chǎn)系統(tǒng),在用戶、目標和AI語音技術(shù)之間形成,結(jié)合AI語音技術(shù)的使用,根據(jù)用戶的目標生成合適的使用邏輯。然后是輸出系統(tǒng),在設(shè)計者、目標和AI語音技術(shù)載體之間形成,設(shè)計者會根據(jù)用戶的目標和使用邏輯輸出設(shè)計方案,并且尋找合適的AI語音技術(shù)載體。最后是循環(huán)系統(tǒng),在用戶、設(shè)計者和目標之間形成,基于用戶目標的設(shè)計產(chǎn)出是一個循環(huán)完善的過程,在這個過程中,往往伴隨著用戶的體驗和反饋,這就需要設(shè)計者不斷對產(chǎn)品進行優(yōu)化迭代,按順序持續(xù)地進行其他三個系統(tǒng)的研究。并且在這個過程中,用戶可以學(xué)習(xí)和內(nèi)化AI語音產(chǎn)品使用方式和邏輯。
AI語音技術(shù)的出現(xiàn)為特殊人群的溝通和交流提供了更多的可能性,通過活動理論建立AI語音交互產(chǎn)品設(shè)計模型可以為AI語音產(chǎn)品的開發(fā)提供更好的依據(jù),讓用戶充分參與到產(chǎn)品的設(shè)計中,提高AI語音交互產(chǎn)品設(shè)計的針對性和滿意度。
三、基于活動理論的AI語音交互產(chǎn)品設(shè)計實踐
在本次設(shè)計實踐中,將為聽障騎手設(shè)計一款更高效的外賣配送App。將上文中提出的AI語音交互產(chǎn)品設(shè)計模型作為設(shè)計實踐的基礎(chǔ),把設(shè)計活動中出現(xiàn)的相關(guān)者填入到模型框架中。用戶是聽障騎手,目標是解決聽障騎手在配送過程中缺乏有效溝通所帶來的問題,設(shè)計者是App設(shè)計師,這三者構(gòu)成了模型的主要成分,AI語音技術(shù)、AI語音技術(shù)需求以及AI語音技術(shù)載體構(gòu)成了模型的次要成分來輔助產(chǎn)品設(shè)計的完成。
(一)基于交換系統(tǒng)的需求和痛點分析。通過構(gòu)建用戶旅程地圖的方式對聽障騎手的配送流程進行分析,該方法是一種以用戶為中心,完整呈現(xiàn)行為過程中用戶與服務(wù)、系統(tǒng)之間交互關(guān)系的可視化工具[9]。在這個過程中,聽障騎手將自己的行為信息傳遞給設(shè)計者,設(shè)計者再對行為信息進行整理和分析,最終總結(jié)出用戶的痛點以及需求。為確保用戶需求的真實性,實驗聯(lián)系到了一個聽力障礙騎手團隊,該團隊有1位聽障騎手調(diào)度人員以及12名聽力障礙騎手。在前期準備的過程中,對調(diào)度者以及每一位騎手進行了訪談,了解他們的工作流程、學(xué)習(xí)習(xí)慣以及工作狀態(tài),深入了解了本項實驗的目標人群,發(fā)掘他們的實際需求。圖5是根據(jù)前期調(diào)研總結(jié)出的聽力障礙騎手的用戶旅程地圖。
用戶旅程地圖對聽障騎手完成訂單的完整流程進行了描述,根據(jù)對用戶行為和用戶情緒的記錄,分析總結(jié)出了以下用戶需求和痛點:在訂單篩選階段,用戶需要快速掌握訂單信息,但平臺的App篩選訂單的效率低下;在搶單階段,聽障騎手與商家之間存在著溝通障礙;在提醒取貨階段,騎手需要與顧客進行溝通,聽力障礙的特殊性導(dǎo)致了溝通成本的增加,用戶希望做到和顧客之間的無障礙交流;在取餐對接階段,可能存在信息傳達不及時以及無法精準表達的問題,嚴重影響騎手的配送效率。
傳統(tǒng)的外賣配送App已經(jīng)不能滿足聽障騎手的配送需求。隨著越來越多的聽障人士加入到外賣配送這個行業(yè)中,傳統(tǒng)的外賣配送App缺乏針對性的優(yōu)化,對于聽障人群十分不友好,導(dǎo)致他們在外賣配送過程中的溝通成本遠高于普通的外賣騎手,嚴重影響了外賣配送的效率。從上文中的用戶旅程地圖分析可以得出,缺乏有效溝通的問題貫穿了聽障騎手的整個配送流程。因此,在主體和場景研究的基礎(chǔ)上,提出了一套高效溝通的解決方案。以移動設(shè)備為載體,移動應(yīng)用程序作為信息傳遞的工具,結(jié)合AI語音技術(shù)的支持,為聽障騎手開拓新的溝通交流方式,目的在于降低溝通成本,提高溝通效率,改善就業(yè)環(huán)境和條件。
(二)基于生產(chǎn)系統(tǒng)的App使用邏輯挖掘和交互功能研究。
1.App使用邏輯的挖掘。根據(jù)前期調(diào)研中對聽障騎手和普通騎手使用外賣配送App的情況進行對比,發(fā)現(xiàn)兩者之間的使用邏輯最大的區(qū)別在于與顧客對接的階段。普通騎手在取餐對接時,可以通過撥打電話的方式與顧客進行溝通,而聽障騎手只能通過短信編輯的方式來與顧客完成對接,這種方式容易被顧客忽略,時效性低,在遇到困難時需要中間協(xié)調(diào)者的幫助,時間成本消耗大,溝通效率低,嚴重影響了外賣配送的效率。為此,根據(jù)前文中所提出的用戶需求和用戶目標,為聽障騎手提供新的交互方式,注重溝通功能的設(shè)計,降低騎手的時間成本和學(xué)習(xí)成本,用精簡的溝通方式連接騎手和顧客?;谇捌诘恼{(diào)研訪談分析和外賣騎手的工作特性,在避免增加學(xué)習(xí)成本的前提下,結(jié)合聽障騎手使用應(yīng)用程序的習(xí)慣,設(shè)計了一套涵蓋大部分配送場景的溝通邏輯框架,如圖6。將AI語音技術(shù)融入到整個配送流程當中,對聽障騎手與外賣配送App之間的交互進行優(yōu)化,滿足用戶對高效溝通的需求。
2.App交互功能的研究。AI語音交互功能的加入是App優(yōu)化的核心,以AI語音技術(shù)為基礎(chǔ)構(gòu)建溝通邏輯,通過在線搶單、路線導(dǎo)航等常見交互功能的加入,完成對外賣配送App的優(yōu)化,詳細交互功能框架見圖7。在接單階段,聽障騎手可以通過首頁的搶單頁面進行訂單的篩選,之后便進入了每個訂單的配送環(huán)節(jié)。在取餐階段,聽障騎手可以通過App的路線引導(dǎo)功能到達指定商家完成取餐,同時在商家詳情頁下方設(shè)置了眾智尋店的功能,有經(jīng)驗的騎手可以通過評論分享尋找店家的經(jīng)驗,為新手提供配送線路上的引導(dǎo),如提供照片、視頻、地標文字描述,持續(xù)地幫助聽障騎手在不需要與商家、顧客進行復(fù)雜溝通的情況下,進行快速高效的尋店以及送餐,完成騎手與騎手之間的互動,提高了送餐效率,減少誤單。在送餐階段,當聽障騎手需要撥打電話時,可以在消息中心找到相應(yīng)的顧客,通過文本輸入的方式表達自己想要傳遞的信息,依托語音合成技術(shù)(TTS)開啟語音轉(zhuǎn)達,App會通過語音通話功能給顧客撥打電話,將騎手輸入的文本信息轉(zhuǎn)化成語音來告知顧客。語音撥打電話的方式更加直接且時效性高,在不需要中間協(xié)調(diào)者的情況下聽障騎手也可以獨立地完成配送任務(wù),降低了工作成本,提高與顧客之間的溝通效率。在有電話呼入時,接通的電話會直接進入AI坐席的服務(wù)環(huán)節(jié),對通話過程中的語義進行分析,再通過語音識別技術(shù)(ASR)將呼入的電話轉(zhuǎn)化為文本,幫助聽障騎手及時了解到顧客的需求。App還具備了快捷語音的功能,聽障騎手可以提前編輯好常用的溝通模版,在需要向顧客傳達信息時一鍵發(fā)送開啟語音轉(zhuǎn)達,節(jié)省不必要的文本編輯時間,提高外賣配送的效率。優(yōu)化后的外賣配送交互流程見圖8。
(三)基于輸出系統(tǒng)的視覺設(shè)計研究。在原有App的基礎(chǔ)上,將訂單配送界面的信息解構(gòu)簡化,并且根據(jù)實際的配送流程,重新為聽力障礙騎手設(shè)計基于Neuomorphism新擬物風(fēng)格的UI界面。但由于該風(fēng)格的界面設(shè)計缺乏對比度,不利于對聽障騎士的下一步操作進行引導(dǎo),所以在設(shè)計實踐中通過對整體頁面的扁平化設(shè)計和統(tǒng)一主色調(diào)的方式,提升了App界面的可讀性,如圖9。目的在于簡化聽障騎手的配送流程,去除中間的協(xié)調(diào)者,使聽障騎手可以與普通騎手一樣獨立完成一系列的配送任務(wù)。
(四)基于循環(huán)系統(tǒng)的評估和反饋。循環(huán)系統(tǒng)是AI語音交互產(chǎn)品設(shè)計模型的核心部分,在該系統(tǒng)中,用戶可以對產(chǎn)品的使用體驗進行反饋,幫助設(shè)計者對產(chǎn)品進行優(yōu)化和迭代,形成一個良好的設(shè)計循環(huán)。實驗聯(lián)系到了上文中提到的南京聽力障礙騎士團隊,邀請了其中5位聽力障礙騎手進行了測試和評估。使用控制變量法進行研究,讓5位聽力障礙騎手分別使用原生的外賣配送App和上文中提出的外賣配送App進行模擬送餐實驗,并采用參與式觀察的方式對用戶的行為進行記錄,對聽力障礙騎手完成每一階段的動作數(shù)量和完成時間進行對比。最后通過里克特量表得到使用體驗的反饋并進行總結(jié)。
以上4個系統(tǒng)組成了AI語音交互產(chǎn)品設(shè)計的一整套流程,從聽障騎手的需求挖掘到交互功能的輸出,再通過用戶的使用體驗反饋對App進行評估和優(yōu)化,最終得到適合聽障騎手使用的外賣配送App。注重聽障騎手與App之間交互的流暢性,通過引入AI語音技術(shù)提高了交互效率,達到了與顧客之間無障礙溝通的目的。
結(jié)論
在智能時代,聽障人群的需求具有特殊性,就現(xiàn)外賣行業(yè)而言,針對聽障騎手的需求,外賣平臺并沒有對外賣配送App進行優(yōu)化和改善。文章從聽障騎手缺乏有效溝通的問題入手,結(jié)合活動理論和AI語音技術(shù),提出了AI語音交互產(chǎn)品設(shè)計模型,對外賣配送App進行了針對性的優(yōu)化,通過AI語音交互的方式提高了溝通效率,一定程度上保證了騎手與商家、騎手與顧客之間的無障礙溝通。同時對App的界面進行了簡化,在不增加學(xué)習(xí)成本的前提下為聽障騎手提供了更高效的使用引導(dǎo)。除了基于聽障騎手需求的外賣配送App設(shè)計導(dǎo)向之外,用戶的使用體驗也是一個不能忽視的方面,基于循環(huán)系統(tǒng)的用戶評估和反饋將是后續(xù)研究的重要內(nèi)容。