于愷 于方軍
語音識(shí)別技術(shù)已經(jīng)運(yùn)用到人們生活的各個(gè)領(lǐng)域。目前,語音識(shí)別技術(shù)常用的有兩種方式,一種是基于本地語音模型庫識(shí)別模式,另一種是基于云語音模型庫識(shí)別模式。本地語音模型首先要建立模型庫,模型庫的建立需要大量的語音訓(xùn)練積累,通過采樣生成音頻文件,對(duì)比本地模型庫,實(shí)現(xiàn)語音識(shí)別,這個(gè)過程需要學(xué)生了解語音信號(hào)的提取、聲學(xué)模型、隱馬爾科夫(HMM)模型等專業(yè)知識(shí)。為了能更好更快地實(shí)現(xiàn)語音識(shí)別效果,在課程設(shè)計(jì)時(shí)應(yīng)采用基于云語音模型庫識(shí)別模式。
語音識(shí)別需要使用麥克風(fēng)采集聲音。掌控板的主控板帶有麥克風(fēng)模塊,可以錄音并保存在內(nèi)存,能夠?qū)崿F(xiàn)語音的獲取,它還帶有WI-FI無線模塊,無線聯(lián)網(wǎng)后實(shí)現(xiàn)語音的云識(shí)別。掌控板的OLED屏能夠顯示云識(shí)別的信息和內(nèi)容,且?guī)в?個(gè)三色LED燈,可以控制燈的開啟及顏色變化。該項(xiàng)目針對(duì)四年級(jí)小學(xué)生,所以采用學(xué)生易懂的mPython圖形化編程軟件完成。教學(xué)框架如圖1所示。
● 體驗(yàn)項(xiàng)目,明確制作目標(biāo)
語音識(shí)別技術(shù)中應(yīng)用最廣的當(dāng)屬手機(jī)語音助手,通過使用語音助手方便了手機(jī)信息的獲取和操作。教學(xué)中,教師可以先引導(dǎo)學(xué)生例舉生活中語音助手的名字,如Siri、天貓精靈、小愛同學(xué)等。接著,使用智能音箱控制燈泡的開啟關(guān)閉及變色,讓學(xué)生總結(jié)出智能音箱語音識(shí)別的工作過程:智能音箱聽到語音→獲取語音→對(duì)獲取的語音進(jìn)行分析→語音內(nèi)容為“開燈”或“關(guān)燈”→控制開啟和關(guān)閉燈。通過體驗(yàn)項(xiàng)目,讓學(xué)生知道語音控制燈開啟和關(guān)閉的工作流程。
● 問題引導(dǎo)項(xiàng)目實(shí)施
1.確定語音獲取方式
語音識(shí)別面臨的第一個(gè)問題是掌控板如何能夠獲取到人的語音?學(xué)生經(jīng)常使用即時(shí)軟件進(jìn)行溝通,實(shí)踐中發(fā)現(xiàn)發(fā)送語音使得信息溝通更加高效。即時(shí)通信工具需要按住一個(gè)按鈕進(jìn)行錄音,錄音結(jié)束后發(fā)送給他人,他人聽取錄音,然后再反饋。云識(shí)別語音信息的方式與此相同,即運(yùn)用掌控板的麥克風(fēng)模塊進(jìn)行錄音,將錄音內(nèi)容上傳到語音識(shí)別平臺(tái)。針對(duì)錄音方式學(xué)生討論出來有兩種方案,一種是掌控板一直錄音,另一種是和即時(shí)通信工具一樣設(shè)置錄音按鈕,按鈕按下開始錄音,設(shè)定錄音時(shí)間。綜合討論兩種方案,學(xué)生選擇了第二種方案,原因是:第一種方案一直錄音,無法生成錄音文件上傳到云語音識(shí)別服務(wù)器;第二種方案可以生成錄音片段上傳到云識(shí)別服務(wù)器,使用按下掌控板A按鈕開始錄音,語音命令需要錄音時(shí)間較短,錄制2秒即可。
2.確定識(shí)別的方式
人類能進(jìn)行聽說交流是因?yàn)槿嗽谟變簳r(shí)通過不斷地學(xué)習(xí)及模仿掌握了語言的發(fā)音及含義,掌控板如何理解語言的意思呢?學(xué)生討論出兩種識(shí)別方式的方案:一種是讓掌控板學(xué)習(xí)人類的語言掌握語言的發(fā)音,并能夠?qū)崿F(xiàn)語音識(shí)別;另一種是讓掌控板借助網(wǎng)絡(luò)的力量,實(shí)現(xiàn)對(duì)語音的識(shí)別。經(jīng)過討論后學(xué)生明確,第一種方案需要?jiǎng)?chuàng)建龐大的語音數(shù)據(jù)庫用于實(shí)現(xiàn)語音識(shí)別,另外掌控板要分析語音,就需要有高性能的處理能力,掌控板無法滿足要求。第二種方案需要聯(lián)網(wǎng)和云語音識(shí)別服務(wù),掌控板能夠連接無線網(wǎng)絡(luò),mPython中自帶語音識(shí)別API,所以能夠?qū)崿F(xiàn)云識(shí)別語音。綜上所述,識(shí)別方式采用云識(shí)別方式。
3.確定語音命令,實(shí)現(xiàn)對(duì)LED控制
云識(shí)別的語音如何控制LED的開啟和關(guān)閉?學(xué)生已經(jīng)學(xué)習(xí)了條件語句的使用,只需要將識(shí)別的語言內(nèi)容進(jìn)行條件判斷,如果滿足條件就執(zhí)行命令,如果不滿足條件就不執(zhí)行。要想查看語音識(shí)別的命令是否準(zhǔn)確,就要將云識(shí)別語音識(shí)別后的文字顯示在OLED屏幕,方便程序測(cè)試和查找問題。
4.繪制流程圖,規(guī)劃項(xiàng)目實(shí)施(如上頁圖2)
5.編程測(cè)試,完成項(xiàng)目制作
在程序測(cè)試過程中,學(xué)生會(huì)發(fā)現(xiàn)語音控制燈源項(xiàng)目(如上頁圖3)有很多地方需要改進(jìn),如語音錄音時(shí)間沒有提示,容易造成識(shí)別失敗。因此,學(xué)生設(shè)計(jì)了開機(jī)提示——按A鍵開始識(shí)別,A鍵按下后屏幕顯示開始錄音,2秒后提示識(shí)別結(jié)果,并提醒使用者再按A鍵開始語音識(shí)別。整個(gè)過程是學(xué)生作為使用者的思考,程序要等待聯(lián)網(wǎng)后才能夠進(jìn)行識(shí)別操作,所以這里可以設(shè)置一個(gè)提示,提示設(shè)備已經(jīng)聯(lián)網(wǎng)成功,可以進(jìn)行語音識(shí)別,屏幕顯示按A鍵開始識(shí)別(如圖4)。識(shí)別完成后,語音滿足條件就可以完成操作,學(xué)生在整個(gè)過程中的思考模式與自身思考模式是相同的,引發(fā)了對(duì)人工智能的思考。
● 發(fā)散學(xué)生思維,創(chuàng)新語音識(shí)別使用
本課主要是講解語音控制機(jī)器的執(zhí)行設(shè)備,通過語音控制LED燈的開啟和關(guān)閉,并擴(kuò)展到機(jī)器能夠聽懂人類的語言,根據(jù)語音完成指令。本課教學(xué)結(jié)束前,教師可讓學(xué)生在原有項(xiàng)目的基礎(chǔ)上進(jìn)行創(chuàng)新,設(shè)計(jì)多條命令語言實(shí)現(xiàn)對(duì)LED燈的控制。學(xué)生們知道RGB的LED燈是可以變色的,嘗試增加“黃色”“綠色”“藍(lán)色”等語言判斷條件控制燈的顏色變化。每個(gè)項(xiàng)目組可以創(chuàng)新1~2個(gè)點(diǎn),然后展示自己的項(xiàng)目成果,進(jìn)而增強(qiáng)各個(gè)項(xiàng)目組之間的反饋交流。在這個(gè)過程中學(xué)生們分享了成功的喜悅,也分享項(xiàng)目中的困惑,大家在思維碰撞中加深對(duì)程序算法的探究。未來,學(xué)生若想創(chuàng)造更加智能的語音識(shí)別工具,就會(huì)嘗試編寫更加復(fù)雜的程序,實(shí)現(xiàn)對(duì)人工智能應(yīng)用更深入的探究。
● 項(xiàng)目總結(jié)
本節(jié)課的教學(xué)采用了項(xiàng)目式學(xué)習(xí),針對(duì)如何實(shí)現(xiàn)語音控制燈的探究過程,通過實(shí)施項(xiàng)目任務(wù)、完成項(xiàng)目制作、改進(jìn)項(xiàng)目作品這個(gè)過程,幫助學(xué)生掌握了語音識(shí)別功能的云識(shí)別語音功能,讓學(xué)生對(duì)語音助手的工作原理有了一定的了解。
在此過程中,學(xué)生發(fā)現(xiàn)最大的問題是語音命令提取不準(zhǔn)確,在語音識(shí)別授課中會(huì)受到外界環(huán)境的影響,如果同時(shí)有多名學(xué)生在測(cè)試語音識(shí)別,或環(huán)境噪音嘈雜,就會(huì)導(dǎo)致語音識(shí)別精度降低,甚至不能識(shí)別相應(yīng)的語音。問題的產(chǎn)生必然會(huì)引起學(xué)生進(jìn)一步的深度思考,且做出的作品也會(huì)更加完美、實(shí)用。另外,教師可以進(jìn)一步引導(dǎo)學(xué)生思考在語音身份識(shí)別中,機(jī)器如何只聽從特定人員的命令或者設(shè)定者的命令,且語音反饋更加人性化?
本論文為淄博市教育科學(xué)規(guī)劃2020年度“基于項(xiàng)目式學(xué)習(xí)的小學(xué)AI校本課程開發(fā)與實(shí)踐研究”課題(課題批準(zhǔn)號(hào):2020ZJY017)成果。