沈陽(yáng)理工大學(xué)自動(dòng)化與電氣工程學(xué)院 阮小烔 野瑩瑩 李 帥 任璐珩
目前市場(chǎng)上大多數(shù)電子記事本都以文字輸入形式呈現(xiàn),且只能通過(guò)文字或語(yǔ)音記錄、進(jìn)行定時(shí)提醒,操作繁瑣,對(duì)于不擅長(zhǎng)使用手機(jī)、記憶力不好的老人并不友好。通過(guò)采用以STM32F103C8T6作為主控芯片LD3320語(yǔ)音智能識(shí)別芯片設(shè)計(jì)一款語(yǔ)音控制記事提示系統(tǒng),做到語(yǔ)音記錄備忘大大提高記事的便利性,且芯片小,功能單純,輕便簡(jiǎn)單。
該語(yǔ)音智能記事提示系統(tǒng)主要由圖1的語(yǔ)音識(shí)別模塊、語(yǔ)音錄放模塊、數(shù)字分析處理模塊、顯示輸入模塊組成。顯示輸入模塊啟動(dòng)本系統(tǒng),語(yǔ)音識(shí)別模塊檢測(cè)負(fù)責(zé)接收周圍聲音信號(hào),提取、分析有效的語(yǔ)音指令。收到指令后傳輸?shù)綌?shù)字分析模塊,并由數(shù)字分析模塊傳輸相應(yīng)的指令到顯示輸入模塊和語(yǔ)音錄放模塊。
圖1 系統(tǒng)結(jié)構(gòu)圖
以上五大模塊主要由以下部件構(gòu)成STM32F103單片機(jī)核心電路、LD3320語(yǔ)音識(shí)別模塊、OLED12864、ISD4003。STM32F103為數(shù)字分析處理模塊,LD3320芯片作為負(fù)責(zé)語(yǔ)音識(shí)別模塊主控芯片,OLED12864作為顯示輸入模塊主要器件,而ISD4003芯片主要作為語(yǔ)音錄放模塊。
本系統(tǒng)設(shè)計(jì)使用STM32F103C8T6作為主控芯片。STM32F103C8T6是一款增強(qiáng)型系列微控制器,使用高性能的ARMRCortexTM-M3 32位的RISC內(nèi)核。它的指令代碼完美兼容了51單片機(jī),具有高性能、低電壓、低功耗、低風(fēng)險(xiǎn)。
本設(shè)計(jì)中,語(yǔ)音識(shí)別模塊的核心是LD3320芯片。該模塊使用ASR(Auto speech recognition)技術(shù)。該技術(shù)識(shí)別率高達(dá)95%,快速且穩(wěn)定。該模塊工作時(shí),先經(jīng)過(guò)MIC輸入聲音施行頻譜分析,再將語(yǔ)音特征提取并匹配重點(diǎn)字詞的語(yǔ)音信息。后將匹配程度最高分作為識(shí)別輸出結(jié)果。圖2為L(zhǎng)D3320與主控芯片接線圖。
圖2 LD3320與主控芯片接線圖
OLED12864作為本系統(tǒng)主要顯示模塊,通過(guò)IIC接線與主控芯片接連通訊,顯示密碼輸入情況,提示系統(tǒng)處于語(yǔ)音識(shí)別或者錄入狀態(tài)。如圖3為OLED12864與主控芯片接線圖。
圖3 OLED12864與主控芯片接線圖
本系統(tǒng)利用REC-1000語(yǔ)音模塊集成了ISD4004語(yǔ)音芯片的單片機(jī)控制芯片及其外圍電路,并提供了常用端口的接口插口形式,使語(yǔ)音芯片的使用簡(jiǎn)單化??捎肐/O口仿真SPI通信協(xié)議,工作電壓3V,錄放時(shí)間為8到16min,高保真錄音。如圖4為ISD4004與主控芯片的接線圖。
圖4 ISD4004與主控芯片的接線圖
對(duì)所有變量進(jìn)行初始化后進(jìn)入循環(huán)判斷。先輸入密碼,密碼信號(hào)正確,則檢測(cè)語(yǔ)音信號(hào)輸入。解析信號(hào),根據(jù)語(yǔ)音信號(hào)執(zhí)行相應(yīng)的語(yǔ)音命令,再按照各個(gè)命令執(zhí)行相應(yīng)的程序。主程序流程圖如圖5所示。
圖5 主程序流程圖
圖6 語(yǔ)音識(shí)別原理框圖
本系統(tǒng)語(yǔ)音識(shí)別模塊由LD3320組成,利用ASR技術(shù)識(shí)別。圖6是語(yǔ)音識(shí)別原理框圖。語(yǔ)音識(shí)別流程采用中斷方式工作。設(shè)計(jì)程序時(shí),首先要通用初始化和語(yǔ)音初始化。再寫入識(shí)別列表添加關(guān)鍵詞和定義識(shí)別碼。當(dāng)麥克風(fēng)采集到的聲音時(shí),將產(chǎn)生一個(gè)中斷信號(hào),再由中斷程序根據(jù)分析結(jié)果選取最高分的結(jié)果。
圖7 系統(tǒng)電路圖
通過(guò)調(diào)試,本系統(tǒng)主要通過(guò)LD3320芯片的語(yǔ)音識(shí)別模塊和ISD4004芯片的語(yǔ)音錄入輸出模塊實(shí)現(xiàn)語(yǔ)音控制的智能記事提示。以STM32作為主控芯片來(lái)協(xié)調(diào)控制各個(gè)模塊的啟動(dòng)。圖7為整個(gè)系統(tǒng)的硬件電路圖。
啟動(dòng)電源,兩盞指示燈將會(huì)亮起,OLED屏初始化。以按鍵輸入密碼,輸入錯(cuò)誤則OLED屏提示密碼輸入錯(cuò)誤。密碼輸入正確則啟動(dòng)語(yǔ)音識(shí)別模塊,若系統(tǒng)檢測(cè)到語(yǔ)音指令,如“記錄書包位置”,語(yǔ)音識(shí)別模塊將識(shí)別到反饋給主控芯片,主控芯片將發(fā)出信號(hào)控制語(yǔ)音錄入輸出模塊啟動(dòng)錄音功能記錄位置。當(dāng)說(shuō)出語(yǔ)音指令“查詢書包位置”,語(yǔ)音識(shí)別模塊識(shí)別到指令之后,將會(huì)反饋到主控芯片,主控芯片將發(fā)出信號(hào)使語(yǔ)音錄入輸出模塊輸出之前記錄到的物品位置。系統(tǒng)實(shí)物接線圖如圖8所示。
圖8 系統(tǒng)實(shí)物圖
結(jié)論:本設(shè)計(jì)提出了語(yǔ)音記事提示功能,對(duì)比于其它形式的記事本更簡(jiǎn)單易上手,更大程度上解放了雙手,方便了弱勢(shì)群體生活。但同時(shí)系統(tǒng)簡(jiǎn)便的同時(shí)指令也比較單一,但出于成本控制采用了按鍵式密碼,按鍵式密碼雖然提高了安全性但也不夠便捷。因此對(duì)于該系統(tǒng),還有很大的研發(fā)空間。