虛擬講師在線課程教學(xué)新技術(shù)探索與實(shí)踐

2022-05-30 22:58:53謝榕

中國(guó)教育信息化 2022年9期

摘? ?要：針對(duì)當(dāng)前國(guó)內(nèi)在線課程建設(shè)普遍存在的制作成本高、更新推廣慢等現(xiàn)實(shí)問(wèn)題，文章將深度學(xué)習(xí)、自然語(yǔ)言處理等最新人工智能技術(shù)與在線課程有機(jī)融合，提出虛擬講師的定義、內(nèi)涵、技術(shù)框架，并開(kāi)發(fā)一款面向在線教學(xué)的虛擬講師軟件系統(tǒng)，來(lái)模擬教師講課的教學(xué)場(chǎng)景。在此基礎(chǔ)上，提出基于該系統(tǒng)的課件制作流程，并運(yùn)用于《人工智能引論》慕課教學(xué)實(shí)踐。通過(guò)探索基于虛擬講師技術(shù)的在線課程創(chuàng)新教學(xué)模式，有效推動(dòng)國(guó)內(nèi)在線課程可持續(xù)發(fā)展。

關(guān)鍵詞：在線課程教學(xué);虛擬講師;虛擬講師軟件系統(tǒng);深度學(xué)習(xí);自然語(yǔ)言處理

中圖分類號(hào)：G434;G642? ? ? 文獻(xiàn)標(biāo)志碼：A? ? ? 文章編號(hào)：1673-8454（2022）09-0123-06

一、研究背景及問(wèn)題解決的思路

（一）傳統(tǒng)在線課程現(xiàn)狀及面臨的問(wèn)題

互聯(lián)網(wǎng)技術(shù)、共享經(jīng)濟(jì)理念正推動(dòng)著知識(shí)共享的發(fā)展，隨之產(chǎn)生多種在線課程優(yōu)質(zhì)教育資源的共享模式，如慕課、SPOC、騰訊課堂等。這些線上課程作為“互聯(lián)網(wǎng)+教育”的重要產(chǎn)物，因其課程資源豐富與開(kāi)放性等特點(diǎn)在最近幾年獲得迅猛發(fā)展。以中國(guó)大學(xué)MOOC-愛(ài)課程（http：//www.icourses.cn/home/）為例，它是一個(gè)向社會(huì)大眾免費(fèi)提供中國(guó)知名高校大規(guī)模開(kāi)放在線課程的學(xué)習(xí)資源分享平臺(tái)，目前課程數(shù)量達(dá)1600多門，報(bào)名選課超1200多萬(wàn)人次。在線課程建設(shè)的重要環(huán)節(jié)在于將教案講義、課件內(nèi)容以視頻形式存儲(chǔ)到網(wǎng)課平臺(tái)，提供給學(xué)習(xí)者學(xué)習(xí)使用。由于它不受時(shí)間與空間的限制，同時(shí)可以共享優(yōu)質(zhì)教育資源，因此，一直受到人們的普遍關(guān)注和歡迎。特別是，受新冠疫情影響，線下教育被暫停的情況下，線上課程作為遠(yuǎn)程教育的優(yōu)勢(shì)開(kāi)始顯露并發(fā)揮重要作用。[1-3]

作為一種新型在線教育模式，在線課程不僅能改變教與學(xué)的方式，同時(shí)也能改變課程開(kāi)發(fā)及課程資源制作的模式。[4]然而，在線教學(xué)課件制作、教師視頻錄播等工作，過(guò)程煩瑣、費(fèi)時(shí)費(fèi)力，且后續(xù)更新成本偏高[5]、周期較長(zhǎng)。在線課程將傳統(tǒng)課堂遷移至互聯(lián)網(wǎng)上，需要高度概括、凝練教學(xué)方案，同時(shí)，課堂教學(xué)還需要根據(jù)知識(shí)的日新月異對(duì)教學(xué)內(nèi)容不斷地進(jìn)行調(diào)整。網(wǎng)絡(luò)課程設(shè)計(jì)中，如何選取適用于網(wǎng)課的教學(xué)內(nèi)容以及講解流程，如何以最精準(zhǔn)、清晰的方式講解知識(shí)，如何改進(jìn)教學(xué)內(nèi)容，以及如何保證網(wǎng)課質(zhì)量與學(xué)生學(xué)習(xí)效果等，都與傳統(tǒng)課堂教學(xué)有著很大差異，煩瑣的過(guò)程對(duì)大部分教師來(lái)說(shuō)十分困難。相比傳統(tǒng)面授式課堂教學(xué)，在線教學(xué)需要教師投入傳統(tǒng)課程教學(xué)的2～4倍甚至更多的時(shí)間和精力。為了制作高質(zhì)量的在線課程，需要課程設(shè)計(jì)專家、講課教師、攝影人員，以及后期編輯人員所在的團(tuán)隊(duì)進(jìn)行通力合作，更何況教學(xué)內(nèi)容的更新會(huì)造成制作課程人力成本偏高。因此，在線課程在實(shí)際推廣過(guò)程中往往存在諸多限制與問(wèn)題，比如教學(xué)資源單一，特別是網(wǎng)課日常維護(hù)管理和后續(xù)更新不及時(shí)等。當(dāng)前，線上教學(xué)更多的還是一種線下教育的補(bǔ)充形式。

（二）國(guó)內(nèi)外研究現(xiàn)狀

1.教育機(jī)器人

教育機(jī)器人（Educational Robotics）[6]的提出最早源自20世紀(jì)60年代美國(guó)麻省理工學(xué)院創(chuàng)辦的人工智能實(shí)驗(yàn)室。其后，意大利技術(shù)學(xué)院、美國(guó)卡內(nèi)基梅隆大學(xué)等，對(duì)機(jī)器人的視覺(jué)、聽(tīng)覺(jué)、對(duì)話能力提出改進(jìn)措施，并研發(fā)教育機(jī)器人。21世紀(jì)初，一些講課機(jī)器人開(kāi)始在課堂上試用。例如，韓國(guó)智能機(jī)器人產(chǎn)業(yè)協(xié)會(huì)與韓國(guó)信息通訊部率先研發(fā)、制造用于英文教學(xué)的講課機(jī)器人[7]，并投放到該國(guó)三個(gè)城市進(jìn)行試驗(yàn)教學(xué)。日本東京理科大學(xué)開(kāi)發(fā)Saya課堂教學(xué)機(jī)器人[8]，構(gòu)造出一個(gè)具有女性外觀、由可拉伸材質(zhì)做成且能呈現(xiàn)多種表情的人體模型，在教室里被賦予代課教師的職責(zé)。近年來(lái)，國(guó)內(nèi)一些大學(xué)也積極地研究講課機(jī)器人技術(shù)。例如，九江學(xué)院智能機(jī)器人工作室研發(fā)的“小美”機(jī)器人[9]，不僅能按照講義PPT給學(xué)生上課，還能與學(xué)生進(jìn)行簡(jiǎn)單交流。這些實(shí)體教育機(jī)器人雖然一定程度上能夠在課堂教學(xué)中發(fā)揮作用，但由于成本偏高，現(xiàn)實(shí)中大面積在高校推廣是非常困難的。

2.語(yǔ)音驅(qū)動(dòng)人臉動(dòng)畫(huà)技術(shù)

隨著人工智能技術(shù)的不斷發(fā)展，一些研究學(xué)者采用深度學(xué)習(xí)技術(shù)開(kāi)展虛擬講課機(jī)器人的研究。語(yǔ)音技術(shù)及語(yǔ)音驅(qū)動(dòng)面部視頻合成技術(shù)是虛擬講課機(jī)器人的核心組件，其中面部區(qū)域唇形部分的運(yùn)動(dòng)與語(yǔ)音之間相互匹配尤為關(guān)鍵，視聽(tīng)效果良好的面部視頻能夠更有效地吸引注意力并輔助人們更好地理解音頻內(nèi)容。有學(xué)者提出，利用任意文本生成音頻和照片級(jí)的真實(shí)感唇同步視頻的架構(gòu)——ObamaNet，實(shí)現(xiàn)模仿美國(guó)前總統(tǒng)奧巴馬講話視頻，并保證精確唇音同步。[10]但該模型對(duì)人物形象不具備泛化能力。有學(xué)者利用生成對(duì)抗網(wǎng)絡(luò)模型開(kāi)發(fā)出Speech-Driven-Animation模型，對(duì)任意給定說(shuō)話者的一段語(yǔ)音和圖像直接生成唇音同步的人臉動(dòng)畫(huà)。[11]該方法關(guān)注于臉部區(qū)域而忽略圖像背景區(qū)域的生成，從而影響生成視頻的真實(shí)感。同時(shí)，雖然該方法可以輸入特定說(shuō)話者的形象，但實(shí)際泛化效果并不好。有學(xué)者基于生成對(duì)抗網(wǎng)絡(luò)提出LipGAN及其改進(jìn)模型Wav2Lip。[12]它可接受一段目標(biāo)語(yǔ)音和一段任務(wù)視頻作為輸入，生成與目標(biāo)語(yǔ)音相匹配的視頻結(jié)果，為目前一種較好的語(yǔ)音驅(qū)動(dòng)人臉動(dòng)畫(huà)技術(shù)。

3.虛擬人臉產(chǎn)品

美國(guó)計(jì)算機(jī)視覺(jué)公司的Loom.ai產(chǎn)品[13]可以實(shí)現(xiàn)從一張靜態(tài)圖像中捕捉人類面部特征的功能，創(chuàng)建一個(gè)逼真的3D虛擬化身。國(guó)內(nèi)在該方面的研究起步相對(duì)較晚，但近年來(lái)也相繼研發(fā)出一些虛擬人臉產(chǎn)品。北京沃富瑞德文化傳播公司研制有表情的仿生機(jī)器人[14]，由有表情的仿生機(jī)器人和卡通形象機(jī)器人組成，以自由立體曲面表面顯示技術(shù)VOFRID（Vertical Optical Fiber Radiant Immersive Display）為核心，改變機(jī)器人千篇一律的機(jī)械形態(tài)，賦予機(jī)器人擬人化的面部表情。科大訊飛公司提出先進(jìn)的AI虛擬主播解決方案（https：//www.xfyun.cn/solutions/virtual-host-solution），利用科大訊飛的語(yǔ)音合成、圖像處理，以及機(jī)器翻譯等多項(xiàng)人工智能技術(shù)，實(shí)現(xiàn)從文本到視頻的自動(dòng)輸出，支持主播多語(yǔ)言視頻生成，并可以實(shí)現(xiàn)定制真人形象以及卡通3D形象。但虛擬主播形象基本固定，制作特定人物形象所需成本偏高，推廣不易。國(guó)內(nèi)外公司研發(fā)的這些產(chǎn)品技術(shù)先進(jìn)，但核心技術(shù)未被公開(kāi)。

（三）解決思路與方法

如何推進(jìn)在線課程教學(xué)模式的改革、運(yùn)用新技術(shù)實(shí)現(xiàn)在線課程智能化建設(shè)并收獲良好的教學(xué)效果具有十分重要的意義。特別是，未來(lái)元宇宙將促進(jìn)在線教學(xué)從單一教育教學(xué)向全方位教育教學(xué)實(shí)現(xiàn)根本性轉(zhuǎn)變。[15]國(guó)內(nèi)外研究者曾研發(fā)出一些教育機(jī)器人產(chǎn)品來(lái)減輕教師講課負(fù)擔(dān)，然而，這些實(shí)物機(jī)器人需要大量硬件設(shè)備、巨額資金的支持，后期維護(hù)成本高，推廣不易。當(dāng)前，計(jì)算機(jī)圖形/圖像技術(shù)不斷發(fā)展，我們完全可以研發(fā)一種在線虛擬講課機(jī)器人軟件系統(tǒng)，使其能智能化地模擬教師講課的場(chǎng)景與過(guò)程，以便節(jié)約成本;同時(shí)，發(fā)揮軟件系統(tǒng)的優(yōu)勢(shì)，設(shè)計(jì)出善于講課、表情生動(dòng)形象的虛擬講課機(jī)器人來(lái)代替教師講課，節(jié)省教師的時(shí)間和精力。然而，根據(jù)上述對(duì)國(guó)內(nèi)外研究現(xiàn)狀的調(diào)研情況，在線虛擬講課機(jī)器人還是一個(gè)全新概念，目前，國(guó)內(nèi)外尚沒(méi)有在線虛擬講課機(jī)器人實(shí)際教學(xué)先例。本文旨在提出并研發(fā)一種虛擬講師技術(shù)，以便基于虛擬講師開(kāi)展在線教學(xué)實(shí)踐?；谏疃壬窠?jīng)網(wǎng)絡(luò)學(xué)習(xí)算法與自然語(yǔ)言處理理論，研究一種虛擬人臉的生成方法，利用輸入的說(shuō)話文本和真人圖像或視頻信息，生成流暢自然、唇音同步的個(gè)性化人臉動(dòng)畫(huà)，實(shí)現(xiàn)一款能模擬教師講課的虛擬講師化身。同時(shí)，在開(kāi)發(fā)該虛擬講師的基礎(chǔ)上，以該講課機(jī)器人模型為基礎(chǔ)，以《人工智能引論》課程教學(xué)為實(shí)踐對(duì)象，研究虛擬講師開(kāi)展慕課教學(xué)的實(shí)踐方法，使虛擬講師講課能夠取得良好的教學(xué)效果。

二、虛擬講師的定義與內(nèi)涵

早期有學(xué)者曾對(duì)虛擬教師的研究進(jìn)行綜述，但迄今為止尚無(wú)虛擬講師的權(quán)威定義。[16]本文提出一個(gè)廣義的虛擬講師（Virtual Lecturer，簡(jiǎn)稱VL）的概念，將其定義為利用人工智能、自然語(yǔ)言處理、計(jì)算機(jī)圖形/圖像等技術(shù)設(shè)計(jì)和渲染的，用來(lái)代替真實(shí)教師的一種虛擬化身，能夠智能化地模擬一般教師講課的教學(xué)場(chǎng)景與過(guò)程。其實(shí)質(zhì)為一種講課機(jī)器人軟件，機(jī)器人能模擬教師運(yùn)用課程課件給學(xué)習(xí)者講解教學(xué)內(nèi)容，并具有形象逼真、表情豐富、動(dòng)作生動(dòng)的特點(diǎn)。

實(shí)際應(yīng)用中，可以為虛擬講師設(shè)定化身、語(yǔ)速、音色，甚至表情和動(dòng)作等基本元素，使其更具真實(shí)性、生動(dòng)性、親和力。新一代虛擬講師還應(yīng)具有交互能力，能夠在一個(gè)三維虛擬教學(xué)環(huán)境中與學(xué)習(xí)者實(shí)時(shí)開(kāi)展互動(dòng)，解答學(xué)習(xí)者提出的各種課程學(xué)習(xí)方面的問(wèn)題。作為智能計(jì)算技術(shù)的一種應(yīng)用，隨著人工智能技術(shù)的不斷發(fā)展，虛擬講師為構(gòu)建集視覺(jué)、聽(tīng)覺(jué)為一體的虛擬教學(xué)環(huán)境提供基礎(chǔ)。

三、虛擬講師軟件系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)

為了實(shí)現(xiàn)虛擬講師，需要設(shè)計(jì)并開(kāi)發(fā)一個(gè)虛擬講師軟件系統(tǒng)（Virtual Lecturer Software System，簡(jiǎn)稱VLSS）。本文將VLSS定義為一種虛擬講師生成軟件，可利用所提供的說(shuō)話文本、真人圖像或視頻信息，生成能模仿普通人說(shuō)話的語(yǔ)音音頻、口型動(dòng)作，實(shí)現(xiàn)唇音同步的個(gè)性化人臉動(dòng)畫(huà)。

（一）VLSS技術(shù)框架

雖然，目前已有一些研究學(xué)者提出虛擬講師的制作方法，但是，一般虛擬人物過(guò)于簡(jiǎn)單、單調(diào)，只有嘴巴張開(kāi)、閉合的簡(jiǎn)單動(dòng)作，且不能泛化人物，距離實(shí)際應(yīng)用尚有一定差距。本文提出如圖1所示的虛擬講師技術(shù)框架，根據(jù)用戶輸入的講課內(nèi)容文本以及教師本人的圖像或視頻，運(yùn)用深度學(xué)習(xí)模型，可生成教師講授該段輸入文本所對(duì)應(yīng)的講課教學(xué)視頻。該框架由文本轉(zhuǎn)音頻、唇域提取、唇音同步合成，以及唇域替換四個(gè)主要部分組成。

1.文本轉(zhuǎn)音頻

它接收輸入的講課文本，輸出產(chǎn)生的講課音頻文件。通過(guò)調(diào)用百度開(kāi)放的語(yǔ)音合成API，將輸入文本.txt文件轉(zhuǎn)換成該段文字對(duì)應(yīng)的音頻.wav文件。目前有4種聲音可供選擇，還可以使用語(yǔ)音克隆功能，使聲音更能滿足實(shí)際教學(xué)需求。同時(shí)，經(jīng)過(guò)測(cè)試與調(diào)整，可設(shè)置合適的音頻語(yǔ)速、語(yǔ)調(diào)、發(fā)音模式，使語(yǔ)音較為自然，且語(yǔ)調(diào)有一定變化，模擬人的自然說(shuō)話過(guò)程。如果用戶事先已錄制好教學(xué)音頻，則可以通過(guò)添加音頻的方式直接選擇錄制音頻文件。

2.唇域提取

它利用開(kāi)源的深度學(xué)習(xí)模型Wav2Lip[12]提供的預(yù)訓(xùn)練好的人臉檢測(cè)模型提取嘴唇區(qū)域。利用它的人臉檢測(cè)S3FD（Single Shot Scale-invariant Face Detector）算法，在大尺寸圖像或視頻中準(zhǔn)確地檢測(cè)人臉區(qū)域，也可對(duì)模糊人臉或小尺寸人臉進(jìn)行人臉檢測(cè)。提取人臉后，調(diào)用該算法的flip_detect（）函數(shù)從人臉區(qū)域提取嘴唇所在區(qū)域。

3.唇音同步合成

它對(duì)輸入的音頻以及所產(chǎn)生的唇形進(jìn)行唇音同步神經(jīng)網(wǎng)絡(luò)訓(xùn)練。該部分由判別器和生成器組成一對(duì)生成對(duì)抗網(wǎng)絡(luò)。其中，判別器用于判別每次訓(xùn)練生成的視頻幀與原視頻幀之間存在的差距，為神經(jīng)網(wǎng)絡(luò)提供學(xué)習(xí)方向。而生成器則用于生成視頻幀，并對(duì)判別器提供的視頻幀進(jìn)行改進(jìn)。經(jīng)過(guò)反復(fù)訓(xùn)練后生成較為準(zhǔn)確的唇形視頻幀。

4.唇域替換

它對(duì)原輸入的教師圖像或視頻的唇形區(qū)域進(jìn)行裁剪，替換并生成新的唇形視頻幀，最后輸出虛擬講師講課視頻。

（二）VLSS開(kāi)發(fā)

本文所開(kāi)發(fā)的VLSS系統(tǒng)由Python語(yǔ)言編寫(xiě)，采用MVC架構(gòu)，即模型層（Model）、視圖層（View）、控制層（Controller）。其中，模型層接收控制層轉(zhuǎn)發(fā)的用戶音頻數(shù)據(jù)和視頻數(shù)據(jù)，使用開(kāi)源深度學(xué)習(xí)模型Wav2Lip對(duì)這些數(shù)據(jù)進(jìn)行處理;視圖層為面向用戶的操作界面，使用Python GUI庫(kù)中的pyqt5作為構(gòu)建圖形界面的工具，它可運(yùn)行于UNIX、Windows、Mac OS等操作系統(tǒng);控制層提供控制軟件運(yùn)行邏輯，實(shí)現(xiàn)控制視圖跳轉(zhuǎn)、將數(shù)據(jù)轉(zhuǎn)發(fā)到模型層。系統(tǒng)基本功能包括文本轉(zhuǎn)音頻、唇域提取、唇音同步合成、唇域替換這些基本功能模塊。“輸入”包括講課音頻文件、講課文本、教師圖片或視頻等多種輸入形式。“輸出”為虛擬講師講課視頻輸出的窗口。“生成視頻”為用戶生成虛擬講師講課視頻動(dòng)畫(huà)的操作，選擇視頻、播放原視頻、播放視頻，是為了方便用戶而設(shè)置的選擇或觀看視頻的操作功能。

四、虛擬講師的慕課教學(xué)實(shí)踐

（一）基于VLSS的課件制作

對(duì)目前教學(xué)模式與講課方式進(jìn)行調(diào)研分析，可以看到，當(dāng)前教師使用課件PPT的授課模式在教學(xué)過(guò)程中占主流地位。[17]實(shí)現(xiàn)虛擬講師教學(xué)時(shí)，和一般傳統(tǒng)教學(xué)一樣，教師也需要根據(jù)教學(xué)大綱編寫(xiě)教案及授課內(nèi)容，并制作教學(xué)課件PPT。新型基于虛擬講師的教學(xué)模式需要對(duì)課件制作方式進(jìn)行變革。如圖2所示，將課件PPT分為三種類型：①無(wú)人物出鏡（圖2a），主要為教學(xué)內(nèi)容展示;②有人物跟隨（圖2b），由虛擬教師化身和教學(xué)內(nèi)容組成;③有人物出鏡（圖2c），由虛擬教師化身出鏡講解教學(xué)內(nèi)容。通過(guò)VLSS，在系統(tǒng)的“添加文本中”輸入教師授課時(shí)的講課文本，該內(nèi)容是虛擬講師發(fā)音材料，直接調(diào)用系統(tǒng)的文本轉(zhuǎn)音頻功能模塊可產(chǎn)生音頻文件，如圖2中的■符號(hào)，將該音頻文件插入到課件相應(yīng)位置。在系統(tǒng)的添加視頻或圖片中輸入教師本人的圖像或視頻（自拍照或自己錄制的視頻），調(diào)用系統(tǒng)的生成視頻模塊可輸出虛擬講師講授課程內(nèi)容的視頻動(dòng)畫(huà)，將該視頻文件插入到課件中。通過(guò)這三種課件類型能夠快速制作課件PPT的內(nèi)容，也可隨時(shí)方便地對(duì)教學(xué)內(nèi)容進(jìn)行更新。

基于VLSS的課件制作流程如圖3所示。①收集、整合各種有關(guān)教學(xué)內(nèi)容的素材并形成課件腳本;②根據(jù)課件PPT三種不同類型，運(yùn)行VLSS，分別調(diào)用“文本轉(zhuǎn)音頻”模塊生成講課文本音頻文件，以及調(diào)用“生成視頻”模塊形成講課視頻動(dòng)畫(huà)，在課件中添加、編輯講課音頻，以及虛擬講師形象，生成各個(gè)幻燈片幀;③將每幀幻燈片進(jìn)行合成，輸出視頻形式的課件PPT。

（二）《人工智能引論》慕課的虛擬講師教學(xué)實(shí)踐

以VLSS為平臺(tái)，以《人工智能引論》課程慕課教學(xué)為實(shí)踐對(duì)象，將該課程在武漢大學(xué)珞珈在線（http：//www.mooc.whu.edu.cn/portal）上進(jìn)行嘗試。在該慕課幻燈片中，輸入講課腳本“在這場(chǎng)圍棋人機(jī)大戰(zhàn)中，AlphaGo使用深度神經(jīng)網(wǎng)絡(luò)配合強(qiáng)化學(xué)習(xí)的訓(xùn)練方法，并利用啟發(fā)式的蒙特卡洛搜索樹(shù)算法和自我博弈，在不依賴人類棋譜先驗(yàn)知識(shí)的情況下，從零開(kāi)始自主訓(xùn)練，展現(xiàn)出極強(qiáng)的學(xué)習(xí)能力。那么，機(jī)器學(xué)習(xí)到底有著怎樣的魔力，能夠打敗我們?nèi)祟惖膰骞谲娔?？今天我們就一起?lái)學(xué)習(xí)機(jī)器學(xué)習(xí)方面的內(nèi)容”。虛擬講師能按照該腳本進(jìn)行長(zhǎng)文本解說(shuō)。為了對(duì)比實(shí)際效果，在課件PPT中添加真人講課視頻和虛擬講師講課視頻的對(duì)比畫(huà)面。由實(shí)踐可知該虛擬講師完全能有效地承擔(dān)課件PPT的講解任務(wù)。

五、結(jié)語(yǔ)

本文設(shè)計(jì)并開(kāi)發(fā)一款智能化的面向在線課程教學(xué)的虛擬講師機(jī)器人軟件產(chǎn)品，并將其運(yùn)用于《人工智能引論》慕課教學(xué)實(shí)踐，使機(jī)器人能模擬教師講課教學(xué)場(chǎng)景和過(guò)程。從實(shí)踐效果來(lái)看：①教師層面，充分發(fā)揮人工智能、計(jì)算機(jī)圖形/圖像等先進(jìn)技術(shù)，并與在線教學(xué)緊密結(jié)合，開(kāi)發(fā)在線虛擬講師，將極大地減少網(wǎng)課視頻制作成本和內(nèi)容更新成本，減輕教師制作、更新網(wǎng)課的負(fù)擔(dān)，使教師能夠全身心地投入到講課內(nèi)容的不斷改進(jìn)上，著實(shí)提高課件制作效率。②學(xué)生層面，虛擬講師由語(yǔ)音驅(qū)動(dòng)的3D動(dòng)畫(huà)生成，引入虛擬講師化身使課堂教學(xué)更加生動(dòng)形象，能有效地提高學(xué)生在網(wǎng)課教學(xué)中學(xué)習(xí)知識(shí)的興趣。③在線教育層面，在開(kāi)發(fā)VLSS基礎(chǔ)上，基于《人工智能引論》慕課教學(xué)開(kāi)展試點(diǎn)，探索一個(gè)切實(shí)可行的虛擬講師在線慕課實(shí)踐教學(xué)新模式，通過(guò)人工智能課程的實(shí)踐可推廣到其它課程，對(duì)全國(guó)在線慕課教學(xué)改革起到示范作用。

在本文研究成果基礎(chǔ)上，進(jìn)一步工作將包括：①改進(jìn)、完善VLSS的功能，豐富虛擬講師形象，使系統(tǒng)可以優(yōu)化虛擬講師的聲音、手勢(shì)動(dòng)作、面部表情等內(nèi)容，編輯出具有逼真效果的虛擬講師課件;②建設(shè)課程領(lǐng)域的知識(shí)圖譜并開(kāi)發(fā)基于知識(shí)圖譜的智能知識(shí)問(wèn)答功能，與VLSS緊密結(jié)合，實(shí)現(xiàn)具有與學(xué)生實(shí)時(shí)互動(dòng)、對(duì)話的能力;③開(kāi)發(fā)虛擬講師APP，集會(huì)講課、能交互、擅答疑為一體的虛擬講師這種學(xué)習(xí)陪伴機(jī)器人，能智能化地模擬教師講課、輔導(dǎo)全過(guò)程，使學(xué)生可以隨時(shí)有效地利用碎片時(shí)間學(xué)習(xí)課程。

參考文獻(xiàn)：

[1]潘玉立，姚志英.基于“慕課+騰訊課堂”的疫期在線教學(xué)實(shí)踐與反思[J].滁州學(xué)院學(xué)報(bào)，2020，22（3）：100-103，109.

[2]喻梅，王建榮，于健，等.基于MOOC的線上線下混合教學(xué)實(shí)踐[J].計(jì)算機(jī)教育，2021， 315（3）：1-5.

[3]呂美香，董永強(qiáng)，洪小麗，等.疫情時(shí)期高校在線教學(xué)管理實(shí)踐與思考[J].計(jì)算機(jī)教育， 2021，315（3）：20-25，30.

[4]鄭小軍.關(guān)注XR技術(shù)應(yīng)用、教學(xué)能力慕課敏捷開(kāi)發(fā)與信息化教學(xué)能力提升，加快職業(yè)教育信息化2.0落地[J].廣西職業(yè)技術(shù)學(xué)院學(xué)報(bào)，2021，14（3）：46-47.

[5]李曉，鄧麗娜，胡艷，等.高校教育教學(xué)改革研究[J].教育與教學(xué)研究，2020，34（12）：91-119.

[6]PAPERT S. Programming and problem-solving： the logo programming language[R]. In W. Feurzeig （Ed.）， Computer Systems for Teaching Complex Concepts： Final Report 1742， 1969：94-106.

[7]YUN S， SHIN J， KIM D， et al. Engkey： tele-education robot[C]. International Conference on Social Robotics，Springer-Verlag， Berlin， Heidelberg， November 24-25， 2011：142-152.

[8]HASHIMOTO T， KATO N， KOBAYASHI H. Development of educational system with the Android robot SAYA and evaluation[J]. International Journal of Advanced Robotic Systems， 2011，8（3）：51-61.

[9]江西一高?，F(xiàn)“美女機(jī)器人”講課[J].求知導(dǎo)刊，2015（11）：5.

[10]KUMAR R， SOTELO J， KUMAR K， et al. Obamanet： photo-realistic lip-sync from text[C]. 31st Conference on Neural Information Processing Systems （NIPS 2017）， Long Beach， CA， USA， December 4-9， 2017：1-4.

[11]VOUGIOUKAS K， PETRIDIS S， PANTIC M. Realistic speech-driven facial animation with GANs[J]. International Journal of Computer Vision， 2020，128：1398-1413.

[12]PRAJWAL K R， MUKHOPADHYAY R， NAMBOODIRI V P， et al. A lip sync expert is all you need for speech to lip generation in the wild[C]. Proceedings of the 28th ACM International Conference on Multimedia. Association for Computing Machinery， New York， United States， October 12-16， 2020：484-492.

[13]付藍(lán).Loom.ai 3D虛擬形象平臺(tái)亮相2019年Qualcomm驍龍技術(shù)峰會(huì)[J].計(jì)算機(jī)與網(wǎng)絡(luò)，2019，45（24）：15.

[14]北京沃富瑞德文化傳播有限公司.具有面部表情并能自動(dòng)應(yīng)答的仿真人：中國(guó)， CN106426222A[P].2017.

[15]張忠華.元宇宙何以賦能未來(lái)教育：變革與挑戰(zhàn)[J].中國(guó)教育信息化，2022，28（4）：35-43.

[16]趙慧勤，孫波，張春悅.虛擬教師研究綜述[J].微型機(jī)與應(yīng)用，2010，29（5）：1-5，8.

[17]雷武超，吳振強(qiáng).結(jié)構(gòu)化課件自動(dòng)生成系統(tǒng)設(shè)計(jì)方案[J].中國(guó)教育技術(shù)裝備，2016（12）：30-34.

作者簡(jiǎn)介：

謝榕，教授，博士，主要研究方向?yàn)槿斯ぶ悄埽]箱：xierong@whu.edu.cn。

Exploration and Practice of New Technologies of Online Course Teaching

by Virtual Lecturer

Rong XIE

（School of Computer Science， Wuhan University， Wuhan Hubei 430072）

Abstract： To solve the issues of high production cost， slow update and promotion of online courses， this paper integrates the latest artificial intelligence technologies such as deep learning and natural language processing with online courses， and consequently proposes the definition， connotation and technical framework of virtual lecturer. It develops a virtual lecturer software system for online teaching to simulate the teaching scene. On this basis， it puts forward the courseware making process based on this system and applies it to the MOOC teaching practice of “Introduction to Artificial Intelligence”. By exploring the innovative teaching mode of online course based on the technology of virtual lecturer， it can effectively promote the sustainable development of online courses in China.

Keywords： Online course teaching; Virtual lecturer; Virtual Lecturer Software System（VLSS）; Deep learning; Natural language processing

編輯：王天鵬? ?校對(duì)：王曉明