顏 菱,黃志成
(廣東女子職業(yè)技術(shù)學(xué)院,廣東廣州 511450)
大眾生活隨著計算機和通信網(wǎng)絡(luò)的高速發(fā)展,被悄然改變,獲取知識的學(xué)習(xí)方式不再單一局限于線下的開班授課,而是有了更多的選擇——網(wǎng)課。2020年新型冠狀病毒的爆發(fā),更是加速推進了全民上網(wǎng)課的進程,通過網(wǎng)絡(luò)學(xué)習(xí)[1]不僅突破了時間、空間等限制,還擁有了靈活、自主和多樣等優(yōu)勢。然而,如何監(jiān)控學(xué)生在攝像頭前的學(xué)習(xí)狀態(tài)[2],提高網(wǎng)課的教學(xué)質(zhì)量,成為網(wǎng)絡(luò)課程平臺、軟件亟待解決的問題。如今,人臉識別技術(shù)被廣泛應(yīng)用于生活的方方面面,門禁、高鐵進站和移動支付等[3-4],“刷臉”成為這個時代的標簽。人臉識別是一種生物識別技術(shù),基于人的臉部特征信息進行身份識別,通過攝像頭采集人臉圖像,能夠高效、智能識別人臉。
為解決管理者對學(xué)習(xí)者線上學(xué)習(xí)的學(xué)習(xí)狀態(tài)監(jiān)控問題,文章引入人臉識別技術(shù),提出基于人臉平面及三維旋轉(zhuǎn)角度和眼睛閉合狀態(tài)等數(shù)據(jù)進行識別的智能督學(xué)輔助系統(tǒng)。
網(wǎng)絡(luò)課程即通過某種教學(xué)平臺或軟件在網(wǎng)絡(luò)上進行的遠程課程。課程形式主要分為錄播課程和直播課程。錄播課程的網(wǎng)絡(luò)教學(xué)比起傳統(tǒng)教學(xué),打破了在時間上、空間上、受教育年齡、環(huán)境等各方面的限制,給予、滿足了社會更多人群選擇豐富良好教育資源的機會和需求,最大化了教育資源的利用率。而網(wǎng)絡(luò)直播課程則有效應(yīng)對了由于突發(fā)事件,諸如出現(xiàn)嚴重疫情時,校園和教育機構(gòu)無法正常開展線下課程的情況。當網(wǎng)絡(luò)課程的學(xué)習(xí)正在被越來越多的高校和教育機構(gòu)所應(yīng)用,說明了網(wǎng)絡(luò)課程作為新興的教學(xué)模式,今后與傳統(tǒng)教學(xué)模式相輔相成,將成為重要的教學(xué)模式之一。
在網(wǎng)絡(luò)課程的廣泛應(yīng)用過程中,網(wǎng)絡(luò)學(xué)習(xí)具有優(yōu)點的同時,也出現(xiàn)一些問題。網(wǎng)絡(luò)學(xué)習(xí)的過程需要受到一定約束,獲取知識的過程更需要一定的控制,這種約束力和控制力一方面來自自我意識的控制,譬如制定學(xué)習(xí)計劃。另一方面則來自老師、家長或者上級的命令、任務(wù)、監(jiān)督等,兩者之間相互依存且相互制約。傳統(tǒng)的教學(xué)課堂通常是受后者,也稱作外部控制的約束更多;而網(wǎng)絡(luò)課堂,則更多靠自身的控制,對學(xué)生自制力有非常高的要求。然而有調(diào)查表明,大多數(shù)學(xué)生的自我控制能力并不高,因此,在網(wǎng)絡(luò)教學(xué)過程中,如何實現(xiàn)有效的監(jiān)控和督促,是提高網(wǎng)絡(luò)課程質(zhì)量的關(guān)鍵。
為解決以上問題,本文設(shè)計、開發(fā)了基于人臉識別智能督學(xué)系統(tǒng)。系統(tǒng)每間隔一段時間利用攝像頭采集學(xué)生人臉,根據(jù)采集到的圖像分析學(xué)生當前人臉左右、俯仰、平面旋轉(zhuǎn)角度和眼睛的開合程度,對比實驗采集的數(shù)據(jù)判斷學(xué)生當前學(xué)習(xí)專注度,發(fā)出相應(yīng)的提示警告以起到外部監(jiān)督作用。人臉識別的底層技術(shù)實現(xiàn)主要包含圖像預(yù)處理、人臉檢測和人臉識別三大模塊[5]。
(1)圖像預(yù)處理:攝像頭采集圖像時可能會受光照強度、環(huán)境條件等客觀因素的影響,導(dǎo)致圖像出現(xiàn)模糊、失真等問題。為提高人臉識別精確度,系統(tǒng)首先會對圖像進行灰度化、直方圖均衡化、噪聲去除等預(yù)處理。
(2)人臉檢測:采取Adaboost[6]級聯(lián)分類器檢測人臉,通過迭代訓(xùn)練出若干個弱分類器,集成效果較好弱分類器為強分類器,經(jīng)加權(quán)投票級聯(lián)強分類器形成最終分類器。能夠準確有效地識別選取圖像人臉。
(3)人臉識別:人臉識別首先將人臉檢測出來的人臉與其注冊的人臉作對比,確認是否為注冊者本人,防止代課行為。其次每間隔一段時間,捕捉人臉,通過分析人臉頭部三維旋轉(zhuǎn)角度與眼睛閉合程度,判斷臉部專注度,分析結(jié)果反饋到系統(tǒng)界面,并做出相應(yīng)的提示警告。
智能督學(xué)系統(tǒng)基于人工智能領(lǐng)域的人臉識別技術(shù),系統(tǒng)技術(shù)架構(gòu)自下而上分為底層API、接口API和應(yīng)用程序3個層面,如圖1所示。
圖1 人臉識別技術(shù)架構(gòu)示意
底層API是人臉識別技術(shù)的底層實現(xiàn),涉及軟件和硬件,尤其是各類算法模型技術(shù)等。CPU 和GPU的性能,決定了人臉識別的速度。當CPU 和GPU 的性能越強,人臉識別的速度就越快。云計算是一種分布式計算,利用大規(guī)模計算機集群,能夠在短時間內(nèi)完成數(shù)據(jù)的處理,提供強大的計算服務(wù)。人臉識別另一個關(guān)鍵是算法,通過建立數(shù)學(xué)模型,不斷優(yōu)化深度學(xué)習(xí)算法,結(jié)合視覺技術(shù),使得人臉識別技術(shù)達到商用標準。
接口API 實現(xiàn)對底層API 的封裝,包括一些常用的攝像頭調(diào)用API、網(wǎng)絡(luò)API 和JsonAPI,向上提供人臉識別API的高層調(diào)用,是系統(tǒng)的核心功能接口。
系統(tǒng)原型基于window平臺,采用C#語言編寫,UI界面使用winform進行設(shè)計。底層使用百度人臉識別API[7],實現(xiàn)核心功能。系統(tǒng)運行流程如圖2所示。
圖2 系統(tǒng)運行流程示意
用戶激活人臉識別智能督學(xué)系統(tǒng)后,人臉識別智能督學(xué)系統(tǒng)前端界面調(diào)用攝像頭,進入界面即人臉識別身份驗證,驗證通過則啟動監(jiān)控。首次使用則要求對人臉進行注冊,方能開啟監(jiān)控。每間隔一段時間,對用戶臉部進行抓拍,經(jīng)過一系列的圖像預(yù)處理傳入人臉檢測模塊標記出位置信息,進入人臉識別模塊提取特征,與后端數(shù)據(jù)庫比對、并分析學(xué)習(xí)行為姿態(tài)。分析結(jié)果上傳至云端服務(wù)器:一方面,前端界面根據(jù)結(jié)果,對用戶進行相關(guān)督學(xué)反饋;另一方面教師、家長也可以通過移動端查詢到分析結(jié)果,隨時了解學(xué)生、孩子的學(xué)習(xí)情況。
此外,本系統(tǒng)還設(shè)計了使用攝像頭的權(quán)限,每次使用督學(xué)系統(tǒng)時,只有用戶手動連接攝像頭,才能開始監(jiān)控,因此能夠有效地保護用戶隱私。
本系統(tǒng)使用百度人臉識別技術(shù),實現(xiàn)對學(xué)習(xí)者頭部和人臉識別,達到學(xué)習(xí)者監(jiān)控的目的。使用帶攝像頭的電腦啟動本系統(tǒng),激活攝像頭后,調(diào)用攝像頭API 定期抓拍學(xué)習(xí)者的頭部和人臉,然后進行人臉識別,獲取人臉的旋轉(zhuǎn)角度、表情及雙眼狀態(tài)的參數(shù)。根據(jù)參數(shù)值判別學(xué)習(xí)者當前是否在關(guān)注屏幕,從而發(fā)出督學(xué)的提醒或指示。系統(tǒng)界面如圖3 所示。經(jīng)過測試,管理者可對學(xué)習(xí)者實施有效監(jiān)控,實現(xiàn)智能督學(xué)。
文章通過對網(wǎng)絡(luò)學(xué)習(xí)的研究,有針對性地提出解決網(wǎng)絡(luò)學(xué)習(xí)中監(jiān)控力不足而導(dǎo)致的教學(xué)質(zhì)量低下的方案。展開闡述了基于人臉識別的智能督學(xué)輔助系統(tǒng)的設(shè)計及其實現(xiàn)。實際應(yīng)用過程中,人臉識別率高,能夠有效起到課堂監(jiān)督的作用。同時,系統(tǒng)也存在不足,未能實現(xiàn)采集動態(tài)視頻流數(shù)據(jù),單從靜態(tài)的人臉圖像數(shù)據(jù)做出分析;專注度判斷準則也僅是通過頭部旋轉(zhuǎn)角度和眼睛閉合程度為依據(jù)。今后如何實現(xiàn)采集動態(tài)人臉數(shù)據(jù)和豐富專注度判斷準則是進一步的研究方向。
圖3 系統(tǒng)原型界面