石 磊
(上海第二工業(yè)大學 工程訓練中心,上海 201209)
隨著近年來人工智能技術的突破,人工智能正在全球范圍內(nèi)迎來新一輪的創(chuàng)新與變革,推動人類社會從信息化時代向智能化時代轉變。與此同時,人工智能領域也在發(fā)生著新的變化:一方面,以深度學習的成熟為標志,全球主要科技廠商與研究機構都在加大對機器學習與人工智能的研發(fā)和投入,將人工智能作為重要的戰(zhàn)略發(fā)展方向;另一方面,許多優(yōu)秀的人工智能和機器學習系統(tǒng)紛紛開源,與全世界的科研人員與技術開發(fā)者共享,通過“合作+開放”的戰(zhàn)略,構建了免費的技術開放平臺、生態(tài)合作平臺。人工智能技術的發(fā)展正在由學術推動的實驗室階段,走向學術界和產(chǎn)業(yè)界共同推動的產(chǎn)業(yè)化階段。
如何促進人工智能在教育中的有效應用是目前教育領域關注的熱點,《2017地平線報告(高等教育版)》也將人工智能列為長期的關鍵技術[1]。通過梳理總結國內(nèi)外現(xiàn)有的教育人工智能研究成果,本研究將當前人工智能在教育領域的研究歸為兩大類:①對教育人工智能的理論如內(nèi)涵、應用領域、發(fā)展趨勢等[2][3]的探討,分析了人工智能為教育發(fā)展帶來的挑戰(zhàn)和機遇[4];②對教育人工智能的某些具體領域如智能導師系統(tǒng)[5]、教育機器人[6]等的研究。就整體而言,人工智能在教育領域的實踐研究還較少,缺少對人工智能如何在教育領域落地和應用的探索。
結合當前人工智能技術的發(fā)展現(xiàn)狀,本研究認為采用開源系統(tǒng)開展教育人工智能的研究與應用,將是推動人工智能在教育領域落地與發(fā)展的一條有效路徑。TensorFlow是Google公司推出的開源人工智能系統(tǒng),具有靈活性、高效性以及良好的可擴展性、可移植性等特征,可應用于從智能手機到大型計算集群的多種計算環(huán)境。
TensorFlow自提出后,在學術界和工業(yè)界都得到了極大的重視與發(fā)展,如Google的多種應用包括 Gmail、Google Play、搜索、翻譯、地圖等都應用了 TensorFlow。在研究層面,一方面TensorFlow自身正在不斷地完善,其深度學習算法和API等保持著持續(xù)更新和演進。如2017年5月,Google推出了 TensorFlow研究云,這是一個可以免費提供的云端張量處理器(Tensor Processing Unit,TPU)集群,以支持廣泛的計算密集型研究項目[7]。另一方面,越來越多的研究選擇使用TensorFlow,包括一些頂尖的學術研究項目也采用TensorFlow進行人工智能研究并取得了多項卓越的科研成果[8],開發(fā)人機博弈系統(tǒng)Alphago的DeepMind也將全部研究重點移到了TensorFlow。可以說,TensorFlow正在形成一個通過研究、應用與發(fā)展相互促進的良性循環(huán)。
TensorFlow是Google公司推出的一個使用數(shù)據(jù)流圖進行數(shù)值計算的開源人工智能軟件庫,最初由Google大腦團隊為了研究機器學習和深度神經(jīng)網(wǎng)絡而開發(fā),之后于2015年10月宣布開源。機器學習與深度學習是人工智能技術中最核心、最關鍵的部分,正是深度學習的發(fā)展帶動了人工智能近年來發(fā)展的新浪潮,推動著“大數(shù)據(jù)+深度模型”的發(fā)展。TensorFlow提供了豐富的構建和訓練機器學習模型的API庫,支持卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks,RNN)、長短期記憶網(wǎng)絡(Long Short Term Memory Networks,LSTMN)等深度神經(jīng)網(wǎng)絡模型。TensorFlow的基本架構如圖1所示。其中,設備層提供TensorFlow的運行環(huán)境;前端則負責提供編程模型,并支持多語言編程環(huán)境。在應用中,通過前端調(diào)用TensorFlow核心API,實現(xiàn)TensorFlow在不同設備環(huán)境下的運行。
圖1 Tensor Flow的基本架構
TensorFlow的主要特征有:①靈活性與可移植性。在設備層,TensorFlow能夠運行在不同類型和大小的機器上,如臺式機、服務器、手機移動設備等,并可以方便地進行移植。在前端,TensorFlow支持C++、Python、Go、Java、Lua、Javascript、R等主流語言。TensorFlow核心庫對CPU/GPU是透明的,其分布式架構使得在大規(guī)模數(shù)據(jù)集上的模型訓練可以在合理的時間內(nèi)完成。②易用性與高效性。TensorFlow工作流易于理解,能夠方便地構建和實現(xiàn)已有的復雜機器學習架構。同時,目前已有多種高層接口構建在TensorFlow之上,如Keras、SkFlow等。TensorFlow庫的高性能、高效率特征,還可以將硬件的計算潛能全部發(fā)揮出來。③促進科學研究進程。以往研究者在科研中的算法需要大量的編碼工作才能轉化為產(chǎn)品,而使用TensorFlow可以幫助研究者直接嘗試新的算法,通過訓練和使用模型,更便捷地將研究成果轉化為實際產(chǎn)品,故有效地提高了科研產(chǎn)出率。④良好的技術支持與完善的社區(qū)。Google投入了巨大的資源為TensorFlow提供支持和引導并且鼓勵社區(qū)參與,使用者通過廣泛的社區(qū)支持可以方便地獲取幫助。
當前,Google、Microsoft、Facebook等科技公司和多家研究機構都推出了開源的人工智能與機器學習框架,其中主要開源框架的比較如表1所示。結果顯示,較之Caffe、MXNet、CNTK、Theano、Torch、PaddlePaddle等主要開源框架,TensorFlow在架構設計、性能、應用等方面的表現(xiàn)均更為出色。
表1 主要開源框架的比較
TensorFlow為教育人工智能的研究與開發(fā)提供了良好的基礎和支持。在應用開源系統(tǒng)進行教育人工智能系統(tǒng)的設計與實現(xiàn)時,需要遵循以下原則——
在教育人工智能研究中,要注意“人工智能教育不同于娛樂游戲產(chǎn)品,無論是應用還是市場開發(fā),都必須充分尊重教育自身的規(guī)律?!盵9]設計教育人工智能產(chǎn)品是在設計一個具有主動學習、成長、預測能力的系統(tǒng),用戶、目標、問題和場景是進行教育人工智能系統(tǒng)設計時需特別注意考慮的要素。從教育需求出發(fā),用戶群分析和目標分析是進行系統(tǒng)設計的前提,而明確應用場景和要解決的問題是進行系統(tǒng)設計的關鍵。在此基礎上,通過教師、教學設計者、教學軟件開發(fā)者的共同參與,完成系統(tǒng)的模型構建和功能模塊設計。
在具體的實現(xiàn)方面,應充分發(fā)揮TensorFlow開源系統(tǒng)的優(yōu)勢,選擇合適的TensorFlow技術和相關技術,將系統(tǒng)模型從教學研究變成教育產(chǎn)品,具體可從以下方面著手:①在應用中可以使用TensorFlow Serving導出和應用模型——TensorFlow Serving是一個高性能的服務系統(tǒng),用于運行通過機器學習得到的模型,使模型能夠更迅速、更便捷地進入產(chǎn)品開發(fā)過程;②可以通過 TensorFlow Ecosystem與多種開源框架融合,實現(xiàn)不同開發(fā)環(huán)境和系統(tǒng)的互通;③在基于TensorFlow教育人工智能系統(tǒng)的應用中,注意充分發(fā)揮其分布式、可擴展性、跨平臺性等優(yōu)勢。
人工智能在教育領域的應用被賦予了極大的希望。結合上文相關TensorFlow的分析和教育信息化現(xiàn)狀,本研究認為TensorFlow在教育領域可應用于教育大數(shù)據(jù)分析、學習推薦系統(tǒng)、教學游戲和教育機器人等方面,助力智能教學應用的設計與實現(xiàn)。
教育大數(shù)據(jù)的主要類型包括文本數(shù)據(jù)、語音數(shù)據(jù)、圖像數(shù)據(jù)、視頻數(shù)據(jù)、行為數(shù)據(jù)等,海量復雜的學習數(shù)據(jù)需要有效的方法進行分析以產(chǎn)生更好的教育價值。本研究總結了 TensorFlow在教育大數(shù)據(jù)分析領域的主要應用,如表2所示。
表2 Tensor Flow在教育大數(shù)據(jù)分析領域的主要應用
(1)文本數(shù)據(jù)的分析與應用
文本是教育系統(tǒng)的主要數(shù)據(jù)類型,TensorFlow對文本數(shù)據(jù)分析提供的主要支持有:文本分類、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、長短期記憶網(wǎng)絡等。在此基礎上,可以實現(xiàn)教育大數(shù)據(jù)分析領域中的問答系統(tǒng)、自動評分、情感分析等應用。
①問答系統(tǒng):隨著機器學習與自然語言處理技術的發(fā)展,在各類大規(guī)模知識庫和海量信息的支持下,問答系統(tǒng)的功能得以不斷提升。TensorFlow能夠使用深度學習的方法完成問答系統(tǒng)的關鍵任務,如問題分類、答案選擇、答案自動生成等,從而使問答系統(tǒng)更為準確地理解以自然語言形式描述的用戶提問,并通過檢索問答知識庫返回簡潔、精確的匹配答案。
②自動評分:大規(guī)模在線學習環(huán)境下的自動評分方法受到教師越來越多的關注,而自動評分的關鍵技術包括自然語言處理、語義分析等。TensorFlow的深度學習框架提供了良好的技術方案,可以對學習者的全量數(shù)據(jù)進行分析,實現(xiàn)對學習結果和學習表現(xiàn)的實時跟蹤與評價,給出相應的等級或分數(shù),并發(fā)現(xiàn)作弊現(xiàn)象。
③情感分析:從認知科學的角度來看,情感既是智能的一部分,也是教學交互的重要要素。應用情感計算理論與技術,有助于教師監(jiān)測學習者的情感變化,調(diào)整教學策略和方法,實時給予學習者情感反饋,使教學質量達到最佳[10]。TensorFlow的情感分析API可以實現(xiàn)更深的語義理解和多模態(tài)情感分析,實現(xiàn)人機交互中情感、情緒的識別與理解,使教學系統(tǒng)更加人性化。
(2)語音數(shù)據(jù)的分析與應用
隨著教學系統(tǒng)的發(fā)展特別是移動學習的廣泛應用,語音數(shù)據(jù)的使用越來越多并已成為一種重要的交流方式,語音會話系統(tǒng)的設計也因此成為了研究者關注的一個重點。其中,基于人工智能的虛擬助手被認為是構建“對話即平臺”的信息系統(tǒng)的核心。TensorFlow能夠對所獲取的語音信息進行深度神經(jīng)網(wǎng)絡分析,提供方便有效的模型和方法,從而支持語音識別、語音檢索等功能,構建語音交互型應用,更好地支持教學。
(3)圖像數(shù)據(jù)的分析與應用
圖像識別是機器學習的一項重要任務。TensorFlow提供良好的圖像分類模型和處理接口,可以實現(xiàn)拍照搜題、圖像自動批注等功能,故增強了學習系統(tǒng)的智能化。如拍照搜題應用,通過大規(guī)模題庫支持,基于圖像識別技術,由系統(tǒng)匹配題庫,能自動為學習者返回題目答案和解題方法。圖像自動批注和注解也是一種有價值的應用,特別是在當前海量學習資源中有很多圖像沒有說明,而通過使用深度學習來自動生成圖像的注解,就為圖像提供了相應的描述。
(4)視頻數(shù)據(jù)的分析與應用
隨著慕課等在線學習的發(fā)展,基于視頻的學習越來越普及,視頻資源的多種處理需求也應運而生,如考試監(jiān)控中的人臉識別和在線課程中的視頻互動分析就是當前教育視頻場景中的典型應用。人工智能技術是解決海量視頻資源分析的關鍵技術,TensorFlow具有視頻分析的各類API,能夠有效地實現(xiàn)視頻中的物體識別、視頻分類、視頻檢索、視頻自動標簽等功能。
(5)行為數(shù)據(jù)的分析與應用
當前智能移動設備特別是手機搭載了越來越多、越來越精確的傳感器。TensorFlow系統(tǒng)具有物體監(jiān)測 API,能夠利用智能手機搭載的傳感器,結合深度學習技術對數(shù)據(jù)進行分析,最終可識別用戶的行為。這種行為識別一方面可以實現(xiàn)對學生行為的實時監(jiān)測,另一方面所獲取的行為數(shù)據(jù)將為學習者分析提供有效的參考。
在教育領域,個性化學習推薦是指根據(jù)學習者的具體學習情況,為學習者推薦個性化、適應性的課程和資源,它是大數(shù)據(jù)時代和信息智能時代提高學習效果的一種有效方式。在推薦系統(tǒng)的研究中,“寬度與深度學習”(Wide & Deep Learning)是集成于TensorFlow的一種有效推薦算法,它通過將深度神經(jīng)網(wǎng)絡(用于歸納)與寬線性模型(用于記憶)聯(lián)合進行訓練,取得了良好的推薦效果[11]。
本研究設計了一種基于寬度與深度學習的通用型個性化學習推薦系統(tǒng),如圖2所示。該系統(tǒng)基于學習者信息、學習資源的訪問行為等數(shù)據(jù),為學習者推薦相關的學習資源。該系統(tǒng)的推薦部分包括候選生成和排序兩個模塊:首先,由候選生成模塊通過機器學習或人工定義規(guī)則等方法,生成高相關性的候選集合數(shù)據(jù);隨后,排序模塊使用“寬度與深度學習”推薦算法,對候選集合數(shù)據(jù)進行排序,最終產(chǎn)生推薦結果。
人工智能在教學游戲中的應用主要涉及兩方面:①使用人工智能操作游戲,如 DeepMind團隊所設計的系統(tǒng)在多個游戲中擊敗了世界頂級玩家,證明人工智能可通過深度學習掌握游戲技巧,并獲得和人類一樣的操控力,甚至在某些方面還超過了人類;②將人工智能元素融入游戲的設計與開發(fā)中,如游戲關卡設計和非玩家控制角色(Non-player Character,NPC)類游戲等。
目前,引入人工智能要素的教學游戲還較少,這是未來教學游戲設計中需要重點考慮的問題。TensorFlow提供的深度學習算法可應用于教學游戲,并通過恰當?shù)哪P瓦x擇與訓練實現(xiàn)游戲中智能化要素的設計。如何在教學游戲中融入更多、更新穎的人工智能要素,是教學游戲設計人員面對的新課題,這就需要設計人員真正理解玩家和人工智能之間的關系,充分考慮游戲的需求和人工智能的應用,最終設計出優(yōu)秀的教學游戲作品。
人工智能是未來發(fā)展教育機器人的關鍵技術[12],而機器人也是人工智能的終極應用目標之一。教育機器人中的感知、認知和行為控制三個部分都是在機器學習和深度學習的支持下實現(xiàn)的,可以完成視覺、聽覺、情感、推理、操作、互動等行為。
TensorFlow提供了構建機器人的智能平臺支持,通過強大的深度學習算法,推動著開放性的教育機器人系統(tǒng)平臺和機器人應用軟件的發(fā)展。本研究對教育機器人的核心功能、行為描述、TensorFlow的技術支持等進行了分析,如表3所示。
表3 教育機器人分析
TensorFlow等開源人工智能系統(tǒng)為推動教育人工智能的研究與應用提供了新的思路和方法,但在研究和實踐的過程中也還存在著一些亟待解決的問題:①學習曲線相對較高。相較于其它技術領域,TensorFlow的核心技術領域——機器學習和深度學習對教育領域的研究人員、技術開發(fā)人員來說門檻較高,他們需要進行專業(yè)化的培訓和學習。由于進行以深度學習為代表的機器學習算法是研究者需掌握的一種基礎能力,而目前與此相應的人才供應相對緊缺,且流通性較弱,因此未來應加強對此領域的研究和學習,做好教育領域的人才儲備,以推動教育人工智能的發(fā)展。②教育界與產(chǎn)業(yè)界之間存在壁壘。目前,TensorFlow雖已在產(chǎn)業(yè)界得到了廣泛應用,但在教育領域相關的研究和實踐還比較滯后,教育界與產(chǎn)業(yè)界之間還存在一定的壁壘。在未來的研究和開發(fā)中,教育界應更多地加強與產(chǎn)業(yè)界的交流與合作,共享成果,共同發(fā)展。盡管人工智能在教育領域還有很長的路要走,但TensorFlow等開源框架提供了一條有效、便捷的智能系統(tǒng)設計與開發(fā)路徑。隨著人工智能生態(tài)越來越完善,研究者可以圍繞開源系統(tǒng)框架,逐步構建“平臺+內(nèi)容+終端+應用”的智能教育系統(tǒng),推動教育人工智能的落地與應用。值得注意的是,教育人工智能的最終落地需要多方面的努力,如加強人工智能人才培養(yǎng)、完善教育大數(shù)據(jù)采集、打破學界和業(yè)界壁壘、深化人工智能教學研究等。未來人工智能的發(fā)展應在政府、院校、企業(yè)的共同努力下,著力打造“人才體系+計算設施+大數(shù)據(jù)+技術框架+應用場景”的教育人工智能發(fā)展新格局。
[1]NMC. Horizon report: 2017 higher education edition[OL].
[2]閆志明,唐夏夏,秦旋,等.教育人工智能(EAI)的內(nèi)涵、關鍵技術與應用趨勢——美國《為人工智能的未來做好準備》和《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》報告解析[J].遠程教育雜志,2017,(1):26-35.
[3]Luckin R, Holmes W. Intelligence unleashed: An argument for AI in education[OL].
[4]Woolf B P, Lane H C, Chaudhri V K, et al. AI grand challenges for education[J]. AI Magazine, 2013,(4):66-84.
[5]Boulay B D. Artificial intelligence as an effective classroom assistant[J]. IEEE Intelligent Systems, 2016,(6):76-81.
[6][12]黃榮懷,劉德建,徐晶晶,等.教育機器人的發(fā)展現(xiàn)狀與趨勢[J].現(xiàn)代教育技術,2017,(1):13-20.
[7]Stone Z. Introducing the TensorFlow research cloud[OL].
[8]Esteva A, Kuprel B, Novoa R A, et al. Dermatologist-level classification of skin cancer with deep neural networks[J].Nature, 2017,(7639):115-118.
[9]新華社.人工智能“沖擊波”來臨,未來我們該如何教育孩子[OL].
[10]李勇帆,李里程.情感計算在網(wǎng)絡遠程教育系統(tǒng)中的應用:功能、研究現(xiàn)狀及關鍵問題[J].現(xiàn)代遠程教育研究,2013,(2):100-106.
[11]Cheng H T, Koc L, Harmsen J, et al. Wide & deep learning for recommender systems[A]. Karatzoglou A, Hidasi B, Tikk D, et al. Proceedings of the 1st workshop on deep learning for recommender systems[C]. New York: ACM, 2016:7-10.