編者按:因?yàn)榉g的問題,“智能”“智慧”和“Intelligence”“Smart”這幾個(gè)名詞往往是混用的,如“智慧校園”對(duì)應(yīng)的單詞是“Smart School”,“智慧社會(huì)”則對(duì)應(yīng)“Intelligent Society”。“智能教育”是指人工智能教育還是智慧教育?“智能設(shè)備”是指人工智能設(shè)備還是電腦類設(shè)備?語(yǔ)義的混淆給人工智能教育的內(nèi)容和目標(biāo)界定帶來了困擾,也造成了“泛人工智能教育”(指把人工智能教育的邊界泛化到機(jī)器人、編程、物聯(lián)網(wǎng)等)的尷尬。那么,國(guó)際上對(duì)人工智能教育的認(rèn)識(shí)和定位是怎么樣的?中小學(xué)人工智能教育如何走出“泛人工智能教育”的誤區(qū)并走向國(guó)際共識(shí)?本期對(duì)話邀請(qǐng)了溫州科技高中的特級(jí)教師謝作如、清華大學(xué)毛勇博士和北京十一學(xué)校鄭子杰老師,他們將圍繞“國(guó)際共識(shí)”展開討論。
算力、數(shù)據(jù)和算法是中小學(xué)AI教育的核心
謝作如:“算力、數(shù)據(jù)和算法是推動(dòng)新一代人工智能發(fā)展的三駕馬車”,這句話對(duì)很多人來說已經(jīng)是常識(shí),隨處都能看到。我查過資料,關(guān)于“算力、數(shù)據(jù)和算法”的表述在2017版的高中信息技術(shù)課標(biāo)中并沒有出現(xiàn),但在2022年發(fā)布的義務(wù)教育信息科技課程標(biāo)準(zhǔn)中出現(xiàn)了,原文為“了解人工智能的基本特征及所依賴的數(shù)據(jù)、算法和算力三大技術(shù)基礎(chǔ)”。最初讀到這句話時(shí),我并沒有深刻感觸。過了相當(dāng)長(zhǎng)一段時(shí)間我才忽然領(lǐng)悟到——“算力+數(shù)據(jù)+算法”不就是機(jī)器學(xué)習(xí)的過程嗎?毛勇博士是清華大學(xué)AI專業(yè)的博士,屬于在新一代人工智能興起前就畢業(yè)的那一批博士,我很好奇,當(dāng)您第一次讀到“三駕馬車”的表述時(shí),想到的是什么?
毛勇:我知道“三駕馬車”這一表述的時(shí)間也已經(jīng)很晚了,大概在2017年之后。那時(shí)候深度學(xué)習(xí)已經(jīng)興起,AlphaGo已經(jīng)橫空出世。經(jīng)過媒體的傳播,AI學(xué)科也漸漸成為人人關(guān)注的“顯學(xué)”。而在2007年前后,也就是我讀書和參與科研工作的年代,AI研究基本上局限在實(shí)驗(yàn)室中。因此,我們當(dāng)時(shí)的研究工作都不需要太強(qiáng)的算力和太多的數(shù)據(jù),而且實(shí)際上這些條件也并不存在。當(dāng)看到這句話之后,結(jié)合AI應(yīng)用在生活中不斷出現(xiàn),我意識(shí)到這是對(duì)AI領(lǐng)域核心要素非常精煉的概括。它概括的是AI發(fā)展的過程,即伴隨著互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代的發(fā)展,摩爾定律帶來的算力飛速提升以及各種優(yōu)秀算法的出現(xiàn),人工智能終于走出困境成為一個(gè)真正的工程學(xué)科。對(duì)于這個(gè)時(shí)代的每個(gè)學(xué)習(xí)者來說,建立起一個(gè)學(xué)科的宏觀概念是非常重要的,所以我認(rèn)為這個(gè)總結(jié)很精辟,每個(gè)學(xué)生都應(yīng)該理解它的內(nèi)涵。
謝作如:相對(duì)于毛勇博士來說,我是“半路出家”的AI教育工作者,靠各種入門型的教程或者教材,才慢慢邁進(jìn)了AI的大門。早在2005年左右,我把當(dāng)時(shí)所有高中《人工智能初步》模塊教材都研究了一遍。即使這樣,我也僅僅了解了點(diǎn)皮毛,一度把機(jī)器人當(dāng)作實(shí)施AI教育的最好載體。2014年左右,我應(yīng)邀參加高中課標(biāo)《智能系統(tǒng)初步》模塊(這一模塊后來又更名為《人工智能初步》)的討論和初稿編寫,重點(diǎn)則落在“機(jī)器人”和“智能控制”上。第一次編寫AI教材是在2019年,我應(yīng)邀為初中生編寫一個(gè)學(xué)年的教材。最初也是中規(guī)中矩從符號(hào)主義開始學(xué)習(xí),如知識(shí)表達(dá)、推理和搜索等內(nèi)容,基本上沒有涉及神經(jīng)網(wǎng)絡(luò)。到了2020年,我們?cè)谇迦A大學(xué)出版社的初中《信息科技》教材中加入了“深度學(xué)習(xí)”的內(nèi)容。而現(xiàn)在,我的想法又有了變化:能不能把學(xué)習(xí)重點(diǎn)定位在“模型”上?因?yàn)椤八懔?數(shù)據(jù)+算法”得到的結(jié)果就是“模型”。我這十多年來的學(xué)習(xí)、認(rèn)知?dú)v程,是不是走了太多彎路?
毛勇:您這個(gè)歷程絕對(duì)不是走了彎路。您從開源硬件、互動(dòng)媒體到創(chuàng)客、3D打印,再到人工智能,一直在堅(jiān)持學(xué)習(xí),這一點(diǎn)讓我尤為佩服,而且您的學(xué)習(xí)路徑很有趣,從“編程和控制”逐步轉(zhuǎn)移到“模型和訓(xùn)練”,關(guān)注真實(shí)問題解決,為解決問題不斷學(xué)習(xí)新的知識(shí),包括機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。對(duì)于符號(hào)主義的涉獵,其實(shí)不能算是走彎路,而是在幫助自己建立對(duì)AI學(xué)科的全貌理解。而且對(duì)于之前的學(xué)習(xí)者來說,都不可避免有這樣的經(jīng)歷。您正在推廣的“以數(shù)據(jù)驅(qū)動(dòng)和模型訓(xùn)練為核心”的AI教育,我認(rèn)為是抓住了現(xiàn)階段AI學(xué)科的核心,路徑非常正確。
謝作如:謝謝毛博士的肯定。鄭子杰老師是北京十一學(xué)校的AI課程教師,我很早就在網(wǎng)上看到過您分享的一個(gè)PDF文件,標(biāo)題為《如何開設(shè)面向10年級(jí)學(xué)生的機(jī)器學(xué)習(xí)課程》。請(qǐng)鄭老師簡(jiǎn)單介紹一下,您的AI課程是什么時(shí)候開始實(shí)施的?面向哪些學(xué)生?涉及哪些課程內(nèi)容?
鄭子杰:自2020年起,我在北京市十一學(xué)校開設(shè)機(jī)器學(xué)習(xí)課程,主要針對(duì)高一和高二學(xué)生。這門課每學(xué)期都開,一個(gè)學(xué)期為一個(gè)學(xué)習(xí)周期,每周二晚上上課,每次上課的長(zhǎng)度是1.5至2小時(shí)。課程內(nèi)容主要涉及機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)、模型的訓(xùn)練與測(cè)試流程,以及包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹在內(nèi)的多種常見模型。我盡可能深入淺出地闡釋這些概念,并鼓勵(lì)學(xué)生通過問題探索,激發(fā)他們思考。例如,在介紹“支持向量機(jī)”時(shí),我會(huì)強(qiáng)調(diào)其設(shè)計(jì)理念中從“較優(yōu)解”到“最優(yōu)解”的演進(jìn)過程。在講解決策樹時(shí),我側(cè)重于交叉熵概念的講解。至于深度神經(jīng)網(wǎng)絡(luò),我會(huì)簡(jiǎn)要介紹如何使用PyTorch搭建神經(jīng)網(wǎng)絡(luò)以及一些常見的網(wǎng)絡(luò)模型,但不會(huì)深入,因?yàn)檫@需要更深厚的數(shù)學(xué)背景知識(shí),超出了一般高中生的理解范圍。我的課程主要面向那些對(duì)AI有濃厚興趣、具備一定Python編程基礎(chǔ),但又不僅僅為了參加學(xué)科競(jìng)賽的優(yōu)秀學(xué)生。雖然現(xiàn)在的AI跟升學(xué)沒關(guān)系,但有相當(dāng)一部分家長(zhǎng)會(huì)支持孩子選擇學(xué)習(xí)我的課程。
謝作如:謝謝鄭老師的介紹。您的課程很有難度,如“交叉熵”一詞就能嚇跑很多想研究AI的老師。但作為度量?jī)蓚€(gè)概率分布間的差異性信息的概念,我也認(rèn)為“交叉熵”在機(jī)器學(xué)習(xí)中實(shí)在是太重要了。對(duì)了,我們?nèi)齻€(gè)人還有一個(gè)共同的身份,都是NOAI科學(xué)教育委員會(huì)委員。NOAI是IOAI活動(dòng)的國(guó)內(nèi)版本,IOAI的全稱是國(guó)際人工智能奧林匹克,我想IOAI的方向基本上代表了AI教育方面的國(guó)際共識(shí)。那么IOAI活動(dòng)是以怎樣的形式,將不同國(guó)家的青少年放在一起“競(jìng)技”?關(guān)注哪方面的AI知識(shí)和能力?請(qǐng)毛博士簡(jiǎn)單介紹一下IOAI官方網(wǎng)站給出的模擬試題,分析涉及的AI知識(shí)以及可能的考核形式。
毛勇:IOAI的考查形式是以4人組隊(duì)的方式解決真實(shí)的人工智能研究和應(yīng)用問題。它主要包括兩輪考查,也就是兩種類型的題目。第一輪叫做科學(xué)輪,科學(xué)輪的3道題目會(huì)在國(guó)際活動(dòng)前1個(gè)月就發(fā)送給學(xué)生。學(xué)生要在國(guó)內(nèi)進(jìn)行充分的學(xué)術(shù)準(zhǔn)備和積累,然后在出國(guó)前提交一次正式的代碼和文檔,但是這部分內(nèi)容只占總分的5%。而到了國(guó)際現(xiàn)場(chǎng),這3道題目的后一半延展問題會(huì)直接給到學(xué)生手中。他們有8個(gè)小時(shí)左右的時(shí)間以團(tuán)隊(duì)為單位進(jìn)行研究、學(xué)習(xí)、寫代碼、處理數(shù)據(jù)、搭建模型,然后還有8個(gè)小時(shí)左右的時(shí)間可以用云端算力去跑訓(xùn)練。然后他們要把自己的代碼、結(jié)果和文檔在線提交??茖W(xué)輪的題目基本都是模擬了現(xiàn)實(shí)世界中非常新的科學(xué)研究問題,選手需要識(shí)別和解決現(xiàn)有方法中的局限性,并提出自己的解決方案。在這一輪中的表現(xiàn)主要取決于選手的基本編碼技能、對(duì)常用深度學(xué)習(xí)Python庫(kù)和框架的熟悉程度,以及對(duì)機(jī)器學(xué)習(xí)基本原理的理解。
謝作如:據(jù)我了解,類似IOAI活動(dòng)的面向青少年的國(guó)際人工智能活動(dòng)很少。我想請(qǐng)毛博士再介紹一下面向成人(包含大學(xué)生)的人工智能活動(dòng)有哪些,這些活動(dòng)的考核內(nèi)容和傳統(tǒng)的編程比賽(如信息學(xué)奧賽)有什么區(qū)別。
毛勇:相對(duì)而言,面向大學(xué)生和成人的國(guó)際人工智能活動(dòng)要更豐富些。例如,圖像領(lǐng)域的學(xué)術(shù)競(jìng)賽ILSVRC(ImageNet Large-Scale Visual Recognition Challenge)、對(duì)話系統(tǒng)領(lǐng)域的DSTC(Dialogue System Technology Challenge)都是學(xué)術(shù)性非常強(qiáng)的比賽活動(dòng),還有開源數(shù)據(jù)平臺(tái)Kaggle上也會(huì)經(jīng)常組織一些活動(dòng)。此外,一些大公司也很喜歡把自己業(yè)務(wù)中的真實(shí)問題做成題目,開放地征集解決方案。這些活動(dòng)要解決的問題往往具體、真實(shí)而又開放,有很大的研究和創(chuàng)新空間,考核內(nèi)容和傳統(tǒng)的編程比賽相差比較大。
AI實(shí)驗(yàn)要重點(diǎn)體現(xiàn)當(dāng)今時(shí)代(近20年)主流AI的核心要素——數(shù)據(jù)、模型(算法)和算力。
在現(xiàn)階段,大語(yǔ)言模型的原理可以在專家講座中出現(xiàn),大語(yǔ)言模型的應(yīng)用可以滲透到其他課程和日常生活中,但是不適合直接放在中學(xué)AI課程中。
精心選擇AI實(shí)驗(yàn)是中小學(xué)AI教育的抓手
謝作如:從毛博士的介紹可以看出,雖然都在強(qiáng)調(diào)算法,但是人工智能方面的活動(dòng)涉及的知識(shí)往往不是我們熟悉的排序、搜索、動(dòng)態(tài)規(guī)劃、線段樹之類,很多內(nèi)容都很新,如“詞向量”“對(duì)抗生成”等。但我們不需要大驚小怪,因?yàn)閲?guó)際奧林匹克活動(dòng)本來就是為學(xué)有余力的學(xué)生設(shè)計(jì)的。當(dāng)然,我們也必須知道,這些內(nèi)容實(shí)際是新一代人工智能的課程不可缺少的部分。
從AI的各種知識(shí)點(diǎn)出發(fā),我想給兩位出一道難題。兩位都知道,目前國(guó)內(nèi)有多個(gè)省份和地區(qū)正組織專家編寫中小學(xué)人工智能通識(shí)課程,以地方課程的形式實(shí)施,如深圳和上海。假設(shè)某地區(qū)準(zhǔn)備在小學(xué)、初中階段實(shí)施一個(gè)學(xué)年的通識(shí)課程,大概32課時(shí),其中有6個(gè)AI實(shí)驗(yàn)(一個(gè)實(shí)驗(yàn)2課時(shí))。假設(shè)你們都是這個(gè)地區(qū)編寫人工智能通識(shí)課程綱要或者指南的專家,你們會(huì)為初中生遴選哪6個(gè)AI實(shí)驗(yàn)主題?
至于我為什么會(huì)選擇AI實(shí)驗(yàn)?那是因?yàn)?023年教育部等十八部門頒布了《關(guān)于加強(qiáng)新時(shí)代中小學(xué)科學(xué)教育工作的意見》,提出要著力在教育“雙減”中做好科學(xué)教育加法,要加強(qiáng)中小學(xué)科學(xué)及相關(guān)學(xué)科(物理、化學(xué)、生物、地理、信息科技/信息技術(shù)、通用技術(shù)等)課程標(biāo)準(zhǔn)及教材修訂完善工作,加強(qiáng)實(shí)驗(yàn)室建設(shè),強(qiáng)化實(shí)驗(yàn)教學(xué)等要求,通過實(shí)驗(yàn)來學(xué)習(xí)AI,顯然是最好的抓手。另外,你們?cè)阱噙x實(shí)驗(yàn)主題時(shí)不要局限于上課教師的AI水平,即要假設(shè)教師們都經(jīng)過一段時(shí)間的AI技術(shù)培訓(xùn),具備了一定的專業(yè)技術(shù)能力。
鄭子杰:首先,我們要明確設(shè)計(jì)這些實(shí)驗(yàn)的目標(biāo)是什么。以初中生的認(rèn)知水平,想要通過這6個(gè)實(shí)驗(yàn)了解AI的各個(gè)前沿方向,如大語(yǔ)言模型、多模態(tài)、具身智能等顯然是不現(xiàn)實(shí)的。所以,我會(huì)牢記基礎(chǔ)教育階段的“基礎(chǔ)性”,課程是為之后學(xué)習(xí)AI打下“基礎(chǔ)”的。至于AI前沿領(lǐng)域的發(fā)展,應(yīng)該通過專家講座或者是通過其他課程完成。所以,AI實(shí)驗(yàn)要重點(diǎn)體現(xiàn)當(dāng)今時(shí)代(近20年)主流AI的核心要素——數(shù)據(jù)、模型(算法)和算力。我推薦的6個(gè)實(shí)驗(yàn)分別是:
實(shí)驗(yàn)1:以二維表為載體、旨在讓中學(xué)生認(rèn)識(shí)和分析數(shù)據(jù)表的實(shí)驗(yàn),數(shù)據(jù)來源可以是他們真實(shí)的物理、化學(xué)、生物課堂;
實(shí)驗(yàn)2:實(shí)現(xiàn)傳統(tǒng)機(jī)器學(xué)習(xí)的實(shí)驗(yàn),如線性回歸或者鳶尾花分類的實(shí)驗(yàn),用來體會(huì)機(jī)器學(xué)習(xí)的一般流程;
實(shí)驗(yàn)3:計(jì)算機(jī)視覺方向的基礎(chǔ)實(shí)驗(yàn),如提取圖片特征等,簡(jiǎn)單跟學(xué)生講講怎么使用卷積提取圖片邊界;
實(shí)驗(yàn)4:計(jì)算機(jī)視覺方向的進(jìn)階實(shí)驗(yàn),如基于CIFAR10這個(gè)數(shù)據(jù)集,使用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像分類;
實(shí)驗(yàn)5:自然語(yǔ)言處理的基礎(chǔ)實(shí)驗(yàn),如直接分析一篇小說,重點(diǎn)讓學(xué)生體會(huì)如何定量化地描述“文字”,并如何提取文字中的信息;
實(shí)驗(yàn)6:自然語(yǔ)言處理的進(jìn)階實(shí)驗(yàn),如使用Pytorch框架和LSTM實(shí)現(xiàn)文本的分類等。
這6個(gè)實(shí)驗(yàn)可以分為3個(gè)大方向——機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺和自然語(yǔ)言處理,并且前一個(gè)實(shí)驗(yàn)都是通過實(shí)驗(yàn)載體了解簡(jiǎn)單的原理,后一個(gè)實(shí)驗(yàn)是走通AI訓(xùn)練的流程。我之所以不提大語(yǔ)言模型,是因?yàn)槠涮珡?fù)雜,學(xué)生在知道模型的一些基礎(chǔ)結(jié)構(gòu)之前,很難體會(huì)大語(yǔ)言模型這類復(fù)雜模型的設(shè)計(jì)初衷。如果直接在課程上講解大語(yǔ)言模型,學(xué)生只會(huì)覺得“好厲害”,卻發(fā)現(xiàn)什么也學(xué)不到。所以我一直堅(jiān)持,至少在現(xiàn)階段,大語(yǔ)言模型的原理可以在專家講座中出現(xiàn),大語(yǔ)言模型的應(yīng)用可以滲透到其他課程和日常生活中,但是不適合直接放在中學(xué)AI課程中。從教學(xué)角度講,我們要用符合中學(xué)生知識(shí)積累和認(rèn)知水平的載體,讓學(xué)生體會(huì)數(shù)據(jù)、模型(算法)、算力,并盡可能體會(huì)一些模型設(shè)計(jì)的初衷和精妙之處。當(dāng)學(xué)生能夠體會(huì)簡(jiǎn)單模型的原理后,隨著年齡的增長(zhǎng),他們自然就會(huì)學(xué)習(xí)、應(yīng)用、修改甚至創(chuàng)造更加復(fù)雜且精妙的模型。
毛勇:我非常同意鄭老師的思路,唯一的不同是我可能會(huì)選擇把實(shí)驗(yàn)5和6改為某個(gè)更簡(jiǎn)單的處理時(shí)序數(shù)據(jù)的問題,如天氣或股票數(shù)據(jù)等。這樣做對(duì)于像北京十一學(xué)校這樣的學(xué)校來說似乎少了一塊內(nèi)容,但是對(duì)于更多的學(xué)校來說,相比處理自然語(yǔ)言做詞表、向量化等困難一些的實(shí)驗(yàn),也許簡(jiǎn)單一些的結(jié)構(gòu)化時(shí)間序列數(shù)據(jù)更加適合他們。當(dāng)然,如果課時(shí)允許,可能更加理想的方式是將這部分內(nèi)容增加到自然語(yǔ)言處理實(shí)驗(yàn)的前面去,增加實(shí)驗(yàn)時(shí)長(zhǎng),讓課程更加豐富。
謝作如:在給兩位出題的時(shí)候,我也進(jìn)行了認(rèn)真的思考,在腦海里把自己了解到的AI學(xué)科內(nèi)容“搜索”了一遍,發(fā)現(xiàn)6個(gè)實(shí)驗(yàn)真的不夠用。鄭老師給出的實(shí)驗(yàn)清單涉及了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)(卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)),涵蓋了計(jì)算機(jī)視覺和自然語(yǔ)言處理,做到了“綱舉目張”,我相信這6個(gè)AI實(shí)驗(yàn)一定會(huì)成為老師們開發(fā)課程的最好參考。
面對(duì)這6個(gè)實(shí)驗(yàn),相信很多老師會(huì)和我一樣有疑問——這些AI實(shí)驗(yàn)對(duì)學(xué)生的數(shù)學(xué)能力都有一定的要求。即使我們不去講“交叉熵”,也不講“梯度下降”和“反向傳播”,但“向量”顯然不可回避。OpenAI的核心研發(fā)人員Jack Rae說過的“壓縮即智能”,給了我們一個(gè)重要的啟示:只要找到合適的方式在數(shù)據(jù)中提取到有效的特征向量,就能用低算力的方式訓(xùn)練出可行的模型。因?yàn)椋锢硎澜绲男畔ⅰ皵?shù)字化”后能被計(jì)算機(jī)處理,“向量化”則讓數(shù)據(jù)能夠更好地用神經(jīng)網(wǎng)絡(luò)來計(jì)算,如圖像識(shí)別是先要用卷積神經(jīng)網(wǎng)絡(luò)提取特征向量,自然語(yǔ)言處理也是要先得到token。但“向量”是學(xué)生在什么年級(jí)才會(huì)學(xué)到的數(shù)學(xué)知識(shí)?初中生能不能理解“向量”?
鄭子杰:向量雖然在中學(xué)數(shù)學(xué)課程中是高一才學(xué)到的知識(shí),但是初中生也能夠理解。在基礎(chǔ)教育階段,我們并不是非要等到數(shù)學(xué)知識(shí)都積累到了,才能學(xué)對(duì)應(yīng)學(xué)科的知識(shí)。舉個(gè)例子,物理中的“力”是先于數(shù)學(xué)中的“向量”出現(xiàn)的,大家都下意識(shí)地將“向量”等同于“一個(gè)箭頭”,導(dǎo)致學(xué)生甚至數(shù)學(xué)和物理等學(xué)科的教師自身都不能理解向量的第二種理解方式——“數(shù)組”。把向量既看作是有方向性的量,又看作是數(shù)組,這種雙重視角對(duì)于AI的學(xué)習(xí)很重要。只要老師們?cè)敢馓鲎约簩W(xué)科固有的理解方式,接受數(shù)學(xué)、物理、計(jì)算機(jī)等學(xué)科對(duì)“向量”不同視角的理解,并轉(zhuǎn)述給學(xué)生,那么學(xué)生理解起來就非常容易。但由于現(xiàn)階段基礎(chǔ)教育的學(xué)科界限過于明顯,很多教師的措辭是“這是A學(xué)科應(yīng)該解決的,不關(guān)咱們學(xué)科的事”,這才使得類似向量這些概念看起來很難。
從另一角度看,數(shù)學(xué)中很多概念的確不能過于超出學(xué)生現(xiàn)有的數(shù)學(xué)知識(shí)水平,但這不等于所有的概念都只能按部就班,不能越雷池一步。例如“矩陣”就很容易理解,可以直接理解為“數(shù)表”,甚至連矩陣的四則運(yùn)算,中學(xué)生都可以很容易接受。但是“特征向量”這個(gè)概念就有些難,因?yàn)槠浔旧砭蜕婕熬€性代數(shù)根本繞不過去的底層原理。但是,提取圖像局部特征的“卷積”卻在中學(xué)能夠講清楚,因?yàn)槠洳⒉恍枰芏啻鷶?shù)推導(dǎo)作為鋪墊。到底什么該講什么不該講,教師自身除了需要十分清楚AI內(nèi)容和具備與之相關(guān)的數(shù)學(xué)基礎(chǔ)外,還需要對(duì)中學(xué)生各科的學(xué)習(xí)內(nèi)容了如指掌,并且對(duì)“學(xué)生能不能理解”有準(zhǔn)確的判斷。
值得一提的是,學(xué)生的Python編程基礎(chǔ)反而是在AI教學(xué)中最不需要擔(dān)心的。只要想學(xué)Python,在本人和家長(zhǎng)不擔(dān)心因?yàn)閷W(xué)習(xí)編程耽誤時(shí)間或者影響視力的前提下,一個(gè)毫無代碼能力且具有基本英語(yǔ)閱讀和表達(dá)能力的初學(xué)生,每天晚上花2個(gè)小時(shí)學(xué)習(xí)寫代碼,1個(gè)月就能熟悉Python的基本語(yǔ)句。因?yàn)閱螐恼Z(yǔ)法層面而言,Python編程無非就是對(duì)著計(jì)算機(jī)說與數(shù)學(xué)相關(guān)的英語(yǔ)而已。
謝作如:鄭老師的分析給了我很大的信心。兩位都知道,我在工作之余,還帶著上海人工智能實(shí)驗(yàn)室的XEdu團(tuán)隊(duì)為青少年學(xué)習(xí)AI開發(fā)工具,其中涉及機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)視覺、自然語(yǔ)言處理等方面的模型訓(xùn)練。雖然一線教師對(duì)XEdu系列工具的反饋都很好,但也會(huì)有人潑冷水,認(rèn)為中小學(xué)生學(xué)不了也理解不了機(jī)器學(xué)習(xí)。特別是在ChatGPT流行后,也有好多專家提出中小學(xué)生只要會(huì)寫提示詞(Prompt)、會(huì)用大模型就夠了,沒有必要學(xué)習(xí)模型訓(xùn)練之類的知識(shí),甚至說只要學(xué)好語(yǔ)文就夠了。對(duì)于這些觀點(diǎn),兩位是怎么看的?
鄭子杰:從學(xué)生發(fā)展的角度看,XEdu提供的功能足以讓學(xué)生掌握AI流程,并在進(jìn)行機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺等案例的過程中,深入了解底層原理。然而,我認(rèn)為這還不夠,我們還需要對(duì)內(nèi)容進(jìn)行更細(xì)致的分層。對(duì)于那些拔尖和對(duì)AI充滿興趣的學(xué)生,我們應(yīng)提供更多關(guān)于底層原理的內(nèi)容,引導(dǎo)他們深入思考并解決“為何會(huì)設(shè)計(jì)出多種不同的損失函數(shù)”“卷積如何實(shí)現(xiàn)特征提取”“全連接層的必要性何在”“如何調(diào)整學(xué)習(xí)率”等問題。而對(duì)于基礎(chǔ)相對(duì)薄弱,未來不打算涉足AI、數(shù)學(xué)和自然科學(xué)領(lǐng)域的學(xué)生,采納專家的觀點(diǎn)是明智之選,他們僅需了解AI應(yīng)用并學(xué)會(huì)將AI作為工具使用。關(guān)于中學(xué)生難以理解機(jī)器學(xué)習(xí)的擔(dān)憂,其實(shí)源自當(dāng)前AI教學(xué)內(nèi)容的匱乏。目前,大部分AI資料都是針對(duì)本科生編寫的,缺乏專門面向中學(xué)生的教學(xué)內(nèi)容。針對(duì)中學(xué)生的內(nèi)容設(shè)計(jì),不應(yīng)僅僅是對(duì)大學(xué)教材內(nèi)容的簡(jiǎn)化,而應(yīng)借鑒現(xiàn)有其他學(xué)科的教學(xué)方法,將內(nèi)容調(diào)整至既能展現(xiàn)學(xué)科核心思想,又適合中學(xué)生學(xué)習(xí)的程度。例如,在中學(xué)和大學(xué)物理課程中都會(huì)講述熱學(xué),但中學(xué)物理課程無需涉及玻爾茲曼分布,同樣能清晰闡述熱學(xué)的核心原理。
毛勇:我認(rèn)為大模型有潛力成為非常重要的學(xué)習(xí)工具,學(xué)生可以通過和大模型的交互迅速學(xué)會(huì)原來需要很長(zhǎng)學(xué)習(xí)周期學(xué)習(xí)或者學(xué)習(xí)曲線很陡峭的內(nèi)容,并迅速應(yīng)用、組裝、改寫大模型給出的代碼解決問題。這種項(xiàng)目導(dǎo)向、問題導(dǎo)向的學(xué)習(xí)方式,我認(rèn)為非常適合AI和信息科技這種強(qiáng)調(diào)應(yīng)用、工程、真實(shí)問題解決的學(xué)科。但是這并不意味著學(xué)生不需要理解技術(shù)背后的原理,不需要完整參與到從數(shù)據(jù)到模型的全過程中去。因?yàn)槲視?huì)假設(shè)好奇心是人類學(xué)習(xí)的最大動(dòng)力,相比掌握了更多知識(shí)的大學(xué)生、研究生,中小學(xué)生在好奇心上也許會(huì)更勝一籌。當(dāng)他們體驗(yàn)到AI的神奇應(yīng)用后,我不相信他們不好奇背后發(fā)生了什么、不想去加深理解、不想去參與做一個(gè)自己的AI。當(dāng)然,這里說的理解和參與是完全可以分層進(jìn)行的,教師根據(jù)自己學(xué)生的學(xué)情選用合適的工具,小學(xué)生顯然也可以毫無壓力地體驗(yàn)完整的模型訓(xùn)練過程,并用AI來解決真實(shí)問題。我認(rèn)為,這樣的學(xué)習(xí)才是更加完整和有價(jià)值的,而不是局限在對(duì)大模型的淺層使用上。
大模型有潛力成為非常重要的學(xué)習(xí)工具,學(xué)生可以通過和大模型的交互迅速學(xué)會(huì)原來需要很長(zhǎng)學(xué)習(xí)周期學(xué)習(xí)或者學(xué)習(xí)曲線很陡峭的內(nèi)容,并迅速應(yīng)用、組裝、改寫大模型給出的代碼解決問題。
教師想去學(xué)習(xí)AI,也不知道往哪個(gè)方向努力。在“泛AI教育”的影響下,他們也以為做創(chuàng)客、玩機(jī)器人就是做AI教育。
不論是信息科技還是人工智能,都是應(yīng)用性、工程性非常強(qiáng)的學(xué)科,如果教師沒有動(dòng)手能力則很難指導(dǎo)學(xué)生。
走向國(guó)際共識(shí)需要師資和學(xué)習(xí)資源
謝作如:兩位博士都提到了最核心的問題,直面一個(gè)問題——我們究竟要培養(yǎng)怎樣的人才。我在《青少年AI教育:從應(yīng)用技術(shù)到引領(lǐng)未來》一文(本刊2024年1月的專題文章)中提出要培養(yǎng)“更多真正理解AI、駕馭AI的人才”,從而引領(lǐng)AI的下一步發(fā)展。AI科學(xué)家李飛飛也說過,AI不是一個(gè)黑箱子,而應(yīng)該是灰箱子。要讓這些箱子從黑變灰,就需要一系列涉及底層的實(shí)驗(yàn)。我組織了一個(gè)叫做“AI開源課程眾籌計(jì)劃”的團(tuán)隊(duì),在暑假期間編寫這些開源的AI實(shí)驗(yàn),希望幫助更多的師生去理解AI。
我還記得幾年前,姚期智先生帶著清華姚班的同學(xué)編寫了一本面向高中生的《人工智能基礎(chǔ)》的教材,后來還做了一期培訓(xùn)。我認(rèn)真閱讀過這本教材,從中受益良多。記得鄭老師曾經(jīng)參加過清華姚班組織的教材培訓(xùn)。您能不能介紹一下這本教材的實(shí)施情況,以及培訓(xùn)過程中教師們的反饋?
鄭子杰:姚老師編的教材整體方向很好,跟我設(shè)計(jì)課程的初衷基本一致。但因?yàn)楦鞣N原因,其推廣起來并不是很理想。首先是課程內(nèi)容難度太高,基本接近本科生的AI課程。在教師培訓(xùn)過程中,絕大部分教師其實(shí)都跟不上。以我們學(xué)校的學(xué)生為例,信息學(xué)競(jìng)賽省隊(duì)水平的學(xué)生都表示學(xué)習(xí)起來很吃力。
但難度高還是次要的因素,更重要的是高估了現(xiàn)有中學(xué)教師的水平。國(guó)內(nèi)的大部分中學(xué)教師普遍缺乏學(xué)習(xí)AI的動(dòng)力,在沒有激勵(lì)的情況下,他們更希望直接使用那種不太費(fèi)腦、只需要按照流程做就能跑通還能展示的課程資源。但是,直接拿過來就用的資源往往缺乏AI教育的價(jià)值。雪上加霜的一點(diǎn)是,一些有學(xué)習(xí)動(dòng)力并通過自學(xué)掌握了AI流程和底層原理之后的中學(xué)教師或許就不愿意待在中學(xué)潛心教學(xué)了——他們?nèi)绾蔚种?倍工資和更高社會(huì)地位的誘惑呢?所以,如何合理調(diào)動(dòng)中學(xué)之外的力量(如市場(chǎng)等)來激勵(lì)教師學(xué)習(xí)并建設(shè)AI課程,是值得思考的問題。
謝作如:鄭老師的回答讓我感動(dòng)。中小學(xué)太需要具備實(shí)施AI教育能力的教師了,但中小學(xué)要想吸引并留住這些人才真的很難。還有一點(diǎn),這些教師想去學(xué)習(xí)AI,也不知道往哪個(gè)方向努力。在“泛AI教育”的影響下,他們也以為做創(chuàng)客、玩機(jī)器人就是做AI教育。今年5月份,中國(guó)教育技術(shù)協(xié)會(huì)信息技術(shù)教育專委會(huì)組織了“第七屆中小學(xué)人工智能教育展示活動(dòng)”,其中,基本功展示項(xiàng)目的上機(jī)操作部分的試題涉及機(jī)器學(xué)習(xí)和深度學(xué)習(xí),不僅要求訓(xùn)練模型還要部署AI應(yīng)用,并要求教師們?cè)跀嗑W(wǎng)的條件下在3小時(shí)內(nèi)完成。當(dāng)然,在局域網(wǎng)內(nèi)提供了大語(yǔ)言模型和模型訓(xùn)練環(huán)境OpenHydra。毛博士看過那份試卷,請(qǐng)簡(jiǎn)要點(diǎn)評(píng)一下。
毛勇:我看過那份試卷,好多題目給我耳目一新的感覺,尤其是其中的實(shí)踐題目,要求教師們真刀真槍地操練起來。我記得有一道燃油車效率回歸預(yù)測(cè)的問題,要求教師在短時(shí)間內(nèi)完成從數(shù)據(jù)預(yù)處理、模型搭建訓(xùn)練到推理預(yù)測(cè)的全過程,而且還要寫出簡(jiǎn)單但完整的UI(程序界面)。線性回歸問題本身并不難,很適合中學(xué)階段的教學(xué),很多有學(xué)科背景的教師應(yīng)該都能解決,不過如果長(zhǎng)時(shí)間處于刀槍入庫(kù)狀態(tài),教師們恐怕也會(huì)面臨一些挑戰(zhàn)。不論是信息科技還是人工智能,都是應(yīng)用性、工程性非常強(qiáng)的學(xué)科,如果教師沒有動(dòng)手能力則很難指導(dǎo)學(xué)生,所以我覺得這份試卷對(duì)如何提升未來教師的AI素養(yǎng)給出了一個(gè)非常好的導(dǎo)向。
謝作如:是的,我們也期望通過各種形式給教師們提供學(xué)習(xí)方向。這幾年鄭老師和我一樣,不斷參與各種會(huì)議,不斷呼吁更多人參與到中小學(xué)的人工智能教育中來。我想鄭老師肯定和我一樣也接到很多來自一線教師的關(guān)于如何學(xué)習(xí)AI、如何教學(xué)AI的“求助”。在您看來,在中小學(xué)推動(dòng)這種國(guó)際共識(shí)的真正的人工智能教育,除了要培養(yǎng)一批與時(shí)俱進(jìn)的教師外,還需要哪些推動(dòng)力?
鄭子杰:我覺得需要構(gòu)建一個(gè)系統(tǒng)性的生態(tài)。這個(gè)生態(tài)里最需要解決三件事,分別是學(xué)術(shù)領(lǐng)袖、靈活且開放的政策、大學(xué)支持和企業(yè)的資助。我們需要一些AI教師成為有影響力的名師,能夠帶大家一起做事。但是這樣的學(xué)術(shù)領(lǐng)袖一般都是自帶AI背景,很難靠后期的教師培訓(xùn)培養(yǎng)出來,所以怎么吸引這些人來中學(xué)值得思考。之所以說需要靈活且開放的政策,主要是因?yàn)樵诂F(xiàn)在的大環(huán)境下,很多有這樣能力的教師做事情都擔(dān)心“違規(guī)”。例如,我只知道不能給北京十一學(xué)校以外的學(xué)生進(jìn)行有償培訓(xùn)以及幫其他教育機(jī)構(gòu)建設(shè)課程。所以,教師們會(huì)在安全第一的情況下,盡可能地拒絕這些活動(dòng)。因?yàn)楹ε逻`規(guī)而讓AI教師力量沒有辦法在更大范圍內(nèi)發(fā)揮,這勢(shì)必會(huì)阻礙AI的普及。另外,部分行政力量的措辭方法可能也會(huì)打擊AI教師的積極性。我在十一學(xué)校之所以能夠?qū)I課程開展得非常順利,是因?yàn)槲覀儗W(xué)校對(duì)教師的學(xué)術(shù)尊重遠(yuǎn)大于行政制約。但當(dāng)我走出學(xué)校時(shí),在行政層面我碰到過類似以下這些措辭:“××說了AI很重要,你們本就應(yīng)該放棄休息時(shí)間貢獻(xiàn)力量”“你如果不想做,我會(huì)通知你們校領(lǐng)導(dǎo)”“你們必須在兩年內(nèi)做出效果,五年時(shí)間太長(zhǎng)”……這會(huì)讓本還想要做事的教師放棄。AI課程開發(fā)并不是教師的常規(guī)職責(zé),在沒有激勵(lì)只有壓力的情況下,有能力的教師會(huì)選擇隱藏自己的能力。既然提到激勵(lì),單純靠行政力量是遠(yuǎn)遠(yuǎn)不夠的。既然這是一個(gè)教育界的“攻堅(jiān)難題”,那么就需要提供與“攻堅(jiān)難題”相匹配的資源支持和激勵(lì),這就需要大學(xué)和企業(yè)的幫助,如大學(xué)提供能夠切實(shí)提升教師AI課程開發(fā)能力的教師培訓(xùn)、企業(yè)提供資源和資金支持等,還有高校研究機(jī)構(gòu)和企業(yè)要為中小學(xué)開發(fā)更加好用的AI教學(xué)工具。
謝作如:對(duì),這個(gè)生態(tài)要很多人一起去建設(shè)。我就認(rèn)為,低門檻的AI學(xué)習(xí)工具和教學(xué)平臺(tái)很重要,尤其是教學(xué)資源,如數(shù)據(jù)集和各種AI科創(chuàng)項(xiàng)目。回到前面關(guān)于AI實(shí)驗(yàn)的話題來。實(shí)施AI教育估計(jì)最大的困難在于算力,因?yàn)殡S著學(xué)生能力的提升,他們會(huì)不再滿足于簡(jiǎn)單的模型訓(xùn)練,會(huì)嘗試去收集更多的數(shù)據(jù)集,訓(xùn)練更復(fù)雜的模型來解決更多的問題。我甚至把一所學(xué)校是否購(gòu)買了算力服務(wù)器看成是評(píng)價(jià)學(xué)校AI教育實(shí)施情況的一個(gè)重要指標(biāo),我知道北京十一學(xué)校購(gòu)買了AI服務(wù)器作為開課的基礎(chǔ)。鄭老師,我想了解一下北京十一學(xué)校購(gòu)買的初衷,以及現(xiàn)在的使用情況。
鄭子杰:我們購(gòu)買服務(wù)器和GPU的初衷是為了滿足AI課程對(duì)算力資源的需求。一節(jié)課時(shí)間太短了,為了讓學(xué)生在課堂上能夠直觀地感受到訓(xùn)練過程,模型訓(xùn)練工作盡量要在5分鐘內(nèi)完成。但是,即便采用CIFAR10這樣小規(guī)模的數(shù)據(jù)集,在普通筆記本電腦或一體機(jī)上也難以做到。因此,我們需要購(gòu)買算力服務(wù)器,配置獨(dú)立的GPU。但因?yàn)轭A(yù)算并不寬裕,僅購(gòu)置了兩臺(tái)服務(wù)器,每臺(tái)服務(wù)器配備了兩個(gè)4090系列的GPU。其中一臺(tái)主要用于日常教學(xué),如部署OpenHydra這樣的教學(xué)資源分配平臺(tái);另一臺(tái)則供學(xué)生在進(jìn)行項(xiàng)目時(shí)使用,以便在離線環(huán)境下運(yùn)行較為復(fù)雜的模型。如果項(xiàng)目涉及當(dāng)前的大型語(yǔ)言模型,使用和購(gòu)買線上資源會(huì)更加合適。由于af1f91ef03247ab846ee643e3942d2c4服務(wù)器剛購(gòu)入幾個(gè)月,目前只在一臺(tái)服務(wù)器上部署了OpenHydra,另一臺(tái)服務(wù)器尚未投入使用。我個(gè)人認(rèn)為,中學(xué)需要建立一個(gè)分級(jí)算力體系,明確在教學(xué)過程中學(xué)生可能遇到的不同場(chǎng)景以及所需的算力資源,然后決定是采用本地部署還是線上資源。在本地部署時(shí),要區(qū)分哪些任務(wù)需要依賴服務(wù)器,哪些可以由普通臺(tái)式機(jī)完成。換句話說,我們應(yīng)該先確定課程內(nèi)容,然后再考慮與內(nèi)容匹配的計(jì)算資源。
謝作如:的確如此,學(xué)有余力的學(xué)生去參加活動(dòng),和有條件的學(xué)校去買算力服務(wù)器,是一樣的邏輯——教育不能做一刀切,要個(gè)性化。前面的6個(gè)AI實(shí)驗(yàn)是面向所有學(xué)生(初中生)設(shè)計(jì)的,對(duì)算力的要求不高,如卷積神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)用的CIFAR10數(shù)據(jù)集的圖片尺寸只有32×32,但是這種方式訓(xùn)練出來的模型幾乎沒辦法用來解決生活中的真實(shí)問題。以我們常用的MobileNet算法來說,數(shù)據(jù)集的圖片尺寸是224×224,對(duì)算力設(shè)備就有要求了。因此我們必須了解,雖然算力設(shè)備不是實(shí)施AI教育的剛需,但是學(xué)生一旦掌握了訓(xùn)練的流程和能力,很快就會(huì)對(duì)算力產(chǎn)生迫切的需求。關(guān)于算力的問題,后續(xù)將邀請(qǐng)相關(guān)專家展開討論,敬請(qǐng)期待。
實(shí)施AI教育估計(jì)最大的困難在于算力,因?yàn)殡S著學(xué)生能力的提升,他們會(huì)不再滿足于簡(jiǎn)單的模型訓(xùn)練,會(huì)嘗試去收集更多的數(shù)據(jù)集,訓(xùn)練更復(fù)雜的模型來解決更多的問題。
學(xué)有余力的學(xué)生去參加活動(dòng),和有條件的學(xué)校去買算力服務(wù)器,是一樣的邏輯——教育不能做一刀切,要個(gè)性化。
我和毛勇博士結(jié)識(shí),算起來已經(jīng)有十多年了。他用Arduino做了一款機(jī)器人,組織了一個(gè)比賽,并寫了一本書。我參與了他的課程編寫工作,受益匪淺,也結(jié)下了深厚的友誼。在開發(fā)XEdu系列工具的時(shí)候,我怕走錯(cuò)方向,就常常去請(qǐng)教他。去年他說要組織NOAI活動(dòng),我很支持,并且祝賀他回到了老本行——十多年后,一個(gè)AI博士終于可以開始做人工智能教育了。
至于鄭子杰博士,我們之前一直是神交,真正見面是今年初,我特意去北京十一學(xué)??此膶W(xué)科教室,看AI教室的環(huán)境部署和算力服務(wù)器。記得在他開車送我的路上,我問了一個(gè)很尖銳的問題:為什么北大畢業(yè)后不去頂尖研究機(jī)構(gòu),卻選擇做一名中學(xué)教師?他說,我從小就有志向做一件很了不起的工作。看著我疑惑的表情,他又補(bǔ)充道:“我認(rèn)為現(xiàn)在中小學(xué)的數(shù)學(xué)教育存在與時(shí)代脫節(jié)的問題,很嚴(yán)重。我研究AI教育,是希望能促進(jìn)基礎(chǔ)教育中數(shù)學(xué)學(xué)科的變革?!庇羞@樣的想法,真的很了不起。
我邀請(qǐng)毛勇和鄭子杰博士做本期對(duì)話,他們欣然答應(yīng)。我們都知道,這次的對(duì)話內(nèi)容其實(shí)挺尖銳的,有期待,也有批評(píng)。但是批評(píng)不是目的,批評(píng)是為了更好地發(fā)展。在人類步入智能計(jì)算時(shí)代的過渡階段,我們都有一種使命感:基礎(chǔ)教育必須順應(yīng)AI的發(fā)展,我們培養(yǎng)出來的學(xué)生才能更好地引領(lǐng)未來。