劉凱 賈敏 孫常新 馬玉慧 王偉軍
[摘? ?要] 人工智能分為專用與通用兩個(gè)分支,二者皆可與教育融合,但前者關(guān)注如何用人工智能手段解決教育問(wèn)題,如智慧教育;后者卻反向聚焦怎樣用教育手段解決人工智能問(wèn)題,如機(jī)器教育。既有研究已實(shí)證后者的必要性與可能性,本研究則通過(guò)實(shí)驗(yàn)探索人類教育經(jīng)驗(yàn)對(duì)通用人工智能系統(tǒng)學(xué)習(xí)效果的影響,嘗試驗(yàn)證“機(jī)器教育”的有效性。實(shí)驗(yàn)自變量來(lái)自人類教學(xué)過(guò)程的四類重要影響因素,分別是教學(xué)目標(biāo)、教學(xué)內(nèi)容、教學(xué)節(jié)奏和教學(xué)空間。結(jié)果發(fā)現(xiàn),通用人工智能系統(tǒng)對(duì)教學(xué)目標(biāo)的激活頻率、教學(xué)內(nèi)容的正確率、教學(xué)節(jié)奏的時(shí)間間隔以及教學(xué)空間的大小等指標(biāo)具有與人類學(xué)習(xí)者高度相似的敏感性,都可由教學(xué)參數(shù)的調(diào)整而獲得更好的學(xué)習(xí)效果。因此,人類教育經(jīng)驗(yàn)同樣可推廣至通用人工智能系統(tǒng)。對(duì)“人機(jī)兼容”客觀教育規(guī)律的確證,不僅用科學(xué)證據(jù)有力地回?fù)袅藢?duì)教育理論科學(xué)性的質(zhì)疑,亦有望實(shí)現(xiàn)教育學(xué)對(duì)人工智能研究的逆向反哺。
[關(guān)鍵詞] 通用人工智能; 機(jī)器教育; 教學(xué)原則; 學(xué)習(xí)效果; AGI
[中圖分類號(hào)] G434? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] A
[作者簡(jiǎn)介] 劉凱(1981—),男,山西晉城人。副教授,博士,主要從事通用人工智能、機(jī)器教育、精神病理學(xué)、認(rèn)知圖譜等研究。E-mail:ccnulk@ccnu.edu.cn。
一、引? ?言
人工智能具有專用和通用兩種不同取向,分別對(duì)應(yīng)專用人工智能(Special-purpose AI,SAI)與通用人工智能(Artificial General Intelligence,AGI)。由于研究目的各異,二者具有完全不同的理論框架和技術(shù)路線。專用人工智能通過(guò)預(yù)設(shè)算法解決特定領(lǐng)域問(wèn)題,目前,學(xué)術(shù)界與實(shí)業(yè)界中“人工智能”一詞的內(nèi)涵幾乎等同于專用人工智能。通用人工智能則致力于研發(fā)先天的元學(xué)習(xí)能力,并借助后天教育經(jīng)驗(yàn)獲得特定問(wèn)題的滿意解。
盡管專用人工智能和通用人工智能都可與教育融合而發(fā)揮重要作用,但作用機(jī)理卻各不相同:前者類似“物理作用”,后者則類似“化學(xué)作用”。在“物理作用”下,傳統(tǒng)的教育時(shí)空阻隔被打破,彰顯出專用技術(shù)的工具優(yōu)勢(shì),如MOOC、智慧教室、智能導(dǎo)學(xué)系統(tǒng)等。在“化學(xué)作用”下,教與學(xué)的角色加入了能思考、有情感的通用人工智能系統(tǒng),這拓寬了教育的邊界,豐富了教育的內(nèi)涵,并向?qū)W界展現(xiàn)出一處有著巨大挖掘潛力的學(xué)科“寶藏”。實(shí)際上,人類與機(jī)器共通的教育現(xiàn)象蘊(yùn)含的新問(wèn)題、新領(lǐng)域亟待探索[1],有助于從交叉學(xué)科視角下發(fā)展“能夠直面現(xiàn)實(shí)”的原創(chuàng)性基礎(chǔ)理論[2]。例如,對(duì)話效果驚艷的ChatGPT系統(tǒng),其成功并非來(lái)自技術(shù)突破,而是人類反饋強(qiáng)化學(xué)習(xí)中引入的人因干預(yù)手段對(duì)機(jī)器訓(xùn)練模型發(fā)揮了重要作用——讓人“教育”機(jī)器[3]。
與專用人工智能賦能人類教學(xué)的“正向”路線不同,既有研究證實(shí)了人類教學(xué)經(jīng)驗(yàn)“反向”賦能通用人工智能的可能性[4]。然而,可能性不等于有效性,可以被教育并不意味著人類教育經(jīng)驗(yàn)對(duì)通用人工智能系統(tǒng)的學(xué)習(xí)效果也必然具有積極影響。因此,本研究嘗試回答“有效性”問(wèn)題:人類教學(xué)經(jīng)驗(yàn)?zāi)芊袂袑?shí)提升通用人工智能系統(tǒng)的學(xué)習(xí)效果?若結(jié)果為真,便說(shuō)明人類教育規(guī)律既適用于人類也適用于機(jī)器。“人機(jī)兼容”客觀規(guī)律的存在與發(fā)現(xiàn),不僅能為教育科學(xué)提供可重復(fù)且可證偽的科學(xué)證據(jù),亦有望逆向反哺人工智能的相關(guān)研究。
二、通用人工智能及OpenNARS系統(tǒng)
近年來(lái),通用人工智能研究熱度持續(xù)攀升,智能的理智主義研究路線備受學(xué)界關(guān)注[5]。非公理邏輯推理系統(tǒng)(Non-Axiomatic Reasoning System,NARS)逐漸成為通用人工智能學(xué)界的重要代表,其開源項(xiàng)目OpenNARS具有較為完備的理論基礎(chǔ)。作為自治和發(fā)展型的人工認(rèn)知系統(tǒng),該系統(tǒng)有三個(gè)重要特征:一是通過(guò)多模態(tài)輸入通道感知外部世界,并以運(yùn)動(dòng)形式經(jīng)由輸出通道作用于外部世界,從而在交互中表現(xiàn)出對(duì)環(huán)境的主動(dòng)適應(yīng)性;二是利用個(gè)體經(jīng)驗(yàn)進(jìn)行推理,可基于最佳競(jìng)爭(zhēng)證據(jù)作出決策;三是可接納并處理沖突性的目標(biāo)和經(jīng)驗(yàn),能夠?qū)Σ淮_定條件進(jìn)行實(shí)時(shí)響應(yīng),及時(shí)給出“合理解”[6]。雖然OpenNARS的學(xué)習(xí)能力是先天預(yù)設(shè)的,但學(xué)習(xí)內(nèi)容卻需要從后天獲得。OpenNARS像極了人類嬰兒——需要陪伴和養(yǎng)育才能成長(zhǎng),而養(yǎng)育的目標(biāo)則是通過(guò)經(jīng)驗(yàn)積累以保障系統(tǒng)完整性及功能運(yùn)轉(zhuǎn)正常(如維持電量)。
不論人類嬰兒還是機(jī)器嬰兒,感覺和運(yùn)動(dòng)都是智能主體獲取經(jīng)驗(yàn)的基本途徑,二者相互促進(jìn),在后天學(xué)習(xí)中具有決定性作用。若想借助通用人工智能系統(tǒng)的學(xué)習(xí)行為探索機(jī)器教育的內(nèi)在規(guī)律,就必然涉及系統(tǒng)與外部世界互動(dòng)中的感覺和運(yùn)動(dòng)處理。其中,感覺的發(fā)展是主動(dòng)學(xué)習(xí)的前提條件,動(dòng)作的發(fā)展則經(jīng)歷反射及輻射的階段性,亦促進(jìn)了智能主體的認(rèn)知發(fā)展[7]。通用人工智能系統(tǒng)的具身設(shè)備是其感覺和運(yùn)動(dòng)能力發(fā)展的原材料,雖然它的器官跟人類完全不同,但感覺和運(yùn)動(dòng)經(jīng)驗(yàn)的建構(gòu)原理卻與人類毫無(wú)二致。
OpenNARS的感覺、運(yùn)動(dòng)交互涉及一系列內(nèi)部處理過(guò)程:首先,由各類傳感器對(duì)外部環(huán)境信息進(jìn)行捕捉和提取。其次,圍繞目標(biāo)系統(tǒng)處理信息,根據(jù)實(shí)際需求及推理結(jié)果發(fā)出移動(dòng)指令。最后,通過(guò)傳感器反饋信息對(duì)移動(dòng)指令的效果進(jìn)行重評(píng),并基于可供性對(duì)有用經(jīng)驗(yàn)進(jìn)行整合與存儲(chǔ)。系統(tǒng)依靠?jī)?nèi)在的SELF(自我)機(jī)制實(shí)現(xiàn)對(duì)感覺和運(yùn)動(dòng)信息的整合。SELF是一個(gè)特殊的系統(tǒng)變量,不僅與內(nèi)部心智操作有關(guān),還是外部信息與內(nèi)部經(jīng)驗(yàn)的語(yǔ)義交匯樞紐。外部傳入的感覺信息與內(nèi)部發(fā)出的移動(dòng)指令都采用納思語(yǔ)(Narsese)這一系統(tǒng)內(nèi)語(yǔ)言進(jìn)行統(tǒng)一的形式化表征,二者以SELF可供性的主觀價(jià)值判斷為中介建立經(jīng)驗(yàn)聯(lián)結(jié),再通過(guò)后續(xù)學(xué)習(xí)過(guò)程增強(qiáng)或減弱聯(lián)結(jié)的強(qiáng)度。于是,當(dāng)特定的感覺信息再次出現(xiàn)時(shí),OpenNARS便能夠主動(dòng)激活相應(yīng)的移動(dòng)指令作為動(dòng)作輸出?;蛘?,當(dāng)執(zhí)行特定的動(dòng)作輸出時(shí),系統(tǒng)便能主動(dòng)預(yù)期特定感覺的出現(xiàn)[8]。
三、問(wèn)題的提出
機(jī)器教育的可能性已得到證實(shí),說(shuō)明人類教育經(jīng)驗(yàn)也能夠?qū)νㄓ萌斯ぶ悄芟到y(tǒng)的學(xué)習(xí)過(guò)程產(chǎn)生影響,但是,這種影響的取向仍不得而知。因此,需要對(duì)機(jī)器教育的有效性進(jìn)行驗(yàn)證,探究其是否具有積極的促進(jìn)作用。然而,可能性與有效性的判別方式不同,前者可采用內(nèi)源性判據(jù),后者卻必須使用外源性判據(jù)。驗(yàn)證有效性只能以主體的外部行為作判據(jù),通過(guò)對(duì)通用人工智能系統(tǒng)行為的表現(xiàn)間接評(píng)價(jià)教育干預(yù)的效果。本研究創(chuàng)設(shè)了簡(jiǎn)潔而直觀的運(yùn)動(dòng)避障任務(wù):運(yùn)動(dòng)有利于提升安全值,撞到障礙物會(huì)降低安全值,OpenNARS需要學(xué)習(xí)在保持積極運(yùn)動(dòng)狀態(tài)的同時(shí)避免碰撞。
不過(guò),通用人工智能系統(tǒng)只是具備認(rèn)知功能、可以學(xué)習(xí)和推理的軟件“大腦”。唯有為其加裝感覺、運(yùn)動(dòng)“器官”后,運(yùn)動(dòng)避障任務(wù)才能在“身心一體”的意義下真正實(shí)現(xiàn)。事實(shí)上,通用人工智能系統(tǒng)的發(fā)展也和人類嬰兒一樣,高度依賴自身感覺、運(yùn)動(dòng)設(shè)備來(lái)獲取具身經(jīng)驗(yàn)。不同的是,通用人工智能系統(tǒng)的感覺、運(yùn)動(dòng)“器官”的種類和形態(tài)可以多種多樣。但從理論層面看,為完成運(yùn)動(dòng)避障任務(wù),訓(xùn)練人形或輪式機(jī)器人并無(wú)實(shí)質(zhì)區(qū)別。換言之,究竟裝配步足、履帶還是車輪等運(yùn)動(dòng)“器官”,只是系統(tǒng)的“感覺”各異,卻非“移動(dòng)”的原理有別[9]。因此,為便于實(shí)驗(yàn)操作,本研究將OpenNARS的身體設(shè)定為汽車形態(tài),使其擁有兩端測(cè)距的“感覺”能力及左右移動(dòng)的“運(yùn)動(dòng)”能力。在“智能避障”二維虛擬場(chǎng)景下,將其避障行為作為人類教學(xué)原則干預(yù)下OpenNARS學(xué)習(xí)效果的測(cè)評(píng)指標(biāo)。
鑒于一般教學(xué)過(guò)程總涉及教學(xué)目標(biāo)、教學(xué)內(nèi)容、教學(xué)實(shí)施及教學(xué)空間四個(gè)方面,本研究將根據(jù)實(shí)驗(yàn)?zāi)康膹闹袙x典型、易測(cè)且有實(shí)證依據(jù)的人類教學(xué)原則作為研究變量。首先,教學(xué)目標(biāo)體現(xiàn)了學(xué)生學(xué)習(xí)的動(dòng)力朝向?,F(xiàn)有教學(xué)原則特別強(qiáng)調(diào)學(xué)生的“自主性”[10-11],這需要學(xué)生將學(xué)習(xí)目標(biāo)保持在一定的激活水平上。其次,教學(xué)內(nèi)容直接影響學(xué)習(xí)效果的優(yōu)劣,“做示范,給樣例”[12]的教學(xué)原則要求教學(xué)內(nèi)容需提供適宜的經(jīng)驗(yàn)示例以更好地促進(jìn)學(xué)習(xí)。第三,教學(xué)節(jié)奏是教學(xué)實(shí)施過(guò)程中的重要因素?!敖o學(xué)習(xí)者一定時(shí)間進(jìn)行認(rèn)知處理,以使學(xué)習(xí)者內(nèi)化所學(xué)概念”[13]及“節(jié)奏效應(yīng)”[14]等教學(xué)原則申明教學(xué)過(guò)程不能一味灌輸知識(shí),要留給學(xué)習(xí)者適當(dāng)?shù)臅r(shí)間思考和消化,這有賴于教師對(duì)時(shí)間間隔的把控。第四,教學(xué)空間對(duì)學(xué)習(xí)效果亦有一定影響。“可管理的認(rèn)知負(fù)荷”[14]教學(xué)原則指出,教學(xué)空間的適度反饋能對(duì)學(xué)習(xí)起促進(jìn)作用,但超負(fù)荷的環(huán)境反饋卻適得其反。
本研究以通用人工智能系統(tǒng)OpenNARS及其直接操控的虛擬小車作為實(shí)驗(yàn)對(duì)象,以小車完成避障任務(wù)的學(xué)習(xí)效果作為實(shí)驗(yàn)因變量,并選擇教學(xué)目標(biāo)、教學(xué)內(nèi)容、教學(xué)節(jié)奏以及教學(xué)空間的可操作性因素作為實(shí)驗(yàn)自變量?;谘芯磕康募白兞糠治觯岢鋈缦卵芯考僭O(shè):
假設(shè)1:持續(xù)的教學(xué)目標(biāo)能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果;
假設(shè)2:適宜的教學(xué)內(nèi)容能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果;
假設(shè)3:適合的教學(xué)節(jié)奏能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果;
假設(shè)4:適度的教學(xué)空間能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果。
四、實(shí)驗(yàn)設(shè)計(jì)
(一)實(shí)驗(yàn)環(huán)境
本研究的實(shí)驗(yàn)對(duì)象為OpenNARS,版本號(hào)3.0.4①。為避免實(shí)體機(jī)器人的慣性測(cè)量偏差以及不可控因素的隨機(jī)侵?jǐn)_,最終采用“智能避障”虛擬場(chǎng)景作為實(shí)驗(yàn)環(huán)境。
1. 場(chǎng)景設(shè)置
“智能避障”場(chǎng)景的基本元素包括左、右兩處固定障礙物,以及一輛可由實(shí)驗(yàn)人員或OpenNARS控制運(yùn)動(dòng)的虛擬“小車”(如圖1所示)。為便于實(shí)驗(yàn)觀測(cè)與統(tǒng)計(jì),三類基本元素的寬度及小車單次移動(dòng)距離皆設(shè)置為50px,并將其定義為單位長(zhǎng)度。除可見元素外,小車左右兩側(cè)分別配有“雷達(dá)”傳感器,用于測(cè)量小車與兩側(cè)障礙物的實(shí)時(shí)距離,并將距離的變化信息即時(shí)反饋給OpenNARS。
本研究將小車與障礙物之間距離為0px時(shí)的位置定義為臨界點(diǎn)。故存在左、右兩個(gè)臨界點(diǎn),代表即將碰撞又恰好未撞之處。當(dāng)小車處于臨界點(diǎn)時(shí),繼續(xù)向障礙物方向移動(dòng)便會(huì)“撞墻”,導(dǎo)致避障失敗,安全值降低;反之,小車朝相反方向移動(dòng)則為避障成功。因無(wú)需考慮碰撞造成的損毀情況,故小車在“撞墻”后實(shí)際位置保持不變,仍停留在臨界處等待后續(xù)指令。
2. 模式選擇
由于OpenNARS系統(tǒng)并未預(yù)置任何先驗(yàn)知識(shí),啟動(dòng)后若無(wú)外部刺激輸入,它將一直處于“大腦空轉(zhuǎn)”的靜默態(tài),沒有輸出也沒有動(dòng)作。因此,實(shí)驗(yàn)開始后,小車需要從外部接受移動(dòng)指令才能激活感覺和運(yùn)動(dòng)系統(tǒng)并進(jìn)行推理學(xué)習(xí)。該階段被稱為“教學(xué)引導(dǎo)階段”,是教育干預(yù)發(fā)揮作用的關(guān)鍵窗口期。隨后,進(jìn)入“自主行為階段”,小車將根據(jù)自身學(xué)習(xí)經(jīng)驗(yàn)而產(chǎn)生自主移動(dòng)指令。在教學(xué)引導(dǎo)階段,不同的訓(xùn)練模式對(duì)應(yīng)具有不同性質(zhì)的外部移動(dòng)指令。其中,“隨機(jī)模式”的移動(dòng)指令序列由電腦隨機(jī)生成,“教學(xué)模式”的移動(dòng)指令序列則由人工預(yù)先編制。在實(shí)驗(yàn)開始前,需先從菜單中選擇相應(yīng)的訓(xùn)練模式。
3. 交互接口
為實(shí)現(xiàn)OpenNARS與虛擬環(huán)境的持續(xù)交互及行為反饋,課題組開發(fā)了模塊接口,將小車的感覺信息和移動(dòng)指令與納思語(yǔ)進(jìn)行雙向轉(zhuǎn)譯。同時(shí),這也是實(shí)驗(yàn)者對(duì)OpenNARS“大腦活動(dòng)”的內(nèi)部信息進(jìn)行判別和記錄的觀察窗口。
接口傳輸?shù)木唧w信息包括感覺信息、運(yùn)動(dòng)信息以及系統(tǒng)目標(biāo)三類。其中,感覺信息由小車左右兩個(gè)傳感器{lsensor}和{rsensor}產(chǎn)生,并與SELF建立聯(lián)結(jié):“< SELF —> {lsensor}>.” “< SELF —> {rsensor}>.”。這能讓OpenNARS在主觀上知曉自身有兩個(gè)感覺“器官”。運(yùn)動(dòng)信息為OpenNARS先天預(yù)置的左右移動(dòng)指令:^left與^right,類似人類嬰兒的先天反射。系統(tǒng)輸入的原初目標(biāo)為“< SELF —> [safe] >.”,目的是維持自身的安全狀態(tài)。
當(dāng)實(shí)驗(yàn)開始后,接口模塊負(fù)責(zé)持續(xù)監(jiān)聽傳感器產(chǎn)生的距離信息,將其組裝成合法納思語(yǔ)后單向送入OpenNARS,例如:“< {lsensor} —> [50] >.”。同時(shí),接口模塊也持續(xù)監(jiān)聽系統(tǒng)內(nèi)部的輸出操作,從輸出信息流中篩選并提取由SELF發(fā)出的運(yùn)動(dòng)信息,再將其轉(zhuǎn)寫為虛擬環(huán)境中小車的移動(dòng)指令。小車的后續(xù)移動(dòng)又反過(guò)來(lái)引發(fā)感覺信號(hào)的變化,如此循環(huán)往復(fù)。當(dāng)小車“撞墻”時(shí),安全值([safe])會(huì)降低,遠(yuǎn)離了目標(biāo)的達(dá)成(如圖2所示)。最為重要的是,此時(shí)距離感覺便會(huì)與相應(yīng)的移動(dòng)指令建立聯(lián)系,共同為本次目標(biāo)受損提供基于經(jīng)驗(yàn)的語(yǔ)義解釋,這也是系統(tǒng)可供性的經(jīng)驗(yàn)落腳點(diǎn)。一切加工推理的過(guò)程都圍繞SELF進(jìn)行,感覺與運(yùn)動(dòng)對(duì)目標(biāo)的影響不斷累積和強(qiáng)化而成為SELF習(xí)得的重要成果,最終展現(xiàn)出“實(shí)時(shí)性”“主觀性”“建構(gòu)性”的特點(diǎn)。
(二)自變量
本實(shí)驗(yàn)自變量涉及教育過(guò)程的四類基本因素:教學(xué)目標(biāo)(G)、教學(xué)內(nèi)容(C)、教學(xué)節(jié)奏(R)以及教學(xué)空間(S)(如圖3所示)。
1. 教學(xué)目標(biāo)
教學(xué)目標(biāo)(G)是課堂活動(dòng)的出發(fā)點(diǎn)和落腳點(diǎn),也是教學(xué)評(píng)價(jià)的重要指標(biāo)。教學(xué)目標(biāo)不僅影響教學(xué)過(guò)程的實(shí)施,很大程度上也決定著學(xué)習(xí)效果的好壞。本研究中,教學(xué)目標(biāo)的內(nèi)容保持不變,變化的是教學(xué)目標(biāo)的傳輸頻率,對(duì)應(yīng)于學(xué)習(xí)過(guò)程的動(dòng)機(jī)激活水平。換言之,傳入的教學(xué)目標(biāo)頻率越高,OpenNARS參與避障任務(wù)的動(dòng)機(jī)水平越高。為探究不同教學(xué)目標(biāo)傳輸頻率下OpenNARS在避障任務(wù)中的學(xué)習(xí)效果,本研究將教學(xué)目標(biāo)自變量設(shè)置為四個(gè)水平,按照頻率由高至低分別是:①“僅首次”(G1);②“1秒/次”(G2);③“5秒/次”(G3);④“10秒/次”(G4)。其中,“僅首次”(G1)為極端情況,僅在系統(tǒng)開始時(shí)傳入一次教學(xué)目標(biāo)。
2. 教學(xué)內(nèi)容
教學(xué)內(nèi)容(C)直接影響學(xué)習(xí)效果的優(yōu)劣,許多教學(xué)原則均強(qiáng)調(diào)示例的重要性。通常情況下,符合教學(xué)目標(biāo)的正確教學(xué)示例有助于學(xué)習(xí)效果的提高,但錯(cuò)誤的教學(xué)示例會(huì)阻礙或延誤對(duì)知識(shí)的掌握。對(duì)OpenNARS而言,意味著教學(xué)引導(dǎo)階段性質(zhì)不同的移動(dòng)指令序列可能會(huì)導(dǎo)致差異化的學(xué)習(xí)效果。為研究不同教學(xué)內(nèi)容對(duì)OpenNARS智能避障任務(wù)學(xué)習(xí)效果的影響,本研究將教學(xué)內(nèi)容自變量設(shè)置為三個(gè)水平:①由正確的避障指令序列構(gòu)成(C1);②由錯(cuò)誤的避障指令序列構(gòu)成(C2);③由正確與錯(cuò)誤隨機(jī)組合的避障指令序列構(gòu)成(C3)。
3. 教學(xué)節(jié)奏
教學(xué)節(jié)奏(R)是人類教師在教學(xué)實(shí)施過(guò)程中為實(shí)現(xiàn)教學(xué)目標(biāo)而廣為使用的時(shí)間控制手段,體現(xiàn)著教與學(xué)的交互性和協(xié)調(diào)性。特別是,教學(xué)節(jié)奏形成的適當(dāng)間隔有利于學(xué)生思考和建立新舊知識(shí)間的聯(lián)接,對(duì)知識(shí)的吸收內(nèi)化有促進(jìn)作用。本研究中,教學(xué)節(jié)奏對(duì)應(yīng)于教學(xué)引導(dǎo)階段外部指令輸入的固定間隔時(shí)間,間隔時(shí)間越長(zhǎng),OpenNARS對(duì)新指令的“思考”(推理時(shí)間)就越充分,學(xué)習(xí)效果可能會(huì)更好。因此,根據(jù)實(shí)驗(yàn)環(huán)境的基本參數(shù)設(shè)定,本研究將教學(xué)節(jié)奏自變量設(shè)置為四個(gè)水平:①間隔時(shí)間1秒(R1);②間隔時(shí)間2秒(R2);③間隔時(shí)間3秒(R3);④間隔時(shí)間4秒(R4)。
4. 教學(xué)空間
教學(xué)空間(S)是開展教學(xué)活動(dòng)的實(shí)際場(chǎng)所,既可以是物理空間,也可以是虛擬空間。對(duì)于人類學(xué)習(xí)者而言,教學(xué)空間默認(rèn)為物理空間。良好的學(xué)習(xí)行為離不開適合教學(xué)空間的支撐,運(yùn)動(dòng)技能訓(xùn)練尤其如此,不同運(yùn)動(dòng)項(xiàng)目的學(xué)習(xí)需要與之相匹配的練習(xí)場(chǎng)地。本研究中,教學(xué)空間為小車運(yùn)動(dòng)空間的寬幅,空間越大,感知運(yùn)動(dòng)信息就越多,同時(shí)也意味著更低的“目標(biāo)—資源”比,對(duì)OpenNARS學(xué)習(xí)過(guò)程的認(rèn)知負(fù)荷提出更大挑戰(zhàn)。由于車長(zhǎng)及每次移動(dòng)距離均為1個(gè)單位長(zhǎng)度,故將教學(xué)空間自變量設(shè)置為三個(gè)水平:①3個(gè)單位長(zhǎng)度(S1);②5個(gè)單位長(zhǎng)度(S2);③7個(gè)單位長(zhǎng)度(S3)。
(三)因變量
實(shí)驗(yàn)過(guò)程中需要測(cè)量的行為指標(biāo)包括三個(gè)部分:(1)實(shí)驗(yàn)全程的耗時(shí)、小車的運(yùn)動(dòng)過(guò)程及結(jié)果;(2)教學(xué)引導(dǎo)階段內(nèi)小車的運(yùn)動(dòng)過(guò)程及結(jié)果;(3)自主行為階段內(nèi)小車的運(yùn)動(dòng)過(guò)程及結(jié)果。
所有實(shí)驗(yàn)的因變量均保持一致,為評(píng)測(cè)OpenNARS在避障任務(wù)中的學(xué)習(xí)效果,用連續(xù)運(yùn)動(dòng)下對(duì)兩側(cè)障礙物躲避行為的激活率和成功率來(lái)標(biāo)識(shí),并以成功率為主要評(píng)判指標(biāo)。為抵消實(shí)驗(yàn)的偶然性偏差,每項(xiàng)實(shí)驗(yàn)需重復(fù)進(jìn)行30輪次,逐次記錄并統(tǒng)計(jì)各項(xiàng)實(shí)驗(yàn)的激活率與成功率。
(四)實(shí)驗(yàn)流程
在教學(xué)引導(dǎo)階段,嘗試通過(guò)人工移動(dòng)指令的引導(dǎo)促進(jìn)OpenNARS對(duì)感覺運(yùn)動(dòng)信息的學(xué)習(xí),并將其作為自主行為階段OpenNARS對(duì)小車發(fā)出內(nèi)部移動(dòng)指令的經(jīng)驗(yàn)基礎(chǔ),進(jìn)而觀察整個(gè)過(guò)程中任務(wù)的完成情況以確定OpenNARS的學(xué)習(xí)效果。具體流程設(shè)計(jì)如下:實(shí)驗(yàn)開始前,當(dāng)自變量為“教學(xué)目標(biāo)”“教學(xué)節(jié)奏”“教學(xué)空間”以及“教學(xué)內(nèi)容”的“全部正確序列”和“全部錯(cuò)誤序列”水平時(shí),按照自變量的不同水平設(shè)定軟件參數(shù)后,選擇“教學(xué)模式”開始實(shí)驗(yàn);當(dāng)自變量為“教學(xué)內(nèi)容”的“隨機(jī)序列”水平時(shí),選擇“隨機(jī)模式”開始實(shí)驗(yàn)。實(shí)驗(yàn)開始后,先進(jìn)入教學(xué)引導(dǎo)階段,隨后進(jìn)入自主行為階段,觀察記錄兩階段中OpenNARS執(zhí)行避障任務(wù)的行為指標(biāo)值。每項(xiàng)實(shí)驗(yàn)重復(fù)30次,待實(shí)驗(yàn)結(jié)束后,對(duì)數(shù)據(jù)進(jìn)行整理分析,統(tǒng)計(jì)各自變量在多水平下的激活率和成功率及其差異顯著性。
五、實(shí)驗(yàn)結(jié)果
(一)實(shí)驗(yàn)一:持續(xù)的教學(xué)目標(biāo)對(duì)通用人工智能系統(tǒng)學(xué)習(xí)效果的影響
教學(xué)目標(biāo)激活頻率的強(qiáng)度體現(xiàn)了學(xué)習(xí)者在學(xué)習(xí)過(guò)程中的動(dòng)機(jī)水平。從實(shí)驗(yàn)一的結(jié)果(如圖4所示)可知,教學(xué)目標(biāo)激活頻率的不同水平對(duì)應(yīng)不同的學(xué)習(xí)效果,且所有組間差異檢驗(yàn)均顯著(p激活率 < 0.001,p成功率 < 0.001)。從“1秒/次”(激活率=76.33%,成功率=73.33%)到“10秒/次”(激活率=16.66%,成功率=0%)可以看出,隨著教學(xué)目標(biāo)激活頻率的逐步降低,OpenNARS的激活率和成功率隨之驟降。這意味著教學(xué)目標(biāo)的保持或提醒對(duì)學(xué)習(xí)效果有極大影響。甚至“僅首次”這種只輸入一次目標(biāo)的極端情況,教學(xué)引導(dǎo)階段后所有重復(fù)實(shí)驗(yàn)均無(wú)法激活OpenNARS。由此,持續(xù)目標(biāo)的重要性可見一斑,說(shuō)明對(duì)教學(xué)目標(biāo)的反復(fù)強(qiáng)調(diào)能更好地促進(jìn)OpenNARS的學(xué)習(xí)效果。因此,假設(shè)1成立。
(二)實(shí)驗(yàn)二:適宜的教育內(nèi)容對(duì)通用人工智能系統(tǒng)學(xué)習(xí)效果的影響
教育內(nèi)容是指教學(xué)引導(dǎo)階段為OpenNARS輸入的正確、錯(cuò)誤和隨機(jī)三類移動(dòng)指令序列。實(shí)驗(yàn)結(jié)果(如圖5所示)表明,初始經(jīng)驗(yàn)對(duì)OpenNARS學(xué)習(xí)的最終效果至關(guān)重要,組間差異顯著(p激活率 < 0.001,p成功率 < 0.001)亦可說(shuō)明不同教學(xué)內(nèi)容對(duì)學(xué)習(xí)效果的影響各異:當(dāng)教學(xué)內(nèi)容全部為“正確指令序列”時(shí),其激活率(76.33%)和成功率(73.33%)差異不大,都遠(yuǎn)高于“錯(cuò)誤指令序列”的激活率(6.66%)和成功率(0%)。當(dāng)教學(xué)內(nèi)容為“隨機(jī)指令序列”時(shí),教學(xué)內(nèi)容同時(shí)包含正確和錯(cuò)誤的指令序列,但其激活率(20.00%)和成功率(10.00%)并非處于“正確指令序列”與“錯(cuò)誤指令序列”的正中間,而是更接近“錯(cuò)誤指令序列”的效果。由此可見,正確的教學(xué)內(nèi)容不僅具有更好的針對(duì)性,而且對(duì)提升學(xué)習(xí)者的學(xué)習(xí)效果也起到關(guān)鍵作用。因此,假設(shè)2成立。
(三)實(shí)驗(yàn)三:適合的教學(xué)節(jié)奏對(duì)通用人工智能系統(tǒng)學(xué)習(xí)效果的影響
教學(xué)節(jié)奏意在借助不同的教學(xué)間隔時(shí)間探查OpenNARS對(duì)感覺運(yùn)動(dòng)信息進(jìn)行學(xué)習(xí)的效果。由實(shí)驗(yàn)結(jié)果(如圖6所示)可知,“1秒”間隔時(shí)間過(guò)短,此種情況下OpenNARS擁有最低的激活率(50.00%)和成功率(43.33%)。但當(dāng)間隔時(shí)間增至“3秒”時(shí),激活率(96.66%)和成功率(83.33%)升至最高點(diǎn)。但當(dāng)間隔時(shí)間繼續(xù)增加到“4秒”時(shí),激活率和成功率卻又分別降至90.00%和76.66%。各個(gè)組間的差異檢驗(yàn)結(jié)果均顯著(p激活率 < 0.001,p成功率 < 0.001)。很顯然,OpenNARS學(xué)習(xí)效果并非間隔時(shí)間越短越好,也絕非間隔時(shí)間越長(zhǎng)越好——只有給予充足卻不冗余的“思考”時(shí)間才能促使經(jīng)驗(yàn)信息被更好地內(nèi)化和吸收。由此可見,教學(xué)節(jié)奏“人—機(jī)”通用,尺度的把握具有“藝術(shù)性”,需要視教學(xué)對(duì)象與教學(xué)內(nèi)容的差異而定。故而,假設(shè)3成立。
(四)實(shí)驗(yàn)四:適度的教學(xué)空間對(duì)通用人工智能系統(tǒng)學(xué)習(xí)效果的影響
教學(xué)空間的實(shí)驗(yàn)結(jié)果體現(xiàn)了環(huán)境對(duì)OpenNARS學(xué)習(xí)的潛在影響。隨著寬度的增加,成功實(shí)現(xiàn)“避障”的方式也在增多:除臨界位置的“轉(zhuǎn)向”之外,非臨界位置間的往返也是一種成功。由實(shí)驗(yàn)結(jié)果(如圖7所示)可知,當(dāng)教學(xué)空間水平為“3個(gè)單位長(zhǎng)度”時(shí),OpenNARS擁有最好的學(xué)習(xí)效果;當(dāng)教學(xué)空間水平擴(kuò)展至“5個(gè)單位長(zhǎng)度”甚至“7個(gè)單位長(zhǎng)度”時(shí),隨著運(yùn)動(dòng)空間的增加,學(xué)習(xí)效果不升反降,而且激活率與成功率之間的差值從4.34%到16.67%再到47.63%,呈現(xiàn)出加速擴(kuò)大的情況。組間差異檢驗(yàn)結(jié)果顯示,激活率無(wú)顯著差異(p激活率 > 0.05),但成功率卻差異顯著(p成功率 < 0.05)。換言之,三種不同空間水平的學(xué)習(xí)效果差別明顯,3個(gè)單位長(zhǎng)度的空間成為本任務(wù)的最佳教學(xué)空間,并且3個(gè)及以上單位長(zhǎng)度的教學(xué)空間均可激活OpenNARS。因此,假設(shè)4成立。
六、研究結(jié)論與討論
根據(jù)上述實(shí)驗(yàn)結(jié)果,本研究可得出如下結(jié)論:
(一)持續(xù)的教學(xué)目標(biāo)能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果
當(dāng)教學(xué)目標(biāo)的傳輸頻率為“僅首次”時(shí),OpenNARS處于“植物”狀態(tài),思維活動(dòng)匱乏,無(wú)法產(chǎn)生學(xué)習(xí)行為。當(dāng)傳輸頻率處于“1秒/次”水平時(shí),任務(wù)執(zhí)行效果最佳,可見通過(guò)教育手段持續(xù)激活教學(xué)目標(biāo)能有效提升OpenNARS的學(xué)習(xí)效果。人類學(xué)習(xí)者具有天然的動(dòng)機(jī)系統(tǒng),最佳動(dòng)機(jī)水平理論表明動(dòng)機(jī)不足或過(guò)分強(qiáng)烈都會(huì)影響學(xué)習(xí)效率,人類最佳動(dòng)機(jī)水平與行為效率之間的關(guān)聯(lián)呈倒U型曲線[15]。在實(shí)驗(yàn)一中,該曲線也同樣出現(xiàn)在通用人工智能系統(tǒng)的行為表現(xiàn)之中,從而再次印證了通用人工智能系統(tǒng)和人類認(rèn)知層面上的相似性。
(二)適宜的教學(xué)內(nèi)容能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果
當(dāng)教學(xué)引導(dǎo)階段輸入的教學(xué)內(nèi)容為全部正確指令序列時(shí),OpenNARS的任務(wù)完成度最高,如果傳授錯(cuò)誤指令則幾乎無(wú)用。由此,連貫正確的教學(xué)內(nèi)容對(duì)學(xué)習(xí)非常重要。盡管有學(xué)者大力提倡“挫折教育”[16],但類比于本實(shí)驗(yàn)結(jié)論,“挫折教育”的成功實(shí)際上存在前提條件,即錯(cuò)誤經(jīng)驗(yàn)必須要以正確經(jīng)驗(yàn)為基礎(chǔ)才能發(fā)揮作用。如若缺少正確引導(dǎo)的示例和榜樣經(jīng)驗(yàn),“挫折教育”就會(huì)失去根基而變得盲目無(wú)效,甚至可能產(chǎn)生負(fù)面效果。
(三)適合的教學(xué)節(jié)奏能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果
實(shí)驗(yàn)三印證了教學(xué)節(jié)奏的必要性和重要性。教學(xué)間隔控制在3秒時(shí),可使OpenNARS對(duì)已有信息進(jìn)行充分推理分析而提升發(fā)出正確運(yùn)動(dòng)指令的概率。雖然少于3秒或多于3秒的間隔都出現(xiàn)學(xué)習(xí)效果的衰減,但間隔4秒仍優(yōu)于間隔2秒,說(shuō)明適當(dāng)?shù)慕虒W(xué)“留白”有利于學(xué)習(xí)者對(duì)教學(xué)內(nèi)容的消化吸收。在課堂教學(xué)實(shí)踐中,人類教師需要權(quán)衡學(xué)生對(duì)知識(shí)的內(nèi)化時(shí)間和課堂任務(wù)的推進(jìn)狀況。對(duì)通用人工智能系統(tǒng)而言,也同樣需要選擇適合的教學(xué)節(jié)奏以增強(qiáng)學(xué)習(xí)效果。
(四)適度的教學(xué)空間能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果
當(dāng)教學(xué)空間處于較小的“3個(gè)單位長(zhǎng)度”時(shí),OpenNARS擁有較高的信息利用率,學(xué)習(xí)效果處于最佳水平。然而,隨著教學(xué)空間的延展,感覺信息量激增,OpenNARS處理和利用信息的壓力也隨之變大。從發(fā)展的視角看,不論人類嬰兒還是通用人工智能的機(jī)器嬰兒,較大的教學(xué)空間不僅加重了學(xué)習(xí)者的認(rèn)知負(fù)荷,也迅速降低了主體在環(huán)境交互過(guò)程中有效感覺信息的占比,阻礙了學(xué)習(xí)效果的提升。換言之,智能主體成長(zhǎng)的初始階段需要空間,卻絕非越大越好,應(yīng)在軀體的基本運(yùn)動(dòng)范圍之內(nèi)最大化提高與目標(biāo)有關(guān)的感覺效用的發(fā)生概率。
七、啟示與展望
本研究通過(guò)受控實(shí)驗(yàn)發(fā)現(xiàn),人類教學(xué)原則同樣能夠提升通用人工智能系統(tǒng)的學(xué)習(xí)效果,從而在機(jī)器教育可能性的基礎(chǔ)上,進(jìn)一步確證了機(jī)器教育的有效性。然而,本研究仍存在某些不足及需要改進(jìn)之處,如:實(shí)驗(yàn)更多利用自變量的理論極值,但更加細(xì)致的自變量水平可以得出改善通用人工智能系統(tǒng)學(xué)習(xí)效果更為精準(zhǔn)的教學(xué)參數(shù),有利于機(jī)器教育應(yīng)用工作的開展。此外,對(duì)于教學(xué)空間自變量研究中5個(gè)單位長(zhǎng)度的學(xué)習(xí)效果劣于7個(gè)單位長(zhǎng)度,可能還隱含著其他作用變量。這些問(wèn)題有待后續(xù)研究探查。同時(shí),本研究還有三方面的理論反思與啟示:
(一)虛擬與模擬的差異
盡管“元宇宙”已迅速成為當(dāng)前教育領(lǐng)域的閃亮熱點(diǎn)[17],但實(shí)證研究及細(xì)致的理論探索仍較為有限。在此問(wèn)題上,基于本實(shí)驗(yàn)的設(shè)計(jì)與開發(fā),有一個(gè)關(guān)鍵的理論問(wèn)題需要辨析——虛擬和模擬是一對(duì)貌似相同卻實(shí)則迥異的易混概念。事實(shí)上,虛擬和模擬是兩種不同的技術(shù)取向[18]:虛擬的設(shè)計(jì)原點(diǎn)內(nèi)嵌著第一人稱的主體視角,強(qiáng)調(diào)系統(tǒng)元機(jī)制的設(shè)計(jì)與運(yùn)作,這種機(jī)制既可以是以現(xiàn)實(shí)世界規(guī)律為藍(lán)本,亦可以是完全嶄新的設(shè)定,因?yàn)槎叨寄鼙惶摂M現(xiàn)實(shí)技術(shù)所支持;模擬則傾向于第三人稱的上帝視角,強(qiáng)調(diào)對(duì)現(xiàn)實(shí)世界表象的模仿和復(fù)刻,越細(xì)致、越細(xì)膩,便越逼真。但對(duì)虛擬來(lái)說(shuō),是否逼真不重要,不同對(duì)象之間的互動(dòng)才最重要。以主流自動(dòng)駕駛仿真平臺(tái)CARLA為例,油門、轉(zhuǎn)速、剎車、轉(zhuǎn)向等參數(shù)非常豐富,但這些參數(shù)卻是以上帝視角給出并計(jì)算,缺少具身嵌入和系統(tǒng)互動(dòng)特征,更多體現(xiàn)出模擬而非虛擬特性。因此,“元宇宙”教學(xué)場(chǎng)景如果擁有逼真的細(xì)節(jié),必能大幅增強(qiáng)學(xué)習(xí)者的臨場(chǎng)感。但是,如果學(xué)習(xí)內(nèi)容涉及與系統(tǒng)復(fù)雜的感知交互,則虛擬環(huán)境對(duì)主體的即時(shí)反饋才是關(guān)鍵。
(二)目標(biāo)及動(dòng)機(jī)系統(tǒng)的重要性
盡管學(xué)習(xí)動(dòng)機(jī)一直是教育學(xué)中的常見問(wèn)題,對(duì)其內(nèi)在機(jī)制的探索卻多見于心理學(xué)領(lǐng)域,即便如此,基于認(rèn)知功能視角的心理學(xué)討論仍非常有限。作為一種“類腦”認(rèn)知系統(tǒng),OpenNARS在四項(xiàng)實(shí)驗(yàn)中的學(xué)習(xí)行為值得深究,特別是“激活”與“成功”的關(guān)系更是剖析自治型智能體動(dòng)機(jī)系統(tǒng)內(nèi)部機(jī)制的關(guān)鍵:一方面,系統(tǒng)的“激活”是其行為“成功”的前提和保障。失活狀態(tài)下,即便不斷輸入有效的教學(xué)材料,也根本無(wú)法觸發(fā)任何行為,更不可能“成功”;另一方面,“激活”的動(dòng)力源于目標(biāo)系統(tǒng),為了維持動(dòng)機(jī)系統(tǒng)的活躍水平,目標(biāo)需要被反復(fù)“強(qiáng)調(diào)”。換言之,這也許是未來(lái)教育學(xué)反哺人工智能的重要突破口。當(dāng)前,專用人工智能的內(nèi)嵌目標(biāo)單一,雖易于建模和求最優(yōu),卻不適于開放環(huán)境。在開放環(huán)境中,智能體的實(shí)際需求和目標(biāo)總是多元和模糊的。這種目標(biāo)之間的復(fù)雜關(guān)聯(lián)具有個(gè)性化的經(jīng)驗(yàn)印記,令傳統(tǒng)的機(jī)器學(xué)習(xí)算法紛紛折戟[19]。面對(duì)當(dāng)前主流人工智能的算法困局及人類嬰幼兒時(shí)期快速發(fā)展的感覺、運(yùn)動(dòng)和語(yǔ)言能力,可以預(yù)見一條基于通用人工智能機(jī)器教育的新路。也許就在不遠(yuǎn)的將來(lái),教育技術(shù)學(xué)界能夠提供具有可解釋、生成式、魯棒性強(qiáng)等特點(diǎn)的機(jī)器人運(yùn)動(dòng)及其主動(dòng)視覺的教育學(xué)解決方案。
(三)學(xué)習(xí)的主體與學(xué)習(xí)的科學(xué)
對(duì)專用人工智能而言,其在教育應(yīng)用中可具有七種角色:輔導(dǎo)者、教練、評(píng)價(jià)者、協(xié)調(diào)者、聯(lián)通者、同伴及學(xué)生[20]。其中,學(xué)生指智能導(dǎo)學(xué)系統(tǒng)所模擬、能以某種方式學(xué)習(xí)的數(shù)字代理,它可以讓人類學(xué)習(xí)者臨時(shí)扮演教師角色進(jìn)行“教中學(xué)”。盡管同伴和學(xué)生角色的觀感及行為模式似人,但它們均非真正意義上與人類等同的學(xué)習(xí)者。與此相反,“能自主感知、理解、預(yù)測(cè)和行動(dòng)”的通用人工智能系統(tǒng)[21]不僅需要接受教育,還可以與人類共享教學(xué)經(jīng)驗(yàn)。但其本身卻不必貌似于人,甚至不能與人類太過(guò)相像,否則容易出現(xiàn)“恐怖谷”效應(yīng),引發(fā)人類學(xué)習(xí)者對(duì)機(jī)器厭惡和恐懼的感覺[22]。在人機(jī)共通的教育規(guī)律背后,蘊(yùn)藏著一個(gè)重大的理論假設(shè):存在跨越人類和機(jī)器學(xué)習(xí)者的普適性學(xué)習(xí)理論。這意味著,學(xué)習(xí)的本質(zhì)也許是一種對(duì)開放環(huán)境主動(dòng)適應(yīng)的認(rèn)知元能力。對(duì)碳基智能而言,從黏菌群體的社交行為[23]到非人類動(dòng)物的“語(yǔ)言”交流[24],從人類嬰兒的先天反射到后天知識(shí)技能的習(xí)得,學(xué)習(xí)呈現(xiàn)出橫跨物種的連續(xù)譜以及愈加注重社會(huì)性遺傳的特點(diǎn)。對(duì)硅基智能而言,專用人工智能的“機(jī)器學(xué)習(xí)”高度依賴數(shù)學(xué)工具,但通用人工智能的學(xué)習(xí)機(jī)理和學(xué)習(xí)過(guò)程高度依賴教育干預(yù)??茖W(xué)研究強(qiáng)調(diào)客觀規(guī)律在不同研究對(duì)象間的可重復(fù)性,橫跨微生物、植物、動(dòng)物及計(jì)算機(jī)等不同“學(xué)習(xí)者”的共同學(xué)習(xí)原理,既是對(duì)學(xué)習(xí)科學(xué)術(shù)語(yǔ)的最好注腳,也是構(gòu)建教育科學(xué)理論大廈的奠基石。
[參考文獻(xiàn)]
[1] MARK L.智能機(jī)器人養(yǎng)成記:開發(fā)人類友好型機(jī)器人[M].劉紅泉,譯.北京:機(jī)械工業(yè)出版社,2021:13-17.
[2] 李芒,余露瑤.須加強(qiáng)教育技術(shù)基礎(chǔ)理論研究[J].電化教育研究,2022,43(9):5-13.
[3] 劉凱.人工智能與教育學(xué)融合的雙重范式變革[J].開放教育研究,2023,29(3):4-18.
[4] 劉凱,賈敏,黃英輝,胡祥恩,王培.像教育人一樣教育機(jī)器——人類教學(xué)原則能用于通用人工智能系統(tǒng)嗎?[J].開放教育研究,2022,28(2):11-21.
[5] 戴益斌.為理智主義辯——從人工智能的視角出發(fā)[J].湖北大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2022,49(1):154-161.
[6] 劉凱,胡祥恩,王培.機(jī)器也需教育?論通用人工智能與教育學(xué)的革新[J].開放教育研究,2018,24(1):10-15.
[7] 安吉洛·坎杰洛西,馬修·施萊辛格.發(fā)展型機(jī)器人:由人類嬰兒?jiǎn)l(fā)的機(jī)器人[M].晁飛,譯.北京:機(jī)械工業(yè)出版社,2017:111-137.
[8] PEI W, CHRISTIAN H, PATRICK H. A model of unified perception and cognition[J]. Frontiers in artificial intelligence, 2022(5):1-14.
[9] 劉凱,賈敏.探索基于通用人工智能的自動(dòng)駕駛[N].中國(guó)社會(huì)科學(xué)報(bào),2022-08-23(007).
[10] 馬會(huì)梅.堅(jiān)持新課程倡導(dǎo)的教學(xué)原則[J].安順師范高等專科學(xué)校學(xué)報(bào),2005(1):9-10.
[11] 張楚廷.凱洛夫教學(xué)原則探疑[J].當(dāng)代教育論壇,2012(3):123-125.
[12] 巴拉克·羅森海因,蔣慧,盛群力.教學(xué)原則:所有教師應(yīng)了解的循證策略[J].課程教學(xué)研究,2017(7):8-15.
[13] 邱婷,鐘志賢.有效教學(xué)原則:客觀主義視角[J].現(xiàn)代遠(yuǎn)距離教育,2007(3):15-18.
[14] GRAESSER C. Inaugural editorial for journal of educational psychology[J]. Journal of educational psychology,2009,101(2):259-261.
[15] LEWTHWAITE R, WULF G. Optimizing motivation and attention for motor performance and learning[J]. Current opinion in psychology, 2017,16:38-42.
[16] 楊柳.挫折教育在我國(guó)基礎(chǔ)教育階段的價(jià)值與意義[J].教學(xué)與管理,2015(21):68-70.
[17] 申靈靈,盧鋒,張金帥,等.從化身到具身:元宇宙教育應(yīng)用的價(jià)值效能與風(fēng)險(xiǎn)考量[J].電化教育研究,2023, 44(4):46-52.
[18] DESHKO P, KRYAZHENKOV G,CHEHARIN E.Virtual technologies[J]. Modeling of artificial intelligence,2016(1):33-43.
[19] 徐英瑾.人工智能哲學(xué)十五講[M].北京:北京大學(xué)出版社,2021:25-27.
[20] 張志禎,張玲玲,徐雪迎,劉佳林.人工智能的教學(xué)角色隱喻分析——以人工智能教育應(yīng)用領(lǐng)域高影響力項(xiàng)目為例[J].中國(guó)遠(yuǎn)程教育,2019(11):24-37,57,93.
[21] LATAPIE H, KILIC O, LIU G, YAN Y, KOMPELLA R, WANG P, TH?RISSON R, SUN Y, SRINIVASA J. A metamodel and framework for artificial general intelligence from theory to practice[J]. Journal of artificial intelligence and consciousness, 2021,8(2):205-227.
[22] MORI M, MACDORMAN F, KAGEKI N.The uncanny valley[J]. IEEE robotics & automation magazine,2012,19(2):98-100.
[23] JACOB B, BECKER I, SHAPIRA Y, LEVINE H. Bacterial linguistic communication and social intelligence[J]. Trends in microbiology,2004,12(8):366-372.
[24] ?ADKOV??L. Do they speak language?[J]. Biosemiotics, 2015,8(1):9-27.
Educating Machines as Humans: Can Human Teaching Experience Improve the Learning Effect of Artificial General Intelligence System?
LIU Kai1,? JIA Min2,? SUN Changxin1,? MA Yuhui1,? WANG Weijun2
(1.School of Educational Sciences, Bohai University, Jingzhou Liaoning 121013;
2.School of Psychology, Central China Normal University, Wuhan Hubei 430079)
[Abstract] Artificial Intelligence(AI) has been divided into two branches of Special purpose AI(SAI) and Artificial General Intelligence(AGI). Both can be integrated with education, but the former focuses on how to use AI to solve educational problems, such as intelligent education. The latter, on the other hand, focuses on how to solve AI problems by educational means, such as machine education. Existing studies have demonstrated the necessity and possibility of the latter, and this study explores the influence of human educational experience on the learning effect of artificial general intelligence systems through experiments, trying to verify the effectiveness of "machine education". The independent variables of the experiment come from four kinds of important factors in human teaching process, which are teaching goal, teaching content, teaching rhythm and teaching space. The results show that the artificial general intelligence system has highly similar sensitivity to the activation frequency of teaching objectives, the accuracy of teaching content, the time interval of teaching rhythm and the size of teaching space as human learners, which can be adjusted by the teaching parameters to obtain better learning results. Therefore, the human education experience can be generalized to artificial general intelligence systems as well. The confirmation of the objective education law of "human-machine compatibility" not only effectively counteracts the questioning of the scientific nature of educational theories with scientific evidence, but also is expected to realize the reverse feedback of pedagogy to AI research.
[Keywords] General Artificial Intelligence; Machine Education; Teaching Principles; Learning Effect; AGI