摘要:利用生成式人工智能來評價學生計算思維的運用情況,可能有多種創(chuàng)新的方法。其中一種方法是,讓學生基于某些可能運用到計算思維的任務,自主向生成式人工智能發(fā)問,通過對在完成任務過程中學生所提問題的文本進行分析,實現(xiàn)對學生計算思維運用情況的評價。本文提出,利用生成式人工智能工具對提問文本進行分析,作為思維運用的分類器、檢驗器和量具,存在一定的可行性,但其較難對學生思維運用的深度和獨創(chuàng)性進行恰當?shù)脑u判,不能完全替代評價過程中教師的主觀感受。
關鍵詞:生成式人工智能;計算思維;計算思維評價
中圖分類號:G434 文獻標識碼:A 論文編號:1674-2117(2024)21-0016-04
“計算思維式的提問”是一個自創(chuàng)短語,用以描述在某人所提出的問題中,問題內(nèi)容本身就能體現(xiàn)出計算思維的運用。在利用生成式人工智能輔助實施任務的過程中,僅僅是提問本身,也或多或少能夠體現(xiàn)出如信息意識、計算思維等信息技術核心素養(yǎng)的狀況,尤其是在一系列的問答交互過程中,教師應善于捕捉提問中隱藏的思維運用的信號,通過恰當?shù)囊龑?,對學生的信息技術核心素養(yǎng)加以培養(yǎng)。雖然生成式人工智能難以給出獨創(chuàng)性的答案,但它往往能提供有用、有啟發(fā)性的答案,且生成答案的效率很高。更重要的是,學生和生成式人工智能的互動可以留存記錄,成為分析學生思維運用的資料,這些資料對研究思維培養(yǎng)的教師來說具有一定的啟發(fā)性。
生成式人工智能工具作為評價思維運用的分類器
學生的問題可視作一種輸入,一方面輸入給生成式人工智能,得到的輸出是針對這個問題的某種回答,另一方面,將“該學生的問題本身更多體現(xiàn)出運用了何種思維方式”作為一種輸入,要求生成式人工智能進行評判,此時,生成式人工智能工具成為一種分類器。需要注意的是,在這里生成式人工智能工具起到了雙重作用。
例如,對于問題“如何用遞歸的方法,編寫代碼顯示一個由星號組成的三角形陣列”,生成式人工智能幾乎都能給出完整且正確的程序代碼。更重要的是,教師可以繼續(xù)追問:“這個問題本身更多體現(xiàn)出的是提問者的信息意識還是計算思維意識?”某生成式人工智能給出了有理有據(jù)的回答:
“信息意識通常指的是個體對信息的敏感度和洞察力,能夠識別信息的價值,并有效地獲取、整合和應用信息。然而,這個問題關聯(lián)到如何使用遞歸這一特定的技術來解決問題。遞歸是計算機科學中一種重要的算法設計技術,它涉及將問題分解成更小的、相似的子問題,直到達到一個簡單到可以直接解決的邊界情況。提問者通過詢問如何使用遞歸來打印星號三角形,展現(xiàn)了對遞歸這一編程概念的理解,并試圖將其應用于解決一個具體的圖形打印問題。這需要對遞歸的原理有深入理解,并設想如何通過遞歸步驟逐步構(gòu)建出所需的圖形。這種思考方式更能體現(xiàn)出計算思維意識?!?/p>
“計算思維意識”不是一個常見的詞語(雖然也偶有文o8cO8OFyZDl0jwPcD+ZXdA==獻提及,但似乎并沒有得到嚴謹?shù)姆治?,在一些文獻中,有時其概念與信息意識相近,有時又與計算思維不加區(qū)分)。筆者認為計算思維意識是運用計算思維的前提條件,這里引用某生成式人工智能對計算思維意識的描述,可以看出概念的界定是清晰的(但無法得知這種清晰的界定到底是來自某文獻,還是其自身的推理過程)。僅就這個例子而言,生成式人工智能對思維運用的判斷是合理的:
“計算思維意識可以理解為對計算思維這種思維方式本身的認知——如計算思維的基本概念、用計算思維解決問題、設計系統(tǒng)等方面的價值和作用,計算思維意識體現(xiàn)出人對計算思維的重視程度及應用意愿?!?/p>
在剛才的例子中,仍然有理由懷疑,人工智能可能只是利用了“遞歸”關鍵詞,通過一系列和概率統(tǒng)計有關的計算,輕松關聯(lián)到了計算思維意識的概念,所以,不妨隱藏那些顯見的和計算思維有關的詞語,重新構(gòu)造問題:“某甲用自然語言的形式,用文字向某生成式人工智能描述了一段數(shù)據(jù)處理的過程,他希望生成式人工智能能夠記住這段描述,并將其命名為功能A命令,然而,他所使用的生成式人工智能工具有很大的缺陷,這個工具無法領會重復執(zhí)行功能A命令。某甲思考后發(fā)現(xiàn),可以在功能A的描述中調(diào)用功能A命令自身,這樣就實現(xiàn)了一種重復執(zhí)行命令的功能。請問,某甲的思考和設計,主要體現(xiàn)了信息技術中哪一種核心素養(yǎng)?”結(jié)果,生成式人工智能仍然能邏輯清晰地論證某甲的設計最主要體現(xiàn)了計算思維的運用,同時,回答中也妥當?shù)靥峒坝赡臣淄诰蚬ぞ邼撃芴幚硇畔⑦@一角度,可以認為其中也有信息意識的體現(xiàn)。
以上實驗讓人產(chǎn)生一種希望:可以利用生成式人工智能,通過分析問答文本,就能夠?qū)崿F(xiàn)對學生思維運用情況的自動化評價。雖然的確存在這樣的可行性,但局限也是顯見的,既然人工智能的推理和文本生成都是基于已有的大數(shù)據(jù),那么它應當難以對人獨創(chuàng)性的思維運用方式進行評判。另外,人也可以通過單純對文本的模仿,來顯現(xiàn)某種思維運用的表象——但如果評價目標不顯山露水地融合到學習活動中,就有可能消除這一缺陷。
需要提出的是,過程性評價的準確性有可能受到學生實際狀態(tài)的影響。例如,某甲和某乙都可能向生成式人工智能發(fā)問:“如何保證人工智能的回答是全面、完整的?”顯然,他們都意識到在獲取信息時,完整性是重要的方面,可視為信息意識的體現(xiàn)。繼而,假設他們兩人在終端輸入Python后,都得到了“'Python'不是內(nèi)部或外部命令,也不是可運行的程序或批處理文件”這句報錯信息,某甲向生成式人工智能提問道:“為何輸入Python命令后報錯?”某乙提問道:“我得到了'Python'不是內(nèi)部或外部命令,也不是可運行的程序或批處理文件這樣的錯誤信息,請盡可能列出各種造成錯誤的情況。”生成式人工智能給出這樣的分析:
“乙同學不僅準確描述了問題的具體現(xiàn)象,還進一步要求列出所有可能的情況,這種提問方式表明,在甲乙同學都具有對計算機系統(tǒng)運行原理相同程度的知識儲備的假設前提下,似乎體現(xiàn)出乙同學具備更強的信息敏感度和分析能力,能夠意識到遇到的問題可能涉及多個方面和多種原因,并希望獲取更全面的信息來輔助問題的解決?!?/p>
看上去,乙同學的提問體現(xiàn)出更強的信息意識,更能體現(xiàn)出“主體在與信息有關的認知活動中產(chǎn)生的感受,以及在感受積累的基礎上形成的對信息活動的覺知能力……具有一種此時此地的特性”。[1]但需要注意的是,優(yōu)秀的生成式人工智能可能會圍繞不起眼的語句片段展開宏大的推理和關聯(lián),就算是對于某甲這樣簡單的提問,生成式人工智能也非常有可能全面地給出導致命令失敗的可能性,甚至提到用戶根本就沒有安裝Python這一可能。因此,某甲完全可能是在充分了解了生成式人工智能的能力后,才做此簡單的發(fā)問。正是思維過程的這種“此時此地”的特性,提醒人們,在復雜的真實環(huán)境中,生成式人工智能的評價能力是有限的。
生成式人工智能工具作為評價思維運用深度的量具
考慮這樣的問題,能否讓生成式人工智能評價思維運用的深度?這里的輸出不是簡單的是或否、有或無,或某種類別,而是具有一定模糊性的滑尺式的判定。從統(tǒng)計學的角度上看,這仍然具有一定可行性,因為可以將學生的提問和教師的評價視作輸入數(shù)據(jù)和輸出數(shù)據(jù),只要數(shù)據(jù)量足夠大,生成式人工智能就能根據(jù)文本對學生思維運用的深度做出具有一定準確率的判定。
可是,既然人工智能構(gòu)建模型的訓練資料是現(xiàn)有的文本,那么就存在一個難解的矛盾:為了讓生成式人工智能有可能成為思維運用深度的量具,就不得不限定在一定的框架下進行對比,但框架的設定本身卻是一個技術和哲學上的難題——哪些蘊含關系與當前情境有關?哪些無關?顯然,人工智能必須有可供分析的文本符號,才能進行比較,但極有可能,并非人的所有行為都對應某種文本符號,“人的一切非隨意的行為都可以形式化,是一種柏拉圖主義”[2]認知下的幻覺。正如本文開頭給出的“計算思維式的提問”這個短語,它只有在被公眾或科學共同體認可并廣泛使用之后,才有可能形成可供分析的數(shù)據(jù)資料,但在此之前,“計算思維式的提問”這個方法并不在人工智能的分析框架之內(nèi)。
這里有一個試著讓生成式人工智能評判某三個人在解決問題過程中計算思維的運用程度的有趣實驗,提問文本是這樣的:“某甲開發(fā)了邏輯鏈網(wǎng)技術,該技術一是基于數(shù)據(jù)科學——涉及使用各種算法和模型來解析大量數(shù)據(jù),二是基于邏輯編程——一種側(cè)重于用聲明性語句來描述問題解決方案的編程范式,不同于傳統(tǒng)的命令式編程,三是基于系統(tǒng)工程——涉及將復雜的系統(tǒng)分解為可管理的部分,并理解各部分之間的相互作用;某乙使用函數(shù)自我調(diào)用過程中產(chǎn)生悖論的方法,證明了邏輯鏈網(wǎng)無法自洽地推理出所有為真的邏輯命題,也就是說,有些為真的邏輯命題,是不能用邏輯鏈網(wǎng)推論獲得的;某丙用邏輯鏈網(wǎng)構(gòu)造了一個在二維平面上反復迭代的離散元胞自動機系統(tǒng),通過構(gòu)造特定的起始狀態(tài),這個離散元胞自動機系統(tǒng)能夠模擬邏輯鏈網(wǎng)本身的功能,基于此證明了邏輯鏈網(wǎng)的通用性。”在提問的文本中,“邏輯鏈網(wǎng)”是一個臆造的生詞,某甲的工作描述,其實來自另一個生成式人工智能的虛構(gòu),而某乙和某丙的工作描述,除了“邏輯鏈網(wǎng)”一詞為虛構(gòu)外,均對應了計算機科學發(fā)展歷程中某項重要而獨特的思想方法,在多個生成式人工智能的實驗中,它們都沒有對某乙和某丙的思維運用的獨特性加以特別描述,有些甚至還傾向于認為某甲的工作具有更深的思維深度。
在本節(jié)最后,用一個簡單的思想實驗暗示人工智能的能力局限:假設人工智能能夠判定文字中蘊含的思維深度,那么通過很多次的隨機的自問自答,就能產(chǎn)生出具有思想深度的洞見,但這和現(xiàn)實狀況是相悖的??梢姡斯ぶ悄芄倘豢梢援a(chǎn)生各種各樣的文字內(nèi)容,但對思維運用深度的主要的判決權,仍然掌握在人的手中。但這樣又同時產(chǎn)生出另一個推論,對于學生是否深刻地運用了計算思維的評價,很可能難以制訂出客觀的標準。
生成式人工智能工具作為思維獨創(chuàng)性的檢驗器
考慮這樣一個簡單的任務:要求某生成式人工智能編寫Python代碼,第一行顯示一個星號,第二行連續(xù)顯示兩個星號……直到第十行連續(xù)顯示十個星號,組成一個三角形形狀的星號陣列。一個有趣的實驗是,可以要求生成式人工智能不斷用不同的方法來編寫程序代碼。人工智能的確能給出多種不同的方法,如嵌套循環(huán)、字符串乘法、字符串連接等,其中有一些方法,對算法的初學者是頗有啟發(fā)性的,然而,如果提示詞不發(fā)生變化,盡管一再提出更換方法的要求,生成式人工智能也不再有辦法給出真正的新的方案,而是陷入一種用多種方法做排列組合的應付狀態(tài)。
提問者當然可以結(jié)合自己已學的知識來修改提示詞,讓生成式人工智能更換方案,如“請使用第三方的Goto跳轉(zhuǎn)功能構(gòu)造循環(huán)來實現(xiàn)以上任務”,或者“在畫布上繪制星號的矩形然后再設法遮住其對角線的一側(cè)”,或者“直接構(gòu)造一個包含換行符、空格和星號的字符串然后打印出來”。在這里,可以想象,提問者在不斷枚舉著自己已知的方法,并將這些方法加以改造或重新組合,以實現(xiàn)顯示三角形排列的星號陣列的任務。有一個很重要的問題是,生成式人工智能從自己的龐大數(shù)據(jù)中分析和推理獲得方法,而人也是從自己儲備的經(jīng)驗中獲得方法,這種看上去和機器處理數(shù)據(jù)得到某種結(jié)果相當類似的過程似乎質(zhì)疑了人的思維過程的獨創(chuàng)性。若要打消這種懷疑,就不得不仔細審視語言和世界的關系,“語言符號的有限性、離散性、收斂性與它所描述的呈無限性和連續(xù)分布狀態(tài)的對象之間會產(chǎn)生一定的差異和矛盾”[3],世界相對于其產(chǎn)生的語言符號而言,是第一性的。如維特根斯坦所說,語言的意義在于真實生活中的使用,“在聽到一個命令,與對該命令做出回應——予以執(zhí)行——之間‘有著一條鴻溝’,而這條溝必須由‘理解活動’予以填平”。[4]所以,當人想到某種新方法來解決問題的時候,這種方法固然和他頭腦中的知識儲備有關,但卻不是簡單的枚舉,這種對認知上的“鴻溝”進行“填平”的行為,是無法還原成語言符號的。
所以,生成式人工智能可以成為一種檢驗器,盡管有時它無法直接合理評價思維運用的深度,但人卻可以通過枚舉的方法,從生成式人工智能提供的各種各樣的回答中,梳理出已有的人類思維的成果,由此間接了解提問者思維運用的獨創(chuàng)性。
結(jié)論
隨著人工智能技術的飛速發(fā)展,生成式人工智能已展現(xiàn)出強大的自然語言處理能力和上下文理解能力,能夠模擬人類對話,根據(jù)提問生成相應回答并有可能圍繞問題做進一步的深層討論,這為學生提供了一個即時反饋與互動的平臺,使得其在完成任務時能夠隨時提出疑問、驗證想法或探索解決方案。通過對學生在生成式人工智能平臺上的交互文本進行評價,能夠在一定程度上反映學生在解決實際問題時的思維過程,而非僅僅依賴靜態(tài)答案或測試結(jié)果,較大程度地隱藏了教師的意圖,提高過程性評價的準確性。這種評價實施過程與學生的自主學習過程融合在一起,鼓勵學生通過提問來深化理解,而非被動接受知識。通過收集并分析這些提問,可以洞察學生在問題分解、抽象思維、算法設計等計算思維核心要素上的表現(xiàn)。
在學生完成任務的過程中,引入生成式人工智能作為互動對象,通過向其提問并分析這些問題文本,對學生的計算思維運用情況進行評價,這一做法是具有可行性的。當然,現(xiàn)實世界的復雜性與人類思想的復雜性,使得生成式人工智能較難自動化地評價思維運用的深度和獨創(chuàng)性,因此不能完全替代評價過程中教師的主觀感受。
參考文獻:
[1]解敏,衷克定.信息意識概念的新構(gòu)想與實證[J].現(xiàn)代遠程教育研究,2012,24(05):51-56.
[2]德雷福斯.計算機不能做什么:人工智能的極限[M].寧春巖,譯.北京:生活·讀書·新知三聯(lián)書店,1986.
[3]魯苓.語言·言語·交往[M].北京:社會科學文獻出版社,2004.
[4]維特根斯坦.哲學研究[M].李步樓,譯.北京:商務印書館,2008.