• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      機器學(xué)習(xí)應(yīng)用于在線科學(xué)探究中的綜述研究

      2023-09-06 06:17:37孫社兵張巧榮李田茖
      現(xiàn)代信息科技 2023年14期
      關(guān)鍵詞:科學(xué)教育機器學(xué)習(xí)

      孫社兵 張巧榮 李田茖

      摘 ?要:機器學(xué)習(xí)近幾年來逐漸被應(yīng)用于在線科學(xué)探究活動的自動評價、過程分析等方面,在輔助教師教學(xué)、提升學(xué)生科學(xué)學(xué)習(xí)效果上發(fā)揮了重要作用。機器學(xué)習(xí)融入并支持在線探究學(xué)習(xí)活動是未來科學(xué)探究走向大規(guī)模多場景實踐應(yīng)用的重要技術(shù)支撐。為向國內(nèi)研究者和一線教師提供開展相關(guān)研究和教學(xué)實踐的參考,在三個英文數(shù)據(jù)庫中篩選出了近10年發(fā)表的24篇英文文獻(xiàn),總結(jié)分析了目前機器學(xué)習(xí)在在線科學(xué)探究中發(fā)揮的作用及具體應(yīng)用,并提出了未來展望。

      關(guān)鍵詞:在線科學(xué)探究;虛擬探究;機器學(xué)習(xí);科學(xué)教育

      中圖分類號:TP18;G434 ? ? 文獻(xiàn)標(biāo)識碼:A ? ? 文章編號:2096-4706(2023)14-0103-08

      Review Research on the Application of Machine Learning in Online Scientific Inquiry

      SUN Shebing, ZHANG Qiaorong, LI Tiange

      (Henan University of Economics and Law, Zhengzhou ?450046, China)

      Abstract: In recent years, machine learning has been gradually applied to the automatic evaluation and process analysis of online scientific inquiry activities, and has played an important role in assisting teachers in teaching and improving students' scientific learning effect. It is an important technical support for machine learning to integrate into and support online inquiry learning activities of scientific inquiry to move to large-scale and multi-scene practical application in the future. In order to provide reference for domestic researchers and front-line teachers to carry out relevant research and teaching practice, 24 English literatures published in the past ten years are selected from three English databases. It summarizes and analyzes the role and specific application of machine learning in online scientific inquiry at present, and puts forward future prospects.

      Keywords: online scientific inquiry; virtual inquiry; machine learning; science education

      0 ?引 ?言

      世界各地的科學(xué)教育標(biāo)準(zhǔn)強調(diào)讓學(xué)生通過探究學(xué)習(xí)科學(xué)的重要性[1]。在我國基礎(chǔ)教育改革中,新課程標(biāo)準(zhǔn)也明確提出“科學(xué)學(xué)習(xí)要以探究為核心”[2]。已有研究表明,科學(xué)探究學(xué)習(xí)能夠幫助學(xué)生理解科學(xué)的本質(zhì)及其推理過程,培養(yǎng)對科學(xué)的積極態(tài)度[3]??茖W(xué)探究過程包括從發(fā)現(xiàn)問題、猜想假設(shè),到設(shè)計實驗、收集證據(jù),再到分析論證、交流評估的一系列活動[4]。但在科學(xué)學(xué)習(xí)中,許多科學(xué)活動由于其特殊性無法在課堂環(huán)境中開展。計算機支持的在線探究環(huán)境在科學(xué)課堂上發(fā)揮著重要作用,為學(xué)生提供了使用多種呈現(xiàn)方法探索不同類型科學(xué)現(xiàn)象的機會,例如模擬[5]、可視化[6]、增強現(xiàn)實[7]、遠(yuǎn)程實驗室[8]等。以往的研究表明參與在線科學(xué)探究活動的學(xué)生相比于使用傳統(tǒng)學(xué)習(xí)方法的表現(xiàn)更好[9]。因此,在線科學(xué)探究活動成為當(dāng)前科學(xué)教育的重要發(fā)展方向之一。

      關(guān)于學(xué)習(xí)科學(xué)和基于學(xué)科的教育研究的文獻(xiàn)表明,僅使用計算機支持的在線環(huán)境進(jìn)行探究活動并不一定有助于學(xué)生進(jìn)行科學(xué)學(xué)習(xí)[10]。研究表明,提供基于研究和理論的適當(dāng)指導(dǎo)、支持,在線環(huán)境下的探究活動才有利于改進(jìn)學(xué)生的學(xué)習(xí)[11]。要為學(xué)習(xí)者提供有效的支持則需要以其在探究過程中的具體行為和表現(xiàn)作為提供支持的依據(jù),但跟蹤和檢查學(xué)生探究學(xué)習(xí)的過程是具有挑戰(zhàn)性的。之前的研究認(rèn)為,機器學(xué)習(xí)是一種有前途的自動化技術(shù),可以輔助教師為探究學(xué)習(xí)提供及時支持[12]。例如,機器學(xué)習(xí)可以通過識別學(xué)生探究過程中產(chǎn)生的行為數(shù)據(jù),在學(xué)生出現(xiàn)無效或與探究活動無關(guān)的行為時提供支持使其能夠?qū)W⒂谔骄咳蝿?wù)[13]。此外,與多項選擇題相比,科學(xué)探究中對建構(gòu)反應(yīng)式的題目進(jìn)行回答更能夠體現(xiàn)學(xué)生的思維和推理過程[14]。而人工對建構(gòu)反應(yīng)式題目進(jìn)行評分需要耗費大量的時間和精力,且無法對學(xué)生的回答進(jìn)行即時的反饋。機器學(xué)習(xí)可以幫助教師幾乎立即評估和解釋學(xué)生在課堂上的復(fù)雜表現(xiàn),從而支持教師調(diào)整教學(xué)方案[15]?;跈C器學(xué)習(xí)的自動評分和與分?jǐn)?shù)相適應(yīng)的個性化反饋或指導(dǎo)也可以通過在線導(dǎo)師系統(tǒng)或自適應(yīng)系統(tǒng)實時提供給學(xué)習(xí)者,以指導(dǎo)學(xué)生的科學(xué)學(xué)習(xí)[16,17]。

      盡管機器學(xué)習(xí)在在線科學(xué)探究中具有巨大的潛力,但目前仍缺少關(guān)于機器學(xué)習(xí)在在線科學(xué)探究中應(yīng)用的系統(tǒng)回顧。Zhai等人的研究綜述了機器學(xué)習(xí)在科學(xué)評估中的應(yīng)用,系統(tǒng)分析了應(yīng)用于科學(xué)評估的機器學(xué)習(xí)的技術(shù)特征、機器學(xué)習(xí)算法有效性的評估方法以及在科學(xué)評估中應(yīng)用機器學(xué)習(xí)算法的教學(xué)特點[18]。但Zhai等人綜述的研究范圍為所有使用了機器學(xué)習(xí)進(jìn)行科學(xué)評估的研究,而沒有關(guān)注在具體探究過程中機器學(xué)習(xí)是如何發(fā)揮作用的。本研究則將焦點集中在使用機器學(xué)習(xí)為在線科學(xué)探究活動提供支持的研究上。目前,國內(nèi)在在線科學(xué)探究領(lǐng)域應(yīng)用機器學(xué)習(xí)的研究較少,以科學(xué)探究和機器學(xué)習(xí)相關(guān)關(guān)鍵詞的組合在知網(wǎng)檢索時得到的中文文獻(xiàn)數(shù)量屈指可數(shù)。因此,有必要對國外相關(guān)研究進(jìn)行綜述,分析機器學(xué)習(xí)在在線科學(xué)探究中發(fā)揮的作用及具體應(yīng)用,以期為國內(nèi)實施相關(guān)研究和教學(xué)提供指導(dǎo)。本研究對檢索出的近十年相關(guān)文獻(xiàn)24篇英文文獻(xiàn)進(jìn)行系統(tǒng)回顧,并提出以下兩個研究問題:

      1)機器學(xué)習(xí)應(yīng)用于在線科學(xué)探究的哪些方面?發(fā)揮了什么作用?

      2)在線科學(xué)探究中采用了哪些類型的機器學(xué)習(xí)算法?算法的有效性如何?

      1 ?研究方法

      1.1 ?文獻(xiàn)來源

      為研究當(dāng)前機器學(xué)習(xí)應(yīng)用于在線科學(xué)探究的發(fā)展趨勢,本研究在Eric、ScienceDirect和Web of Science三個英文數(shù)據(jù)庫檢索了2012—2022近十年的相關(guān)研究。研究檢索關(guān)鍵詞為“Scienceinquiry”“Computer-supportedinquirylearning”“Web-basedinquirylearning”

      “Virtual science inquiry”“Scientificargumentation”

      “machine learning”“automatic scoring”“automatic guidance”和“automatic feedback”,將以上關(guān)鍵詞用“And”或“OR”進(jìn)行組合在數(shù)據(jù)庫中進(jìn)行檢索并將語言限定為英語,最終得到文獻(xiàn)636篇。研究者根據(jù)指定的納入/排除標(biāo)準(zhǔn)對文獻(xiàn)進(jìn)行篩選,標(biāo)準(zhǔn)如表1所示。

      首先,研究者使用Endnote X9軟件排除了59篇重復(fù)文獻(xiàn)。然后使用納入/排除標(biāo)準(zhǔn)篩選了剩余577篇文獻(xiàn)的標(biāo)題和摘要,并最終保留了55篇文獻(xiàn)。之后,通過閱讀全文進(jìn)一步排除了36篇不合格的文獻(xiàn)。為擴大樣本的代表性,在關(guān)鍵詞檢索的基礎(chǔ)上使用滾雪球的方法追加檢索結(jié)果,最終納入24篇文獻(xiàn),文獻(xiàn)檢索和篩選流程如圖1所示。

      1.2 ?文獻(xiàn)編碼方案

      在使用納入/排除標(biāo)準(zhǔn)篩選出最終納入文獻(xiàn)之后,研究者對這24篇文獻(xiàn)進(jìn)行了編碼分析。在快速閱讀摘要和分析文獻(xiàn)框架的基礎(chǔ)上,本研究編碼了納入文獻(xiàn)的基本信息,包括文獻(xiàn)的作者、發(fā)表時間、地區(qū)、教育水平、在線科學(xué)探究任務(wù)的探究主題和探究平臺、開發(fā)和部署機器學(xué)習(xí)算法的程序/工具。然后,針對第一個研究問題,編碼了機器學(xué)習(xí)在在線科學(xué)探究中應(yīng)用范圍及發(fā)揮的作用。最后,針對第二個研究問題,編碼了研究中應(yīng)用的具體的機器學(xué)習(xí)算法和評估算法有效性的標(biāo)準(zhǔn)。

      2 ?研究結(jié)果

      2.1 ?文獻(xiàn)基本信息

      本研究統(tǒng)計了篩選出的24篇文獻(xiàn)的基本信息,如表2所示。

      由表2可知,在在線科學(xué)探究任務(wù)中應(yīng)用機器學(xué)習(xí)的研究集中于少數(shù)團(tuán)隊。例如,文獻(xiàn)[1]、[4]、[6]、[7]是美國伍斯特理工學(xué)院學(xué)習(xí)科學(xué)與技術(shù)項目的Gobert團(tuán)隊的研究,該團(tuán)隊的主要研究內(nèi)容是使用機器學(xué)習(xí)分析學(xué)生的日志行為數(shù)據(jù)為探究過程提供支持;文獻(xiàn)[15]、[16]、[18]、[23]和[24]是美國教育考試服務(wù)中心和康科德集團(tuán)的合作團(tuán)隊Lee團(tuán)隊的研究,該團(tuán)隊的研究方向是為學(xué)生的科學(xué)論證提供自動評分和自動反饋。其他還有中國臺灣國立政治大學(xué)Chen的團(tuán)隊、加拿大不列顛哥倫比亞大學(xué)Fratamico的團(tuán)隊等。此外,這些研究大多數(shù)是美國的科研機構(gòu),占總研究數(shù)量的79.2%。研究對象的教育階段大多集中在中學(xué),占總研究數(shù)量的62.5%,而涉及小學(xué)階段的僅有3項。應(yīng)用機器學(xué)習(xí)技術(shù)的在線科學(xué)探究任務(wù)的主題更多地集中在物理學(xué)科,一種可能的原因是物理相比于其他學(xué)科具有更多的線性因果結(jié)構(gòu),使得對學(xué)生探究技能的評估更加簡單[20]。

      在24項研究中共使用了12個探究平臺開展探究任務(wù)。其中使用最多的通用探究平臺是WISE(Web-based Inquiry Science Environment)。WISE平臺是由美國加利福尼亞大學(xué)伯克利分校Marcia.C.Linn主持的科學(xué)教育和教育技術(shù)研究團(tuán)隊在美國國家科學(xué)基金會NSF(National Science Foundation)的資助下開發(fā)[41]。WISE有50多個免費的開放式科學(xué)探究學(xué)習(xí)任務(wù),提供各種探究工具幫助學(xué)習(xí)者以自主探究的方式學(xué)習(xí)科學(xué)知識,同時WISE為教師提供了各種易操作的工具幫助教師監(jiān)督學(xué)生的學(xué)習(xí)情況、管理學(xué)生的學(xué)習(xí)活動等。WISE系統(tǒng)集成了由ETS開發(fā)的c-rater-ML工具,可以利用機器學(xué)習(xí)為學(xué)生提供自動評分與反饋。2015年,華南師范大學(xué)對該平臺進(jìn)行了漢化,并被國內(nèi)多項開展在線科學(xué)探究的研究使用[42]。

      2.2 ?機器學(xué)習(xí)的應(yīng)用

      在對回顧的24篇文獻(xiàn)編碼后發(fā)現(xiàn),機器學(xué)習(xí)主要應(yīng)用于在線科學(xué)探究過程中學(xué)生的行為數(shù)據(jù)分析和學(xué)生提交的科學(xué)論證文本的自動評分和反饋。

      2.2.1 ?在線探究過程學(xué)生行為數(shù)據(jù)分析

      基于計算機的在線探究環(huán)境可以自動實時記錄學(xué)生的行為,由于這些日志文件是在學(xué)生探究過程中生成的,因此可以根據(jù)這些探究行為對探究生成的結(jié)果和學(xué)生的探究技能進(jìn)行評估。在回顧的24篇文獻(xiàn)中有12篇文獻(xiàn)使用機器學(xué)習(xí)算法處理學(xué)生在探究過程中生成的行為數(shù)據(jù)。其中,Gobert團(tuán)隊的研究使用機器學(xué)習(xí)算法對學(xué)生行為進(jìn)行預(yù)測,研究開發(fā)了基于機器學(xué)習(xí)的探測器,該探測器通過對日志行為數(shù)據(jù)的分析判斷學(xué)生是否在正常進(jìn)行實驗并對行為進(jìn)行預(yù)測,以期在學(xué)生出現(xiàn)偏離探究實驗軌道的行為時,為學(xué)生提供幫助使其專注于探究任務(wù)[13,21,23,24]。Chen等人的研究使用機器學(xué)習(xí)識別影響學(xué)生學(xué)習(xí)成績的關(guān)鍵行為序列,研究在CWISE平臺中嵌入基于xAPI(體驗應(yīng)用程序編程接口)的學(xué)習(xí)記錄存儲模塊,以記錄有關(guān)學(xué)生學(xué)習(xí)過程的詳細(xì)數(shù)據(jù),并使用序列挖掘算法分析這些行為數(shù)據(jù),識別不同學(xué)習(xí)成績和探究能力的學(xué)習(xí)者的學(xué)習(xí)行為[24,27]。Baker等人的研究使用機器學(xué)習(xí)中的分類算法開發(fā)了與教育相關(guān)的無傳感器情感模型,將探究行為分類為無聊、困惑、喜悅、專注和沮喪五種情感狀態(tài),檢查與特定情感狀態(tài)最密切相關(guān)的行為,通過為學(xué)生提供自適應(yīng)個性化指導(dǎo)提高學(xué)生參與度和學(xué)習(xí)能力[20]。

      2.2.2 ?科學(xué)論證文本的自動評分與反饋

      在24篇文獻(xiàn)中,還有12篇文獻(xiàn)利用機器學(xué)習(xí)處理學(xué)生在探究過程中生成的文本數(shù)據(jù)。在科學(xué)探究過程的最后階段,對科學(xué)現(xiàn)象做出解釋或?qū)ψ约旱牟孪脒M(jìn)行論證是一種重要的探究產(chǎn)出,用以評估學(xué)生對科學(xué)現(xiàn)象的理解程度。機器學(xué)習(xí)的一個重要作用就是對解釋或論證的文本進(jìn)行自動評分并提供與分?jǐn)?shù)相對應(yīng)的自動反饋。自動評分不但可以節(jié)省時間和精力、減少人工評分過程中的錯誤和偏見,而且可以實現(xiàn)實時不斷的連續(xù)評分,這時使用人工評分很難達(dá)到的效果。例如,Lee團(tuán)隊的研究為學(xué)生的論證提供自動評分與反饋,研究結(jié)果顯示,自動評分與自動反饋能夠促進(jìn)學(xué)生的修訂行為,提高學(xué)生的論證成績[31,32]。除對解釋和論證文本進(jìn)行自動評分外,Sung等人的研究還使用機器學(xué)習(xí)對學(xué)生的熱力學(xué)回答進(jìn)行多標(biāo)簽文本分類以快速評估學(xué)生的思維方式[38],在在線學(xué)習(xí)環(huán)境的認(rèn)知科學(xué)領(lǐng)域取得了新進(jìn)展。在小組合作的在線探究環(huán)境中,小組內(nèi)還會產(chǎn)生一些交流的文本數(shù)據(jù),Xing和Zhu等人的研究建立了機器學(xué)習(xí)模型來自動識別協(xié)作環(huán)境中產(chǎn)生的大規(guī)模的變革性和非變革性討論,旨在發(fā)現(xiàn)小組內(nèi)的哪些討論有助于科學(xué)學(xué)習(xí)[35,36]。

      2.3 ?算法及有效性評估

      2.3.1 ?在線科學(xué)探究中應(yīng)用的機器學(xué)習(xí)算法

      基于機器學(xué)習(xí)的算法可以分為有監(jiān)督、無監(jiān)督或半監(jiān)督,具體取決于訓(xùn)練算法的數(shù)據(jù)集使用、不使用或部分使用人類專家標(biāo)簽/分?jǐn)?shù)。表3顯示了24篇文獻(xiàn)中各類算法的使用情況。應(yīng)用于在線科學(xué)探究任務(wù)的機器學(xué)習(xí)算法中,主要使用的是有監(jiān)督的機器學(xué)習(xí)算法和無監(jiān)督的機器學(xué)習(xí)算法。

      對于有監(jiān)督的機器學(xué)習(xí),首先機器從人工標(biāo)記過的數(shù)據(jù)中學(xué)習(xí),建立算法模型,然后使用該模型推斷并做出決策。因為訓(xùn)練數(shù)據(jù)提供標(biāo)簽并包含機器學(xué)習(xí)算法要學(xué)習(xí)的模式,因此被稱為有監(jiān)督的機器學(xué)習(xí)。在24項研究中,有19項研究使用了有監(jiān)督的機器學(xué)習(xí),占總研究數(shù)量的79.2%。其中回歸算法使用最為廣泛。在回歸中SVR(support vector regression)是使用最多的一種回歸算法。SVR基于機器學(xué)習(xí)技術(shù),是專門用于處理具有大量相關(guān)預(yù)測變量的大型數(shù)據(jù)集的統(tǒng)計分析方法。ETS開發(fā)的自動評分工具c-rater-ML就是使用SVR來建立學(xué)生回答與分?jǐn)?shù)之間的關(guān)系模型,并識別從文本回答到分?jǐn)?shù)之間的映射。

      與有監(jiān)督的機器學(xué)習(xí)不同,無監(jiān)督的機器學(xué)習(xí)不需要標(biāo)記數(shù)據(jù)來訓(xùn)練機器,因此它減少了人力花費。使用無監(jiān)督的機器學(xué)習(xí)方法,機器可以根據(jù)個別案例特征的共性和差異識別數(shù)據(jù)集中的潛在結(jié)構(gòu)、分布或模式,以構(gòu)建算法。在24項研究中有6項研究使用了無監(jiān)督的機器學(xué)習(xí)方法,占總研究數(shù)量的25%。其中,5項研究使用無監(jiān)督機器學(xué)習(xí)方法進(jìn)行序列挖掘。這些研究希望從學(xué)生的日志數(shù)據(jù)中挖掘出探究的有效行為,以期為學(xué)生提供支持。在這5項研究中有3項研究使用的是K-means聚類算法,K-mans以空間中k個點為形心進(jìn)行聚類,對最靠近他們的對象歸類,通過迭代的方法,逐次更新各簇的形心的值,直至得到最好的聚類結(jié)果,是最經(jīng)典的基于劃分的聚類方法。例如,F(xiàn)ratamico等人的研究根據(jù)交互日志對學(xué)生的行為進(jìn)行聚類,以識別具有相似行為的學(xué)生[27]。Chen等人的研究使用聚類算法挖掘出學(xué)生探究過程中發(fā)生頻率足夠高的行為,分析這些行為和學(xué)習(xí)績效之間的關(guān)系,以預(yù)測學(xué)生的成績[28,37]。此外,1項研究使用了Bert深度學(xué)習(xí)方法。Sung等人的研究使用Bert實現(xiàn)了在科學(xué)教育的自動化評估中對學(xué)生的書面回答進(jìn)行多標(biāo)簽分類,以識別學(xué)生不同的思維方式,相比于傳統(tǒng)的機器學(xué)習(xí)方法SVM取得了更好的分類效果[38]。

      半監(jiān)督的機器學(xué)習(xí)是指一部分訓(xùn)練數(shù)據(jù)被標(biāo)記,另一部分未標(biāo)記。半監(jiān)督的機器學(xué)習(xí)可用于分析輸入數(shù)據(jù)的結(jié)構(gòu)或預(yù)測未標(biāo)記數(shù)據(jù)中的模式。由于半監(jiān)督機器學(xué)習(xí)提高了無監(jiān)督機器學(xué)習(xí)的準(zhǔn)確性,并克服了為有監(jiān)督的機器學(xué)習(xí)準(zhǔn)備數(shù)據(jù)的時間和成本負(fù)擔(dān),因此它具有很大的潛力。但在本研究篩選出來的24項研究中,沒有使用半監(jiān)督的機器學(xué)習(xí)算法。

      2.3.2 ?算法的有效性

      機器學(xué)習(xí)中需要評估算法的有效性,即機器為測試數(shù)據(jù)分配的分?jǐn)?shù)在多大程度上接近人類專家生成的分?jǐn)?shù)。在某種程度上,人類分配的分?jǐn)?shù)被視為評估機器學(xué)習(xí)性能的“金標(biāo)準(zhǔn)”[16]。在回顧的24篇文獻(xiàn)中,機器學(xué)習(xí)算法的有效性主要依據(jù)以下指標(biāo)進(jìn)行評估:

      1)科恩的kappa值[13]。在24篇文獻(xiàn)中,使用最多的有效性指標(biāo)是科恩的kappa值,有9項研究使用了這一指標(biāo)??贫鞯膋appa值范圍在-1.0~1.0之間,用于評估機器學(xué)習(xí)研究中機器分配的分?jǐn)?shù)和人工分配的分?jǐn)?shù)之間的一致程度或可比性。Kappa值為1,說明對于每個回答,機器評分與人工評分是完全一致的,不存在偶然的一致;值為0表示機器評分和人工評分之間的所有一致性都是偶然的;值為負(fù)數(shù)表示機器評分和人工評分之間的一致性比偶然一致更差。一般認(rèn)為,科恩的kappa值大于0.75表示人機一致性好,0.40~0.75之間表示人機一致性尚可,小于0.4則表示人機一致性較差[43]。在使用了這一指標(biāo)的9篇文獻(xiàn)中,7篇文獻(xiàn)中的使用算法的kappa值在0.41~0.702,只有2項研究的kappa值低于0.4,及大部分機器學(xué)習(xí)算法的人機一致性取得了令人尚能滿意的結(jié)果。

      2)精確率[13]。精確率指正樣本被預(yù)測正確的比率,該指標(biāo)表示機器識別標(biāo)記數(shù)據(jù)的有效性。有7項研究使用的有效性指標(biāo)是精確率。在使用了這一指標(biāo)的研究中,精確率值在0.7~0.95之間。

      3)二次加權(quán)的kappa值(QWK)[39]。QWK根據(jù)編碼員之間的分歧程度,為不同的分歧分配不同的權(quán)重,QWK假設(shè)變量是在區(qū)間尺度上測量的,不適用于名義數(shù)據(jù)。在使用了這一指標(biāo)的研究中,精確率值在0.7~0.9之間。

      4)A[23]。A是指當(dāng)給定兩個樣本,一個標(biāo)記為正樣本,一個標(biāo)記為負(fù)樣本,機器能夠正確識別每個樣本的概率。A的偶然值為0.5。有5項研究使用的有效性指標(biāo)是A。在使用了這一指標(biāo)的研究中,精確率值在0.56~0.94之間。

      5)召回率[13]。召回率是指預(yù)測為正樣本的樣本中,正確的比例,該指標(biāo)表示機器識別標(biāo)簽數(shù)據(jù)的完整程度。有4項研究使用的有效性指標(biāo)是召回率。在使用了這一指標(biāo)的研究中,精確率值在0.46~0.94之間。

      6)皮爾遜系數(shù)r [32]。皮爾遜系數(shù)r指機器評分與人工評分之間的皮爾遜相關(guān)性,但皮爾遜相關(guān)僅適用于區(qū)間或比率數(shù)據(jù),并不適用于所有研究。有3項研究使用的有效性指標(biāo)是皮爾遜系數(shù)r。在使用了這一指標(biāo)的研究中,精確率值在0.7~0.72之間。

      7)支持度[28]。支持度是評估序列挖掘算法的重要指標(biāo),必須設(shè)置最小支持度,才能挖掘高于最小支持度的最大順序模式。有3項研究使用的有效性指標(biāo)是支持度。在使用了這一指標(biāo)的研究中,精確率值在0.43~0.79之間。

      這些指標(biāo)通常用于機器學(xué)習(xí),以相互補充,并測量機器性能的不同方面[18]。

      3 ?結(jié)論與未來展望

      機器學(xué)習(xí)在在線科學(xué)探究中具有巨大的應(yīng)用潛力。文獻(xiàn)綜述結(jié)果表明,當(dāng)前研究界已經(jīng)開展了機器學(xué)習(xí)支持在線科學(xué)探究學(xué)習(xí)的探索,但研究仍處于起步階段,研究團(tuán)隊相對集中。同時,當(dāng)前研究仍較少關(guān)注低年齡段群體,且多局限在物理和地球科學(xué)學(xué)科,未有在更多樣的科學(xué)學(xué)科中進(jìn)行廣泛開展與驗證。在具體的應(yīng)用方面,機器學(xué)習(xí)主要被用來進(jìn)行行為分析、識別和預(yù)測,以及建構(gòu)類文本的自動評分。在適應(yīng)性的過程支持、資源推薦、路徑導(dǎo)航、個性化反饋方面還未有深入探索。在具體的算法應(yīng)用中,機器學(xué)習(xí)算法使用還相對單一,大量研究使用了有監(jiān)督的機器學(xué)習(xí)算法,少量研究使用了無監(jiān)督的機器學(xué)習(xí)算法,且大多取得了較好的效果,但半監(jiān)督的機器學(xué)習(xí)算法卻沒有得到很好的應(yīng)用。

      為更好地指導(dǎo)我國研究者和一線教育工作者進(jìn)行科學(xué)教育,本研究在總結(jié)以往研究的基礎(chǔ)上提出以下展望。

      3.1 ?挖掘機器學(xué)習(xí)應(yīng)用于在線科學(xué)探究的綜合支撐潛力

      以往的研究已經(jīng)發(fā)現(xiàn)了機器學(xué)習(xí)在幫助教師監(jiān)控學(xué)生行為、自動指導(dǎo)和提供反饋上具有巨大的潛力[18]。但目前在機器學(xué)習(xí)應(yīng)用于在線科學(xué)探究的相關(guān)研究中,機器學(xué)習(xí)技術(shù)在探究任務(wù)中只發(fā)揮一種作用,例如識別“跑題”行為或自動評分。很少有研究使用機器學(xué)習(xí)在探究的各個過程中為學(xué)生提供支持。未來的研究可以考慮開發(fā)智能系統(tǒng),將多個機器學(xué)習(xí)算法集成在智能系統(tǒng)中,在多個方面為學(xué)生提供幫助。例如在探究過程中通過識別日志數(shù)據(jù)給遇到困難的學(xué)生提供支持,并在學(xué)生提交建構(gòu)式答案后進(jìn)行自動評分并結(jié)合學(xué)生的日志行為數(shù)據(jù)提供即時的個性化反饋。此外,目前大多數(shù)研究將機器學(xué)習(xí)的應(yīng)用集中于在科學(xué)探究過程中生成的文本的識別和分類,例如對解釋和論證進(jìn)行評分。還需要更多的研究探索學(xué)生的在探究過程中情緒、表現(xiàn)、信心等,以提升機器學(xué)習(xí)的教學(xué)潛力。最后,現(xiàn)有機器學(xué)習(xí)模型在在線科學(xué)探究任務(wù)中的表現(xiàn)仍有待提升。當(dāng)前研究中訓(xùn)練樣本較少可能是影響模型有效性的原因之一,未來研究中可以考慮收集數(shù)量更多、代表學(xué)生群體更廣泛的數(shù)據(jù)對模型進(jìn)行訓(xùn)練以提升模型精度。

      3.2 ?提升機器學(xué)習(xí)在在線科學(xué)探究中的可遷移性

      遷移學(xué)習(xí)是機器學(xué)習(xí)的一個研究方向,主要研究如何將在一個任務(wù)上面學(xué)習(xí)到的知識遷移到另一個任務(wù)上,以提高機器學(xué)習(xí)模型的泛化性能。目前,在線科學(xué)探究中應(yīng)用機器學(xué)習(xí)研究的探究主題較為集中,這主要是因為機器學(xué)習(xí)的可遷移性較差。例如,Lee的團(tuán)隊的5項研究就將機器學(xué)習(xí)應(yīng)用主題限定在了地球科學(xué),而沒有討論其模型在其他領(lǐng)域的應(yīng)用。他們的研究中也指出研究中提出的機器學(xué)習(xí)模型只適用于本研究的探究主題,要探究模型在其他主題上的表現(xiàn)則需要更多的研究。但Gobert團(tuán)隊的研究將在物理主題中開發(fā)的基于機器學(xué)習(xí)方法的探測器應(yīng)用于生態(tài)學(xué)主題,探測器表現(xiàn)出了令人滿意的有效性。這說明盡管探究主題之間可能有不同程度的復(fù)雜關(guān)系,但開發(fā)可遷移的機器學(xué)習(xí)模型是可能實現(xiàn)的。因此,未來的研究中應(yīng)有更多的研究者開發(fā)高性能的通用模型,提升模型的遷移能力,拓展機器學(xué)習(xí)在在線科學(xué)探究中的應(yīng)用領(lǐng)域。

      3.3 ?加大我國在在線科學(xué)探究中應(yīng)用機器學(xué)習(xí)的研究力度

      目前,我國機器學(xué)習(xí)技術(shù)較為成熟,在線科學(xué)探究的研究起步較晚但發(fā)展快速[44],但在在線科學(xué)探究中應(yīng)用機器學(xué)習(xí)的研究相對較少。實現(xiàn)K-12框架[45]和NGSS[46]中指定的評估目標(biāo)的最大挑戰(zhàn)之一是開發(fā)利用復(fù)雜結(jié)構(gòu)的評估任務(wù),如實踐中的認(rèn)知能力,并在教學(xué)中應(yīng)用評估[47]。在教學(xué)實踐中,這種復(fù)雜的評估任務(wù)通常需要花費教師大量時間和精力,如果沒有自動化評分等技術(shù)的參與,這一挑戰(zhàn)不太可能得到完成[48]。因此,我國研究者需要在借鑒國外在線科學(xué)探究領(lǐng)域應(yīng)用機器學(xué)習(xí)的基礎(chǔ)上,使用機器學(xué)習(xí)的自動化促進(jìn)我國科學(xué)教育改革,幫助教師更好實施科學(xué)教學(xué),提升學(xué)生科學(xué)學(xué)習(xí)效果。此外,目前國外相關(guān)研究在小學(xué)階段的較少,但小學(xué)科學(xué)教育在培養(yǎng)國民科學(xué)素養(yǎng)方面有著不可替代的作用,它不僅能夠幫助學(xué)生正確認(rèn)識周圍世界,適應(yīng)學(xué)生和生活的需要,還能夠幫助學(xué)生培養(yǎng)從小獨立思考的習(xí)慣和勇于創(chuàng)造的意識[49]。且根據(jù)皮亞杰的認(rèn)知發(fā)展理論,小學(xué)生處于具體運算階段,其思維活動需要更多的支持。因此在我國未來的相關(guān)研究中,要加大利用機器學(xué)習(xí)自動化為小學(xué)生的在線科學(xué)探究學(xué)習(xí)提供支持的研究力度,助力提升小學(xué)生科學(xué)素養(yǎng)。

      4 ?結(jié) ?論

      機器學(xué)習(xí)近年來在在線科學(xué)探究的教學(xué)活動中發(fā)揮了重要作用,將機器學(xué)習(xí)與在線科學(xué)探究活動進(jìn)行深度融合也是未來科學(xué)教育的發(fā)展趨勢。本文通過對眾多研究工作的回顧和分析,對機器學(xué)習(xí)在在線科學(xué)探究中的應(yīng)用進(jìn)行了分類梳理,總結(jié)了在在線科學(xué)探究中常見的機器學(xué)習(xí)方法及算法有效性評估指標(biāo)。最后本文對我國未來機器學(xué)習(xí)在在線科學(xué)探究中的應(yīng)用做出了未來展望??梢灶A(yù)見,機器學(xué)習(xí)在在線科學(xué)探究中越來越廣泛地應(yīng)用,能夠顯著提升教師的教學(xué)效率和學(xué)生的科學(xué)學(xué)習(xí)水平。

      參考文獻(xiàn):

      [1] AULIA E,AULIA E V. Improving Science Literacy Skills for High School Students Through Guided Inquiry-Based Learning [C]//Proceedings of the Mathematics,Informatics,Science,and Education International Conference (MISEIC 2019).Surabaya:ATLANTIS PRESS,2019:124-128.

      [2] 凌浩.基于科學(xué)探究的科技館科普教育活動研究與實踐 [J].科技風(fēng),2022(11):37-39.

      [3] MARX R W,BLUMENFELD P C,KRAJCIK J S,et al. Inquiry-based science in the middle grades: assessment of learning in urban systemic reform [J].Journal of Research in Science Teaching,2004,41(10),1063-1080.

      [4] 董耀,孫偉軍,朱行建.要讓學(xué)生經(jīng)歷完整的科學(xué)探究過程——對“牛頓第一定律”教學(xué)的思考 [J].物理教學(xué),2021,43(10):47-49+16.

      [5] JUSTIN D,UMESH R. The Effect of Simulation-Supported Inquiry on South African Natural Sciences Learners Understanding of Atomic and Molecular Structures [J]. Education Sciences,2020,10(10) :280-280.

      [6] Al-BALUSHI S M,Al-MUSAWI A S,AMBUSAIDI A K,et al. The Effectiveness of Interacting with Scientific Animations in Chemistry Using Mobile Devices on Grade 12 Students Spatial Ability and Scientific Reasoning Skills [J].Journal of Science Education and Technology,2017,26(1) :70-81.

      [7] JUANA W,RONG R,ZHUO W,et al. Integrating spherical video-based virtual reality into elementary school students scientific inquiry instruction:effects on their problem-solving performance [J].Interactive Learning Environments,2019,29(3) :1-14.

      [8] ANDUJAR J M,MEJIAS A,MARQUEZ M A. Augmented Reality for the Improvement of Remote Laboratories:An Augmented Remote Laboratory [J].IEEE Transactions on Education,2011,54(3) :492-500.

      [9] DONNELLY D F,LINN M C ,LUDVIGSEN S. Impacts and characteristics of computer-based science inquiry learning environments for precollege students [J].Review of Educational Research ,2014,84(4):572-608.

      [10] JOOLINGEN R V W,JONG D T,DIMITRAKOPOULOU A. Issues in computer supported inquiry learning in science [J].Journal of Computer Assisted Learning,2007,23(2):111-119.

      [11] SWAAK J,JONG D T. Discovery simulations and the assessment of intuitive knowledge [J].Journal of Computer Assisted Learning,2001,17(3):284-294.

      [12] VITALE J M,LAI K,LINN M C. Taking advantage of automated assessment of student-constructed graphs in science [J].Journal of Research in Science Teaching,2015,52(10),1426-1450.

      [13] GOBERT J D,PEDRO S M,RAZIUDDIN J,et al. From Log Files to Assessment Metrics:Measuring Students' Science Inquiry Skills Using Educational Data Mining [J].Journal of the Learning Sciences,2013,22(4) :521-563.

      [14] KUECHLER W L,SIMKIN M G. Why is performance on multiple-choice tests and constructed-response tests not more closely related? Theory and an empirical test [J]. Decision Sciences Journal of Innovative Education,2010,8(1),55-73.

      [15] RAMLA G,S?BASTIEN O,CLAUDE F. LewiSpace: an Exploratory Study with a Machine Learning Model in an Educational Game [J].Journal of Education and Training Studies,2015,4(1) :192-201.

      [16] CHRISTOPHER M N,SYTIL K M,MICHAEL G C,et al. Automated analysis of short responses in an interactive synthetic tutoring system for introductory physics [J/OL].Physical Review Physics Education Research,2016,12(1) :010122(2016-03-16).https: //journals.aps.org/prper/abstract/10.1103/PhysRevPhysEducRes.12.010122.

      [17] TANSOMBOON C,GERARD L F,VITALE J M,et al. Designing Automated Guidance to Promote Productive Revision of Science Explanations [J].International Journal of Artificial Intelligence in Education,2017,27(4),729-757.

      [18] ZHAI X M,YIN Y,PELLEGRINO J W,et al. Applying machine learning in science assessment: a systematic review [J].Studies in Science Education,2020,56(1):111-151.

      [19] TING C Y,CHEAH W N,HO C C. 2013. Student Engagement Modeling Using Bayesian Networks [C]//2013 IEEE International Conference on Systems, Man, and Cybernetics.Manchester:2013:2939-2944.

      [20] BAKER R S,OCUMPAUGH J,GOWDA S M,et al. Extending Log-Based Affect Detection to a Multi-User Virtual Environment for Science [C]//User Modeling, Adaptation, and Personalization(UMAP).Springer:2014,290-300.

      [21] PEDRO M S ,GOBERT J D,BETTS C G. Towards Scalable Assessment of Performance-Based Skills: Generalizing a Detector of Systematic Science Inquiry to a Simulation with a Complex Structure [C]//Intelligent Tutoring Systems(ITS).Honolulu:Springer:2014:591-600.

      [22] DONNELLY D F,VITALE1 J M,LINN M C. Automated Guidance for Thermodynamics Essays: Critiquing Versus Revisiting [J].Journal of Science Education and Technology,2015,24(6):861-874.

      [23] GOBERT J D,BAKER R S,WIXON M B. Operationalizing and Detecting Disengagement Within Online Science Microworlds [J].Educational Psychologist,2015,50(1):43-57.

      [24] GOBERT J D,KIM Y J,SAO P M A,et al. Using educational data mining to assess students skills at designing and conducting experiments within a complex systems microworld [J].Thinking Skills and Creativity,2015,18 :81-90.

      [25] GWEON G H,LEE H S,F(xiàn)INZER W. Measuring systematcity of students' experimentation in an open-ended simulation environment from logging data [C]//the Annual Meeting of the American Educational Research Association.2016.

      [26] VITALE M J,MCBRIDE E,LINN M C. Distinguishing complex ideas about climate change: knowledge integration vs. specific guidance [J].International Journal of Science Education,2016,38(9):1548-1569.

      [27] FRATAMICO L,CONATI C,KARDAN S,et al. Applying a Framework for Student Modeling in Exploratory Learning Environments: Comparing Data Representation Granularity to Handle Environment Complexity [J].International Journal of Artificial Intelligence in Education,2017,27(2) :320-352.

      [28] LIN F C,CHEN C M,WANG W F. Learning Process Analysis Based on Sequential Pattern Mining and Lag Sequential Analysis in a Web-Based Inquiry Science Environment [C]//2017 6th IIAI International Congress on Advanced Applied Informatics (IIAI-AAI). Hamamatsu:IEEE,2017:655-660.

      [29] PEREZ S,MASSEY-ALLARD J,BUTLER D,et al. Identifying Productive Inquiry in Virtual Labs Using Sequence Mining [C]//Artificial Intelligence in Education(AIED).Cham:Springer,2017,287-298.

      [30] ROWE E,ASBELL-CLARKE J,BAKER R S,et al. Assessing implicit science learning in digital games [J].Computers in Human Behavior,2017,76 :617-630.

      [31] ZHU M X,LEE H S,WANG T,et al. Investigating the impact of automated feedback on students scientific argumentation [J].International Journal of Science Education,2017,39(12) :1648-1668.

      [32] MAO L Y,LIU O L,ROOHR K,et al. Validation of Automated Scoring for a Formative Assessment that Employs Scientific Argumentation [J].Educational Assessment,2018,23(2):121-138.

      [33] GERARD L,KIDRON A ,LINN M C. Guiding collaborative revision of science explanations [J].International Journal of Computer-Supported Collaborative,2019,14(2) :291-324.

      [34] LEE H L,PALLANT A,PRYPUTNIEWICZ S,et al. Automated text scoring and real‐time adjustable feedback: Supporting revision of scientific arguments involving uncertainty [J].Science Education,2019,103(3):590-622.

      [35] XING W L,POPOV V,ZHU G X,et al. The effects of transformative and non-transformative discourse on individual performance in collaborative-inquiry learning [J].Computers in Human Behavior,2019,98:267-276.

      [36] ZHU G X,XING W,VITALIY POPOV V. Uncovering the sequential patterns in transformative and non-transformative discourse during collaborative inquiry learning [J].The Internet and Higher Education,2019,41 :51-61.

      [37] CHEN C M,WANG W F.Mining Effective Learning Behaviors in a Web-Based Inquiry Science Environment [J].Journal of Science Education and Technology,2020,29:1-17.

      [38] SUNG S H,LI C L,CHEN G H,et al. How Does Augmented Observation Facilitate Multimodal Representational Thinking? Applying Deep Learning to Decode Complex Student Construct [J].Journal of Science Education and Technology,2020,30:1-17.

      [39] ZHU M X,LIU O L,LEE H S. The effect of automated feedback on revision behavior and learning gains in formative assessment of scientific argument writing [J/OL].Computers & Education,2020,143(C) :103668(2019-08-19).https: //www.sciencedirect.com/science/article/abs/pii/S0360131519302210.

      [40] LEE H S,GWEON G H,LORD T,et al. Machine Learning-Enabled Automated Feedback: Supporting Students Revision of Scientific Arguments Based on Data Drawn from Simulation [J].Journal of Science Education and Technology,2021,30:168–192.

      [41] 吳偉,趙陽陽,熊耀華.基于網(wǎng)絡(luò)的科學(xué)探究教學(xué):來自WISE的啟示 [J].外國中小學(xué)教育,2011(2):33-37.

      [42] 張新華,劉美博,容梅.WISE項目移植于我國科學(xué)教學(xué)的實踐探索 [J].中國教育信息化,2018(10):23-28+50.

      [43] YANG Y W,BUCKENDAHL C W,JUSZKIEWICZ P J,et al. A Review of Strategies for Validating Computer-Automated Scoring [J].Applied Measurement in Education,2010,15(4):391-412.

      [44] 吳華君,陳其鐵,何聚厚.國內(nèi)虛擬實驗研究的知識圖景及態(tài)勢展望——基于近二十年文獻(xiàn)計量的視角 [J].數(shù)字教育,2022,8(2):10-19.

      [45] National Research Council. A Framework for K-12 Science Education: Practices, Crosscutting Concepts, and Core Ideas ?[M].Washington,DC:The National Academies Press,2012.

      [46] National Research Council. Next generation science standards: for states, by states [M].Washington,DC:The National Academies Press,2013.

      [47] ERDURAN S. Developing assessments for the next generation science standards [J].Assessment in Education:Principles,Policy & Practice,2018,25(2):224-226.

      [48] BENNETT R E. Educational Assessment: What to Watch in a Rapidly Changing World [J].Educational Measurement:Issues and Practice,2018,37(4):7-15.

      [49] 楊曉鵬,梁芳,余翔.小學(xué)科學(xué)教育“低谷”現(xiàn)象探析——以南昌市部分小學(xué)為例 [J].教育導(dǎo)刊,2010(6):80-82.

      作者簡介:孫社兵(1996—),女,漢族,河南濮陽人,碩士在讀,研究方向:教育數(shù)據(jù)挖掘;通訊作者:張巧榮(1978—),女,漢族,河南鄭州人,副教授、碩士生導(dǎo)師,博士,研究方向:數(shù)字圖像處理、人工智能;李田茖(2001—),女,漢族,河南鄭州人,本科在讀,研究方向:教育數(shù)據(jù)可視化。

      猜你喜歡
      科學(xué)教育機器學(xué)習(xí)
      基于詞典與機器學(xué)習(xí)的中文微博情感分析
      基于機器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      用“科學(xué)教育”澆灌祖國的花朵
      理工科高校加強人文教育的研究與建議
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
      時代金融(2016年27期)2016-11-25 17:51:36
      新時代背景下如何有效開展幼兒科學(xué)教育
      在幼兒園科學(xué)教育活動中克服小學(xué)化傾向
      STEM對我國科學(xué)教育專業(yè)人才培養(yǎng)的啟示
      前綴字母為特征在維吾爾語文本情感分類中的研究
      基于支持向量機的金融數(shù)據(jù)分析研究
      武汉市| 石屏县| 兴安县| 收藏| 永宁县| 洛阳市| 广水市| 神木县| 克拉玛依市| 大厂| 珲春市| 莫力| 玉溪市| 南开区| 白沙| 文山县| 黔东| 仲巴县| 神木县| 九江市| 克东县| 丁青县| 石门县| 汶上县| 安图县| 福清市| 佛坪县| 平江县| 郑州市| 白山市| 阿拉善左旗| 岐山县| 株洲市| 武川县| 恩平市| 南皮县| 正阳县| 平昌县| 鹿泉市| 新民市| 昌平区|