顧乃景 伏 干
21世紀是強調(diào)科技創(chuàng)新的時代,國家間綜合國力的競爭日益體現(xiàn)在科學技術實力的競爭上,而科學技術的進步離不開具有較高科學素養(yǎng)和科學探究能力的人才。科學探究能力是科學教育的核心理念已成為共識,它是學生科學素養(yǎng)發(fā)展的內(nèi)在思維品質(zhì),既是科學思維及批判質(zhì)疑態(tài)度發(fā)展的內(nèi)化結果,又是將二者有機結合靈活運用以解決問題的重要保證[1]。大學生,特別是本科生群體,作為未來科學教育乃至整個國家、社會發(fā)展的中流砥柱,其科學探究能力水平將直接影響《中國教育現(xiàn)代化2035》提出的“推動我國成為學習大國、人力資源強國和人才強國”目標的實現(xiàn),并決定未來科學教育事業(yè)以及國家、社會的進步發(fā)展水平。國內(nèi)外對“學生科學探究能力”這一主題的研究,多集中于“對科學探究能力的研究”及“對科學探究能力培養(yǎng)的研究”兩方面,有關“科學探究能力評價”的研究相對較少,且評價研究多集中在中小學階段,大學階段的研究相對較少。本研究將基于PTA量表,結合相關評價方式,對大學生的科學探究能力進行實證研究,從而為促進大學本科生科學探究能力的提升和發(fā)展做出探索。
1.評價體系確定的依據(jù)
科學探究能力必須外顯為具體的、可測量的行為,才能進行有效地評價。為此,在對大學生的科學探究能力評價過程中,選擇恰當?shù)脑u價依據(jù)十分重要。美國安迪生和沃爾佛德設計出的“基本要素分析法”(Primary Trait Analysis,PTA)將需要評價的表現(xiàn),層層細分為外在可測量的基本要素,逐一評價,取得了良好的效果[2],在國內(nèi)外理工文醫(yī)多門學科的教育領域得到了廣泛應用,如Varela Manuel F等采用PTA量表評價免疫學碩士“分析科學文獻”的能力[3],盛剛采用PTA量表評估高中生歷史學科“史料實證”能力[4],藍嵐采用PTA量表進行“凸透鏡成像規(guī)律”相關物理教學等[5]。其基本假設是:無論是行為表現(xiàn),還是認知表現(xiàn),都是由一系列基本要素組成的,這些要素是學生學習知識、獲得技能的基本單元;通過對這些基本單元的行為表現(xiàn)進行評定,就可以從整體上對學生的表現(xiàn)進行適當評價。基本步驟見表1[6]。
表1 PTA量表建立的基本步驟
評價目標、評價標準以及評價方式、方法是科學探究能力評價中的核心問題,具體而言,相關評價目標、評價標準回答了科學探究能力該“評價什么”的問題,而評價方式、方法回答了“怎么評價”的問題。由表1可見,PTA量表的建立準確解決了“評價什么”和“怎么評價”的問題。使用PTA量表,宏觀上可以看出學生科學探究能力發(fā)展的整體情況,微觀上又可以了解學生各個能力要素發(fā)展的具體情況,從而為評價者及學生提供全面有效的反饋信息,以便采取相關針對性措施,提升學生的探究能力水平。目前,由于其科學的理論基礎和實踐研究,PTA量表被廣泛用于開放性試題開發(fā)等方面。
2.評價體系的確定
系統(tǒng)的、現(xiàn)代的科學教育多源于國外,其科學探究能力評價的成功經(jīng)驗值得借鑒學習。相關的評價主要有國際學生評價項目(Program for International Student Assessment,PISA)、國際數(shù)學和科學評測趨勢項目(Trends in International Mathematics and Science Study,TIMSS),英國的“教育與科學部成就評估”(Assessment of Performance Unit,APU),美國的“探究的原則性評價設計方案”(Principled Assessment Designs for Inquiry,PADI)、國家教育進展評估(National Assessment of Educational Progress,NAEP)等等[7]。上述評價都提及了科學探究領域的實踐內(nèi)容。例如,英國的APU將科學探究能力要素分為6個方面,包括符號表征的使用、器材及測量工具的使用、觀察能力、解釋及應用、探究設計、整體探究表現(xiàn),并將其劃分為若干個小的方面;PISA 2015提出了3種能力要素,包括科學地解釋現(xiàn)象、評價和設計科學探究、科學地解釋數(shù)據(jù)和證據(jù),在具體能力要素下也有若干小的方面;TIMSS 2015提出了5個有關科學實踐的方法,包括對問題和猜想進行建模、設計調(diào)查或研究方案、重組和表示數(shù)據(jù)、分析和解釋數(shù)據(jù)、得出結論和進行解釋。在我國,化學、生物、物理等課程標準中均將科學探究作為學科核心素養(yǎng)重點提出?!镀胀ǜ咧形锢碚n程標準(2017年版)》中將科學探究要素分為四項,主要包含問題、證據(jù)、解釋、交流這四大要素[8]?!镀胀ǜ咧形锢碚n程標準(實驗)》中對科學探究的要素歸納更為具體,包含7項:提出問題、猜想與假設、制訂計劃與設計實驗、進行實驗與收集證據(jù)、分析與論證、評估、交流與合作[9]。由具體的評價內(nèi)容來看,上述評價及課程標準共同涉及了以下的步驟[10]:(1)提出問題,即從對自然世界的現(xiàn)象觀察中產(chǎn)生問題,形成可驗證的科學假設;(2)收集證據(jù),即設計可施行、可控制的實驗來收集證據(jù),以支持或者推翻原有假設,在此過程中需要將對科學概念的理解與可觀察、可測量的實驗聯(lián)系起來,形成測量的具體步驟(在很多體系中,證據(jù)的收集并不局限于控制性的實驗方法,還可以包括問卷、訪談等諸多方法,而本研究由于測評需要,針對大學生的收集證據(jù)方法只重點考察實驗法);(3)處理數(shù)據(jù),即根據(jù)變量類型,描述或驗證數(shù)據(jù)的模式,從而探索數(shù)據(jù)之間的關系;(4)回答問題,即使用觀察結果和調(diào)查證據(jù)來回答問題,支持或推翻假設;(5)反思討論,即與他人合作,使用科學知識及相關調(diào)查結果來支持結論的邏輯性,并將所得結論應用到新情境中。
本研究結合上述5個步驟,并為突顯“為評價提供明確的參考標準,將科學探究能力由抽象變得具體”的要求,依據(jù)PTA量表建立的基本步驟,明確測量的目標、標準及方式[11]。
(1)確定評價目標。科學探究能力要素是隱變量,不能直接對其進行評價,所以要將這些因素外顯為學生的行為特征,也就是將其表現(xiàn)為顯變量,才能完成評價[12]。為了更好地對學生進行評價,將上述5個步驟細化為多個具體可測量的要素,如“提出問題”“猜想與假設”等。
(2)建立評價標準。本次實驗采用德爾菲法(專家調(diào)查法),即通過匿名反復函詢的方式進行,各位專家可以自由發(fā)表意見,這種方法能夠集思廣益,取各家之長,避各家之短,使最終獲得的結果可靠性較高[13]。本研究將相關評價內(nèi)容以電子郵件的方式發(fā)送給物理教學、科學教育等領域的共計7名專家并參照相關學者研究[14],進行征詢調(diào)查,總計兩輪:第一輪主要征詢擬定的能力要素指數(shù)是否合理,第二輪針對量表指數(shù)確定后的意見反饋,確定了本次科學探究能力評價中各要素的權重指數(shù),最終將學生科學探究能力的總分定義為:M=∑miαi,其中,mi表示相應能力要素的得分,αi表示第i項能力要素的指數(shù)(注:為了便于計算,本評價標注指數(shù)總和以2.8為基數(shù)),見表2。
表2 科學探究能力各要素PTA量表
續(xù)表2
續(xù)表2
本研究的目的是對大學本科生科學探究能力進行評價,由于人力、物力以及相關條件的限制,選擇了某985院校及某普通院校學生,涉及不同專業(yè)、不同戶籍等,所有學生均參與工作單及紙筆測試。在去除殘卷、白卷、無名卷及不對應卷(即僅僅參加工作單或紙筆測試中的一個)后,整體有效答卷115份,滿足了研究的需要。被試詳細信息如表3所示。
表3 被試詳細信息
1.工作單設計
工作單1:提供相關情境,引出問題。提供具體情境,讓學生自己發(fā)現(xiàn)并提出相關探究問題,并將問題寫在工作單上。工作單1主要考察學生提出問題的能力。
工作單2:猜想并提出假設;設計實驗方案。工作單2呈現(xiàn)工作單1中需要探究的問題,給學生一定的時間,讓他們針對問題進行猜想,提出相關的假設,并使用相關器材設計可以探究的方案。工作單2主要考察學生猜想與假設的能力以及實驗方案設計能力。
工作單3:學生根據(jù)自己的假設與方案設計,進行相關實驗操作;分析實驗結果,得出結論,并說明原因;分析誤差,列出至少三個影響結果的原因;反思自己的實驗設計,寫出相關實驗改進的建議。工作單3主要考察學生實驗操作和觀察、控制變量能力、運用數(shù)學工具能力、評價與反思能力、下結論能力。
基于“實驗可操作性”的原因,工作單主要借鑒曹永青“單擺的周期影響因素”設計,整個測試時長為50分鐘,其中工作單1時長5分鐘,工作單2時長15分鐘,工作單3時長30分鐘,結合科學探究能力各要素PTA量表,工作單總分為14分(不含加分)。
2.紙筆測試卷設計
紙筆測試分為兩部分:第一部分是被試學生的基本信息,包括學生的性別、所屬學校、高中分科、本科專業(yè)及戶籍等信息;第二部分是測試題的具體內(nèi)容。在本次研究中,對紙筆測試進行了可靠性檢驗,分半信度為0.72,表明內(nèi)在一致性較好,紙筆測試題的可靠性較高。整個測試時長為90分鐘,結合科學探究能力各要素PTA量表,紙筆測試總分為14分(不含加分)。
1.整體分析
通過對工作單、紙筆測試總得分數(shù)據(jù)進行正態(tài)檢驗,得知兩種評價方式下總分均呈正態(tài)分布。相關描述統(tǒng)計見表4。
表4 大學生科學探究能力水平總分描述統(tǒng)計
表5則呈現(xiàn)了兩種評價方式平均分比較。
表5 兩種評價方式平均分比較
總體而言,學生在工作單的得分區(qū)域分布要優(yōu)于紙筆測試,其原因如下:
(1)從測試內(nèi)容和難度方面來看,紙筆測試涉及的問題情境(知識點范圍)比較多,試題之間的聯(lián)系較少,整體上難度較大。而工作單圍繞“單擺”這一個情境進行,并且采用有一定提示的工作單評價方式,難度與紙筆測試相比較小。
(2)從學生本身來看,學生先前較少接觸工作單這種形式,對它比較感興趣,重視程度較高;而對紙筆測試這種能力測評形式的重視程度較低。此外,紙筆測試集中在晚自習期間進行,學生在忙碌了一天之后,可能比較勞累,并非所有學生都很積極地參與測試。
對兩種方式總分進行相關性分析,在置信度為0.01時,兩種方式總分顯著相關(0.433)。
2.各要素分析
本次分析需對工作單、紙筆測試分數(shù)據(jù)進行正態(tài)檢驗。正態(tài)檢驗中的非參數(shù)檢驗方法包括Kolmogorov-Smirnov檢驗(D檢驗)和Shapiro-Wilk(W檢驗)。SAS中規(guī)定:當樣本含量n≤2000時,結果以Shapiro-Wilk(W 檢驗)為準,當樣本含量n>2000時,結果以Kolmogorov-Smirnov(D檢驗)為準。本次樣本量為115,故以W檢驗為準。對工作單和紙筆測試兩種評價方式下的各能力要素得分進行正態(tài)檢驗,各要素sig.值均小于0.05,兩種方式下各能力要素均不呈現(xiàn)正態(tài)分布。
在數(shù)據(jù)不服從正態(tài)分布時,U檢驗比T檢驗統(tǒng)計效能更高,從控制一類錯誤的角度講,如果U檢驗一類錯誤能控制到0.05以下,采用U檢驗更優(yōu)。因此使用Mann-Whitney U檢驗來檢驗兩種方式下各能力要素是否存在差異,見表6。
表6 一級指標(各要素)得分率
由表6可知:在提出問題、推理和預測以及下結論三個能力要素方面,兩種方式得分差異不顯著,而其他五個能力要素差異顯著。具體如下:
(1)工作單方式下,大學生的科學探究能力各要素得分較為理想,各要素的均分均高于2.5分(單要素賦值為5分)。其中,評價與反思能力得分最高,為4.39分。取得分中值作為中等水平參考值,通過比較發(fā)現(xiàn),實驗操作、控制變量以及推理和預測、評價與反思三個能力得分稍低于參考值,其他5個要素得分均高于參考值,可見學生在工作單方式下,科學探究能力水平整體處于中等水平。
(2)紙筆測試方式下,大學生的科學探究能力各要素得分不平衡。其中實驗操作、控制變量,運用數(shù)學工具,推理和預測以及評價與反思能力四項得分均低于2.5分。此外,取得分中值作為中等水平參考值,通過比較發(fā)現(xiàn),除了推理和預測、運用數(shù)學工具兩個能力要素,得分與參考值差距較大,其他6個要素得分均略高于或略低于參考值,可見學生在紙筆測試方式下,反映出來的探究能力整體水平不高,處于中等水平。
為了研究探究各能力要素之間以及與總分是否存在某種依存關系,采用相關性分析分別對工作單和紙筆測試兩種評價方式進行內(nèi)部相關性的檢驗。在相關性分析中,數(shù)值代表Person相關性系數(shù),它用來衡量定距變量之間的性關系,越接近于1相關性越強,反之越弱。具體見表7和表8。
表7 大學生科學探究能力各要素(工作單)相關性
表8 大學生科學探究能力各要素(紙筆測試)相關性
由表7可知,在工作單方式下,各能力要素與總分之間高度相關;評價與反思與其他7個能力要素之間缺乏相關性,可能是因為學生平時在這方面的訓練較少,不太重視對評價過程及結果的總結。除此之外的各能力要素之間顯著相關。
由表8可知,在紙筆測試方式下,各能力要素也與總分之間高度相關。從各能力要素之間看:運用數(shù)學工具、猜想與假設兩個能力之間沒有相關,這可能是因為運用數(shù)學工具這一能力,在紙筆測試下,更強調(diào)學生數(shù)據(jù)的選擇和統(tǒng)計方法的使用,著重考查學生的數(shù)理使用能力,而且沒有具體的實驗情境,導致了兩個能力之間的不相關。下結論和提出問題、猜想與假設兩個能力之間沒有相關,這可能是因為下結論主要是依據(jù)實驗材料,如根據(jù)實驗數(shù)據(jù)的分析結果提出相關結論,即更強調(diào)從實證證據(jù)來得出相關結論,而與提出問題、猜想與假設等關系不大。類似于工作單,評價與反思與其他7個能力要素之間也沒有相關性。除此之外的各能力要素之間顯著相關。
由此可見,各能力要素之間以及與總分之間顯著相關,說明在工作單和紙筆測試兩種方式下,這些要素都是科學探究能力的主要素。通過這些要素的分析,可以了解大學生的科學探究能力水平發(fā)展情況。
1.整體分析
在工作單及紙筆測試兩種方式下,大學生的總分都呈正態(tài)分布,采用獨立樣本T檢驗進行處理,探索校際在評價總分是否存在差異,見表9。
表9 大學生科學探究能力平均數(shù)及差異檢驗(校際*能力)
如表9所示,在工作單和紙筆測試兩種評價方式下,校際對大學生探究能力總分造成顯著差異。由總分可見,在兩種評價方式下,重點院校學生科學探究能力水平要優(yōu)于普通院校學生。
2.各要素分析
工作單和紙筆測試兩種評價方式下的各能力要素得分均不呈現(xiàn)正態(tài)分布。使用Mann-Whitney U檢驗來檢驗校際下各能力要素是否存在差異,見表10。
表10 大學生各科學探究能力要素得分情況(校際*能力)
從表10中的數(shù)據(jù)來看:在工作單形式下,兩校大學生在八個要素均差異顯著。在紙筆測試下,兩校大學生在猜想與假設,實驗方案設計,實驗操作、控制變量,推理和預測能力四個要素差異顯著,而其他能力要素,就本次調(diào)查的數(shù)據(jù)來看,沒有達到顯著性。
縱向觀察表10可以發(fā)現(xiàn):(1)工作單方式下,在實驗操作、控制變量能力這個要素上,重點院校學生得分低于普通院校學生得分,而其他7個要素均高于普通院校學生。紙筆測試重點院校學生在8個能力要素上均高于普通院校的學生。(2)在工作單方式下,最低分上面,重點院校實驗操作、控制變量能力2.88分,普通院校推理和預測能力1.90分;最高分上面,重點院校下結論能力4.67分,普通院校評價與反思能力4.25分;從整體上看,普通院校學生除了在推理和預測能力上得分1.90,低于2.5分,兩校學生在其他能力要素上均高于2.5分??梢妰尚W生在工作單方式下各個要素得分均較高,處于中等偏上水平。(3)在紙筆測試方式下,兩校學生的最低分也都出現(xiàn)在評價與反思能力上面,重點院校1.23分,普通院校1.14分。最高分上面,重點院校實驗方案設計能力3.97分,普通院校提出問題能力3.32分;從整體上看,提出問題能力、猜想與假設能力、實驗方案設計能力以及下結論能力四個方面兩校得分均超過2.5分。在其他四個能力要素中,除了重點院校學生在推理和預測能力上的得分超過3分,其他均低于2.5分??梢妰尚W生在紙筆測試方式下各個要素發(fā)展均不平衡。
橫向觀察表10可以發(fā)現(xiàn):整體上,除普通院校學生在提出問題能力、推理和預測能力、下結論能力三個方面,工作單低于紙筆測試得分,兩校學生在其他要素上,工作單方式下的得分高于紙筆測試得分。在一些要素上差距還比較大,如評價與反思能力這一要素,工作單兩校學生均高于4分,而在紙筆測試下均低于1.5分。這也說明,對于學生的探究能力評價不能僅從一種方式來評價,要綜合選擇多種方式,合理評價。
1.整體分析
在工作單及紙筆測試兩種方式下,大學生的總分都呈正態(tài)分布,采用獨立樣本T檢驗進行處理,探索性別在評價總分是否存在差異,見表11。
表11 大學生科學探究能力平均數(shù)及差異檢驗(性別*能力)
如表11所示,在工作單評價方式下,性別對大學生探究能力總分未造成顯著差異。在紙筆測試方式下,女生科學探究能力的實際情況優(yōu)于男生。
許多有關學生能力方面的研究表明,性別因素對學生的科學探究能力存在影響。但從本次工作單和紙筆測試兩種評價方式的結果來看:工作單方式下,男女之間的科學探究能力水平差異不顯著;而紙筆測試方式下,兩者差異顯著。原因可能如下:男女學生先前都未接觸過工作單這種評價方式,因此男女學生表現(xiàn)出來的科學探究能力水平相差不大。而紙筆測試,由于長期以來我國的考試模式以紙筆考試為主,相較于男生來說,女生有耐性、喜歡思考,答題細致、考慮較為全面,更加適應紙筆測試這種模式,因此得分較高。
在本研究中,為了進一步了解不同學校、不同性別學生的探究能力水平。筆者以性別為自變量,校際為控制變量,科學探究能力水平為因變量對大學生這一群體的情況進行分析。見表12及圖1。
圖1 兩種方式在“性別、校際”下的直方圖
表12 大學生科學探究能力(性別*校際*能力)
一般認為,在理科(科學)學習方面,尤其涉及科學探究能力水平方面,男生優(yōu)于女生。但從本次所得數(shù)據(jù)來看,情況并非如此。
(1)性別:在兩種評價方式下,女生的得分均比同校男生高。具體而言,重點院校男生得分低于女生,普通院校男生得分同樣低于女生。
(2)學校:在工作單方面,重點院校學生得分總體高于普通院校學生。其中重點院校女生得分最高,為11.52分,隨后依次為重點院校男生的11.15分、普通院校女生的9.19分,以及普通院校男生的8.92分。在紙筆測試方面,也呈現(xiàn)類似于工作單的情況。分析原因:由于我國大學招生以高考分數(shù)為主要錄取標準,學生通過層層選拔進入高校,并且當前我國高考模式較適合于女生,這就造成了重點院校學生能力整體強于普通院校學生,女生整體強于男生現(xiàn)象的出現(xiàn)。
2.各要素分析
工作單和紙筆測試兩種評價方式下的各能力要素得分均不呈現(xiàn)正態(tài)分布。使用Mann-Whitney U檢驗來檢驗性別下各能力要素是否存在差異,見表13。
從表13中的數(shù)據(jù)看:在工作單方式下,依本次調(diào)查所得數(shù)據(jù)來看,男女大學生在各能力要素上的差異均沒有達到顯著性。在紙筆測試方式下,猜想與假設、推理和預測、運用數(shù)學工具、下結論四個能力方面,顯著性分別為0.006、0.041、0.027和0.001,男女學生差異顯著;而其余能力要素男女之間的差異沒有達到顯著性。
縱向觀察表13可以發(fā)現(xiàn):(1)工作單方式下,在提出問題能力,猜想與假設能力,實驗操作、控制變量能力這三個要素上,男學生得分高于女學生得分,其他5個要素均低于女學生,其中,男、女在推理和預測能力上差距最大,女生比男生高0.34分。紙筆測試下,在提出問題能力,評價與反思能力這兩個要素上,男學生得分高于女學生得分,其他6個要素均低于女學生,六個要素男生與女生分數(shù)相差均在0.3分以上。(2)在工作單方式下,最低分上面,男女均出現(xiàn)在推理和預測能力這個要素上,分別為2.43分和2.77分;最高分上面,男女均出現(xiàn)在評價與反思能力這個要素上,分別為4.33分和4.44分;從整體上看,男女學生在8個能力要素上均高于2.5分??梢妰尚W生在工作單方式下各個要素得分均較高,處于中等偏上水平。(3)在紙筆測試方式下,男女學生的最低分出現(xiàn)在評價與反思能力上面,男生1.26分,女生1.10分。最高分上面,男生提出問題能力3.45分,女生實驗方案設計能力3.44分;從整體上看,類似于工作單的情況,提出問題能力、猜想與假設能力、實驗方案設計能力以及下結論能力四個方面兩校得分均超過2.5分。在其他四個能力要素中,也類似于工作單的情況,除了女學生在推理和預測能力上的得分超過2.5分,其他均低于2.5分??梢妰尚W生在紙筆測試方式下各個要素發(fā)展不平衡。
橫向觀察表13可以發(fā)現(xiàn):整體上,提出問題能力方面,男女學生工作單得分低于紙筆測試得分;而在其他7個要素上,工作單方式下的得分均高于紙筆測試下得分。
表13 大學生各科學探究能力要素得分情況(性別*能力)
1.整體分析
在工作單及紙筆測試兩種方式下,大學生的總分都呈正態(tài)分布,采用獨立樣本T檢驗進行處理,探索高中文理分科在評價總分是否存在差異,見表14。
表14 大學生科學探究能力平均數(shù)及差異檢驗(高中分科*能力)
如表14所示,在工作單和紙筆測試兩種評價方式下,高中分科對大學生探究能力總分造成顯著差異。在兩種評價方式下,理科學生科學探究能力水平要優(yōu)于文科學生。
2.各要素分析
工作單和紙筆測試兩種評價方式下的各能力要素得分均不呈現(xiàn)正態(tài)分布。使用Mann-Whitney U檢驗來檢驗高中分科下各能力要素是否存在差異,見表15。
從表15看:在工作單方式下,依本次調(diào)查所得數(shù)據(jù)來看,猜想與假設,推理和預測,運用數(shù)學工具,下結論四個能力方面,顯著性分別為0.000、0.035、0.000和0.001,文、理學生差異顯著;而其余能力要素文、理學生之間沒有達到顯著性。在紙筆測試方式下,猜想與假設、實驗方案設計、實驗操作、控制變量,推理和預測四個能力方面,顯著性分別為0.000、0.002、0.001和0.003,文、理學生差異顯著;而其余能力要素文、理學生之間沒有達到顯著性。
縱向觀察表15可以發(fā)現(xiàn):(1)工作單方式下,實驗操作、控制變量能力這個要素上,文科學生得分稍高于理科學生,而其他7個要素均低于理科學生。紙筆測試方式下,下結論能力這個要素上,文科學生得分稍高于理科學生,其他7個要素均低于理科學生。(2)在工作單方式下,最低分上面,文科運用數(shù)學工具能力2.21分,理科推理和預測能力2.93分;最高分上面,文、理學生均是評價與反思能力,文科4.33分,理科4.43分;從整體上看,除了文科學生在推理和預測能力2.17分,運用數(shù)學工具能力2.21分,兩項低于2.5分,學生在其他能力要素上均高于2.5分??梢娢?、理學生在工作單方式下各個要素得分均較高,處于中等偏上水平。(3)在紙筆測試方式下,文理兩科學生的最低分都出現(xiàn)在評價與反思能力上面,文科1.13分,理科1.22分。最高分上面,文、理均在提出問題能力上,文科3.27分,理科3.49分;從整體上看,提出問題能力、猜想與假設能力、實驗方案設計能力以及下結論能力四個方面兩校學生得分均超過2.5分。在其他4個能力要素中,除了理科學生在推理和預測能力上的得分超過2.5分,其他均低于2.5分。可見文理學生在紙筆測試方式下各個要素發(fā)展不平衡。
橫向觀察表15可以發(fā)現(xiàn):整體上,除文科學生在提出問題能力方面,以及理科生在推理與預測方面,文科生在下結論能力方面,工作單低于紙筆測試得分,文、理學生在其他要素上,工作單方式下的得分均高于紙筆測試得分;在一些要素上差距還比較大,如評價與反思能力這一要素上,工作單文、理學生均高于4分,而在紙筆測試下均低于1.5分。這同樣說明對于學生的探究能力評價,不能僅從一種方式來評價,要綜合選擇多種方式,合理評價。
1.整體分析
在工作單及紙筆測試兩種方式下,大學生的總分都呈正態(tài)分布,采用獨立樣本T檢驗進行處理,探索大學不同專業(yè)在評價總分方面是否存在差異,見表16。
表16 大學生科學探究能力平均數(shù)及差異檢驗(專業(yè)*能力)
如表16所示,在工作單和紙筆測試兩種評價方式下,大學專業(yè)對大學生探究能力總分造成顯著差異。在兩種評價方式下,工科專業(yè)學生科學探究能力水平要優(yōu)于文科專業(yè)學生。
2.各要素分析
工作單和紙筆測試兩種評價方式下的各能力要素得分均不呈現(xiàn)正態(tài)分布。使用Mann-Whitney U檢驗來檢驗大學不同專業(yè)下各能力要素是否存在差異,見表17。
表17 大學生各科學探究能力要素得分情況(專業(yè)*能力)
從表17中的數(shù)據(jù)看:在工作單方式下,依本次調(diào)查所得數(shù)據(jù)來看,提出問題,猜想與假設,實驗方案設計,推理和預測,運用數(shù)學工具,下結論6個能力方面,文、工學生差異顯著;而其余能力要素文、工學生之間沒有達到顯著性。在紙筆測試方式下,猜想與假設,實驗方案設計,實驗操作、控制變量,推理和預測4個能力方面,文、工學生差異顯著;而其余能力要素文、工學生之間的差異沒有達到顯著性。
縱向觀察表17可以發(fā)現(xiàn):(1)工作單方式下,類似于文、理科學生,實驗操作、控制變量能力這個要素上,文科學生得分稍高于工科學生得分,其他7個要素均低于工科學生。紙筆測試方式下,文科學生8個要素得分均低于理科學生。(2)在工作單方式下,最低分上面,文科推理和預測能力2.20分,工科實驗操作、控制變量能力2.90分;最高分上面,文、工科學生均是評價與反思能力,文科4.31分,理科4.61分;從整體上看,除了文科學生在推理和預測能力2.20分,運用數(shù)學工具能力2.42分,兩項低于2.5分,學生在其他能力要素上均高于2.5分,這一點與文、理科學生情況極其相似。可見文、工兩科學生在工作單方式下各個要素得分均較高,處于中等偏上水平。(3)在紙筆測試方式下,文工兩科學生的最低分都出現(xiàn)在評價與反思能力上面,文科1.17分,工科1.19分。最高分上面,文科在提出問題能力上,3.33分;工科在實驗方案設計,3.95分;從整體上看,提出問題能力、猜想與假設能力、實驗方案設計能力以及下結論能力四個方面文、工兩科學生得分均超過2.5分。在其他4個能力要素中,除了工科學生在推理和預測能力上的得分超過2.5分,其他均低于2.5分。可見文、工兩科學生在紙筆測試方式下各個要素發(fā)展不平衡。
橫向觀察表17可以發(fā)現(xiàn):整體上,文科學生在提出問題能力方面,工作單得分低于紙筆測試得分。文、工學生在其他要素上,工作單方式下的得分均高于紙筆測試得分。在一些要素上差距還比較大,如評價與反思能力這一要素上,工作單文、工兩科學生均高于4分,而在紙筆測試下均低于1.5分。再次說明對于學生的探究能力評價,不能僅從一種方式來評價,要綜合選擇多種方式,合理評價。
1.整體分析
在工作單及紙筆測試兩種方式下,大學生的總分都呈正態(tài)分布,采用獨立樣本T檢驗進行處理,探索不同戶籍在評價總分方面是否存在差異,見表18。
表18 大學生科學探究能力平均數(shù)及差異檢驗(戶籍*能力)
如表18所示,在工作單和紙筆測試兩種評價方式下,戶籍對大學生探究能力總分未造成顯著差異。
2.各要素分析
工作單和紙筆測試兩種評價方式下的各能力要素得分均不呈現(xiàn)正態(tài)分布。使用Mann-Whitney U檢驗來檢驗戶籍下各能力要素是否存在差異,見表19。
從表19的數(shù)據(jù)看:在工作單和紙筆測試兩種方式下,依本次調(diào)查所得數(shù)據(jù)來看,城鄉(xiāng)大學生在各能力要素上均沒有達到顯著性。
表19 大學生各科學探究能力要素得分情況(城鄉(xiāng)*能力)
續(xù)表19
由以上結果可知:紙筆測試方式下,女生科學探究能力的實際情況優(yōu)于男生;而工作單方式下,大學生科學探究能力總分在性別、戶籍兩項上都不存在差異。為此,特就工作單方式下,以性別(F=0.001,p=0.980)、戶籍(F=0.001,p=0.980)兩項因素之一為自變量,另一項為協(xié)變量進行斜率同質(zhì)假設檢驗,結果均為p>0.05,滿足了斜率同質(zhì)假設,可進行下一步協(xié)方差分析。表20是工作單總分以兩項因素為自變量的協(xié)方差分析:
表20 大學生科學探究能力協(xié)方差分析(工作單)
由表20可知,工作單總分在性別(df=1,F(xiàn)=0.60,p=0.807)、戶籍(df=1,F(xiàn)=0.66,p=0.798)上均為p>0.05,差異不顯著。這代表性別和戶籍這兩項因素對工作單下學生的科學探究能力總分沒有造成太大的影響。
1.無論是工作單還是紙筆測試結果顯示,就均值來看,目前大學生具備了基本的探究能力。這與學生基礎教育階段的扎實訓練緊密相關,同時也為高等教育階段學生科學探究能力的進一步提升奠定了基礎,充分反映出基礎教育與高等教育之間的連續(xù)性。
2.總體上工作單得分高于紙筆測試,兩者結合可以較好地評價大學生的科學探究能力,成本較低,并兼顧了評價的公平性、客觀性。
3.不同學生之間能力發(fā)展水平不同,兩種方式下:校際、高中分科、本科專業(yè)三個因素上差異均顯著,戶籍因素上差異均不顯著。性別因素在工作單方式下差異不顯著,紙筆測試方式下差異顯著。
1.對于高校
針對不同專業(yè)學生的探究能力水平存在較大差異現(xiàn)象,高校在學科建設方面,要打破學科壁壘,建立學科群。如加強院系之間的合作培養(yǎng),尤其是理工科與人文社科院系之間的交流合作,及時調(diào)整相關課程設置,增加實踐課程的比重,輔之靈活的專業(yè)主輔修制度,從而實現(xiàn)跨學科的交叉融合研究。在師資配比方面,建設跨學科師資隊伍,提高人才培養(yǎng)質(zhì)量。進一步加強創(chuàng)新人才特別是拔尖創(chuàng)新人才的培養(yǎng),加大應用型、復合型、技術技能型人才培養(yǎng)比重,以便提升一流人才培養(yǎng)與創(chuàng)新能力。
2.對于教師、評價者
在教學中,教師要因材施教,可以在已開設的實驗課程中增加自主實驗的比重;根據(jù)男女學生不同認知特點,采用男女合作方式,讓學生在探究活動中,相互學習,共同進步;此外,要加強與學生之間的交流互動。評價者在評價時,要從兩方面進行考慮:一是選擇科學合理的評價標準;二是采用多種評價方式綜合評價。只有在正確的評價體系基礎上,才能使評價的結果合理有效。
3.對于學生
首先要清晰定位自己的科學探究能力水平;其次要掌握提升自身能力的方法,如增加閱讀量,積極參與學校院系組織的實踐活動,與同學、教師多進行溝通等等。
1.被試者的取樣
本研究因主客觀條件限制,被試數(shù)量雖能滿足研究的基本需要,但取樣范圍仍然較窄。在今后研究中,應擴大被試取樣規(guī)模,增加不同地區(qū)、不同學校及不同年級類型的學生,從而增強相關代表性。
2.評價指標體系
本研究建立在工作單及紙筆測試兩種方式結合基礎之上,兩種評價方式起到了很好的互補作用,但有些評價目標(如評價反思中“與他人交流合作的重要性”)未能很好展現(xiàn)出來。在今后研究中,需要開發(fā)出多種適合不同探究任務的工作單、紙筆測試問卷,并結合觀察法、計算機模擬等形式,形成更加完善的“綜合評價學生的科學探究能力”評價體系。