王光明 余文娟 王兆云
摘要:對于元認知能力的評價和測試一直以來都是研究的難點,特別是就數(shù)學學科而言,已有研究多圍繞數(shù)學問題解決過程中元認知監(jiān)控水平的評價以及能力的培養(yǎng)展開。鮮有全面評價學生數(shù)學學習元認知水平的問卷。同時,沒有針對高中生編制的元認知水平調(diào)查問卷。故本研究在已有研究的基礎上,對已有的問卷進行修正和完善,通過征求專家意見與樣本測試和數(shù)據(jù)分析,形成《高中生數(shù)學元認知水平調(diào)查問卷》。該問卷具有較好的內(nèi)容效度和結構效度。信度方面,問卷整體的內(nèi)部信度為0.952,分半信度為0.931,重測信度為0.946,說明問卷具有很好的內(nèi)部一致性和測量穩(wěn)定性。
關鍵詞:數(shù)學元認知,數(shù)學元認知知識,數(shù)學元認知體驗,數(shù)學元認知監(jiān)控。
1.引言
近些年來的研究表明,元認知在學習技能的獲得和應用中具有重要的作用和意義(Alexander,F(xiàn)abricius,F(xiàn)leming,Zwahr,&Brown,2003)。數(shù)掌學科本身,特別是利用數(shù)學知識解決問題的過程,對于學生思維以及各方面能力培養(yǎng)都有著重要作用,故元認知在數(shù)學教育領域內(nèi)受到越來越多的關注。從歷史的角度看。元認知作為一個科學概念是由美國著名發(fā)展心理學家Flavell在1976年基于元記憶的概念正式提出的(Panaoura&PhiHDpou,2005)。一般地,元認知指以個體的認知過程為對象,并對認知過程進行監(jiān)控、調(diào)節(jié),其實質就是個體對自身的認知活動的自我意識、評價和調(diào)節(jié)。是個體思維品質的內(nèi)源(唐劍嵐,周瑩,湯服成,2006)。盡管元認知的定義不盡一致。但它的組成部分相對固定。事實上,在現(xiàn)代心理學文獻中,元認知包括兩個領域的研究:關于認知的知識和關于認知的監(jiān)控(Panaoura,Philippou,&Christou,2003)。國內(nèi)學者在研究元認知的過程中普遍認為元認知主要包括:元認知知識、元認知體驗和元認知監(jiān)控。就數(shù)學學科而言,已有研究多圍繞數(shù)學問題解決過程中元認知監(jiān)控水平的評價以及能力的培養(yǎng)展開。鮮有全面評價學生數(shù)學學習元認知水平的問卷。因而。本文在已有研究基礎之上,借鑒不同層面的問卷和量表。設計和編制一份關于數(shù)學學習元認知水平調(diào)查問卷,為深入研究數(shù)學學習與元認知的關系提供理論與實踐參考。
2.相關研究述評
2.1數(shù)學元認知成分的理論框架
Brown(1987)認為元認知是個體關于自身認知系統(tǒng)的知識以及控制。Flavell(1979)從最初認為元認知包含元認知知識以及元認知監(jiān)控兩大方面,逐步對元認知的概念加以擴充。他建立了一個元認知以及認知監(jiān)控的模型來描述四種現(xiàn)象的相互作用,分別是元認知知識、元認知體驗、目標或任務以及行為或策略。后期眾多研究者在Flavell和Brown關于元認知理論框架的研究成果基礎上又做了大量的工作,在國內(nèi),影響較為廣泛的分類方式是董奇(1989)將元認知的成分分為三個要素,一是元認知知識;二是元認知體驗;三是元認知監(jiān)控。
元認知知識方面,F(xiàn)lavelI采用一種“個體一任務一策略”的分類方式(Panaoura,Philippou,&Christou,2003)。Brown(1987)認為元認知知識可以依據(jù)個體的自我意識分為程序性知識、陳述性詢專家意見;(3)借鑒已有的可信問卷。
為構建合理的問卷維度結構。在2014年5月-2014年7月期間,分別對國內(nèi)外的多位知名專家學者進行訪談。其中包括加拿大多倫多大學教育學院Douglas McDougall教授。香港大學梁貫成教授,美國特拉華大學蔡金法教授。澳大利亞墨爾本大學David Clarke主任,美國范德堡大學Paul Cobb教授等專家。在訪談過程中,就問卷維度的確定以及題目的編寫等具體問題征求了專家的意見。
在綜合已有文獻以及專家意見后,最終確定數(shù)學學習元認知問卷的理論維度。其中包含3主維度。10子維度。問卷維度如圖1。
各個(子)維度的相關操作概念界定如下:
3.2問卷條目庫的建立
《高中生數(shù)學元認知水平調(diào)查問卷》的條目庫建立內(nèi)容來源主要有:(1)章建躍《中學生數(shù)學學科自我監(jiān)控能力問卷》(2003年);(2)喻平《數(shù)學解題自我監(jiān)控能力問卷》(2002年);(3)唐劍嵐,周瑩,湯服成《數(shù)學問題解決中的元認知問卷》(2006年);(4)Panaoura和Philippou編制的《數(shù)學元認知問卷》(2003年)。
進而結合StiUman和Galbrmth(1998)設計的結構化訪談問題以及Yang(2012)關于元認知策略設計的若干問題,從學生數(shù)學學習的視角建立了90道題目的問卷。其中元認知知識維度17題,元認知體驗維度13題,元認知監(jiān)控維度54題,可信度維度6題。
問卷題目的具體來源分布如圖2,除26道自編題目外。對以上問卷題目進行了引用及改編。問卷的題目編排采取混合螺旋式,隨機編排順序。問卷計分方式采用五級評分法。從“非常符合”到“非常不符合”依次計分5-1。
3.3被試選取與問卷回收
問卷編制過程中共進行了三次測試。選取了三個樣本。為保證樣本的普遍性和典型性。樣本選取采用整群抽樣的方法。
選取的樣本一為預研究樣本。包括天津市三個市區(qū)及一個郊區(qū)(和平區(qū)、河西區(qū)、河北區(qū)、寶坻區(qū))的8所典型學校的學生進行問卷的試測。分別選取的是新華中學、第二南開中學、第五十五中學、大鐘莊高中、寶坻四中、第五十七中學、第七十八中學、微山路中學的高二年級學生,每個學校文理科班級各一個,總樣本容量約為350人。
本次測試采取匿名自愿測試原則,共回收問卷332份,根據(jù)以下方法剔除無效問卷。第一步:目測。問卷答案呈現(xiàn)規(guī)律性、周期性、統(tǒng)一性的將作為無效問卷剔除,對于問卷題目有大量未作答題目或多選題目的也作為無效問卷剔除。經(jīng)第一步篩選后剩余問卷311份;第二步:根據(jù)可信度問題對剩余的問卷繼續(xù)進行篩選。凡是對測謊題回答差異性過大的均作為無效問卷剔除。最終剩余有效問卷282份。問卷有效率為84.94%,樣本學生均為高二年級,男、女生人數(shù)之比為1:1.4。
選取的樣本二為問卷正式確定的研究樣本。包括天津市的三所中學、湖北地區(qū)的兩所中學以及新疆地區(qū)的一所中學??倶颖救萘考s為650人。本次測試共同收問卷619份,按照上述方法剔除無效問卷后,最終剩余有效問卷567份。問卷有效率為91.60%。樣本學生均為高二年級,男、女生人數(shù)之比為1.2:1。
選取的樣本三為重測樣本。選取的是樣本二中的一所中學。本次測試共回收問卷121份。按同樣的方法刪除無效問卷后,最終剩余有效問卷114份,樣本有效率為94.21%,樣本學生均為高二年級。男、女生人數(shù)之比為1:1.2。
3.4數(shù)據(jù)分析工具
本研究中選取SPSS 18.0和AMOS 17.0作為數(shù)據(jù)分析軟件對問卷數(shù)據(jù)進行處理和分析。
4.問卷的預研究結果分析
4.1項目分析
按兩個步驟對問卷題目進行項目分析:首先采用臨界比率(CR)法對樣本一的數(shù)學元認知得分進行高低分組顯著性差異的檢驗。將數(shù)學元認知得分按升序排序,前27%為低分組,后27%為高分組。對兩組進行獨立樣本t檢驗,刪除不具有高低分組顯著性差異的題目。共刪除5道題目(12,28,46,63,88)。進而用題總相關法對各個題目的得分與學生數(shù)學元認知總得分之間進行相關分析,由于當相關系數(shù)小于0.3時。可認為二者之間存在低度相關,因而在0.05的顯著性水平下刪除與總分相關系數(shù)低于0.3的題目。共計刪除12道題目(2,9,22,26,36,38,43,53,54,64,73,83)
經(jīng)過項目分析,對問卷題目進行了第一步篩選。最終剩余72題。
4.2探索性因素分析
首先對問卷理論結構中的三個主維度進行檢驗,結果顯示三個主維度的KMO值均在0.9左右,Bartlett球形檢驗X2值顯著(p<0.01),說明樣本數(shù)據(jù)非常適合進行探索因素分析(表2)。在SPSS軟件中使用主成分分析以及最大方差旋轉法確定問卷因子數(shù)及題目。保留在問卷中的題目主要遵循如下原則:(1)因子特征值大于1;(2)因子負荷至少在0.4以上;(3)同一個因子在不同主成分的負荷均在0.4以上時,予以剔除;(4)提取出的主成分符合陡階檢驗;(5)每個因子至少包含3道題目。
經(jīng)探索因素分析得到三個主維度的因子結構及其負荷、公因子方差(表3-5),其中元認知知識維度經(jīng)軟件處理析出3個主成分,元認知體驗維度得到2個主成分,元認知監(jiān)控維度經(jīng)軟件得到7個主成分。通過分析碎石圖的分布特征,提取前5個因子。精簡題目12道,剩余60題,
從元認知知識因子結構矩陣看。各題項的載荷均在0.6以上,說明這些題目與其所屬因子的關系密切;從公因子方差來看。各題項對問卷的解釋在Q4以上。有些高達0.9以上。說明提取的因子能夠很好的反應原始變量的主要信息。三個因子的累計貢獻率為74.470%。表明這是一個一階三因素的結構,因子一為關于個體的知識,共5題;因子二是關于數(shù)學任務的知識。共4題;因子三為關于認知策略的知識,共6題。
從元認知體驗因子結構矩陣看,各題項的載荷均在0.7以上。說明這些題目與其所屬因子的關系十分密切;從公因子方差來看,各題項對問卷的解釋在0.5到0.9之間,說明提取的因子能夠很好的反應原始變量的主要信息。兩個因子的累計貢獻率為71.422%,表明這是一個一階兩因素的結構。因子一為個體對認知過程的認知體驗,共6題;因子二是個體對認知過程的情感體驗,共5題。
從元認知監(jiān)控因子結構矩陣看。各題項的載荷均在0.4以上。說明這些題目與其所屬因子的關系比較密切;從公因子方差來看,各題項對問卷的解釋在0.5與0.6上下,說明提取的因子基本能夠反應原始變量的主要信息。五個因子的累計貢獻率為47.879%,表明這是一個一階五因素的結構,分別代表個體對自身認知過程的監(jiān)控調(diào)節(jié)的不同階段。因子一表示個體對認知過程的反饋與檢驗。共11題:因子二表示個體對認知過程的監(jiān)控與調(diào)節(jié),共5題;因子三表示個體對認知過程的反思與評價。共7題:因子四表示個體對認知過程的定向與計劃,共3題;因子五表示個體對認知過程的組織與管理,共3題。
進一步對軟件建議刪除的題目進行分析。認為一部分題目的數(shù)據(jù)不理想的原因在于:
(1)題量偏大,學生注意力不夠集中;
(2)表述方式不夠清晰,學生可能產(chǎn)生理解偏差。
為了更好的編制問卷。對問卷中的一部分題目進行了表述方式的改進和完善,進而將題目重新混合編排,最終確定再測問卷共60題。
5.問卷的正式確定及結果分析
5.1項目分析與探索性因素分析
對選取的樣本二進行再測問卷的調(diào)查。將再測數(shù)據(jù)收集整理好后,按照預研究的處理分析過程。對數(shù)據(jù)按步驟進行高低分組顯著性差異的檢驗以及題總相關性的分析后,刪除題目28,剩余59題。進而對數(shù)據(jù)進行探索因素分析,結果表明問卷因子確定合理,與理論框架基本吻合,只涉及部分題目的因子歸屬調(diào)整問題。
5.2內(nèi)容效度分析
問卷的效度主要包括內(nèi)容效度與結構效度兩方面。在內(nèi)容效度方面??煞譃閮蓚€階段進行評價,首先,在高中生數(shù)學元認知水平調(diào)查問卷的編制階段,經(jīng)過構建理論框架,對多位專家進行訪談,確定問卷維度,在已有問卷的基礎上進行一定的修正和改進,并征詢專家意見,修改部分題目的內(nèi)容及表述方式。并根據(jù)預研究數(shù)據(jù)進行了進一步修改
進而,在問卷內(nèi)容效度的評價階段,采用目前使用較為廣泛的內(nèi)容效度指數(shù)CVI(content validityindex)作為評價指標(史靜垮,莫顯昆,孫振球,2012)。評價本問卷內(nèi)容效度的專家共有4位,分別是自學軍、曹一鳴、連四清和鮑建生,幾位專家就問卷條目與所屬維度的關聯(lián)性做出評價,在4級評分的可選項“1=不相關,2=弱相關,3=較強相關,4=非常相關”中做出選擇。選擇1或2表示認為題項對所屬維度的代表性不強,相應地,選擇3或4表示題項的代表性較好。通過分析。專家評分中所有評分都為3或4的題項共有41道。沒有所有評分都為1或2的題目,可知專家評價一致性水平為0.82,具有較好的一致性。問卷條目水平的內(nèi)容效度指數(shù)如表6。
結果表明,本問卷中的41個題目的內(nèi)容效度優(yōu)秀,占總題目數(shù)的82%。表明問卷中的題項內(nèi)容效度較好。對各個題目的I-CVI值計算均值可得到問卷的內(nèi)容效度指數(shù)S-CVI/Ave為0.955,表明問卷整體上具有很好的內(nèi)容效度。
5.3結構效度分析
對于問卷的結構效度,采用兩種分析方法。分別是結構方程驗證因素分析和相關法。這兩種討論方法可以很好的評價問卷結構理論模型的合理性以及問卷子維度的異質性。
5.3.1驗證因素分析
對回收數(shù)據(jù)進行驗證因素分析旨在檢驗問卷的測量結果與構想的理論模型是否具有良好的擬合效果。本問卷采用的是結構方程模型中的測量模型,主要用來檢驗問卷的各個題目是否可以很好的構成問卷中的10個子維度(吳明隆,2010)。
分析結果中首先考慮各個題目在所屬維度上的負荷。結果表明,負荷在0.4-0.6區(qū)間的有40題。在0.6-0.75區(qū)間的有14題,沒有負荷低于0.34需要刪除的題目,說明題目所屬維度是合理的。進而觀察結果報表Modification Indices中的MI值,發(fā)現(xiàn)有4對題目之間的修正指數(shù)在30以上,表明題目之間存在一定的因果關系,通過對題目內(nèi)容的觀察。認為確實存在表述上的重復性,如25題“在認真聽講的情況下,我相信自己能理解老師在課堂上講的最難的數(shù)學題”和48題“我相信自己可以處理比課上老師所講題目或作業(yè)題更復雜的數(shù)學運算”就存在一定的表述同質性,可以刪除其中的一道題目或進行合并。根據(jù)MI值刪除48。51,52和60題,最終剩余題目50道。
指標擬合效果評價。一方面觀察模型的基本適配度檢驗效果,首先根據(jù)Variances報表,得知各誤差變異量均為正值,標準誤數(shù)值在0.19-0.44之間,說明沒有很大的標準誤。進而根據(jù)StandardizedRegression Weights報表得知因素載荷量在0.39-0.75之間,沒有低于0.34的載荷量(表7)。
從這些結果知,模型擬合的基本適配度良好另一方面,從絕對適配度指數(shù)、增值適配度指數(shù)以及簡約適配度指數(shù)三方面的評價指標對整體模型適配度效果進行評價。
首先采用AMOS 17.0軟件進行一階10因子斜交模型驗證因素分析,對本問卷的模型擬合效果的評價指標選取了更為穩(wěn)定的NC值(即自由度比值)。根據(jù)分析結果輸出顯示,對模型進行了微小的調(diào)整,最終各項指標結果如表8。
從表中結果可以看出。指標GFT、AGFI、NFI、IFI、TLj、CFI的值在0.825-0.925之間,基本符合模型適配標準。PCFI、PNFI的值均在0.7以上,RMR、RMSEA的值小于0.05。NC值為1.623。在1-3之間,表示模型有簡約適配程度。綜合考慮各項指標的最終結果,一階10因子的模型擬合程度較好。可以接受。
通過Correlations結果報表知。一階因子概念之間存在高度相關性,結合理論框架模型可知,有必要進行二階驗證因素分析。各項指標結果如表9。
從表中數(shù)據(jù)可知,一階10因子二階3因子的模型擬合效果更佳,其中50道題目在一階因子上的標準化負荷在0.38-0.76之間。一階因子在二階因子上的標準化載荷值在0.56-0.88之間??梢哉J為,一階10因子二階3因子的模型擬合程度較好,可以接受(問卷的評價結構及標準化載荷值與系數(shù)見圖3)。
5.3.2相關性檢驗分析
對于結構效度采用各維度與總問卷的相關性是否高于各維度之間的相關性來檢驗分析(表10)。
各維度間的相關系數(shù)在0.69-0.77之間。而總的數(shù)學學習元認知問卷與各維度的相關系數(shù)在0.87-0.97之間。表明該問卷具有較好的結構效度。
5.4信度分析
對問卷進行信度分析,即考查問卷的內(nèi)在一致性及其重測信度,根據(jù)預測、再測、重測的數(shù)據(jù)分析(表11),結果表明,高中生數(shù)學元認知水平調(diào)查問卷的各主維度Cronbach系數(shù)在0.70-0.92之間,Spearman-Brown的分半信度在0.70-0.91之間,表明各主維度內(nèi)部題目的同質性程度很高??倖柧淼腃ronbach系數(shù)為0.951,Spearman-Brown分半信度為0.931。表明編制的數(shù)學元認知水平問卷具有很高的信度。
對于問卷的重測信度采用Pearson積差相關的方法。分析兩次測試分數(shù)的相關性。結果表明。問卷各主維度的重測信度在0.87-0.95之間,總鬮卷的重測信度為0.946??芍?,問卷具有很好的外部一致性。
6.討論與結論
在數(shù)學元認知水平問卷編制的已有研究中,具有如下特點:首先,問卷針對數(shù)學問題解決過程,而非數(shù)學學習過程,譬如唐劍嵐(2006)、喻平(2002,2004)等研究成果就是針對數(shù)學解題過程進行問卷編制;其次,問卷多是關注元認知的某一維度,譬如章建躍(2003)就是針對數(shù)學學習自我監(jiān)控能力,即數(shù)學元認知監(jiān)控維度進行了問卷編制,湯服成(2000)則是針對數(shù)學元認知知識進行了問卷設計;最后,問卷大多沒有區(qū)分適用群體的學段,多以中學生為研究對象。本研究則與以往研究不同,針對高中學生的數(shù)學學習過程設計題目。能夠更加全面的評價學生的數(shù)學元認知水平,題目表述具有高中數(shù)學的特點,適用于高二及以上年級學生。
本問卷的編制過程共經(jīng)過三次測試及數(shù)據(jù)分析過程,結合網(wǎng)上填寫問卷及紙筆填寫問卷兩種方式,通過目測以及測謊題兩方面的篩選,保證了問卷的有效性和數(shù)據(jù)的可信性。分析過程中,預研究使用第一版90題問卷,經(jīng)過項目分析以及探索性分析,確定再測問卷60題。再測使用第二版60題問卷,經(jīng)過項目分析、探索性分析以及驗證因素分析,確定了最終的正式問卷。
《高中生數(shù)學元認知水平調(diào)查問卷》共包含55題,分為三個維度和一個可信度問卷。其中數(shù)學元認知知識維度14道題。分為關于個體的知識、關于任務的知識、關于策略的知識3個子維度;數(shù)學元認知體驗維度9道題。分為數(shù)學認知體驗、數(shù)學情感體驗2個子維度:數(shù)學元認知監(jiān)控維度27道題。分為定向與計劃、組織與管理、監(jiān)控與調(diào)節(jié)、反饋與檢驗、反恩與評價5個子維度;可信度問卷5道題(具體題目分布見表12)。
雖然本研究成果經(jīng)歷多次取樣測試,并且各個測量指標比較理想,但仍有許多問題需要進一步探討。首先,10個子維度的測試題數(shù)從4題到8題不等。分布不夠均勻;其次,數(shù)學元認知體驗維度的內(nèi)部信度尚未達到0.8以上。還可以進一步改進;最后,由于各方面的限制,問卷的編制沒有確定全國常模。這將是未來進一步完善問卷結構,逐步形成量表的研究方向。
7.結論
通過分析,《高中生數(shù)學元認知水平調(diào)查問卷》具有很好的內(nèi)容效度和結構效度,可作為高中生數(shù)學學習元認知水平調(diào)查與評測的可信有效的工具。