李 碩,劉賀家,劉東來(lái),李 陽(yáng)
(1.吉林財(cái)經(jīng)大學(xué) a.公共管理學(xué)院;b.會(huì)計(jì)學(xué)院,長(zhǎng)春 130117;2.吉林省會(huì)計(jì)學(xué)會(huì),長(zhǎng)春 130021;3.吉林省醫(yī)療保障事業(yè)管理中心,長(zhǎng)春 130033)
在統(tǒng)計(jì)學(xué)中,聯(lián)合分析方法(Conjoint Analysis)經(jīng)常用于量表調(diào)查中,以分析統(tǒng)計(jì)總體的偏好,主要是用于模擬和衡量消費(fèi)者對(duì)產(chǎn)品或服務(wù)質(zhì)量的感知[1]。聯(lián)合分析方法可與多種隨機(jī)模型一起使用處理聯(lián)合數(shù)據(jù),如普通最小二乘回歸模型,logit,probit,多項(xiàng)概率和嵌套logit或probit模型等。從20世紀(jì)90年代開(kāi)始,貝葉斯層次模型(Hierarchical Bayes Model)與聯(lián)合分析一起使用變得非常流行,因?yàn)槟芴岣呗?lián)合分析的可靠性,預(yù)測(cè)的有效性并可提供可靠的估計(jì)[2]。
目前,越來(lái)越多的學(xué)者使用此方法在充分考慮到大學(xué)生偏好異質(zhì)性的情況下進(jìn)行教育質(zhì)量評(píng)估,如Kuzmanovic,Savic,Popovic和Martic等。由于受聯(lián)合分析方法不能同時(shí)對(duì)大量的參數(shù)進(jìn)行變量分析[3]的限制,因此大多數(shù)研究者只測(cè)試一部分教育質(zhì)量評(píng)估因素,而這些屬性并不能構(gòu)成一個(gè)完整的教學(xué)過(guò)程。
筆者將使用與聯(lián)合分析類似的實(shí)驗(yàn)設(shè)計(jì),要求大學(xué)生評(píng)估課程教學(xué)和內(nèi)容的某些教學(xué)因素以及整體的課程質(zhì)量。通過(guò)收集數(shù)據(jù),剔除學(xué)生對(duì)教學(xué)變量的權(quán)重設(shè)計(jì),因?yàn)椴煌瑢W(xué)生對(duì)每個(gè)教學(xué)因素的重要程度都有不同的看法。然后,構(gòu)建一個(gè)貝葉斯β回歸模型(Bayesian Beta Regression Model),其權(quán)重具有均勻Dirichlet分布作為先驗(yàn)分布以得出屬性權(quán)重的后驗(yàn)分布,符合實(shí)驗(yàn)設(shè)計(jì)的設(shè)定并將構(gòu)造出一個(gè)基于學(xué)生偏好的教學(xué)質(zhì)量指標(biāo)體系。此模型包含兩個(gè)層級(jí),第1層級(jí)是在涵蓋先驗(yàn)信息的基礎(chǔ)上用廣義線性模型對(duì)第2層級(jí)中的參數(shù)提供可能的概率分布。貝葉斯層次模型借用其他受訪者的信息,使用迭代程序以穩(wěn)定每個(gè)個(gè)體的最大似然參數(shù)估計(jì),而且可以提供穩(wěn)定和準(zhǔn)確的模型,即使所觀察到的結(jié)果小于所估計(jì)的參數(shù),該模型也可以通過(guò)將模型與干擾分離恢復(fù)異質(zhì)性[4]。
假設(shè)已經(jīng)調(diào)查了nj個(gè)學(xué)生的隨機(jī)樣本,其中j=1,2表示調(diào)查的兩個(gè)不同時(shí)間段。令n=n1+n2表示總樣本大小,并且yij表示由第i個(gè)人在時(shí)間j(i=1,…,nj)給出的響應(yīng)變量(總教學(xué)/課程評(píng)估分?jǐn)?shù))的觀察值。令Xij=(xij,1,…,xij,k)T表示k個(gè)已知屬性的矢量的觀測(cè)值。令zij表示未觀測(cè)到的隨機(jī)變量(潛在變量),其與學(xué)生i在時(shí)間j對(duì)某些未涉及的因素的測(cè)量有關(guān)。為不失一般性,假設(shè)數(shù)據(jù)已經(jīng)被縮放,因此所有上述變量都是在區(qū)間[0,1]中取值的分?jǐn)?shù)。
假設(shè)響應(yīng)變量遵循beta分布,其均值被建模為觀察到的和未觀察到的屬性與更定變量的加權(quán)線性組合。模型的系數(shù)可以被解釋為權(quán)重(所有權(quán)重加和為1),因此其測(cè)量學(xué)生i在時(shí)間j給予不同屬性和潛在變量的相對(duì)重要性。
對(duì)于因變量的觀察數(shù)據(jù)最初是以百分比呈現(xiàn)的,用于表示總體評(píng)估得分。目前對(duì)百分比數(shù)據(jù)建模的方法中最常用的是對(duì)百分比數(shù)據(jù)進(jìn)行轉(zhuǎn)化(transform)后對(duì)其進(jìn)行最小二乘回歸。對(duì)上述數(shù)據(jù)轉(zhuǎn)化方法,通常使用反正弦平方根和logit函數(shù)。這些方法雖然在相關(guān)的數(shù)據(jù)分析中廣泛應(yīng)用,但通常研究者忽視了方法中的前提條件而使其模型假設(shè)沒(méi)有得到滿足[5]。另一種方法是使用基于二項(xiàng)分布的回歸模型[6]。在很多情況下,基于此模型下的百分比結(jié)果被過(guò)度分散,造成其顯示出比二項(xiàng)分布預(yù)期更大的可變性。更重要的是百分比的結(jié)果是非二項(xiàng)式的,例如人口未的社區(qū)占總社區(qū)的比例。為克服上述問(wèn)題和限制,經(jīng)常采用β回歸模型(Beta Regression Model)。這是因?yàn)棣路植季哂懈叨褥`活的形狀,適合表示以百分比尺度測(cè)量的任意結(jié)果變量。此外,即使是基礎(chǔ)簡(jiǎn)單的β回歸模型也可以通過(guò)包含精度參數(shù)調(diào)整百分比結(jié)果的條件方差從而方便地解釋其過(guò)度離散現(xiàn)象。在類似的問(wèn)題中,Carmichael將包括β回歸在內(nèi)的幾個(gè)模型通過(guò)教育績(jī)效數(shù)據(jù)進(jìn)行了比較,得出基于β分布的線性模型通常是最合適模擬上述類型數(shù)據(jù)的結(jié)論[7]。
基于上述觀點(diǎn),筆者對(duì)兩個(gè)不同的時(shí)間段(j=1,2),構(gòu)建模型如下
對(duì)上述模型進(jìn)行模擬并且將其與更簡(jiǎn)單的(聯(lián)合)模型的預(yù)測(cè)能力進(jìn)行比較。該簡(jiǎn)單模型如下
下面筆者將開(kāi)發(fā)相關(guān)的機(jī)器學(xué)習(xí)算法完成上述所構(gòu)建模型的模擬與抽樣檢驗(yàn)。上述模型對(duì)于響應(yīng)變量的假設(shè)是其應(yīng)大于0且小于1。
該調(diào)查對(duì)象選擇具有至少兩年以上學(xué)習(xí)經(jīng)驗(yàn)的本科學(xué)生,主修公共管理,并選修過(guò)20門(mén)以上的課程,學(xué)習(xí)過(guò)不同學(xué)科的教材,并且由不同的教師授課。有充分表達(dá)和分辨教學(xué)感受的能力,考慮到調(diào)查質(zhì)量,其中題目應(yīng)答率若低于10%,則刪除該題目。學(xué)生無(wú)應(yīng)答率低于10%,題目無(wú)應(yīng)答率低于10%這兩種情況下可忽略不計(jì)。
在調(diào)研中要求學(xué)生評(píng)價(jià)其迄今為止學(xué)習(xí)所有課程中的一些因素,并要求根據(jù)其上課的經(jīng)驗(yàn)和感受填寫(xiě)能做到正面積極質(zhì)量特征的課程/教師的百分比,測(cè)量尺度是定序的,對(duì)于順序共有11個(gè)級(jí)別對(duì)應(yīng),10%寬度百分比間隔,從0~100。
課程/教師教學(xué)模塊的質(zhì)量通過(guò)一組14個(gè)因素測(cè)量,而這14個(gè)因素被嵌入到一個(gè)具有3級(jí)的層次模型中。在第1層,識(shí)別了兩組質(zhì)量因素,1組與課程相關(guān),另一組與教師相關(guān)。在這兩組內(nèi)部,是第2層模型,一般因素包含進(jìn)第2層模型作為主要研究問(wèn)題,例如,第1組包含課程內(nèi)容,教科書(shū)和評(píng)分程序等因素,第2組包含教師的教學(xué),知識(shí)和行為等元素。在第3層,將之前設(shè)定的14個(gè)個(gè)體質(zhì)量屬性轉(zhuǎn)化為14個(gè)單項(xiàng)問(wèn)題。最后要求學(xué)生在可比較的測(cè)量量表中對(duì)一般課程/教學(xué)模塊進(jìn)行總體質(zhì)量評(píng)估。
調(diào)查問(wèn)卷的結(jié)構(gòu),內(nèi)容選擇和描述主要基于歐洲高等教育質(zhì)量保證協(xié)會(huì)(2009)和希臘質(zhì)量Assura(2007),Feldman類別[8]和SEEQ(Students Evaluation of Education Quality)因素[9]的原型和指南。表1中給出了15個(gè)單獨(dú)的質(zhì)量問(wèn)題,其順序與問(wèn)卷中相應(yīng)問(wèn)題的順序相同。
表1 變量描述表Tab.1 Variable description table
調(diào)查問(wèn)卷的初級(jí)版本由學(xué)生樣本的6名志愿者進(jìn)行回答和評(píng)估,根據(jù)學(xué)生的意見(jiàn)和結(jié)果,修改其中問(wèn)題的措辭和排序并形成最終問(wèn)卷。
貝葉斯方法在給定先驗(yàn)分布的條件下,僅需計(jì)算后驗(yàn)分布的概率密度函數(shù)即可。貝葉斯推斷方法的應(yīng)用受到限制的原因在于這些未知參數(shù)的后驗(yàn)分布大多數(shù)都是高維的、復(fù)雜的、非一般常見(jiàn)的分布,計(jì)算過(guò)程較難以實(shí)現(xiàn)[10]。而通過(guò)模擬的方式對(duì)高維積分進(jìn)行計(jì)算的MCMC(Markov Chain Monte Carlo)方法出現(xiàn),使原本異常復(fù)雜的高維積分計(jì)算問(wèn)題變得很容易解決,從而為貝葉斯方法的應(yīng)用開(kāi)辟了新的思路[11]。基于上述對(duì)貝葉斯層次模型的構(gòu)建,筆者首先對(duì)模型1進(jìn)行擬合。在擬合過(guò)程中,對(duì)MCMC算法進(jìn)行3 000次迭代(iteration),其中將前1 000次作為開(kāi)始階段的樣本(burn-in period sample)。算法流程如下。
Algorithmic Flow of MCMC Based on Bayesian Hierarchical Model
1:
2:iter←3 000?Number of Sampling Iteration
3:burnin←1 000?Sufficiently large burn-in period
4:
5:declarea?Shell of length iter foradraws
6:declareb?Shell of length iter forbdraws
7:declaremu?Shell of length iter formudraws
8:a←b←mu←3?Set arbitrary initial value
9:
10:fori=2:iter do
11:a[i]~p(a|a=a[i-1],b=b[i-1],μ=mu[i-1])
12:b[i]~p(b|a=a[i],b=b[i-1],μ=mu[i-1])
13:mu[i]~p(μ|a=a[i],b=b[i],μ=mu[i-1])
圖1 模型變量權(quán)重的后驗(yàn)分布箱型圖Fig.1 Box plot of posterior distribution of model variable weights
14:
15:returna[burnin:iter],b[burnin:iter],mu[burnin:iter]
通過(guò)模擬結(jié)果可以發(fā)現(xiàn),其中一些變量權(quán)重的后驗(yàn)分布(posterior)發(fā)生了較為顯著變化,變量2、5、10和12在模型運(yùn)行過(guò)程中表現(xiàn)不同(見(jiàn)圖1)。圖1給出了箱形圖,總結(jié)了不同時(shí)間中模型變量權(quán)重的差異的后驗(yàn)分布。
表2給出了兩個(gè)不同時(shí)間段模型變量權(quán)重的后驗(yàn)均值,以及權(quán)重差異(第1個(gè)時(shí)期~第2個(gè)時(shí)期)。表2同時(shí)給出了權(quán)重差異為0的尾部區(qū)域概率,即后驗(yàn)概率
π0=min{f(ω1,l-ω2,l>0|y),f(ω1,l-ω2,l<0|y)}
(9)
當(dāng)數(shù)值0處于后驗(yàn)分布的中心位置,則上述π0值接近0.5,這表明兩個(gè)不同時(shí)間段之間的權(quán)重沒(méi)有明顯的差異。當(dāng)π0值低于某個(gè)數(shù)值(例如0.2)時(shí),則在兩個(gè)不同時(shí)間段之間模型變量的權(quán)重存在差異。對(duì)變量2、5和14的權(quán)重,π0值都低于0.2,特別是對(duì)權(quán)重14,π0值約為0.03。
表2 兩個(gè)模型權(quán)重后驗(yàn)概率均值的差異Tab.2 Differences in the mean values of the posterior probabilities of the weights of the two models
注:最后一列為差異為0的概率。
用相同的迭代次數(shù)以及初始樣本,對(duì)模型2進(jìn)行了MCMC算法模擬。通過(guò)結(jié)果對(duì)比分析發(fā)現(xiàn),兩個(gè)模型的統(tǒng)計(jì)量的后驗(yàn)概率均值均為0.65。這表明處理這個(gè)問(wèn)題不需要使用相對(duì)更復(fù)雜的模型(考慮不同的時(shí)間段),而使用簡(jiǎn)單的模型(聯(lián)合模型)即可。
表3給出了在使用聯(lián)合模型后對(duì)模型變量權(quán)重的后驗(yàn)概率的分析結(jié)果。變量4、6、10、11、14的權(quán)重均具有高于5%的后驗(yàn)概率均值。
表3 聯(lián)合模型中的權(quán)重的后驗(yàn)概率分析結(jié)果Tab.3 Summary of the posterior probability of the weights in the joint model
從表3可以看出,學(xué)生對(duì)變量6給出了更高的權(quán)重(后驗(yàn)均值為0.139 6),其次是變量14(后驗(yàn)均值為0.128 7)。此外,隱變量(latent variable),即除這15個(gè)變量外還有其他方面的權(quán)重具有約為3%的后驗(yàn)均值,這說(shuō)明在進(jìn)行評(píng)估過(guò)程中,學(xué)生給隱變量的權(quán)重約為3%。
屬性4是指課程內(nèi)容和專業(yè)要求相匹配。屬性6是指考核內(nèi)容與方法和課程內(nèi)容與教學(xué)的匹配性。屬性10是指教師講課的感染力和吸引力。屬性11是教師的專業(yè)知識(shí)豐富程度。屬性14是指對(duì)當(dāng)前專業(yè)及發(fā)展趨勢(shì)的了解與擴(kuò)展。因此,可見(jiàn)學(xué)生們始終高度重視與學(xué)術(shù)質(zhì)量相關(guān)的核心問(wèn)題:教師的專業(yè)背景,教學(xué)質(zhì)量,課程與專業(yè)的關(guān)聯(lián)程度。
由于每個(gè)評(píng)估都應(yīng)該是連續(xù)一致的過(guò)程,筆者提出了一個(gè)貝葉斯層次模型,其相對(duì)于聯(lián)合分析方法具有如下優(yōu)勢(shì):1) 數(shù)據(jù)輸入簡(jiǎn)單,即問(wèn)卷收集后就可帶入到模型中,不用對(duì)數(shù)據(jù)進(jìn)行處理。由于貝葉斯模型不同于傳統(tǒng)的統(tǒng)計(jì)模型,所以貝葉斯模型對(duì)輸出結(jié)果的解釋非常直觀,簡(jiǎn)單自然。2) 貝葉斯模型對(duì)所要研究的問(wèn)題可以包含人們已有的認(rèn)知與看法,即先驗(yàn)信息。3) 貝葉斯模型適應(yīng)性很強(qiáng),可以實(shí)時(shí)采用新的數(shù)據(jù)對(duì)模型參數(shù)進(jìn)行更換,而其他傳統(tǒng)的統(tǒng)計(jì)模型則需要在加入新數(shù)據(jù)后對(duì)模型參數(shù)進(jìn)行重新全盤(pán)模擬。
上面所描述的特征表明貝葉斯模型具有很好的靈活性、包容性和適應(yīng)性,其突破了統(tǒng)計(jì)中聯(lián)合分析的局限,可以被擴(kuò)展并應(yīng)用于其他相關(guān)的研究中,除了能持續(xù)性地評(píng)估和檢測(cè)服務(wù)質(zhì)量外,貝葉斯模型還可以監(jiān)測(cè)學(xué)生偏好與各種社會(huì)經(jīng)濟(jì)時(shí)間序列的關(guān)聯(lián)性,將研究向更深更廣的領(lǐng)域推進(jìn)。