黃 玲,白曉波
(西安工程大學(xué)管理學(xué)院,陜西 西安 710048)
高校教師的科研無論是其個人還是單位,都是一個無法回避的問題,絕大多數(shù)高校,都建立了對本單位教師科研考核辦法,通常都有具體的量化指標(biāo),以促進(jìn)教師和單位科研績效的提升。而如何提高教師和單位科研績效,受多種因素綜合影響。為此,很多學(xué)者對此進(jìn)行了研究。馬秀萍[1]針對當(dāng)前高校科研考核中的問題,提出了相應(yīng)的激勵方法,如薪資、精神情感等。于濱等[2]從超標(biāo)準(zhǔn)薪酬的角度分析了這種激勵方式對高??蒲械淖呦蛴绊?。其他,如文獻(xiàn)[3-5]主要研究了高校教師的科研績效評價機(jī)制,文獻(xiàn)[6-8]分析了高??蒲锌冃У挠绊懸蛩亍N墨I(xiàn)[9]基于聚類算法對高校教師科研績效進(jìn)行評價,羅宇等[10]、龍粲妍[11]、錢玲[12]有別于文獻(xiàn)[3-5],主要在不同背景下,研究了科研績效評價的指標(biāo)體系,如基于協(xié)同平臺、應(yīng)用型本科高校和“雙一流”等為研究背景,或立足于高校特色,研究成果具有高校背景特色。使用關(guān)鍵詞“高校教師科研績效”在知網(wǎng)搜索,共231條記錄,對其分類歸納,其研究主要分為3大類,一是對科研績效激勵機(jī)制研究,二是評價方法,三是科研績效的影響因素,且多以定性方法為主。
通過文獻(xiàn)回顧發(fā)現(xiàn):高校教師科研績效受多種主、客觀因素的綜合作用,單純地以一種方法或者視角研究一個綜合問題,很難把握未來的發(fā)展趨勢,這就難以建立科學(xué)、有效的評價和激勵方法。而高校教師科研績效,受多因素高維空間向量的影響,其影響具有強(qiáng)烈的非線性和不確定性。因此,利用學(xué)院過去6年的教師科研數(shù)據(jù),結(jié)合核偏最小二乘法[13](Kernel-based Partial Least-Squares, KPLS)建立預(yù)測模型,對下一個聘期教師科研績效做出預(yù)測,進(jìn)而制定更加合理的激勵與考核辦法。
KPLS中,常用的核函數(shù)有多項(xiàng)式核和高斯核。在高斯核中,核參數(shù)取值方法[14]c=rmσ2,該參數(shù)的取值對擬合結(jié)果具有強(qiáng)烈影響,取值不準(zhǔn)確嚴(yán)重影響預(yù)測精度。因此,基于粒子群[15](Particle Swarm Optimization, PSO)算法對該參數(shù)進(jìn)行尋優(yōu),提出了PSO-KPLS算法。
Trejo和Rosipal教授[13]提出核偏最小二乘法,其基本原理是,通過非線性核函數(shù)將輸入空間映射到高維特征空間,在特征空間中構(gòu)建線性偏最小二乘回歸,從而實(shí)現(xiàn)原始輸入空間的非線性建模。核偏最小二乘算法的詳細(xì)步驟如下[16]。
Step1計(jì)算核矩陣。
(1)
利用高斯核函數(shù)計(jì)算矩陣元素,核函數(shù)表示如下。
(2)
其中,cl(l=1,2,…,p)表示高斯核函數(shù)尺度。
Step2對核矩陣K中心化處理。
(3)
Step3隨機(jī)初始化Y的得分向量u。
Step4計(jì)算特征空間中X的得分向量th并進(jìn)行歸一化。
(4)
Step5計(jì)算Yh的權(quán)值向量ch。
(5)
Step6計(jì)算Yh的得分向量uh并歸一化。
(6)
Step7重復(fù)Step4~Step6,直到th收斂。
Step8將矩陣K、Y縮小,重復(fù)Step3~Step7,取得p個t、u。
(7)
(8)
以下為訓(xùn)練樣本的擬合公式。
(9)
預(yù)測樣本擬合公式為:
Yt=KtU(TTKU)-1TTY
(10)
Kt=Φ(xnew)Φ(x)T
(11)
xnew表示新采樣的數(shù)據(jù),x為輸入訓(xùn)練數(shù)據(jù),Y為輸出訓(xùn)練數(shù)據(jù),Kt為新數(shù)據(jù)對應(yīng)的核矩陣,Yt為預(yù)測結(jié)果。
關(guān)于KPLS的相關(guān)應(yīng)用及研究,如文獻(xiàn)[17-18]將其分別應(yīng)用于高抗多離群點(diǎn)的近紅外光譜數(shù)據(jù)分析中。Liu等[19]提出了動態(tài)并行KPLS方法,并將其應(yīng)用于污水處理過程的監(jiān)測。Said 等[20]提出了改進(jìn)的動態(tài)核偏最小二乘法,并應(yīng)用于非線性故障檢測。這些都擴(kuò)展了KPLS的應(yīng)用場景,提升了KPLS的適用性。但是,在相關(guān)應(yīng)用和研究中,忽略了核參數(shù)對算法性能的影響,因此,接著提出了PSO-KPLS算法。該算法,本質(zhì)上是利用PSO群體尋優(yōu)思想,求得合適參數(shù)使得KPLS擬合的均方根誤差最小。具體表示如下:
min RMSE(s,f)
(12)
式(12)中,s表示因變量樣本向量,f表示擬合值向量。但是,擬合值主要受到高斯核函數(shù)中參數(shù)c的影響。這是因?yàn)閏=rmσ2,r是一個常數(shù)(1≤r≤10),m是輸入空間的維數(shù),σ2是維度l輸入數(shù)據(jù)的方差。進(jìn)而也就轉(zhuǎn)化為對參數(shù)r的尋優(yōu)。整個算法的流程如圖1所示。
圖1 PSO-KPLS算法流程圖
PSO-KPLS算法詳細(xì)步驟如下:
Step1使用均勻分布,生成n個在[1,10]之間的隨機(jī)粒子ri。
Step2for each particlei
初始化速度vi和位置xi
評估粒子i,并設(shè)置pBesti=xi
end for
gBest=min{pBesti}
Step3For each particlei
Step3.1 form=1:n
forj=1:n
用公式(2)計(jì)算核矩陣K(m,j)
end
end
Step3.2 用公式(3)對核矩陣K中心化
Step3.3 ford=1:m
初始化u;
初始化t;
end
Step3.4 ford=1:m
forj=1:100
用公式(4)~公式(8)非線性迭代求解t,u
end
end
Step3.5 用公式(9)~公式(11)計(jì)算預(yù)測值
Step3.6 計(jì)算RMSEi
end
觀點(diǎn)1:思政課教師職責(zé)定位的“三種角色”說。黃岡職業(yè)技術(shù)學(xué)院的侯利平認(rèn)為,高校思政課教師應(yīng)扮演“三種角色”,即馬克思主義理論的宣講者、學(xué)生思想問題的釋疑者、堅(jiān)定的馬克思主義實(shí)踐者[3]6。
Step4判斷RMSEi是否滿足約束條件
fori=1 ton
if RMSEi>threshold){
vi=vi+c1×rand()×(pbesti-xi)+c2×rand()×(gbesti-xi)
(13)
xi=xi+vi
(14)
評估粒子i。
If(fit(xi) if(fit(pBesti) gBest=pbesti }else{ break for循環(huán),進(jìn)入Step5。 } end for 返回Step3 Step5結(jié)束。 式(13)更新粒子速度,式(14)更新粒子位置。vi表示粒子i的速度,rand()表示(0,1)之間的隨機(jī)數(shù),xi是粒子的當(dāng)前位置,c1和c2是當(dāng)前學(xué)習(xí)因子,通常,c1=c2=2,vi的最大值為Vmax>0,若vi>Vmax,則vi=Vmax。 教師的科研績效受到多個指標(biāo)影響,一是個人基本特征,如年齡、學(xué)位、指導(dǎo)的碩士、博士生人數(shù)等,二是組織環(huán)境因素,如學(xué)院的激勵政策、科研補(bǔ)貼等,因此,每個教師每年的科研績效采用如下方式表示: D=φ(C,O) 其中,φ為C、O到D的函數(shù)映射。其中D=(a,p,r,b,k,h)表示教師的科研產(chǎn)出。a表示文章數(shù),p表示專利數(shù),r表示省部級以上項(xiàng)目數(shù),b表示專著數(shù),k表示科研經(jīng)費(fèi)(萬元),h表示教師參與的學(xué)術(shù)會議數(shù)。為了綜合表達(dá)教師每年科研績效,建立D與(C,O)之間的函數(shù)關(guān)系,將D的計(jì)算方法進(jìn)一步表示如下: f(t)=at+pt+rt+bt+st+dt (15) C=(w,g,l,s,d)表示與教師相關(guān)的屬性,w表示教師學(xué)位,s表示指導(dǎo)的碩士生人數(shù),d表示指導(dǎo)的博士生人數(shù),結(jié)合文獻(xiàn)[21-23]對影響因素進(jìn)行分析,年齡系數(shù)g和教學(xué)工作量系數(shù)l對f(t)的影響到底是正向還是負(fù)向影響,與具體取值相關(guān)。g的取值和年齡ω相關(guān),隨著年齡的增長,其創(chuàng)新能力和體力相對降低,對科研績效起到負(fù)向影響作用,具體表示如下: (16) l的取值與δ(實(shí)際教學(xué)工作量)和b相關(guān),其取值如下: (17) b是教師需要完成的基本課時數(shù)。 O=(e×β,Q)表示組織屬性,e表示人均科研補(bǔ)助數(shù),β是e的權(quán)重,取值方法如公式(18)。β為e的權(quán)重,取值如下: (18) 即科研經(jīng)費(fèi)越多,對科研成果的影響越大。Q是[-5,5]之間的隨機(jī)數(shù),表示組織O的環(huán)境因素對教師t不確定因素的影響,但是,這個影響因人而異,所以,這里用隨機(jī)數(shù)表示。 為了驗(yàn)證PSO-KPLS的有效性,以學(xué)院近6年來的教師信息和科研數(shù)據(jù)為基礎(chǔ),利用式(15)計(jì)算每個教師的科研績效,然后以最近3年部分教師的信息作為輸入,對老師科研績效進(jìn)行預(yù)測。具體實(shí)驗(yàn)環(huán)境為:處理器:Intel(R) Core(TM) i5-4200U CPU @1.60 GHz 2.30 GHz,內(nèi)存:4 GB,操作系統(tǒng):Win7(64位),Matlab 7。由于篇幅所限,這里選取部分教師的信息及科研績效,如表1所示。 表1 教師信息及科研績效樣本 再利用上述方法計(jì)算出其他老師過去6年,約438條記錄的科研績效,檢驗(yàn)PSO-KPLS算法性能。 在PSO-KPLS迭代尋優(yōu)的過程中,結(jié)束迭代是以實(shí)際RMSE的值是否符合RMSE取值為依據(jù)。因此,對于PSO-KPLS的性能分析,主要通過以下2個方面來分析。 1)從處理數(shù)據(jù)時間和精度2個方面來闡述,為此,主要通過在不同RMSE要求下,探究程序?qū)?yōu)次數(shù)、運(yùn)行時間和實(shí)際的RMSE的關(guān)系。 2)在相同的基礎(chǔ)數(shù)據(jù)條件下,同時使用KPLS建模,對PSO-KPLS與KPLS,及其他文獻(xiàn)中的方法在擬合誤差、預(yù)測誤差和運(yùn)行效率上進(jìn)行對比分析。 從理論上分析,RMSE對算法的運(yùn)行效率有影響,即要求擬合精度越高,也就是RMSE越小,就需要算法花費(fèi)更多的時間進(jìn)行參數(shù)尋優(yōu),反之,若RMSE越大,則算法找到符合精度要求的最優(yōu)參數(shù),所需時間越少。具體實(shí)驗(yàn)過程如下,首先取RMSE=2,然后取RMSE=5,針對每個取值分別運(yùn)行10次程序,并記錄其運(yùn)行時間、實(shí)際RMSE的值以及尋優(yōu)獲取的核參數(shù)c。實(shí)驗(yàn)結(jié)果如表2所示。 表2 PSO-KPLS 的2組實(shí)驗(yàn)結(jié)果 在表2中,可以看出RMSE的取值對運(yùn)行時間和精度都有著重要影響。當(dāng)RMSE=2時,尋優(yōu)次數(shù)均值為25.6次,運(yùn)行時間均值為34.3562 s。在核參數(shù)c=20.877時取得最小均方根誤差。當(dāng)RMSE=5時,尋優(yōu)次數(shù)均值為5.5次,運(yùn)行時間均值為7.4403 s,在核參數(shù)c=45.1726時取得最小均方根誤差。 為了進(jìn)一步分析RMSE取值對算法性能的影響,繼續(xù)分別取RMSE=8、RMSE=10,各運(yùn)行10次,分別計(jì)算尋優(yōu)次數(shù)運(yùn)行時間均值,如表3所示。 表3 RMSE取值與尋優(yōu)次數(shù)、運(yùn)行時間均值 對40次實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)以后,效果如圖2所示。 從表3、圖2所示的結(jié)果中可以得出結(jié)論:RMSE越小,即擬合精度越高,尋優(yōu)次數(shù)和程序運(yùn)行時間都明顯增加,若對擬合精度要求越低,算法的尋優(yōu)次數(shù)和運(yùn)行時間也明顯降低。在尋優(yōu)次數(shù)、運(yùn)行時間和RMSE之間呈非線性遞減關(guān)系。 圖2 RMSE與計(jì)算次數(shù)、運(yùn)行時間關(guān)系圖 為了進(jìn)一步說明PSO-KPLS的優(yōu)勢,本文利用相同的樣本數(shù)據(jù),再利用標(biāo)準(zhǔn)KPLS、文獻(xiàn)[19]的DCKPLS、文獻(xiàn)[20]、文獻(xiàn)[24]和文獻(xiàn)[25]中改進(jìn)的KPLS進(jìn)行實(shí)驗(yàn),并利用第一次達(dá)到相同精度要求時(RMSE均值小于特定閾值)的參數(shù),對各自的擬合誤差、預(yù)測誤差以及運(yùn)行效率作對比分析。其結(jié)果如表4所示。 表4 PSO-KPLS與KPLS及其他改進(jìn)的KPLS的性能對比 從表4的對比結(jié)果可以看出,尋找最優(yōu)參數(shù)時,在滿足相同精度要求的情況下,PSO-KPLS的性能明顯優(yōu)于KPLS,不論是擬合誤差和預(yù)測誤差。另外,由于PSO-KPLS融入了粒子群參數(shù)尋優(yōu),其效率明顯高于KPLS的人工參數(shù)調(diào)優(yōu)。PSO-KPLS在要求RMSE小于2時,其效率約為KPLS的26倍。在要求RMSE在小于5、8和10的情況下,PSO-KPLS效率分別約是KPLS效率的73倍、118倍和144倍。其他如文獻(xiàn)[19]和文獻(xiàn)[20],其參數(shù)都需要多次手動調(diào)優(yōu),才能達(dá)到指定的精度要求,而且由于文獻(xiàn)[20]對KPLS進(jìn)行了簡化,在建模時丟失了部分信息,從而在RMSE要求為2時,通過25次參數(shù)調(diào)優(yōu)后未能達(dá)到精度要求,所以其結(jié)果用“--”表示。文獻(xiàn)[24]利用模因算法進(jìn)行參數(shù)尋優(yōu),以提高KPLS的回歸預(yù)測能力。文獻(xiàn)[25]利用了遺傳算法進(jìn)行參數(shù)尋優(yōu)。從整體的實(shí)驗(yàn)結(jié)果分析,在達(dá)到相同的RMSE要求時,PSO-KPLS具有較高的精度優(yōu)勢,而文獻(xiàn)[25]具有較高的效率優(yōu)勢,所用時間更少,兩者性能相近。文獻(xiàn)[24]的效率和精度介于PSO-KPLS和文獻(xiàn)[25]的GA-KPLS之間。 為了對PSO-KPLS的預(yù)測性能進(jìn)行驗(yàn)證,在設(shè)定精度要求為RMSE<8時,對部分教師科研績效進(jìn)行預(yù)測,并重點(diǎn)與文獻(xiàn)[24]和文獻(xiàn)[25]的預(yù)測效果進(jìn)行對比,結(jié)果如圖3所示。 圖3 PSO-KPLS擬合效果圖 從圖3的結(jié)果看出,PSO-KPLS的預(yù)測結(jié)果更接近真實(shí)值,其次是文獻(xiàn)[25]和文獻(xiàn)[24],但是這兩者的結(jié)果比較接近。這也符合3.2節(jié)的實(shí)驗(yàn)結(jié)果。 高校教師科研績效考核與激勵,是激發(fā)教師科學(xué)研究和學(xué)科建設(shè)的重要途徑。但其科研績效模型受多種因素影響,有正向的激勵因素,也有負(fù)向制約因素,如何使用數(shù)學(xué)語言對其準(zhǔn)確表達(dá),并有效把握其發(fā)展趨勢,對于管理者制定科學(xué)合理的激勵機(jī)制,促進(jìn)教師職業(yè)發(fā)展、提升單位學(xué)科影響力具有重要意義。因此,基于既有數(shù)據(jù),定義了教師科研績效的表達(dá)方法,提出了PSO-KPLS預(yù)測算法,并詳細(xì)闡述了利用PSO對KPLS算法進(jìn)行參數(shù)尋優(yōu)的詳細(xì)過程,再根據(jù)樣本數(shù)據(jù)建立了預(yù)測模型,著重分析了精度要求對PSO-KPLS算法運(yùn)行效率的影響。在以后的研究中,需要進(jìn)一步分析教師科研績效的主要影響因素,簡化績效模型,進(jìn)一步設(shè)計(jì)高效的預(yù)測模型。2 教師科研績效表示
3 實(shí)驗(yàn)仿真與分析
3.1 RMSE對尋優(yōu)次數(shù)和運(yùn)行時間的影響
3.2 PSO-KPLS與其他改進(jìn)的KPLS的性能對比
3.3 PSO-KPLS對部分科研績效的預(yù)測結(jié)果
4 結(jié)束語