劉 葉,王 帥,周慶忠
(1.重慶能源職業(yè)學院,重慶 402260;2.陸軍勤務(wù)學院,重慶 401311)
目前,隨著高等教育事業(yè)的不斷發(fā)展,教育質(zhì)量受到廣泛的關(guān)注,具有一支高水平的師資隊伍是提高教育質(zhì)量的有力保障??冃Э荚u作為評定高校教師工作行為與質(zhì)量的主要方式,相關(guān)研究也在逐漸增多[1-6]??冃Э荚u是現(xiàn)代企業(yè)提升競爭力的有效工具,將其科學運用到高校教師管理當中,能夠檢查教師履行職責情況,形成良好的激勵機制,績效考評已逐漸成為高校人力資源管理的重要組成部分。因此,構(gòu)建起符合自身特點的教師績效考評體系,對于進一步增強高校辦學能力、提升教學水平具有重要的現(xiàn)實意義。
支持向量機(SVM,Support Vector Machine)具有良好的理論基礎(chǔ),在處理小樣本學習問題上具有獨到的優(yōu)越性[7-8]。粗糙集(RS,Rough Set)對于屬性簡約具有很好的效果[9-10],因此,本文綜合使用粗糙集與支持向量機,建立了基于RS-SVM的高校教師績效考評模型,以提高高校教師績效評價的簡便性、科學性和準確性。
高校教師績效考評指標體系是績效考評工作得以開展的基礎(chǔ),科學構(gòu)建指標體系是高校教師績效考評的重要準備工作內(nèi)容。本文建立的指標體系見表1,需要指出的是由于個體差異的普遍性,每個個體都有其獨特的個性特征,而不同院校不同學科不同專業(yè)的高校教師所處的位置不同,承擔的課程性質(zhì)和對學生的培養(yǎng)目標都有很大不同,這就導(dǎo)致不同的評價指標對不同的教師具有不同的重要意義。因此,在具體對特定專業(yè)及崗位的高校教師進行績效考評時,需要針對實際情況對指標體系進行適當調(diào)整。
表1 高校教師績效考評指標體系
RS理論只能處理離散型數(shù)據(jù),對連續(xù)型數(shù)據(jù)無法進行處理,因此,在對評價指標約簡之前首先要對指標中的連續(xù)屬性進行離散化處理。在此基礎(chǔ)上,基于RS理論對指標體系進行約簡,從而降低模型復(fù)雜度。
可以用四元組S=(U,A,V,F)來表達粗糙集中的信息,其中:
U={u1,u2,…,u||U},是有限非空集合,即論域;
A=,為屬性的非空有限集合;
AV=為屬性a的值域;
f:U×A→V是一個信息函數(shù),它為每個對象的每個屬性賦予了一個信息值,即:
知識表達系統(tǒng)也稱為信息系統(tǒng),通常也用S=(U,A)來代替S=(U,A,V,F)。
如果A=C?D,C?D≠φ,則可以將(U,A)看作為信息表,C中的屬性作為條件,D中的屬性起決策作用。
在所有的屬性當中,有些屬性很重要,有些屬性不太重要,甚至有些屬性基本沒有任何作用。屬性約簡就是要找到?jīng)]有任何作用以及作用非常小的屬性并將它們剔除,從而降低信息系統(tǒng)的復(fù)雜程度。
令R為一族等價關(guān)系,P∈R,如果ind(R)=ind(R-{P}),則稱P在R中不起任何作用;反之稱P在R中具有作用。假如每一個P∈R都在R中具有作用,就證明R是獨立的;相反說明R是不獨立的。設(shè)P?R,假如P為獨立的,并且ind(P)=ind(R),就可以將P看做R的約簡。
當R的簡約不止一個時,可以將所有必要的約簡組成一個集合,定義為R的核,可以用core(R)表示。
式中red(R)代表R所有的約簡。
實際運用過程中,每一個分類對其他分類的作用不同,有的只是有關(guān)系,有的卻十分重要,程度有很大不同,因此,還必須考慮約簡與核的相對性問題。
令P和Q為U中的等價關(guān)系,Q的P正域記為Posp(Q),即:
假定 P和 Q具有等價關(guān)系,R∈P,當POSind(P)(ind(Q))=POSind(p-{R})(ind(Q))時,則稱R為P中Q不必要的;否則R為P中Q必要的。如果P中的每個R都為Q必要的,則稱P為Q獨立的。
設(shè)S∈P,S為P的Q約簡當且僅當S是P的Q獨立子族且POSind(S)(ind(Q))=POSind(p)(ind(Q)),P的Q約簡稱為相對約簡。P中所有的Q必要的原始關(guān)系構(gòu)成的集合稱為P的Q核,記為coreQ(P)。
相對核與相對約簡的關(guān)系如下:
coreQ(P)=?redQ(P),其中redQ(P)是所有P的Q約簡構(gòu)成的集合。
為此,構(gòu)建S=(U,A,V,F)為高校教師績效考評指標信息集合,對于等價關(guān)系P?R有分類U ind(P)={X1,X2,…,Xn},則P的信息量記為:
通過考察等價關(guān)系中蘊含的信息量,就能夠確定在高校教師績效考評指標體系中,哪個指標重要性高,哪個指標重要性低,哪個指標基本沒有作用。在信息集合S=(U,A,V,F)中,指標屬性a∈A在指標屬性集A中的重要度和屬性的信息量的關(guān)系可以確定為:
可以通過衡量去掉某個指標后信息系統(tǒng)信息量的變化情況來確定某項指標的重要程度。假如去掉某個指標后,信息系統(tǒng)的信息量具有顯著的變化,說明該指標在整個信息系統(tǒng)中具有重要的作用,必須保留。反之就可以剔除。
因此通過式(6)
就可以計算出高校教師績效考評指標體系中所有指標的權(quán)重。
然后通過式(7),設(shè)置合理閥值,依據(jù)偏離程度的量化,對指標進行約簡。
Wi表示高校教師績效考評指標體系中第i個指標的權(quán)重;Wmax表示所有高校教師績效考評指標中權(quán)重最高的指標,Wmax-Wi表示高校教師績效考評指標體系中第i個指標相對于Wmax指標的偏離程度,Wi數(shù)值越低,說明指標Wi與指標Wmax的偏離度越高。
依據(jù)實際情況和希望高校教師績效考評指標體系的規(guī)模,確定科學合理的閥值,當Di的值超過確定的閥值時,說明指標i應(yīng)當從高校教師績效考評指標體系中刪除。
通過屬性約簡,得到最終的高校教師績效考評指標體系,在此基礎(chǔ)上,采用SVM算法對高校教師的績效評價進行仿真。
把能夠使式(8)中等號成立的樣本稱為支持向量(Support Vectors)。兩類樣本間間隙的大小可以定義如下:
尋找兩類樣本間最佳分類面的問題就可以轉(zhuǎn)化為求函數(shù)式(10)
的最小值。
定義如下函數(shù):
把式(11)分別對w、b、αi求偏微分并令它們等于0,然后加上原約束條件可以把原問題轉(zhuǎn)化為如下凸二次規(guī)劃的對偶問題。
sgn()為符號函數(shù)。
收集以往高校教師績效考評的樣本數(shù)據(jù),將樣本數(shù)據(jù)分為兩組,每組都包含績效考評成績較好與績效考評成績較差的,將其中一組數(shù)據(jù)作為訓練樣本,采用Libsvm2.9工具箱,借助gnuplot工具進行參數(shù)優(yōu)選,確定最終的SVM。將訓練樣本輸入SVM進行訓練,然后將測試樣本輸入模型進行測試,如未能達到預(yù)期的精度,再次對SVM進行訓練,通過反復(fù)訓練,得到滿意的輸出結(jié)果。
本文選取某高校物流專業(yè)近三年對所屬教員績效考評的243組數(shù)據(jù)作為樣本數(shù)據(jù)。
首先,通過借助ROSETTA軟件,將高校教師績效評價22個指標中的連續(xù)型指標進行離散化處理,然后,利用這243個試驗樣本,通過RS模型對高校教師績效評價指標體系進行約簡,最終確定U13,U21,U24,U33,U43,U51,U61,U73八個指標為主要指標。
其次,選擇合適的支持向量機核函數(shù)。核函數(shù)一般從以下幾種函數(shù)中選取:(1)多項式核函數(shù),即對應(yīng)SVM是一個q階多項式分類器。(2)徑向基核函數(shù),即對應(yīng)SVM是一種徑向基函數(shù)分類器。(3)S形核函數(shù),則SVM實現(xiàn)的就是一個兩層的感知器神經(jīng)網(wǎng)絡(luò)。
選用徑向基核函數(shù),將243組樣本數(shù)據(jù)中前200組作為訓練樣本,后43組樣本作為測試樣本,條件屬性為約簡出的八個指標,使用Libsvm2.9工具箱中的gnuplot工具進行參數(shù)優(yōu)選,結(jié)果如圖1所示。
圖1 支持向量機參數(shù)選取結(jié)果
將200個訓練樣本輸入svm-train工具進行訓練,將其余的43個樣本輸入svm-predict工具進行測試,通過實際輸出的準確性發(fā)現(xiàn),對43個測試樣本的判別正確率達到98%。因此說明,本文建立的仿真模型具有較高的準確性。
本文構(gòu)建了基于RS-SVM的高校教師績效考評模型,該模型具有精度較高,操作簡單,不受主觀因素影響等特點,而且通過SVM的優(yōu)勢,在積累樣本數(shù)據(jù)的基礎(chǔ)上可以不斷對模型進行訓練,從而進一步提高模型的精度,可以為評估高校教師績效水平提供科學的依據(jù)。