張 帆,李其深,劉 穎
(1西南石油大學(xué) 理學(xué)院,四川 成都 610500;2中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,湖北 武漢 430074)
粗糙集理論在師范生培養(yǎng)質(zhì)量分析中的應(yīng)用
張 帆1,李其深1,劉 穎2
(1西南石油大學(xué) 理學(xué)院,四川 成都 610500;2中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,湖北 武漢 430074)
師范生教育是高等本科教育體系的一部分,為初等教育培養(yǎng)高水平教育工作者和管理人才。基于粗糙集理論討論師范生的培養(yǎng)質(zhì)量問題。首先確定評價指標(biāo)并隨機(jī)抽取一定數(shù)量的數(shù)據(jù),根據(jù)粗糙集的重要度對數(shù)據(jù)進(jìn)行屬性約簡,通過約簡表提取規(guī)則,對師范生培養(yǎng)質(zhì)量進(jìn)行客觀評價分析,為以后的師范生培養(yǎng)提供參考。
粗糙集;屬性約簡;重要度;師范生;培養(yǎng)質(zhì)量
師范生教育是科教興國和人才強(qiáng)國戰(zhàn)略的重要內(nèi)容。我國師范院校眾多,以“德高為師,身正為范”為標(biāo)準(zhǔn)培養(yǎng)一代又一代的教育工作者。本文從評價的基本理論著手,將師范生的培養(yǎng)質(zhì)量作為對象,構(gòu)建師范生培養(yǎng)質(zhì)量的評價體系,加強(qiáng)對師范生培養(yǎng)理論層次的認(rèn)識。從實踐操作的角度來看,建立科學(xué)高效的師范生培養(yǎng)質(zhì)量評價體系可以推進(jìn)我國師范生培養(yǎng)的規(guī)范發(fā)展和持續(xù)改進(jìn)。對于師范生培養(yǎng)質(zhì)量的討論能夠在一定程度上幫助教育系統(tǒng)從上而下整體地提高辦學(xué)水平。
粗糙集理論[1-2]是一種用來處理不精確、不確定和不完全數(shù)據(jù)的非經(jīng)典數(shù)學(xué)理論。粗糙集理論可以從大量的數(shù)據(jù)中挖掘潛在的、有利用價值的知識。粗糙集理論將知識理解成為“區(qū)分事物的能力”,將論域上的知識進(jìn)行劃分,通過論域上的等價關(guān)系來表示知識。對知識的這種特殊理解方式?jīng)Q定了它與傳統(tǒng)的處理不確定性問題理論的方法存在著本質(zhì)的區(qū)別。粗糙集理論不需要已知數(shù)據(jù)外的其他先驗知識,通過對知識的簡化和知識的依賴性分析,完全可以由已知的數(shù)據(jù)導(dǎo)出決策規(guī)則。由于粗糙集理論一般只能處理離散數(shù)據(jù),所以當(dāng)要處理連續(xù)屬性值數(shù)據(jù)時,一般先要對數(shù)據(jù)離散化[3]。本文嘗試借助粗糙集的理論與方法,對師范生的培養(yǎng)質(zhì)量進(jìn)行客觀的數(shù)學(xué)理論方法的分析研究,并給出相應(yīng)的決策規(guī)則,幫助高校在人才培養(yǎng)過程中更清晰地對師范生進(jìn)行考核與教育。
1.1粗糙集理論基礎(chǔ)
粗糙集理論由波蘭科學(xué)家Z.Pawlak于1982年提出,它是繼概率論、模糊集、證據(jù)理論之后又一新的處理模糊和不確定性知識的數(shù)學(xué)工具[4]。粗糙集理論認(rèn)為知識本身就應(yīng)該具有對對象的分類能力,并提供嚴(yán)格的數(shù)學(xué)理論方法,使得知識有一個清晰定義的數(shù)學(xué)意義,并且可使用數(shù)學(xué)方法來分析處理。運(yùn)用粗糙集理論能處理定量、定性的因素,有效分析不完整的、不一致的、不精確的等各種不完備的信息,能對數(shù)據(jù)進(jìn)行分析推理,發(fā)現(xiàn)其中隱含的規(guī)律。其主要思想就是在保持知識分類能力不變的前提下,通過知識約簡來導(dǎo)出問題的決策或分類規(guī)則。目前,粗糙集理論已經(jīng)被成功地應(yīng)用于過程控制、決策分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘與模式識別等領(lǐng)域。
定義2 若P?R,且P≠Φ,則P中全部等價關(guān)系的交集稱為P上的不可分辨關(guān)系,記為ind(p):ind(P)={(x,y)∈U×U|?q∈P,f(x,q)=f(y,q)}。
定義3 設(shè)S=(U,A,V,f)為一知識表達(dá)系統(tǒng),A=C∪D,C∩D=Φ,C稱為條件屬性集,D稱為決策屬性集。具有條件屬性和決策屬性的知識表達(dá)系統(tǒng)稱為決策表。
定義4 設(shè)S=(U,A,V,f)為一個信息系統(tǒng),a∈A,如果ind(A-{a})=ind(A),則稱a在A中是不必要的,否則稱a在A中是必要的。
定義5 設(shè)S=(U,A,V,f)為一個信息系統(tǒng),如果?a∈A在A中都是必要的,則稱屬性集A是獨(dú)立的,否則稱A是相關(guān)的。
定理1 如果A是獨(dú)立的,P?A,則P也是獨(dú)立的。
定義6 設(shè)S=(U,A,V,f)為一個信息系統(tǒng),P?A,如果P是獨(dú)立的,且ind(P)=ind(A),則稱P是A的一個約簡。
定義7 設(shè)S=(U,A,V,f)為一個信息系統(tǒng),A中所有必要屬性組成的集合稱為屬性集A的核,記為core(A)。
定理2core(A)=∩red(A),其中red(A)表示A的所有約簡。
定義8 對于決策表S=(U,C∪D,V,f)中的條件屬性集X?C,W?U,X的支持子集是SX(W)=W(U/X)-=∪V∈U/X,V?WV。
1.2指標(biāo)體系的建立與數(shù)據(jù)離散化
師范生的培養(yǎng)質(zhì)量主要通過師范生個體反映出來,作為培養(yǎng)師范生的高校,所采用的數(shù)字計劃會對師范生培養(yǎng)質(zhì)量有直接的影響[6-7]。學(xué)生的各項指標(biāo)數(shù)據(jù)就是師范生培養(yǎng)質(zhì)量優(yōu)劣的具體表現(xiàn),也是師范生培養(yǎng)質(zhì)量的重點(diǎn)考核標(biāo)準(zhǔn)。本文根據(jù)師范生的教育目標(biāo)和師范生的本質(zhì)特點(diǎn),考察和剖析師范生培養(yǎng)形成的全過程,建立以政治思想素質(zhì)、專業(yè)課程學(xué)習(xí)、外國語水平、計算機(jī)水平、教學(xué)實踐、學(xué)位論文為評價指標(biāo)的評價體系。
在對學(xué)生指標(biāo)數(shù)據(jù)離散化的過程中,指標(biāo)的評價數(shù)據(jù)往往帶有某種語義偏好,對于帶有偏好的有關(guān)語言值評語集釆用等級制進(jìn)行分類,并進(jìn)行數(shù)值化。對于語義偏好由低到高,依次建立多個評價等級。語言值評語集的數(shù)值化表如表1所示。
表1 語言值評語集的數(shù)值化表
指標(biāo)數(shù)據(jù)也常常帶有連續(xù)數(shù)值,對于這種帶有連續(xù)數(shù)值的指標(biāo)數(shù)據(jù),需要進(jìn)行離散化。具體的方法是:將連續(xù)數(shù)值的整個區(qū)間按照劃分的完整性依次分為4個區(qū)間,并對這4個區(qū)間的數(shù)值偏好關(guān)系進(jìn)行離散化、數(shù)值化。連續(xù)數(shù)值的離散化表如表2所示。
表2 連續(xù)數(shù)值的離散化表
首先建立關(guān)于師范生培養(yǎng)的信息系統(tǒng),即S=(U,C∪D,V,f),其中,U={u1,u2,…,un},ui表示第i名學(xué)生,共有n名;以師范生培養(yǎng)影響指標(biāo)作為條件屬性C={aj,j=1,2,3,4,5,6},a1表示政治思想素質(zhì),a2表示專業(yè)課程學(xué)習(xí),a3表示外語水平,a4表示計算機(jī)水平,a5表示教學(xué)實踐,a6表示學(xué)位論文。將培養(yǎng)質(zhì)量作為決策屬性,記為d,D=j5i0abt0b,d的取值為1、2、3、4,分別代表差、中等、良好、優(yōu)秀;d的值由各班主任及專業(yè)教授主觀給出。隨機(jī)抽取學(xué)生原始數(shù)據(jù)如表3所示。
表3 隨機(jī)抽取學(xué)生原始數(shù)據(jù)
按照表2中離散化數(shù)值表將決策表進(jìn)行離散化后得到離散化處理后各指標(biāo)數(shù)據(jù)如表4所示。
表4 離散化處理后各指標(biāo)數(shù)據(jù)
基于屬性重要度對以上決策表進(jìn)行屬性約簡,該算法的具體步驟如下所示[8]:
1)求核算法。
輸入:信息系統(tǒng)S=(U,C∪D,V,f)
輸出:屬性集合C的核core(C)
Step1:設(shè)置1→i;
Step3:令xi∈core(C),轉(zhuǎn)Step4;
Step4:如果i=|X|,則算法完成,core(C)即為屬性集合C的核。如果i<|X|,轉(zhuǎn)Step5;
Step5:令i+1→i,轉(zhuǎn)Step2。
2)屬性約簡算法。
輸入:信息系統(tǒng)S=(U,C∪D,V,f)
輸出:屬性集合C的核約簡red(C)
Step1:根據(jù)求核算法求出core(C);
Step2:令B=core(C),如果ind(B)=ind(C),轉(zhuǎn)Step5;
Step3:?a∈CB,計算它們相對于core(C)的屬性重要度,取屬性重要度最大的屬性am,如果這樣的屬性有多個,則選取在論域上形成的劃分個數(shù)最少的那個,把它加入B中,即B∪{am}?B;
Step4:如果ind(B)≠ind(C),轉(zhuǎn)Step3,否則轉(zhuǎn)Step5;
Step5:輸出B∈red(C),算法結(jié)束。
通過算法進(jìn)行數(shù)據(jù)處理得到的核是{a2,a6},約簡結(jié)果{a1,a2,a6}與{a2,a3,a6}與{a2,a4,a6}。對于約簡{a1,a2,a6}得到屬性約簡表如表5所示。
表5 屬性約簡表
規(guī)則提取得到:
a1(2)anda2(2)anda6(3)?d(3)
a1(3)anda2(2)anda6(2)?d(2)
a1(2)anda2(2)anda6(2)?d(2)
a1(1)anda2(2)anda6(2)?d(2)
a1(3)anda2(1)anda6(2)?d(2)
a1(2)anda2(1)anda6(2)?d(1)
a1(1)anda2(1)anda6(2)?d(1)
a1(1)anda2(1)anda6(1)?d(0)
a1(1)anda2(0)anda6(1)?d(0)
從此約簡得到的規(guī)則中可以得到以下信息:如果一個學(xué)生政治思想素質(zhì)與專業(yè)課程學(xué)習(xí)良好、學(xué)位論文優(yōu)秀,那么這個學(xué)生的培養(yǎng)質(zhì)量是優(yōu)秀的;如果一個學(xué)生政治思想素質(zhì)不差、專業(yè)課程學(xué)習(xí)與學(xué)位論文良好,那么這個學(xué)生的培養(yǎng)質(zhì)量是良好的;如果一個學(xué)生政治思想素質(zhì)優(yōu)秀、專業(yè)課程學(xué)習(xí)中等、學(xué)位論文良好,那么這個學(xué)生的培養(yǎng)質(zhì)量是良好的;如果一個學(xué)生政治思想素質(zhì)中等或者良好、專業(yè)課程學(xué)習(xí)中等、學(xué)位論文良好,那么這個學(xué)生的培養(yǎng)質(zhì)量是中等的;如果一個學(xué)生政治思想素質(zhì)與學(xué)位論文中等、專業(yè)課程學(xué)習(xí)較差或者中等,那么這個學(xué)生的培養(yǎng)質(zhì)量是差的。對于其他約簡表也可以提取相應(yīng)的規(guī)則并得到培養(yǎng)質(zhì)量的分析和參考。
對于師范類學(xué)生來說,屬性集{政治思想素質(zhì),專業(yè)課程學(xué)習(xí),外國語水平,教學(xué)實踐,學(xué)位論文}的約簡為{政治思想素質(zhì),專業(yè)課程學(xué)習(xí),學(xué)位論文},{專業(yè)課程學(xué)習(xí),外國語水平,學(xué)位論文},{專業(yè)課程學(xué)習(xí),計算機(jī)水平,學(xué)位論文},屬性集的核為{專業(yè)課程學(xué)習(xí),學(xué)位論文}。說明專業(yè)課程學(xué)習(xí)、學(xué)位論文基本上可以反映出對學(xué)生的培養(yǎng)質(zhì)量水平,而師范生特有的教學(xué)實踐由于評價由所在實踐單位給出,一般得到的評價都是優(yōu)秀,沒有客觀反映實際教學(xué)效果,故從數(shù)據(jù)上得不到參考。通過規(guī)則表可以發(fā)現(xiàn),培養(yǎng)一名優(yōu)秀或者良好的師范生需要在哪些方面加強(qiáng)教育,在實際的教育培養(yǎng)過程中可以更清晰地了解他們的發(fā)展趨勢并使他們變得更加優(yōu)秀。
[1] Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11:341-356.
[2] 張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001:1-39.
[3] 王彪,段禪倫,吳昊,等.粗糙集與模糊集的研究及應(yīng)用[M].北京:電子工業(yè)出版社,2008:1-32.
[4] 董婷.碩士研究生教育質(zhì)量評價的研究[D].武漢:武漢理工大學(xué),2005.
[5] 賀衛(wèi)紅,劉志輝,鐘嘉鳴.基于粗糙集的教育網(wǎng)站綜合評價研究[J].計算機(jī)應(yīng)用與軟件,2009(26):57-61.
[6] 王麗娜.基于粗糙集的數(shù)據(jù)挖掘改進(jìn)的屬性約簡算法研究[D].成都:電子科技大學(xué),2012.
[7] 麥宏元.基于粗糙集的高職院校學(xué)生綜合測評模式的應(yīng)用研究[D].南寧:廣西大學(xué),2012.
[8] 張巖,秦克云,宋軍智.基于粗糙集理論的研究生教育質(zhì)量評價方法[J].文教資料,2012(3月下旬刊):136-138.
(責(zé)任編輯桂堤)
Application of Rough Set Theory in Analysis of Normal Students' Cultivation Quality
ZhangFan1,LiQishen1,LiuYing2
(1School of Science,Southwest Petroleum University,Chengdu Sichuan 610500;2School of Mathematics and Statistics,South-Central University for Nationalities,Wuhan Hubei 430074)
Normal education is a part of the higher undergraduate education system,which can train high-level educators and management personnels for primary education.This paper discusses the cultivation quality of normal stuednts based on Rough Set Theory.Firstly,the evaluation indexes and a certain amount of random data should be chosen.Then the data attribute reduction can be carried out according to the importance degree of rough sets.By using reduction table to extract certain rules, the training quality of normal students are evaluated and analyzed objectively,which provides a reference for the future training.
rough set;attribute reduction;significance;normal students;cultivation quality
2014-05-09
張帆(1990— ),男,碩士生。
10.3969/j.issn.2095-4565.2014.04.010
TP18
A
2095-4565(2014)04-0036-05