鄭小龍,王丹濃,陳麗娜
(寧波第二技師學(xué)院 機(jī)械工程系,浙江 寧波 315012)
熵原本是一個(gè)熱力學(xué)的概念,用來表征熱力學(xué)系統(tǒng)內(nèi)部微粒的混亂程度,熵值越大,系統(tǒng)中微粒分布越不均勻混亂程度越高;反之,越均勻,越有序。1948年,香農(nóng)提出了信息熵的概念,將熱力學(xué)中的熵引進(jìn)到了信息量化度量的問題中,用來表示信息的不確定性。[1]決策樹算法是在信息熵的基礎(chǔ)上,對(duì)數(shù)據(jù)處理的一種方法,其本質(zhì)是在系統(tǒng)的多個(gè)變量屬性中,找到對(duì)結(jié)果而言可分辨能力最大的屬性,將數(shù)據(jù)分成若干子集,對(duì)應(yīng)即決策樹的分支,然后循環(huán)以上分支過程,直到子集中對(duì)應(yīng)的結(jié)果屬性統(tǒng)一為止。[2-7]該算法也是目前機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)挖掘的一種重要手段。
本文以機(jī)械裝配技術(shù)課為研究對(duì)象,該課程的特征在于教學(xué)評(píng)價(jià)重點(diǎn)不僅在于結(jié)果性評(píng)價(jià),還在于整個(gè)裝配和精度調(diào)整過程的規(guī)范性和工藝性,所以評(píng)價(jià)過程是一個(gè)形成性評(píng)價(jià)與結(jié)果性評(píng)價(jià)的綜合。結(jié)果性評(píng)價(jià)比較直觀,可通過有無零件遺漏、設(shè)備流暢性、檢測(cè)精度等方法來完成。形成性評(píng)價(jià)是教師觀察中間過程是否有不規(guī)范操作和錯(cuò)誤操作,但教師很難將整個(gè)班級(jí)的形成性評(píng)價(jià)量化,并找出潛在規(guī)律,如學(xué)生多項(xiàng)操作都出現(xiàn)錯(cuò)誤,錯(cuò)誤操作是否有相關(guān)性,先糾正哪項(xiàng)錯(cuò)誤操作最合理,該判斷更多的是根據(jù)教師已有經(jīng)驗(yàn),所以教師的能力和經(jīng)驗(yàn)決定著該課程的教學(xué)效果。由于該課程的教學(xué)評(píng)價(jià)有相當(dāng)一部分集中在形成性評(píng)價(jià)中,因此將信息熵引入到機(jī)械裝配技術(shù)的實(shí)訓(xùn)課程中,使每一項(xiàng)操作都有相應(yīng)的標(biāo)準(zhǔn)操作,即只要出現(xiàn)不規(guī)范操作就相當(dāng)于出現(xiàn)了熵增。并且,通過計(jì)算熵值來確定某項(xiàng)操作的混亂度,從而對(duì)教學(xué)評(píng)價(jià)起到量化作用,避免了教師對(duì)整個(gè)班級(jí)大樣本的技能操作掌握程度的主觀估計(jì)。
首先進(jìn)行采集數(shù)據(jù),橫坐標(biāo)第i項(xiàng)操作,縱坐標(biāo)為第j個(gè)小組,得到一個(gè)矩陣A:
K=1/Ln(m),當(dāng)學(xué)生只進(jìn)行一種規(guī)范、標(biāo)準(zhǔn)操作時(shí),信息熵最小,混亂程度低;當(dāng)學(xué)生錯(cuò)誤操作比較多時(shí),信息熵大,混亂程度高。
在信息熵的基礎(chǔ)上計(jì)算各項(xiàng)錯(cuò)誤操作的熵權(quán):
通過熵權(quán)的量化,明確各項(xiàng)錯(cuò)誤操作的權(quán)重,為學(xué)生糾正錯(cuò)誤提供數(shù)據(jù)支持,形成性評(píng)分即概率值和熵權(quán)的乘積。
再利用決策樹ID3算法進(jìn)行數(shù)據(jù)挖掘,確定各項(xiàng)錯(cuò)誤操作信息增益,探究各項(xiàng)錯(cuò)誤操作的前后的關(guān)聯(lián)性和糾正順序性。
在機(jī)械裝配技術(shù)課程中,以直線導(dǎo)軌與基準(zhǔn)面的平行度為例進(jìn)行研究,安裝前需要將安裝面先進(jìn)行清洗,再將導(dǎo)軌滑塊副預(yù)安裝到安裝面上,用螺釘進(jìn)行預(yù)緊,然后在滑塊上安裝杠桿百分表,測(cè)量頭對(duì)準(zhǔn)基準(zhǔn)面,如圖1所示?;瑝K沿導(dǎo)軌滑動(dòng),通過觀察杠桿百分表的值來判斷平行度是否達(dá)標(biāo),如超標(biāo),則需要用紫銅棒或者橡皮錘敲擊導(dǎo)軌進(jìn)行調(diào)整,最終達(dá)到要求得平行度。在筆者任教的機(jī)械裝配技術(shù)課程中,有20位學(xué)生,按前期表現(xiàn)均勻分成10組,每組2人,進(jìn)行直線導(dǎo)軌平行度調(diào)整的教學(xué),教學(xué)后進(jìn)行平行度調(diào)整測(cè)試,結(jié)果性評(píng)價(jià)指標(biāo)合格為導(dǎo)軌平行度≤0.02mm,調(diào)整時(shí)間≤5min,即結(jié)果性評(píng)價(jià)為Y,未達(dá)標(biāo)則為N;形成性評(píng)價(jià)指標(biāo)設(shè)置四項(xiàng):D1為杠桿百分表判斷方向準(zhǔn)確率、D2為判斷時(shí)間長度、D3為調(diào)節(jié)次數(shù)、D4為安裝百分表時(shí)間。建立表 1,其中,D2、D3、D4因?yàn)閿?shù)值越大,越負(fù)面,所以將這三項(xiàng)數(shù)值取為負(fù),利用公式(1)、(2)、(3)進(jìn)行形成性評(píng)價(jià)計(jì)算,結(jié)果如表1所示。形成性評(píng)價(jià)的絕對(duì)值越小,該小組形成性評(píng)分就越好。
該過程對(duì)每個(gè)小組目前狀態(tài)進(jìn)行量化,特別是各小組在量變的過程中且結(jié)果性評(píng)價(jià)尚未改變,形成性評(píng)價(jià)的得分就能體現(xiàn)這一變化。根據(jù)表1呈現(xiàn)的結(jié)果,形成性評(píng)價(jià)和結(jié)果性評(píng)價(jià)有高度的相關(guān)性,即使同樣Y或N的結(jié)果也有高低之分,可見形成性評(píng)價(jià)是對(duì)結(jié)果性評(píng)價(jià)的有力補(bǔ)充。
圖1 導(dǎo)軌滑塊副平行度調(diào)整
表1 直線導(dǎo)軌平行度調(diào)整測(cè)試信息熵采樣
采樣數(shù)據(jù)被量化后,利用決策樹算法采樣項(xiàng)目進(jìn)行數(shù)據(jù)挖掘。由于決策樹的剪枝是針對(duì)離散變量進(jìn)行計(jì)算的,如果當(dāng)變量為連續(xù)值時(shí),必須進(jìn)行離散化,才能進(jìn)行信息增益大小的判斷,即直線導(dǎo)軌平行度各變量?jī)?yōu)先級(jí)的判斷。[8]
根據(jù)以上的離散化的采樣項(xiàng)目集合,將四個(gè)采樣變量分為進(jìn)行離散化劃分,結(jié)果如表2所示。
根據(jù)采樣項(xiàng)目離散化的結(jié)果,將結(jié)果代入公式3進(jìn)行計(jì)算,信息增益值的結(jié)果如表3所示,表格中信息增益值越大,對(duì)應(yīng)的優(yōu)先越高。
表3中采樣項(xiàng)目信息增益值越大,說明該項(xiàng)被糾正或改進(jìn)后,結(jié)果性評(píng)價(jià)會(huì)更大概率的趨向于統(tǒng)一,也就是能快速降低結(jié)果性評(píng)價(jià)的信息熵,所以信息增益值越大的采樣變量應(yīng)該優(yōu)先被關(guān)注,可以認(rèn)為是教學(xué)中的重點(diǎn),而在其他的采用變量按照信息增益值大小確定優(yōu)先級(jí),可以確定為第二、三、四重點(diǎn),量化知識(shí)點(diǎn),為教學(xué)提供支持。
表2 采樣項(xiàng)目離散化結(jié)果
表3 信息增益值結(jié)果
按照表3的優(yōu)先級(jí)判斷,與教學(xué)經(jīng)驗(yàn)相結(jié)合分析得出以下五點(diǎn)結(jié)論:(1)由于班級(jí)人數(shù)和設(shè)備有限,D1判向準(zhǔn)確率信息增益值出現(xiàn)1的情況,即D1將決策樹劃分到根節(jié)點(diǎn),D1高對(duì)應(yīng)的結(jié)果性評(píng)價(jià)都是Y,所以決策樹圖形無法形成,但本次研究只進(jìn)行信息增益值計(jì)算和優(yōu)先級(jí)的判斷,已滿足研究要求。(2)判向準(zhǔn)確率對(duì)應(yīng)能否準(zhǔn)確使用杠桿百分表,如果使用錯(cuò)誤,無法完成導(dǎo)軌平行度調(diào)整,學(xué)生可能沒有真正掌握杠桿百分表的使用方法。(3)調(diào)節(jié)次數(shù)過多,很大程度是由于導(dǎo)軌調(diào)整方向錯(cuò)誤導(dǎo)致,另一種情況是銅棒調(diào)節(jié)力度未掌握到位,致使調(diào)節(jié)過度,需多次進(jìn)行調(diào)節(jié),此準(zhǔn)確性須長時(shí)間練習(xí)提升。(4)裝表時(shí)間長短是熟練度導(dǎo)致,初學(xué)者在固定杠桿百分表時(shí)會(huì)將指針頂?shù)綐O限位置,需重復(fù)固定,浪費(fèi)時(shí)間。(5)判向時(shí)長也與熟練度相關(guān),但判向的準(zhǔn)確率更重要,所以判向時(shí)長的信息增益比較小,即相關(guān)性較低。
本研究的前提是利用教師經(jīng)驗(yàn)制定采樣項(xiàng)目,教師再利用計(jì)算數(shù)據(jù)輔助教學(xué),兩者相輔相成。由于統(tǒng)計(jì)數(shù)據(jù)較小,本方法價(jià)值大于結(jié)論,如果依托決策樹理論,增加數(shù)據(jù)量,結(jié)合機(jī)器學(xué)習(xí)繼續(xù)實(shí)驗(yàn),可提供更準(zhǔn)確、可靠的教學(xué)輔助信息。同時(shí),該方法也可為護(hù)士、電工、運(yùn)動(dòng)員等的規(guī)范操作評(píng)價(jià)提供參考。