邵俊明+楊勤麗
(1.電子科技大學(xué) 計算機科學(xué)與工程學(xué)院,四川 成都 611731;
2.電子科技大學(xué) 資源與環(huán)境學(xué)院,四川 成都 611731)
摘 要:針對當前數(shù)據(jù)挖掘課程教學(xué)中工程應(yīng)用與理論創(chuàng)新的脫節(jié)問題,分析數(shù)據(jù)挖掘課程本身的特點和當前教學(xué)現(xiàn)狀,從提高本科生創(chuàng)新能力的人才培養(yǎng)模式角度出發(fā),提出在教學(xué)內(nèi)容的前沿性、教學(xué)方式的多元性及實驗教學(xué)的多梯度性改革,達到因材施教、工程應(yīng)用與理論創(chuàng)新的有機統(tǒng)一,有效提高學(xué)生的學(xué)習(xí)興趣及學(xué)習(xí)效果。
關(guān)鍵詞:數(shù)據(jù)挖掘;理論創(chuàng)新;多元教學(xué);多梯度實驗
0 引 言
在當前大數(shù)據(jù)時代背景下,如何從海量數(shù)據(jù)中挖掘并提煉出對人們真正有用的知識,是大數(shù)據(jù)研究的難點問題,同時也是目前數(shù)據(jù)挖掘面臨的關(guān)鍵和核心問題[1]。數(shù)據(jù)挖掘作為當前計算機專業(yè)的一個前沿課程,是一個綜合性的交叉課程,也是重要的學(xué)術(shù)研究方向,其內(nèi)容涉及多方面基礎(chǔ)理論學(xué)科和應(yīng)用性強的技術(shù)領(lǐng)域,是提高計算機專業(yè)學(xué)生應(yīng)用實踐能力和理論創(chuàng)新能力的載體課程,在整個計算機專業(yè)的學(xué)習(xí)中具有極為重要的地位。
1 教學(xué)現(xiàn)狀
數(shù)據(jù)挖掘作為一門同時具備應(yīng)用性和學(xué)術(shù)性的課程,早期屬于計算機專業(yè)研究生培養(yǎng)的專業(yè)課程,但隨著數(shù)據(jù)挖掘在各個領(lǐng)域的廣泛應(yīng)用,現(xiàn)已成為計算機專業(yè)本科培養(yǎng)的專業(yè)選修課之一。目前,數(shù)據(jù)挖掘課程在教學(xué)內(nèi)容、教學(xué)方法和實驗教學(xué)模式上存在諸多不足之處。
(1)教學(xué)內(nèi)容陳舊。目前的教學(xué)內(nèi)容一般根據(jù)某本數(shù)據(jù)挖掘教科書進行講解,由于數(shù)據(jù)挖掘技術(shù)的快速發(fā)展,一本教科書往往很難全面概括數(shù)據(jù)挖掘的內(nèi)容、方法和技術(shù)。
(2)基礎(chǔ)理論算法與實驗教學(xué)脫節(jié)。當前的教學(xué)路線往往是使本科學(xué)生從了解和掌握數(shù)據(jù)挖掘的基本任務(wù)開始,然后講授數(shù)據(jù)挖掘的各種基本算法,最后上機實驗。這一教學(xué)方式側(cè)重于以應(yīng)用為主,主要目標在于培養(yǎng)計算機工程的應(yīng)用人才。然而,由于基礎(chǔ)理論算法與實驗教學(xué)分開講解,使得學(xué)生缺乏對使用數(shù)據(jù)挖掘解決實際問題的能力。
(3)理論創(chuàng)新意識的缺乏。在當前的本科教學(xué)中側(cè)重工程實踐能力的培養(yǎng),忽略理論創(chuàng)新的培養(yǎng)。在數(shù)據(jù)挖掘課程中,理論創(chuàng)新是指學(xué)生對所學(xué)的數(shù)據(jù)挖掘算法有自己的見解,能有意識地思考目前數(shù)據(jù)挖掘面臨的問題并提出新的數(shù)據(jù)挖掘算法。
(4)實驗教學(xué)僵化。當前的實驗教學(xué)往往是固定的幾個算法驗證性實驗,對于不同學(xué)習(xí)能力的人而言,實驗教學(xué)往往很難達到理想的效果。
目前,對日新月異的科技發(fā)展、以科技創(chuàng)新和技術(shù)升級為核心特征的激烈國際競爭,我國自主創(chuàng)新能力較為薄弱的問題已經(jīng)越來越成為信息化發(fā)展的瓶頸[2],這也給數(shù)據(jù)挖掘教學(xué)帶來巨大挑戰(zhàn),即教師如何在教學(xué)過程中提高學(xué)生的理論創(chuàng)新能力?
2 教學(xué)方法的改革
2.1 教學(xué)內(nèi)容的前沿性與統(tǒng)一性
作為一門新興的前沿課程,該門課程內(nèi)容、方法和技術(shù)仍處于發(fā)展和探索階段。通過固定的教材去系統(tǒng)地傳授數(shù)據(jù)挖掘的內(nèi)容顯然是不太合理的。因此,與傳統(tǒng)學(xué)科不同,數(shù)據(jù)挖掘教學(xué)內(nèi)容需要進行更新,并根據(jù)學(xué)生的接受能力進行甄別篩選。同時,要求任課教師在不斷發(fā)展的新技術(shù)與相對穩(wěn)定的教材中尋找一條貫穿整個教學(xué)內(nèi)容的主線,在講課的過程中,結(jié)合數(shù)據(jù)挖掘研究進展,配合自己的研究成果,把最新的技術(shù)融入到課堂中。此外,由于數(shù)據(jù)挖掘是多學(xué)科的交叉課程,內(nèi)容涉及統(tǒng)計學(xué)、算法、數(shù)據(jù)庫、機器學(xué)習(xí)、模式識別、可視化等,而本科生的知識體系薄弱,在短時間難以透徹理解各部分內(nèi)容。因此,教學(xué)過程中教師應(yīng)合理設(shè)計教學(xué)大綱和方案,有機地統(tǒng)一教學(xué)內(nèi)容,讓學(xué)生對數(shù)據(jù)挖掘有一個整體的了解。建立不同數(shù)據(jù)挖掘任務(wù)之間的相互關(guān)聯(lián),同時以項目講解的方式將數(shù)據(jù)挖掘涉及的數(shù)據(jù)預(yù)處理、聚類分析、分類預(yù)測、噪聲檢測、關(guān)聯(lián)規(guī)則挖掘等有機結(jié)合在一起。
2.2 理論創(chuàng)新的多元教學(xué)
針對現(xiàn)有本科生教學(xué)中理論創(chuàng)新意識的缺乏,嘗試進行多元化教學(xué)模式,主要從以下4個方面展開。
(1)區(qū)分教學(xué)內(nèi)容的難易度,將教學(xué)內(nèi)容分為基礎(chǔ)內(nèi)容與進階內(nèi)容。在講授中注重基礎(chǔ)內(nèi)容的原理性,并有意識地讓學(xué)生接觸一些前沿性的理論拓展知識。比如在講解分類算法時,首先專注幾個經(jīng)典的分類算法,如K—最鄰近、決策樹、樸素貝葉斯和支持向量機等。同時,在此基礎(chǔ)上,給學(xué)生講述目前分類的一些前沿方法,如集成學(xué)習(xí)、深度學(xué)習(xí)和遷移學(xué)習(xí)等。
(2)以問題為驅(qū)動教學(xué)。在講解聚類算法時,可以通過“物以類聚,人以群分”的思想展開,具體介紹K—MEANS和DBSCAN兩個具有代表性的聚類算法,讓學(xué)生思考數(shù)據(jù)挖掘不同算法提出的原因、基本思想和優(yōu)劣性,初步引導(dǎo)學(xué)生的自我思考、自我學(xué)習(xí)的創(chuàng)新思維能力。同時,針對數(shù)據(jù)具有的高維性,讓學(xué)生進一步思考“高維詛咒”問題及在此問題上展開的子空間聚類的研究。
(3)建立“教研統(tǒng)一”研究式教學(xué)方法,利用教師現(xiàn)有科研促進和服務(wù)于教學(xué),探索形成“科研嵌入”理論教學(xué)內(nèi)容。將教師在自己的研究與教學(xué)內(nèi)容進行有機結(jié)合,豐富教學(xué)內(nèi)容,拓寬學(xué)生視野,提高學(xué)生實踐能力和創(chuàng)新能力,實現(xiàn)科研成果融入教學(xué)。這樣既提高了學(xué)生學(xué)習(xí)知識的興趣性,又培養(yǎng)了潛在的科學(xué)素養(yǎng)。此外,在整個教學(xué)環(huán)節(jié)中布置兩個任務(wù),一是讓學(xué)生進行數(shù)據(jù)挖掘的文獻調(diào)研(主要涉及數(shù)據(jù)挖掘的歷史、現(xiàn)狀、面臨的挑戰(zhàn)及當前的行業(yè)應(yīng)用),二是在課程結(jié)束后進行主題研究報告,每個學(xué)生選擇自己感興趣的一個主題進行,研究報告的目的是讓學(xué)生深入理解所學(xué)內(nèi)容,為后續(xù)的科研工作打下基礎(chǔ)。
(4)教學(xué)模式由傳統(tǒng)“填鴨式”向“互動式”教學(xué)轉(zhuǎn)變。通過研討方式引導(dǎo)學(xué)生去思考,激發(fā)學(xué)生的求知欲,充分調(diào)動其學(xué)習(xí)的積極性和主觀能動性。通過具體實例,讓學(xué)生知道算法的應(yīng)用場合,提高學(xué)習(xí)興趣和效率。
2.3 多梯度實驗教學(xué)
實驗教學(xué)是使學(xué)生在實踐環(huán)節(jié)將數(shù)據(jù)挖掘課程中學(xué)習(xí)的理論算法應(yīng)用于實踐,幫助學(xué)生理解和掌握知識,提高動手能力。傳統(tǒng)的上機實驗往往是側(cè)重幾個經(jīng)典算法的實現(xiàn),如KMEANS、KNN、ID3決策樹和LOF算法等。然而,數(shù)據(jù)挖掘是一門工程應(yīng)用性較強的學(xué)科,這種算法驗證實驗很難讓學(xué)生體會到數(shù)據(jù)挖掘的實際應(yīng)用,因此,從基礎(chǔ)能力培養(yǎng)、工程應(yīng)用及創(chuàng)新研究3個方面設(shè)計多梯度實驗。
首先,按照由淺入深的原則設(shè)計2個經(jīng)典算法實現(xiàn),如KMEANS和 ID3決策樹。這個實驗為算法型實驗,主要是幫助學(xué)生通過實驗更好地了解所學(xué)算法,學(xué)生也可以自己選擇聚類分析和分類預(yù)測的任意兩個算法進行實現(xiàn)。
其次,設(shè)計一個簡單綜合型實驗,比如垃圾郵件的分類系統(tǒng),要求學(xué)生完成從數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理到整個系統(tǒng)的實現(xiàn)。主要考查學(xué)生綜合運用數(shù)據(jù)挖掘知識,解決實際問題的能力,注重工程能力的培養(yǎng)。
最后是創(chuàng)新算法的實驗設(shè)計,比如子空間聚類算法的實現(xiàn)。這個實驗注重部分學(xué)生創(chuàng)新能力的培養(yǎng),尤其是致力于以后從事科學(xué)研究的學(xué)生。學(xué)生可以根據(jù)自己的愛好,選擇算法型實驗和綜合型實驗,也可以選擇算法型實驗和創(chuàng)新算法設(shè)計實驗。多梯度實驗的目的主要是希望針對不同學(xué)生的學(xué)習(xí)興趣及將來的發(fā)展方向,給出合適的實驗教學(xué)。實驗的整體難度由易到難,層層深入,有利于學(xué)生實踐能力和創(chuàng)新能力的培養(yǎng)。
3 結(jié) 語
當前,數(shù)據(jù)挖掘正處在快速發(fā)展的過程中,各個領(lǐng)域的大量應(yīng)用使得對數(shù)據(jù)挖掘這門課程的工程應(yīng)用能力要求越來越高,需要學(xué)生具有更好的創(chuàng)新能力,因此,數(shù)據(jù)挖掘課程的教學(xué)也同樣需要調(diào)整教學(xué)內(nèi)容和教學(xué)手段來緊跟其發(fā)展的步伐?;诖耍覀兲岢鲈谡n程內(nèi)容的前沿性、教學(xué)模式的多元性及實驗教學(xué)的多梯度性上進行改革,從而達到在培養(yǎng)學(xué)生工程實踐能力的同時,提高其創(chuàng)新思維能力。
基金項目:電子科技大學(xué)“互聯(lián)網(wǎng)+”課程建設(shè)教改專項。
第一作者簡介:邵俊明,男,教授,研究方向為數(shù)據(jù)挖掘、機器學(xué)習(xí)及在交叉學(xué)科的應(yīng)用研究, junmshao@uestc.edu.cn。
參考文獻:
[1]涂新莉, 劉波, 林偉偉. 大數(shù)據(jù)研究綜述[J]. 計算機應(yīng)用研究, 2014, 31(6): 1612-1616.
[2]應(yīng)必娣. 培養(yǎng)學(xué)生創(chuàng)新能力的教學(xué)改革[J]. 實驗室科學(xué), 2015(3): 228-230.
(編輯: 郭田珍 )